COMPLEMENTI DI MATEMATICA Seminario Fisico
Transcript
COMPLEMENTI DI MATEMATICA Seminario Fisico
COMPLEMENTI DI MATEMATICA Seminario Fisico–Matematico – I anno Note basate sugli appunti dei corsi tenuti da F. Ricci, A. Mennucci e T. Pacini negli anni A.A. dal 2009 al 2013, L. Ambrosio e C. Mantegazza nell’A.A. 2013–14, L. Ambrosio e L. Mazzieri nell’A.A. 2014–15. Indice Capitolo 1. ELEMENTI DI TEORIA DEGLI INSIEMI 1. Connettivi logici e notazione di base 2. Prodotto cartesiano di due insiemi 3. Relazioni 4. Relazioni di equivalenza 5. Relazioni di ordine 6. Funzioni 7. Prodotti cartesiani multipli 8. L’insieme dei numeri naturali 9. Cardinalità di insiemi 10. Cardinalità di P(A) 11. Insiemi finiti e infiniti 12. Il Lemma di Zorn 13. Il Teorema di Zermelo 14. *Dimostrazione del Lemma di Zorn 15. Esercizi 6 6 8 8 9 10 11 13 14 18 21 21 22 24 26 27 Capitolo 2. INSIEMI NUMERICI E OPERAZIONI 1. Operazioni su N 2. Dai naturali agli interi 3. Dagli interi ai razionali 4. Campi 5. Costruzione del campo R dei numeri reali 6. Operazioni su R 7. Campi ordinati 8. Campi ordinati completi 9. Esercizi 36 36 38 39 40 41 42 44 46 48 Capitolo 3. COMPLEMENTI SULLE SUCCESSIONI DI NUMERI REALI 1. Massimo e minimo limite 2. Teoremi di Cesaro 3. Teorema di Stolz–Cesaro 4. Confronti asintotici tra successioni 5. Ordini di infinito e di infinitesimo 6. Esercizi 53 54 56 58 60 62 64 Capitolo 4. SOMMATORIE SU INSIEMI INFINITI 1. Somme di termini non negativi 2. Limiti lungo insiemi ordinati filtranti 67 67 68 3 INDICE 3. 4. 5. 6. 7. 8. 9. *L’integrale di Riemann Serie a termini di segno generico Il caso I = N: confronto con la nozione di “somma di una serie” Convergenza incondizionata di serie Sommatorie a più indici Prodotto secondo Cauchy di successioni Esercizi 4 69 73 75 77 80 82 84 Capitolo 5. SPAZIO EUCLIDEO Rn , SPAZI METRICI E FUNZIONI CONTINUE 1. Struttura Euclidea di Rn : prodotto scalare, modulo e distanza 2. Insiemi aperti e chiusi di Rn , parte interna, chiusura, frontiera 3. Successioni a valori in Rn 4. Caratterizzazione per successioni della chiusura e del derivato di un insieme 5. Punti limite di una successione 6. Spazi metrici 7. *Il Teorema di Baire 8. Funzioni continue tra spazi Euclidei 9. Connessione, convessità, connessione per archi 10. Esercizi 89 89 92 95 97 98 99 109 110 113 116 Capitolo 6. SUCCESSIONI E SERIE DI FUNZIONI 1. Convergenza puntuale e uniforme 2. Continuità del limite uniforme 3. La convergenza uniforme come convergenza in uno spazio metrico 4. Derivabilità della funzione limite 5. Convergenza uniforme di serie di funzioni e spazi vettoriali normati 6. Serie di potenze 7. Derivabilità sull’asse reale 8. Serie di potenze e serie di Taylor 9. Il Lemma di Abel 10. Alcune serie notevoli 11. Esercizi 139 139 140 141 142 146 149 151 152 158 161 161 Capitolo 7. CALCOLO DIFFERENZIALE IN PIÙ VARIABILI 1. Derivate parziali e direzionali 2. Differenziale 3. Il teorema del differenziale totale 4. Curve regolari in Rn 5. Curve regolari e grafici 6. Grafici e insiemi di livello: il teorema della funzione implicita 7. *Funzioni differenziabili da Rn a Rm 8. *Composizione di funzioni differenziabili 9. *Punti stazionari liberi e vincolati 10. *Diagonalizzazione di matrici simmetriche 11. Derivate di ordine superiore 12. Campi vettoriali, integrali curvilinei, potenziali 13. *La matrice Hessiana 14. *Discussione della natura dei punti stazionari liberi 171 171 172 175 177 179 179 183 184 185 188 190 193 197 199 INDICE 15. Esercizi 5 200 Capitolo 8. EQUAZIONI DIFFERENZIALI ORDINARIE 1. Definizioni e primi esempi 2. Metodi risolutivi per alcuni tipi di equazioni del primo ordine 3. Problemi di Cauchy per equazioni del primo ordine 4. Contrazioni in spazi metrici 5. Dimostrazione del teorema di esistenza e unicità locale 6. Sistemi di equazioni differenziali ed equazioni di ordine superiore 7. Sistemi differenziali lineari a coefficienti costanti e matrice esponenziale 8. *Calcolo della matrice esponenziale 9. *Equazioni differenziali lineari a coefficienti costanti di ordine superiore 10. Esercizi 210 210 212 215 222 223 225 228 231 233 236 Libri Utili o per Approfondire 246 CAPITOLO 1 ELEMENTI DI TEORIA DEGLI INSIEMI 1. Connettivi logici e notazione di base Anche se le note del corso sono scritte in un linguaggio semi–formalizzato, sarà a volte utile esprimere alcuni enunciati e alcune nozioni in termini più formali, usando: • gli operatori di congiunzione ∧ (“e”) e disgiunzione ∨ (“o”); • i quantificatori ∃ (“esiste”) e ∀ (“per ogni”); • i simboli di implicazione ⇒, ⇐, ⇐⇒; • il simbolo di negazione ¬ (“non”). Ricordiamo anche le regole fondamentali per l’uso dell’operatore di negazione: ¬(¬P ) equivale a P , ¬(P ∧ Q) equivale a (¬P ) ∨ (¬Q), ¬(P ∨ Q) equivale a (¬P ) ∧ (¬Q), ¬(∀xP (x)) equivale a ∃x¬P (x), ¬(∃xP (x)) equivale a ∀x¬P (x). La lista dei simboli è in realtà ridondante, perché P ⇐ Q potrebbe essere sostituito da Q ⇒ P e P ⇐⇒ Q potrebbe essere sostituito da (P ⇒ Q) ∧ (Q ⇒ P ), riducendo cosı̀ tutto all’operatore ⇒. Ma, persino P ⇒ Q può essere sostituito da (¬P ) ∨ Q. Informalmente, l’implicazione P ⇒ Q è da intendersi falsa quando P è vera e Q è falsa, è da intendersi vera in tutti gli altri 3 casi. Questo è coerente con lo schema della “dimostrazione per assurdo”, con la quale si mostra l’implicazione P ⇒ Q mostrando in realtà che (¬Q) ⇒ (¬P ): si ha infatti (¬(¬Q)) ∨ (¬P ) equivale a Q ∨ (¬P ) che a sua volta equivale a (¬P ) ∨ Q per la regola che ¬(¬Q) corrisponde a Q e per la “commutatività” di ∨. Con ragionamenti simili, potremmo usare le regole di negazione per fare a meno dei simboli ∀ e ∧, usando ∃, ∨ e ovviamente ¬. Questa ridondanza nella scelta dei simboli, tuttavia, aiuta a generare formule non troppo lunghe, come presto si vedrà. Per lo stesso motivo e per guadagnare in leggibilità, useremo a volte anche “e” per ∧ e “o” per ∨. Per non appesantire troppo questa trattazione, che vuole restare elementare, useremo anche senza renderle esplicite tutte le regole fondamentali di deduzione, come ad esempio la deduzione di P ⇒ R dalla combinazione di P ⇒ Q e Q ⇒ R o la commutatività di ∧ e ∨, che abbiamo già menzionato. Diamo per note le nozioni e notazioni fondamentali della teoria degli insiemi, come: • la nozione di appartenenza di un elemento a un insieme (x ∈ A) e la sua negazione x ∈ / A, i.e. ¬(x ∈ A), • la nozione di insieme vuoto, indicato con Ø, i.e. l’insieme A che soddisfa ∀x(x ∈ / A). Si noti che l’insieme vuoto è unico grazie al cosiddetto assioma di estensionalità: ∀x((x ∈ A) ⇐⇒ (x ∈ B)), A = B se e solo se vale • la nozione di inclusione di un insieme in un altro (A ⊆ B), in formule A ⊆ B se e solo se vale ∀x((x ∈ A) =⇒ (x ∈ B)) 6 1. CONNETTIVI LOGICI E NOTAZIONE DI BASE 7 (useremo anche la notazione A ⊂ B per (A ⊆ B) ∧ ¬(A = B)), • le operazioni di unione (A∪B) e intersezione (A∩B), le proprietà commutativa e associativa di ciascuna di esse, la proprietà distributiva dell’una rispetto all’altra, • le nozioni di differenza insiemistica (A \ B, B \ A) e differenza simmetrica (A4B) di due insiemi, • la nozione di complementare X \ A di un insieme A rispetto a un insieme ambiente X dato, e a volte sottinteso (Ac ),1 • l’insieme potenza (o insieme delle parti) P(X) di un dato insieme X:2 P(X) := A : A ⊆ X , • le formule di De Morgan: [ c \ Ai = Aci , i∈I i∈I \ i∈I Ai c = [ Aci . i∈I Descriveremo un insieme elencando i suoi elementi, ad esempio con la notazione A = {a, b, c, d}, o (specialmente per insiemi potenzialmente infiniti) attraverso la validità di una formula A = x ∈ B : P (x) . Informalmente, A è il sottoinsieme di B costituito dagli elementi x tali che vale P (x).3 A titolo di esempio, descriviamo in formule gli insiemi A ∪ B e A ∩ B: ∀x x ∈ (A ∪ B) ⇐⇒ (x ∈ A) ∨ (x ∈ B) , ∀x x ∈ (A ∩ B) ⇐⇒ (x ∈ A) ∧ (x ∈ B) . Analogamente l’insieme A \ B = A ∩ B c è descritto dalla formula ∀x x ∈ (A \ B) ⇐⇒ (x ∈ A) ∧ (x ∈ / B) e A4B si può intendere come una abbreviazione per (A \ B) ∪ (B \ A). Infine, anche se gli insiemi • N dei numeri naturali 0, 1, 2, 3, . . . , e N∗ dei numeri naturali positivi {1, 2, 3, . . .}, • Z dei numeri interi . . ., −3, −2, −1, 0, 1, 2, 3, . . .}, ∗ • Q dei numeri razionali p/q : p ∈ Z, q ∈ N verranno “costruiti” e caratterizzati assiomaticamente nell’ambito della teoria, presupponiamo già una certa familiarità con essi, per poter dare sin da subito esempi naturali di funzioni, relazioni, etc. 1Come vedremo, c’è spesso bisogno di un insieme ambiente, visto che la considerazione dell’insieme di tutti gli insiemi porta a paradossi. Per questa ragione useremo la notazione Ac solo quando l’insieme ambiente è chiaro dal contesto. 2Il fatto che questa operazione produca un insieme è in realtà un assioma. 3Anche in questo caso, il fatto che questa operazione produca un insieme è in realtà un assioma, noto come assioma di separazione. 3. RELAZIONI 8 2. Prodotto cartesiano di due insiemi Siano a, b due elementi, non necessariamente distinti tra loro. Quando si parla di coppia ordinata (a, b) si vuole specificare la posizione dei due termini nella coppia, e cioè che essa consiste di un primo termine a e di un secondo termine b. Per questo motivo, la coppia (a, b) è un’entità del tutto diversa dall’insieme {a, b}. Due coppie (a, b) e (a0 , b0 ) sono uguali se e solo se sono uguali a due a due i termini corrispondenti. In formule: (a, b) = (a0 , b0 ) ⇐⇒ a = a0 e b = b0 . In particolare, (a, b) 6= (b, a) se a 6= b. Per poter accogliere una simile definizione nella teoria degli insiemi, una coppia va definita come un opportuno insieme. La definizione più comunemente adottata è la seguente: (a, b) = {a}, {a, b} . È un semplice esercizio verificare che effettivamente {a}, {a, b} = {a0 }, {a0 , b0 } ⇐⇒ a = a0 e b = b0 . Siano ora A e B due insiemi. Si chiama prodotto cartesiano di A e B l’insieme A × B delle coppie ordinate (a, b), al variare di a in A e di b in B: A × B = (a, b) : a ∈ A , b ∈ B . Convenzionalmente, si pone Ø × B = Ø e A × Ø = Ø. Si osservi che, se A 6= B, A × B 6= B × A . Il prodotto cartesiano A × A di un insieme A con se stesso si indica anche con A2 . Si chiama diagonale di A2 l’insieme diag (A2 ) = (a, a) : a ∈ A . 3. Relazioni Si chiama relazione tra elementi di un insieme A ed elementi di un insieme B un qualunque sottoinsieme R del prodotto cartesiano A × B. Se la coppia (a, b) ∈ A × B appartiene a R, si dice che a è in relazione con b; si usa la notazione4 aRb. Esempi. (1) Con A = {1, 2, . . . , 100} e B = {1, 2, . . . , 200}, poniamo la relazione aRb ⇐⇒ M CD(a, b) > 1 . Una scrittura equivalente è R = (a, b) ∈ A × B : M CD(a, b) > 1 . (2) Con A = B = N (come ricordato prima, N indica l’insieme dei numeri naturali), l’insieme (m, n) ∈ N2 : m ≤ n fornisce la relazione ≤. 4Invece di lettere, come R, è anche comune usare simboli come ∼, ≤, ecc., secondo i casi (v. seguito). 4. RELAZIONI DI EQUIVALENZA 9 4. Relazioni di equivalenza Una relazione R tra elementi di uno stesso insieme A si dice una relazione di equivalenza su A se soddisfa le seguenti proprietà per qualsiasi scelta di a, b, c in A: • riflessiva: aRa; • simmetrica: aRb ⇒ bRa; • transitiva: aRb e bRc ⇒ aRc. Simboli comunemente usati per relazioni di equivalenza sono: ∼, ', ≈ e simili. Sia dunque ∼ una relazione di equivalenza. Fissato a ∈ A, si chiama classe di equivalenza di a modulo ∼ l’insieme Ca = {b ∈ A : b ∼ a} . Lemma 1.1. Se a ∼ a0 , allora Ca = Ca0 . Se a 6∼ a0 , allora Ca ∩ Ca0 = Ø. Dimostrazione. Supponiamo a ∼ a0 e b ∈ Ca . Allora b ∼ a e per la proprietà transitiva b ∼ a0 . Dunque b ∈ Ca0 . Questo prova che Ca ⊆ Ca0 . Allo stesso modo si dimostra che Ca0 ⊆ Ca . Dalla doppia inclusione segue che Ca = Ca0 . Dimostriamo ora che (4.1) Ca ∩ Ca0 6= Ø =⇒ a ∼ a0 . Infatti, sia b ∈ Ca ∩ Ca0 . Allora b ∼ a e b ∼ a0 . Per le proprietà simmetrica e transitiva, a ∼ a0 . Vale allora la contronominale della implicazione (4.1), cioè a 6∼ a0 =⇒ Ca ∩ Ca0 = Ø . Si chiama partizione di A una famiglia di sottoinsiemi non vuoti di A che siano a due a due disgiunti e la cui unione sia tutto l’insieme A. Teorema 1.2 (Classi di equivalenza e partizioni). Data una relazione di equivalenza ∼ in A, le classi di equivalenza modulo ∼ costituiscono una partizione di A. Viceversa, data una partizione di A, esiste un’unica relazione di equivalenza le cui classi di equivalenza siano gli elementi della partizione stessa. Dimostrazione. Il Lemma 1.1 dimostra che le classi di equivalenza distinte modulo ∼ sono disgiunte. Inoltre, ogni a ∈ A appartiene alla classe Ca per la proprietà riflessiva. Quindi l’unione delle classi distinte è tutto A. S Per il viceversa, sia {Ai : i ∈ I} una partizione di A, cioè con i∈I Ai = A, Ai 6= Ø per ogni i ∈ I, e Ai ∩ Ai0 = Ø se i 6= i0 . Si verifica facilmente che la relazione xRy ⇐⇒ ∃ i ∈ I tale che x, y ∈ Ai è di equivalenza e che le sue classi di equivalenza sono gli Ai . L’insieme delle classi di equivalenza si chiama insieme quoziente di A modulo ∼ ed è indicato con la notazione A/∼. In formule, A/∼ = {Ca : a ∈ A}. ∗ Ad esempio, dato n ∈ N , possiamo introdurre la relazione di equivalenza ∼n in Z richiedendo che p ∼n q se p − q è un multiplo intero (relativo) di n. Le classi di equivalenza (le cosiddette classi di resto modulo n) sono in questo caso n e possono essere indicizzate proprio dagli n valori {0, 1, . . . , n − 1} del resto. In questo caso, quindi, l’insieme quoziente ha n elementi. 5. RELAZIONI DI ORDINE 10 5. Relazioni di ordine Una relazione R tra elementi di uno stesso insieme A si chiama una relazione d’ordine, o un ordinamento, su A se valgono le seguenti proprietà per qualsiasi scelta di a, b, c in A: • riflessiva: aRa; • antisimmetrica: aRb e bRa ⇒ a = b; • transitiva: aRb e bRc ⇒ aRc. Simboli comunemente usati per relazioni d’ordine sono: ≤, e simili. I corrispondenti simboli <, ≺, ecc. si usano allora per indicare che aRb e a 6= b . Un ordinamento si dice totale se inoltre vale la proprietà: • tricotomia: ∀ a, b ∈ A, aRb o bRa. Altrimenti si dice che l’ordinamento è parziale. Esempi. (1) La relazione ≤ su N è un ordinamento totale. (2) La relazione ⊆ su P(X) (l’insieme dei sottoinsiemi di un insieme X) è un ordinamento, solo parziale se X ha almeno due elementi. (3) La relazione R su N data da mRn ⇐⇒ mn è un ordinamento parziale. (4) Se R è un ordinamento su A, la relazione inversa R−1 = (a, b) : (b, a) ∈ R è pure un ordinamento. (5) Se R è un ordinamento su A e B ⊆ A, la restrizione di R a B, R|B = R ∩ B 2 è un ordinamento su B. Se R|B è un ordinamento totale su B, B si dice una catena (o sottoinsieme totalmente ordinato) di A. Uno stesso insieme può ammettere più ordinamenti. È perciò corretto dire che un insieme ordinato è una coppia (A, ≤), dove A è un insieme e ≤ è un ordinamento su di esso. Sia (A, ≤) un insieme ordinato. Un elemento m ∈ A si dice massimo di A se, per ogni a ∈ A, a ≤ m. In modo analogo si definisce il minimo di un insieme ordinato. Lemma 1.3 (Unicità del massimo e del minimo). Se un insieme ordinato ha un massimo (risp. minimo), esso è unico. Dimostrazione. Siano m e m0 due massimi. Allora m0 ≤ m e m ≤ m0 e, per la proprietà antisimmetrica, m = m0 . Analogamente per i minimi. Le nozioni di massimo e di minimo si applicano ovviamente anche a sottoinsiemi di un insieme ordinato. Un elemento m ∈ A si dice massimale se non esiste alcun elemento a ∈ A tale che m < a (se la relazione di ordine è totale questo equivale a dire che a ≤ m per ogni a ∈ A). In modo analogo si definisce un elemento minimale di A. 6. FUNZIONI 11 Per un insieme A totalmente ordinato, le nozioni di elemento massimo ed elemento massimale coincidono. Se l’ordinamento non è totale, il massimo è un elemento massimale, ma non viceversa. Un insieme parzialmente ordinato può possedere più elementi massimali. Ad esempio, nell’insieme A ⊆ N : A ha al più 5 elementi con la relazione di ordine indotta dall’inclusione in P(N), ogni insieme di 5 elementi è massimale e nessuno di questi insiemi è massimo. Considerazioni del tutto analoghe valgono per gli elementi minimi e minimali. Sia ora A0 un sottoinsieme di A. Un elemento a ∈ A si dice un maggiorante di A0 se, per ogni a0 ∈ A0 , a0 ≤ a. In modo analogo di definisce un minorante di A0 . Se l’insieme dei maggioranti di A0 ha un minimo, questo si chiama l’estremo superiore di A0 . L’estremo inferiore di A0 si definisce come il massimo dei minoranti, quando questo esiste. Per il Lemma 1.3, l’estremo superiore e l’estremo superiore, se esistono, sono unici. I simboli max, min, sup, inf indicano rispettivamente massimo, minimo, estremo superiore ed estremo inferiore di un sottoinsieme di un insieme ordinato. Si noti che (con considerazioni analoghe per minimi, minoranti e estremo inferiore) • un maggiorante a di A0 in A appartiene ad A0 se e solo se a = max A0 ; • se A0 ⊆ A ha massimo, allora max A0 = sup A0 ; • un elemento a ∈ A è massimale se e solo se A0 = {a} non ha maggioranti all’infuori di a stesso. Esempi. (1) Si consideri N ordinato dalla relazione m n se mn. Allora min N = 1 e max N = 0. Se prendiamo invece A = N \ {0, 1} con l’ordinamento indotto da , A non ammette né minimo né massimo, i numeri primi sono gli elementi minimali, e non ci sono elementi massimali. (2) Nell’insieme Q dei dell’ordinamento (totale) abituale, si consideri numeri razionali, dotato 0 = m/n : (m/n)2 < 2 . Si dimostri che l’insieme dei maggioranti di A0 è l’insieme A m/n > 0 : (m/n)2 > 2 e che tale insieme non ha minimo. Dunque A0 ha dei maggioranti in Q, ma non l’estremo superiore. 6. Funzioni Una relazione R ⊆ A × B si dice una funzione (o anche applicazione, mappa, trasformazione) di A in B se vale la seguente proprietà: (6.1) per ogni a ∈ A, esiste un unico b ∈ B tale che aRb. Si scrive abitualmente R(a) = b invece di (a, b) ∈ R. Una funzione R di A in B si indica con le notazioni R : A −→ B, a ∈ A 7→ R(a) ∈ B. Pur non dimenticando che le funzioni sono relazioni, iniziamo a usare da subito, ma non esclusivamente, la notazione tradizionale f : A → B per una funzione f da A in B. Data f : A → B, le seguenti definizioni e notazioni sono standard: • A si chiama il dominio di f e B il suo codominio; • dato A0 ⊆ A, la restrizione di f ad A0 è la funzione che corrisponde alla relazione R| A0 definita da R ∩ (A0 × B), ove R ⊂ A × B è la relazione corrispondente a f (in parole più povere, il dominio 6. FUNZIONI 12 di questa nuova funzione è A0 e i valori di f e della sua restrizione coincidono su A0 ); • l’insieme imf = b ∈ B : ∃ a ∈ A tale che f (a) = b ⊆ B si chiama l’insieme immagine, o anche solo immagine, di f ; • dato A0 ⊆ A, si chiama immagine di A0 secondo f l’insieme f (A0 )5 definito da f (A0 ) = b ∈ B : ∃ a ∈ A0 tale che f (a) = b ; • dato B 0 ⊆ B, si chiama controimmagine di B 0 secondo f l’insieme f −1 (B) definito da f −1 (B 0 ) = a ∈ A : f (a) ∈ B 0 ; Si noti che f (∅) = ∅ e che f −1 (∅) = ∅. • f si dice surgettiva se imf = B (quindi, per ogni b ∈ B esiste almeno un a ∈ A tale che f (a) = b); • R si dice iniettiva se a, a0 ∈ A e a 6= a0 =⇒ f (a) 6= f (a0 ) (quindi, per ogni b ∈ B esiste al più un a ∈ A tale che f (a) = b); • f si dice bigettiva o biunivoca, o anche corrispondenza biunivoca, se è iniettiva e surgettiva (quindi, per ogni b ∈ B esiste esattamente un a ∈ A tale che f (a) = b); • se f : A → B è bigettiva, f −1 : B → A è pure una funzione, detta funzione inversa di f ; • se f : A −→ B e g : B −→ C, la funzione composta g ◦ f : A −→ C è definita da g ◦ f (a) = g f (a) , ∀ a ∈ A (più in generale, la composizione ha senso se il dominio di g contiene l’immagine di f ); • la diagonale di A2 è una funzione, detta funzione identica di un insieme A, e indicata con ιA : A −→ A. Osservazioni. (1) Se una funzione R non è surgettiva e B 0 = im R, allora R ⊆ A × B 0 , e dunque R definisce una funzione surgettiva di A su B 0 . Tuttavia è bene considerare R : A → B e R : A → B 0 come funzioni diverse. Per tener conto di ciò in modo formalmente corretto, bisogna dire più precisamente che una funzione da A a B è una terna (A, B, R), con R soddisfacente la proprietà (6.1). (2) Se A è l’insieme vuoto e B è un insieme qualsiasi, la relazione R = Ø ⊆ A × B è, sia pure formalmente, una funzione. Infatti ogni condizione della forma “∀ a ∈ Ø, P (a)” è verificata e qui si prende come P l’enunciato “esiste un unico b tale che (a, b) ∈ Ø”. (3) Data f : A → B, la funzione d’insieme B 0 7→ f −1 (B 0 ) tra P(B) e P(A) commuta con tutte le operazioni insiemistiche, vale a dire [ [ \ \ −1 0 00 −1 −1 00 −1 −1 −1 f (B \ B ) = f (B) \ f (B ) , f Bi = f (Bi ) , f Bi = f −1 (Bi ) . i∈I i∈I i∈I i∈I Per la funzione di insieme 7→ f (A) tra P(A) e P(B), invece, in generale si può solo dire che [ [ \ \ f Ai = f (Ai ), f Ai ⊆ f (Ai ) , A0 i∈I i∈I i∈I i∈I ma la seconda inclusione può essere stretta. Si noti anche che la validità di f (A0 ∩ A00 ) = f (A0 ) ∩ f (A00 ) 5La notazione è qui un po’ ambigua, in quanto il simbolo f viene usato sia per la funzione da A in B che per la funzione indotta da P(A) in P(B). Tuttavia in genere nel contesto si capisce sempre di quale delle due funzioni si sta parlando. Un’analoga osservazione vale per f −1 , introdotta più avanti. 7. PRODOTTI CARTESIANI MULTIPLI 13 per ogni coppia di insiemi A0 e A00 equivale all’iniettività di f . 7. Prodotti cartesiani multipli Dati tre insiemi A, B, C, si possono costruire i prodotti cartesiani (A × B) × C e A × (B × C), costituiti rispettivamente dagli elementi (a, b), c e a, (b, c) , al variare di a ∈ A, b ∈ B, c ∈ C. Essi sono dunque insiemi diversi tra loro, pur potendo essere canonicamente messi in corrispondenza biunivoca. Peraltro, anche se questa procedura potrebbe essere iterata per definire il prodotto di un numero finito di insiemi, non è semplice adattarla per definire il prodotto di un numero infinito (numerabile o persino più che numerabile) di insiemi. Mirando a una costruzione più diretta ed estendibile ai prodotti infiniti, vorremmo definire, più semplicemente, il prodotto cartesiano A × B × C come l’insieme delle “terne” (a, b, c), con a ∈ A, b ∈ B, c ∈ C. Ma dobbiamo innanzitutto definire cosa sono le terne. Avendo a disposizione la nozione di funzione, possiamo dare la seguente definizione: • Siano A, B, C tre insiemi. Il prodotto cartesiano A × B × C è l’insieme delle funzioni6 f : {1, 2, 3} −→ A ∪ B ∪ C tali che f (1) ∈ A, f (2) ∈ B, f (3) ∈ C. Una terna è dunque una funzione f con le proprietà suddette. Come avevamo anticipato, questa costruzione può essere facilmente adattata anche a un numero maggiore di insiemi, finito o infinito7 nel modo seguente. Sia I un insieme non vuoto di indici, introdotto per parametrizzare una famiglia di insiemi8 A = {Ai : i ∈ I} . Definizione 1.4 (Prodotto cartesiano di insiemi). Il prodotto cartesiano delle funzioni [ f : I −→ Ai Q i∈I Ai è l’insieme i∈I tali che f (i) ∈ Ai per ogni i ∈ I. Q Se tutti gli Ai sono uguali tra loro a un dato insieme A, il prodotto cartesiano i∈I A è l’insieme di tutte funzioni f : I −→ A. Esso viene indicato con AI . Se I è finito, tipicamente I = {1, 2, . . . , n}, si usa la notazione An anziché A{1,...,n} , e i suoi elementi sono le n–uple (ordinate) di elementi di A, indicate abitualmente come (a1 , a2 , . . . , an ). È un fatto ovvio che se uno degli insiemi Ai è vuoto, anche il prodotto cartesiano è vuoto, perché la condizione f (i) ∈ Ai non può essere realizzata per quel particolare i; questo è coerente con la convenzione che avevamo introdotto per il prodotto cartesiano di due Q insiemi. Viceversa, non è per nulla ovvio che se nessun Ai è vuoto, allora i∈I Ai è non vuoto. Questa affermazione, certamente dimostrabile per induzione sulla cardinalità dell’insieme degli indici I 6Qui presupponiamo l’esistenza dell’insieme N dei numeri naturali, che costruiremo solo nella prossima sezione; per aggirare questa imprecisione si potrebbe prendere {Ø} al posto di 1, {Ø, {Ø}} al posto di 2 e {Ø, {Ø, {Ø}}} al posto di 3; saranno proprio i numeri 1, 2, 3 nella costruzione dei numeri naturali che presenteremo. 7Perché questa definizione non è utilizzabile per introdurre il prodotto di due insiemi? In che relazione è la nozione di prodotto di due insiemi A e B con quella di funzioni f : {1, 2} → A ∪ B con f (1) ∈ A e f (2) ∈ B? 8Strettamente parlando, anche questa andrebbe intesa come una mappa S a valori insiemi, che associa a ogni i ∈ I un sottoinsieme Ai di un certo dato insieme X, quindi Ai = S(i) per ogni i ∈ I. 8. L’INSIEME DEI NUMERI NATURALI 14 quando questo è finito9, è in effetti indipendente dagli assiomi della teoria degli insiemi comunemente adottati (teoria di Zermelo–Fraenkel, o ZF). Pertanto può essere indifferentemente accettato oppure no, dando luogo a due teorie degli insiemi, una più ampia e l’altra più ristretta.10 Nella matematica moderna essa viene comunemente accettata, come assioma aggiuntivo, detto Assioma della scelta. Q Esistono opzioni intermedie, come richiedere che il prodotto i∈I Ai sia non vuoto quando tutti gli insiemi Ai sono non vuoti e I = N (o è equipotente a N), questo è il cosiddetto Assioma della scelta numerabile (gran parte dell’Analisi Matematica moderna non potrebbe essere possibile se non si accettasse almeno questo assioma, come presto vedremo). Le seguenti sono formulazioni equivalenti dell’Assioma della scelta. • Il prodotto cartesiano di una famiglia non vuota di insiemi non vuoti è non vuoto. • Data una famiglia non vuotaS{Ai : i ∈ I} di insiemi non vuoti a due a due disgiunti, esiste un sottoinsieme B di i∈I Ai tale che, per ogni i ∈ I, B ∩ Ai contenga un unico elemento. Si noti che dalla Q prima alla seconda formulazione si passa prendendo B = f (I), ove f è una qualsiasi funzione in i∈I Ai (per esercizio, si passi dalla seconda alla prima formulazione). La seconda formulazione giustifica il nome di “Assioma della scelta”: è possibile “scegliere” simultaneamente rispetto al parametro i un elemento da ciascun Ai . 8. L’insieme dei numeri naturali Dato un insieme X, chiamiamo successore di X l’insieme S(X) = X ∪ {X} . Un insieme A si dice S–saturo se (i) Ø ∈ A; (ii) se X ∈ A, anche S(X) ∈ A. È facile verificare che l’insieme intersezione di una famiglia qualsiasi di insiemi S–saturi è S–saturo: Lemma 1.5. Sia {Ai }i∈I una famiglia di insiemi S–saturi. Allora anche la loro intersezione A0 = T i∈I Ai è S–satura. Dimostrazione. Essendo Ø ∈ Ai per ogni i ∈ I, si ha Ø ∈ A0 . Dunque A0 soddisfa la condizione (i). Inoltre, se X ∈ A0 , allora X ∈ Ai per ogni i ∈ I, e dunque anche S(X) ∈ Ai per ogni i ∈ I. Quindi S(X) ∈ A0 , e A0 soddisfa anche la condizione (ii), cioè A0 è S–saturo. Nel sistema assiomatico ZF, l’Assioma dell’infinito afferma che: Assioma dell’infinito. Esistono insiemi S–saturi. 9I concetti di cardinalità e di insieme finito verranno precisati in seguito. 10L’Assioma della scelta è strettamente necessario in alcune dimostrazioni/costruzioni solo nei casi in cui non si ha un criterio “effettivo” di scelta. In questi casi, l’assioma garantisce l’esistenza di una funzione generata in modo “non costruttivo”. Supponiamo per esempio che Ai ⊂ N: in questo caso si può definire il minimo degli Ai come criterio di scelta, ottenendo una funzione ben definita anche senza usare l’Assioma della scelta, a questo proposito si veda anche il Teorema 1.23. Per quanto possa sembrare “innocuo”, l’Assioma della scelta ha conseguenze sorprendenti. Forse la più sorprendente è il cosiddetto paradosso di Banach–Tarski (scoperto da S. Banach e A. Tarski nel 1924): è possibile decomporre la palla (solida) di raggio 1 e centro nell’origine, nello spazio tridimensionale R3 , in un numero finito di parti (il numero minimo, come poi mostrato da R. M. Robinson, è 5) in modo tale che, con opportune traslazioni e rotazioni, è possibile ricomporre con queste parti due palle solide di raggio 1 e centro nell’origine. 8. L’INSIEME DEI NUMERI NATURALI 15 Il nome viene dal fatto che, come vedremo, l’assioma consente di mostrare l’esistenza di insiemi con infiniti elementi. Si noti la differenza tra infinito potenziale e attuale: nel primo caso è sufficiente considerare teorie degli insiemi in cui tutti gli insiemi sono finiti, ma non vi è alcuna limitazione superiore al loro numero di elementi, nel secondo caso esistono insiemi con infiniti elementi (ma questo, appunto, deve essere garantito da qualche assioma). Grazie al lemma precedente ha senso pensare all’intersezione di tutti gli insiemi S–saturi come il più piccolo insieme S–saturo possibile; questo sarà per noi l’insieme dei numeri naturali. Tuttavia (come vedremo anche più avanti) la considerazione dell’“insieme di tutti gli insiemi con qualche proprietà” può dar luogo a contraddizioni; per aggirare questo problema adottiamo la seguente costruzione. Sia A un insieme S–saturo. Per il Lemma 1.5, l’intersezione NA di tutti i suoi sottoinsiemi S–saturi è un insieme S–saturo. Vogliamo verificare che questo insieme è indipendente dalla scelta di A. Lemma 1.6. Siano A, A0 due insiemi S–saturi e siano NA , NA0 le intersezioni dei loro rispettivi sottoinsiemi S–saturi. Allora NA = NA0 . Dimostrazione. Si noti che A ∩ A0 è non vuoto, perché contiene Ø, e che è un sottoinsieme S–saturo di A. Per la minimalità di NA , deve essere NA ⊆ A ∩ A0 , quindi concludiamo che NA ⊆ A0 . Ora, la minimalità di NA0 dà NA0 ⊆ NA . Ma le ipotesi su A e A0 sono perfettamente simmetriche, quindi un discorso analogo dà anche l’inclusione opposta NA ⊆ NA0 . L’insieme caratterizzato dal Lemma 1.6 è indicato con N ed è detto insieme dei numeri naturali (la “costruzione” di N qui presentata è dovuta a Von Neumann, di qui il nome di interi di Von Neumann). Esso è il “più piccolo” insieme S–saturo esistente, rispetto alla relazione d’inclusione. Sono elementi di N gli insiemi 0=Ø 1 = S(0) = Ø ∪ {Ø} = {Ø} 2 = S(1) = {Ø} ∪ {Ø} = Ø, {Ø} n o 3 = S(2) = Ø, {Ø}, Ø, {Ø} n o 4 = S(3) = Ø, {Ø}, Ø, {Ø} , Ø, {Ø}, Ø, {Ø} ......... dove 0, 1, 2, . . . sono i simboli convenzionalmente usati. I puntini sospensivi sottintendono l’idea intuitiva che tutti gli elementi di N siano ottenibili iterando l’operazione S. Gli enunciati che seguono contengono la formalizzazione rigorosa di questa idea. Lo strumento fondamentale per ricavare le proprietà di N è il Principio di induzione. Teorema 1.7 (Principio di induzione). Sia P (n) un predicato11 dipendente da un numero naturale n. Se vale P (0) e, per ogni intero n, vale l’implicazione P (n) ⇒ P (S(n)), allora vale ∀n ∈ N P (n). In formule P (0) ∧ ∀n ∈ N P (n) ⇒ P (S(n)) =⇒ ∀n ∈ N P (n) . Dimostrazione. Sia A = {n ∈ N : P (n) vale}. Allora, per ipotesi, A è un sottoinsieme S–saturo di N. Dunque N ⊆ A. Ma anche A ⊆ N, per cui A = N. Si noti che l’ipotesi del principio di induzione non fa riferimento alla validità (o verità) di P (n), ma solo alla validità dell’implicazione P (n) ⇒ P (S(n)), che a volte si può cercare di dimostrare 11In logica, un enunciato che dipende da una o più variabili n, x ecc., variabili in dati insiemi, si chiama predicato. 8. L’INSIEME DEI NUMERI NATURALI 16 indipendentemente dal “valore di verità” di P (n); esistono inoltre facili esempi12 in cui l’implicazione è logicamente corretta ma, dato che P (0) non vale, non possiamo usare il principio di induzione per concludere che P (n) vale per ogni n. Tuttavia, dato che P (n) ⇒ P (S(n)) non vale solo quando P (n) è vera e P (S(n)) è falsa, quello che si fa per mostrare la validità dell’implicazione è di mostrare che P (S(n)) vale tutte le volte che P (n) vale. Si noti che, per ogni n ∈ N, n ⊆ S(n) = n ∪ {n}. Più in generale, il seguente risultato evidenzia che le relazioni di inclusione stretta e di appartenenza coincidono, se ristrette a N × N, e alcune proprietà di N e della funzione S : N → N. Proposizione 1.8 (Proprietà del successore). (1) (2) (3) (4) (5) Per ogni n, S(n) 6= Ø. Per ogni n, n ∈ / n. Di conseguenza, n ⊂ S(n) (inclusione stretta). m ∈ n ⇔ m ⊂ n (inclusione stretta). m ⊆ n ⇔ m ⊂ S(n). S(m) = S(n) ⇒ m = n. Infine, S : N → N \ {0} è una corrispondenza biunivoca, è quindi ben definita l’applicazione“predecessore” S −1 da N \ {0} a N, e per ogni intero n non esistono interi m tali che n ∈ m ∈ S(n). Dimostrazione. Per ogni n, n ∈ S(n). Questo dimostra (1). Dimostriamo ora, per induzione su n, una versione più debole di (3), ovvero che m ∈ n ⇒ m ⊆ n. Per n = 0, è ovvio. Supponiamolo vero per n e dimostriamo che m ∈ S(n) ⇒ m ⊆ S(n). Se m ∈ S(n) allora si hanno due casi: (i) m ∈ n, e quindi per ipotesi induttiva m ⊆ n ⊆ S(n), oppure (ii) m = n, nel qual caso m ⊆ n ∪ {n} = S(n). Sfruttando questo fatto, dimostriamo (2) per induzione su n. Per n = 0 è ovvio. Supponiamolo vero per n e dimostriamo che S(n) ∈ / S(n). Per assurdo, sia S(n) ∈ S(n). Allora S(n) ∈ n ∪ {n} e quindi (i) S(n) ∈ n oppure (ii) S(n) ∈ {n}. Nel primo caso, per quanto visto sopra, S(n) ⊆ n e quindi n ∈ n: assurdo per ipotesi induttiva. Nel secondo caso S(n) = n e quindi si ritrova l’assurdo n ∈ n. Questo dimostra (2). Sfruttando (2) possiamo migliorare l’affermazione precedente, dimostrando che m ∈ n ⇒ m ⊂ n. Questo dimostra una implicazione nella (3). L’altra implicazione si dimostra di nuovo per induzione su n ed è lasciata per esercizio. Al punto (4) l’implicazione ⇒ segue immediatamente dalla (2). Supponiamo ora m ⊂ S(n) e mostriamo che m ⊆ n. Da m ⊂ S(n), per la (3) si ha m ∈ n ∪ {n}; se m = n l’inclusione m ⊆ n da dimostrare è ovvia. Se invece m ∈ n allora sempre per la (3) otteniamo m ⊆ n. Dimostriamo ora la (5). Supponiamo che S(n) = S(m). Ne consegue che n ∈ m ∪ {m} e quindi n = m oppure n ∈ m. Nel primo caso, abbiamo verificato la (5). Nel secondo caso, segue dalla (3) che n ⊂ m e quindi S(n) = n ∪ {n} ⊆ m ⊂ m ∪ {m} = S(m): assurdo. L’iniettività di S è l’enunciato (5). Se, per assurdo, l’immagine di S non contenesse un elemento n 6= 0, l’insieme N \ {n} sarebbe S–saturo, in contrasto con la minimalità di N. Quindi, tenendo anche conto del punto (1), S(N) = N \ {0}. Infine, se per un certo n ∈ N esistesse m ∈ N tale che n ∈ m ∈ S(n), troveremmo per la (3) le inclusioni strette n ⊂ m ⊂ S(n). D’altro canto S(n) = n ∪ {n} sarebbe un sottoinsieme di m, assurdo. 12Ad esempio se P (n) è il predicato “1/(S(n)) < 0”, ove ≤ è l’ordinamento (naturale) in N che rispetta le regole aritmetiche e che introdurremo rigorosamente nelle pagine successive. 8. L’INSIEME DEI NUMERI NATURALI 17 Osservazione 1.9 (Assioma di buona fondazione). Più in generale, nel sistema ZF, l’Assioma di buona fondazione afferma ogni insieme non vuoto A ha almeno un elemento disgiunto da A, in formule ∀A∃y (y ∈ A) ∧ (A ∩ y = ∅). È facile vedere che questo assioma consente non solo di escludere che X ∈ X per qualsiasi insieme X (si consideri A = {X}), ma anche di mostrare che la mappa S è “iniettiva”, i.e. X 6= Y implica S(X) 6= S(Y ) (se S(X) = S(Y ) e X 6= Y , si consideri A = {X, Y }). Si provi per esercizio, usando l’assioma di buona fondazione, che (a, b) = {a, {a, b}} è ancora una buona definizione di coppia, oltre a quella (a, b) = {{a}, {a, b}} già vista in precedenza. Definiamo ora le relazioni ≤ e < su N come segue: m ≤ n ⇐⇒ m ⊆ n, m < n ⇐⇒ m ⊂ n. Per le proprietà dell’inclusione è chiaro che ≤ è una relazione d’ordine. Inoltre la Proposizione 1.8 afferma che, dato n ∈ N, non esistono elementi m ∈ N con n < m < S(n). Proposizione 1.10. (1) La relazione ≤ è un ordinamento totale su N. (2) Ogni sottoinsieme di N non vuoto ha minimo. Dimostrazione. Dimostriamo (1) per induzione su m, studiando la proposizione (ove per “n confrontabile con m” si intende n ≤ m o m ≤ n) P (m) : “ogni n ∈ N è confrontabile con m”. Per ogni insieme X, Ø ⊆ X. Ne segue che P (0) è vera. Supponiamo vera P (m). Per ogni n ∈ N, si hanno allora due casi: (i) n ≤ m, nel qual caso n < S(m), oppure (ii) m < n, i.e. m ⊂ n. In questo secondo caso, per la Proposizione 1.8 (3), si hanno le seguenti implicazioni: m ⊂ n =⇒ m ∈ n =⇒ m ∪ {m} ⊆ n =⇒ S(m) ≤ n . Quindi in entrambi i casi n è confrontabile con S(m) e vale P S(m) . Dimostriamo per prima cosa la (2) per assurdo, ma sotto l’ipotesi aggiuntiva che B sia una semiretta, vale a dire n ∈ B e n ≤ n0 implica n0 ∈ B. Sia quindi B una semiretta non vuota e priva di minimo. Mostriamo sotto queste ipotesi, per induzione su n, che n ∈ / B per ogni n ∈ N, il che ci darà l’assurdo. Evidentemente 0 ∈ / B (altrimenti 0 sarebbe il minimo di B); se fosse n ∈ / B e S(n) ∈ B, la proprietà di semiretta ci darebbe S(n) ≤ m per ogni m ∈ B; se infatti fosse m < S(n), non essendoci interi intermedi tra n e S(n) avremmo m ≤ n e quindi n ∈ B (grazie alla proprietà di semiretta), assurdo. La (2) è quindi mostrata per semirette. Per dimostrare la (2) in generale, sia B ⊆ N non vuoto e consideriamo la semiretta B 0 = {n ∈ N : ∃ m ∈ B tale che m ≤ n} dei naturali che maggiorano un elemento di B, che contiene B e quindi è non vuota. Allora B 0 ha un elemento minimo n0 . Se mostriamo che n0 appartiene a B otteniamo che n0 è anche minimo di B, per l’inclusione B 0 ⊆ B. Dal fatto che n0 ∈ B 0 deduciamo che esiste un elemento m di B tale che m ≤ n0 ; per la minimalità di n0 deve essere m = n0 , quindi n0 ∈ B. Grazie all’ordinamento totale di N possiamo generalizzare il principio di induzione come segue: chiamiamo una proprietà P induttiva se vale l’implicazione P (n) ⇒ P (S(n)). 9. CARDINALITÀ DI INSIEMI 18 Corollario 1.11 (Induzione generalizzata). Sia P (n) una proprietà induttiva. Allora o P (n) non vale per alcun n o esiste n0 ∈ N tale che P (n) ⇐⇒ vale n0 ≤ n . Dimostrazione. Sia B = {n ∈ N : P (n) è vera} e supponiamo che B non sia vuoto, altrimenti la tesi è ovvia. B ha quindi un minimo elemento n0 , da cui deduciamo che vale l’implicazione ⇒ nella tesi. Per ottenere l’implicazione ⇐ basta applicare il principio di induzione alla proprietà induttiva Q(n) = (n < n0 ) ∨ P (n) per ottenere che Q(n) vale per ogni n, quindi P (n) vale per ogni n ∈ N tale che n0 ≤ n. 9. Cardinalità di insiemi La teoria che illustreremo in questa sezione è dovuta, nelle sue linee generali, a G. Cantor, intorno al 1870. • Si dice che un insieme A ha la stessa cardinalità, o potenza, di un insieme B se esiste una funzione bigettiva di A in B. Si dice anche che A è equipotente a B. Si vede facilmente che: • un insieme A è equipotente a se stesso (perché ιA è bigettiva); • se A è equipotente a B, B è equipotente ad A (perché se f : A → B è bigettiva, anche f −1 : B → A lo è); • se A è equipotente a B e B è equipotente a C, allora A è equipotente a C (perché se f : A → B e g : B → C sono bigettive, allora g ◦ f : A → C è bigettiva). La “relazione” di equipotenza gode dunque delle proprietà riflessiva, simmetrica e transitiva che caratterizzano le relazioni di equivalenza. Ma su quale insieme è definita la relazione? Vorremmo poter prendere “l’insieme di tutti gli insiemi”, ma cosı̀ facendo andremmo in contrasto con gli assiomi del sistema ZF.13 Accontentiamoci dunque di affermare che su un qualunque insieme Ω, l’equipotenza (che indichiamo con ∼) è in effetti una relazione di equivalenza in P(Ω), le cui classi di equivalenza chiameremo cardinalità. L’idea intuitiva dietro queste nozioni è che due insiemi sono equipotenti se “sono ugualmente numerosi”. Questa intuizione è corretta per insiemi finiti: un insieme con 37 elementi può essere posto in corrispondenza biunivoca solo con un altro insieme di 37 elementi (v. Teorema 1.16). Per insiemi infiniti la questione è molto più delicata, ed è per questo motivo che la trattazione deve essere particolarmente accurata sul piano formale. Trasferire a insiemi infiniti la nostra prima intuizione porta facilmente a errori. Si può ad esempio mostrare che gli insiemi N, Z, Q e Nn (n ∈ N∗ ) sono equipotenti a due a due, cosı̀ come gli insiemi (molto più numerosi) {0, 1}N , NN , R, Rn , RN (qui R indica l’insieme dei numeri reali, del quale si parlerà più avanti). Proprio in relazione agli esempi appena illustrati, vogliamo ora dire che certi insiemi sono “meno numerosi di altri”. Stabiliamo allora una relazione di “minore numerosità” R nel modo seguente: Siano A, A0 sottoinsiemi di Ω; diciamo che A R A0 se esiste f : A → A0 iniettiva. 13L’insieme E di tutti gli insiemi avrebbe la proprietà E ∈ E, in contrasto con l’Assioma di buona fondazione (vedi l’Osservazione 1.9). 9. CARDINALITÀ DI INSIEMI 19 La nostra intuizione con insiemi finiti ci dice che se A ha n elementi e A0 ha n0 elementi, esiste una funzione iniettiva di A in A0 se e solo se n ≤ n0 . Dunque la validità della relazione A R A0 dipende (per insiemi finiti) solo dalla cardinalità di A e A0 . Il seguente lemma afferma che ciò è vero per insiemi generici. Lemma 1.12. Supponiamo che A R A0 , e siano B, B 0 ∈ P(Ω) con B ∼ A, B 0 ∼ A0 . Allora B R B 0 . Dimostrazione. Per ipotesi, esistono: (1) f : A −→ A0 iniettiva; (2) g : B −→ A bigettiva; (3) h : B 0 −→ A0 bigettiva. Consideriamo allora la composizione h−1 ◦ f ◦ g : B −→ B 0 , g f h−1 B −→ A −→ A0 −→ B 0 . Essendo una composizione di funzioni iniettive, essa è iniettiva. Possiamo allora “passare la relazione R al quoziente modulo ∼”, per definire una relazione sull’insieme quoziente delle cardinalità. Siano C, C 0 due cardinalità. Diciamo che C C 0 se, presi A ∈ C e A0 ∈ C 0 , si ha A R A0 . Il Lemma 1.12 ci assicura che questa è una buona definizione, ossia che la conclusione A R A0 non dipende dalla scelta di A e A0 come rappresentanti di C e C 0 rispettivamente. Vogliamo vedere che è una relazione d’ordine tra cardinalità. Le proprietà riflessiva e transitiva sono facili da verificare (la transitività, in particolare, si basa sul fatto che la composizione di funzioni iniettive è iniettiva). Dimostrare la proprietà antisimmetrica vuol dire dimostrare il seguente teorema. Teorema 1.13 (Cantor–Bernstein). Siano A, B insiemi e supponiamo che esistano funzioni f : A → B e g : B → A iniettive. Allora A e B sono equipotenti. Dimostrazione. È utile pensare che A e B siano disgiunti. Questo non è restrittivo, sostituendo eventualmente A e B con insiemi di uguale cardinalità per ridursi a questo caso. Può anche essere utile pensare che sia B \ f (A) che A \ g(B) siano non vuoti, altrimenti la tesi è banale. Dato a ∈ A, possiamo generare consecutivamente “figli” f (a) ∈ B, “nipoti” g(f (a)) ∈ A, “pronipoti” f (g(f (a))) ∈ B e cosı̀ via (vedi la Figura 1). In maniera analoga ogni elemento b ∈ B genera successivamente g(b) ∈ A, f (g(b)) ∈ B, g(f (g(b))) ∈ A e cosı̀ via. L’idea chiave è che, essendo tutte queste mappe iniettive (e quindi invertibili, se ristrette alla loro immagine), possiamo fare il procedimento a ritroso, dividendo A in tre insiemi a due a due disgiunti: l’insieme AA degli elementi a ∈ A che o appartengono a A \ g(B) o hanno come primo progenitore un elemento a0 di A (che necessariamente dovrà appartenere a A \ g(B)), l’insieme AB degli elementi a ∈ A che hanno come primo progenitore un elemento b di B (che necessariamente dovrà appartenere a B \ f (A)), infine l’insieme A∞ degli elementi di A che non hanno un primo progenitore. Fatta una analoga decomposizione dell’insieme B, in tre insiemi a due a due disgiunti BB ⊇ B \ f (A), BA e B∞ , è evidente che la mappa f porta bigettivamente non solo A∞ in B∞ , ma anche AA in BA , perché ogni elemento b ∈ BA deve essere immagine tramite f di un elemento a ∈ A, che andando a ritroso ha necessariamente un primo progenitore in A (a stesso, eventualmente). Tuttavia, f non è surgettiva da AB in BB , perché f (AB ) ⊆ f (A) e BB ⊇ B \ f (A) 6= Ø. Ma, per simmetria rispetto al ragionamento già fatto per f , g mappa bigettivamente BB in AB , quindi l’inversa h della restrizione di g 9. CARDINALITÀ DI INSIEMI 20 a BB mappa bigettivamente AB su BB . Incollando quindi queste due mappe, i.e. definendo f (a) se a ∈ AA ∪ A∞ ; H(a) := h(a) se a ∈ AB otteniamo una bigezione tra A e B. È un utile esercizio quello di tradurre in formule la dimostrazione discorsiva su riportata: indicata con (g ◦ f )(n) l’n–sima iterata di g ◦ f : A −→ A (con la convenzione (g ◦ f )(0) = ιA ), si ha A∞ = ∞ \ (g ◦ f )(n) (A), n=0 ∞ [ AA = (g ◦ f )(n) (A \ g(B)) . n=0 Gli insiemi B∞ e BB sono definiti analogamente e, posto AB = g(BB ) e BA = f (AA ), si tratta di mostrare che con queste definizioni (A∞ , AA , AB ) e (B∞ , BB , BA ) sono partizioni di A e B rispettivamente. f g g(f(A)) f(g(B)) B f A Figura 1 Corollario 1.14. La relazione tra cardinalità è un ordinamento. Si noti che per il momento abbiamo solo dimostrato che è un ordinamento parziale. Come vedremo più avanti, facendo uso dell’Assioma della scelta, si dimostra che si tratta di un ordinamento totale. 11. INSIEMI FINITI E INFINITI 21 10. Cardinalità di P(A) Ricordiamo che l’insieme P(A) delle parti di A è l’insieme di tutti i sottoinsiemi di A, mentre indicheremo con Pfin (A) l’insieme delle parti finite di A. Dimostriamo due proprietà della cardinalità di P(A): Teorema 1.15. Valgono le seguenti relazioni: (i) card P(A) = card {0, 1}A ; (ii) card P(A) card A. Dimostrazione. Per dimostrare la (i), definiamo per prima cosa la funzione caratteristica χB : A → {0, 1} di B ⊆ A come segue: ( 1 se a ∈ B χB (a) = 0 se a ∈ A \ B . Definiamo ora la mappa Φ : P(A) → {0, 1}A che associa a B ∈ P(A) la funzione χB . Si verifica facilmente che Φ è iniettiva. Per la surgettività, basta osservare che ogni funzione f da A in {0, 1} −1 è la funzione caratteristica di f {1} . Per dimostrare la (ii) bisogna provare che da A a P(A) esistono applicazioni iniettive, ma nessuna che sia bigettiva. È evidente che la funzione f (a) = {a} è iniettiva da A in P(A). Supponiamo per assurdo che g : A → P(A) sia surgettiva. Poniamo A0 = a ∈ A : a 6∈ g(a) . Allora esiste a0 tale che A0 = g(a0 ). Ci sono due casi, a0 ∈ A0 e a0 ∈ 6 A0 . Se a0 ∈ A0 , allora 0 0 0 a0 6∈ g(a0 ) = A , il che è assurdo. Se a0 6∈ A , allora a0 ∈ g(a) = A , che è ancora assurdo.14 Questo teorema mostra che non esistono cardinalità massimali. Come vedremo, questo è particolarmente interessante per insiemi infiniti. Per esempio, card N ≺ card P(N) ≺ card P P(N) ≺ · · · 11. Insiemi finiti e infiniti Vediamo in questo paragrafo come si definiscono rigorosamente gli insiemi finiti e le loro cardinalità. Lemma 1.16. Per n ∈ N, sia En = {k ∈ N : k < n}. Se m < n, allora card Em è strettamente minore di card En . Dimostrazione. È evidente che card Em card En , perché Em ⊂ En e dunque esiste la funzione iniettiva di inclusione ι : Em → En . Mostriamo che invece non può esistere un’applicazione iniettiva di En in Em . Proviamo per induzione su m che ∀ n > m, non esiste una funzione iniettiva di En in Em . Per m = 0 la tesi è ovvia perché E0 = Ø mentre 0 ∈ En se n > 0. Supponiamo la tesi vera per m e sia n > S(m). Ammettiamo per assurdo che esista f : En → ES(m) iniettiva. Poniamo n0 = S −1 (n). È allora chiaro che En = En0 ∪ {n0 }, ES(m) = Em ∪ {m} e n0 > m. 14Si noti che questa dimostrazione trae ispirazione dalla famosa antinomia di Russel, dell’insieme {x : x ∈ / x} degli insiemi che non appartengono a se stessi. L’esistenza di questa antinomia ha determinato regole più restrittive in ZF per la generazione di insiemi e ha ispirato l’assioma di buona fondazione. 12. IL LEMMA DI ZORN 22 Se f (n0 ) = m, allora, per l’iniettività, f (En0 ) ⊆ Em e dunque f |En0 sarebbe una funzione iniettiva di Em in En0 , contro l’ipotesi induttiva. Se f (n0 ) = k < m, si consideri l’applicazione bigettiva σ : ES(m) → ES(m) , tale che σ(k) = m, σ(m) = k e σ(p) = p per ogni altro p ∈ ES(m) . Posto g = σ ◦ f , si ricade nel caso precedente. A questo punto, si definisce finito un insieme che sia equipotente a uno (e dunque uno solo) degli En . Se A ∼ En , si pone card A = n. Un insieme non equipotente a nessun En si dice infinito. Teorema 1.17. Se A è infinito, allora card A card N. In particolare, card A n per ogni n ∈ N. Dimostrazione. Applichiamo l’assioma della scelta come segue: (a) prendiamo Pfin (A) come insieme I degli indici; (b) dato F ∈ Pfin (A), poniamo AF = A \ F . Siccome A è infinito, AF è non vuoto per ogni F ∈ Pfin (A). Per l’assioma della scelta, a ogni F ∈ Pfin (A) possiamo dunque associare un elemento σ(F ) ∈ A \ F . Definiamo allora f : N −→ A con il seguente procedimento induttivo (questo tipo di definizione è anche detto ricorsivo e può essere formalizzato usando il principio di induzione): (i) scegliamo f (0) in modo arbitrario; (ii) supponendo definiti f (0), f (1), . . . , f (n), definiamo f S(n) = σ {f (0), f (1), . . . , f (n)} . Si noti che la (ii) implica che, se m < n, f (n) 6= f (m), e dunque f risulta iniettiva. Un insieme infinito A equipotente a N si dice numerabile. La cardinalità di N si indica con il simbolo ℵ0 (aleph con zero). 12. Il Lemma di Zorn Il Lemma di Zorn è un enunciato equivalente all’Assioma della scelta. Di esso viene fatto frequente uso in vari campi della matematica avanzata, per mostrare attraverso l’esistenza di opportuni oggetti in modo non costruttivo (e in genere per tali oggetti una dimostrazione di esistenza per via costruttiva non è possibile). Per poterlo enunciare, dobbiamo premettere alcune nozioni relative a insiemi ordinati. Il Lemma di Zorn riguarda una classe speciale di insiemi ordinati, detti induttivi, cosı̀ definiti: • Un insieme ordinato (A, ≤) si dice induttivo se ogni catena C di A (cioè ogni sottoinsieme totalmente ordinato) possiede maggioranti, ovvero esiste a ∈ A tale che c ≤ a per ogni c ∈ C. Si noti che la definizione stessa implica che un insieme induttivo non è vuoto. Infatti la catena vuota deve avere un maggiorante in A. Teorema 1.18 (Lemma di Zorn). Sia (A, ≤) un insieme ordinato induttivo. Per ogni a ∈ A esiste un elemento massimale m tale che a ≤ m. Si noti che per insiemi finiti la dimostrazione è elementare: se a stesso non è massimale, esiste a1 ∈ A con a < a1 ; se neanche a1 lo è, esiste a2 ∈ A con a1 < a2 , e cosı̀ via. Essendo tutti gli ai distinti, il processo termina su un elemento massimale. L’assioma della scelta consente di formalizzare questo procedimento anche per insiemi infiniti: la difficoltà deriva dal fatto che, se il processo su descritto non dovesse terminare, potremmo pure prendere un maggiorante m di tutti gli ai , i ∈ N, ma nessuno ci assicurerebbe che esso sia massimale (troveremmo quindi m1 con m < m1 ...., in una spirale senza fine di iterazioni). 12. IL LEMMA DI ZORN 23 Mostriamo ora alcune applicazioni del Lemma di Zorn, rinviando la dimostrazione di quest’ultimo al paragrafo successivo. La prima applicazione riguarda l’ordinamento tra cardinalità. Teorema 1.19. Dati due insiemi A e B, esiste sempre una funzione iniettiva di A in B o di B in A. Quindi l’ordinamento tra cardinalità è totale. Dimostrazione. La conclusione è ovvia se A o B è vuoto (se per esempio A = Ø, si prenda la funzione vuota Ø : Ø → B). Supponiamo dunque che A e B siano non vuoti. Indichiamo con X l’insieme delle funzioni bigettive f : A0 → B 0 , dove A0 ⊆ A, B 0 ⊆ B. Chiaramente X non è vuoto, perché, fissati a ∈ A e b ∈ B, la funzione f : {a} → {b} tale che f (a) = b è bigettiva. Per dimostrare la tesi, occorre dimostrare l’esistenza di una funzione f ∈ X che abbia come dominio tutto A, oppure come immagine tutto B. Nel primo caso, allargando il codominio di f da B 0 a B, otteniamo una funzione iniettiva da A in B; nel secondo caso, facciamo la stessa operazione su f −1 : B → A0 , ottenendo una funzione iniettiva di B in A. Su X definiamo il seguente ordinamento: (f : A0 → B 0 ) (g : A00 → B 00 ) , ⇐⇒ A0 ⊆ A00 , B 0 ⊆ B 00 e f = g|A0 , (in termini puramente insiemistici, f ⊆ A0 × B 0 , g ⊆ A00 × B 00 ; allora f g se e solo se f ⊆ g). Si verifica facilmente che è una relazione d’ordine (parziale a meno che A e B non contengano un unico elemento). Mostriamo che (X, ) è induttivo. S S Sia C = {fi : Ai → Bi : i ∈ I} una catena di X. Poniamo A = i∈I Ai , B = i∈I Bi , e sia f : A → B la funzione il cui grafico è l’unione dei grafici delle fi .15 È evidente che fi f per ogni i ∈ I, e dunque f è un maggiorante di C in X. Essendo dunque X induttivo, per il Lemma di Zorn, esso ammette un elemento massimale f0 : A0 → B 0 . Se A0 e B 0 fossero entrambi sottoinsiemi propri di A e B rispettivamente, potremmo scegliere a ∈ A \ A0 e b ∈ B \ B 0 e definire f1 : A0 ∪ {a} → B 0 ∪ {b} ponendo ( f0 (a) se a ∈ A0 , f1 (a) = b se a = a . Avremmo allora f1 ∈ X e f0 ≺ f1 , in contrasto con l’ipotesi di massimalità di f0 . Teorema 1.20 (Esistenza di ordinamenti totali). Ogni insieme ammette un ordinamento totale. Dimostrazione. Sia A un insieme, che supponiamo non vuoto16. Chiamiamo X l’insieme delle coppie (A0 , ≤), dove A0 ⊆ A e ≤ è un ordinamento totale su A0 . Su X definiamo la relazione (A0 , ≤) (A00 , v) ⇐⇒ A0 ⊆ A00 e v|A0 =≤ . L’insieme X non è vuoto perché i sottoinsiemi di A contenenti un unico elemento ammettono un ovvio ordinamento totale. In modo analogo al teorema precedente, si dimostra che (X, ) è induttivo. Per il lemma di Zorn, esiste un elemento massimale (A0 , ≤). Se fosse A0 6= A, potremmo prendere a ∈ A \ A0 e definire un ordinamento totale su A0 ∪ {a} che estenda ≤, stabilendo, per esempio, che a sia l’elemento massimo. Questo contrasterebbe con l’ipotesi di massimalità. Come abbiamo anticipato, il Lemma di Zorn è equivalente all’Assioma della scelta. La dimostrazione nel prossimo paragrafo mostrerà che, assumendo vero l’Assioma della scelta, si dimostra il Lemma di Zorn. Mostriamo qui che, viceversa, assumendo vero il Lemma di Zorn, si dimostra l’Assioma della scelta. 15Si noti che, in generale, l’unione di grafici non è un grafico. 16Se A = Ø, la relazione Ø è un ordinamento totale. 13. IL TEOREMA DI ZERMELO 24 Teorema 1.21. Il Lemma di Zorn implica l’Assioma della scelta. Dimostrazione. Sia {Ai : i ∈ I} una famiglia non vuota di insiemi non vuoti a due a due disgiunti. Poniamo n o [ X= B⊂ Ai : ∀ i ∈ I , B ∩ Ai contiene al più un elemento . i∈I Chiaramente X è non vuoto (Ø ∈ X). Ordinando X per inclusione, mostriamo che (X, ⊆) è S induttivo. Se C = {Bj : j ∈ J} è una catena, prendiamo B = j∈J Bj . Dobbiamo mostrare che B ∈ X. Supponiamo per assurdo che esista i ∈ I tale che B ∩ Ai contenga due elementi distinti b1 , b2 . Esisteranno allora j1 , j2 tali che b1 ∈ Bj1 e b2 ∈ Bj2 . Siccome C è totalmente ordinato, uno dei due è contenuto nell’altro. Supponiamo che B2 ⊆ B1 , per cui b1 , b2 ∈ Bj1 . Ma allora b1 , b2 ∈ Bj1 ∩ Ai . Ma poiché Bj1 ∈ X, deve essere b1 = b2 , da cui l’assurdo. Per il Lemma di Zorn, X ammette un elemento massimale B0 . Mostriamo che per ogni i ∈ I, B0 ∩ Ai contiene esattamente un elemento. Se, per assurdo, esistesse i0 tale che B0 ∩ Ai0 = Ø, scegliendo17 un elemento b ∈ Ai0 , avremmo l’insieme B1 = B0 ∪ {b} ∈ X, strettamente maggiore di B0 , contrariamente all’ipotesi di massimalità. 13. Il Teorema di Zermelo Un ordinamento su A si dice un buon ordinamento se ogni sottoinsieme non vuoto possiede un elemento minimo. Per esempio, la Proposizione 1.10 dimostra che l’ordinamento standard su N è un buon ordinamento. Un altro esempio è dato dall’ordinamento lessicografico su N2 : (m, n) ≤ (m0 , n0 ) ⇐⇒ m < m0 oppure m = m0 e n ≤ n0 . È chiaro che ogni buon ordinamento su A è totale: per confrontare due suoi elementi a e b basta prendere in esame il sottoinsieme {a, b}. È anche chiaro che ogni buon ordinamento su A ammette un minimo assoluto: basta prendere in esame il sottoinsieme A. Il seguente teorema, noto anche come Principio del buon ordinamento, è invece più delicato; la sua dimostrazione è una variante di quella utilizzata per mostrare il Teorema 1.20. Teorema 1.22 (Teorema di Zermelo). Ogni insieme ammette un buon ordinamento. Nel corso della dimostrazione diremo che un sottoinsieme B di un insieme ordinato (A, ≤) è un segmento (iniziale) di A se ∀ b ∈ B , (a ∈ A e a < b) =⇒ a ∈ B . Dimostrazione. Dato un insieme A, sia X l’insieme delle coppie (B, ≤) dove B ⊆ A e ≤ è un buon ordinamento su B. Su X introduciamo la relazione d’ordine (B, ≤) (B 0 , v) ⇐⇒ B è un segmento di B 0 e v|B =≤ . S S è un insieme Se (Bi , ≤i ) i∈I è una catena in X, si verifica facilmente che i∈I Bi , i∈I ≤i S ordinato, e che ogni Bi ne è un segmento. Mostriamo che è bene ordinato: se Z ⊆ i∈I Bi è non vuoto, esiste i tale che Z ∩ Bi è non vuoto, esiste quindi il minimo z di Z ∩ Bi . Ogni elemento z 0 ∈ Z minore di z appartiene, per la proprietà di segmento di Bi , anche a Bi , quindi la minimalità di z in Z ∩ Bi implica la minimalità di z in Z. Quindi (X, ) è induttivo. 17Si sceglie qui da un unico insieme, quindi non stiamo usando l’assioma di scelta! 13. IL TEOREMA DI ZERMELO 25 Sia allora (B, ≤) un elemento massimale di X. Se B fosse un sottoinsieme proprio di A, potremmo prendere un elemento a ∈ A \ B e introdurre su B ∪ {a} l’ordinamento che estende ≤, ponendo a come massimo di B ∪ {a}. Si vede facilmente che questo sarebbe un buon ordinamento, contro l’ipotesi di massimalità di (B, ≤). Come si vede, nella dimostrazione è stato usato il Lemma di Zorn, ossia l’Assioma della scelta. In realtà il Teorema di Zermelo è equivalente all’Assioma della scelta, come ora dimostriamo. Teorema 1.23. Il prodotto cartesiano di qualunque famiglia non vuota di insiemi non vuoti contenuti in un insieme bene ordinato è non vuoto. In particolare il Teorema di Zermelo implica l’Assioma della scelta. S Dimostrazione. Sia A = {Ai : i ∈ I} la famiglia di insiemi. Sia A = i∈I Ai la loro unione e supponiamo che A sia bene ordinato. Allora, per ogni i ∈ I, il sottoinsieme Ai di A ammette un minimo ai . La funzione f : I → A, i 7→ ai è un elemento del prodotto cartesiano Πi∈I Ai . Si noti che la definizione di f non richiede alcuna scelta arbitraria; in particolare questa definizione non richiede l’Assioma della scelta. Sugli insiemi bene ordinati (A, ≤) privi di massimo è possibile definire la funzione successore a 7→ S(a), i.e. un elemento b > a tale che a < b0 implica b ≤ b0 : S(a) = min {b ∈ A : a < b} . Si noti anche che S è iniettiva: infatti c < S(c) per definizione di S; se a < b allora a < S(a) ≤ b < S(b). Tuttavia S non è in generale surgettiva, ad esempio nell’insieme bene ordinato N t N0 , dove N0 = {n0 : n ∈ N} è una copia (distinta) di N come insieme ordinato e tutti gli elementi di N sono minori di tutti gli elementi di N0 , l’elemento 0’ di N0 non appartiene all’immagine di S. Quindi la funzione “predecessore” S −1 non è sempre definita su tutto A \ {min A}. Un’altra operazione possibile in insiemi bene ordinati (A, ≤) è quella che associa a un insieme B ⊆ A superiormente limitato il suo estremo superiore, ovvero il minimo dei maggioranti di B. Vale inoltre la seguente forma estesa del principio di induzione. Proposizione 1.24 (Induzione transfinita). Sia (A, ≤) un insieme bene ordinato e sia P (a) un enunciato dipendente da a ∈ A. Se per ogni a ∈ A vale l’implicazione (∀a0 < a P (a0 )) =⇒ P (a) allora vale P (a) per ogni a ∈ A. Dimostrazione. Si noti che, se a0 = min A, allora l’ipotesi della proposizione implica che P (a0 ) vale (perché la premessa nell’implicazione, che andrebbe scritta più precisamente nella forma ∀a0 ((a0 ≥ a) ∨ P (a0 )), è verificata). Se l’insieme B degli elementi di A tali che P non vale è non vuoto, l’implicazione nell’ipotesi è violata prendendo come a > a0 il minimo di B. Si noti anche che la formulazione dell’induzione transfinita non usa la funzione successore, a differenza di quello che abbiamo visto in N. Questo è dovuto al fatto che non è possibile in generale definire, al contrario di quello che abbiamo visto in N∗ , una funzione predecessore in A \ {min A}. 14. *DIMOSTRAZIONE DEL LEMMA DI ZORN 26 14. *Dimostrazione del Lemma di Zorn Per la dimostrazione del lemma di Zorn faremo uso di alcune proprietà elementari degli insiemi bene ordinati, ma non del teorema di Zermelo (che abbiamo mostrato usando il lemma di Zorn). Sia (A, ≤) un insieme induttivo. Mostreremo che esiste in A un elemento m massimale. Per ottenere la versione originale del lemma di Zorn che stabilisce, dato a ∈ A, l’esistenza di un elemento massimale m tale che a ≤ m, basterà applicare il risultato all’insieme A0 = {x ∈ A : a ≤ x} che è non vuoto, e induttivo se munito della relazione di ordine indotta da A. Per l’assioma di scelta, esiste una funzione f : P(A) \ {∅} → A tale che f (B) ∈ B per ogni B ⊆ A non vuoto. Indicheremo con a∗ il valore f (A). Data una tale funzione di scelta f , definiamo f -catena un sottoinsieme non vuoto C di A tale che: (a) C è bene ordinato (in particolare è una catena); (b) per ogni a ∈ C vale (14.1) a = f {x ∈ A : b < x per ogni b ∈ C, b < a} . Si noti che la (14.1) ha senso, perché l’insieme {x ∈ A : b < x per ogni b ∈ C, b < a} contiene almeno a. Si noti anche che l’insieme delle f -catene è non vuoto. Basta prendere C = {a∗ }: in questo caso l’insieme degli x ∈ A tali che b < x per ogni b ∈ C, b < a∗ , coincide con A. Per esprimere la condizione b ∈ C e b < a useremo nel seguito di questa dimostrazione la notazione suggestiva b ∈ C ∩ (−∞, a). Possiamo quindi riformulare la (14.1) come segue: per ogni a ∈ C, vale a = f (Ma ), dove Ma è l’insieme dei maggioranti stretti di C ∩ (−∞, a). Verifichiamo ora che: (14.2) date due f -catene C e C 0 , una è sempre un segmento iniziale dell’altra. Più precisamente, mostreremo che C e C 0 hanno lo stesso minimo e che C ⊆ C 0 o C 0 ⊆ C. Se c∗ = min C abbiamo infatti dalla (14.1) che c∗ = a∗ ; lo stesso ragionamento per C 0 mostra che a∗ deve anche essere il minimo di C 0 . Consideriamo ora la classe S dei segmenti non vuoti di C ∪ C 0 contenuti in C ∩ C 0 , vale a dire S ∈ S se e solo se S ⊆ C ∩ C 0 e vale l’implicazione (14.3) c ∈ C ∪ C 0 , x ∈ S, c < x =⇒ c ∈ S. Osserviamo che la classe S è non vuota, dato che {a∗ } ∈ S, e che l’unione di una famiglia qualsiasi di elementi di S appartiene a S. Grazie a questa stabilità di S, l’elemento massimo S∗ di S esiste. Mostreremo che S∗ = C o S∗ = C 0 , il che ci darà in particolare che C ⊆ C 0 o C 0 ⊆ C. A tal fine, supponiamo per assurdo che C \ S∗ e C 0 \ S∗ siano entrambi non vuoti e indichiamo con b e b0 i rispettivi elementi minimi (qui usiamo in maniera essenziale il fatto che le f -catene sono insiemi bene ordinati). Mostriamo che (14.4) C ∩ (−∞, b) = C 0 ∩ (−∞, b0 ) . Per simmetria, ci basta mostrare l’inclusione ⊆ nella (14.4). Se x ∈ C e x < b, allora per la minimalità di b deve essere x ∈ S∗ , quindi x ∈ C 0 . Se non fosse x < b0 avremmo o x = b0 , ma questo è escluso dal fatto che b0 ∈ / S∗ , o b0 < x. In quest’ultimo caso la proprietà di segmento (14.3) di S∗ 0 0 (con c = b ) darebbe b ∈ S∗ , che non può valere. Questo mostra la (14.4). Applicando la (14.1) all’elemento b della f -catena C e all’elemento b0 della f -catena C 0 , otteniamo b = f (L) e b0 = f (L), ove L è l’insieme dei maggioranti stretti dell’insieme nella (14.4). Ma allora b = b0 ∈ C ∩ C 0 . Potremmo allora estendere S∗ aggiungendo b; si noti che per minimalità di b in C \ S∗ e di b0 in C 0 \S∗ , l’insieme S∗ ∪{b} = S∗ ∪{b0 } resta ancora un segmento di C ∪C 0 , questo dà l’assurdo cercato e mostra che per ogni coppia di catene una delle due è sempre un segmento iniziale dell’altra. 15. ESERCIZI 27 Ora possiamo concludere la dimostrazione usando (14.2) delle f -catene. Usando questa proprietà, come abbiamo visto nella dimostrazione del teorema di Zermelo, otteniamo subito che l’unione di una famiglia qualsiasi di f -catene è una f -catena. Indichiamo allora con C∗ l’unione di tutte le f -catene, i.e. la f -catena massima. Per l’ipotesi di induttività di A, C∗ ha un maggiorante m. Se m non fosse massimale, esisterebbe n ∈ A con m < n, quindi l’insieme M dei maggioranti stretti di C∗ sarebbe non vuoto. Posto allora C = C∗ ∪ {f (M )} , dato che f (M ) è un maggiorante stretto di C∗ avremmo che C è ancora un insieme bene ordinato che contiene strettamente C∗ . L’assurdo deriverà allora dalla dimostrazione che C è una f -catena. Per verificarlo, notiamo che la (14.1) ovviamente vale se a ∈ C∗ , usando il fatto che C∗ è una f -catena e che C ∩ (−∞, a) = C∗ ∩ (−∞, a). Se invece a = f (M ) abbiamo che C ∩ (−∞, a) = C∗ e si usa proprio il fatto che M è l’insieme dei maggioranti stretti di C∗ . 15. Esercizi Esercizio 1.1. Si trovi una espressione proposizionale in termini di P, Q, R tale che risulti vera se e solo se esattamente due di esse sono vere. Esercizio 1.2. Siano A e B due sottoinsiemi di un insieme X. Si dica (e si dimostri la risposta) per quali sottoinsiemi Y ⊆ X valgono le seguenti relazioni • A ∪ Y = B, • A ∩ Y = B, • A4Y = B. Esercizio 1.3. Dati tre insiemi A, B e C, si provi che A × (B ∪ C) = (A × B) ∪ (A × C) , A × (B ∩ C) = (A × B) ∩ (A × C) . Esercizio 1.4. Siano A e B due insiemi non vuoti, si provi che se (A × B) ∪ (B × A) = C × C per un terzo insieme C, allora A = B = C. Esercizio 1.5. Dati quattro insiemi A, B, C e D, si determinino le relazioni tra le seguenti coppie di insiemi (A × C) ∪ (B × D) e (A ∪ B) × (C ∪ D) , (A × C) ∩ (B × D) e (A ∩ B) × (C ∩ D) . Esercizio 1.6. Siano A ⊆ X e B ⊆ Y , si provi che X × Y \ A × B = (Ac × Y ) ∪ (X × B c ) . 15. ESERCIZI 28 Esercizio 1.7. Si provi che per una famiglia di insiemi Ai per i ∈ {1, . . . , n}, si ha n [ Ai = A1 ∪ (A2 \ S1 ) ∪ · · · ∪ (An \ Sn−1 ) , i=1 Sk dove Sk = i=1 Ai e che tale unione è disgiunta. Vale la formula analoga ∞ [ Ai = A1 ∪ (A2 \ S1 ) ∪ · · · ∪ (An \ Sn−1 ) ∪ . . . i=1 (infinita) se la famiglia di insiemi Ai è numerabile (cioè i ∈ N)? Esercizio 1.8. Per una famiglia di insiemi Ai con i ∈ {1, . . . , n}, si determini se la seguente formula vale n n [ \ Ai = (A1 \ A2 ) ∪ (A2 \ A3 ) ∪ · · · ∪ (An \ A1 ) ∪ Ai . i=1 i=1 Esercizio 1.9. Data una successione di insiemi (An ) per n ∈ N, si definiscano il limsup ed il liminf della successione, rispettivamente, come segue ∞ [ ∞ \ lim An = An+k , lim An = n=1 k=1 ∞ \ ∞ [ An+k . n=1 k=1 Si provi che ∞ \ n=1 An ⊆ lim An ⊆ lim An ⊆ ∞ [ An . n=1 Esercizio 1.10. S Si provi che lim An sono tutti e soli gli elementi in ∞ n=1 An tali che appartengano ad un insieme infinito di insiemi An . S Si provi che lim An sono tutti e soli gli elementi in ∞ n=1 An tali che appartengano definitivamente agli insiemi An . Esercizio 1.11. Si provi che se tutti gli insiemi Ai sono sottoinsiemi di un insieme X, valgono le relazioni c lim Acn = lim An , c lim Acn = lim An . Esercizio 1.12. Date due successioni di insiemi (An ) e (Bn ), si stabiliscano le relazioni tra le seguenti coppie di insiemi lim An ∪ lim Bn e lim (An ∪ Bn ) , e lim (An ∩ Bn ) , lim An ∩ lim Bn lim An ∪ lim Bn e lim (An ∪ Bn ) , lim An ∩ lim Bn e lim (An ∩ Bn ) . 15. ESERCIZI 29 Esercizio 1.13. Si mostri che se A1 ⊆ A2 ⊆ . . . An ⊆ . . . allora lim An = lim An = ∪∞ n=1 An e se invece A1 ⊇ A2 ⊇ A . . . . An ⊇ . . . allora lim An = lim An = ∩∞ n=1 n Esercizio 1.14. Sia f : X → Y una funzione e siano A, B ⊆ X, si provino le seguenti relazioni, mostrando un esempio quando l’uguaglianza non vale e discutendo se vale assumendo che f sia iniettiva/surgettiva: f (A ∪ B) = f (A) ∪ f (B) , f (A ∩ B) ⊆ f (A) ∩ f (B) , f (A \ B) ⊇ f (A) \ f (B) , f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B) , f −1 (A ∩ B) = f −1 (A) ∩ f −1 (B) , f −1 (A \ B) = f −1 (A) \ f −1 (B) . Esercizio 1.15. Si discutano le relazioni del problema precedente in caso di unioni/intersezioni multiple e/o infinite di insiemi. Esercizio 1.16. Sia f : X → Y una funzione, si provi che f (A ∩ B) = f (A) ∩ f (B) oppure f (A \ B) = f (A) \ f (B) , per ogni coppia di insiemi A, B ⊆ X, se e solo se la funzione f è iniettiva. Esercizio 1.17. Sia f : X → Y una funzione e siano A ⊆ X e B ⊆ Y . Si provino le seguenti relazioni, mostrando con un esempio che l’uguaglianza non vale in generale: f −1 (f (A)) ⊇ A , f (f −1 (B)) ⊆ B . Si provi inoltre che l’uguaglianza vale nella prima relazione per ogni insieme A ⊆ X se e solo se la funzione f è iniettiva e che l’uguaglianza vale nella seconda relazione per ogni insieme B ⊆ X se e solo se la funzione f è surgettiva. Esercizio 1.18. Con le stesse notazioni del problema precedente si provi in generale che f −1 (f (f −1 (f (A)))) = f −1 (f (A)) , f (f −1 (f (f −1 (B)))) = f (f −1 (B)) . Esercizio 1.19. Considerate due funzioni g : X → Y e f : Y → Z, si risponda alle seguenti domande, motivando la risposta. • Se f e g sono iniettive, la funzione composta f ◦ g è iniettiva? Vale il viceversa? • Se f e g sono surgettive, la funzione composta f ◦ g è surgettiva? Vale il viceversa? • Se la funzione composta f ◦ g è iniettiva/surgettiva cosa si può dire sulle funzioni f e g? 15. ESERCIZI 30 • Se la funzione composta f ◦ g è iniettiva per ogni funzione g : X → Y iniettiva e X ha almeno due elementi, cosa si può dire sulla funzione f ? • Se la funzione composta f ◦ g è surgettiva per ogni funzione f : Y → Z surgettiva e Z ha almeno due elementi, cosa si può dire sulla funzione g? Esercizio 1.20. F Esiste una funzione f : R → R tale che f (f (x)) = −x? Per ogni funzione g : R → R esiste sempre una funzione f : R → R tale che f ◦ f = g? Esercizio 1.21. Dati due insiemi X e Y , si provi che esiste una funzione f : X → Y iniettiva (surgettiva) se e solo se esiste una funzione g : Y → X surgettiva (iniettiva). Esercizio 1.22. Si provi che per ogni funzione f : X → Y esiste un insieme Z e due funzioni g : X → Z e h : Z → Y tali che f = h ◦ g con g surgettiva e h iniettiva. È vero anche con g iniettiva e h surgettiva? Esercizio 1.23. Dato un sottoinsieme A ⊆ X, sia χA : X → {0, 1} la sua funzione caratteristica. Si provi che χA∩B = χA · χB , χA∪B = χA + χB − χA · χB . Esercizio 1.24. Si provi che l’Assioma di buona fondazione (Osservazione 1.9) implica la non esistenza di catene discendenti di appartenenza, i.e. una successione di insiemi (An ) tali che An+1 ∈ An per ogni n ∈ N. Esercizio 1.25. Si provino per induzione le seguenti formule: n sin (n + 1/2)x 1 X + cos kx = 2 2 sin(x/2) per n ≥ 1, x ∈ R e x 6= 2hπ per ogni h ∈ N , k=1 n Y k=1 cos x sin x = n k 2 sin 2xn 2 per n ≥ 1, x ∈ R e x 6= 2n hπ per ogni h ∈ N . Esercizio 1.26. Pk Siano x1 , x2 , . . . , xn e y1 , y2 , . . . , yn numeri reali, posto Vk = i=1 yi e V0 = 0 si dimostri per induzione la seguente formula di sommazione per parti di Abel, n X x i yi = i=m n−1 X (xi − xi+1 )Vi + xn Vn − xm Vm−1 i=m per ogni m ∈ {1, 2, . . . , n − 1}. Esercizio 1.27. Si dimostri che un insieme X è infinito se e solo se esiste un suo sottoinsieme proprio Y e una funzione iniettiva f : X → Y , oppure una funzione surgettiva g : Y → X. L’insieme X \ Y si può scegliere infinito? Esercizio 1.28. Si provi che 15. ESERCIZI 31 • l’unione di due insiemi numerabili è numerabile e cosı̀ ogni unione finita di insiemi numerabili, • il prodotto di due insiemi numerabili è numerabile e cosı̀ ogni prodotto finito di insiemi numerabili, • che ogni insieme infinito contiene un insieme numerabile. Esercizio 1.29. Si provi che se X è un insieme infinito allora la cardinalità di X ∪ N è uguale a quella di X. Si provi che se X è un insieme infinito di cardinalità maggiore di N allora la cardinalità di X \ Y , dove Y ⊆ X è numerabile, è uguale a quella di X. Esercizio 1.30. Si provi che un’unione numerabile di insiemi numerabili è numerabile e che l’insieme delle parti finite di un numerabile è numerabile. L’insieme delle parti numerabili di N è numerabile? Esercizio 1.31. F Si trovi un polinomio p(x, y) in due variabili a coefficienti interi tale che la funzione p : N∗ ×N∗ → N∗ sia iniettiva. Si trovi un polinomio q(x, y) in due variabili a coefficienti razionali tale che la funzione q : N∗ × N∗ → N∗ sia bigettiva.18 Esercizio 1.32. Si provi che la cardinalità di R (cardinalità del continuo c) è uguale a quella di 2N e delle successioni in N, cioè di NN . Esercizio 1.33. Si provi che • l’unione di due insiemi con cardinalità del continuo ha sempre cardinalità del continuo e cosı̀ ogni unione finita, • il prodotto di due insiemi con cardinalità del continuo ha sempre cardinalità del continuo e cosı̀ ogni prodotto prodotto finito. Esercizio 1.34. Si provi che se X è un insieme di cardinalità maggiore di c allora le cardinalità di X ∪ R e di X \ R sono uguali a quella di X. Esercizio 1.35. Si provi che un’unione numerabile di insiemi con cardinalità del continuo ha sempre cardinalità del continuo. Esercizio 1.36. F Si dimostri che l’insieme delle parti finite di un insieme con cardinalità del continuo ha sempre cardinalità del continuo. L’insieme delle parti numerabili di R ha la cardinalità del continuo? E la sua cardinalità è uguale a quella delle successioni in R, cioè di RN ? Esercizio 1.37. Si discutano le cardinalità dei seguenti insiemi: 18Lo stesso problema per p : Z × Z → Z o q : Q × Q → Q è aperto, per approfondire si vedano http://mathoverflow.net/q/21003 e http://mathoverflow.net/q/117390. 15. ESERCIZI 32 • • • • • • i numeri razionali e i numeri irrazionali, i numeri complessi, i polinomi a coefficienti interi o razionali, i numeri algebrici19 e i numeri trascendenti, le successioni a valori razionali/reali, le successioni a valori in Q convergenti ad un limite in Q e quelle a valori in Q convergenti ad un limite in R, • le successioni a valori in R convergenti ad un limite in Q e quelle a valori in R semplicemente convergenti, • le funzioni continue da R in R. Esercizio 1.38. Dati tre insiemi A, B e C si provino le seguenti formule, • card A × B = card B × A, • card (AB )C = card AB×C , • card AB × AC = card AB∪C , se B e C sono disgiunti. Esercizio 1.39. Sia X infinito e Y di cardinalità minore di X, si provi allora che le cardinalità di X ∪ Y e di X \ Y sono uguali alla cardinalità di X. Esercizio 1.40. F Si provi che se almeno uno dei due insiemi A e B è infinito, si ha card A ∪ B = max{card A, card B} e che di conseguenza card 2A = card nA = card A per ogni n ∈ N e A infinito. Esercizio 1.41. F Si provi che se X è infinito la cardinalità di X × N è uguale alla cardinalità di X. Esercizio 1.42. FF Si provi che se almeno uno dei due insiemi A e B è infinito, si ha card A × B = max{card A, card B} e che di conseguenza card A × A = card An = card A per ogni n ∈ N e A infinito. Esercizio 1.43. Sia X infinito, si provi che si può partizionare X in una famiglia di insiemi numerabili. Qual è la cardinalità di tale famiglia? Esercizio 1.44. Sia X infinito, si provi che si può partizionare X in una famiglia numerabile di insiemi di cardinalità uguale a quella di X. 19Un numero reale si dice algebrico se è la radice di un polinomio a coefficienti interi. 15. ESERCIZI 33 Esercizio 1.45. Sia X di cardinalità minore o uguale a Y . Si può partizionare Y in una famiglia di insiemi ognuno di cardinalità uguale a quella di X. Qual è la cardinalità di tale famiglia? Esercizio 1.46. Sia X di cardinalità minore o uguale a Y . Si provi che si può partizionare Y in una famiglia di insiemi di cardinalità uguale a quella di X e la cardinalità di tale famiglia può essere scelta tra tutte quelle minori o uguali a quella di Y . Esercizio 1.47. Dati due insiemi X e Y , si discutano le cardinalità degli insiemi delle funzioni f : X → Y iniettive, surgettive, bigettive, in relazione alla cardinalità dell’insieme Y X . Esercizio 1.48. F La cardinalità delle parti numerabili di Y è la stessa della cardinalità di Y N ? Sia X di cardinalità minore o uguale a Y , la cardinalità delle parti di cardinalità X di Y è la stessa della cardinalità di Y X ? Esercizio 1.49. Si provi che se Y è un insieme infinito e card X ≤ card Y si ha card X Y = card 2Y . Esercizio 1.50. Si provi che se card X = card 2Z per un qualche insieme Z infinito, allora card X Y = max{card X, card 2Y } , in particolare, card X N = card X.20 Esercizio 1.51. FF Si provi il seguente Teorema di König. Se card Xi < card Yi per ogni i ∈ I si ha [ Y card Xi < card Yi . i∈I i∈I Se ne deduca il fatto che card X < card 2X per ogni insieme infinito X. Esercizio 1.52. Date due relazioni R e S su di un insieme X, si definisca la relazione composta R ◦ S come segue: a(R ◦ S)b se e solo se esiste c ∈ X tale che aRc e cSb. • Si provi che la relazione R è simmetrica se e solo se R = R−1 . • Si provi che la relazione R è transitiva se e solo se lo è R−1 . • Si provi che se una relazione R è transitiva se e solo se R ◦ R ⊆ R e si dia un esempio in cui tale inclusione è stretta. Se la relazione R è anche riflessiva vale l’uguaglianza? • Si provi che una relazione R è di equivalenza se e solo se è riflessiva, R = R−1 e R◦R ⊆ R. Esercizio 1.53. Si provi che se una relazione R è riflessiva e transitiva allora la relazione R ∩ R−1 è di equivalenza. Esercizio 1.54. Si mostri che, se vale l’assioma di buona fondazione, anche {a, {a, b}} soddisfa l’assioma della coppia, i.e. {a, {a, b}} = {a0 , {a0 , b0 }} implica a = a0 e b = b0 . 20 Nel caso in cui l’insieme X non soddisfi card X = card 2Z per un qualche insieme infinito Z, determinare la cardinalità di X Y quando card Y < card X può essere difficile (è legata al concetto di cofinalità di un numero cardinale) e dipendere dall’assunzione o meno dell’ipotesi del continuo (generalizzata). Esistono comunque insiemi infiniti X tali che card X N > card X (esempio complicato). 15. ESERCIZI 34 Esercizio 1.55. Si dicano quali sono le proprietà soddisfatte dalle seguenti relazioni: • R su R data da xRy se e solo se x − y ∈ Q, • R0 su R data da xR0 y se e solo se x − y ∈ R \ Q, • S su R \ {0} data da xSy se e solo se x/y ∈ Q. • S 0 su R \ {0} data da xS 0 y se e solo se x/y ∈ R \ Q. Esercizio 1.56. L’intersezione e l’unione di due o più relazioni di equivalenza sono ancora relazioni di equivalenza? L’intersezione e l’unione di due o più relazioni d’ordine sono ancora relazioni d’ordine? Esercizio 1.57. Date due relazioni R su X e S su Y , si definisca una relazione R × S su X × Y come segue: (x1 , y1 )(R × S)(x2 , y2 ) se e solo se x1 Rx2 e y1 Sy2 . Si dica se valgono: • R e S relazioni d’equivalenza allora R × S è una relazione d’equivalenza, • R e S relazioni d’ordine allora R × S è una relazione d’ordine. Si dica se le due affermazioni sopra valgono se la relazione R × S su X × Y è invece definita come segue: (x1 , y1 )(R × S)(x2 , y2 ) se e solo se vale almeno una delle due condizioni x1 Rx2 e y1 Sy2 . Esercizio 1.58. Sia R una relazione su X, si provi che R ∪ R−1 è la più piccola relazione simmetrica che contiene R e che R ∩ R−1 è la più grande relazione simmetrica contenuta in R. Esercizio 1.59. Sia f : X → Y una funzione e definiamo la relazione aRb se f (a) = f (b). Si mostri che R è una relazione d’equivalenza e che la mappa fe : X/R → Y è ben definita da fe([a]) = f (a) per ogni a ∈ X, è iniettiva e soddisfa fe ◦ π = f , dove π : A → X/R è la mappa di proiezione nel quoziente. Esercizio 1.60. Sia f : X → Y una funzione e siano R su X e S su Y due relazioni d’equivalenza, inoltre si assuma che per ogni coppia a, b in X con aRb si abbia f (a)Sf (b). Si provi che allora è ben definita e unica una mappa fe : X/R → Y /S tale che fe ◦ πR = πS ◦ f , dove πR : X → X/R e πS : Y → Y /S sono le rispettive mappe di proiezione sul quoziente delle due relazioni R e S. Esercizio 1.61. Siano R e S rispettivamente una relazione di equivalenza e di ordine sull’insieme X, sia π : X → X/R la mappa proiezione che manda ogni elemento x ∈ X nella sua classe di equivalenza [x] ∈ X/R. Se si ha che per ogni coppia (x, y) e (z, w) con xRy e zRw, la relazione x ≤ z implica y ≤ w allora si provi che Se = π e(S) è una relazione d’ordine su X/R, dove la mappa π e : X × X → X/R × X/R è data da (x, z) 7→ ([x], [z]). Si noti inoltre che la mappa π e manda la relazione d’equivalenza R in una relazione d’equivalenza e=π R e(R) su X/R consistente nella sola diagonale di X/R × X/R. Esercizio 1.62. F Sia V uno spazio vettoriale su un campo K. Diciamo che X ⊆ V è libero se ogni suo sottoinsieme finito è linearmente indipendente. Diciamo che X è un sistema di generatori se per ogni v ∈ V 15. ESERCIZI 35 esistono x1 , x2 , . . . , xn ∈ X e λ1 , λ2 , . . . , λn ∈ K tali che v = λ1 x1 + λ2 x2 + · · · + λn xn . Una base di Hamel B di V è un sistema libero di generatori. • Si provi che B è una base di Hamel se e solo se è un sottoinsieme libero massimale. • Si dimostri, usando il lemma di Zorn, che ogni spazio vettoriale ammette una base di Hamel. • Si dimostri che, dato X sottoinsieme libero di V , esiste una base di Hamel di V contenente X. • Si dimostri che, dato X sottoinsieme libero di V e una base di Hamel B di V , esiste un sottoinsieme B 0 di B tale che X ∪ B 0 è una base di Hamel di V . • Si dimostri che due basi di Hamel B1 e B2 di uno spazio vettoriale V hanno la stessa cardinalità. Esercizio 1.63. Si provi che un insieme A è finito se e solo se ogni ordinamento totale su A è un buon ordinamento. Esercizio 1.64. Si provi che un insieme A è finito se e solo se possiede un buon ordinamento ≤ tale che la relazione d’ordine inversa sia ancora un buon ordinamento. Esercizio 1.65. Si discuta la struttura di un insieme totalmente ordinato (A, ≤) in cui per ogni elemento esista sia il suo successore che il suo predecessore. Il predecessore di un elemento a ∈ A si definisce come il massimo degli elementi b < a e il suo successore come il minimo degli elementi c > a. Esercizio 1.66. Sia (A, ≤) un insieme totalmente ordinato, si provi che se ogni sottoinsieme numerabile di A è bene ordinato, allora A è bene ordinato. CAPITOLO 2 INSIEMI NUMERICI E OPERAZIONI In questo capitolo costruiremo, a partire dai numeri naturali, gli insiemi Z, Q e R. Con le costruzioni qui date sono rispettate le regole generali dell’aritmetica e dell’algebra. Daremo poi una caratterizzazione assiomatica di R, quindi indipendente dalla particolare costruzione che qui viene adottata, basata sulla struttura di campo, di insieme ordinato e sulla proprietà di completezza. 1. Operazioni su N Definiamo l’operazione di somma: + : N × N −→ N , tra numeri naturali definendo ricorsivamente, per m ∈ N fissato, l’applicazione Σm : N → N (somma per m): ( Σm (0) = m , (1.1) Σm (S(n)) = S(Σm (n)) . L’applicazione +(m, n) risulta quindi definita da Σm (n). Rimane tuttavia inteso che useremo da ora in poi la notazione classica m + n, abituale per le operazioni, in luogo di quella che sarebbe formalmente più appropriata. Si noti una facile induzione su n mostra che Σ0 = ιN e che, posto 1 = S(0), si ha S(n) = Σ1 (n) = 1 + n ∀n ∈ N . Più in generale, usando ripetutamente il principio di induzione si possono derivare le proprietà fondamentali della somma. Proposizione 2.1 (Proprietà della somma). La somma gode della proprietà commutativa (i.e. n + m = m + n) e associativa (i.e. (m + n) + k = m + (n + k)). Inoltre Σm è bigettiva e strettamente crescente tra N e {n ∈ N : m ≤ n}. Dimostrazione. Per dimostrare la commutatività, dimostriamo preliminarmente che vale l’identità (1.2) S(m + n) = S(m) + n , ∀ m, n ∈ N , applicando il principio di induzione alla proprietà P (n) : “S(m + n) = S(m) + n per ogni m ∈ N” . P (0) è ovvia. Supponendo vera P (n), dimostriamo P S(n) , ossia che S m+S(n) = S(m)+S(n). Applicando prima la definizione di Σm , poi l’ipotesi induttiva e infine la definizione di ΣS(m) otteniamo S m + S(n) = S ◦ S(m + n) = S S(m) + n = S(m) + S(n) , per ogni m ∈ N. 36 1. OPERAZIONI SU N 37 Possiamo ora dimostrare per induzione su n che Q(n) : “m + n = n + m per ogni m ∈ N” è vera per ogni n. Per n = 0, dobbiamo dimostrare che 0 + m = m + 0 per ogni m ∈ N, i.e. Σ0 (m) = Σm (0) per ogni m ∈ N. Ma abbiamo già osservato che, per induzione, vale Σ0 (m) = m, quindi l’identità da mostrare si riduce alla prima delle (1.1). Abbiamo dunque verificato che Q(0) è vera. Supponiamo ora vera Q(n). Allora usando prima la definizione di Σm , poi l’ipotesi induttiva e infine la (1.2) otteniamo m + S(n) = S(m + n) = S(n + m) = S(n) + m , ∀m ∈ N . Quindi Q S(n) è vera. La dimostrazione della proprietà associativa è simile. Sempre per induzione su n0 si mostra che m + n < m + n0 se n < n0 , quindi Σm è iniettiva, e sempre per induzione su n si mostra che Σm ha valori nell’insieme {n ∈ N : m ≤ n}. Se l’insieme n ∈ N : m ≤ n \ Σm (N) fosse non vuoto, prendendone il minimo n0 (che, si noti, non può essere uguale a m) e considerando il suo predecessore m0 ≥ m, si otterrebbe facilmente una contraddizione dal fatto che, scrivendo m0 = Σm (k) per un certo k ∈ N (per minimalità di m0 ), si otterrebbe n0 = S(m0 ) = Σm (S(k)) ∈ Σm (N). Si noti che iniettività di Σk e commutatività danno anche m+k =n+k =⇒ m = n. Abbiamo già osservato che la somma per m è compatibile con la struttura d’ordine. Analizziamo più a fondo la compatibilità delle due strutture. Proposizione 2.2 (Compatibilità di somma e ordinamento). (i) Siano m, n ∈ N. Allora m ≤ n se e solo se esiste k ∈ N tale che n = m + k. (ii) Siano m, n, k ∈ N. Allora m ≤ n se e solo se m + k ≤ n + k. Dimostrazione. (i) Per provare una delle due implicazioni, dimostriamo per induzione su n ≥ m che esiste k ∈ N tale che n = m + k. Se n = m l’implicazione è vera con k = 0. Supponiamo che l’implicazione valga per n. Allora S(n) = S(m + k) = m + S(k) . Per l’implicazione inversa, basta dimostrare per induzione su k ∈ N che m ≤ m + k. La verifica è semplice e viene lasciata per esercizio. La dimostrazione di (ii), per induzione su k, è lasciata per esercizio. Attraverso un procedimento analogo possiamo definire il prodotto · : N × N −→ N , come segue. Fissato m ∈ N, definiamo ricorsivamente la “moltiplicazione per m” come segue: ( m·0=0 , m · (n + 1) = m · n + m . Si verifica facilmente che m · 1 = m per ogni m ∈ N e che 0 · n = 0 per ogni n ∈ N. Vale inoltre la legge di annullamento del prodotto: m · n = 0 se e solo se m = 0 o n = 0. 2. DAI NATURALI AGLI INTERI 38 È possibile verificare per induzione che anche il prodotto soddisfa le proprietà associativa e commutativa. Vale anche la proprietà distributiva della somma rispetto al prodotto1 (m + n) · p = m · p + n · p . Infine, abbiamo anche qui relazioni di compatibilità con la struttura d’ordine: Proposizione 2.3 (Compatibilità di prodotto e ordinamento). Siano m, n ∈ N, k ∈ N∗ . Allora m ≤ n se e solo se k · m ≤ k · n. 2. Dai naturali agli interi Su N2 introduciamo la relazione di equivalenza2 (m, n) ∼ (m0 , n0 ) ⇐⇒ m + n0 = n + m0 . Indichiamo con (m, n) la classe di equivalenza dell’elemento (m, n) e indichiamo l’insieme quoziente N2 /∼ con il simbolo Z. (2.1) Lemma 2.4 (Ordinamento di Z). La relazione ≤Z (m, n) ≤Z (p, q) ⇐⇒ m + q ≤ n + p è ben definita su Z ed è un ordinamento totale. Dimostrazione. Per poter dire che ≤Z è ben definita su Z, bisogna dimostrare che se (m, n) ∼ (m0 , n0 ), (p, q) ∼ (p0 , q 0 ) e m + q ≤ n + p, allora m0 + q 0 ≤ n0 + p0 . Usando ripetutamente la Proposizione 2.2(ii) e la (2.1) si ottiene che m + n0 + q ≤ n + n0 + p, da cui m0 + n + q ≤ n + n0 + p, e quindi m0 + q ≤ n0 + p. Aggiungendo p0 ad ambo i membri e procedendo allo stesso modo, si conclude che m0 + q 0 ≤ n0 + p0 . A questo punto, è molto semplice verificare che si tratti di un ordinamento totale. Segue pure dalla Proposizione 2.2(i) che ogni classe di equivalenza [(a, b)] contiene un unico elemento della forma (n, 0), oppure della forma (0, n) con n ≥ 1 (basta distinguere i casi a ≤ b e b ≤ a). Si ha allora Z = (0, n) : n ∈ N∗ ∪ (n, 0) : n ∈ N . Inoltre, se 0 < m < n, (0, n) <Z (0, m) <Z (0, 0) <Z (m, 0) <Z (n, 0) . Le operazioni di somma e prodotto su Z si definiscono come segue: (m, n) + (p, q) = (m + p, n + q) , (m, n) · (p, q) = (mp + nq, np + mq) . Una serie di semplici verifiche mostra che sono ben definite (i.e. indipendenti dalla scelta dei rappresentanti nella classe di equivalenza) e che valgono le seguenti proprietà: (1) le proprietà associativa e commutativa sia per la somma che per il prodotto; (2) la proprietà distributiva della somma rispetto al prodotto; (3) (0, 0) è l’elemento neutro per la somma, cioè (m, n) + (0, 0) = (m, n) per ogni (m, n) ∈ Z; 1Useremo da ora in poi la convenzione standard relativa alla priorità tra somme e prodotti; senza di questa, la formula sotto andrebbe scritta: (m · p) + (n · p). 2Si verifichi che lo è effettivamente. 3. DAGLI INTERI AI RAZIONALI 39 (4) (1, 0) è l’elemento neutro per il prodotto, cioè (m, n) · (1, 0) = (m, n) per ogni (m, n) ∈ Z; (5) ogni elemento (m, n) ha un opposto (l’elemento (n, m) ), indicato con −[(m, n)], tale cioè che la somma dei due sia (0, 0) ; (6) se il prodotto di due elementi di Z è nullo, cioè uguale a (0, 0) , allora almeno uno dei due è nullo; (7) (n, m) ≤Z (n0 , m0 ) se e solo se esiste (p, q) tale che (n, m) + (p, q) ≤Z (n0 , m0 ) + (p, q) ; (8) se (m, n) ≥Z (0, 0) e (p, q) ≥Z (0, 0) , anche (m, n) · (p, q) ≥Z (0, 0) . Le proprietà (1)–(8) forniscono le abituali regole dell’aritmetica. Le proprietà (1)–(5) si riassumono dicendo che Z è un anello commutativo. Includendo anche la (6), che segue facilmente dalla legge di annullamento del prodotto in N, Z si dice, più precisamente, che Z è un dominio di integrità. Un esempio classico, derivato da questo, di anello commutativo è costituito dall’insieme dei polinomi a coefficienti interi: A = a0 + a1 x + · · · + an xn : n ∈ N∗ , a0 , . . . , an ∈ Z , con le usuali regole algebriche di somma coefficiente per coefficiente e prodotto. Infine, (7) e (8) esprimono le usuali relazioni di compatibilità tra ordine e somma, ordine e prodotto. Osservazione 2.5 (N come sottoinsieme di Z). Alla luce di questi fatti, possiamo a tutti gli effetti considerare N come un sottoinsieme di Z, identificando n ∈ N con la classe di equivalenza [(n, 0)]. Questa identificazione rispetta le operazioni aritmetiche (e anche, come abbiamo notato, l’ordinamento), vale a dire [(n, 0)] + [(m, 0)] = [(n + m, 0)] , [(n, 0)] · [(m, 0)] = [(nm, 0)] ∀n, m ∈ N . Sulla base dell’osservazione precedente, d’ora in poi adottiamo la abituale notazione semplificata con n anche per gli elementi di Z, usando ≤ per l’ordinamento in Z. Useremo anche la classica notazione n − m per n + (−m). 3. Dagli interi ai razionali Con un procedimento non molto diverso, si arriva a costruire il campo Q dei numeri razionali a partire da Z. Sul prodotto cartesiano Z×N∗ consideriamo la relazione di equivalenza delle “frazioni equivalenti” (m, n) ≈ (m0 , n0 ) ⇐⇒ mn0 = nm0 , 3 e indichiamo con m n la classe di equivalenza di (m, n). Con questa convenzione, si verifica facilmente che è ben definita la relazione d’ordine m m0 ≤ 0 ⇐⇒ mn0 ≤ nm0 , n n (i.e. indipendente dalla scelta dei rappresentanti) e che sono ben definite le abituali operazioni di somma e prodotto, con le regole abituali del calcolo con le frazioni: m m0 mn0 + m0 n m m0 mm0 + 0 = , · = . n n nn0 n n0 nn0 3Si noti che la nozione di frazione irriducibile corrisponde alla scelta di un rappresentante nella classe di equivalenza su descritta. 4. CAMPI 40 In aggiunta alle proprietà (1)–(8) presentate per Z, valgono su Q le seguenti altre proprietà: p mp (9) ogni elemento m n 6= 0 ha un inverso, ossia un elemento q tale che n q = 1 (si prende −n se m > 0, pq = −m altrimenti); p 4 (10) vale la proprietà archimedea: dati m n , q > 0, esiste k ∈ N tale che k· p q = n m p m > . n q L’insieme delle proprietà (1)–(10) conferisce a Q la struttura di campo totalmente ordinato archimedeo. Si noti che la validità della (6) su Q segue direttamente dalla (9). Seguendo l’uso comune, ometteremo sovente il simbolo di prodotto, i.e. scrivendo qr per q · r. È importante osservare una forte differenza tra gli ordinamenti su Z e su Q. Mentre in Z ogni elemento n ha un “immediato predecessore”, n − 1, e un “immediato successore”, n + 1, Q è denso p p m0 m m0 in sé: dati comunque due elementi m n < n0 , esiste un terzo elemento q tale che n < q < n0 (basta prendere la media aritmetica dei due). Osservazione 2.6 (Z come sottoinsieme di Q). Anche in questo caso, possiamo a tutti gli effetti considerare Z come un sottoinsieme di Q, identificando n ∈ Z con n1 . Questa identificazione rispetta le operazioni aritmetiche (e anche l’ordinamento), vale a dire n+m n m n·m n m + = , · = ∀n, m ∈ Z . 1 1 1 1 1 1 4. Campi Alcune delle proprietà aritmetiche appena viste su Q possono essere assiomatizzate, dando luogo alla nozione di campo. Definizione 2.7. Si chiama campo un insieme F dotato di due operazioni, indicate con “+” e “·” e dette rispettivamente somma e prodotto, che soddisfino le seguenti proprietà: (a) proprietà commutativa di entrambe: ∀ x, y ∈ F , x+y =y+x , x·y =y·x ; (b) proprietà associativa di entrambe: ∀ x, y, z ∈ F , (x + y) + z = x + (y + z) , (x · y) · z = x · (y · z) ; (c) proprietà distributiva della somma rispetto al prodotto: ∀ x, y, z ∈ F , (x + y) · z = x · z + y · z ; (d) le due operazioni ammettono elementi neutri distinti (abitualmente indicati con 0 e 1 rispettivamente) cioè tali che 0 6= 1 e ∀x ∈ F , x+0=x , x·1=x ; (e) esistenza dell’opposto: ∀ x ∈ F , ∃ x0 ∈ F : x + x0 = 0 ; 4Prendendo k = np + 1, vale k · (m · q) ≥ k · 1 = k > np, da cui segue la disuguaglianza tra le frazioni. 5. COSTRUZIONE DEL CAMPO R DEI NUMERI REALI 41 (f) esistenza dell’inverso per elementi diversi da 0: ∀ x ∈ F \ {0} , ∃ x00 ∈ F : x · x00 = 1 . Esempi. • Q e, come vedremo, il campo R dei numeri reali. Un altro esempio importante è il campo C dei che non sarà trattato in questi appunti. √ numeri complessi, √ • Q[ 2] = {p + q 2 : p, q ∈ Q} con le operazioni indotte da R. • se p è unnumero primo, Zp = {0, 1, . . . , p − 1} con le operazioni intese modulo p. • F (x) = pq , dove p e q sono polinomi a coefficienti in un campo F e q non è il polinomio nullo, con le normali operazioni algebriche tra polinomi e frazioni, detto campo delle funzioni razionali a coefficienti in F . Dagli assiomi (a)–(f) che definiscono i campi, seguono numerose proprietà generali, di cui elenchiamo le principali: • dato x0 ∈ F , se esiste y tale che x0 + y = y, allora x0 = 0; in particolare F ammette un unico elemento neutro per la somma; • dato x0 ∈ F , se esiste y 6= 0 tale che x0 · y = y, allora x0 = 1; in particolare F ammette un unico elemento neutro per il prodotto; • l’opposto di un elemento di F e l’inverso di un elemento non nullo di F sono unici; essi vengono indicati rispettivamente con −x e x−1 (o anche con 1/x); • −(x + y) = −x + (−y), (xy)−1 = x−1 · y −1 ; • −(−x) = x, (x−1 )−1 = x; • per ogni x, x · 0 = 0 e x · (−1) = −x; • x · y = 0 ⇐⇒ x = 0 o y = 0. Definizione 2.8 (Omomorfismo di campi). Siano F e F 0 due campi. Si chiama omomorfismo di F in F 0 un’applicazione ϕ : F −→ F 0 non identicamente nulla e tale che (4.1) ∀ x, y ∈ F , ϕ(x + y) = ϕ(x) + ϕ(y) , ϕ(x · y) = ϕ(x) · ϕ(y) . F0 Un omomorfismo ϕ di F in si dice un isomorfismo se è bigettivo. In tal caso anche ϕ−1 è un isomorfismo ed F e F 0 si dicono isomorfi. Si dimostra facilmente che un omomorfismo soddisfa le condizioni ϕ(0F ) = 0F 0 , ϕ(1F ) = 1F 0 , ϕ(−x) = −ϕ(x) , ϕ(x−1 ) = ϕ(x)−1 ; e che la relazione di isomorfismo tra campi è una “relazione di equivalenza nell’insieme dei campi”. Si noti che le relazioni ϕ(0F ) = 0F 0 e ϕ(1F ) = 1F 0 seguono dal fatto che ϕ(0F ) e ϕ(1F ) fungono rispettivamente da elemento neutro per la somma e il prodotto per F 0 . 5. Costruzione del campo R dei numeri reali Ci sono diversi modi di costruire il campo reale R, una volta analizzata la struttura di Q. Presentiamo il procedimento più elementare (ne vedremo altri, che usano concetti meno elementari ma sono anche molto meno macchinosi), che usa la relazione di ordine su Q, dovuto a R. Dedekind. Ricordiamo la nozione di segmento di un insieme ordinato (A, ≤), già usata nella dimostrazione del teorema di Zermelo e del lemma di Zorn: B ⊆ A è un segmento se b ∈ B e a ≤ b implica a ∈ B. Definizione 2.9. Si chiama sezione (di Dedekind) di Q un sottoinsieme S di Q che soddisfi le seguenti tre proprietà: 6. OPERAZIONI SU R 42 (i) S è un segmento non vuoto; (ii) S è superiormente limitato; (iii) S non ha massimo. Indichiamo con R l’insieme delle sezioni di Q. Esempi. I seguenti esempi illustrano che vi sono due tipi di sezioni, intuitivamente quelle che individuano un razionale e quelle che individuano un irrazionale. (1) Sia p ∈ Q. Allora Sp = {q ∈ Q : q < p} è una sezione. Più in generale, se S è una sezione che ha un estremo superiore (in Q, si intende), allora usando il fatto che S non ha massimo si mostra facilmente che S = Ssup S . (2) L’insieme S = {q ∈ Q : q < 0 ∨ q 2 < 2} è una sezione e non è del tipo descritto in precedenza, a causa del fatto che non esistono razionali q tali che q 2 = 2. Proposizione 2.10 (Proprietà delle sezioni). (a) (b) (c) (d) La relazione di inclusione ⊆ tra sezioni di Q definisce un ordinamento totale su R. Ogni E ⊆ R superiormente limitato ammette estremo superiore (proprietà di completezza). L’applicazione ϕ : Q −→ R data da ϕ(p) = Sp è strettamente crescente, dunque iniettiva. Date S, S 0 ∈ R con S ⊂ S 0 , esiste r ∈ Q tale che S ⊂ Sr ⊂ S 0 (densità di Q in R). Dimostrazione. (a) Ovviamente si tratta di un ordinamento. Per verificare che esso è totale, si usa ripetutamente la proprietà di segmento delle sezioni. Siano S, S 0 sezioni e supponiamo che S 0 6⊆ S. Preso p ∈ S 0 \ S, per la proprietà di segmento di S si ha necessariamente q < p per ogni q ∈ S, cioè S ⊆ Sp . Ma essendo p ∈ S 0 , la proprietà di segmento di S 0 dà Sp ⊆ S 0 . Quindi S ⊆ S 0 . (b) Sia E ⊂ R superiormente limitato. Esiste quindi una sezione S ∗ di Q tale che S ⊆ S ∗ per ogni S ∈ E. L’unione [ S0 = S, S∈E è pure una sezione. Infatti è non vuota ed è superiormente limitata perché contenuta in S ∗ . Se S 0 avesse massimo, questo apparterrebbe a una sezione S ∈ E che dunque avrebbe un massimo, il che è assurdo. Infine, dato q ∈ S 0 , esiste S ∈ E tale che q ∈ S. Se q 0 < q, allora q 0 ∈ S, e dunque q 0 ∈ S 0 , quindi S 0 è un segmento. Chiaramente S 0 è un maggiorante di E, perché S ⊆ S 0 per ogni S ∈ E. D’altra parte, ogni maggiorante Se di E contiene ogni S ∈ E, e dunque contiene S 0 . Quindi S 0 è il minimo maggiorante di E. La (c) è una conseguenza evidente della densità in sé di Q. Per dimostrare la (d) è sufficiente migliorare il ragionamento fatto nella dimostrazione del punto (a). Questo dimostra che, nelle presenti ipotesi, esiste p ∈ S 0 tale che S ⊆ Sp . Siccome S 0 non ha massimo, esiste un elemento p0 ∈ S 0 con p0 > p. Allora S ⊂ Sr ⊂ S 0 con r = (p + p0 )/2. 6. Operazioni su R Siano S, S 0 sezioni di Q. Definiamo S + S 0 = q + q0 : q ∈ S , q0 ∈ S 0 . Lemma 2.11. S + S 0 è una sezione di Q. Inoltre, per ogni p, p0 ∈ Q vale Sp + Sp0 = Sp+p0 . 6. OPERAZIONI SU R 43 Dimostrazione. Chiaramente, S +S 0 è non vuoto. Se m, m0 sono maggioranti rispettivamente di S, S 0 in Q, allora m + m0 è un maggiorante di S + S 0 . Quindi S + S 0 è superiormente limitato. Supponiamo per assurdo che S + S 0 abbia massimo m. Allora m = q + q 0 per qualche q ∈ S e q 0 ∈ S 0 . Siccome q non è massimo di S, esiste r ∈ S con r > q. Ma allora r + q 0 ∈ S + S 0 e r + q 0 > m, da cui l’assurdo. Per dimostrare che S + S 0 soddisfa la condizione di segmento, si prendano q ∈ S, q 0 ∈ S 0 e r ∈ Q con r < q + q 0 . Allora r − q < q 0 , e dunque r − q ∈ S 0 . Quindi r ∈ S + S 0 . Passando alla seconda parte dell’enunciato, l’inclusione Sp + Sp0 ⊆ Sp+p0 è ovvia. Per ottenere l’inclusione opposta, si prenda r ∈ Sp+p0 . Allora r = p + (r − p) e r − p ∈ Sp0 . Dato che Sp0 non ha massimo, per > 0 abbastanza piccolo ho ancora r − p0 + ∈ Sp0 e concludo che r ∈ Sp + Sp0 osservando che p − ∈ Sp . Definiamo ora (6.1) ( S−p − S := Q \ {−q : q ∈ S} se S = Sp per qualche p ∈ Q ; altrimenti . La complessità della definizione (6.1) è dovuta al fatto che Q \ {−q : q ∈ Sp } non è una sezione (perché?). Passiamo ora al prodotto, la cui definizione è altrettanto macchinosa, a causa della regola dei segni. Definizione 2.12 (Prodotto di sezioni). • per S, S 0 ⊇ S0 , si pone SS 0 = {qq 0 : q, q 0 ≥ 0 , q ∈ S , q 0 ∈ S 0 } ∪ {q ∈ Q : q < 0}; • per tutti gli altri casi, il prodotto si definisce in modo che siano soddisfatte le identità (−S)S 0 = S(−S 0 ) = −(SS 0 ). Anche in questo caso si verifica che il prodotto di sezioni è una sezione, inoltre (6.2) Sp Sp0 = Spp0 per ogni p, p0 ∈ Q . Esempio. Se S = {q ∈ Q : q < 0 ∨ q 2 < 2}, allora S 2 = S2 . Se S 6= S0 poniamo anche, distinguendo i due tipi di sezioni, (Sp )−1 = Sp−1 (6.3) se S = Sp per qualche p ∈ Q \ {0}, ( Q \ {q −1 : q ∈ S, q > 0} −1 (6.4) S := {q −1 : q ∈ / S, q < 0} se S0 ⊂ S ; se S ⊂ S0 altrimenti (si noti che, anche in questo caso, l’espressione in (6.4), se applicata alle sezioni Sp non dà luogo a una sezione). Teorema 2.13 (R è un campo). L’insieme R delle sezioni di Q, munito della somma e del prodotto su definiti, è un campo il cui elemento neutro per la somma è S0 e quello neutro per il prodotto è S1 . L’opposto e l’inverso sono definiti rispettivamente da (6.1) e (6.3)-(6.4). Infine valgono le proprietà (6.5) (6.6) S ≤ S0 =⇒ S + S 00 ≤ S 0 + S 00 ∀S 00 ∈ R ; S, S 0 ≥ 0 =⇒ SS 0 ≥ 0 . 7. CAMPI ORDINATI 44 La dimostrazione non è difficile, ma consiste in una lunga (e noiosa) serie di verifiche. Nel seguito useremo le notazioni abituali per i numeri reali, facendo riferimento esplicito alle sezioni di Dedekind solo quando sarà conveniente. Attraverso l’identificazione p ←→ Sp tra numeri razionali e corrispondenti sezioni di Dedekind, consideriamo Q come un sottoinsieme (proprio, come abbiamo visto) di R, grazie al fatto che il Lemma 2.11 e la formula (6.2) mostrano che p 7→ Sp è un omomorfismo di campi (i.e. le operazioni algebriche sui numeri razionali coincidono con quelle sulle corrispondenti sezioni). Inoltre indicheremo con l’abituale simbolo ≤ la relazione d’ordine su R. L’enunciato che segue generalizza l’esempio presentato sopra. Proposizione 2.14. Dato un numero reale x > 0 e un intero n ≥ 2 esiste uno e un solo numero reale positivo y, detto radice n-sima di x, tale che y n = x. Dimostrazione. L’unicità di y segue dal fatto che, se 0 < a < b, allora 0 < an < bn , e quindi due numeri positivi diversi non possono avere la stessa potenza n–esima. Per dimostrare l’esistenza di y, sia S la sezione di Q corrispondente a x. Essendo S0 ⊂ S, S contiene numeri razionali positivi. Poniamo y uguale al numero corrispondente alla sezione (si verifichi che lo è) S 0 = q ∈ Q : qn ∈ S ∨ q < 0 . Per verificare che S 0 ⊃ S0 (cioè y > 0), prendiamo p ∈ S con 0 < p ≤ 1. Allora pn ≤ p è pure in S, dunque p ∈ S 0 . Si vede facilmente che (S 0 )n = S: infatti se qi ∈ S 0 , 1 ≤ i ≤ n, allora n q1 · q2 · · · qn−1 · qn ≤ max qi ∈ S , 1≤i≤n quindi (S 0 )n ⊆ S. Viceversa, se q ∈ S è positivo, per mostrare che q ∈ (S 0 )n ci basta mostrare l’esistenza (visto che (S 0 )n ha la proprietà di segmento) di r ∈ S 0 tale che q < rn . Scelto q 0 ∈ S tale che q 0 > q, ci basta allora trovare r ∈ Q tale che q < rn < q 0 . Scegliamo prima δ > 0 sufficientemente piccolo in modo che (1 + δ)n < q 0 /q. Poniamo ora r = (1 + δ)k dove k ∈ Z è il massimo intero tale che (1 + δ)kn < q 0 .5 Allora la massimalità di k dà rn (1 + δ)n = (1 + δ)(k+1)n ≥ q 0 > (1 + δ)n q , da cui segue che q < rn . 7. Campi ordinati Accanto alla struttura di campo, abbiamo visto che R ha anche una struttura di ordine. La compatibilità tra queste due strutture espressa dalle formule (6.5) e (6.6) viene formalizzata in astratto con questa definizione. Definizione 2.15 (Campo ordinato). Un campo ordinato è un campo F dotato di un ordinamento totale ≤ tale che (a) per ogni x, y, z ∈ F , x ≤ y =⇒ x + z ≤ y + z; (b) x, y ≥ 0F =⇒ x · y ≥ 0F . 5La disuguaglianza di Bernoulli (Esercizio 2.10) (1 + δ)kn ≥ 1 + knδ per k ≥ 0 mostra che un tale massimo esiste. 7. CAMPI ORDINATI 45 Abbiamo visto che sia R che Q sono campi ordinati, anche se non per tutti i campi esiste una relazione di ordine compatibile con la somma e il prodotto (l’esempio più famoso è il campo C dei numeri complessi6). Dagli assiomi di campo ordinato possono essere dedotte numerose proprietà generali, tra cui (come sempre usiamo a > b e a ≥ b come sinonimi di b < a e b ≤ a rispettivamente): • per ogni x ∈ F , x2 ≥ 0F , in particolare 1F = (1F )2 > 0F ; • x ≤ y , a ≥ 0 =⇒ a · x ≤ a · y ; • x > 0F =⇒ −x < 0F e x−1 > 0F ; • x · y ≥ 0F se e solo se x e y sono concordi. Abbiamo anche visto che p 7→ Sp è un omomorfismo da Q in R; più in generale, vale il seguente risultato che mostra come, a meno di isomorfismi, Q sia il più piccolo campo ordinato. Lemma 2.16. Dato un campo ordinato F , esiste un unico omomorfismo ϕ : Q −→ F . Tale omomorfismo è strettamente crescente, quindi iniettivo, e stabilisce un isomorfismo tra Q e un sottocampo QF di F . Dimostrazione. Per ogni omomorfismo ϕ : Q −→ F deve essere necessariamente ϕ(0) = 0F e ϕ(1) = 1F , quindi iniziamo col definire ϕ in questo modo. Induttivamente, si deve anche avere, per ogni n ∈ N n volte }| { def z ϕ(n) = 1F + · · · + 1F = nF . Essendo (n + 1)F = nF + 1F > nF , ϕ è univocamente determinata e strettamente crescente su N. Inoltre ogni omomorfismo ϕ deve soddisfare ϕ(−n) = −ϕ(n) = −nF , quindi adottando questa come definizione si vede che ϕ si prolunga in modo univoco a una funzione strettamente crescente su Z. Si verifica facilmente che le proprietà (4.1) sono soddisfatte per x, y ∈ Z. Preso ora p = m/n ∈ Q, per poter soddisfare alla condizione ϕ(m) = ϕ(m/n) · ϕ(n), deve necessariamente essere m −1 = ϕ(m) · ϕ(n) = mF · (nF )−1 . ϕ n Questa è una buona definizione, perché sostituendo (mk)/(nk) al posto di m/n si ottiene lo stesso risultato, quindi la adottiamo per estendere ϕ a Q. Inoltre, prendiamo m/n < m0 /n0 in Q, supponendo n, n0 > 0. Allora ϕ(n), ϕ(n0 ) > 0F , e dunque mn0 < m0 n =⇒ ϕ(m)ϕ(n0 ) < ϕ(m0 )ϕ(n) =⇒ ϕ(m) · ϕ(n)−1 < ϕ(m0 ) · ϕ(n0 )−1 . Quindi ϕ è strettamente crescente. Abbiamo visto nel corso della dimostrazione precedente che possiamo individuare dentro un campo F una copia isomorfa dei numeri naturali NF = ϕ(N), i cui elementi continueremo a indicare per semplicità con n (facciamo eccezione solo per 0F e 1F ). Possiamo usarla per dare la definizione di campo archimedeo. Definizione 2.17 (Campo archimedeo). Un campo ordinato F si dice archimedeo se, dati x, y > 0, esiste n ∈ NF tale che n · x > y. Abbiamo visto che Q è un campo archimedeo. 6Qualunque assegnazione del segno dell’unità immaginaria i implica i2 = −1 > 0 , in contrasto con il fatto che C C 1F > 0F in tutti i campi ordinati F . 8. CAMPI ORDINATI COMPLETI 46 Proposizione 2.18. Sia F un campo ordinato. Le seguenti proprietà sono equivalenti: (i) F è archimedeo; (ii) NF non è superiormente limitato; (iii) inf{n−1 : n ∈ N∗F } = 0F ; (iv) dati x, y ∈ F con x < y, esiste q ∈ QF tale che x < q < y. La condizione (iv) si esprime dicendo che QF è denso in F . Dimostrazione. (i)⇒(ii). Basta prendere, dato un ipotetico maggiorante y, x = 1F . (ii)⇔(iii). La (iii) vuol dire che ∀ x > 0F ∃ n ∈ N∗F : n−1 < x . Sostituendo y = x−1 , questa condizione equivale a dire che per ogni y > 0F esiste n ∈ N+ F tale che y < n, e questa è la (ii). (iii)⇒(iv). Il caso in cui x < 0F < y è ovvio. Possiamo dunque supporre che x e y siano concordi. Passando eventualmente agli opposti, ci riconduciamo al caso 0F < x < y. Sia δ = y − x > 0F . Per la (iii), esiste allora k ∈ N∗F tale che k −1 < δ. Consideriamo l’insieme {n · k −1 : n ∈ NF }. Per ipotesi, esso contiene elementi maggiori di x. Sia m ∈ N∗F il minimo intero tale che m · k −1 > x. Allora (m − 1) · k −1 ≤ x e quindi m · k −1 = (m − 1) · k −1 + k −1 < x + δ = y . Dunque x < m · k −1 < y. (iv)⇒(i). Siano u, v > 0F . Applicando (iv) con x = 0F e y = u/v, esistono m, n ∈ N∗F tali che 0F < m/n < u/v. In particolare nu > mv ≥ v. Esempio. Su R(x), il campo delle funzioni razionali a coefficienti reali, consideriamo il seguente ordinamento: p/q ≤ r/s se esiste a ∈ R tale che p(x)/q(x) ≤ r(x)/s(x) per ogni x > a tale che q(x) e s(x) non si annullano. Si dimostri per esercizio che: (a) R(x) è un campo ordinato; (b) R(x) non è archimedeo. Si verifichi con opportuni controesempi che per R(x) non vale nessuna delle proprietà (ii), (iii), (iv) della Proposizione 2.18. 8. Campi ordinati completi Definizione 2.19 (Campo ordinato completo). Un campo ordinato si dice completo se ogni suo sottoinsieme non vuoto e superiormente limitato ha estremo superiore. Abbiamo già visto che R è un campo completo (Proposizione 2.10(b)). Il campo R è anche archimedeo: questa proprietà può essere dedotta da una delle formulazioni equivalenti della proprietà archimedea date nella Proposizione 2.18 (la (iv)), tenendo conto del fatto che abbiamo già mostrato la densità di Q in R (Proposizione 2.10(d)). Tuttavia si può anche dedurre questa proprietà dal seguente lemma, che ci tornerà utile nella caratterizzazione assiomatica di R. Lemma 2.20 (Completo implica archimedeo). Ogni campo ordinato e completo è archimedeo. Dimostrazione. Sia F ordinato e completo, e supponiamo per assurdo che non sia archimedeo. Allora NF sarebbe superiormente limitato, e dunque ammetterebbe estremo superiore s ∈ F . Dalla condizione s ≥ n per ogni n ∈ NF segue che anche s − 1F ≥ n per ogni n ∈ NF . Ma allora s − 1F sarebbe un maggiorante di NF strettamente minore di s, da cui l’assurdo. 8. CAMPI ORDINATI COMPLETI 47 Abbiamo visto che R è un campo ordinato completo. Il seguente risultato mostra che questa proprietà identifica R univocamente, a meno di isomorfismi (a posteriori, possiamo quindi dire che il lemma precedente vale perchè R è archimedeo). Teorema 2.21 (Caratterizzazione di R a meno di isomorfismi). Sia F un campo ordinato completo. L’omomorfismo canonico ϕ : Q → F si estende, in modo unico, a un isomorfismo strettamente crescente di R su F . Quindi ogni campo ordinato completo è isomorfo a R. Dimostrazione. Ricordiamo che, grazie al lemma precedente, F è archimedeo. Per t ∈ R, poniamo ϕ(t) e = sup ϕ(q) : q ∈ Q , q < t . Tale elemento ϕ(t) e è certamente definito, perché F è completo e l’insieme è maggiorato da un qualunque elemento ϕ(r) con r ∈ Q, r > t. Inoltre ϕ e è non decrescente, perché l’insieme del quale di calcola l’estremo superiore cresce al crescere di t. Dimostriamo una per una le proprietà che ci fanno concludere che ϕ e è un omomorfismo strettamente crescente che estende ϕ. Per ogni t ∈ Q, ϕ(t) e = ϕ(t): la disuguaglianza ϕ(t) e ≤ ϕ(t) è ovvia, perché ϕ(t) è un maggiorante. Se fosse ϕ(t) e < ϕ(t), per la Proposizione 2.18(iv) esisterebbe f = ϕ(q) ∈ QF tale che ϕ(t) e < ϕ(q) < ϕ(t). Ma allora dovrebbe essere q < t, contro il fatto che ϕ(t) e maggiora tutti gli elementi ϕ(r) per r < t. La mappa ϕ e è strettamente crescente, dunque iniettiva: se t < t0 sono reali, esistono q1 , q2 ∈ Q tali che t < q1 < q2 < t0 . Quindi ϕ(t) e ≤ ϕ(q1 ) < ϕ(q2 ) ≤ ϕ(t e 0 ). La mappa ϕ e è surgettiva: dato f ∈ F , poniamo α = {q ∈ Q : ϕ(q) < f } e notiamo che α è superiormente limitata perché F è archimedeo, sia quindi t = sup α ∈ R (α è proprio la sezione di Q che definisce il numero reale t, ma questo non ci servirà nel seguito) e mostriamo che ϕ(t) e = f. 0 Per definizione di ϕ, e si ha ϕ(t) e = sup{ϕ(q) : q < t}. Dato che per ogni q < t esiste q > q con q 0 ∈ α, i.e. ϕ(q 0 ) < f , deduciamo che ϕ(q) < f e quindi che ϕ(t) e ≤ f . Se valesse la disuguaglianza stretta, grazie alla Proposizione 2.18(iv) potremmo trovare q 0 < q 00 razionali tali che ϕ(t) e < ϕ(q 0 ) < ϕ(q 00 ) < f . Ma allora avremmo q 0 < q 00 e q 00 ∈ α, quindi q 0 < t. La disuguaglianza ϕ(t) e < ϕ(q 0 ) contraddirebbe allora la definizione di ϕ(t). e Per ogni t, u ∈ R, ϕ(t+u) e = ϕ(t)+ e ϕ(u): e sia q ∈ Q, q < t+u. Scegliendo q1 ∈ Q con q −u < q1 < t, si ottiene una scomposizione di q, q = q1 + q2 , con q1 < t, q2 = q − q1 < u e q2 ∈ Q. Allora ϕ(q) = ϕ(q1 ) + ϕ(q2 ) < ϕ(t) e + ϕ(u) e . Passando quindi all’estremo superiore rispetto ai q < t + u, si ottiene che ϕ(t e + u) ≤ ϕ(t) e + ϕ(u). e D’altra parte, dati q1 < t, q2 < u, con q1 , q2 ∈ Q, si ha ϕ(q1 ) + ϕ(q2 ) = ϕ(q1 + q2 ) < ϕ(t e + u) . Passando all’estremo superiore rispetto a q1 < t, si ottiene che ϕ(t) e + ϕ(q2 ) ≤ ϕ(t e + u). In modo analogo, passando all’estremo superiore rispetto a q2 < u, si ottiene la disuguaglianza ϕ(t)+ e ϕ(u) e ≤ ϕ(t e + u). Per ogni t, u ∈ R, ϕ(tu) e = ϕ(t) e ϕ(u): e per quanto visto prima, ϕ(0) e = 0 e ϕ(−t) e = −ϕ(t). e Quindi basta considerare il caso t, u > 0. Si procede in modo analogo a quanto visto per l’additività. 9. ESERCIZI 48 9. Esercizi Esercizio 2.1. Siano A e B due sottoinsiemi di R, si definiscano −A = {−x : x ∈ A} , A + B = {x + y : x ∈ A e y ∈ B} , A − B = {x − y : x ∈ A e y ∈ B} , A · B = {x, y : x ∈ A e y ∈ B} . Si determinino (quando è possibile o sotto delle ipotesi) sup(−A), inf(−A), sup(A + B), inf(A + B), sup(A − B), inf(A − B), sup(A · B), inf(A · B), sup(A ∪ B), inf(A ∪ B), sup(A ∩ B), inf(A ∩ B), sup(A \ B), inf(A \ B), in termini di sup A, inf A, sup B e inf B. Esercizio 2.2. √ Si provi che Q, R \ Q, Q[ 2], i numeri algebrici e i numeri trascendenti sono tutti sottoinsiemi densi di R. Esercizio 2.3. √ √ √ √ √ √ I seguenti numeri sono razionali o irrazionali? 2, p con p primo, n + m e n − m con √ almeno uno di n, m ∈ N non quadrato perfetto, k n con k, n ∈ N ed n non k–potenza perfetta di un naturale. Esercizio 2.4. Si trovino sup e inf dei seguenti insiemi n nm n2 + m 2 n nm o : n, m ∈ N, n, m ∈ N∗ , o : n, m ∈ N, n, m ∈ N∗ , n+m nm − 2 o : n, m ∈ N, n > 0 , 3n n xy o : x, y ∈ (0, 1) , x2 + y 2 o n nλ + m1/λ : n, m ∈ N∗ , n+m in quest’ultimo caso al variare di λ ∈ R∗ . Esercizio 2.5. F Sia a ∈ R e n ∈ N, si provi che almeno un elemento dell’insieme {a, 2a, . . . (n − 1)a} dista al massimo 1/n da un intero. Esercizio 2.6. Si trovino sup e inf degli insiemi {sin n : n ∈ N} e {sin nx : n ∈ N} al variare di x ∈ R . Esercizio 2.7. F Dati due numeri reali α e β, si trovino le condizioni su di essi tali che l’insieme {αm+βn : n, m ∈ Z} sia denso in R. Lo stesso per l’insieme {αm + βn : n, m ∈ N}. 9. ESERCIZI 49 Esercizio 2.8. F Dato un numero irrazionale x si dimostri che esistono infiniti razionali m/n tali che m 1 x − < 2 . n n Esercizio 2.9. F √ Si trovino sup e inf dell’insieme n n : n ∈ N . Esercizio 2.10. Si provino le seguenti disuguaglianze di tipo Bernoulli e si discutano gli eventuali casi di uguaglianza: (1 + x)n ≥ 1 + nx per x > −1 e n ∈ N, (1 − x)n ≥ 1 − nx 1 (1 + x)n ≤ 1 − nx 1 (1 − x)n ≤ 1 + nx x m x n 1+ 1− ≤1 m n per x < 1 e n ∈ N, per −1 < x < 1/n e n ∈ N, per −1/n < x < 1 e n ∈ N, per 1 < x < n e n, m ∈ N∗ . Esercizio 2.11. F Usando i risultati del problema precedente, si provino le seguenti disuguaglianze (analoghe con esponente razionale) e si discutano gli eventuali casi di uguaglianza: (1 + x)q ≥ 1 + qx per x > −1 e q ≥ 1, q ∈ Q, q per x > −1 e q ∈ Q ∩ (0, 1], q per x < 1 e q ≥ 1, q ∈ Q, q per x < 1 e q ∈ Q ∩ (0, 1], (1 + x) ≤ 1 + qx (1 − x) ≥ 1 − qx (1 − x) ≤ 1 − qx 1 (1 + x)q ≤ 1 − qx 1 (1 − x)q ≤ 1 + qx x p x q 1+ 1− ≤1 p q per −1 < x < 1/q e q ≥ 1, q ∈ Q, per −1/q < x < 1 e q ≥ 1, q ∈ Q, per 1 < x < q e p, q ≥ 1, p, q ∈ Q. Si discuta poi il passaggio agli esponenti reali. Esercizio 2.12. F n Si provi che la successione 1 + n1 è monotona crescente e limitata dall’alto da 3. n+1 Si provi che per ogni x ∈ R la successione 1 + n1 è monotona decrescente e limitata dal basso da 2. Esercizio 2.13. F Si provi la disuguaglianza aritmetico–geometrica, cioè, dati a1 , a2 , . . . , an numeri reali positivi si ha √ n a1 a2 . . . an ≤ a1 + a2 + · · · + an , n 9. ESERCIZI 50 e se ne deduca la disuguaglianza tra la media armonica e geometrica 1/a + 1/a + · · · + 1/a −1 √ 1 2 n ≤ n a1 a2 . . . an n e la disuguaglianza tra la media quadratica e aritmetica degli stessi numeri r a1 + a2 + · · · + an a21 + a22 + · · · + a2n ≤ . n n Esercizio 2.14. Si provi la seguente disuguaglianza di tipo Young, prima con α e β naturali e poi razionali positivi, con x, y > 0: 1 αx + βy xα y β α+β ≤ α+β e si veda che è equivalente a xp y q + xy ≤ p q con p, q ∈ Q, p, q > 1 tali che 1/p + 1/q = 1. Si discuta poi il passaggio agli esponenti reali. Esercizio 2.15. Si provi che per ogni x > 1 e n ∈ N si ha 0< √ n x−1≤ x−1 . n Esercizio 2.16. Si dimostri che per ogni α ≥ 0 e n ≥ 1 si ha n1+α (n + 1)1+α ≤ 1 + 2 α + · · · + nα ≤ . 1+α 1+α Esercizio 2.17. Si provi la seguente disuguaglianza prima con α naturale e poi razionale maggiore o uguale a uno e 0 < y ≤ x: αy α−1 (x − y) ≤ xα − y α ≤ αxα−1 (x − y) . Si discuta poi il passaggio agli esponenti reali. Esercizio 2.18. Si provi che per p ≥ q reali positivi e x ≥ 1 si ha xq − 1 xp − 1 ≥ . p q Esercizio 2.19. Si provi che per q reale maggiore o uguale a uno, x > 0 e h > −1 valgono le disuguaglianze q(x − 1)xq−1 ≥ xq − 1 ≥ q(x − 1) , 1 + qh(1 + h)q−1 ≥ (1 + h)q ≥ 1 + qh . Esercizio 2.20. Si determinino i numeri n ∈ N tali che 22n (2n)! ≤ ≤ 22n . 2n (n!)2 9. ESERCIZI 51 Esercizio 2.21. Si provi la disuguaglianza di Cauchy–Schwarz (o di prodotto scalare): dati a1 , a2 , . . . , an e b1 , b2 , . . . , bn numeri reali, si ha n n n X 1/2 X 1/2 X ai bi ≤ a2i b2i . i=1 i=1 i=1 Quando vale l’uguaglianza? Verificare inoltre la seguente identità di Lagrange, ! n ! !2 n n X X X X a2i b2i − ai bi = (ai bj − aj bi )2 . i=1 i=1 i=1 i<j Esercizio 2.22. Si provi che se a1 , . . . , an sono positivi si ha a1 + a2 + · · · + an ≤ √ n a21 + a22 + · · · + a2n 1 2 . Esercizio 2.23. F Si provi la disuguaglianza di Hölder: dati a1 , a2 , . . . , an e b1 , b2 , . . . , bn numeri reali e due esponenti p, q > 1 con 1/p + 1/q = 1, si ha n X ai bi ≤ n X i=1 |ai | p n 1/p X i=1 |bi |q 1/q . i=1 Si discutano poi i casi di uguaglianza. Cosa succede se si permette a p, q di essere minori o uguali a 1? Esercizio 2.24. Si provi che dati a1 , a2 , . . . , an numeri reali positivi e p ≥ 1 vale n n X p X p−1 ai ≤ n api . i=1 i=1 Quando vale l’uguaglianza? Esercizio 2.25. F Si provi la disuguaglianza di Minkowski: dati a1 , a2 , . . . , an e b1 , b2 , . . . , bn numeri reali e p ≥ 1 , si ha n n n X 1/p X 1/p X 1/p p p |ai + bi | ≤ |ai | + |bi |p . i=1 i=1 i=1 Si discutano poi i casi di uguaglianza. Cosa succede se si permette a p di essere minore di 1? Esercizio 2.26. Si provi la disuguaglianza di riarrangiamento: dati a1 ≤ a2 ≤ · · · ≤ an e b1 ≤ b2 ≤ · · · ≤ bn numeri reali, allora si ha n n n X X X ai bn+1−i ≤ ai bσ(i) ≤ ai bi , i=1 i=1 per ogni permutazione σ : {1, 2, . . . , n} → {1, 2, . . . , n}. i=1 9. ESERCIZI 52 Esercizio 2.27. Si provi la disuguaglianza di Chebyshev: dati a1 ≤ a2 ≤ · · · ≤ an e b1 ≤ b2 ≤ · · · ≤ bn numeri reali, allora si ha n n n 1 X 1 X 1X ai bi ≥ ai bi . n n n i=1 i=1 i=1 Si provi che se invece a1 ≤ a2 ≤ · · · ≤ an e b1 ≥ b2 ≥ · · · ≥ bn la disuguaglianza vale nel verso opposto. Esercizio 2.28. F Si provi la disuguaglianza generale delle medie: definita la media p–esima, con p ∈ R∗ , di n numeri reali positivi a1 , a2 , . . . , an come Pn ap 1/p i=1 i Mp = n e posto M0 uguale alla media geometrica, si ha min{ai } ≤ Mp1 ≤ Mp2 ≤ M0 ≤ Mq1 ≤ Mq2 ≤ max{ai } per ogni insieme di reali p1 ≤ p2 < 0 < q1 ≤ q2 . Esercizio 2.29. F Si dimostrino le seguenti disuguaglianze con a, b, c, d ≥ 0 √ √ √ √ √ √ √ √ √ √ 3 √ abc + 3 abd + 3 acd + 3 bcd ab + bc + cd + da + ac + bd a+b+c+d 4 abcd ≤ ≤ ≤ . 4 6 4 Esercizio 2.30. Sia P un punto interno ad un triangolo ABC, si cerchi il minimo della somma dei quadrati delle distanze di P dai tre lati, al variare di P . CAPITOLO 3 COMPLEMENTI SULLE SUCCESSIONI DI NUMERI REALI Indicheremo nel seguito con (xn ) una successione di numeri reali, i.e. una mappa x : N → R il cui valore in n ∈ N viene indicato con xn (si noti la distinzione tra la notazione usata per la successione e quella usata per il suo valore n–simo). Useremo anche la notazione (xn )n∈N quando vogliamo dare maggiore evidenza all’insieme degli indici. Una sottosuccessione (detta anche successione estratta) (xn(k) ) è una successione che si ottiene mediante la composizione x◦n, ove n : N → N è strettamente crescente (intuitivamente, la funzione n corrisponde alla scelta di un sottoinsieme di indici e n(k) è il (k + 1)–mo indice scelto, da qui l’aggettivo “estratta”). In questo capitolo diamo per noti nozioni e teoremi principali relativi alle successioni di numeri reali, e in particolare: • definizione di limite reale per una successione (xn ) ⊆ R (chiameremo tali successioni convergenti) lim xn = ` n→∞ ⇐⇒ ∀ > 0 ∃m ∈ N∀n ∈ N (n ≥ m ⇒ |xn − `| < ) e analoghe definizioni per i casi ` = ±∞ (chiameremo queste ultime divergenti a ±∞); • teorema di unicità del limite, finito o infinito; • permanenza del segno (se xn ≥ 0 frequentemente1, allora ` ≥ 0, se ` > 0 allora xn > 0 definitivamente2); • criterio del confronto (se limn an = a, limn bn = b, allora an ≤ bn frequentemente, implica a ≤ b, mentre a > b implica, per ogni δ ∈ R tale che a > b + δ, che an > bn + δ vale definitivamente); • criterio “dei due carabinieri” per l’esistenza del limite, finito o infinito (se limn an = ` = limn cn e an ≤ bn ≤ cn definitivamente allora limn bn = `); • esistenza del limite, finito o infinito, per successioni monotone (in questo enunciato, per il caso delle successioni monotone limitate, è cruciale la completezza di R); • limitatezza di una successione convergente; • permanenza del limite per sottosuccessioni di successioni convergenti o divergenti a ±∞; • somme e prodotti di successioni convergenti; • criterio di convergenza di Cauchy (se (xn ) soddisfa la proprietà che per ogni > 0 esiste n0 ∈ N tale che |xn − xm | < per ogni n, m ≥ n0 , allora (xn ) è convergente). Anche in questo enunciato è cruciale la completezza di R. 1Abbreviazione che useremo d’ora in poi per: “per infiniti indici n ∈ N”. 2Abbreviazione che useremo d’ora in poi per: “esiste n ∈ N tale che vale per ogni n ≥ n ”. 0 0 Si noti che “definitivamente” implica “frequentemente” e che ¬ “P (n) vale definitivamente” equivale a “¬P (n) vale frequentemente”. 53 1. MASSIMO E MINIMO LIMITE 54 1. Massimo e minimo limite In questa sezione introdurremo le nozioni di massimo e minimo limite, sovente utili per snellire alcune dimostrazioni nelle quali l’esistenza del limite non è nota a priori. Definizione 3.1 (Massimo e minimo limite). Sia (xn ) ⊆ R una successione. Il massimo e minimo limite di (xn ) sono definiti rispettivamente da: 3 lim sup xn = lim sup xn , lim inf xn = lim inf xn . n→∞ k→∞ n≥k n→∞ k→∞ n≥k La definizione è ben posta, nel senso che il massimo e minimo limite esistono sempre, finiti o infiniti. Infatti le successioni k 7→ sup xn e k 7→ inf xn sono monotone; inoltre il criterio di confronto tra n≥k n≥k successioni dà lim inf xn ≤ lim sup xn . n→∞ n→∞ È inoltre facile verificare che vale la proprietà lim sup xn = − lim inf −xn , n→∞ n→∞ e, con la convenzione (+∞) + (−∞) = +∞ per la subadditività del lim sup e (+∞) + (−∞) = −∞ per la superadditività del lim inf, lim sup (xn + yn ) ≤ lim sup xn + lim sup yn , n→∞ n→∞ n→∞ lim inf (xn + yn ) ≥ lim inf xn + lim inf yn . n→∞ n→∞ n→∞ Alcuni dei fatti elencati nella sezione precedente possono essere migliorati o riformulati usando i massimi e minimi limiti, vediamo come: • (criterio di convergenza) (xn ) ha limite, finito o infinito, se e solo se lim supn xn ≤ lim inf n xn , e in tal caso il valore comune del massimo e minimo limite è il valore del limite; • (permanenza del segno) se xn ≥ 0 frequentemente allora lim supn xn ≥ 0, se xn ≥ 0 definitivamente allora lim inf n xn ≥ 0;4 • (criterio “dei due carabinieri”) an ≤ bn ≤ cn definitivamente e lim supn cn ≤ lim inf n an implica che le tre successioni hanno limite, finito o infinito, e che i tre limiti coincidono. Con riferimento all’ultimo criterio, nelle ipotesi enunciate sulle tre successioni vale infatti lim sup cn ≤ lim inf an ≤ lim inf cn , n→∞ n→∞ n→∞ lim sup an ≤ lim sup cn ≤ lim inf an , n→∞ n→∞ n→∞ dalle quali deduciamo che (cn ) e (an ) convergono, e che i limiti sono gli stessi. A titolo di esempio, vediamo anche come si dimostra con il massimo e il minimo limite la convergenza delle successioni di Cauchy. Teorema 3.2. Ogni successione (xn ) ⊆ R di Cauchy è convergente. 3Usiamo la notazione (più intuitiva) corrente in lingua inglese, lim sup e lim inf al posto rispettivamente di maxlim e minlim. 4Le contronominali sono rispettivamente: se lim sup x < 0 allora x < 0 definitivamente, se lim inf x < 0 n n n n n allora xn < 0 frequentemente. 1. MASSIMO E MINIMO LIMITE 55 Dimostrazione. Scegliendo = 1 e M = max{|x0 |, |x1 |, . . . , |xn0 | + 1} si vede facilmente che |xn | ≤ M per ogni n ∈ N, quindi (xn ) è limitata. Per > 0 arbitrario, esiste n ∈ N tale che xn ≤ + xm ∀n, m ≥ n . Passando al limite superiore in n otteniamo lim supn xn ≤ + xm per ogni m ≥ n . Possiamo allora passare al limite inferiore in m, ottenendo lim sup xn ≤ + lim inf xm . m→∞ n→∞ Dato che è arbitrario, è soddisfatto il criterio di convergenza lim sup ≤ lim inf. La seguente proposizione chiarisce l’origine dei termini “massimo e minimo limite”. Osserviamo preliminarmente che lim sup xn(k) ≤ lim sup xn , (1.1) k→∞ lim inf xn(k) ≥ lim inf xn k→∞ n→∞ n→∞ per ogni successione estratta (xn(k) ) (la semplice verifica è lasciata per esercizio, si veda anche la (1.2)). Proposizione 3.3 (Caratterizzazione del massimo e minimo limite). Per ogni successione (xn ) ⊆ R vale lim sup xn = max lim xn(k) : (xn(k) ) successione estratta, avente limite, di (xn ) , n→∞ k→∞ lim inf xn = min lim xn(k) : (xn(k) ) successione estratta, avente limite, di (xn ) . n→∞ k→∞ Dimostrazione. Sostituendo eventualmente (xn ) con (−xn ), possiamo limitarci a considerare la prima formula. Per ogni successione estratta (xn(k) ) vale xn(k) ≤ sup xi (1.2) ∀k ∈ N . i≥n(k) Dato che la successione a destra è estratta di una successione il cui limite è lim supn xn , se anche la successione a sinistra ha limite si ottiene limk xn(k) ≤ lim supn xn . Viceversa, dobbiamo ora costruire una successione estratta (xn(k) ) il cui limite è proprio lim supn xn , che indicheremo con `. Supponiamo che −∞ < ` < +∞ e per ogni k ≥ 1 determiniamo (grazie alla definizione di limite, con = 1/k) un intero n(k) tale che xn(k) > ` − 1 ∀k ≥ 1 k e n(k) > n(k − 1) ∀k ≥ 2 . Si noti che questo è possibile, in quanto a k fissato la disuguaglianza xn > ` − 1/k vale per infiniti indici n, grazie alla convergenza di supn≥m xn a ` per m → ∞. Abbiamo allora per costruzione (e per la proprietà archimedea) lim inf xn(k) ≥ ` , k→∞ mentre la (1.1) dà lim supk xn(k) ≤ `. Concludiamo quindi che (xn(k) ) ha limite e che il limite vale `. Se ` = −∞ la tesi è banale, se ` = +∞ si ripete la dimostrazione precedente sostituendo ` − 1/k con k. 2. TEOREMI DI CESARO 56 Come conseguenza della caratterizzazione variazionale del massimo e minimo limite otteniamo il teorema di Bolzano–Weierstrass sulla retta reale. Un’altra classica dimostrazione del teorema passa attraverso il metodo di bisezione.5 Teorema 3.4 (Bolzano–Weierstrass). Ogni successione (xn ) ha una sottosuccessione avente limite. In particolare ogni successione limitata ha una sottosuccessione convergente. 2. Teoremi di Cesaro La media di Cesaro n–esima σn , n ≥ 1, di una successione (an ) di numeri reali è la media aritmetica σn dei primi n termini a0 , . . . , an−1 : n−1 (2.1) σn = a0 + a1 + · · · + an−1 1X = ak . n n k=0 Teorema 3.5 (Primo teorema di Cesaro). Se la successione (an ) tende al limite ` (finito o infinito), anche la successione (σn ) tende a `. Dimostrazione. Consideriamo per primo il caso in cui ` = +∞. Dato un numero M > 0, esiste un intero n0 tale che, per ogni n ≥ n0 , an > M . Se n ≥ n0 si ha dunque a0 + · · · + an0 −1 n − n0 σn > +M . n n Prendendo il limite inferiore in n e usando la superadditività del lim inf otteniamo lim inf σn ≥ M . n→∞ Dato che M è arbitrario, lim inf n σn = +∞ quindi limn σn = +∞. Per il caso ` = −∞ basta sostituire alla successione degli an la successione dei −an . Supponiamo ora che ` sia finito. Sostituendo alla successione degli an la successione dei bn = an − `, e osservando che le medie di Cesaro τn dei bn sono τn = σn − `, possiamo ridurci al caso ` = 0. Dato ε > 0, esiste un intero n0 tale che, per ogni ≥ n0 , |bn | < ε. Allora, per n ≥ n0 , n − n0 |b0 | + · · · + |bn0 −1 | +ε . n n Prendendo il limite superiore in n e usando la subadditività del lim sup otteniamo lim supn |τn | ≤ ε, quindi l’arbitrarietà di ε dà che limn |τn | = lim supn |τn | = 0. |τn | ≤ L’implicazione inversa a quella dimostrata nel teorema, limn σn = ` ⇒ limn an = ` non è vera. È possibile infatti che le medie σn abbiano limite e che gli an non lo abbiano. Per esempio, si prenda an = (−1)n , le cui medie di Cesaro, uguali a ( 0 se n è pari σn = 1 se n è dispari , n tendono a 0. 5Supponendo ad esempio la successione (x ) contenuta in [0, L], si divide l’intervallo [0, L] in due intervalli n chiusi di lunghezza L/2, scegliendone uno nel quale la successione cade infinite volte; iterando questo procedimento, abbiamo intervalli Ik ⊆ [0, L] di lunghezza L/2k nei quali la successione cade infinite volte. Basta allora scegliere ricorsivamente n(k) in modo che n(k + 1) > n(k) e xn(k+1) ∈ Ik+1 per avere una successione (xn(k) ) di Cauchy, quindi convergente. Si noti che, scegliendo tutte le volte che è possibile l’intervallo di destra (sinistra) si seleziona proprio una successione convergente al lim sup (lim inf). 2. TEOREMI DI CESARO 57 Corollario 3.6. Sia (an ) una successione di numeri reali, e si supponga che limn (an+1 − an ) = ` (finito o infinito). Allora limn an /n = `. Dimostrazione. Si consideri la successione (bn ), dove b0 = a0 e, per n ≥ 1, bn = an+1 − an . Le medie di Cesaro dei bn sono b0 + · · · + bn−1 an = . n n Quindi limn an /n = limn σn = `, per il Teorema 3.5. σn = Si noti che in realtà il Corollario 3.6 è equivalente al primo teorema di Cesaro. Basta osservare che la (2.1) è equivalente all’identità an−1 = nσn − (n − 1)σn−1 . Quindi, applicando il Corollario 3.6 alla successione (nσn ), si ottiene il Teorema 3.5. Teorema 3.7 (Secondo teorema di Cesaro). Sia (an ) una successione di numeri reali strettamente positivi. Se limn an = ` (finito o infinito), anche la successione delle medie geometriche √ γn = n a0 a1 · · · an−1 tende a `. Dimostrazione. Osserviamo che, essendo an > 0 per ogni n, si ha necessariamente ` ≥ 0. Supponiamo ` = +∞. Dato un numero M > 0, esiste un intero n0 tale che, per ogni n ≥ n0 , an > 2M . Se n ≥ n0 si ha dunque p n−n0 1 γn > (a0 a1 · · · an0 −1 ) n (2M ) n = 2M n a0 a1 · · · an0 −1 (2M )−n0 . √ Poiché limn→∞ n b = 1 per ogni b > 0, esiste n1 ≥ n0 tale che γn > M per ogni n ≥ n1 . Per il caso ` = 0, basta sostituire agli an i loro reciproci 1/an . Consideriamo dunque il caso 0 < ` < +∞. Sostituendo gli an con an /`, possiamo supporre che ` = 1. Dato ε > 0, esiste un intero n0 tale che, per ogni n ≥ n0 , 1 − 2ε < an < 1 + 2ε . Allora, se n ≥ n0 , n−n n−n 1 1 ε n 0 ε n 0 < γn < (a0 a1 · · · an0 −1 ) n 1 + . (a0 a1 · · · an0 −1 ) n 1 − 2 2 Il limite del primo termine è 1 − 2ε , mentre il limite del terzo termine è 1 + 2ε . Quindi esiste un indice n1 ≥ n0 tale che, per n ≥ n1 , 1 − ε < γn < 1 + ε. Usando la continuità delle funzioni logaritmo ed esponenziale (che qui non diamo ancora per note), il Teorema 3.7 si ottiene più semplicemente applicando il Teorema 3.5 alla successione (log an ). È fondamentale, per la validità del Teorema 3.7, che gli an siano tutti strettamente positivi. Se uno solo di essi è nullo, da quell’indice in poi tutte le medie geometriche γn sono nulle, e tendono quindi a 0 indipendentemente dal limite degli an . Corollario 3.8. Sia (an ) una successione di numeri reali strettamente positivi, tale che limn an+1 /an = √ ` (finito o infinito). Allora limn n an = `. Come prima, questo enunciato è equivalente al Teorema 3.7, e si dimostra in modo del tutto analogo al Corollario 3.6 (anche qui, una dimostrazione alternativa si basa sulla funzione logaritmo). 3. TEOREMA DI STOLZ–CESARO 58 3. Teorema di Stolz–Cesaro Il Teorema di Stolz–Cesaro può essere visto come una forma “discretizzata” della regola di de l’Hôpital. La “discretizzazione” si riferisce, in una analogia tra funzioni della variabile “continua” x ∈ R e funzioni (successioni) della variabile intera n ∈ N, a una corrispondenza tra operazioni del calcolo differenziale e integrale da un lato e operazioni aritmetiche dall’altro, come quelle indicate in tabella: Continuo Discreto derivata: f 0 (x) differenza: an+1 − an integrale: RT 0 somma: sn = a0 + · · · + an f (x) dx media integrale: 1 T RT integrale improprio: 0 f (x) dx R +∞ 0 media di Cesaro: a0 +···+an−1 n f (x) dx somma della serie: P∞ n=0 an Teorema 3.9 (Teorema di Stolz–Cesaro). Siano (an ), (bn ) successioni. Si supponga che (i) (bn ) sia strettamente monotona; (ii) valga una delle seguenti condizioni: (3.1) lim an = lim bn = 0 , n→∞ n→∞ oppure lim bn = +∞ (oppure − ∞) ; (3.2) n→∞ an+1 − an = `, finito o infinito. n→∞ bn+1 − bn (iii) lim Allora (3.3) an =`. n→∞ bn lim Si noti che nel caso (3.1), il limite (3.3) si presenta nella forma indeterminata 0/0, mentre il caso (3.2) comprende quello di limiti nella forma indeterminata ∞/∞. Si noti anche che il teorema nella forma (3.2) comprende il Corollario 3.6 come caso particolare, con bn = n. Dimostrazione. Consideriamo separatamente i quattro casi, secondo che valga l’uguaglianza (3.1) o l’uguaglianza (3.2) e secondo che ` sia finito o infinito. Forma indeterminata 0/0 e ` infinito. A meno di cambiar segno ai termini di una o di entrambe le successioni, possiamo supporre che la successione (bn ) sia strettamente decrescente, e dunque bn > 0 per ogni n, e inoltre che ` = +∞. 3. TEOREMA DI STOLZ–CESARO 59 Fissato M > 0, esiste n0 ∈ N tale che, per ogni n ≥ n0 , an+1 − an > M , ossia an − an+1 > M (bn − bn+1 ) . bn+1 − bn Per ogni p > 0 si ha (3.4) an − an+p = (an − an+1 ) + (an+1 − an+2 ) + · · · + (an+p−1 − an+p ) > M (bn − bn+1 ) + (bn+1 − bn+2 ) + · · · + (bn+p−1 − bn+p ) = M (bn − bn+p ) . Passando al limite per p → ∞, si ha an ≥ M bn per ogni n ≥ n0 . Si ha cosı̀ la tesi. Forma indeterminata 0/0 e ` finito. Come sopra, possiamo supporre che la successione (bn ) sia strettamente decrescente, e dunque bn > 0 per ogni n. Sostituendo, se necessario, an con an − `bn , possiamo anche supporre che ` = 0. Fissato ε > 0, esiste n0 ∈ N tale che, per ogni n ≥ n0 , |an − an+1 | < ε(bn − bn+1 ) . Per ogni p > 0, ragionando come in (3.4), si ha allora che |an − an+p | < ε(bn − bn+p ) . Passando al limite per p → ∞, si ha |an | ≤ εbn per ogni n ≥ n0 , e dunque la tesi. Caso bn → ±∞ e ` infinito. Possiamo supporre che sia ` che limn bn siano +∞, e dunque che la successione (bn ) sia strettamente crescente. Fissato M > 0, esiste n0 ∈ N tale che, per ogni n ≥ n0 , an > 0 e inoltre an+1 − an > M , ossia an+1 − an > M (bn+1 − bn ) . bn+1 − bn Per n > n0 si ha an − an0 = (an − an−1 ) + (an−1 − an−2 ) + · · · + (an0 +1 − an0 ) > M (bn − bn−1 ) + (bn−1 − bn−2 ) + · · · + (bn0 +1 − bn0 ) = M (bn − bn0 ) . Dividendo per bn , si deduce che, per n > n0 , bn an bn an >M 1− 0 + 0 >M 1− 0 . bn bn an bn Ma bn lim 1 − 0 = 1 , n→∞ bn an M per cui si ha definitivamente > . bn 2 Caso bn → ±∞ e ` finito. Come sopra, possiamo supporre che limn bn = +∞, e dunque che (bn ) sia strettamente crescente, e inoltre che ` = 0. Fissato ε > 0, esiste n0 tale che, per ogni n ≥ n0 , bn > 0 e |an+1 − an | < ε(bn − bn+1 ) . Si ha allora, per n > n0 , |an | ≤ |an − an−1 | + |an−1 − an−2 | + · · · + |an0 +1 − an0 | + |an0 | < ε (bn − bn−1 ) + (bn−1 − bn−2 ) + · · · + (bn0 +1 − bn0 ) + |an0 | 4. CONFRONTI ASINTOTICI TRA SUCCESSIONI 60 = ε(bn − bn0 ) + |an0 | . Dividendo per bn , si ha, per n > n0 , a bn |an0 | |an0 | n <ε+ . <ε 1− 0 + bn bn bn bn an |an0 | Essendo lim = 0, definitivamente si ha < 2ε. n→∞ bn bn 4. Confronti asintotici tra successioni Definizione 3.10 (I simboli O e o di Landau). Siano (an ) e (bn ) due successioni. (a) Si dice che an = O(bn ) , se esistono un indice n0 e una costante M ≥ 0 tali che ∀ n ≥ n0 , |an | ≤ M |bn | . (b) Si dice che an = o(bn ) , se per ogni ε > 0 esiste un indice n0 tale che ∀ n ≥ n0 , |an | ≤ ε|bn | . Si noti che se bn 6= 0 definitivamente, dimodoché il rapporto an /bn abbia senso, allora (4.1) an = O(bn ) ⇐⇒ lim sup n→∞ |an | < +∞ , |bn | an = o(bn ) ⇐⇒ lim n→∞ an =0. bn Le proprietà seguenti, di transitività e stabilità rispetto a somme e prodotti delle relazioni o e O, sono di semplice verifica, che viene lasciata per esercizio: (1) (2) (3) (4) (5) (6) (7) (8) an an an an an an an an = o(bn ) =⇒ an = O(bn ); = O(bn ) , bn = O(cn ) =⇒ an = O(cn ); = O(bn ) , bn = o(cn ) =⇒ an = o(cn ); = o(bn ) , bn = O(cn ) =⇒ an = o(cn ); = O(bn ) , a0n = O(bn ) =⇒ an + a0n = O(bn ); = o(bn ) , a0n = o(bn ) =⇒ an + a0n = o(bn ); = O(bn ) , a0n = O(b0n ) =⇒ an a0n = O(bn b0n ); = O(bn ) , a0n = o(b0n ) =⇒ an a0n = o(bn b0n ). La relazione an = o(bn ) si esprime anche dicendo che an è trascurabile rispetto a bn . Questa terminologia si riferisce al fatto che nel calcolo dei limiti si applica spesso il: Teorema 3.11 (Principio di eliminazione degli infinitesimi di ordine superiore). (4.2) an + o(an ) an = lim . n→∞ cn + o(cn ) n→∞ cn lim Più precisamente, se esiste uno dei due limiti, allora esiste l’altro, e sono uguali. 4. CONFRONTI ASINTOTICI TRA SUCCESSIONI 61 Dimostrazione. Mostriamo il principio nel caso o(cn ) = 0, ripetendo due volte il ragionamento poi si arriva alla formula (4.2). Supponiamo quindi che esista ` := limn an /cn e mostriamo che ` = limn (an +o(an ))/cn (l’implicazione inversa si mostra considerando a0n = an +o(an )). Cambiando se necessario il segno a numeratore e denominatore possiamo supporre che cn > 0 per ogni n ∈ N; per ogni ε ∈ (0, 1) sia n0 ∈ N tale che |o(an )| ≤ ε|an | per ogni n ≥ n0 ; abbiamo allora (an + o(an )) ≤ an (1 + ε) se an ≥ 0 , (an + o(an )) ≤ an (1 − ε) se an ≤ 0 . Da questo deduciamo, dividendo per cn , che lim supn (an + o(an ))/cn ≤ max{(1 + ε)`, (1 − ε)`}. Essendo ε arbitrario si ottiene lim supn (an + o(an ))/cn ≤ `. La disuguaglianza lim inf n (an + o(an ))/cn ≥ ` si mostra analogamente. Definizione 3.12. Siano (an ) e (bn ) due successioni. Si dice che an bn se an = O(bn ) e bn = O(an ). Usando le proprietà (2) e (3), si dimostra facilmente quanto segue. Proposizione 3.13. (i) La relazione è una relazione di equivalenza sull’insieme delle successioni a valori reali. (ii) Se an bn , per ogni successione (cn ) vale (4.3) cn = O(an ) ⇐⇒ cn = O(bn ) e cn = o(an ) ⇐⇒ cn = o(bn ) , (4.4) an = O(cn ) ⇐⇒ bn = O(cn ) e an = o(cn ) ⇐⇒ bn = o(cn ) . Le classi di equivalenza modulo si chiamano ordini di grandezza di successioni. Definizione 3.14. Siano a, b due ordini di grandezza e siano (an ) ∈ a, (bn ) ∈ b. Diciamo che a b se an = O(bn ). Si vede facilmente, grazie alle implicazioni (4.3) e (4.4), che la validità di questa condizione è indipendente dalla scelta degli elementi di a e b. Proposizione 3.15. La relazione è ben definita sull’insieme degli ordini di grandezza di successioni, ed è una relazione d’ordine. Osserviamo che • La relazione non è un ordinamento totale: si prendano, per esempio ( ( n se n è pari , 1 se n è pari , an = bn = 1 se n è dispari ; n se n è dispari . I rispettivi ordini di grandezza non sono confrontabili (per esercizio, si produca un esempio simile con successioni non decrescenti). an • Se bn 6= 0 definitivamente e esiste, finito o infinito, ` = lim , allora n→∞ bn an = O(bn ) ⇐⇒ ` ∈ R , an = o(bn ) ⇐⇒ ` = 0 , an bn ⇐⇒ ` ∈ R \ {0} . • Siano (an ) ∈ a, (bn ) ∈ b. Le due condizioni an = o(bn ) e a ≺ b non coincidono né una delle due implica l’altra. Si consideri infatti che la successione identicamente nulla è “o” di se stessa, quindi an = o(bn ) 6⇒ a ≺ b. Si prendano poi, ad esempio, le successioni ( n se n è pari an = , bn = n . 1 se n è dispari 5. ORDINI DI INFINITO E DI INFINITESIMO 62 I rispettivi ordini di grandezza a e b soddisfano la condizione a ≺ b, ma an 6= o(bn ). Introduciamo ora una relazione di equivalenza più fine (i.e. con classi di equivalenza più piccole) di . Definizione 3.16 (Asintotica equivalenza). Siano (an ), (bn ) successioni. Diciamo che sono asintoticamente equivalenti, e scriveremo an ∼ bn , se an − bn = o(bn ). Anche in questo caso si può mostrare, usando la proprietà (4.1), che per successioni definitivamente non nulle una formulazione equivalente è limn an /bn = 1. In ogni caso, dalla uguaglianza (4.2) deduciamo che vale il principio di sostituzione delle successioni equivalenti an bn an ∼ bn , cn ∼ dn =⇒ lim = lim , n→∞ cn n→∞ dn con la solita convenzione che se esiste uno dei due limiti esiste l’altro, e coincidono. Che ∼ sia una relazione di equivalenza è parte del seguente enunciato. Proposizione 3.17. (i) Vale l’implicazione an ∼ bn =⇒ an bn . (ii) ∼ è una relazione di equivalenza tra successioni. Dimostrazione. Se an ∼ bn , dato ε > 0, esiste n0 ∈ N tale che |an − bn | ≤ ε|bn | ∀n ≥ n0 . Per tali valori di n, |an | ≤ |an − bn | + |bn | ≤ (1 + ε)|bn | e |an | ≥ |bn | − |an − bn | ≥ (1 − ε)|bn | . Questo dimostra il punto (i). Per dimostrare il punto (ii) osserviamo innanzitutto che la proprietà riflessiva di ∼ è ovvia, mentre la proprietà simmetrica segue dalla seconda equivalenza nella formula (4.3) con cn = an − bn . Assumendo poi che an ∼ bn e bn ∼ cn , si ha, per la proprietà (5), an − cn = (an − bn ) + (bn − cn ) = o(bn ) + o(cn ) = o(cn ) + o(cn ) = o(cn ) . 5. Ordini di infinito e di infinitesimo Sia α un numero reale positivo. Una successione (an ) si dice un infinito di ordine α, rispettivamente un infinitesimo di ordine α, se an nα , rispettivamente an n−α . In modo analogo si definiscono infiniti e infinitesimi di ordine α rispetto a una successione “campione” (bn ) positiva e infinita, scelta in sostituzione della successione bn = n (per es., bn = en , oppure bn = log n). Nel seguito ci limitiamo ad assumere bn = n come infinito campione, ma quello che diremo ha evidenti estensioni al caso generale. Se, per un dato α > 0, an lim α = c ∈ R \ {0} , n→∞ n e quindi (an ) è infinita di ordine α, si ha an ∼ cnα , ossia an = cnα + o(nα ) , e cnα si chiama la parte principale di an . In modo analogo si definisce, se esiste, la parte principale di un infinitesimo di ordine α. 5. ORDINI DI INFINITO E DI INFINITESIMO 63 Esempio. Si prenda la successione an = Siccome p n2 − n . √ n2 − n =1, n→∞ n an è infinita di ordine 1 con parte principale n. Quindi p n2 − n = n + o(n) . √ Il “resto” rn = n2 − n − n, che sappiamo essere o(n) può essere a sua volta analizzato, osservando che 1 n =− . lim rn = − lim √ 2 n→∞ n→∞ 2 n −n+n Quindi 1 an = n + rn = n − + o(1) , 2 dove o(1) = o(n0 ) indica ovviamente un generico infinitesimo. Analizziamo dunque il nuovo resto 1 p 1 4 rn0 = n2 − n − n + = − √ . 2 n2 − n + n − 21 lim 1 Questo è infinitesimo di ordine 1 con parte principale − . Quindi 8 1 1 an = n − − + o(n−1 ) . 2 8n Ripetendo questo procedimento, è possibile, calcolando iterativamente i coefficienti ck , giungere per ogni k a una formula 1 c2 ck 1 + 2 + · · · + k + o(n−k ) . an = n − − 2 8n n n Questo tipo di formula costituisce lo sviluppo asintotico dei termini an della successione data.6 Osservazione 3.18. Le definizioni e notazioni introdotte in questi due paragrafi vengono utilizzate anche per funzioni di variabile reale. Siccome esse possono riguardare sia il comportamento asintotico di una funzione per x → ±∞, sia quello per x → x0 con x0 ∈ R, è necessario accompagnare le espressioni f (x) = O g(x) , f (x) ∼ g(x), ecc. dall’indicazione del punto, finito o infinito, verso cui si intendono i limiti o nel cui intorno devono valere le maggiorazioni. Per esempio, si scrive sin x ∼ x (x → 0) , sin x per esprimere il fatto che lim = 1. x→0 x oppure sin x ∼x→0 x , 6Con gli strumenti del calcolo differenziale è poi possibile determinare una formula esplicita per i coefficienti c : k √ n2 − n − n per n → ∞ è come studiare r √ 1 1 1 1−x−1 f (x) = − − = x2 x x x √ per x → 0+ (si pone x = 1/n). Lo sviluppo di Taylor di 1 − x − 1 nell’intorno di 0 è √ 1x 1 x2 3 x3 3 · 5 x4 3 · 5 · 7 x5 3 · 5 · 7 · 9 x6 1−x−1=− − + − + − + ··· 2 1! 4 2! 8 3! 16 4! 32 5! 64 6! k −k−1 da cui si ricava, dopo aver diviso per x, che ck = (−1) 2 (1 · 3 · · · (2k − 1))/(k + 1)! per k ≥ 1. studiare rn = 6. ESERCIZI 64 6. Esercizi Esercizio 3.1. Se (xn ) è una successione di numeri reali tale che per ogni k ∈ N si ha limn→∞ (xn − xn+k ) = 0, si può concludere che (xn ) è di Cauchy? Esercizio 3.2. Sia (xn ) una successione di numeri reali tale che limn→∞ (xn − xn+2 ) = 0. Si provi che allora xn − xn+1 lim =0 n→∞ n Esercizio 3.3. La successione (xn + pxn−1 ) converge se e solo se converge (xn ). Dire per quali valori reali di p tale affermazione è corretta. Esercizio 3.4. Sia (an ) una successione di reali positivi tali che an−1 + an−2 an < . 2 Dimostrare che allora (an ) converge. Esercizio 3.5. Sia (xn ) una successione di numeri reali. Provare che è sempre possibile trovare una sottosuccessione monotona. Esercizio 3.6. Sia (xn ) una successione di numeri positivi. Provare che è sempre possibile trovare o una sottosuccessione convergente o una sottosuccessione che diverge a +∞. Esercizio 3.7. F Dire se esistono i limiti delle seguenti successioni e eventualmente calcolarli: p √ √ √ √ √ n n2 n log n n a per a ∈ R+ , n n, n n log n, n!, n!, n! , Pn 1 n X 1 k=1 k , − log n , log n k k=1 √ n p √ n! n! n n+1 per α ∈ R, , (n + 1)! − n! , α n n n Pn Pn Pn α−1 k=1 k k=1 log k k=1 log k , − log n . per α > −1, nα n log n n Esercizio 3.8. F Studiare il limite di p xn = sin π n2 + λn al variare del parametro λ ∈ R. Nel caso il limite sia zero si studi l’ordine di infinitesimo della successione. Esercizio 3.9. F √ Quali sono i possibili limiti della successione delle parti frazionarie di n? 6. ESERCIZI 65 Esercizio 3.10. F La successione (1/(n sin n)) ha una sottosuccessione che converge a zero? Si discuta se ne ha una che converge a +∞? (ATTENZIONE!!! Questo secondo è un PROBLEMA APERTO!!! Cercare in letteratura o in rete informazioni al riguardo). Esercizio 3.11. Studiare il comportamento delle seguenti successioni definite per ricorrenza, al variare del parametro λ, an (1) a1 = λ, an+1 = 1+a , n (2) a1 = λ, an+1 = sin an , (3) a1 = λ, an+1 = a2n + an 2 . Esercizio 3.12. Sia (an ) una successione di numeri reali tale che a1 = a, a2 = b e an+1 = an + an−1 2 Si studi la convergenza di (an ) e si calcoli l’eventuale limite. Esercizio 3.13. Studiare il comportamento della successione √ r q q √ √ 2, 2 2, 2 2 2, ... Esercizio 3.14. Si trovi una formula esplicita per la successione dei numeri di Fibonacci, definita per ricorrenza da F0 = 1, F1 = 1 e Fn+2 = Fn + Fn+1 . Esercizio 3.15. Sia (an ) la successione definita per ricorrenza da a0 = 1 e an+1 = 2an + n. Si trovi una formula esplicita per (an ). Esercizio 3.16. Si consideri la seguente successione definita per ricorrenza, ( a0 = 0, a1 = 1 an = 4an−1 + an−2 se n > 1 . √ Trovare limn→∞ n an . Esercizio 3.17. Dati due numeri reali e positivi a e b, definiamo a+b √2 G(a, b) = ab A(a, b) = H(a, b) = 1 a Media Aritmetica, Media Geometrica, !1 + 1b 2 2ab = Media Armonica. 2 a+b 6. ESERCIZI 66 Consideriamo le successioni (xn ) e (yn ), definite per ricorrenza da x0 = a, y0 = b xn = A(xn−1 , yn−1 ) yn = G(xn−1 , yn−1 ) Si provi che entrambe le successioni convergono ad uno stesso limite (tale limite si dice Media Aritmetico–Geometrica di a e b). Esercizio 3.18. Mostrare che la successione (xn ) definita da x0 = 1, diverge a +∞ e valutarne l’ordine di crescita. xn+1 = xn + 1 xn CAPITOLO 4 SOMMATORIE SU INSIEMI INFINITI In questo capitolo diamo per noti nozioni e teoremi principali relativi alle serie numeriche, e in particolare: • definizione di somma di una serie (come limite delle somme finite, dei primi n termini); • condizione necessaria per la convergenza (termine n–esimo infinitesimo); • criteri di convergenza per serie con termini P non negativi: confronto (se anP≤ bn definitivaquella della serie n an , quindi la mente allora la convergenza della serie n bn implica P P √ divergenza della serie n an implica quella della serie n bn ), radice (se n an → `, allora P la serie Pn an converge se ` < 1, diverge se ` > 1), rapporto1 (se an+1 /an → `, allora la serie n an converge se ` < 1, diverge se ` > 1), infine condensazione di Cauchy (se P P 0 ≤ an+1 ≤ an , la serie n an converge se e solo se k 2k a2k converge, più precisamente P∞ P∞ k P∞ 1 an ); 0 2 a2k ≤ 2 1 an ≤ P • criterio di convergenza assoluta per serie di segno variabile (se la serie n |an | converge, P allora anche la serie n an converge); • criterio di convergenza di Leibniz P per serie di segno alternante (se (an ) ⊂ [0, +∞) è infinitesima e decrescente, allora n (−1)n an converge). 1. Somme di termini non negativi Dato un insieme I, indichiamo con Pfin (I) l’insieme dei sottoinsiemi finiti di I. Data a : I −→ R, conveniamo di indicare con ai il valore a(i) e, come per le successioni, con (ai ) la funzione a. Definizione 4.1 (Somma su insiemi arbitrari di indici). Sia ai ≥ 0 per ogni i ∈ I. Si chiama sommatoria su I degli ai il valore X X ai = sup ai ∈ [0, +∞] . i∈I F ∈Pfin (I) i∈F Si dice che la sommatoria converge se tale valore è finito. Vediamo alcune proprietà generali. Proposizione 4.2. Se la sommatoria massimo numerabile. P i∈I ai converge, allora l’insieme {i ∈ I : ai > 0} è al Dimostrazione. Sia S il valore della sommatoria. Se S = 0, allora necessariamente ai = 0 per ogni i ∈ I. Supponiamo allora 0 < S < +∞. Per ogni n ∈ S N∗ , sia En = {i ∈ I : ai ≥ S/n}. Ovviamente En non può contenere più di n elementi. Quindi n>0 En = {i ∈ I : ai > 0} è al massimo numerabile. 1Applicando il secondo teorema di Cesaro a a n+1 /an si deduce il criterio del rapporto da quello della radice. 67 2. LIMITI LUNGO INSIEMI ORDINATI FILTRANTI 68 Per determinare il comportamento di una sommatoria a termini non negativi, è possibile limitarsi a considerare le somme finite su particolari sottofamiglie F di Pfin (I), come ora vedremo. Definizione 4.3 (Famiglia cofinale in Pfin (I)). Una famiglia F di sottoinsiemi finiti di I si dice cofinale se, per ogni F ∈ Pfin (I), esiste F 0 ∈ F tale che F ⊆ F 0 . Proposizione 4.4. Sia F una sottofamiglia cofinale di Pfin (I). Allora X X ai = sup ai . F ∈F i∈F i∈I Dimostrazione. La disuguaglianza X sup ai ≤ F ∈F i∈F sup X ai = F ∈Pfin (I) i∈F X ai i∈I è ovvia. D’altra parte, dato G ∈ Pfin (I) sia F ∈ F tale che G ⊆ F . Allora X X X ai ≤ ai ≤ sup ai . i∈G i∈F F ∈F i∈F Prendendo l’estremo superiore delle somme a primo membro al variare di G in Pfin (I), si conclude che X X ai ≤ sup ai . i∈I F ∈F i∈F Corollario 4.5. Sia I = N e sia (an ) una successione a termini non negativi. La definizione di sommatoria secondo la Definizione 4.1 coincide con quella di somma della serie (cioè come limite delle somme parziali). Dimostrazione. Basta osservare che F = {0, 1, . . . , n} : n ∈ N soddisfa le ipotesi della Proposizione 4.4. Come vedremo al Paragrafo 5, la stessa equivalenza non varrà più per successioni di segno generico. 2. Limiti lungo insiemi ordinati filtranti La nozione di serie di termini (ai ) non negativi è stata data come un estremo superiore di somme finite, e questo ha consentito di definirla per un insieme generico I infinito. Tuttavia, per estendere la nozione di serie a termini di segno qualunque, è necessario esprimerla come limite. Per far questo, occorre introdurre la nozione di insieme ordinato filtrante e di limite di una funzione definita su un insieme filtrante. È anche utile estendere la definizione di insieme cofinale a un qualsiasi insieme ordinato. Definizione 4.6 (Insiemi cofinali e insieme ordinato filtrante). Un sottoinsieme Y di un insieme ordinato (X, ) si dice cofinale se per ogni x ∈ X esiste y ∈ Y tale che x y. Un insieme ordinato (X, ) si dice filtrante se, dati comunque x, y ∈ X, esiste z ∈ X tale che x ≺ z e y ≺ z. L’insieme filtrante a cui saremo interessati è X = Pfin (I), con I infinito, ordinato per inclusione. È inoltre filtrante un qualunque insieme non vuoto, totalmente ordinato e privo di massimo. 3. *L’INTEGRALE DI RIEMANN 69 Definizione 4.7. Sia (X, ) un insieme ordinato filtrante e sia f : X −→ R. Si dice che ` ∈ R è limite di f lungo X, e si scrive ` = lim f (x) , x∈X se per ogni ε > 0 esiste x ∈ X tale che ∀x x , |f (x) − `| < ε . In modo analogo si definiscono i limiti a ±∞. Osservazione 4.8. La dimostrazione dei seguenti teoremi per limiti lungo insiemi filtranti è lasciata per esercizio. Si noti che il ruolo delle sottosuccessioni è giocato dagli insiemi cofinali, nell’enunciato (6), e che l’ipotesi che l’insieme sia filtrante è essenziale per avere l’unicità del limite. (1) unicità del limite; (2) esistenza del limite di funzioni crescenti, cioè tali che x ≺ y ⇒ f (x) ≤ f (y), e uguaglianza limx∈X f (x) = supx∈X f (x); (3) esistenza del limite di funzioni decrescenti, cioè tali che x ≺ y ⇒ f (x) ≥ f (y), e uguaglianza limx∈X f (x) = inf x∈X f (x); (4) teoremi di confronto; (5) limiti di somme e prodotti; (6) se limx∈X f (x) = ` e Y è cofinale in X, allora anche limy∈Y f (y) = `; (7) se ` ∈ R non è il limite di f lungo X, esiste un intervallo I = (` − ε, ` + ε) tale che l’insieme{f 6∈ I} è cofinale in X (analogo enunciato se ` = ±∞); (8) esistenza di lim supx∈X f (x) = inf x∈X supyx f (x) e di lim inf x∈X f (x) = supx∈X ∈yx f (x); (9) criterio di convergenza di Cauchy: f ha limite finito lungo X se e solo se per ogni ε > 0 esiste x0 tale che, ∀ x, y x0 , vale |f (x) − f (y)| < ε.2 3. *L’integrale di Riemann 3 Un esempio importante di limite lungo insiemi filtranti è dato dall’integrale di Riemann. Ricordiamo prima le definizioni tradizionali di integrale e di funzione integrabile secondo Riemann, vedremo poi come entrambi questi concetti possono essere espressi in modo più efficace usando la nozione di limite lungo un insieme filtrante. Sia [a, b] ⊆ R un intervallo chiuso e limitato e indichiamo con Σ l’insieme delle partizioni di [a, b], Σ := (t0 , . . . , tn ) : n ∈ N∗ , a = t0 < t1 < · · · < tn−1 < tn = b , indicando con σ l’elemento generico di Σ. L’insieme Σ, munito della relazione di ordine insiemistica, è filtrante. 2A differenza del caso I = N, non è detto che le successioni di Cauchy (o, il che è lo stesso, convergenti) siano limitate. Ad esempio, se I = Z munito della usuale struttura d’ordine, allora la successione (2−n ) ha limite uguale a 0, ma non è limitata. 3Sezione facoltativa 3. *L’INTEGRALE DI RIEMANN 70 Indichiamo ora con S([a, b)) le funzioni f : [a, b) → R semplici, caratterizzate dall’essere costanti sugli intervalli [ti , ti+1 ) su un’opportuna partizione σ = (t0 , . . . , tn+1 ) ∈ Σ. Si verifica facilmente che S([a, b)) è uno spazio vettoriale, che la definizione I(g) := n−1 X g(ti )(ti+1 − ti ) se g è costante su [ti , ti+1 ), i = 0, . . . , n − 1 i=0 è ben posta e che I definisce un funzionale4 lineare e monotono su S([a, b)). Verifichiamo a titolo di esempio che S([a, b)) è vettoriale, le altre verifiche sono del tutto analoghe: se f è costante sugli intervalli di σ, lo è anche su ogni partizione più fine di σ (basta verificarlo aggiungendo un punto alla volta). Quindi se f è costante sugli intervalli di σ e g è costante sugli intervalli di η, αf + βg è costante sugli intervalli di σ ∪ η, quindi αf + βg è semplice. Diremo che una funzione limitata f : [a, b) → R è integrabile secondo Riemann, in breve Rintegrabile, se I∗ (f ) = I ∗ (f ), ove I ∗ (f ) := inf I(g) : g ≥ f, g ∈ S([a, b)) e I∗ (f ) := sup I(h) : h ≤ f, h ∈ S([a, b)) . Si noti che I∗ (f ) ≤ I ∗ (f ) e che −∞ < (b − a) inf f ≤ I∗ (f ) ≤ I ∗ (f ) ≤ (b − a) sup f < ∞. Rb Quando f è R-integrabile, il valore comune a I∗ (f ) e I ∗ (f ) è indicato con a f (x) dx. Il classico esempio di funzione non integrabile è la funzione f di Dirichlet, identicamente uguale a 1 su Q e identicamente nulla su R \ Q. In tal caso per ogni intervallo [a, b] vale I∗ (f ) = 0 e I ∗ (f ) = (b − a). È possibile dimostrare che: (a) l’insieme delle funzioni R-integrabili è uno spazio vettoriale e l’integrale agisce linearmente su di esso; (b) sono R-integrabili le funzioni semplici (per definizione, si prende f = g = h) e l’integrale di Riemann coincide con I su questa classe di funzioni; (c) sono R-integrabili le funzioni continue in [a, b]5 (d) sono R-integrabili le funzioni monotone limitate.6 Per tutte queste classi di funzioni e in realtà, come vedremo tra un attimo, per tutte le funzioni integrabili, vale anche la formula Z b n−1 X (b − a) i f (ti ) con ti = a + (b − a) . (3.1) f (x) dx = lim n→∞ n n a i=0 Proposizione 4.9. Per ogni f : [a, b) → R R-integrabile vale la (3.1). 4In genere le funzioni definite su spazi di funzioni sono chiamate funzionali. 5Infatti, per l’uniforme continuità, per ogni ε > 0 esiste δ > 0 tale che |f (x) − f (y)| < ε tutte le volte che |x − y| < δ; preso n ∈ N tale che n > δ −1 , dividendo [a, b) in n intervalli Ji = [a + i(b − a)/n, a + (i + 1)(b − a)/n) e prendendo come minorante (risp. maggiorante) la funzione h (risp. g) che vale minJ i f (risp. maxJ i f ), dalla disuguaglianza maxJ i f − minJ i f < ε si deduce che I(g) ≤ I(h) + ε(b − a). 6 Se f è crescente, basta prendere una suddivisione come in (c) e poi definire h uguale a f (a + i(b − a)/n) in Ji e g uguale a f (a + (i + 1)(b − a)/n), ottenendo I(g) ≤ I(h) + (b − a) sup |f |. 3. *L’INTEGRALE DI RIEMANN 71 Dimostrazione. Abbiamo già osservato che il risultato vale per funzioni continue f : [a, b] → R, con un ragionamento simile a quello seguito in (c). Osserviamo ora che per ogni ε > 0 ed ogni funzione semplice h minorante (risp. g maggiorante) possiamo trovare, con un piccolo raccordo tra Rb le successive discontinuità a salto, una funzione continua h1 ≤ h tale che a (h − h1 ) dx < ε (risp. Rb una funzione continua g1 ≥ g tale che a (g1 − g) dx < ε). Allora lim sup n→∞ n−1 X i=0 n−1 X (b − a) (b − a) f (ti ) ≤ lim sup g1 (ti ) = n n n→∞ Z i=0 b g1 (x) dx ≤ I(g) + . a Minimizzando rispetto a ε e g otteniamo lim sup n→∞ n−1 X i=0 (b − a) f (ti ) ≤ I ∗ (f ) n e, con ragionamento analogo basato su h1 , lim inf n→∞ n−1 X i=0 (b − a) f (ti ) ≥ I∗ (f ) . n La R-integrabilità di f implica allora che il limite esiste e coincide con l’integrale. Tuttavia, quando trattiamo funzioni molto discontinue, il limite in (3.1) potrebbe non esistere o dipendere dalla partizione. Ad esempio, nel caso della funzione di Dirichlet, il limite in (3.1) esiste ma può valere 0 o 1 a seconda dell’appartenenza a Q di a e di b. Quindi l’esistenza del limite in (3.1) non implica l’integrabilità. Ci chiediamo quindi: è possibile caratterizzare la R-integrabilità e non solo l’integrale con un processo di limite? Per capire questo partiamo dall’osservazione che, nella Proposizione 4.9, non vi è nulla di essenziale nella scelta di una partizione in intervalli di uguale lunghezza, né nella scelta del punto più a destra dell’intervallo: se avessimo scelto partizioni σk = {(t0,k , . . . , tnk ,k )} e punti ξi,k ∈ [ti,k , ti+1,k ), avremmo ancora avuto (con dimostrazione simile) b Z f (x) dx = lim a k→∞ nX k −1 (ti+1,k − ti,k )f (ξi,k ) i=0 purché la finezza della partizione σk , vale a dire supi (ti+1,k − ti,k ), fosse stata infinitesima. Queste considerazioni suggeriscono l’introduzione dell’insieme Σp delle partizioni puntate Σp := {(σ, ξ) : σ = (t0 , . . . , tn ) ∈ Σ, ξi ∈ [ti , ti+1 ), i = 0, . . . , n − 1} munito della relazione d’ordine parziale definita come segue: 0 (σ, ξ) = (t0 , . . . , tn ; ξ1 , . . . , ξn−1 ) (t00 , . . . , t0m ; ξ10 , . . . , ξm−1 ) = (σ 0 , ξ 0 ) se e solo se σ ⊆ σ 0 . Consideriamo anche la funzione I : Σp → R definita da I(σ, ξ) := n−1 X i=0 f (ξi )(ti+1 − ti ) per (σ, ξ) ∈ Σp , σ = (t0 , . . . , tn ) . 3. *L’INTEGRALE DI RIEMANN 72 Per caratterizzare la R-integrabilità senza menzionare l’integrale è anche utile considerare la funzione n−1 X Oσ (f ) := sup f − inf f (ti+1 − ti ) = i=0 [ti ,ti+1 ) n−1 X sup [ti ,ti+1 ) (f (ξ) − f (ξ 0 ))(ti+1 − ti ) 0 i=0 ξ, ξ ∈ti ,ti+1 ) per σ = (t0 , . . . , tn ) . Non è difficile verificare la proprietà di monotonia (come sempre, aggiungendo un punto alla volta) Oσ (f ) ≥ Oσ0 (f ) (3.2) se σ ≤ σ 0 . Teorema 4.10. Sia f : [a, b) → R limitata. Allora le seguenti tre proprietà sono equivalenti: (i) f è integrabile secondo Riemann; (ii) lim Oσ (f ) = 0; σ∈Σ (iii) esiste lim(σ,ξ)∈Σp I(σ, ξ). Per f integrabile secondo Riemann vale la formula Z b (3.3) f (x) dx = lim I(σ, ξ) . (σ,ξ)∈Σp a Dimostrazione. (i) =⇒ (ii). Per ogni > 0 esistono h minorante e g maggiorante tali che Z b Z b ∗ I(g) ≤ I (f ) + = f (x) dx + , I(h) ≥ I∗ (f ) − = f (x) dx − , a a quindi I(g)−I(h) ≤ 2. Raffinando se necessario le due partizioni lungo le quali g e h sono costanti, possiamo trovare una partizione σ = (t0 , . . . , tn ) tale che sia g che h sono costanti sugli intervalli [ti , ti+1 ). Dato che h è minorante e g è maggiorante, vale evidentemente sup f − inf f ≤ g(ti ) − h(ti ) [ti ,ti+1 ) [ti ,ti+1 ) e moltiplicando per (ti+1 − ti ) e sommando otteniamo Oσ (f ) ≤ I(g) − I(h) ≤ 2. Dalla (3.2) otteniamo allora che Oσ0 (f ) ≤ 2 per ogni σ 0 ≥ σ, quindi limσ Oσ (f ) = 0. (ii) =⇒ (i). Per ogni > 0 possiamo trovare una partizione σ = (t0 , . . . , tn−1 ) tale che n−1 X sup f − inf f (ti+1 − ti ) < . [ti ,ti+1 ) i=0 [ti ,ti+1 ) Definendo h uguale a inf f su [ti , ti+1 ) e g uguale a [ti ,ti+1 ) sup f su [ti , ti+1 ) otteniamo funzioni [ti ,ti+1 ) semplici minoranti e maggioranti f tali che I(g − h) < . Quindi I ∗ (f ) ≤ I(g) < I(h) + ≤ I∗ (f ) + ed essendo arbitrario otteniamo che f è integrabile secondo Riemann. (i) =⇒ (iii). Sia ε > 0 e siano g, h maggioranti e minoranti rispettivamente tali che I(g) − I(h) < ε. Indicando con σ = (t0 , . . . , tn ) un elemento di Σ tale che sia g che h sono costanti sugli intervalli [ti , ti+1 ) individuati da σ, per ogni (σ, ξ) ∈ Σp , dato che h(ti ) ≤ f ≤ g(ti ) in [ti , ti+1 ) abbiamo I(h) = n−1 X i=0 h(ti )(ti+1 − ti ) ≤ n−1 X i=0 f (ξi )(ti+1 − ti ) ≤ n−1 X i=0 g(ti )(ti+1 − ti ) = I(g) . 4. SERIE A TERMINI DI SEGNO GENERICO 73 Spezzando ciascun intervallo di σ in sottointervalli, la stessa disuguaglianza vale per ogni (σ 0 , ξ 0 ) ∈ Rb Σp con σ ≤ σ 0 , quindi per l’arbitrarietà di ε esiste il limite in (c) e coincide con a f (x) dx. (iii) =⇒ (ii). Per ogni ε > 0 esiste, per la proprietà di Cauchy, σε = (t0 , . . . , tn ) ∈ Σ tale che |I(σ, ξ) − I(σ, ξ 0 )| < ε tutte le volte che σε ≤ σ. Per σ = σε , se calcoliamo l’estremo superiore di n−1 X X X n−1 n−1 |I(σ, ξ) − I(σ, ξ 0 )| = f (ξi )(ti+1 − ti ) − f (ξi0 )(ti+1 − ti ) = (f (ξi ) − f (ξi0 ))(ti+1 − ti ) i=0 al variare di ξ e ξ0 i=0 i=0 vale proprio Oσε (f ). Abbiamo quindi, per monotonia, Oσ (f ) ≤ ε per σε ≤ σ. In sostanza, la proprietà (3.3) risulta sufficientemente forte per caratterizzare la R-integrabilità, a differenza dell’esistenza del limite (3.1). Si noti anche che l’insieme delle partizioni 2 h−1 1 ∗ (a, a + (b − a), a + (b − a), . . . , a + (b − a), b) : h ∈ N h h h non è cofinale in Σ, e non lo è in Σp neanche l’insieme delle partizioni puntate che compaiono in (3.1). Quindi la Proposizione 4.9 non è conseguenza diretta del Teorema 4.10(iii). 4. Serie a termini di segno generico Sia I un insieme infinito e Pfin (I) ordinato per inclusione. Definizione 4.11. Sia (ai ) definita su I e a valori reali. Si chiama serie degli ai il limite X X ai , ai = lim F ∈Pfin (I) i∈I i∈F se tale limite esiste. La serie si dice convergente, divergente o indeterminata secondo che il limite esista finito, esista infinito o non esista rispettivamente. Per F ∈ Pfin (I), poniamo s(F ) = X ai . i∈F Dimostriamo subito, per funzioni a termini non negativi, l’equivalenza di questa definizione con la Definizione 4.1. Proposizione 4.12. Se ai ≥ 0 per ogni i ∈ I, allora lim F ∈Pfin (I) s(F ) = sup s(F ) . F ∈Pfin (I) Dimostrazione. Se gli ai sono non negativi, la funzione s(F ) è crescente su Pfin (I). La tesi segue allora dall’Osservazione 4.8(2). Nel resto di questo paragrafo, dimostreremo che una serie converge se e solo se converge la serie dei suoi valori assoluti. Per cominciare, diamo un’apposita formulazione del criterio di convergenza di Cauchy adattata alle sommatorie su insiemi infiniti. P Lemma 4.13 (Criterio di convergenza di Cauchy per serie infinite). La serie i∈I ai converge se e solo se per ogni ε > 0 esiste un insieme F0 ∈ Pfin (I) tale che, per ogni F ∈ Pfin (I) disgiunto da F0 , si abbia |s(F )| < ε. 4. SERIE A TERMINI DI SEGNO GENERICO 74 Dimostrazione. Supponiamo che la serie converga a s ∈ R. Allora, dato ε > 0 esiste F0 ∈ Pfin (I) tale che |s(F 0 ) − s| < ε per ogni F 0 ⊇ F0 finito. Dato F finito e disgiunto da F0 , si consideri F 0 = F ∪ F0 . Allora |s(F )| = |s(F 0 ) − s(F0 )| ≤ |s(F 0 ) − s| + |s − s(F0 )| < 2ε . Viceversa, si supponga che, per ogni ε > 0, esista un insieme F0 ∈ Pfin (I) tale che, per ogni F ∈ Pfin (I) disgiunto da F0 , si abbia |s(F )| < ε. Si considerino due sottoinsiemi finiti di I, F 0 e F 00 , entrambi contenenti F0 . Allora le due differenze F 0 \ F 00 e F 00 \ F 0 sono entrambe disgiunte da F0 . Quindi |s(F 0 \ F 00 )| < ε e analogamente per |s(F 00 \ F 0 )|. Osservando che s(F 0 ) − s(F 00 ) = s(F 0 \ F 00 ) − s(F 00 \ F 0 ) , si ottiene che |s(F 0 ) − s(F 00 )| ≤ |s(F 0 \ F 00 )| + |s(F 00 \ F 0 )| < 2ε . Per il criterio di convergenza di Cauchy, vedi l’Osservazione 4.8(9), la serie converge. P P Teorema 4.14. La serie i ai converge se e solo se converge la serie i |ai |. In tal caso, X X (4.1) ai ≤ |ai | . i∈I i∈I Dimostrazione. Per ogni F ∈ Pfin (I), poniamo X X s(F ) = ai , σ(F ) = |ai | . i∈F i∈F Ovviamente, per ogni F ∈ Pfin (I), (4.2) s(F ) ≤ σ(F ) . Supponiamo che converga la serie dei valori assoluti degli ai . Allora, per il Lemma 4.13, dato ε > 0, esiste F0 ∈ Pfin (I) tale che, per ogni F ∈ Pfin (I) disgiunto da F0 , σ(F ) < ε. Per la (4.2) e il criterio di convergenza di Cauchy, anche la sommatoria degli ai converge. Passando al limite nella (4.2) otteniamo (4.1). Viceversa, supponiamo che converga la serie degli ai . Allora, dato ε > 0, esiste F0 ∈ Pfin (I) tale che, per ogni F ∈ Pfin (I) disgiunto da F0 , |s(F )| < ε. Fissato un tale F , lo si scomponga nell’unione disgiunta di F+ = i ∈ F : ai ≥ 0 , F− = i ∈ F : ai < 0 . Allora anche F+ e F− sono disgiunti da F0 , per cui σ(F+ ) = s(F+ ) < ε , σ(F− ) = −s(F− ) < ε . Pertanto, σ(F ) = σ(F+ ) + σ(F− ) < 2ε , e, per il criterio di convergenza di Cauchy, anche la sommatoria P i |ai | converge. 5. IL CASO I = N: CONFRONTO CON LA NOZIONE DI “SOMMA DI UNA SERIE” 75 5. Il caso I = N: confronto con la nozione di “somma di una serie” Se I = N, occorre dunque distinguere tra la nozione di “sommatoria di una successione” (an ) secondo la Definizione 4.11 e quella di “somma della serie”, ∞ X an = lim N X N →∞ n=0 an . n=0 Siccome la famiglia F degli insiemi En = {0, 1, . . . , n} è cofinale, vale l’implicazione lim F ∈Pfin (N) s(F ) = s =⇒ lim s(F ) = lim s(En ) = s . n→∞ F ∈F P Mantenendo la distinzione simbolica tra n∈N an per la sommatoria secondo la Definizione 4.11, e P∞ 7 0 an per la somma della serie , si ha dunque che X an = s =⇒ ∞ X an = s . n=0 n∈N L’implicazione inversa non vale, considerare una qualsiasi serie convergente, non assolutaP basta n /n). Riprendendo l’analogia sottosuccessioni-insiemi cofinali mente (il classico esempio è ∞ (−1) 1 P∞ fatta in precedenza, la nozione di serie 0 an corrisponde al P limite “lungo la sottosuccessione delle parti finite {0, . . . , n}”, mentre la nozione di sommatoria n∈N an corrisponde al limite pieno nell’insieme filtrante delle parti finite. In relazione all’implicazione inversa, si ha la seguente caratterizzazione della convergenza della sommatoria. Teorema 4.15. Per una successione (an ) le seguenti proprietà sono equivalenti: P (1) La sommatoria n∈N an converge; P∞ (2) la serie 0 an converge assolutamente. Dimostrazione. Per il Teorema 4.14, la condizione (1) equivale alla convergenza P della somP matoria n∈N |an |. Per il Corollario 4.5, questo equivale alla convergenza della serie ∞ 0 |an |. Dimostriamo infine che una sommatoria convergente su un insieme I si può scomporre in una sommatoria (finita o infinita) di sommatorie parziali. 8 Teorema 4.16. Sia {I Pk }k∈K una partizione dell’insieme I, e sia (ai ) una funzione da I a R. Allora la sommatoria i∈I ai converge se e solo se valgono le seguenti proprietà: P (i) per ogni k ∈ K, la sommatoria i∈Ik |ai | converge; P P (ii) posto sk = |ai |, la sommatoria sk converge. i∈Ik In tal caso convergono anche (5.1) k∈K P a k∈K i∈Ik i e vale XX ai = ai . P i∈Ik ai e X i∈I P k∈K i∈Ik 7Si faccia attenzione al fatto che questa distinzione terminologica e notazionale tra “sommatoria” e “serie” è stata introdotta perché funzionale alla presente trattazione, ma non è del tutto standard. 8Nelle applicazioni, K sarà finito o numerabile. Si noti che sia l’insieme K, sia uno o più degli insiemi I possono k essere finiti. In tal caso la condizione di convergenza della corrispondente sommatoria è automaticamente verificata. Per completezza di dimostrazione, si assumerà implicitamente che tutti questi insiemi siano infiniti. 5. IL CASO I = N: CONFRONTO CON LA NOZIONE DI “SOMMA DI UNA SERIE” 76 Dimostrazione. Consideriamo prima il caso in cui ai ≥ 0 per ogni i ∈ I. Supponiamo che X ai = sup s(F ) = s F ∈Pfin (I) i∈I sia finito. Fissiamo E ∈ Pfin (K) e, per ogni k ∈ E, Fk ∈ Pfin (Ik ). Posto F = si ha X s(Fk ) = s(F ) ≤ s . S k∈E Fk ∈ Pfin (I), k∈E Dall’insieme E isoliamo un suo singolo elemento k0 e teniamo a primo membro il termine corrispondente: X s(Fk ) . s(Fk0 ) ≤ s − k∈E\{k0 } Mantenendo fissati gli Fk a secondo membro, prendiamo l’estremo superiore al variare di Fk0 in Pfin (Ik0 ). Si ottiene che X X ai ≤ s − s(Fk ) . i∈Ik0 k∈E\{k0 } P In particolare, la sommatoria i∈Ik ai converge, e la proprietà (i) è soddisfatta. Chiamiamo sk0 0 la sua somma. Abbiamo allora la disuguaglianza X sk0 + s(Fk ) ≤ s . k∈E\{k0 } Ripetendo lo stesso procedimento iterativamente per ognuno degli altri elementi di E, si ottiene che X sk ≤ s . k∈E Passando all’estremo superiore rispetto a E ∈ Pfin (K), si ottiene la condizione (ii), e inoltre che X X (5.2) sk ≤ ai . k∈K i∈I Supponiamo viceversa che siano soddisfatte le condizioni (i) e (ii). Dato F ∈ Pfin (I), poniamo, per k ∈ K, Fk = F ∩ Ik , e inoltre chiamiamo E ∈ Pfin (K) l’insieme dei k per cui Fk 6= Ø. Essendo F l’unione disgiunta degli Fk con k ∈ E, si ha allora X X X s(F ) = s(Fk ) ≤ sk ≤ sk . k∈E k∈E k∈K Passando all’estremo superiore rispetto a F ∈ Pfin (I), si ottiene la disuguaglianza X X (5.3) ai ≤ sk . i∈I k∈K Abbiamo dunque dimostrato, nel caso ai ≥ 0 per ogni i, l’equivalenza tra la convergenza della sommatoria su I da un lato, e le condizioni (i) e (ii) dall’altro. Inoltre, le due disuguaglianze (5.2) e (5.3) forniscono l’uguaglianza (5.1). Consideriamo ora il caso generale. Poniamo (5.4) a+ i = max{ai , 0} , a− i = max{−ai , 0} . 6. CONVERGENZA INCONDIZIONATA DI SERIE Supponiamo che la sommatoria Essendo anche le due sommatorie P i ai 77 converga. Allora, per il Teorema 4.14, P i |ai | converge. 0 ≤ a± i ≤ |ai | , ± + − i∈I ai convergono. Inoltre, essendo ai = ai − ai , X X X ai = a+ a− i − i . P i∈I i∈I i∈I Applicando quanto dimostrato per sommatorie a termini positivi, possiamo allora affermare che P P • per ogni k ∈ K, le due sommatorie i∈Ik a+ a− i∈IkP i , i convergono, P 0 00 • chiamate sk , sk le rispettive somme, le sommatorie k∈K s0k , k∈K s00k convergono, P P P P + − 0 00 • k∈K sk = i∈I ai , k∈K sk = i∈I ai . Da questo si deduce che P • per ogni k ∈ K, sk = i∈Ik |ai | = s0k + s00k , e dunque vale la conclusione al punto (i), P P • Pk∈K sk = i∈I |ai |, e dunque vale la conclusione al punto (ii), • a = s0k − s00k , P P P Pi∈Ik i0 + − 00 • i∈I ai − i∈I ai = i∈I ai , cioè vale la formula (5.1). k∈K (sk − sk ) = Rimane da dimostrare l’implicazione inversa. Supponiamo che valgano (i) e (ii). Per confronto, le − stesse due condizioni valgono con a+ Quindi, per la prima parte della i , oppure ai , al posto di |ai |.P dimostrazione, possiamo dire che convergono le due sommatorie i∈I a± i e che X XX a± a± . i = i i∈I k∈K i∈Ik P Ma allora la sommatoria i ai converge e X X X XX XX XX + − ai = ai − ai = a+ − a− = ai . i i i∈I i∈I i∈I k∈K i∈Ik k∈K i∈Ik k∈K i∈Ik 6. Convergenza incondizionata di serie Data una successione (an ), si consideri un suo riordinamento, bn = aσn , dove σ : N −→ N è una funzione bigettiva. È facile verificare che le due sommatorie X an , n∈N X aσn n∈N hanno lo stesso comportamento e, se convergenti, la stessa somma. P a n∈N n converga a s. Dato ε > 0, esiste F0 ∈ Pfin (N) tale che X an − s < ε n∈F per ogni F ⊇ F0 . Allora X aσn − s < ε n∈F 0 Infatti, supponiamo che 6. CONVERGENZA INCONDIZIONATA DI SERIE 78 P per ogni F 0 ⊇ σ −1 (F0 ). Quindi anche n∈N aσn = s. L’implicazione inversa si dimostra allo stesso modo. Per quanto riguarda invece il confronto tra le due serie ∞ ∞ X X an , aσn , n=0 n=0 si deve considerare che le rispettive somme parziali sono difficilmente confrontabili tra loro. Vediamo prima il caso più semplice. Teorema 4.17. Se la serie ∞ P an è assolutamente convergente, per ogni riordinamento σ dei suoi n=0 termini si ha ∞ X aσn = n=0 ∞ X an . n=0 Dimostrazione. P Per il Teorema 4.15 converge la sommatoria sopra, è uguale a n∈N |aσn |. Quindi, per gli stessi motivi, si ha ∞ X n=0 aσn = X aσn = n∈N X an = n∈N ∞ X P n∈N |an | che, per quanto detto an . n=0 Se invece una serie converge, ma non assolutamente, si ha una situazione molto diversa. Teorema 4.18. Sia ∞ P an una serie convergente, ma non assolutamente. Allora, per ogni ` ∈ n=0 R ∪ {±∞}, esiste un riordinamento σ di N tale che ∞ X aσn = ` . n=0 + n an = P + negativi ∞ 0 an Più in generale, la stessa conclusione vale se limn an = 0 e P − n an = +∞. P − e ∞ 0 an divergono P entramDimostrazione. Per ipotesi le serie a termini non be (almeno unaPdeve divergere, altrimenti ci sarebbe convergenza assoluta, devono farlo entrambe perché la serie n an è supposta convergente). Questo implica, in particolare, che gli insiemi E + = {n ∈ N : an ≥ 0} , E − = {n ∈ N : an < 0} , sono entrambi infiniti. Inoltre E + , E − formano una partizione di N. Diamo una dimostrazione completa solo del caso ` ∈ R, lasciando per esercizio i casi ` = +∞, ` = −∞, che non richiedono idee molto dissimili. L’idea della costruzione del riordinamento è questa: si cominciano a prendere, nell’ordine, i primi an positivi, fino a giungere a una somma maggiore di `. A questo punto, si riparte dall’inizio e si aggiungono ai termini precedenti i primi an negativi, fermandosi quando la somma ottenuta diventa minore di `. Quindi si riprende ad aggiungere, in sequenza, termini positivi non ancora utilizzati, finché non si torna ad avere una somma maggiore di `, ecc. Vediamo ora di seguire questa idea con espressioni precise e con le dimostrazioni necessarie. Definiamo ricorsivamente σ(n) ponendo σ(0) = 0 e, supponendo di aver già scelto σ(0), . . . , σ(n), scegliamo σ(n + 1) come: P • il minimo intero m in E + \ {σ(0), . . . , σ(n)}, se n0 aσ(i) ≤ `; 6. CONVERGENZA INCONDIZIONATA DI SERIE 79 P • il minimo intero m in E − \ {σ(0), . . . , σ(n)}, se n0 aσ(i) > `. Essendo E ± infiniti il procedimento non si arresta mai, ed è chiaro che σ : N → N è iniettiva, perché ad ogni Ppasso si sceglie un indice tra quelli non ancora scelti. Resta da mostrare che σ è surgettiva e che ∞ 0 aσ(i) = `. Per mostrare che σ è surgettiva basta considerare l’insieme S degli interi n per i quali la strategia viene invertita, i.e. σ(n) ∈ E + e σ(n + 1) ∈ E − , oppure σ(n) ∈ E − e σ(n + 1) ∈ E + . Questo insieme S deve essere infinito, altrimenti si avrebbe σ(n) ∈ E + definitivamente oppure σ(n) ∈ E − definitivamente. Ma, nel primo caso, si avrebbe che l’immagine di σ Pconterrebbe tutti gli interi di E + e un numero finito di interi in E − , quindi le somme parziali n0 aσ(i) supererebbero P + P a un certo punto λ, per la divergenza della serie n an = n∈E + an ; il secondo caso si può escludere con considerazioni analoghe. È allora chiaro che l’indice m deve appartenere all’insieme {σ(0), . . . , σ(n)}, se scegliamo n cosı̀ grande che l’intervallo [1, n] ∩ S contenga più di 2m elementi: in tal caso, infatti, si è “pescato” per almeno m volte dentro l’insieme E + ed almeno m volte dentro l’insieme E − . Fino ad adesso non abbiamo mai usato l’ipotesi che limn an = 0; questa entra proprio nella dimoP strazione del fatto che n aσ(n) = λ. Osserviamo preliminarmente che, anche se (aσ(n) ) non è una sottosuccessione (l’unica permutazione di N strettamente crescente è l’identità), si ha comunque limn aσ(n) = 0 perché σ è iniettiva.9 Ora, la successione dei resti n X δn+1 := ` − aσ(i) i=0 soddisfa, per n ≥ 1, (6.1) ( δn+1 ≤ δn δn+1 ≤ |aσ(n) | se n ∈ /S, se n ∈ S . Il caso n ∈ / S è semplice, ad esempio se σ(n) ∈ E + e σ(n+1) ∈ E + (il caso σ(n) ∈ E − , σ(n+1) ∈ E − è analogo) abbiamo n−1 n X X aσ(i) ≤ aσ(i) ≤ ` , i=0 i=0 da cui la disuguaglianza δn+1 ≤ δn segue subito. Quando n ∈ S, verifichiamo il caso in cui σ(n) ∈ E + e σ(n + 1) ∈ E − (il caso σ(n) ∈ E − , σ(n + 1) ∈ E + è analogo). Abbiamo allora n−1 X i=0 aσ(i) ≤ ` < n X aσ(i) , i=0 da cui deduciamo facilmente δn+1 ≤ aσ(n) . Resta da verificare che ogni successione (δn ) che soddisfa la condizione (6.1) è infinitesima. Useremo quindi il fatto che (δn ) decresce finché non arriva a un indice di S, dove comunque non supera il valore di una successione già infinitesima. Per dimostrarlo, posto per semplicità zn = |aσ(n) |, ci siamo ridotti a dimostrare che ( δn+1 ≤ δn se n ∈ /S, (6.2) δn+1 ≤ zn se n ∈ S , 9Si verifichi con maggiori dettagli questa affermazione; una dimostrazione astratta si può ad esempio dare osservando che la famiglia {σ(0), . . . , σ(n)}, n ≥ 0, è cofinale. 7. SOMMATORIE A PIÙ INDICI 80 con (zn ) infinitesima e S infinito, implicano che (δn ) è infinitesima. Questo è dimostrato nel seguente lemma. Lemma 4.19. Sia S ⊆ N infinito e (zn ) ⊆ [0, +∞) infinitesima. Allora ogni successione (δn ) ⊆ [0, +∞) soddisfacente la (6.2) è infinitesima. Dimostrazione. Per > 0, sia n tale che zn ≤ per n ≥ n ; sia poi n0 ≥ n appartenente a S. Allora δm ≤ per m = n0 + 1 e per induzione su m, usando la (6.2) e il fatto che zm ≤ per ogni m ≥ n0 + 1, otteniamo subito che la stessa proprietà vale per ogni m ≥ n0 + 1. Essendo arbitrario si ha la tesi. 7. Sommatorie a più indici La differenza tra sommatoria e serie va tenuta ancora maggiormente in considerazione quando si prendono in esame “serie multiple”, ossia con indici variabili in Nk con k ≥ 2. Supponiamo che l’insieme I degli indici di una sommatoria sia il prodotto cartesiano di k insiemi, I = I1 × I2 × · · · × Ik , di modo che la sommatoria assume la forma “a più indici” X ai1 ,i2 ,...,ik . (i1 ,i2 ,...,ik )∈I1 ×I2 ×···×Ik Per semplicità di notazioni ci limiteremo a considerare il caso k = 2, denotando con I e J, anziché I1 e I2 , i due insiemi di indici. I risultati che dimostreremo hanno naturali estensioni al caso generale, che vengono lasciate per esercizio. Ci interessa discutere la validità di alcune proprietà che sono ovvie per somme finite, in particolare: • la sommazione “per orizzontali” o “per verticali”: XX X XX (7.1) ai,j = ai,j = ai,j ; (i,j)∈I×J (7.2) • la “proprietà distributiva”: X (i,j)∈I×J j∈J ai bj = i∈I X i∈I i∈I j∈J X ai · bj . j∈J Il teorema che segue è una diretta conseguenza del Teorema 4.16. Teorema 4.20. Si consideri una successione a due indici (ai,j )(i,j)∈I×J a valori reali. Le seguenti condizioni sono equivalenti: P (a) (i,j)∈I×J ai,j converge; P (b) per ogni j fissato, i∈I |ai,j | converge e, chiamata sj la sua somma, P la sommatoria converge anche j∈J sj ; P 0 (c) per ogni i fissato, la sommatoria j∈J |ai,j | converge e, chiamata si la sua somma, P 0 converge anche i∈I si . Se queste condizioni sono verificate, hanno senso tutti i termini e le uguaglianze in (7.1). Dimostrazione. Basta applicare il Teorema 4.16 alle due partizioni I×{j} j∈J e {i}×J i∈I di I × J. A questo punto, si ottiene facilmente il seguente risultato sulla proprietà distributiva. 7. SOMMATORIE A PIÙ INDICI 81 P P P Teorema 4.21. Date due sommatorie convergenti, i∈I ai e j∈J bj , la sommatoria (i,j)∈I×J ai bj è pure convergente e vale l’uguaglianza (7.2). P P Dimostrazione. Posto A = i∈I ai , per j fissato, la sommatoria i∈I ai bj converge a sj = bj A. Inoltre converge la sommatoria X X sj = A bj . j∈J j∈J La conclusione segue dunque dall’implicazione (b)⇒(a) del Teorema 4.20 e dalla (7.1) con ai,j = ai bj . • Data una “successione doppia” (am,n )(m,n)∈N2 , la formulazione per serie della seconda uguaglianza nella formula (7.1) diventa: ∞ X ∞ ∞ X ∞ X X (7.3) am,n = am,n . m=0 n=0 n=0 m=0 È facile vedere che in generale questa identità non vale in generale: se si prende ad esempio se m = n 1 am,n = −1 se m = n + 1 0 altrimenti, si verifica che il primo membro dell’uguaglianza dà 1 e il secondo 0. • Siccome N2 non ha un ordinamento naturale, non è univocamente definibile cosa sia una “serie doppia”. Si ricorre allora a opportune famiglie cofinali F = {FN : N ∈ N} di Pfin (N2 ), a ciascuna delle quali si collega una diversa nozione di “somma della serie doppia”. Per esempio, si ha la sommazione per quadrati se si utilizza il limite X lim am,n , N →∞ m, n≤N o la sommazione per cerchi X lim N →∞ am,n , m2 +n2 ≤N 2 oppure per triangoli X lim N →∞ am,n , m+n≤N ecc. L’esempio che segue mostra che diversi metodi di sommazione danno luogo a diverse nozioni di convergenza. Esempio. Si prenda am,n 1 n = −1 n 0 se m = 0 , n > 0 se m = n > 0 altrimenti. 8. PRODOTTO SECONDO CAUCHY DI SUCCESSIONI 82 Sommando per quadrati, si ha X am,n = 0 , m, n≤N qualunque sia N . Sommando invece per triangoli, si ha, per N = 2k pari, X am,n = k X n=1 m+n≤2k − 2k 2k X 1 X1 1 1 + = > . n n n 2 n=1 n=k+1 Tuttavia, i problemi citati sopra non si presentano in situazioni di assoluta convergenza, ossia quando le serie in questione coincidono con le sommatorie studiate nei paragrafi precedenti. Per esempio, riguardo all’inversione dell’ordine di sommazione nella (7.3), il Teorema 4.20 con I = J = N implica: Corollario 4.22. Sia (am,n )(m,n)∈N2 una funzione a valori reali definita su N2 . Le seguenti condizioni sono equivalenti: P am,n converge; (a) (m,n)∈N2 ∞ P (b) per ogni m fissato, la serie converge anche la serie ∞ P sm ; m=0 (c) per ogni n fissato, la serie converge anche la serie ∞ P n=0 |am,n | converge e, chiamata sm la somma di questa serie, n=0 ∞ P m=0 |am,n | converge e, chiamata s0n la somma di questa serie, s0n . Se queste condizioni sono verificate, vale l’uguaglianza ∞ X ∞ ∞ X ∞ X X X am,n = am,n = am,n . m=0 (m,n)∈N2 n=0 n=0 m=0 8. Prodotto secondo Cauchy di successioni Definizione 4.23 (Prodotto di Cauchy). Date due successioni (an ) e (bn ), si chiama prodotto secondo Cauchy delle due successioni la successione (cn ) il cui termine n–esimo è cn = n X ak bn−k = k=0 X aj bk . j+k=n Si vede facilmente che, se i termini an e bn sono definitivamente nulli, e dunque si ha a che fare solo con somme finite, vale l’uguaglianza ∞ ∞ ∞ X X X cn = aj bk . n=0 j=0 k=0 Per discutere la validità di questa uguaglianza in generale, cominciamo dal caso in cui i termini an e bn sono non negativi. 8. PRODOTTO SECONDO CAUCHY DI SUCCESSIONI 83 Proposizione 4.24. Siano (an ) e (bn ) due successioni a termini non negativi, e sia (cn ) il loro prodotto secondo Cauchy. Allora ∞ ∞ ∞ X X X bn , an cn = n=0 n=0 n=0 con la convenzione che “ 0 · ∞ = 0”. Dimostrazione. Basta osservare che valgono le disuguaglianze n X ai n 2n 2n 2n X X X X bi ≤ ci ≤ ai bi i=0 i=0 i=0 i=0 i=0 e passare al limite per n → ∞. Per il prodotto secondo Cauchy di successioni a valori di segno qualunque, spezzando come nella dimostrazione del Teorema 4.16 in parte positiva e negativa, si deduce facilmente il seguente corollario. Corollario 4.25. Siano (an ) e (bn ) due successioni le cui serie sono assolutamente convergenti, e sia (cn ) il loro prodotto secondo Cauchy. Allora ∞ ∞ ∞ X X X (8.1) cn = an bn . n=0 n=0 n=0 Osservazione 4.26. L’uguaglianza (8.1) non vale in generale in assenza di convergenza assoluta. P (−1)n √ (convergente per il Si dimostri, per esempio, che il prodotto secondo Cauchy della serie ∞ n=1 n criterio di Leibniz) con se stessa è una serie il cui termine n–simo cn non tende a zero, e dunque non converge. Tuttavia è possibile dimostrare che l’uguaglianza vale se almeno una delle serie converge assolutamente (Teorema di Mertens).10 Il prodotto secondo Cauchy interviene in vari problemi riguardanti serie di funzioni. Uno di questi riguarda la convergenza di serie di potenze (che saranno studiate ampiamente più avanti). Si supponga di avere due serie ∞ ∞ X X an xn , bn xn , n=0 n=0 entrambe dipendenti da una variabile x (i coefficienti an e bn sono numeri reali assegnati). Si supponga di sapere che entrambe le serie convergono quando a x vengono assegnati valori in un dato insieme E ⊆ R. Esse allora definiscono due funzioni definite su E a valori in R, f (x) = ∞ X an xn , n=0 g(x) = ∞ X bn xn . n=0 Moltiplicando i termini delle due serie a due a due, risulta naturale raggruppare insieme i prodotti contenenti la stessa potenza di x. Si ottiene cosı̀ una nuova serie di potenze, ∞ X X aj bk xn , n=0 Pn 0 j+k=n 10Detta (a ) la successione la cui serie converge assolutamente, la dimostrazione si basa sulla scrittura C = n n P an−i Bi = n 0 an−i (Bi − B) + An B, ove An , Bn , Cn sono le somme parziali delle tre serie. 9. ESERCIZI 84 che non è altro, per x fissato, che il prodotto secondo Cauchy delle due serie date. Si vuole sapere se essa converge a f (x)g(x) quando x ∈ E e la (8.1) dà risposta positiva, in presenza della convergenza assoluta. 9. Esercizi Esercizio 4.1. Dimostrare la seguente identità 1 1 1 1 1 1 + + ··· + = 1 − + − ··· − n+1 n+2 2n 2 3 2n (Identità di Catalan) . Esercizio 4.2. Calcolare 1 + 2x + 3x2 + · · · + nxn−1 e 1 + 4x + 9x2 + · · · + n2 xn−1 . Esercizio 4.3. Provare che le seguenti serie sono convergenti e calcolarne la somma ∞ X n=1 ∞ X n=2 ∞ X n=1 1 n(n + 1) ∞ X 1 , 2 n −1 n=1 √ (Serie di Mengoli), √ n+1− n √ , n2 + n 1 , n(n + 1)(n + 2) ∞ X n6=m ∞ X n=1 1 n2 − m2 2n + 1 , + 1)2 n2 (n per m ∈ N∗ , 1 1 1 1 + + + + ... 1·3 3·5 5·7 7·9 Esercizio 4.4. Provare che le seguenti serie sono convergenti e calcolarne la somma ∞ X n=1 n , (2n − 1)(2n + 1)(2n + 3) ∞ X n=0 1 , (2n + 1)(2n + 3)(2n + 5) Esercizio 4.5. Provare che la seguente serie è convergente e calcolarne la somma ∞ X 1 arctan . 1 + n(n + 1) n=0 Esercizio 4.6. Sia h un intero positivo. Provare che ∞ X n=1 1 1 = . n(n + 1)(n + 2) . . . (n + h) hh! ∞ X n=1 n4 n . + n2 + 1 9. ESERCIZI 85 Esercizio 4.7. P a una serie convergente con an+1 ≤ an . Si provi che la successione nan è infinitesima. Sia ∞ n n=1 (Osservare che da questo si può dedurre che la serie armonica è divergente). Esercizio 4.8. P∞ Sia an una successione P∞infinitesima e decrescente. Provare che se la serie n=1 an è convergente, allora anche la serie n=1 n(an − an+1 ) lo è, e le due serie hanno la stessa somma. Esercizio 4.9. P Provare che la serie ∞ n=1 an , ove i termini an sono definiti ricorsivamente da an a1 = 1, an+1 = , 2 + an è convergente. Provare invece che l’analoga serie definita da an a1 = 1, an+1 = , 1 + an è divergente. Esercizio 4.10. Si provi che la serie ∞ X n=1 1 , (a + 1)(a + 2) . . . (a + n) con a > 0, è convergente. Esercizio 4.11 (Criterio di Raabe). P a Sia ∞ n=1 n una serie a termini positivi. Si provi che se esiste un numero k > 1 tale che an n − 1 ≥ k, an+1 per ogni n, allora la serie è convergente, mentre se si verifica che an n − 1 ≤ 1, an+1 per ogni n, allora la serie è divergente. Esercizio 4.12. Si utilizzi il criterio di Raabe per lo studio della convergenza della serie 2 1 1·4 2 1 · 4 · 7 . . . (3n − 2) 2 + + ··· + + ... 3 3·6 3 · 6 · 9 . . . (3n) Esercizio 4.13. Sia xn un successione di punti distinti di (0, 1), densa in [0, 1]. I numeri x1 , x2 , . . . , xn−1 dividono [0, 1] in n parti e xn divide una di queste in due intervalli. Siano an e bn le lunghezze di questi due intervalli. Dimostrare che ∞ X 1 an bn (an + bn ) = . 3 n=1 Esercizio 4.14 (Criterio di Condensazione di Cauchy). P Sia an una successione decrescente di numeri positivi. Si provi che ∞ n=0 an è convergente se e P∞ k solo se la serie 2 a è convergente. Come applicazione si dimostri che la serie armonica k P n=0 a 2 generalizzata ∞ 1/n risulta convergente se a > 1. n=1 9. ESERCIZI Esercizio 4.15. Si determini il comportamento delle serie ∞ ∞ X X 1 1 , , α nα n logβ n n=1 n=2 ∞ X n=3 86 1 ,... nα (log n)β (log log n)γ per α, β, γ > 0. Esercizio 4.16. Mostrare che le serie ∞ X n=2 1 , (log n)log n ∞ X n=2 1 (log n)log log n sono una convergente e l’altra divergente. Esercizio 4.17 (Criterio di Dirichlet I). P a è una serie le cui somme parziali costituiscono una successione limitata e bn è una sucSe ∞ n n=1 P cessione di numeri positivi decrescente e infinitesima, dimostrare che la serie ∞ n=1 an bn converge. Come applicazione, si mostri che convergono le serie ∞ ∞ ∞ X X X √ an n n an x , , nan , n n=0 n=1 n=1 P se ∞ n=1 an è convergente e |x| < 1. Si mostri inoltre che questo criterio implica il criterio di Leibniz sulle serie a segni alterni. Esercizio 4.18. Sia an una successione di numeri reali tale che ∞ X |an+1 − an | < +∞ n=1 (una tale successione si dice a variazione limitata), si mostri che è convergente. Esercizio 4.19 (Criterio di Dirichlet II). Siano an e bn due successioni di numeri reali tali che ∞ X |an+1 − an | < +∞, an → 0 n=1 ed esiste M > 0 tale che ∞ X bn < M , P n=1 per ogni n ∈ N. Si mostri che la serie ∞ n=1 an bn converge e si ha ∞ ∞ X X an bn ≤ 2M |an+1 − an | . n=1 n=1 Si mostri che questo criterio implica il criterio classico sulle serie a segni alterni. Esercizio 4.20. Si mostrino dei controesempi alla conclusione del problema precedente nel caso che • la successione an non sia a variazione limitata, • la successione an non sia infinitesima, 9. ESERCIZI • le somme parziali della serie P∞ n=1 bn 87 non siano limitate. Esercizio 4.21 (Criterio di Abel). Siano an e bn due successioni di numeri reali tali che ∞ X |an+1 − an | < +∞ , n=1 e la serie P∞ n=1 bn è convergente. Si mostri allora che la serie P∞ n=1 an bn converge. Esercizio 4.22. F P n Si costruiscano due P successioni di numeri positivi an e bn tali che an /bn → 1 e ∞ n=1 (−1) an è ∞ n convergente mentre n=1 (−1) bn non converge o è divergente. Esercizio 4.23. F Si dimostri che, nelle ipotesi del Teorema 4.18, esistono riordinamenti che danno luogo a una serie indeterminata. Esercizio 4.24. Si dica per quali valori del parametro reale α la seguente serie converge 1− 1 1 1 1 1 + − α + − α + ... α 2 3 4 5 6 Esercizio 4.25. √ P n Mostrare che la serie ∞ n=1 (−1) / n + 1 converge, però il prodotto di questa serie con se stessa non converge. Esercizio 4.26. P P −n . Si calcoli Si calcoli il prodotto alla Cauchy della serie ∞ 2−n e lo si usi per calcolare ∞ n=1 n2 P∞ an=1 P∞ b n n il prodotto alla Cauchy delle due serie n=1 n! e n=1 n! , con a, b ∈ R. Esercizio 4.27. Si dica per quali α ≥ 0 la sommatoria X (n,m)∈N2 1 (n + m + 1)α converge. Esercizio 4.28 (Teorema di Goldbach–Eulero). F Sia P l’insieme di tutte le potenze perfette dei naturali: 4,8,9,16,25,27,. . . . Si provi che la serie P 1 n∈P n−1 è convergente ed ha somma 1. Esercizio 4.29. FF Dimostrare che la serie il cui termine n–esimo è il reciproco dell’n–esimo numero primo diverge. Indicato con π(n) il numero di numeri primi minori o uguali a n, si provi che π(n) = o(n) per n → ∞. Esercizio 4.30. P 2 2 Sapendo che ∞ n=1 1/n = π /6, si dimostri che ∞ X (−1)n−1 n=1 n2 = π2 . 12 9. ESERCIZI Esercizio 4.31. F Si provi che ∞ X (−1)n−1 n n=1 Esercizio 4.32. La serie 88 = log 2 . n(n+1) ∞ X (−1) 2 n=1 n è convergente? Esercizio 4.33. Pn Dimostrare che la successione delle somme parziali k=1 sin k è limitata e usare tale fatto per dedurre che la serie ∞ X sin n n n=1 è convergente. Esercizio 4.34. Q Data una successione an di numeri reali, si dice che il prodotto infinito ∞ n=0 an converge se lim n→∞ n Y k=0 ak = lim a0 a1 . . . an n→∞ esiste finito. Si dimostri che Q an = 1, • se ∞ n=0 an converge P ad un numero non zero, allora limQn→∞ ∞ • se an ≥ 1, la serie ∞ (a − 1) converge se e solo se a n=0 n n=0 n converge. CAPITOLO 5 SPAZIO EUCLIDEO Rn , SPAZI METRICI E FUNZIONI CONTINUE Da questo punto in poi diamo per noti: (1) (2) (3) (4) la struttura di Rn come spazio vettoriale; i fatti di base della teoria dei limiti di funzioni a valori reali in una variabile reale; la caratterizzazione del limite in un punto tramite successioni; il teorema della permanenza del segno. Nel seguito chiameremo intervallo di R ogni sottoinsieme non vuoto della forma (a, b), [a, b), (a, b] e [a, b], ammettendo nei casi in cui gli estremi non sono inclusi anche i valori a = −∞ e b = +∞ (in questo modo tutte le semirette e anche lo stesso insieme R sono intervalli). Daremo anche per noti i risultati di base della teoria delle funzioni continue, e in particolare: (1) il teorema dei valori intermedi (l’immagine tramite una funzione continua di un intervallo è un intervallo); (2) la nozione di continuità uniforme; (3) il teorema di Heine–Cantor (ogni funzione continua in un intervallo chiuso e limitato è uniformemente continua); (4) le relazioni tra monotonia e invertibilità per funzioni continue su un intervallo: (a) ogni funzione continua e iniettiva su un intervallo è monotona,1 (b) se una funzione monotona g definita su un intervallo ha come immagine un intervallo, allora è continua,2 (c) se I, J sono intervalli e f : I → J è continua e bigettiva, allora f −1 : J → I è continua.3 1. Struttura Euclidea di Rn : prodotto scalare, modulo e distanza Nello spazio Euclideo Rn , ma vedremo anche in altri spazi, è possibile dedurre dal prodotto scalare una nozione di lunghezza (modulo di un vettore) e, da questa, una nozione di distanza. Non sempre, come vedremo, questo percorso si può invertire: esistono nozioni di lunghezza non associate a prodotti scalari e distanze non associate a nozioni di lunghezza. Siano x = (x1 , x2 , . . . , xn ) , y = (y1 , y2 , . . . , yn ) due elementi, o punti o vettori, di Rn . 1Se ad esempio x < y < z, f (x) < f (y) e f (y) > f (z), basta scegliere ` compreso tra max{(x), f (z)} e f (y) e applicare il teorema dei valori intermedi in [x, y] e [y, z] per avere una contraddizione. 2Se avesse una discontinuità, necessariamente a salto, in un punto t, allora l’intervallo aperto avente come estremi i limiti destri e sinistri in t non sarebbe contenuto nell’immagine, che quindi non sarebbe un intervallo. 3Basta applicare (b) all’inversa di f , che è monotona per (a). 89 1. STRUTTURA EUCLIDEA DI Rn : PRODOTTO SCALARE, MODULO E DISTANZA 90 Definizione 5.1 (Prodotto scalare). Si chiama prodotto scalare tra x e y il numero reale x · y = x1 y1 + x2 y2 + · · · + xn yn . Si chiama modulo di x il numero non negativo q √ |x| = x · x = x21 + x22 + · · · + x2n . Le proprietà fondamentali del prodotto scalare sono le seguenti: • per ogni x, y ∈ Rn , x · y = y · x; • per ogni x, x0 , y ∈ Rn e λ ∈ R, (x + λx0 ) · y = x · y + λx0 · y; • per ogni x ∈ Rn , x · x ≥ 0 ed è uguale a 0 se e solo se x = 0. La seconda proprietà è la linearità nella prima componente. Per la prima proprietà, di simmetria, si ha anche linearità nella seconda componente. Una conseguenza importante e non ovvia di queste proprietà è la seguente disuguaglianza. Teorema 5.2 (Disuguaglianza di Cauchy–Schwarz). Per ogni x, y ∈ Rn , |x · y| ≤ |x| |y| , con uguaglianza se e solo se x e y sono linearmente dipendenti. Si noti che a primo membro compare il modulo (valore assoluto) di un numero reale, mentre i moduli a secondo membro sono moduli di vettori. Dimostrazione. Se almeno uno tra x e y è il vettore nullo, si hanno l’uguaglianza 0 = 0 e la lineare dipendenza, in coerenza con quanto enunciato. Supponiamo allora che x e y siano entrambi diversi da 0. Si consideri, al variare di λ in R, il prodotto scalare p(λ) = (x + λy) · (x + λy) = x · (x + λy) + λ y · (x + λy) = (x + λy) · x + λ (x + λy) · y = |x|2 + 2λx · y + λ2 |y|2 . Si osservi che p(λ) è un polinomio di secondo grado in λ, sempre non negativo su R. Quindi il suo discriminante, ∆ = 4 (x · y)2 − |x|2 |y|2 deve essere minore o uguale a 0, cioè (x · y)2 ≤ |x|2 |y|2 . Estraendo le radici quadrate positive di ambo i membri, si ottiene la disuguaglianza di Cauchy– Schwarz. Si noti poi che vale l’uguaglianza se e solo se ∆ = 0, e dunque se e solo se esiste λ0 ∈ R per cui p(λ0 ) = 0. Ma questo equivale a dire che x + λ0 y = 0, e dunque che x e y sono linearmente dipendenti. Corollario 5.3. Il modulo in Rn soddisfa la disuguaglianza triangolare |x + y| ≤ |x| + |y| , con uguaglianza se e solo se esiste λ ≥ 0 per cui x = λy oppure y = λx. 1. STRUTTURA EUCLIDEA DI Rn : PRODOTTO SCALARE, MODULO E DISTANZA 91 Dimostrazione. Per la disuguaglianza di Cauchy–Schwarz si ha |x + y|2 = (x + y) · (x + y) = |x|2 + 2x · y + |y|2 ≤ |x|2 + 2|x · y| + |y|2 ≤ |x|2 + 2|x| |y| + |y|2 2 = |x| + |y| . Questo dimostra la disuguaglianza. Per avere l’uguaglianza, devono valere le due condizioni x·y ≥ 0 e |x · y| = |x| |y|. Per il Teorema 5.2, x e y devono essere linearmente dipendenti, e inoltre la condizione x · y ≥ 0 implica che la costante di proporzionalità tra le loro componenti deve essere non negativa. Siano x, y elementi non nulli di Rn . Essendo −1 ≤ x·y ≤1, |x||y| esiste uno e uno solo θ ∈ [0, π] tale che x · y = |x||y| cos θ . Si dice che θ è l’angolo compreso tra x e y. Due elementi x, y di Rn si dicono ortogonali se x · y = 0. A questo punto elenchiamo le proprietà fondamentali del modulo: • per ogni x ∈ Rn , |x| ≥ 0, e |x| = 0 se e solo se x = 0; • per ogni x ∈ Rn e λ ∈ R, |λx| = |λ||x|; • per ogni x, y ∈ Rn , |x + y| ≤ |x| + |y|. Definizione 5.4. Si chiama distanza euclidea su Rn la funzione d : Rn × Rn −→ [0, +∞) data da d(x, y) = |x − y| . Dalle proprietà del modulo si deducono le seguenti proprietà della distanza: • • • • per per per per ogni ogni ogni ogni x, x, x, x, y ∈ Rn , d(x, y) = 0 se e solo se x = y; y ∈ Rn , d(y, x) = d(x, y); y ∈ Rn e λ ∈ R, d(λx, λy) = |λ|d(x, y); y, z ∈ Rn , d(x, z) ≤ d(x, y) + d(y, z) (disuguaglianza triangolare). Dalla proprietà triangolare si deduce facilmente che d(x, z) − d(y, z) ≤ d(x, y) . (1.1) ∀ x, y, z ∈ Rn , Dati tre punti x, y, z nel piano R2 , le tre distanze d(x, y), d(x, z), d(y, z) rappresentano le lunghezze dei lati del triangolo (possibilmente degenere) di vertici x, y, z. La disuguaglianza triangolare dice che la lunghezza di un lato è minore o uguale della somma delle altre due, mentre la disuguaglianza (1.1) dice che la lunghezza di un lato è maggiore o uguale della differenza delle altre due. Questa proprietà si estende dunque a triangoli in spazi di dimensione superiore. 2. INSIEMI APERTI E CHIUSI DI Rn , PARTE INTERNA, CHIUSURA, FRONTIERA 92 2. Insiemi aperti e chiusi di Rn , parte interna, chiusura, frontiera In questo paragrafo e nei due seguenti elenchiamo le nozioni principali relative alla topologia4 di Rn , presentando le principali relazioni tra di esse. Si chiama palla aperta di centro x0 e raggio r > 0 in Rn l’insieme Br (x0 ) = {x ∈ Rn : d(x, x0 ) < r} . Indicheremo anche con B r (x0 ) la palla chiusa {x ∈ Rn : d(x, x0 ) ≤ r}. Notiamo che la proprietà triangolare della distanza ha delle conseguenze in termini di inclusioni di palle (si veda la formula (2.2) più avanti) e di intersezioni: se due palle aperte (risp. chiuse) hanno intersezione non vuota allora la distanza dei centri è strettamente minore (risp. minore o uguale) della somma dei raggi. 2.1. Insiemi aperti e chiusi. Definizione 5.5 (Insiemi aperti). Un sottoinsieme A di Rn si dice aperto se è unione di una famiglia (possibilmente vuota) di palle aperte. Si noti che, in particolare, l’insieme vuoto è aperto, cosı̀ come le palle aperte (si prendere la famiglia costituita da un solo elemento). Questa definizione si può formulare, in modo equivalente, come segue: (2.1) ∀ x0 ∈ A ∃ r > 0 : Br (x0 ) ⊆ A . Infatti, se vale la (2.1) è evidente che A è unione di una famiglia di palle aperte. Viceversa, possiamo verificare che per ogni punto x contenuto in una palla aperta B esiste una palla B 0 centrata in x e contenuta in B, per la disuguaglianza triangolare vale infatti (2.2) Br−d(x,x0 ) (x) ⊆ Br (x0 ) per ogni x ∈ Br (x0 ) . Grazie a questa considerazione possiamo verificare che ogni insieme aperto soddisfa la condizione (2.1), visto che questa è soddisfatta dalle palle aperte. Non tutti i sottoinsiemi di Rn sono aperti. Per esempio, un insieme costituito da un unico punto x0 non può contenere nessuna palla di centro x0 . Per esercizio, si dimostri che la palla chiusa B 1 (0) non è aperta. La seguente proposizione segue subito dalla formula (2.1). Proposizione 5.6 (Stabilità degli insiemi aperti). La famiglia degli insieme aperti di Rn gode delle seguenti proprietà: (i) Ø e Rn sono aperti; (ii) l’unione di una qualsiasi famiglia di aperti è aperta; (iii) l’intersezione di una famiglia finita di aperti è aperta. Definizione 5.7 (Insiemi chiusi di Rn ). Un sottoinsieme di Rn si dice chiuso se il suo complementare è aperto. Usando le formule di De Morgan, si dimostra facilmente il seguente enunciato. Proposizione 5.8 (Stabilità degli insiemi chiusi). La famiglia degli insiemi chiusi di Rn gode delle seguenti proprietà: (i) Ø e Rn sono chiusi; (ii) l’intersezione di una qualsiasi famiglia di insiemi chiusi è chiusa; 4Il significato di questo termine verrà chiarito nell’Osservazione 5.35. 2. INSIEMI APERTI E CHIUSI DI Rn , PARTE INTERNA, CHIUSURA, FRONTIERA 93 (iii) l’unione di una famiglia finita di insiemi chiusi è chiusa. Si mostri per esercizio che le palle chiuse B r (x0 ) sono, per l’appunto, chiuse. Si noti anche che Ø e Rn sono sia aperti che chiusi, mentre esistono insiemi che non sono né aperti né chiusi: per esempio, in R, gli intervalli semiaperti [a, b), (a, b] con a < b. 2.2. Parte interna, chiusura e frontiera di un insieme. Definizione 5.9 (Parte interna). Dato E ⊆ Rn , indicheremo con E̊ la parte interna di E, ovvero il più grande aperto contenuto in E. Per le proprietà di stabilità degli insiemi aperti, la definizione di parte interna è ben posta e un insieme E è aperto se e solo se E̊ = E. La seguente proposizione dà una caratterizzazione più operativa della parte interna. Proposizione 5.10. Per ogni insieme E ⊆ Rn non vuoto vale ◦ (2.3) E = x ∈ E : esiste r > 0 tale che Br (x) ⊆ E . Dimostrazione. Se x0 ∈ E̊, dato che E̊ è aperto esiste una palla Br (x0 ) tale che Br (x0 ) ⊆ E̊. Quindi a maggior ragione Br (x0 ) ⊆ E e abbiamo stabilito l’inclusione ⊆ nell’uguaglianza (2.3). Viceversa, l’insieme A a destra nella (2.3) è contenuto in E ed è aperto. Infatti, se x ∈ A e Br (x) ⊆ E allora Br/2 (y) ⊆ Br (x) ⊆ E per ogni y ∈ Br/2 (x), quindi Br/2 (x) ⊂ A. Quindi la massimalità di E̊ implica l’uguaglianza cercata. Definizione 5.11 (Chiusura). Dato un insieme E ⊆ Rn , indicheremo con E il più piccolo chiuso contenente E. Per le proprietà degli insiemi chiusi, la definizione è ben posta. Inoltre, per passaggio al complementare abbiamo le relazioni ◦ Rn \ E = Rn \ E , ◦ Rn \ E = Rn \ E . Con la formula (2.3), si verifichi per esercizio che la parte interna della palla chiusa è la palla aperta. Si mostri anche che per A aperto e E chiuso valgono rispettivamente le inclusioni ◦ A⊇A, ◦ E⊆E , e che, in generale, non sono uguaglianze. Per poter dare una caratterizzazione più operativa della chiusura, chiameremo un punto x0 ∈ E aderente a E se vale ∀ r > 0 , E ∩ Br (x0 ) 6= Ø . Ovviamente gli elementi di E sono tutti aderenti a E, ma potrebbero essercene altri. Per esempio, un qualunque punto della palla chiusa B r (x0 ) è aderente all’insieme E = Br (x0 ). Sempre per passaggio al complementare, dalla uguaglianza (2.3) deduciamo la seguente proposizione. Proposizione 5.12. Dato E ⊆ Rn , E è l’insieme dei punti aderenti ad E. Con questo criterio, si verifichi per esercizio che la chiusura della palla aperta è la palla chiusa. Più in generale possiamo dare la seguente definizione. 2. INSIEMI APERTI E CHIUSI DI Rn , PARTE INTERNA, CHIUSURA, FRONTIERA 94 Definizione 5.13 (Insieme denso). Sia E ⊆ Rn un insieme, e sia E 0 un suo sottoinsieme. Si dice che E 0 è denso in E se E 0 ⊇ E, equivalentemente se per ogni x ∈ E e per ogni r > 0 l’intersezione Br (x) ∩ E 0 non è vuota. Esempio. Qn è denso in Rn , basta infatti scegliere per ogni x ∈ Rn e per ogni r > 0 razionali qi tali che |xi − qi | < /n, ottenendo cosı́ |x − q| < per q = (q1 , . . . , qn ). Definizione 5.14 (Frontiera). L’insieme ◦ ∂E = E \ E = E ∩ Rn \ E si chiama frontiera di E. Osserviamo che ∂E = ∂(Rn \ E). Ad esempio, la frontiera della palla aperta (o anche della palla chiusa) è la sfera Sr (x0 ) := x ∈ Rn : d(x, x0 ) = r . Tuttavia, la frontiera di un insieme piccolo può anche essere molto grande: ad esempio la frontiera di Qn è Rn . 2.3. Punti di accumulazione, punti isolati e derivato di un insieme. Definizione 5.15 (Punti di accumulazione e isolati). Un punto x0 ∈ Rn è di accumulazione per l’insieme E se ∀ r > 0 , E ∩ Br (x0 ) \ {x0 } 6= Ø . L’insieme dei punti di accumulazione per E si chiama insieme derivato di E e si indica con D(E). Un punto x0 di E si dice isolato in E se ∃ r > 0 : E ∩ Br (x0 ) \ {x0 } = Ø . Si noti, nella definizione di D(E), la differenza con la nozione di punto aderente, a causa del fatto che x0 viene escluso nell’intersezione. Chiaramente valgono le seguenti proprietà: • i punti di accumulazione per E sono aderenti a E, i.e. D(E) ⊆ E; • i punti aderenti a E che non siano in E sono di accumulazione per E, i.e. E = E ∪ D(E); • ogni punto di E è di accumulazione per E o isolato in E. Esempio. In R, sia E = n1 : n ∈ N∗ . Tutti i punti di E sono isolati in E, ed E ha un unico punto di accumulazione, l’origine, che non appartiene a E. Si noti che Ø = D(D(E)) ( D(E) ( E. Proposizione 5.16. L’insieme derivato di un insieme E è un sottoinsieme chiuso di E. Dimostrazione. Dimostriamo che Rn \ D(E) è aperto. Se x0 6∈ D(E), esiste r > 0 tale che Br (x0 ) \ {x0 } è disgiunto da E. Se x0 ∈ / E deduciamo che Br (x0 ) ∩ E = Ø e quindi che nessun punto di Br (x0 ) può essere di accumulazione per E, i.e. Br (x0 ) ⊂ Rn \ D(E). Se x0 ∈ E allora x0 è un punto isolato in E e vale la stessa conclusione. 3. SUCCESSIONI A VALORI IN Rn 95 3. Successioni a valori in Rn Sia a : N −→ Rn una successione di punti di Rn , che indicheremo con l’abituale simbolo (ak ). D’ora in poi, con lieve abuso di notazione, scriveremo anche (ak ) ⊆ E per dire che la successione prende i suoi valori nell’insieme E. Definizione 5.17. Si dice che ` ∈ Rn è limite della successione (ak ) se, per ogni ε > 0, esiste k0 ∈ N tale che, per ogni k ≥ k0 , d(ak , `) < ε. È immediato verificare che il limite, se esiste, è unico. Infatti d(ak , `) < ε e d(ak , `0 ) < ε con 2ε ∈ (0, d(`, `0 )) contraddice la disuguaglianza triangolare d(`, `0 ) ≤ d(`, ak ) + d(ak , `0 ) < ε + ε < d(`, `0 ) . Sempre usando la disuguaglianza triangolare, si mostra subito che ogni successione convergente è limitata, i.e. contenuta in una palla (e, sempre per la disuguaglianza triangolare, il centro della palla può essere scelto arbitrariamente, pur di aumentare il raggio). Altre formulazioni equivalenti della convergenza sono: ` è limite della successione se, per ogni ε > 0, i punti ak sono definitivamente contenuti nella palla Bε (`), o anche lim ak = ` ⇐⇒ lim d(ak , `) = 0 , (3.1) k→∞ k→∞ dove il limite a secondo membro riguarda una successione di numeri reali. Da questo (o anche da una verifica diretta) si può dedurre che anche questa nozione di limite è stabile per passaggio a sottosuccessioni. Vediamo ora due proprietà importanti dei limiti in Rn . Proposizione 5.18 (Convergenza dei moduli e delle distanze). Se limk ak = `, allora limk |ak | = |`|. Più in generale, limk d(ak , b) = d(`, b) per ogni b ∈ Rn . Dimostrazione. Per la disuguaglianza (1.1) si ha 0 ≤ |ak | − |`| = d(ak , 0) − d(`, 0) ≤ d(ak , `) . Per la (3.1), limk |ak | − |`| = 0, da cui la tesi. Lo stesso ragionamento, sostituendo l’origine con un qualsiasi altro punto b fissato, dà l’enunciato più generale. P D’ora in poi useremo spesso le disuguaglianze elementari maxi |xi | ≤ |x| ≤ i |xi |. Proposizione 5.19 (Convergenza componente per componente). Posto ak = (a1k , a2k , . . . , ank ) e ` = (`1 , `2 , . . . , `n ), si ha l’equivalenza lim ak = ` k→∞ ⇐⇒ ∀ j = 1, . . . , n , lim aj k→∞ k = `j . Dimostrazione. Se limk ak = `, dato che |ajk − `j | ≤ |ak − `| per ogni j = 1, . . . , n, per confronto deduciamo la convergenza delle componenti. L’altra implicazione segue da |a − `| ≤ n X |aj − `j | j=1 con a = ak . 3. SUCCESSIONI A VALORI IN Rn 96 La Proposizione 5.19 consente di ridurre lo studio di una successione di punti di Rn allo studio di n successioni numeriche. Questo è utile per estendere a questa classe di successioni il criterio di convergenza di Cauchy e il teorema di Bolzano–Weierstrass.5 Proposizione 5.20 (Criterio di convergenza di Cauchy). Una successione (ak ) in Rn converge se e solo se è di Cauchy, vale a dire per ogni ε > 0 esiste k0 ∈ N tale che d(ak , ak0 ) < ε per ogni k, k 0 ≥ k0 . Teorema 5.21 (Bolzano–Weierstrass). Ogni successione limitata (ak ) in Rn ha una sottosuccessione convergente. Dimostrazione. Estraiamo una prima sottosuccessione s1 : N → N in modo tale che (a1s1 (k) ) converga a un limite `1 . Dalla successione (as1 (k) ) possiamo estrarre un’altra sottosuccessione s2 : N → N in modo tale che (a2s1 (s2 (k)) ) converga a un limite `2 . Si noti che, essendo (a1s1 (s2 (k)) ) una sottosuccessione di (a1s1 (k) ), questa continua a convergere a `1 . In sostanza, la prima e la seconda componente di (as1 (s2 (k)) ) convergono. Se n > 2, proseguendo cosı̀ per altri n − 2 passi si guadagna la convergenza di tutte le componenti. Posto ` = (`1 , . . . , `n ), la sottosuccessione as1 (s2 (s3 (···sn (k)··· ))) converge a ` grazie alla Proposizione 5.19. Sempre ragionando componente per componente, non è difficile mostrare le seguenti proprietà: (1) se due successioni (ak ), (bk ) a valori in Rn sono convergenti, rispettivamente a ` e `0 , allora lim (ak + bk ) = ` + `0 ; k→∞ (2) se due successioni (ak ) a valori in Rn e (λk ) a valori in R sono convergenti, rispettivamente a ` e λ, allora lim λk ak = λ` ; k→∞ (3) se due successioni (ak ), (bk ) a valori in C sono convergenti6, rispettivamente a ` e `0 , allora lim ak bk = ``0 ; k→∞ (4) vale il teorema di convergenza assoluta per serie di elementi di Rn :7 ∞ X |ak | converge =⇒ k=0 ∞ X ak converge , k=0 e in questo caso (3.2) ∞ ∞ X X |ak |. ak ≤ k=0 k=0 Si noti però che la stima (3.2) non si deduce ragionando P componente per componente (almeno se si usano le disuguaglianze maxi |xi | ≤ |x| ≤ i |xi |). Bisogna prima osservare 5È un utile esercizio cercare di dimostrare il teorema di Bolzano–Weierstrass attraverso un metodo di bisezione, senza ragionare componente per componente. 6Le successioni di numeri complessi vengono considerate come a valori in R2 , con componenti (<e a , =m a ). k k 7Per serie di vettori di Rn la convergenza va intesa componente per componente o, equivalentemente, come convergenza in Rn delle somme parziali da 0 a N . 4. CARATTERIZZAZIONE PER SUCCESSIONI DELLA CHIUSURA E DEL DERIVATO DI UN INSIEME 97 che, per passaggio al limite per N → ∞ nelle somme parziali da 0 a N , la serie commuta con il prodotto scalare: ∞ ∞ X X h ak , vi = hak , vi ∀v ∈ Rn . k=0 k=0 P Poi, se k ak 6= 0, prendendo come v il vettore unitario S/|S| e stimando il membro di destra con la disuguaglianza di Schwarz si ha la tesi. Osservazione 5.22. In dimensione n ≥ 2 il “limite infinito” si intende come segue: lim ak = ∞ ⇐⇒ lim |ak | = +∞ . k→∞ k→∞ Ovviamente, relativamente a successioni di punti di Rn con n ≥ 2, i simboli ±∞ non hanno senso. La distinzione tra un “infinito positivo” e un “infinito negativo” è strettamente legata all’ordinamento di R. 4. Caratterizzazione per successioni della chiusura e del derivato di un insieme Il seguente teorema mostra che possiamo caratterizzare mediante successioni la chiusura di un insieme e l’insieme dei suoi punti di accumulazione. Teorema 5.23. (i) Un punto x0 ∈ Rn è aderente a un insieme E se e solo se esiste una successione (ak ) tale che ak ∈ E per ogni k e limk ak = x0 . (ii) Un punto x0 ∈ Rn è di accumulazione per un insieme E se e solo se esiste una successione (ak ) tale che ak ∈ E \ {x0 } per ogni k e limk ak = x0 . (iii) Un insieme E è chiuso se e solo se è chiuso per successioni, vale a dire, per ogni successione (ak ) di elementi di E convergente a un limite `, anche ` ∈ E. Dimostrazione. Dimostriamo solo l’enunciato (i), le altre dimostrazioni essendo analoghe o facilmente deducibili da questa. Se x0 ∈ E, per ogni k ≥ 1, esiste un punto ak ∈ B1/k (x0 ) ∩ E. Essendo |ak − x0 | < 1/k, la successione (ak ) converge a x0 . Viceversa, se x0 = limk ak , con ak ∈ E per ogni k, dato r > 0, gli ak sono definitivamente in Br (x0 ). Quindi E ∩ Bx0 ,r non è vuoto, e dunque x0 è aderente a E. In termini di successioni si dà anche la nozione di sottoinsieme compatto di Rn . Definizione 5.24 (Compatti in Rn ). Un sottoinsieme E di Rn si dice compatto se, data comunque una successione (ak ) di elementi di E, esiste una sua sottosuccessione (ak(p) ) convergente a un elemento di E. Come nel caso n = 1, si ha la seguente caratterizzazione dei sottoinsiemi compatti di Rn . Teorema 5.25. Un sottoinsieme di Rn è compatto se e solo se è chiuso e limitato (i.e. contenuto in una palla). Dimostrazione. Sia E compatto. Se E non fosse limitato, esisterebbe una successione (ak ) di punti di E con limk |ak | = +∞. D’altra parte, esisterebbe anche una sottosuccessione (ak(p) ) convergente a ` ∈ E. Ma questo è assurdo per la Proposizione 5.18. Sia ora x0 ∈ E. Per il Teorema 5.23, esiste una successione (ak ) di punti di E convergente a x0 . Allora esiste una 5. PUNTI LIMITE DI UNA SUCCESSIONE 98 sottosuccessione (akp ) convergente a un elemento di E, ma grazie alla permanenza del limite questo deve essere x0 . Dunque x0 ∈ E ed E è chiuso. Viceversa, sia E chiuso e limitato, e sia (ak ) una successione di punti di E. Per il teorema di Bolzano–Weierstrass in Rn (Teorema 5.21), esiste una sottosuccessione (ak(p) ) convergente a un limite ` ∈ Rn . Dato che E è chiuso, ` ∈ E. Quindi E è compatto. 5. Punti limite di una successione Definizione 5.26. Sia (ak ) una successione a valori in Rn . Si dice che x ∈ Rn è un punto limite della successione se esiste una sottosuccessione (ak(p) ) convergente a x. Le seguenti proprietà sono evidenti o di facile verifica: • una successione (ak ) non ha punti limite se e solo se limk |ak | = +∞ (Teorema di Bolzano– Weierstrass), equivalentemente una successione (ak ) ha punti limite se e solo se lim inf k |ak | < +∞; • una successione limitata (ak ) ha un unico punto limite x se e solo se limk ak = x. Infatti una implicazione è ovvia, per la stabilità del limite rispetto a sottosuccessioni. Viceversa, se (ak ) ha un unico punto limite x, se supponiamo per assurdo che (ak ) non tenda a x troviamo ε > 0 tale che |ak −x| > per infiniti indici k. Usando questi indici per costruire una sottosuccessione convergence, troviamo un punto limite necessariamente diverso da x. Proposizione 5.27. Data una successione (ak ), sia Ek = {ak0 : k 0 ≥ k}. Allora l’insieme L dei punti limite della successione è uguale a \ Ek . k∈N In particolare, L è chiuso. Si noti che Ek+1 ⊆ Ek per ogni k e che la stessa relazione vale per le chiusure. Dimostrazione. Sia x un punto limite, x = limp ak(p) . Dato che k(p) ≥ k definitivamente, x è limite di T una successione di elementi di Ek , da cui segue che x ∈ E k . Abbiamo quindi mostrato che L ⊆ k E k . Viceversa, se x ∈ ∩k E k , per ogni m ∈ N e ogni p ∈ N \ {0} esiste k > m tale che ak ∈ B1/p (x). Si scelga allora induttivamente k0 tale che xk(0) ∈ B1 (x) , k(p + 1) > k(p) tale che ak(p+1) ∈ B1/(p+1) (x) . La sottosuccessione (ak(p) ) converge allora a x. La Proposizione 5.27 mostra che per ogni successione a valori in un insieme E l’insieme dei punti limite è un sottoinsieme chiuso di E. Mostriamo ora che questa inclusione, in generale, non può essere migliorata. Teorema 5.28. Sia E un sottoinsieme chiuso non vuoto di Rn . Esiste allora una successione (ak ) di elementi di E avente E come insieme dei suoi punti limite. 6. SPAZI METRICI 99 Dimostrazione. Sia q : N → Qn una numerazione dei punti a coordinate razionali di Rn . Per ogni k ∈ N scegliamo un elemento xk ∈ E che quasi minimizza la distanza in E da qk , i.e. tale che8 1 |xk − qk | < inf |y − qk | + y∈E k (se qk ∈ E si può prendere xk = qk ). Mostriamo che la successione (xk ) ha la proprietà richiesta. Dato x ∈ E, per la densità di Qn in Rn esiste una successione (qk(p) ) ⊆ Qn convergente a x. La corrispondente successione (xk(p) ) è costituita da elementi di E e, per come sono stati scelti xk , soddisfa 1 1 ≤ |x − qk(p) | + . |xk(p) − qk(p) | < inf |y − qk(p) | + y∈E k(p) k(p) Dunque anche (xk(p) ) converge a x. 6. Spazi metrici Molte delle proprietà descritte nei paragrafi precedenti non dipendono da proprietà specifiche della distanza euclidea, ma solo da tre proprietà di base che, assiomatizzate, conducono alle nozioni astratte di distanza e di spazio metrico. 6.1. Distanze, spazi metrici, esempi. Definizione 5.29 (Distanza e spazio metrico). Si chiama distanza9 su un insieme X una funzione d : X × X −→ [0, +∞) che soddisfi le seguenti proprietà: (i) (non degenerazione) d(x, y) = 0 se e solo se x = y; (ii) (simmetria) per ogni x, y ∈ X vale d(x, y) = d(y, x); (iii) (disuguaglianza triangolare) per ogni x, y, z ∈ X vale d(x, z) ≤ d(x, y) + d(y, z). Uno spazio metrico è una coppia (X, d), dove d è una distanza sull’insieme X. Si noti che su un insieme X possono essere definite diverse distanze, come illustrato dagli esempi seguenti, per questo lo spazio metrico va inteso come coppia (X, d). Se (X, d) è uno spazio metrico e Y ⊆ X, si chiama distanza indotta da X su Y la distanza d|Y ×Y . Elenchiamo ora una serie di concetti e di risultati che si estendono, praticamente senza alcuna modifica nelle dimostrazioni10, quando a Rn munito della distanza euclidea sostituiamo un generico spazio metrico (X, d): • palle aperte Br (x) e chiuse B r (x), insiemi aperti e chiusi, Br (x) è aperto, B r (x) è un chiuso;11 • parte interna, chiusura, insieme denso, frontiera, punti di accumulazione e isolati; • per le successioni x : N → X, unicità e permanenza del limite rispetto a sottosuccessioni, convergenza delle distanze da un punto di X fissato, le successioni convergenti sono limitate e di Cauchy; • caratterizzazione per successioni della chiusura e del derivato di un insieme. 8In effetti si potrebbe anche mostrare che l’inf è raggiunto, usando il teorema di Bolzano-Weierstrass. Lo si mostri per esercizio. 9Le distanze sono a volte anche chiamate metriche, ma in Geometria Riemanniana la parola metrica ha un significato diverso, quindi non useremo mai questo termine. Nonostante questo, la terminologia “spazi metrici” è troppo consolidata per non doverla adottare, anche se alcuni puristi chiamano questi spazi “spazi di distanza”. 10Proprio per questo, in tutte le dimostrazioni dei fatti citati, abbiamo sempre usato d(x, y) e non |x − y|. 11In generale, la chiusura di B (x) potrebbe essere un sottoinsieme proprio di B (x), B (x) potrebbe essere un r r r ˚ (x), le palle potrebbero essere contemporaneamente aperte e chiuse. sottoinsieme proprio di B r 6. SPAZI METRICI 100 Si noti che mancano dall’elenco il criterio di convergenza di Cauchy, che può non valere (si prenda X = Q con la distanza euclidea indotta), cosı̀ come il teorema di Bolzano–Weierstrass (si prenda X = (0, 1) con la distanza euclidea indotta). Esempi. (1). Oltre alla distanza euclidea, su Rn sono interessanti le seguenti distanze: 1/p dp (x, y) = |x1 − y1 |p + · · · + |xn − yn |p dove 1 ≤ p < +∞ e d∞ (x, y) = max |xk − yk | . 1≤k≤n Le proprietà (i) e (ii) sono ovvie. La proprietà triangolare (iii) è di semplice verifica per d1 e d∞ , ed è stata dimostrata per la distanza euclidea d2 . Per p generico, la verifica è più complessa e viene qui tralasciata. (2). Su un qualunque insieme X, ( 0 se x = y d(x, y) = 1 se x 6= y , è una distanza, nota come distanza discreta (le cui palle aperte sono punti o tutto lo spazio, a seconda che r ≤ 1 o r > 1). (3). (distanza p–adica su Q) Ogni numero razionale x 6= 0 si scompone in modo unico come prodotto (6.1) mk 1 m2 x = ±pm 1 p2 · · · pk , dove p1 < p2 < · · · < pk sono numeri primi e gli mj interi relativi. Fissato un numero primo p, si definisce il valore assoluto p–adico di x ∈ Q come ( 0 se x = 0 |x|p = p−m se pm è il fattore con base p nella scomposizione (6.1) . Si verifica facilmente che |x + y|p ≤ max |x|p , |y|p per ogni x, y ∈ Q. Da questo segue che dp (x, y) = |x − y|p è una distanza su Q. In realtà vale una proprietà più forte della disuguaglianza triangolare, cioè dp (x, z) ≤ max dp (x, y), dp (y, z) , ∀ x, y, z ∈ Q . (4). Si consideri l’insieme R, detto retta reale estesa, ottenuto aggiungendo a R due elementi, che indichiamo con −∞ e +∞: R = R ∪ {−∞, +∞} . Su R è possibile definire la distanza (con le convenzioni arctan ± ∞ = ±π/2): (6.2) δ(x, y) := arctan x − arctan y x, y ∈ R . Si verifichi per esercizio che le successioni di R aventi limite, finito o infinito, convergono in R. Da questo, usando il teorema di Bolzano–Weierstrass (o la caratterizzazione variazionale del massimo e del minimo limite), si deduca che ogni successione (xn ) ⊂ R ha una sottosuccessione convergente rispetto alla distanza δ. (5). Se (X, dX ) e (Y, dY ) sono spazi metrici, la distanza prodotto è definita da q d (x, y), (x0 , y 0 ) := d2X (x, x0 ) + d2Y (y, y 0 ) (x, y), (x0 , y 0 ) ∈ X × Y . 6. SPAZI METRICI 101 Si noti che se tutti i fattori sono uguali a R con la distanza euclidea, ripetendo n volte questa costruzione si ottiene proprio la distanza d2 euclidea in Rn+1 . (6). Sulla sfera S1 (0) di Rn possiamo definire δ(x, y) = θ(x, y), ove θ ∈ [0, π] è l’angolo tra i vettori x e y. Si verifichi che è una distanza, detta distanza geodetica. Si noti che la distanza geodetica è più grande di quella indotta dalla distanza euclidea, se consideriamo la sfera come un sottoinsieme di Rn . (7). Dato I ⊆ R, lo spazio vettoriale C(I) delle funzioni continue da I in R, munito della distanza “del sup” d(f, g) := sup |f (x) − g(x)| f, g ∈ C(I) x∈I è uno spazio metrico. Più in generale, la stessa distanza ha senso anche nello spazio vettoriale delle funzioni limitate su I. (8). Sia N ∈ N∗ . Nell’insieme {0, 1}N delle stringhe binarie di lunghezza N la distanza di Hamming è definita da 1 d (a1 , . . . , aN ), (b1 , . . . , bN ) = card {i : ai 6= bi } . N Per funzioni tra spazi metrici si adotta la seguente terminologia. Definizione 5.30 (Isometrie, funzioni Lipschitziane e contrazioni). Siano (X, d), (X 0 , d0 ) spazi metrici e sia f : X −→ X 0 una funzione. (i) Si dice che f è una isometria di X sulla sua immagine f (X) ⊆ X 0 se d0 f (x), f (y) = d(x, y) , ∀ x, y ∈ X . (ii) Si dice che f è Lipschitziana se esiste una costante reale L ≥ 0 tale che (6.3) d0 f (x), f (y) ≤ Ld(x, y) , ∀ x, y ∈ X . (iii) Si dice che f è una contrazione se è Lipschitziana con costante L ≤ 1, una contrazione stretta se L < 1. Ad esempio le rotazioni di Rn sono isometrie, mentre le trasformazioni qPaffini x 7→ Ax + c con n 2 c ∈ R e A = (aij ) matrici n × n sono Lipschitziane, con costante L = ij aij . Un altro esempio interessante è la mappa (intendendo naturalmente l’angolo in radianti) θ ∈ R 7→ (cos θ, sin θ) ∈ S1 (0) che è una isometria, se ristretta a intervalli di lunghezza inferiore a π, tra l’intervallo e la sfera S1 (0) di R2 , munita della distanza geodetica. Si noti che le isometrie sono iniettive, grazie all’assioma di non degenerazione, e che la composizione di funzioni Lipschitziane (risp. contrazioni) è Lipschitziana (risp. una contrazione). Due spazi metrici (X, d), (X 0 , d0 ) si dicono isometrici se esiste una isometria surgettiva (quindi una bigezione) di X in X 0 , mentre due distanze d1 e d2 nello stesso insieme X si dicono bi–Lipschitz equivalenti se la mappa identità ι : (X, d1 ) −→ (X, d2 ) è Lipschitziana con inversa Lipschitziana, in termini equivalenti (6.4) cd1 (x, y) ≤ d2 (x, y) ≤ Cd1 (x, y) ∀x, y ∈ X per opportune costanti positive c, C. Si osservi che la traduzione geometrica delle disuguaglianze (6.4) è (indicando con Brdi (x) la palla relativa alla distanza di ) d1 d1 Br/C (x) ⊆ Brd2 (x) ⊆ Br/c (x) ∀x ∈ X, r > 0. 6. SPAZI METRICI 102 Da questo si deduce subito che tutte le nozioni che abbiamo elencato prima (convergenza di successioni, insiemi aperti e chiusi, parte interna, chiusura) ed altre che discuteremo più avanti (continuità, uniforme continuità, completezza, compattezza, connessione) sono invarianti nella classe di bi–Lipschitz equivalenza, i.e. se una proprietà vale per una distanza, vale per tutte le distanze bi–Lipschitz equivalenti ad essa. Esempi. 1. Le distanze d1 , d2 , d∞ su Rn sono a due a due bi–Lipschitz equivalenti. Questo segue dalle disuguaglianze d∞ (x, y) ≤ d2 (x, y) ≤ d1 (x, y) ≤ nd∞ (x, y) , tutte facilmente verificabili (con ragionamenti simili si mostra che tutte le distanze dp , 1 ≤ p ≤ ∞, sono a due a due equivalenti). Più in generale, dati spazi metrici (X, dX ) e (Y, dY ), le distanze max{dX (x, x0 ), dY (y, y 0 )} , dX (x, x0 ) + dY (y, y 0 ) sono bi–Lipschitz equivalenti alla distanza prodotto. 2. Per ogni intervallo limitato I ⊂ R, la distanza euclidea deu e la distanza δ nella (6.2), indotta dall’inclusione in R, sono bi–Lipschitz equivalenti. Non lo sono, tuttavia, su tutto l’insieme R: più precisamente, la distanza euclidea maggiora d (quindi ι : (R, deu ) → (R, δ) è una contrazione, non stretta) ma non esiste nessuna costante C tale che deu (x, y) ≤ Cδ(x, y), perchè δ è limitata). 3. Si verifichi per esercizio che nessuna distanza p–adica su Q è bi–Lipschitz equivalente alla distanza euclidea (indotta da R). 4. Nello spazio {0, 1}N delle stringhe binarie di lunghezza N , ogni trasformazione indotta da una permutazione degli indici 1, . . . , N è una isometria. La trasformazione che manda la stringa (i1 , . . . , iN ) nella stringa (1 − i1 , . . . , 1 − iN ) è anch’essa una isometria. 6.2. Limiti e funzioni continue tra spazi metrici. Le nozioni di limite, continuità, continuità in un punto di una funzione tra spazi metrici si possono definire, in perfetta analogia con il caso di variabile reale, come segue. Definizione 5.31 (Limite e continuità in un punto). Siano (X, dX ), (Y, dY ) spazi metrici, E ⊆ X e f : E −→ Y . Sia inoltre x0 un punto di accumulazione di E in X. Si pone lim f (x) = x→x0 ` ∈ Y se ∀ε > 0 ∃δ > 0 : x ∈ E ∧ 0 < dX (x, x0 ) < δ ⇒ dY (f (x), `) < ε . Se x0 ∈ E, si dice che f è continua in x0 se lim f (x) = f (x0 ), in termini equivalenti x→x0 ∀ε > 0 ∃δ > 0 : x ∈ E ∧ dX (x, x0 ) < δ ⇒ dY (f (x), f (x0 )) < ε . Usando le palle, possiamo esprimere in maniera più sintetica le implicazioni sopra con f (Bδ (x0 ) \ {x0 }) ⊆ Bε (f (x0 )) e f (Bδ (x0 )) ⊆ Bε (f (x0 )) rispettivamente. Definizione 5.32 (Continuità). Siano (X, dX ), (Y, dY ) spazi metrici. Si dice che f : X −→ Y è continua se f è continua in ogni punto x ∈ X. Passiamo ora alla continuità uniforme, una nozione di continuità più forte di quella puntuale. Definizione 5.33 (Uniforme continuità). Siano (X, dX ), (Y, dY ) spazi metrici. Si dice che f : X −→ X 0 è uniformemente continua se, per ogni ε > 0, esiste δ > 0 tale che (6.5) ∀ x, x0 ∈ X , dX (x, x0 ) < δ =⇒ dY f (x), f (x0 ) < ε . 6. SPAZI METRICI 103 Si noti che le funzioni Lipschitziane sono uniformemente continue: per la formula (6.3) basta scegliere δ = ε/L se L > 0, se L = 0 la funzione è costante (quindi uniformemente continua). Abbiamo quindi le inclusioni Lipschitziane ⊆ Uniformemente continue ⊆ Continue . La funzione f (x) = 1/x su (0, 1] munito della distanza euclidea mostra che non tutte le funzioni continue sono uniformemente continue. D’altro canto, sull’intervallo [0, 1] munito della distanza euclidea tutte le funzioni continue sono uniformemente continue (Teorema di Heine–Cantor), mentre √ è facile costruire esempi di funzioni continue non Lipschitziane, ad esempio f (x) = x. Teorema 5.34 (Formulazioni equivalenti della continuità). Siano (X, dX ), (Y, dY ) spazi metrici e sia f : X −→ Y . Le seguenti condizioni sono equivalenti: (i) f è continua; (ii) per ogni aperto A di Y , f −1 (A) è aperto in X; (iii) per ogni chiuso C di Y , f −1 (C) è chiuso in X. Dimostrazione. Mostriamo che (i)⇒(ii). Dato A ⊆ Y aperto, mostriamo che f −1 (A) è aperto. Si prenda x ∈ f −1 (A). Siccome A è un aperto contenente f (x), esiste ε > 0 tale che Bε (f (x)) ⊆ A. Allora la continuità in x garantisce l’esistenza di δ > 0 tale che f (Bδ (x)) ⊆ Bε (f (x)). Segue che Bδ (x) ⊆ f −1 (A) che quindi è aperto. Mostriamo ora che (ii)⇒(i). Siano x0 ∈ X e ε > 0. Dato che f −1 (Bε (f (x0 ))) è aperto in X e contiene x0 , esiste δ > 0 tale che Bδ (x0 ) ⊆ f −1 (Bε (f (x0 ))), quindi f (Bδ (x0 )) ⊆ Bε (f (x0 )). Infine l’equivalenza (ii)⇔(iii) segue dall’identità f −1 (Y \ Y 0 ) = X \ f −1 (Y 0 ), valida per ogni sottoinsieme Y 0 di Y . Osservazione 5.35 (Spazi topologici). Il Teorema 5.34 mostra che la nozione di continuità può essere formulata usando solo la classe degli aperti (o dei chiusi). Questo è il punto di vista alla base della teoria, molto più generale, degli spazi topologici, che verrà trattata in corsi più avanzati. In questa teoria si prescrive non una distanza ma una topologia, i.e. una classe di insiemi in P(X), detti insiemi aperti della topologia, stabile per unioni arbitrarie e intersezioni finite, contenente X e Ø. Con la classe degli aperti si possono formulare varie nozioni di convergenza, continuità, etc. senza far ricorso a una distanza. Proposizione 5.36 (Stabilità per composizione). Siano (X, dX ), (Y, dY ), (Z, dZ ) spazi metrici, e siano f : X −→ Y , g : Y −→ Z funzioni continue. Allora anche g ◦ f : X −→ Z è continua. Dimostrazione. Dato un aperto A in Z, g −1 (A) è aperto in Y , e dunque f −1 g −1 (A) = (g ◦ f )−1 (A) è aperto in X. Si noti che, dati un sottoinsieme E di X e una funzione f : X −→ Y , le due condizioni • f è continua su E (cioè in ogni punto di E), • f |E è continua (con E dotato della distanza indotta da X), non sono equivalenti. Si prenda ad esempio f : R −→ R uguale alla funzione caratteristica χE di un sottoinsieme E di R (ad esempio un intervallo [a, b]), ( 1 se x ∈ E χE (x) = 0 se x 6∈ E . 6. SPAZI METRICI 104 Allora f |E ≡ 1 è continua, ma f non è continua nei punti della frontiera di E (nel caso dell’intervallo, in a e in b). 12 Proposizione 5.37 (Continuità della distanza). Sia (X, d) uno spazio metrico. La funzione d : X × X −→ R è continua rispetto alle distanza prodotto sul dominio e distanza euclidea sul codominio. Dimostrazione. Siano (x1 , x2 ), (y1 , y2 ) in X × X. Applicando la disuguaglianza triangolare in R e poi quella su X, si ha d(x1 , x2 ) − d(y1 , y2 ) ≤ d(x1 , x2 ) − d(x2 , y1 ) + d(x2 , y1 ) − d(y1 , y2 ) ≤ d(x1 , y1 ) + d(x2 , y2 ) ≤ 2dX×X (x, y), (x0 , y 0 ) . Il teorema che segue mette in relazione la continuità di una funzione con la convergenza di successioni nel dominio e delle loro immagini nel codominio. Teorema 5.38 (Caratterizzazione sequenziale della continuità). Siano (X, dX ), (Y, dY ) spazi metrici. Una funzione f : X −→ Y è continua in x ∈ X se e solo se, per ogni successione (xn ) di elementi di X convergente a x, la successione f (xn ) converge a f (x). Dimostrazione. Se f è continua in x, per ogni ε > 0 esiste δ > 0 tale che f (Bδ (x)) ⊆ Bε (f (x)). Quindi, dato che dX (xn , x) < δ definitivamente, dY (f (xn ), f (x)) < ε definitivamente. Ne segue che (f (xn )) converge a f (x). Viceversa, se f (xn ) → f (x) per ogni successione (xn ) convergente a x, se f non fosse continua in x esisterebbe ε > 0 tale che f (Bδ (x)) \ Bε (f (x)) è non vuoto per ogni δ > 0. Scegliendo δn = 1/(n + 1) e punti xn ∈ Bδn (x) tali che dY (f (xn ), f (x)) ≥ ε, avremmo una successione che contraddice l’ipotesi. In modo analogo si potrebbe caratterizzare l’esistenza del limite in x, considerando successioni (xn ) ⊂ X \ {x} convergenti a x. 6.3. Spazi metrici compatti. La proprietà vista per successioni a valori in un intervallo chiuso e limitato di R e, più in generale, per successioni a valori in un insieme chiuso e limitato di Rn (Teorema 5.21 di Bolzano–Weierstrass) motiva la seguente definizione astratta, che estende quella già data per sottoinsiemi di Rn . Definizione 5.39 (Spazio metrico compatto). Uno spazio metrico (X, d) si dice compatto se ogni successione di elementi di X ha una sottosuccessione convergente. Ad esempio la retta reale estesa R munita della distanza δ(x, y) = | arctan x−arctan y| già introdotta in (6.2) è uno spazio metrico compatto. Un sottoinsieme Y di uno spazio metrico (X, d) si dice compatto se, con la distanza indotta dall’inclusione, è compatto. Senza riferimento esplicito alla distanza indotta su Y , questa condizione equivale a dire che ogni successione di elementi di Y ammette una sottosuccessione convergente in X a un elemento di Y . Sono quindi compatti i chiusi e limitati di Rn . In generale, entrambe queste condizioni sono necessarie per la compattezza: 12Per esercizio, si mostri che la prima proprietà implica la seconda e che vale l’implicazione inversa se E ∩∂E = Ø, i.e. E è aperto. 6. SPAZI METRICI 105 Proposizione 5.40. Ogni sottoinsieme compatto di uno spazio metrico (X, d) è chiuso e limitato (i.e. contenuto in una palla). Dimostrazione. Sia Y ⊆ X compatto. Basta verificare la chiusura per successioni. Se (xn ) ⊆ Y converge a x ∈ X, esiste per ipotesi una sottosuccessione (xn(k) ) convergente a un elemento y ∈ Y . Per l’unicità del limite x = y ∈ Y . Se per assurdo Y non fosse limitato, fissato x ∈ X avremmo che per ogni n esisterebbe xn ∈ Y tale che d(xn , x) ≥ n. Se allora (xn(k) ) converge a y, la convergenza delle distanze che viene da d(xn(k) , x) − d(y, x) ≤ d(xn(k) , x) darebbe d(xn(k) , x) → d(y, x), assurdo. A differenza del caso degli spazi Euclidei, non tutti gli insiemi chiusi e limitati sono compatti. Per convincersene basta fare la seguente osservazione generale: se (X, d) è uno spazio metrico, (X, min{1, d}) è anch’esso uno spazio metrico, con distanza limitata, avente le stesse successioni convergenti, gli stessi chiusi, gli stessi aperti, etc. Quindi, ad esempio, in (R, min{1, |x − y|}) ogni insieme chiuso è limitato, ma i compatti restano quelli della distanza euclidea. Vedremo in seguito altri esempi più naturali fatti con spazi di funzioni (ad esempio l’insieme delle funzioni continue da [0, 1] in [0, 1] è un sottoinsieme chiuso e limitato, ma non compatto, di C([0, 1])). Teorema 5.41 (Immagine continua di compatti è compatta). Siano (X, d), (X 0 , d0 ) spazi metrici, con (X, d) compatto e f : X −→ X 0 continua. Allora f (X) è compatto. Dimostrazione. Sia (yn ) una successione di elementi di f (X). Per ogni n, si prenda xn ∈ X tale che f (xn ) = yn . Per la compattezza di X, esiste una sottosuccessione (xn(k) ) convergente a x. Per la continuità di f , si ha lim yn(k) = lim f (xn(k) ) = f (x) ∈ f (X) . k→∞ k→∞ Dunque f (X) è compatto. Teorema 5.42 (Continuità su compatti implica uniforme continuità). Siano (X, d), (X 0 , d0 ) spazi metrici, con (X, d) compatto e f : X −→ X 0 continua. Allora f è uniformemente continua. Dimostrazione. Si supponga per assurdo che f non sia uniformemente continua. Esiste quindi ε0 > 0 tale che, per ogni δ > 0 la condizione (6.5) sia violata. Prendendo δ = 1/n, esistono quindi xn , yn ∈ X con 1 d(xn , yn ) < , d0 f (xn ), f (yn ) ≥ ε0 . n Per la compattezza di X, esiste una sottosuccessione (xn(k) ) convergente a x ∈ X. Essendo d(x, yn(k) ) ≤ d(x, xn(k) ) + d(xn(k) , yn(k) ) < d(x, xn(k) ) + 1 , n(k) anche (yn(k) ) converge a x. Per la continuità di f , lim f (xn(k) ) = lim f (yn(k) ) = f (x) . k→∞ k→∞ Per la disuguaglianza triangolare, otteniamo che d0 f (xn(k) ), f (yn(k) ) → 0, contraddicendo il fatto che queste distanze sono tutte più grandi di ε0 . Dato che i compatti di R, essendo chiusi e limitati, hanno massimo e minimo, otteniamo il seguente teorema di esistenza di massimi e minimi per funzioni continue definite su insiemi compatti. 6. SPAZI METRICI 106 Corollario 5.43 (Teorema di Weierstrass). Sia (X, d) uno spazio metrico compatto e sia f : X −→ R continua. Allora f assume valore massimo e valore minimo. 6.4. Spazi metrici completi, completamento. Abbiamo già osservato che non sempre le successioni di Cauchy sono convergenti. Questo fornisce la base per una definizione di completezza totalmente svincolata dalla struttura d’ordine, ma compatibile con quella già vista su R. Definizione 5.44 (Completezza). Uno spazio metrico (X, d) si dice completo se ogni successione di Cauchy di elementi di X converge a un elemento di X. Un sottoinsieme Y di uno spazio metrico (X, d) si dice completo in X se (Y, d|Y ×Y ) è uno spazio completo. È facile verificare, lo si faccia per esercizio, che ogni successione di Cauchy avente una sottosuccessione convergente è convergente. Da questo deduciamo il Teorema 5.45 (Compattezza implica completezza). Ogni spazio metrico compatto è completo. Dimostrazione. Consideriamo uno spazio compatto e una successione (xn ) in questo spazio. Per compattezza (xn ) ha una sottosuccessione convergente ad un elemento x dello spazio. Se poi è di Cauchy, per quanto detto prima la successione (xn ) e non solo la sottosuccessione converge a x. Quindi lo spazio è completo. Il viceversa evidentemente non vale: basta prendere R con la distanza euclidea. Miglioriamo ora l’implicazione tra compattezza e chiusura mostrando che la sola completezza (che è implicata dalla compattezza) implichi la chiusura. Proposizione 5.46 (Completezza e chiusura). Se Y è completo in uno spazio metrico (X, d), allora Y è chiuso. Se (X, d) è completo, ogni suo sottoinsieme chiuso è completo. Dimostrazione. Sia Y completo in X. Dato x ∈ Y , esiste una successione (yn ) di elementi di Y convergente a x. Tale successione è di Cauchy e, essendo (Y, d) completo, converge a un elemento di Y . Per l’unicità del limite, x ∈ Y . Dunque Y è chiuso. Si supponga ora (X, d) completo e sia Y chiuso in X. Ogni successione di Cauchy di elementi di Y ha un limite in X. Ma, essendo Y chiuso, tale limite è in Y . Dunque (Y, d|Y ×Y ) è completo. Esempio. Vedremo in seguito che lo spazio C(I), munito della distanza del sup, è completo. La completezza di C(I) è lo strumento fondamentale per lo studio delle equazioni differenziali; più in generale, serve a mostrare che certi procedimenti iterativi, come le somme parziali di una serie di funzioni, effettivamente convergono. Si consideri ad esempio le serie ∞ X an sin(bn πx) x∈R n=0 con a ∈ (0, 1). È facile verificare che la serie definisce una funzione f : R → R con |f | ≤ 1/(1 − a), per il criterio della convergenza assoluta. Tuttavia, è solo con la completezza di C(R) che si può mostrare che f è continua. Storicamente, questo è il primo esempio di funzione continua non derivabile in nessun punto: nel 1872 K. Weierstrass mostrò che questa proprietà vale se b è un intero dispari e ab > 1 + π/2.13 13In tempi più recenti sono stati trovati altri esempi espliciti di tipo “frattale”, ad esempio P∞ (3/4)n ϕ(4n x), ove 0 ϕ : R → [0, 1] è la funzione “a tenda” che misura la distanza dall’insieme degli interi pari, si veda J. McCarthy, American Mathematical Monthly, Vol. LX, 10, 1953, o anche http://www.math.ubc.ca/~feldman/m321/nondiffble.pdf per una semplice dimostrazione. 6. SPAZI METRICI 107 La seguente proposizione consente di estendere una funzione f da un dominio E alla chiusura del dominio, a patto che il codominio sia completo e che la funzione f sia uniformemente continua (si diano esempi che mostrano che l’estensione potrebbe non esistere se una di queste ipotesi viene a mancare). Basta in realtà che la funzione f sia localmente uniformemente continua in un aperto A, vale a dire, per ogni x ∈ A esiste r > 0 tale che f |E∩Br (x) è uniformemente continua. Proposizione 5.47 (Estensione per completamento). Siano (X, dX ) e (Y, dY ) spazi metrici, con (Y, dY ) completo. Allora ogni funzione f : E ⊆ X −→ Y uniformemente continua (rispettivamente localmente uniformemente continua in A ⊆ X aperto) ha un unico prolungamento continuo fe : E −→ Y (rispettivamente fe : E ∩ A −→ Y ). Tale prolungamento è anche (localmente in A) uniformemente continuo. Dimostrazione. Diamo la dimostrazione nel caso localmente uniformemente continuo. Dato x ∈ E ∩ A sia (xn ) ⊂ E convergente a x. Dato che per ogni r > 0 si ha xn ∈ Br (x) definitivamente, per la locale uniforme continuità, (f (xn )) è di Cauchy visto che (xn ) lo è, quindi (f (xn )) ha limite ` ∈ Y . Poniamo fe(x) = `. Questa definizione non dipende dalla scelta della successione (xn ): infatti se (xn ) e (x0n ) sono successioni contenute in E e convergenti entrambe a x, da dX (xn , x0n ) → 0 deduciamo, grazie ancora alla locale uniforme continuità, dY (f (xn ), f (x0n )) → 0, quindi (f (xn )) e (f (x0n )) hanno lo stesso limite. È evidente che se vogliamo un’estensione continua, che quindi commuti con l’operazione di limite, quella data è l’unica possibile. Mostriamo che fe è localmente uniformemente continua, se f lo è, usando la continuità della distanza: per ogni x ∈ A sia r > 0 tale che f |Br (x)∩E è uniformemente continua e mostriamo che anche f˜|Br (x)∩E lo è. Dato ε > 0, sia δ > 0 tale che dY (f (x), f (x0 )) < ε/2 tutte le volte che x, x0 ∈ Br (x) ∩ E e dX (x, x0 ) < δ. Se x, x0 ∈ Br (x) ∩ E, dX (x, x0 ) < δ e (xn ) e (x0n ) sono successioni contenute in E e convergenti rispettivamente a x e x0 , allora la continuità della distanza dX implica dX (xn , x0n ) < δ e xn , xn0 ∈ Br (x) definitivamente, quindi dY (f (xn ), f (xn )) < ε/2 definitivamente. Usando ora la continuità della distanza dY otteniamo dY (fe(x), fe(x0 )) ≤ ε/2 < ε. In modo analogo si mostra che se f è globalmente uniformemente continua, anche fe lo è. Nella dimostrazione dell’unicità del completamento ci servirà questo caso particolare della Proposizione 5.47: se f è un’isometria, allora lo è anche fe. Questo si dimostra con lo stesso ragionamento usato per costruire fe: se x, y ∈ E allora possiamo trovare successioni (xn ), (yn ) contenute in E e convergenti rispettivamente a x e y; dato che dY (f (xn ), f (yn )) = dX (xn , yn ), usando la continuità della distanza in X e in Y otteniamo, per passaggio al limite, dY (fe(x), fe(y)) = dX (x, y). Definizione 5.48 (Completamento). Dato uno spazio metrico (X, d), chiamiamo completamento di (X, d) uno spazio metrico (X ∗ , d∗ ) tale che: (i) (X ∗ , d∗ ) è completo; (ii) esiste un’isometria j : X → X ∗ tale che j(X) è denso in X ∗ . Spesso si “identifica” X con la sua copia isometrica j(X) dentro X ∗ , vedendo X come un sottoinsieme di X ∗ . In quest’ottica, si noti che la proposizione precedente garantisce questa proprietà universale del completamento: ogni funzione (localmente in A ⊂ X ∗ aperto) uniformemente continua f : X → Y , con (Y, dY ) completo, si estende in modo unico a una funzione (localmente in A) uniformemente continua su X ∗ . Il seguente teorema mostra che il completamento esiste, ed è unico nel solo senso possibile, a meno di isometrie. La dimostrazione si basa su un adattamento dell’argomento diagonale di Cantor, visto che costruiremo una successione a partire da una successione di successioni. 6. SPAZI METRICI 108 Teorema 5.49 (Esistenza e unicità del completamento). Ogni spazio metrico (X, d) ammette un completamento. Il completamento è unico a meno di isometrie. Dimostrazione. Per l’esistenza, consideriamo il sottoinsieme Y di X N costituito dalle successioni di Cauchy di X. Definiamo d (xn ), (x0n ) := lim sup d(xn , x0n ) (xn ), (x0n ) ∈ Y . n→∞ È facile verificare, usando la subadditività del lim sup, che valgono la proprietà simmetrica e triangolare.14 Tuttavia non vale l’assioma di non degenerazione: due successioni, pur distinte, potrebbero essere asintoticamente vicine. Per ovviare a questo problema consideriamo la relazione di equivalenza (xn ) ∼ (x0n ) se lim d(xn , x0n ) = 0 n→∞ 0 e osserviamo d (xn ), (xn ) dipende solo dalla classe di equivalenza di (xn ) e (x0n ), quindi possiamo passare al quoziente, definendo X ∗ = Y /∼ e d∗ come la distanza indotta da d. È evidente che esiste una isometria j da X in X ∗ : basta associare a x la classe di equivalenza della successione (x) costantemente uguale a x. Resta da verificare che j(X) è denso in X ∗ e che (X ∗ , d∗ ) è completo. Densità di j(X) in X ∗ . Sia (xn ) ∈ Y , [(xn )] ∈ X ∗ la sua classe di equivalenza. Per ogni ε > 0 esiste n0 ∈ N tale che d(xn , xn0 ) < ε per ogni n ≥ n0 . Si ha allora d∗ ([(xn )], j(xn0 )) = lim supn d(xn , xn0 ) ≤ ε, quindi per l’arbitrarietà di (xn ) e di ε concludiamo che j(X) è denso in X ∗. Completezza di (X ∗ , d∗ ). Sia (zn ) ⊆ X ∗ una successione di Cauchy. Dato che j(X) è denso in X ∗ , per ogni n ∈ N possiamo trovare xn ∈ X tale che d∗ (zn , j(xn )) < 1/(n + 1). Mostriamo che la successione (xn ) è di Cauchy. Per ogni ε > 0 esiste n0 ∈ N tale che d∗ (zn , zn0 ) < ε/2 per n, n0 ≥ n0 . Se scegliamo n0 sufficientemente grande in modo che valga anche la disuguaglianza 2/(n0 +1) < ε/2 otteniamo d(xn , xn0 ) = d∗ (j(xn ), j(xn0 )) ≤ d∗ (j(xn ), zn ) + d∗ (zn , zn0 ) + d∗ (zn0 , j(xn0 )) ε 1 ε ε 1 + + 0 < + =ε ∀n, n0 ≥ n0 . ≤ n+1 2 n +1 2 2 Posto z = [(xn )] ∈ X ∗ , mostriamo ora che zn → z in X ∗ . Vale infatti d∗ (z, zn ) ≤ d∗ (z, j(xn )) + d∗ (j(xn ), zn ) < lim sup d(xm , xn ) + m→∞ 1 . n+1 Per la proprietà di Cauchy di (xn ), lim supm d(xm , xn ) ha limite nullo per n → ∞, quindi d∗ (z, zn ) → 0. Unicità del completamento. Siano (X1∗ , d1 ), (X2∗ , d2 ) completamenti, ji : X → Xi∗ , i = 1, 2, le rispettive immersioni isometriche. Allora grazie alla Proposizione 5.47 e all’osservazione fatta immediatamente dopo, l’isometria j1 ◦ j2−1 : j2 (X) → X1∗ si estende in modo unico, essendo (X1∗ , d1 ) completo, a una isometria j12 : X2∗ → X1∗ . La sua immagine è un insieme chiuso (essendo (X2∗ , d2 ) completo) che contiene l’immagine di j1 ◦ j2−1 , vale a dire j1 (X). Essendo quest’ultimo insieme denso in X1∗ , j12 è anche surgettiva. 14In realtà questo vale in tutto l’insieme X N ×X N , mentre si può anche osservare che in Y ×Y il lim sup è un limite, grazie al fatto che le successioni sono di Cauchy e alla disuguaglianza |d(xn , x0n )−d(xm , x0m )| ≤ d(xn , xm )+d(x0n , x0m ), ma questo non ci servirà. 7. *IL TEOREMA DI BAIRE 109 6.5. R come completamento metrico di Q. Con la notazione della sezione precedente, possiamo facilmente mettere in relazione l’insieme R (i.e. l’unico campo ordinato completo, costruito con le sezioni di Dedekind di Q) con Q∗ , il completamento metrico di Q. Si noti che Q∗ non ha a priori altra struttura se non quella di spazio metrico, quindi la proposizione qui sotto è la migliore possibile. Proposizione 5.50. Q∗ è isometrico a R, quest’ultimo inteso come spazio metrico munito della distanza Euclidea. Dimostrazione. Abbiamo mostrato nel Teorema 3.2, usando la completezza di R come insieme ordinato (i.e. l’esistenza dell’estremo superiore e inferiore), che R è anche completo come spazio metrico. D’altro canto, abbiamo anche mostrato che Q interseca ogni intervallo di R, quindi Q è denso in R anche nel senso metrico. Quindi l’unicità del completamento metrico dà la tesi. Senza presupporre la costruzione di Dedekind, ma usando invece la Proposizione 5.47, è possibile munire direttamente Q∗ della struttura di campo ordinato, verificandone poi la completezza. In questo modo si ha una dimostrazione alternativa dell’esistenza di campi ordinati completi. Non faremo vedere questo nei dettagli, ma sottolineiamo solo che in questo caso, pensando Q come un sottoinsieme di Q∗ , l’estensione delle operazioni di somma e prodotto + : Q × Q −→ Q∗ , · : Q × Q −→ Q∗ , cosı̀ come l’estensione delle operazioni x 7→ −x e x 7→ x−1 (la prima da Q in Q∗ , la seconda da Q\{0} in Q∗ ) sono automaticamente garantite dalla Proposizione 5.47, perché uniformemente continue (la somma e l’opposto) o almeno localmente uniformemente continue (il prodotto e l’inverso, prendendo per il prodotto come insieme A un qualsiasi insieme limitato e per l’inverso A = Q∗ \ {0}). Anche la relazione di ordine si può facilmente estendere, ponendo (qn ) ≤ (qn0 ) ⇐⇒ ∀ > 0, qn < qn0 + definitivamente . Vediamo come le proprietà di campo si estendono “per densità” da Q a Q∗ , limitandoci per semplicità solo a trattare l’esistenza dell’inverso destro (si verificano in modo del tutto simile commutatività, associatività, distribuitività, etc). Osserviamo per prima cosa che l’applicazione Q∗ × (Q∗ \ {0}) 3 (x, y) → x · y −1 ∈ Q∗ è continua (si verifica facilmente che è localmente Lipschitziana, quindi localmente uniformemente continua). Allora la mappa x 7→ x · x−1 , ottenuta componendo la precedente a sinistra con x 7→ (x, x), è localmente uniformemente continua in Q∗ \ {0} ed è costantemente uguale a 1 su Q \ {0}, quindi è costante anche su Q∗ \ {0}. 7. *Il Teorema di Baire 15 Teorema 5.51 (Baire). Sia (X, d) uno spazio metrico completo e sia (Fn )n≥1 una successione di chiusi la cui unione è X. Allora almeno uno dei chiusi ha parte interna non vuota. Dimostrazione. Supponiamo per assurdo che tutti gli insiemi Fn abbiano parte interna vuota. Costruiremo una successione di palle Brn (xn ) tali che Brn+1 (xn+1 ) ⊆ Brn (xn ), rn → 0 e B rn (xn ) ⊂ X \ Fn . Se ci riusciamo, dall’inclusione delle palle Brm (xm ) in Brn (xn ) per m ≥ n otteniamo d(xm , xn ) < rn 15Sezione facoltativa per m ≥ n , 8. FUNZIONI CONTINUE TRA SPAZI EUCLIDEI 110 quindi (xn ) è di Cauchy e converge a x. D’altro canto, passando al limite per n → ∞ nella disuguaglianza d(xk , xn ) < rk (valida per n ≥ k) otteniamo d(x, xk ) ≤ rk , quindi x ∈ / Fk per ogni k, assurdo. Per costruire le palle iniziamo con una prima palla chiusa B(x1 , r1 ) disgiunta da F1 , con r1 ∈ (0, 1]. Essendo F˚2 = ∅, esiste x2 ∈ Br1 (x1 ) ∩ X \ F2 e possiamo scegliere r2 ∈ (0, 1/2] in modo tale che Br2 (x2 ) ⊆ Br1 (x1 ) (per questo basta che r2 < r1 − d(x2 , x1 )) e B r2 (x2 ) sia disgiunta da F2 (e questo è possibile perché X \ F2 è aperto). Continuando in questo modo generiamo la successione dei centri xn e dei raggi rn ≤ 1/n richiesta. Passando ai complementari, una formulazione equivalente è: in uno spazio metrico completo, se (An ) è una successione di aperti la cui intersezione è vuota, allora almeno uno degli aperti non è denso, oppure: in uno spazio metrico completo, intersezione numerabile di aperti densi è densa. 8. Funzioni continue tra spazi Euclidei Si consideri una funzione f : E −→ Rm , con E ⊆ Rn , e siano f1 , . . . , fm : E −→ R le sue componenti scalari, tali cioè che f (x) = f1 (x), . . . , fm (x) . La nozione di continuità di f in un punto di E rientra nella Definizione 5.32. Sulla base della Proposizione 5.19 e del Teorema 5.38, punto (ii), possiamo affermare quanto segue. Proposizione 5.52. La funzione f : E ⊆ Rn −→ Rm è continua in x0 ∈ E se e solo se ciascuna delle sue componenti scalari fk , 1 ≤ k ≤ m, è continua in x0 . 8.1. *Curve in Rm . 16 Definizione 5.53 (Curve parametriche e archi di curva). Sia I un intervallo di R. Una funzione continua γ : I −→ Rm si chiama curva parametrica. La restrizione di γ a un sottointervallo compatto [a, b] di I si chiama arco della curva parametrica γ. Spesso ometteremo l’aggettivo “parametrica”. Per le curve e per gli archi (caso particolare di curve) si adotta una apposita terminologia. • La variabile t ∈ I si chiama anche parametro della curva γ; • se γ : [a, b] −→ Rm è un arco, i punti x = γ(a) e y = γ(b) si chiamano rispettivamente il primo e il secondo estremo di γ; si dice anche che γ congiunge x a y; • un arco γ si dice chiuso se i suoi estremi coincidono; • una curva γ si dice semplice se è iniettiva come funzione da I in Rm ; • l’insieme immagine γ(I) ⊆ Rm si chiama17 sostegno di γ. Si noti che nessuna curva chiusa può essere iniettiva; per esprimere il fatto che il difetto di iniettività è solo dovuto agli estremi, si dice che una curva γ : [a, b] → Rm è semplice e chiusa se è chiusa ed è iniettiva da (a, b] in Rm . Le curve parametriche non sono dunque sottoinsiemi di Rm , ma funzioni. La nozione di curva è legata piuttosto all’idea di un punto di Rm che si sposta nel tempo. Nelle applicazioni alla meccanica, infatti, si usa questa nozione di curva per rappresentare la legge del moto di un punto materiale nello spazio. Del resto, una nozione di curva come sottoinsieme di Rm si scontra con serie 16Sezione facoltativa 17Si usa anche il termine traiettoria, o curva non parametrica. 8. FUNZIONI CONTINUE TRA SPAZI EUCLIDEI 111 difficoltà. L’esempio della curva di Peano, che ha come sostegno un intero quadrato, mostra come il sostegno di una curva possa non avere alcun aspetto di “unidimensionalità”.18 Si presenta spesso, comunque, l’esigenza di svincolare la nozione di curva dalla definizione di una specifica parametrizzazione. Questo risultato si ottiene, in parte, introducendo una opportuna relazione di equivalenza tra curve. Definizione 5.54. Siano γ : I −→ Rm e δ : J −→ Rm due curve in Rm . Si pone γ ∼ δ se esiste una funzione continua, surgettiva e strettamente crescente ϕ : I −→ J tale che γ = δ ◦ ϕ. Si verifica facilmente quanto segue: • ∼ è effettivamente una relazione di equivalenza; • se γ e δ sono equivalenti, esse hanno lo stesso sostegno; • se γ e δ sono equivalenti, γ è semplice (risp. chiusa) se e solo se lo è δ. La seconda affermazione non ammette in generale un’implicazione inversa. Per esempio, gli archi γ(t) = (cos t, sin t) , t ∈ [0, 2π] , δ(t) = (cos t, sin t) , t ∈ [0, 3π] , hanno come sostegno il cerchio di centro l’origine e raggio 1 in R2 , ma non sono equivalenti. Più chiara è la situazione per quanto riguarda gli archi semplici. Nella dimostrazione useremo questa proprietà delle funzioni di variabile reale (già richiamata all’inizio del capitolo), che daremo per nota: se φ : I → J è continua e bigettiva, con I e J intervalli, allora φ è strettamente monotona; inoltre la funzione inversa φ−1 : J → I è continua. Teorema 5.55 (Orientamento di archi semplici). Sia γ : [a, b] −→ Rm un arco semplice. Esistono allora esattamente due classi di equivalenza di archi semplici con lo stesso sostegno di γ: la classe Cγ e la classe C−γ , dove −γ è l’arco −γ(t) = γ(−t) , t ∈ [−b, −a] . Dimostrazione. Sia E = γ [a, b] il sostegno di γ. Proviamo innanzitutto che γ −1 : E −→ [a, b] è continua, dimostrando che soddisfa la condizione (iii) del Teorema 5.34 (controimmagini di chiusi sono chiuse). Sia F un chiuso di [a, b]. Allora (γ −1 )−1 (F ) = γ(F ). Ma F è un insieme compatto, dunque γ(F ) è compatto e, per il Teorema 5.41(ii), γ(F ) è pure compatto. Sia allora δ : [c, d] −→ E un altro arco semplice con sostegno E. La composizione ϕ = γ −1 ◦ δ : [c, d] −→ [a, b] , è continua e bigettiva, quindi o è strettamente crescente, o è strettamente decrescente. Nel primo caso, δ = γ ◦ ϕ ∼ γ, nel secondo δ ∼ −γ. Le due classi di equivalenza Cγ e C−γ rappresentano dunque i due possibili orientamenti con cui si può percorrere E senza passare due volte per lo stesso punto. Il Teorema 5.55 non ammette un 18Anche la costruzione di G. Peano, cosı̀ come l’esempio di Weierstrass e le sue varianti che abbiamo già discusso, si basa sulla completezza dello spazio delle funzioni continue. Indicate con Iin , Qn j rispettivamente le suddivisioni di [0, 1] in 22n intervalli chiusi di lunghezza 1/22n e [0, 1]2 in 22n quadrati chiusi di lato 1/2n , si costruiscano delle curve γn tali 2n che γn (t), per t ∈ Iin , prende valori in un opportuno quadrato Qn σn (i) , con σn permutazione di {1, . . . , 2 }. Costruendo n+1 n n le curve γn in maniera tale che per t ∈ Ii ⊂ Ik , per qualche k, la curva γn+1 resta nel quadrato Qσn (k) che conteneva la curva γn per t ∈ Ikn (e questo è possibile, vedi ad √ esempio http://it.wikipedia.org/wiki/Curva_di_Peano), la successione di curve γn soddisfa max |γm − γn | ≤ 2/2n per m ≥ n ≥ 1, quindi è una successione di di Cauchy in [0,1] C([0, 1]; [0, 1]2 ) e il suo limite “riempie” [0, 1]2 . 8. FUNZIONI CONTINUE TRA SPAZI EUCLIDEI 112 analogo per curve semplici definite su intervalli aperti o semiaperti. Si consideri per esempio una curva semplice definita su I = [a, b), e tale che esista c ∈ I per cui lim γ(t) = γ(c) , t→b (si pensi a un sostegno a forma di 9). In questo caso esistono quattro, e non due, modi non equivalenti di ottenere lo stesso sostegno con curve semplici. 8.2. Funzioni continue da Rn a Rm . Iniziamo con il trattare il caso m = 1. Valgono per le funzioni da Rn a R i teoremi sulla continuità delle funzioni somma prodotto, reciproco di funzioni continue come nel caso n = 1. Ricordiamo poi la Proposizione 5.36 sulla continuità della funzione composta. Aggiungiamo questa semplice osservazione, che è in realtà un caso particolare dell’affermazione precedente19: se g è una funzione di una variabile, continua su I ⊆ R, allora f (x1 , . . . , xn ) = g(x1 ) , è continua su I × Rn−1 . Con questi strumenti si dimostra facilmente la continuità di funzioni di più variabili definite in termini di funzioni elementari, per esempio x + sin y . f (x, y, z) = exp 1 + y2 + z2 In situazioni diverse, la determinazione della continuità di una funzione può presentare aspetti problematici, e tentativi di riduzione a metodi “di una variabile” possono dar luogo a conclusioni sbagliate. Partiamo da questa semplice conseguenza della Proposizione 5.36: se f è una funzione a valori reali, continua su E ⊆ Rn , e γ : I −→ E è una curva, allora f ◦ γ : I −→ R è continua. In particolare, se prendiamo γx0 ,v (t) = x0 + tv, parametrizzazione affine della retta passante per x0 e parallela al vettore v, la funzione g(t) = f (x0 + tv) , è continua sull’insieme t : x0 + tv ∈ E . Con un abuso di linguaggio, diremo che g è la restrizione di f alla retta data. Mostriamo ora con un esempio in due variabili che una funzione può avere restrizioni continue a tutte le rette senza essere tuttavia continua. Esempio. Partiamo da una funzione ϕ(t) continua su R, nulla fuori dall’intervallo [1, 3] e uguale a 1 per t = 2, per esempio t − 1 se 1 ≤ t ≤ 2, ϕ(t) = 3 − t se 2 ≤ t ≤ 3, 0 altrimenti, e poniamo ( y ϕ 2 se x 6= 0, x (8.1) f (x, y) = 0 se x = 0. Si ha allora che: • f è diversa da 0 solo nei punti (x, y) con x2 < y < 3x2 (regione aperta compresa tra due parabole con vertice nell’origine); • f = 1 sui punti della parabola y = 2x2 con x 6= 0, ma f (0, 0) = 0; quindi f non è continua in 0. 19Basta considerare la proiezione sulla prima coordinata 9. CONNESSIONE, CONVESSITÀ, CONNESSIONE PER ARCHI 113 Tuttavia: • la restrizione di f a una qualunque retta del piano è continua (lo si mostri per esercizio). Questo esempio mostra i problemi che si possono incontrare nel trattamento di limiti di funzioni di più variabili. Dato che limx→0 f (x, y) = 0 per ogni y e limy→0 f (x, y) = 0 per ogni x, si ha infatti lim lim f (x, y) = 0 , lim lim f (x, y) = 0 , x→0 y→0 y→0 x→0 mentre non esiste lim f (x, y) . (x,y)→(0,0) Quindi il calcolo di un limite non può essere sempre ridotto a una sequenza di limiti nelle singole variabili. In termini sequenziali, la differenza consiste essenzialmente nel fatto che, per avere il limite in n variabili, serve considerare tutte le successioni che si avvicinano al punto, non solo quelle che si muovono lungo rette o lungo una prescritta famiglia di curve. Infine, nel caso f : Rn → Rm , m ≥ 1, in base alla Proposizione 5.52, sarà sufficiente considerare la continuità delle componenti f1 , . . . , fm , funzioni a valori in R. 9. Connessione, convessità, connessione per archi Cosı̀ come le nozioni di completezza e compattezza per spazi metrici generalizzano e formalizzano proprietà note della retta reale (rispettivamente il criterio di convergenza di Cauchy e il teorema di Bolzano–Weierstrass), la nozione di connessione consente di estendere a contesti più generali il teorema del valore intermedio, richiamato all’inizio del capitolo e che qui daremo per noto: ogni funzione continua in un intervallo assume tutti i valori compresi tra due qualsiasi valori assunti nell’intervallo (equivalentemente: una funzione continua manda intervalli in intervalli). Definizione 5.56 (Connessione). Uno spazio metrico (X, d) si dice connesso se non è scomponibile nell’unione disgiunta di due aperti non vuoti. Un sottoinsieme non vuoto Y di uno spazio metrico (X, d) si dice connesso in X se, posto dY = d|Y ×Y , (Y, dY ) è uno spazio metrico connesso. La formulazione che abbiamo dato della connessione per sottoinsiemi Y ne sottolinea il carattere intrinseco (i.e. la proprietà dipende solo dalla restrizione della distanza all’insieme e non dallo “spazio ambiente” X). Tuttavia, sul piano operativo, una formulazione equivalente della connessione per sottoinsiemi Y è il fatto che non esistono aperti A1 , A2 di X, tali che A1 ∩ Y e A2 ∩ Y sono non vuoti, Y ⊆ A1 ∪ A2 e A1 ∩ A2 ∩ Y = Ø. Infatti, se questa proprietà vale, allora A0i = Ai ∩ Y sono aperti non vuoti e disgiunti nello spazio metrico (Y, dY ) la cui unione contiene Y , quindi Y è sconnesso. Il viceversa si ottiene mostrando (lo si faccia per esercizio) che ogni aperto A0 di (Y, dY ) è rappresentabile come A ∩ Y , per un opportuno aperto A di X. Le seguenti due proprietà sono di facile dimostrazione. Proposizione 5.57. (i) Uno spazio metrico (X, d) è connesso se e solo se gli unici sottoinsiemi di X contemporaneamente aperti e chiusi sono X e Ø. (ii) Se due spazi (X, dX ) e (Y, dY ) sono bi–Lipschitz equivalenti20, e uno dei due è connesso, anche l’altro è connesso. 20Qui basta in realtà che siano omeomorfi, vale a dire che esista una mappa bigettiva, continua con inversa continua, tra i due spazi. 9. CONNESSIONE, CONVESSITÀ, CONNESSIONE PER ARCHI 114 La proprietà (ii) segue anche da un fatto più generale che estende, come vedremo, il teorema dei valori intermedi. Teorema 5.58 (Immagine continua di connessi è connessa). Sia (X, dX ) uno spazio metrico connesso e sia (Y, dY ) un altro spazio metrico. Se f : X −→ Y è continua, allora f (X) è un sottoinsieme connesso di Y . Dimostrazione. Per assurdo, supponiamo che f (X) non sia connesso. Esisterebbero allora A, A0 aperti di Y e disgiunti in f (X), aventi intersezione non vuota con f (X), tali che A∪A0 ⊇ f (X). Si considerino ora i sottoinsiemi di X B = f −1 (A) , B 0 = f −1 (A0 ) . Essendo A e A0 aperti in Y , B e B 0 sono aperti in X, per la continuità di f . Inoltre essi sono non vuoti, disgiunti e X ⊆ B ∪ B 0 , contraddicendo la connessione di X. Caratterizziamo ora i sottoinsiemi connessi di R (inteso come sempre munito della distanza euclidea). Useremo nella dimostrazione il fatto elementare che la proprietà di intervallo equivale a x, y ∈ I =⇒ [x, y] ⊂ I . Si noti che, esprimendo l’intervallo [x, y] in forma parametrica {(1−t)x+ty : t ∈ [0, 1]}, la proprietà sopra ha senso anche in spazi vettoriali reali ed è nota come convessità. Quindi i convessi di R sono tutti e soli gli intervalli. Teorema 5.59 (Insiemi connessi di R). I sottoinsiemi connessi di R sono tutti e soli gli intervalli. Dimostrazione. Dimostriamo che se E ⊆ R non è un intervallo, allora non è connesso. Sia M = sup E e m = inf E; dato che E non è un intervallo, per la proprietà di convessità deve esistere y ∈ (m, M ) \ E (in caso contrario, si avrebbe uno dei 4 casi E = (m, M ), E = [m, M ), E = (m, M ], E = [m, M ], tutti intervalli). Per definizione di estremo superiore e inferiore abbiamo quindi x < y < z con x, z ∈ E e y 6∈ E. Poniamo A = (−∞, y) , A0 = (y, +∞) . Allora A, A0 sono aperti disgiunti di R la cui unione contiene E perché y ∈ / E. Dato che x ∈ A ∩ E e z ∈ A0 ∩ E concludiamo che E non è connesso. Dimostriamo ora che ogni intervallo I è connesso, per fissare le idee lo dimostriamo per un intervallo aperto I = (a, b). Si supponga per assurdo che I = (A ∩ I) ∪ (A0 ∩ I), con A, A0 aperti di R, A ∩ I e A0 ∩ I non vuoti e disgiunti. Fissato x0 ∈ A ∩ I, o esistono punti di A0 ∩ I maggiori di x0 , o esistono punti minori. Consideriamo, per fissare le idee, il primo caso e sia x1 l’estremo superiore degli x ≥ x0 tali che [x0 , x] ⊂ A ∩ I. Allora non può essere x1 = b, quindi x1 ∈ I. D’altro canto x1 ∈ / A ∩ I per la massimalità di x1 e se fosse x1 ∈ A0 ∩ I vi sarebbe un intervallo (x1 − δ, x1 ) tutto contenuto in A0 ∩ I, contro il fatto che x1 è aderente a A ∩ I. 21 21Una dimostrazione alternativa, che usa il teorema dei valori intermedi, è la seguente. Si consideri la funzione f : I −→ R data da ( f (x) = 0 1 se x ∈ I ∩ A , se x ∈ I ∩ A0 . La funzione f assume in I esattamente due valori perché A ∩ I e A0 ∩ I sono non vuoti. Dato un punto x ∈ A, la funzione f è costante in I ∩ (x − r, x + r) per un certo r > 0 (precisamente per r > 0 tale che (x − r, x + r) ⊆ A), dunque è continua in x. Analogamente se x ∈ A0 . Quindi f è continua in ogni punto di I. Ma questo contrasta con il teorema (classico) dei valori intermedi, da cui si ha un assurdo. 9. CONNESSIONE, CONVESSITÀ, CONNESSIONE PER ARCHI 115 Corollario 5.60 (Teorema dei valori intermedi). Sia (X, d) uno spazio metrico e sia f : X −→ R continua. Se Y ⊆ X è connesso, f (Y ) è un intervallo. Introduciamo ora un’altra nozione di connessione, basata sul principio espresso dal Teorema 5.58 quando X è un intervallo chiuso e limitato di R. Definizione 5.61 (Connessione per archi). Un sottoinsieme E di uno spazio metrico (X, d) si dice connesso per archi se, dati comunque punti x, y ∈ E, esiste una curva continua γ : [a, b] −→ E congiungente x a y, i.e. tale che γ(a) = x e γ(b) = y. Anche la nozione di connessione per archi è intrinseca, come è facile verificare. Inoltre, se lo spazio ambiente X è uno spazio vettoriale, gli insiemi E convessi sono connessi per archi: dati x, y ∈ E basta considerare la curva γ(t) = (1 − t)x + ty, t ∈ [0, 1]. Proposizione 5.62 (Connessione per archi implica connessione). Ogni insieme E connesso per archi è connesso. In particolare gli insiemi convessi sono connessi. Dimostrazione. Per assurdo, supponiamo che esista un insieme E che sia connesso per archi, ma non connesso. Possiamo allora scomporre E come unione disgiunta (E ∩ A) ∪ (E ∩ A0 ) con A, A0 aperti dello spazio metrico ambiente X e E ∩ A, E ∩ A0 non vuoti. Si prendano ora x ∈ E ∩ A e y ∈ E ∩ A0 . Per ipotesi, esiste una curva continua γ : [a, b] −→ E congiungente x a y. Abbiamo allora che γ −1 (A) e γ −1 (A0 ) sono aperti non vuoti e disgiunti la cui unione è [a, b], assurdo. Esempi. (1) Siano I un intervallo di R e f : I −→ R continua. Il grafico di f , E = x, f (x) : x ∈ I , è connesso per archi: basta infatti usare la stessa funzione f per definire gli archi congiungenti due punti di E, considerando la mappa continua x 7→ (x, f (x)). Dunque E è connesso. (2) Esistono in Rn insiemi connessi, anche chiusi, che non sono connessi per archi. Un esempio in dimensione n = 2 è dato dall’insieme chiuso o n 1 : x ∈ (0, 1] = E0 ∪ E1 . E = (0, t) : −1 ≤ t ≤ 1 ∪ x, sin x Mostriamo che E è connesso. Supponiamo che E = (E ∩ A) ∪ (E ∩ A0 ) con A, A0 aperti, disgiunti in E e aventi intersezione non vuota con E. Allora E1 è unione disgiunta E1 = (E1 ∩ A) ∪ (E1 ∩ A0 ) . Essendo E1 connesso per l’esempio precedente, uno dei due termini dell’unione deve essere vuoto, e dunque E1 è contenuto o in A o in A0 . Lo stesso vale per E0 , che pure è connesso per l’esempio 1. Quindi, dato che A e A0 hanno intersezione non vuota con E, deve essere E0 ⊆ A e E1 ⊆ A0 , o viceversa. Supponiamo che sia vera la prima delle due alternative. Prendendo ad esempio x = (0, 0) ∈ E0 , questo vuol dire che esiste r > 0 tale che Br (x) ⊆ A e quindi Br (x) non può contenere punti di E1 (che sono tutti contenuti in A0 , che è disgiunto da A ∩ E). Questo è assurdo, perché x è punto di accumulazione di punti in E1 e quindi E1 ∩ Br (x) è non vuoto. Quindi E è connesso. Tuttavia non è connesso per archi, perché non esiste alcun arco con sostegno in E congiungente il punto (0, 0) ∈ E0 con un punto y ∈ E1 (la dimostrazione, non del tutto banale, è lasciata per esercizio22). 22Traccia della dimostrazione per y = (1, sin 1): sia γ = (γ , γ ) : [a, b] → E un arco continuo con γ(a) = (0, 0) e 1 2 γ(b) = (1, sin 1). Dato che γ1 (a) = 0 e γ1 (b) = 1 possiamo definire a∗ come il massimo dei t ∈ [a, b] tale che γ1 (t) = 0. È evidente che a∗ < b; a seconda del segno di γ2 (a∗ ), scegliamo tn ∈ (a∗ , b] tali che γ1 (tn ) = (±π/2 + 2nπ)−1 , in modo che sin(γ1 (tn )) ∈ {−1, 1} disti almeno 1 da γ2 (a∗ ). È semplice verificare che ogni punto limite di (tn ) vale a∗ , 10. ESERCIZI 116 Mostriamo infine che, per aperti di Rn (e più in generale di uno spazio vettoriale normato, o di uno spazio metrico connesso per archi), connessione e connessione per archi si equivalgono. Teorema 5.63. Sia A ⊆ Rn aperto. Allora A è connesso se e solo se è connesso per archi. Dimostrazione. Avendo a disposizione la Proposizione 5.62, rimane da dimostrare che se A è connesso allora è connesso per archi. Fissato un punto x0 ∈ A, si consideri l’insieme A0 degli x ∈ A che si possono congiungere a x0 con un arco con sostegno contenuto in A. Tale insieme è non vuoto perché contiene almeno x0 stesso. Dimostriamo che A0 è aperto. Fissato x ∈ A0 , si prenda una palla Br (x) contenuta in A. Ogni punto y ∈ Br (x) si può congiungere a x0 nel modo seguente: per ipotesi esiste un arco γ : [a, b] −→ A con γ(a) = x0 e γ(b) = x. Definiamo allora un nuovo arco δ : [a, b + 1] −→ A ponendo ( γ(t) se t ∈ [a, b] , (9.1) δ(t) = x + (t − b)(y − x) se t ∈ (b, b + 1] . In questo modo si percorre, per t ∈ [b, b + 1], il segmento congiungente x a y. Si vede facilmente che δ è continua, e dunque è un arco. Essendo x arbitrario, questo prova che A0 è aperto. Dimostriamo ora che A0 è anche chiuso in A, o, in modo equivalente, che A1 = A \ A0 è aperto. Se x ∈ A1 , si prenda una palla Br (x) contenuta in A e si fissi un punto y ∈ Br (x). Se fosse y ∈ A0 , esso sarebbe congiungibile a x0 con un arco in A. Ma allora la stessa costruzione usata in (9.1) (scambiando x con y) consentirebbe di congiungere x0 a x, il che è assurdo. Essendo A connesso ed essendo A0 un suo sottoinsieme aperto, chiuso e non vuoto, deve essere A0 = A. Dunque ogni punto di A è congiungibile a x0 con un arco in A. Per l’arbitrarietà di x0 si ha la conclusione. Una dimostrazione un po’ diversa si può dare come segue: definiamo una relazione x ∼ y se x è congiungibile a y con un arco contenuto in A; con una operazione di concatenazione di archi simile a quella in (9.1) (dove abbiamo concatenato γ con un arco rettilineo) si mostra che questa è una relazione di equivalenza. Ora, proprio la costruzione in (9.1) mostra che le classi di equivalenza sono aperte. Ma allora, se ve ne fosse più di una, prendendo una classe e l’unione di tutte le altre avremmo sconnesso A. Quindi esiste una sola classe, i.e. tutti i punti sono connettibili a tutti gli altri. Si osservi anche che, se definissimo A0 come l’insieme degli x ∈ A congiungibili a x0 con una curva lineare a tratti, otterremmo lo stesso risultato, quindi la tesi vale in maniera più forte: per ogni aperto connesso A e per ogni coppia di punti x, y ∈ A esiste una curva lineare a tratti congiungente x a y e interamente contenuta in A. Attraverso un’ulteriore approssimazione, è poi possibile ottenere curve completamente liscie, i.e. derivabili infinite volte. 10. Esercizi 10.1. Topologia di Rn . Esercizio 5.1. Si dica cosa sono la chiusura, l’apertura e la frontiera di Q e di R \ Q. visto che a∗ è l’unico punto in [a∗ , b] ove γ1 si annulla, quindi tn → a∗ . Considerando i limiti di γ2 (tn ) = sin(γ1 (tn )) per n → ∞ si ha una contraddizione. 10. ESERCIZI 117 Esercizio 5.2. Si provi che gli unici sottoinsiemi di R sia aperti che chiusi sono il vuoto e R stesso. Esercizio 5.3. Si provi che l’interno di un insieme A ⊆ R è l’unione di tutti gli aperti contenuti in A. Esercizio 5.4. Dati gli insiemi A, B ⊆ R, si determinino le relazioni tra le seguenti coppie di insiemi A∪B e A∪B, A∩B e A∩B, e A∪B, e A∩B. ◦ A∪B ◦ A∩B ◦ ◦ ◦ ◦ Esercizio 5.5. Dato A ⊆ R, si dimostrino le relazioni ◦ ◦ ◦ A = A, ◦ c A = Ac , ◦ c A = Ac , A = A, ◦ c Ac = A ◦ c A = A c , , ◦ A = A ∪ ∂A, A = A \ ∂A . Esercizio 5.6. Sia A ⊆ R, si dica se sono vere o false le seguenti relazioni: ∂A = ∂(Ac ), ◦ ∂A = ∂A, ∂A = ∂ A, ∂A = ∂A, ∂A = A ∩ Ac , ∂∂A ⊆ ∂A . Esercizio 5.7. Si provi che per A ⊆ R è aperto, ∂A ⊆ Ac , A = A \ ∂A . Esercizio 5.8. Si provi che per A ⊆ R, ∂A = (A ∩ Ac ) ∪ (A \ A) . Esercizio 5.9. Si provi che per A, B ⊆ R, ∂(A ∪ B) ⊆ ∂A ∪ ∂B ⊆ ∂(A ∪ B) ∪ A ∪ B . Esercizio 5.10. Sia A ⊆ R limitato, si provi che sup(A) ∈ ∂A. Esercizio 5.11. Sia A ⊆ R, quanti insiemi diversi ci possono essere nella seguente sequenza? A, ∂A, ∂∂A, ∂∂∂A, . . . Esercizio 5.12. Qual è la cardinalità della famiglia degli insiemi aperti di R? E quella della famiglia dei chiusi? 10. ESERCIZI 118 Esercizio 5.13. ◦ Si provi che se A è un sottoinsieme aperto contenuto in B ⊆ R si ha A ⊆ B Esercizio 5.14. F Trovare un insieme A di R tale che i seguenti 7 sottoinsiemi di R risultino tutti distinti: A, A, ◦ ◦ ◦ ◦ ◦ ◦ ◦ A, A A, A, A. Dimostrare inoltre che non se ne possono creare altri proseguendo nella stessa maniera. Esercizio 5.15. Se A e B sono due sottoinsiemi aperti di R, l’insieme A + B = {x + y : x ∈ A, y ∈ B} è aperto? Si discuta anche il caso in cui uno solo dei due insiemi A, B è aperto. Esercizio 5.16. Se A e B sono due sottoinsiemi chiusi di R, l’insieme A + B = {x + y : x ∈ A, y ∈ B} è chiuso? Si discuta anche il caso in cui uno dei due insiemi A, B è compatto. Esercizio 5.17. Si provi che ogni aperto di R è un’unione numerabile di intervalli aperti a due a due disgiunti. Esercizio 5.18. F Si provi che ogni chiuso di R è un’intersezione numerabile di aperti di R. Esercizio 5.19. FF Si provi che non è possibile ottenere R o un intervallo I ⊆ R come unione numerabile di intervalli chiusi e limitati, a due a due disgiunti. Esercizio 5.20 (Teorema di Baire). FF Si provi che non è possibile ottenere R o un intervallo I ⊆ R come unione numerabile di sottoinsiemi chiusi con parte interna vuota. Esercizio 5.21. FF Si provi l’intersezione di una famiglia numerabile di aperti densi di R è non vuota. È un insieme denso? Si provi un’unione numerabile di sottoinsiemi chiusi di R con parte interna vuota ha parte interna vuota. Nota. Un insieme si dice di prima categoria se è un’unione numerabile di sottoinsiemi chiusi con parte interna vuota, di seconda categoria altrimenti. Esercizio 5.22. Si provi che se A ⊆ R è composto solo da punti isolati allora ha cardinalità al più numerabile. Più in generale, si mostri che l’insieme dei punti isolati di un qualunque insieme A ⊆ R è al più numerabile. Esercizio 5.23. Si diano esempi di: • un sottoinsieme infinito di R senza punti di accumulazione, • un insieme non vuoto A ⊆ R tale che A ⊆ A0 , • un insieme A ⊆ R con infiniti punti di accumulazione e tale che A ∩ A0 = Ø, • un insieme non vuoto A ⊆ R tale che ∂A = A. 10. ESERCIZI 119 Esercizio 5.24. Si provi che l’insieme derivato A0 di un insieme A ⊆ R è chiuso e che A = A ∪ A0 . Esercizio 5.25. Si provi che un insieme A è chiuso se e solo se A0 ⊆ A. Esercizio 5.26. Si provi che vale la relazione (A)0 = A0 . Esercizio 5.27. Si provi la relazione (A ∪ B)0 = A0 ∪ B 0 . Esercizio 5.28. Si provi che ogni sottoinsieme di R di cardinalità del continuo ha insieme derivato non vuoto. Esercizio 5.29. F Si provi che se l’insieme derivato A0 di un insieme A ⊆ R è finito, l’insieme A è numerabile. La stessa conclusione vale se A0 è numerabile? Esercizio 5.30. F Si diano esempio di insiemi A ⊆ R tali che A00 6= A0 . Per quali n ∈ N la successione A, A0 , A00 A000 . . . può avere i primi n insiemi tutti diversi tra loro? Può esserci una successione composta di insiemi tutti diversi tra loro? Esercizio 5.31. FF Si dimostri che un sottoinsieme perfetto e non vuoto di Rn non può essere numerabile. Esercizio 5.32. Si provi che A ⊆ R è compatto se e solo se ogni suo sottoinsieme infinito ha un punto di accumulazione in A. Esercizio 5.33. Si provi che ogni successione di Cauchy in un compatto A ⊆ R converge in A. Esercizio 5.34. Se A ⊆ R è infinito e A0 consiste di un singolo punto, allora A è compatto? Esercizio 5.35. F Dimostrare che C ⊆ R è compatto se e solo se, data una qualunque famiglia {Ai }i∈I di insiemi aperti che ricopre C (cioè C ⊆ ∪i∈I Ai ), esiste una sottofamiglia finita {Ai1 , Ai2 , . . . , Ain } che ricopre ancora C. Esercizio 5.36. Si dia un esempio di una famiglia di insiemi aperti che ricopre l’intervallo (0, 1) che non abbia una sottofamiglia finita che ricopre ancora (0, 1). Esercizio 5.37 (Insieme di Cantor). Si consideri la successione di insiemi di R definita per ricorrenza da I1 = [0, 1] e In 2 In In+1 = ∪ + . 3 3 3 (1) Si provi che In è l’unione di 2n intervalli chiusi disgiunti di lunghezza 3−n . 10. ESERCIZI 120 S (2) si mostri che C = n∈N In (insieme di Cantor) è un chiuso non vuoto e se ne determini la cardinalità. (3) Si mostri che x ∈ R appartiene a C se e solo se esiste una successione an tale che an ∈ {0, 2} e ∞ X x= an 3−n . n=0 Esercizio 5.38. Dimostrare che l’insieme di Cantor è perfetto, i.e. ogni suo punto è di accumulazione. Esercizio 5.39. Sia E il sottoinsieme di [0, 1] dei numeri tali che nella loro espansione decimale contengano solo le cifre 4 e 7. L’insieme E è denso in [0, 1]? Compatto? Perfetto? Esercizio 5.40. Si provi che se C1 , C2 sono due chiusi disgiunti di Rn , allora esistono due aperti A1 ⊇ C1 e A2 ⊇ C2 tali che A1 ∩ A2 = Ø. Esercizio 5.41. Sia F1 ⊇ F2 ⊇ · · · ⊇ Fn ⊇ . . . una successione di chiusi non vuoti di Rn . Si provi che se almeno uno degli Fn è limitato, allora ∩∞ n=1 Fn è non vuoto. Esercizio 5.42. Sia AS⊆ Rn aperto, dimostrare che esiste una successione Kn di compatti con Kn ⊂ K̊n+1 tale che A= ∞ 1 Kn . 10.2. Spazi Metrici, Normati e Topologici. Esercizio 5.43. Sia (X, d) uno spazio metrico costituito da tre punti, si provi che si può immergere isometricamente in R2 . Si mostri un esempio di spazio metrico (X, d) costituito da quattro punti che non si può immergere isometricamente in nessun Rn e si discutano condizioni per cui invece ciò sia possibile. Esercizio 5.44. Sia X un insieme infinito. Per p, q ∈ X si ponga ( 1 d(p, q) = 0 se p 6= q, se p = q. Si provi che d è una metrica (detta metrica discreta) completa e si determinino gli aperti, i chiusi, i limitati, i connessi e i compatti dello spazio metrico (X, d). Si mostri inoltre che ogni punto è isolato e che una successione è convergente se e solo se è costante. Esercizio 5.45. Sia (X, d) uno spazio metrico e si definisca d(A, B) = inf d(a, b) : a ∈ A, b ∈ B , per ogni coppia di sottoinsiemi A e B di X. Si provi che d non è una distanza su P(X) e che esistono due chiusi A e B disgiunti con d(A, B) = 0. Esercizio 5.46. Dati x, y ∈ R si definiscano d1 (x, y) = (x − y)2 , 10. ESERCIZI d2 (x, y) = 121 p |x − y| , d3 (x, y) = |x2 − y 2 | , d4 (x, y) = |x − 2y| , d5 (x, y) = |x − y| . 1 + |x − y| Si determinino quali di queste funzioni sono metriche su R. Esercizio 5.47. Dati x, y ∈ Rn si definiscano n X d1 (x, y) = |xi − yi | , i=1 d2 (x, y) = n X |xi − yi |2 1/2 , i=1 d∞ (x, y) = max |xi − yi | . i=1,2,...,n Si mostri che sono metriche e che vale d∞ (x, y) ≤ d2 (x, y) ≤ d1 (x, y) ≤ nd∞ (x, y) . Esercizio 5.48. Due metriche d e δ su X si dicono equivalenti se esiste una costante C > 0 tale che Cd(x, y) ≤ δ(x, y) ≤ 1 d(x, y) C per ogni x, y ∈ X. Si provi che d e δ determinano la stessa topologia su X e che le loro successioni di Cauchy coincidono. Esercizio 5.49. Per ogni x, y ∈ R poniamo d(x, y) = • • • • Si Si Si Si x y − . 1 + |x| 1 + |y| provi che d è una distanza su R. mostri che (R, d) non è completo. mostri che d induce su R la topologia usuale mostri che il completamento di (R, d) è omeomorfo a [0, 1]. Esercizio 5.50. Dato uno spazio metrico (X, d) si definiscano d0 (x, y) = d(x, y) , 1 + d(x, y) d00 (x, y) = min{d(x, y), 1} , per ogni x, y ∈ X, e si provi che sono distanze su X, non equivalenti a d, ma che ma determinano la stessa topologia su X e le loro successioni di Cauchy coincidono. Esercizio 5.51. Sia (X, d) uno spazio metrico e xn una successione di Cauchy. Si provi che se xn ha una sottosuccessione convergente, allora tutta la successione è convergente. 10. ESERCIZI 122 Esercizio 5.52. Siano (X1 , d1 ) e (X2 , d2 ) due spazi metrici. Si mostri che la topologia prodotto su X1 × X2 coincide con quella generata dalla distanza δ((x1 , x2 ), (y1 , y2 )) = d1 (x1 , y1 ) + d2 (x2 , y2 ) , dove (x1 , x2 ), (y1 , y2 ) ∈ X1 × X2 . Esercizio 5.53. Sia (X, d) uno spazio metrico. Si provi che d : X × X → R è continua. È anche Lipschitziana? Esercizio 5.54. Dato uno spazio metrico (X, d) e un suo sottoinsieme A non vuoto, si definisca la funzione distanza da A come dA (x) = inf d(x, y) . y∈A (1) (2) (3) (4) (5) Dimostrare che la funzione dA è ben definita e Lipschitziana. Si provi che dA = dA . Si dimostri che {x ∈ X : dA (x) = 0} = A. Si provi che ogni aperto di X è un’unione numerabile di chiusi. Se X = Rn e dA (x) = r si provi che esiste y ∈ A tale che d(x, y) = r. Se inoltre A è chiuso si mostri che per ogni x ∈ Rn esiste almeno un punto y ∈ A di distanza minima da x. (6) Se X = Rn e A è un chiuso non vuoto, si provi che {x ∈ X : dA (x) ≤ r} = A + Dr dove Dr è il disco chiuso di raggio r in Rn . (7) Se X = Rn e A è un convesso chiuso non vuoto, si provi che la funzione dA è convessa e per ogni x ∈ Rn il punto y ∈ A di distanza minima da x è unico. Esercizio 5.55. Sia p ∈ N un numero primo e per ogni x ∈ Q \ {0} con x = apn /b, dove a, b sono interi non divisibili per p, sia ord(x) = n. Definiamo ( p−ord(x) se x ∈ Q \ {0} , |x|p = 0 se x = 0 . Sia poi d : Q × Q → R definita da d(x, y) = |x − y|p . • Si mostri che per ogni x, y, z ∈ Q si ha d(x, z) ≤ max{d(x, y), d(y, x)}. • Si mostri che d è una distanza su Q. • Si dica se (Q, d) è uno spazio metrico completo. • Sia (Q, d) il completamento di (Q, d). Si dica se i limitati di (Q, d) sono compatti. Nota. Questa distanza prende il nome di distanza p–adica su Q. Esercizio 5.56. Sia X l’insieme delle successioni a valori in [−1, 1]. Per A = (an ) e B = (bn ) si ponga d(A, B) = ∞ X 2−n |an − bn | . n=0 Si dimostri che (X, d) è uno spazio metrico e che una successione Ak = (akn ) di elementi di X converge a un elemento limite A = (an ) se e solo se per ogni n ∈ N si ha limk→∞ akn = an . È uno spazio completo? 10. ESERCIZI 123 Esercizio 5.57. Sull’insieme GL(n, R) delle matrici n × n si consideri la funzione d(A, B) = kAx − Bxk . sup x∈Rn , kxk=1 Si mostri che d è una distanza completa su GL(n, R). Data una successione di matrici Ai , si mostri che An → A rispetto a d se e solo se tutte le “entrate” (An )ij di An convergono alle entrate Aij di A. La distanza d è equivalente alla distanza Euclidea n X 1/2 dE (A, B) = |Aij − Bij |2 ? i,j=1 Esercizio 5.58 (Distanza di Hausdorff). Sia (X, d) uno spazio metrico e si indichi con K(X) l’insieme dei suoi sottoinsiemi compatti e non vuoti. Fissati due compatti K e K 0 si definisce la loro distanza come l’inf su r > 0 tali che l’r–intorno di K contiene K 0 e l’r–intorno di K 0 contiene K. In formule, δ(K, K 0 ) = inf{r ∈ R : K 0 ⊆ Ur (K) e K ⊆ Ur (K 0 )} . Si mostri che δ è una distanza su K(X), detta distanza di Hausdorff. Si calcoli in K(R) la distanza tra le seguenti coppie di compatti: [0, 1], [0, 1], [2, 3] ; [0, 1/2] ; [0, 1], C; {1/2}, C, dove C è l’insieme di Cantor. Esercizio 5.59. Si mostri che una definizione equivalente della distanza di Hausdorff tra due compatti K e K 0 è data da δ(K, K 0 ) = sup {d(x, K 0 ) : x ∈ K} ∪ {d(x0 , K) : x0 ∈ K 0 } . Esercizio 5.60. Si mostri che una successione Kn di compatti di (X, d) converge in (K(X), δ) ad un compatto K ⊆ X se e solo se le due seguenti condizioni si verificano: • per ogni successione (xn(k) ) tale che xn(k) ∈ Kn(k) , esiste una sottosuccessione convergente ad un elemento x appartenente a K; • per ogni x ∈ K esiste una successione xn → x con xn ∈ Kn . Si calcoli, se esiste, il limite in K(R) delle seguenti successioni di compatti: Kn = {1/n} , Kn = [1/n, n] , Kn = [1/n, 1 − 1/n] e, se esiste, il limite in K(R2 ) di Kn = {(x, y) : |x|n + |y|n ≤ 1} , Kn = {(e−t/n cos t, e−t/n sin t) t ≥ 0} . 10. ESERCIZI 124 Esercizio 5.61. Sia Kn una successione decrescente Kn+1 ⊆ Kn di compatti di uno spazio metrico (X, d). Si mostri che tale successione ammette limite in (K(X), δ) uguale a ∩n∈N Kn . Si consideri la seguente successione di compatti definita per ricorrenza I0 = [0, 1], In+1 = 1/3In ∪ (2/3 + 1/3In ) e se ne calcoli il limite. Esercizio 5.62. F Sia (X, d) uno spazio metrico compatto, si mostri che allora anche (K(X), δ) è compatto. Esercizio 5.63. F Sia Kn una successione di Cauchy in in (K(X), δ), con (X, d) spazio metrico completo. Si mostri che per ogni k ∈ N l’insieme [ Kn Bk = n≥k è compatto. Si provi che esiste B = limk→∞ Bk e che B = limn→∞ Kn , se ne deduca che (K(X), δ) è completo. Esercizio 5.64. Si mostri che la funzione F : K(X) → R che associa ad ogni compatto di uno spazio metrico (X, d) il suo diametro, dato da diam(K) = supx,y∈K d(x, y), è continua. Esercizio 5.65. Sia Kn una successione in (K(X), δ) convergente a K. Se tutti i Kn sono connessi, anche K è connesso? Esercizio 5.66. Siano f1 , f2 , . . . , fn : (X, d) → (X, d) funzioni Lipschitziane di costante r < 1. • Si mostri che per ogni i ∈ {1, 2, . . . , n} la mappa fi,∗ : K(X) → K(X) definita da fi,∗ (K) = fi (K) è Lipschitziana di constante r. • Si mostri che la mappa F : K(X) → K(X) definita da F (K) = f1 (K) ∪ f2 (K) ∪ · · · ∪ fn (K) è Lipschitziana di constante r. • Si deduca che se (X, d) è completo esiste un unico compatto non vuoto K ⊆ X tale che K = f1 (K) ∪ f2 (K) ∪ · · · ∪ fn (K) . • Nel caso speciale X = [0, 1] con l’usuale distanza Euclidea, si determinino f1 e f2 tale che l’unico insieme K ⊆ [0, 1] con K = f1 (K) ∪ f2 (K) sia l’insieme di Cantor. Esercizio 5.67. Sia V uno spazio vettoriale normato con una norma k · k. Si mostri che l’operazione somma + : V × V → V è continua. Esercizio 5.68. Sia V uno spazio vettoriale normato con una norma k · k. Si mostri che d(x, y) = kx − yk definisce una distanza su V . Se lo spazio metrico (V, d) è completo, si dice spazio di Banach. 10. ESERCIZI 125 Esercizio 5.69. Sia V uno spazio vettoriale con una metrica d. Si discutano le condizioni su d per cui la mappa k · k = d(·, 0) è una norma e d(x, y) = kx − yk. Esercizio 5.70. Sia V uno spazio vettoriale con una norma k · k. Si mostri che la palla unitaria di V è convessa. Si discutano le condizioni per cui un convesso di V è la palla unitaria di una qualche norma. Esercizio 5.71. Provare che per ogni x, y ∈ Rn vale l’identità 2kxk2 + 2kyk2 = kx + yk2 + kx − yk2 , detta identità del parallelogramma . Esercizio 5.72. Dati x, y ∈ Rn si definiscano kxk1 = kxk2 = n X |xi | , i=1 n X |xi |2 1/2 , i=1 kxk∞ = max |xi | . i=1,2,...,n Si mostri che sono norme e che vale kxk∞ ≤ kxk1 ≤ √ nkxk2 ≤ nkxk∞ . Esercizio 5.73. Siano V1 e V2 due spazi vettoriali con norme k · k1 e k · k2 , rispettivamente. Si mostri che la mappa k · k : V1 × V2 → R, definita da k(x1 , x2 )k = kx1 k1 + kx2 k2 dove x1 ∈ V1 , x2 ∈ V2 è una norma sullo spazio vettoriale V1 × V2 . Esercizio 5.74. Sia V è uno spazio vettoriale, un prodotto scalare su V è una forma bilineare h·|·i : X × X → R tale che hx|xi ≥ 0 ed è uguale a zero se e solo se x = 0. Si provi che vale |hx|yi|2 ≤ hx|xi · hy|yi 1/2 e che x 7→ hx|xi è una norma su V . Esercizio 5.75. Si mostri che una norma k · k su uno spazio vettoriale V viene da un prodotto scalare h· | ·i se e solo se vale l’identità del parallelogramma 2kxk2 + 2kyk2 = kx + yk2 + kx − yk2 , per ogni x, y ∈ V . Se lo spazio V è completo con la distanza indotta da tale norma si dice spazio di Hilbert. 10. ESERCIZI 126 Esercizio 5.76. Si provi che due norme k · k1 e k · k2 su uno stesso spazio vettoriale V inducono la stessa topologia se e solo se sono equivalenti, cioè esiste una costante C > 0 tale che 1 Ckxk1 ≤ kxk2 ≤ kxk1 C per ogni x ∈ V . Esercizio 5.77. F Si provi che se V è uno spazio vettoriale di dimensione finita, tutte le norme sono equivalenti. Si dia un esempio di uno spazio vettoriale di dimensione infinita con due norme non equivalenti. Esercizio 5.78. Si provi che se V è uno spazio vettoriale normato e W un suo sottospazio vettoriale di dimensione finita, si provi che W è un chiuso di V . Si costruisca un esempio esplicito di uno spazio vettoriale e di un suo sottospazio vettoriale non chiuso. Esercizio 5.79. Sia V è uno spazio vettoriale normato con norma k · k. Si mostri che le seguenti due condizioni sono equivalenti: • V con la distanza d(x, y) = kx − yk è uno spazio metrico completo; • per ogni sequenza xn si ha ∞ ∞ X X kxn k < +∞ =⇒ xn converge. n=1 n=1 Esercizio 5.80. Sia V uno spazio vettoriale normato. Si mostri che la norma è una funzione convessa. Esercizio 5.81. P Per p ≥ 1, su Rn definiamo la mappa x 7→ |x|p = ni=1 |xi |p . Si provi che | · |p è una norma e che la topologia indotta è quella usuale di Rn . Lo stesso per la mappa x 7→ |x|∞ = max{|xi |}. Si disegni la palla unitaria per tutte queste norme. Esercizio 5.82. F Si mostri che la palla unitaria chiusa di uno spazio normato o di Banach di dimensione infinita non è compatta. Esercizio 5.83. Si considerino gli spazi vettoriali `∞ = {x ∈ RN : sup |xn | < +∞} , n∈N N c = {x ∈ R N c0 = {x ∈ R : esiste finito lim xn } , n→∞ : lim xn = 0} . n→∞ Si mostri che |x|∞ = supn∈N |xn | è una norma per questi spazi che li rende spazi di Banach. Esercizio 5.84. Dato p ∈ [1, +∞), si consideri lo spazio vettoriale ∞ n o X p N ` = x∈R : |xn |p < +∞ . n=1 10. ESERCIZI Si mostri che |x|p = P ∞ p n=1 |xn | 1/p 127 è una norma su `p che lo rende uno spazio di Banach. Esercizio 5.85. Si mostri che nessuna palla di `2 è compatta. Si trovi una successione xk non convergente in `2 tale che per ogni n ∈ N la successione numerica xkn converge a zero. Esercizio 5.86. Sia F un sottoinsieme di uno spazio metrico compatto. Si provi che F è compatto se e solo se è chiuso. Esercizio 5.87. Si provi che uno spazio vettoriale normato localmente compatto è completo. Esercizio 5.88 (Numero di Lebesgue). Sia (X, d) uno spazio metrico. Dato un ricoprimento di X con una famiglia di aperti U = {Ui } si definisca il numero di Lebesgue del ricoprimento U come il sup dei ρ ∈ R+ tali che per ogni x ∈ X, esiste un aperto Ui che contiene la palla aperta di centro x e raggio ρ, se un tale ρ positivo non esiste diciamo che il ricoprimento ha numero di Lebesgue zero. Si mostri che se (X, d) è compatto, ogni suo ricoprimento ha numero di Lebesgue positivo. Esercizio 5.89. Sia F1 ⊇ F2 ⊇ · · · ⊇ Fn ⊇ . . . una successione di compatti non vuoti di uno spazio metrico (X, d). Si provi che ∩∞ n=1 Fn è non vuoto. Esercizio 5.90. Uno spazio metrico si dice separabile se contiene un sottoinsieme numerabile denso. Si mostri che Rn è separabile. Esercizio 5.91. F Si provi che ogni spazio metrico compatto è separabile. Esercizio 5.92. Sia K un sottoinsieme di uno spazio metrico (X, d). Si provi che le tre seguenti condizioni sono equivalenti. • Ogni successione xn ∈ K ha una sottosuccessione convergente a x ∈ K (compattezza sequenziale). • Da ogni famiglia di aperti che ricopre K si può estrarre una sottofamiglia finita che lo ricopre (compattezza per ricoprimenti, o semplicemente compattezza). • L’insieme K è completo e per ogni ε > 0 esiste un insieme finito di punti x1 , x2 , . . . , xn ∈ K tale che K ⊆ ∪ni=1 B(xi , ε) (totale limitatezza). Esercizio 5.93. Si provi che uno spazio metrico è separabile se e solo se ha una base numerabile della sua topologia. Esercizio 5.94. Si provi che ogni spazio metrico compatto ha una base numerabile della sua topologia. Esercizio 5.95. Si provi che se in uno spazio metrico possiamo trovare una famiglia più che numerabile di aperti non vuoti a due a due disgiunti, lo spazio non è separabile. 10. ESERCIZI 128 Esercizio 5.96. Si mostri che lo spazio metrico `∞ non è separabile. Si provi che tutti gli spazi `p , per p ≥ 1, sono separabili. E gli spazi c e c0 ? Esercizio 5.97. Sia X lo spazio delle funzioni continue da R in [0, 1] con la distanza d∞ (f, g) = sup |f (x) − g(x)| , x∈R detta distanza uniforme. Si provi che tale spazio non è separabile, quindi la sua topologia non ha base numerabile. Cambia qualcosa considerando invece lo spazio delle funzioni continue da [0, 1] in sé? Esercizio 5.98 (Teorema di Lindelöf). F Si provi che se (X, d) è uno spazio metrico separabile, allora da ogni ricoprimento aperto di X si può estrarre un sottoricoprimento numerabile. Vale anche il viceversa? Esercizio 5.99. F Si dia un esempio di uno spazio metrico che non soddisfa il secondo assioma di numerabilità, cioè tale che la sua topologia non abbia una base numerabile. Esercizio 5.100 (Teorema di Baire). F Si provi che se (X, d) è uno spazio metrico completo, non è possibile ottenere X come unione numerabile di sottoinsiemi chiusi con parte interna vuota. Esercizio 5.101. F Si provi che se (X, d) è uno spazio metrico completo, allora l’intersezione di una famiglia numerabile di aperti densi di X è un insieme denso. Si provi che un’unione numerabile di sottoinsiemi chiusi di X con parte interna vuota ha parte interna vuota. Esercizio 5.102. ◦ ∞ F è un aperto Sia (X, d) uno spazio metrico completo, se X = ∪∞ F con F chiusi, allora ∪ n n n=1 n=1 n denso di X. Esercizio 5.103. FF Si provi che ogni chiuso di uno spazio metrico separabile è l’unione disgiunta di un insieme perfetto e di un numerabile. Inoltre, tale decomposizione è unica. Esercizio 5.104. Sia (X, d) uno spazio metrico contenente almeno due punti. Si mostri che se X è connesso, allora la sua cardinalità è almeno quella del continuo. Esercizio 5.105. Si mostri che la palla unitaria e la sfera unitaria di Rn , se n ≥ 2 sono spazi connessi. Esercizio 5.106. La chiusura e la parte interna di un sottoinsieme connesso di uno spazio metrico (topologico) sono connessi? Esercizio 5.107. F Si mostri che se X è uno spazio metrico e An è una famiglia di sottoinsiemi connessi di X tali che ∞ ∩∞ n=1 An 6= Ø, allora ∪n=1 An 6= Ø è connesso. 10. ESERCIZI 129 Esercizio 5.108. Si consideri sullo spazio X la relazione x ∼ y se esiste un sottoinsieme connesso di X che contenga x e y. Si mostri che tale relazione è di equivalenza. Le classi di equivalenza si dicono componenti connesse di X. Esercizio 5.109. Si mostri che le componenti connesse sono chiuse. Sono anche aperte? Esercizio 5.110. Sia (X, d) uno spazio metrico e sia An una successione di sottoinsiemi non vuoti di X tali che An+1 ⊆ An e sia A = ∩∞ n=1 An . • Si provi che se ogni An è compatto e connesso, allora A è compatto, connesso e non vuoto. • Si provi che ci sono casi in cui tutti gli An sono connessi per archi ma A è non vuoto e non connesso. • Si provi che ci sono casi in cui tutti gli An sono compatti e connessi per archi ma A non è connesso per archi. 10.3. Funzioni Continue. Esercizio 5.111. Una funzione f : R → R che trasforma ogni successione xn convergente in una successione convergente f (xn ), è necessariamente continua? Esercizio 5.112. Se f : R → R porta intervalli in intervalli, si può concludere che f è continua? Esercizio 5.113. Se f : R → R porta aperti in aperti, si può concludere che f è continua? E chiusi in chiusi? Esercizio 5.114. Sia f : R → R una funzione tale che f 3 + 2f + 1 è una funzione continua. Si provi che allora f è continua. Esercizio 5.115. Sia f : R → R una funzione tale che f lim sup xn = lim sup f (xn ) n→∞ n→∞ per ogni successione limitata di numeri reali xn . Dimostrare che f è continua e monotona. Esercizio 5.116. F Sia f : R → R una funzione surgettiva tale che per ogni successione xn non convergente, la successione f (xn ) è non convergente. Si provi che allora f è continua. Esercizio 5.117. F Sia f : R → R una funzione tale che lim [f (x + h) − f (x − h)] = 0 h→0+ per ogni x ∈ R. La funzione f è allora continua? Esercizio 5.118. Si mostri che una funzione continua f : C → R su un chiuso C di uno spazio metrico (X, d) si può estendere ad una funzione continua su tutto X. 10. ESERCIZI 130 Esercizio 5.119. Sia f : R → R continua, si discuta se f e f −1 come funzioni insiemistiche, mandano aperti in aperti, chiusi in chiusi, limitati in limitati, densi in densi, perfetti in perfetti, compatti in compatti, connessi in connessi, di I/II categoria in I/II categoria, etc.. ed eventualmente si trovino ipotesi che lo garantiscano. Si discutano le stesse questioni per funzioni continue f : X → Y dove X, Y siano due spazi metrici o topologici. Esercizio 5.120. Si discutano le stesse questioni del problema precedente se V e W sono due spazi normati (o di Banach) e f : V → W è un’applicazione lineare e continua. Esercizio 5.121. Sia f : R → R continua, si discutano le relazioni tra le seguenti coppie di insiemi ed eventualmente si trovino ipotesi che ne garantiscano l’uguaglianza: f (A) e f (A), f (A◦ ) e f (A)◦ , f (∂A) e ∂f (A), f (A0 ) e f (A)0 , f −1 (A) e f −1 (A), f −1 (A◦ ) e f −1 (A)◦ , f −1 (∂A) e ∂f −1 (A), f −1 (A0 ) e f −1 (A)0 . Si discutano le stesse questioni per funzioni continue f : X → Y dove X, Y siano due spazi metrici o topologici. Si discutano le stesse questioni se V e W sono due spazi normati (o di Banach) e f : V → W è un’applicazione lineare e continua. Esercizio 5.122. Sia f : R → R limitata e sia Γ(f ) = {(x, y) ∈ R2 : y = f (x)} il grafico di f . Si mostri che f è continua se e solo se Γ(f ) è un chiuso di R2 . La conclusione vale anche se f non è limitata? Esercizio 5.123. Sia V uno spazio vettoriale con una norma k · k che viene da un prodotto scalare h· | ·i. Si mostri che le funzioni f : X × X → X, g : X × X → R e h : X × R → X date da f (x, y) = x + y, g(x, y) = hx|yi e h(x, λ) = λx sono funzioni continue. Esercizio 5.124. Siano (X, d) e (Y, δ) due spazi metrici di cui X compatto, T : X → Y e S : Y → X due isometrie (cioè δ(T (x), T (y)) = d(x, y) per ogni coppia x, y ∈ X e lo stesso per S). Provare che allora T ed S sono iniettive e surgettive. Esercizio 5.125. F Sia f : X → X un’isometria di uno spazio metrico (X, d), si provi che f è iniettiva ma non necessariamente surgettiva. Se X è compatto si mostri che f è bigettiva. Si dia un esempio di due spazi metrici (X, d) e (Y, δ), non isometrici tra loro, per cui esistano due isometrie f : X → Y , g : Y → X. Esercizio 5.126. Si provi che l’inversa di una isometria bigettiva tra due spazi metrici è ancora un’isometria. Esercizio 5.127. Siano (X, d) e (Y, d0 ) due spazi metrici, con (X, d) compatto. Sia f : X → Y una funzione continua e iniettiva, si mostri che allora è un omeomorfismo tra X e la sua immagine f (X). 10. ESERCIZI 131 Esercizio 5.128. Siano (V1 , k · k1 ) e (V2 , k · k2 ) due spazi vettoriali normati, si mostri che una applicazione lineare A : V1 → V2 è continua se e solo se esiste una costante C > 0 tale che kA(x)k2 ≤ Ckxk1 per ogni x ∈ V1 . Esercizio 5.129. Sia f : R → R una funzione continua tale che ogni punto di R è un punto di minimo relativo per f . Dimostrare che f è costante. Esercizio 5.130. F Sia f : R → R una funzione qualunque. Si mostri che l’insieme dei suoi minimi (o massimi) stretti è al più numerabile. Esercizio 5.131. FF Si determinino le funzioni f : R → R tali che ogni punto di R è o un massimo o un minimo relativo per f e si descriva la sottoclasse delle continue con tale proprietà. Esercizio 5.132. F Si consideri una funzione f : [0, +∞) → R limitata e continua in 0, tale che f (0) = 0 e f (x) > 0 per ogni x > 0. È possibile trovare una funzione g : [0, +∞) → R che sia continua, valga g(0) = 0 e g ≥ f dappertutto? Esercizio 5.133. Sia f : R → R una funzione tale che f (x + y) = f (x) + f (y) per ogni x, y ∈ R (tale funzione si dice additiva). • Si mostri che se f è continua in almeno un punto, allora è lineare. • Si mostri che se f è monotona, allora è lineare. • Si mostri che se f è limitata in un qualche intervallo di R, allora è lineare. Esercizio 5.134. F Si mostri che esistono f : R → R additive ma non lineari. Esercizio 5.135. Sia f : R → R una funzione tale che |f (x) − f (y)| ≤ h(x − y) , dove h : R → R è una funzione tale che limx→0 h(x) = 0. Si mostri che f è continua. Esercizio 5.136. Sia f una funzione reale tale che soddisfi una delle seguenti ipotesi (1) (2) (3) (4) f (λx) = λf (x) per ogni λ ∈ Q e x ∈ R, f (xy) = f (x)f (y) per ogni x, y ∈ R, f (x + y) = f (x)f (y) per ogni x, y ∈ R, f (xy) = f (x) + f (y) per ogni x, y ∈ R∗ , è vero che se f è continua in un punto, allora è continua dappertutto? E se è solo limitata? O monotona? Assumendo f continua, si descrivano gli insiemi delle funzioni che soddisfano tali condizioni. 10. ESERCIZI 132 Esercizio 5.137. Sia f : R → R una funzione continua tale che i limiti lim f (x) x→−∞ e lim f (x) , x→+∞ esistono (finiti o infiniti) e sono uguali. Si dimostri che allora f ha minimo o massimo in R (nel senso che ne ha almeno uno dei due oppure entrambi). Esercizio 5.138. Una funzione f : X → R (lo spazio topologico R è definito da R = R ∪ {−∞, +∞} con base della sua topologia la famiglia di insiemi (a, b) , [−∞, a) , (a, +∞] , dove a, b ∈ R) con (X, d) spazio metrico, si dice semicontinua inferiormente (superiormente) – talvolta si scrive SCI (SCS) – se per ogni x0 ∈ X si ha lim inf x→x0 f (x) ≥ f (x0 ) (lim supx→x0 f (x) ≤ f (x0 )). Si mostri che le seguenti affermazioni sono equivalenti: • f è semicontinua inferiormente. • Per ogni t ∈ R, il sottolivello St = {x ∈ X : f (x) ≤ t} è un chiuso di X. • L’epigrafico E = {(x, t) ∈ X × R : f (x) ≤ t} è un chiuso di X × R. Si formuli poi l’equivalente conclusione per le funzioni semicontinue superiormente. Esercizio 5.139. Si dica se gli spazi delle funzioni semicontinue inferiormente e superiormente da R in R sono spazi vettoriali. Esercizio 5.140. Si mostri che se {fi : X → R}i∈I è una famiglia di funzioni semicontinue inferiormente, allora la funzione f : X → R, definita da f (x) = supi∈I fi (x) per ogni x ∈ X, è semicontinua inferiormente. Esercizio 5.141. F Si mostri che se f : Rn → R è semicontinua inferiormente e mai uguale a −∞, esiste una successione crescente di funzioni continue fk : Rn → R tale che limk→∞ fk (x) = f (x), per ogni x ∈ Rn . Esercizio 5.142. Si mostri che se f : X → R è una funzione semicontinua inferiormente, mai uguale a −∞, e X è uno spazio compatto, allora f assume minimo. Si discuta l’analogo enunciato per le funzioni semicontinue superiormente. Esercizio 5.143. Sia f : (a, b) → R una funzione continua e iniettiva, si mostri che deve essere monotona e che l’inversa f −1 : f (a, b) → (a, b) è continua. Esercizio 5.144. Dati n numeri reali positivi a1 , a2 , . . . , an , si mostri che la funzione Pn ap 1/p i=1 i p 7→ Mp = n definita su R∗ è continua e monotona e che • limp→0 Mp = G, dove G è la media geometrica dei valori a1 , a2 , . . . , an , • limp→−∞ Mp = min{ai }, • limp→+∞ Mp = max{ai }. 10. ESERCIZI 133 Esercizio 5.145. P Data una serie convergente a termini positivi ∞ n=1 an , si definisca la funzione ∞ X 1/p p 7→ Sp = apn n=1 per p ∈ [1, +∞). Si mostri che limp→+∞ Sp = max{an }. Esercizio 5.146. Sia f : [a, b] → R una funzione continua, si mostri che per ogni ε > 0 esiste una funzione g : [a, b] → R costante a tratti, che assume un numero finito di valori, tale che |f (x) − g(x)| < ε per ogni x ∈ [a, b]. La conclusione va modificata se invece di [a, b] si considera tutto R, oppure un intervallo aperto, assumendo che la funzione f sia o meno limitata? Se la funzione non è continua ma è soltanto limitata, cosa si può dire? Esercizio 5.147. Sia f : R2 → R data da f (x, y) = lim f (t, mt) , t→0 x2 y x4 +y 2 e sia m ∈ R. Si calcolino, se esistono, i limiti lim f (0, t) , t→0 lim f (t, t2 ) , t→0 lim f (x, y) . (x,y)→0 Esercizio 5.148. Si consideri la funzione f : (0, +∞) → R definita da ( 0 per x ∈ R+ \ Q+ , f (x) = 1 per x = pq > 0, p e q primi tra loro q e se ne discuta l’iniettività, la surgettività e i punti di continuità o di semicontinuità inferiore e superiore. Esercizio 5.149. Sia f : R → R una funzione qualunque, si dimostri che l’insieme dei punti x ∈ R dove f ha una discontinuità a salto oppure una discontinuità eliminabile è al più numerabile. Esercizio 5.150. FF Sia f : R+ → R una funzione tale che, per ogni x ∈ R+ lim f (nx) = 0. n→∞ Si può concludere allora che lim f (x) = 0 ? x→+∞ E se f è uniformemente continua? E se è solo continua? Esercizio 5.151. Dare un esempio di una funzione u : R → R tale che i suoi punti di discontinuità siano tutti e soli i numeri razionali. Una funzione u con questa proprietà può essere monotona? Esercizio 5.152. Data f : R → R, si indichi con D(f ) l’insieme dei punti in cui f non è continua. Si dimostri che D(f ) è un’unione numerabile di insiemi chiusi, cioè un Fσ . Esercizio 5.153. F Esiste una funzione f : R → R tale che i suoi punti di discontinuità siano tutti e soli i numeri irrazionali? 10. ESERCIZI 134 Esercizio 5.154. F Supponendo che lo spazio metrico (X, d) abbia un sottoinsieme denso D con parte interna vuota, si mostri che dato E ⊆ X che sia un Fσ , esiste una funzione f : X → R tale che l’insieme dei suoi punti di discontinuità D(f ) sia esattamente E. Esercizio 5.155. Una funzione ω : [0, +∞) → [0, +∞] si dice modulo di continuità se è continua in 0, ω(0) = 0 ed è monotona crescente. Si dice che ω è un modulo di continuità per f : A → R con A ⊆ R se f (x) − f (y) ≤ ω(|x − y|) ∀x, y ∈ A . Dimostrare che f è uniformemente continua se e solo se ammette un modulo di continuità finito (cioè a valori in (0, +∞)). Scrivere un modulo di continuità per una funzione Lipschitziana o Hölderiana. Esercizio 5.156. Sia F una famiglia di funzioni su R con un modulo comune di continuità finito ω e tali che f (x) = sup{f (x) : f ∈ F} < +∞ Dimostrare che allora ω è un modulo di continuità anche per la funzione f che quindi è continua. Esercizio 5.157. Data una funzione f : X → R, dove (X, d) è uno spazio metrico, si definisca la funzione oscillazione, per ogni x ∈ X, come θf (x) = inf diam f (Bε (x)) , ε>0 dove per un insieme A ⊆ R definiamo diam(A) come l’estremo inferiore delle lunghezze degli intervalli che contengono A. (1) Si mostri che θf (x) = inf sup{f (Bε (x))} − inf{f (Bε (x))} . ε>0 (2) Si mostri che θf (x) = lim sup max{f (y), f (x)} − lim inf min{f (y), f (x)} . y→x y→x (3) Si mostri che θf (x) ≥ 0 e che f è continua in x ∈ X se e solo se θf (x) = 0. (4) Si mostri che per ogni n ∈ N∗ l’insieme An = {x ∈ R : θf (x) ≥ 1/n} è chiuso. (5) Si concluda che θf : X → R è semicontinua superiormente. Esercizio 5.158. F Si dimostri che l’insieme dei punti di R in cui una funzione semicontinua inferiormente non è continua è un insieme di prima categoria (un sottoinsieme di R si dice di prima categoria se è contenuto in un’unione numerabile di chiusi con parte interna vuota). Esercizio 5.159. Si provi che una funzione uniformemente continua f : X → R trasforma ogni successione di Cauchy in una successione di Cauchy. Vale il viceversa? Esercizio 5.160. Nella relazione ε–δ che vale per una funzione continua f : R → R, la scelta di δ in generale dipende da x ∈ R e da ε > 0. Fissato ε, si può sempre scegliere δ dipendente in modo continuo da x? 10. ESERCIZI 135 Esercizio 5.161. Siano f, g : [0, +∞) → R due funzioni continue tali che limx→+∞ (f (x) − g(x)) = 0. Si mostri che se g è uniformemente continua, lo è anche f . Esercizio 5.162. Si provi che una funzione uniformemente continua su uno spazio vettoriale normato è limitata su ogni sottoinsieme limitato. Si mostri con un esempio che la stessa conclusione non vale in generale per uno spazio metrico. Esercizio 5.163. Si dimostri che una funzione continua sull’intervallo aperto e limitato (a, b) è uniformemente continua se e solo se esistono finiti i limiti di f (x) per x che tende ad a e b. Esercizio 5.164. Sia f definita e continua in R. Si mostri che se esistono finiti i limiti limx→±∞ f (x), allora f è uniformemente continua. Esercizio 5.165. Per ogni n ∈ N, definiamo In = [2n, 2n + 1] e sia E = ∪n∈N In . Sia f : E → R definita da f (x) = 2n se x ∈ In . Si mostri che esiste un’estensione continua di f a tutto R+ ma non esiste un’estensione uniformemente continua. Esercizio 5.166. Si mostri che la composizione di due funzioni uniformemente continue è uniformemente continua. Esercizio 5.167. Sia f : R → R una funzione continua, si dica quali delle seguenti affermazioni sono corrette: • se f è periodica, f è uniformemente continua, • se f è limitata, f è uniformemente continua, • se f è limitata e uniformemente continua, allora f 2 (cioè la funzione x 7→ [f (x)]2 ) è uniformemente continua, • se f è uniformemente continua esistono a, b ∈ R tali che |f (x)| ≤ a|x| + b, per ogni x ∈ R, • se esistono a, b ∈ R tali che |f (x)| ≤ a|x| + b, per ogni x ∈ R, allora f è uniformemente continua. Esercizio 5.168. Sia f : R → R uniformemente continua, si mostri che esistono due costanti C, M ∈ R tale che |f (x)| ≤ C|x| per |x| ≥ M . Esercizio 5.169. Si mostri che una funzione continua f : I → R, monotona e limitata, dove I ⊆ R è un intervallo limitato o illimitato, è uniformemente continua. Esercizio 5.170. F Si trovi una funzione continua f : R → R tale che non sia monotona in nessun intervallo non vuoto. Esercizio 5.171. Una funzione si dice aperta se manda insiemi aperti in aperti. Si mostri che una funzione f : R → R continua e aperta è strettamente monotona. Esercizio 5.172. Si mostri che una funzione f : R → R strettamente monotona e con la proprietà del valor intermedio è continua. 10. ESERCIZI 136 Esercizio 5.173. Sia f : [a, b] → R continua tale che per ogni x ∈ [a, b] esiste h > 0 tale che per ogni y ∈ [x, x + h] si ha f (x) ≤ f (y). Si provi che f è monotona non decrescente. La stessa conclusione vale se f non è continua? Esercizio 5.174. Sia f : (0, +∞) → R una funzione Lipschitziana. Si provi che esiste finito il limite limx→0+ f (x). Esercizio 5.175. Sia A ⊆ R e sia f : A → R. La funzione f si dice α–Hölderiana (per α > 0) se esiste una costante C ≥ 0 tale che |f (x) − f (y)| ≤ C|x − y|α ∀x, y ∈ A . (1) (2) (3) (4) Si Si Si Si Si dica per quali β ≥ 0 la funzione xβ da [0, +∞) in R è α–Hölderiana. provi che ogni funzione Hölderiana è uniformemente continua. dia un esempio di una funzione continua ma non α–Hölderiana per ogni α > 0. mostri che se A è limitato e β < α, allora ogni funzione α–Hölderiana è β–Hölderiana. dica se lo stesso vale se A = R. Esercizio 5.176. Sia f : R → R tale che |f (x) − f (y)| ≤ C(x − y)α , ∀x, y ∈ R , con α > 1 e C > 0. Si mostri che f è costante (da cui nella definizione di funzione α–Hölderiana si considera sempre α ≤ 1). Esercizio 5.177. Si esibisca una funzione f : [a, b] → R uniformemente continua ma non α–Hölderiana per ogni α > 0. Esercizio 5.178. Si provi che l’insieme di discontinuità di una funzione monotona f : R → R è al più numerabile. Esercizio 5.179. Siano f e g funzioni Lipschitziane da R in R. Si dica quali delle seguenti funzioni risultano ancora Lipschitziane, precisando le relative costanti: f + g, f − g, f ∧ g, f ∨ g, f g, f /g, f ◦ g. Si discuta il problema analogo con f e g Hölderiane. Esercizio 5.180. Si mostri che una funzione Lipschitziana su di un sottoinsieme di R si estende sempre ad una funzione Lipschitziana su tutto R. La costante di Lipschitz si può mantenere invariata nell’estensione? Esercizio 5.181. Si mostri che una funzione Lipschitz su tutto R è sempre differenza di due funzioni monotone. Si possono scegliere entrambe crescenti o decrescenti? O una crescente e l’altra decrescente? Esercizio 5.182. Una funzione f : [a, b] → R si dice a variazione limitata (talvolta indicato come BV ) se esiste una costante C > 0 tale che per ogni suddivisione x0 = a < x1 < · · · < xn−1 < xn = b si ha n X i=1 |f (xi ) − f (xi−1 )| ≤ C . 10. ESERCIZI 137 Si mostri che una funzione a variazione limitata è sempre differenza di due funzioni monotone. Si possono scegliere entrambe crescenti o decrescenti? O una crescente e l’altra decrescente? Vale il viceversa? Esercizio 5.183. Si mostri che una funzione Lipschitziana è a variazione limitata. Esercizio 5.184. F Una funzione f : [a, b] → R si dice assolutamente continua (talvolta indicato come AC) se per ogni ε > 0 esiste un δ > 0 tale che per ogni famiglia P finita {[a1 , b1 ], [a2 , b2 ], . . . , [an , bn ]} di sottointervalli chiusi di [a, b], a due a due disgiunti, con ni=1 (bi − ai ) < δ si ha n X |f (bi ) − f (ai )| ≤ ε . i=1 Si mostri che vale la seguente catena di implicazioni: f è Lipschitziana =⇒ f è AC =⇒ f è BV e continua =⇒ f è uniformemente continua . Si mostri con controesempi che le implicazioni opposte non valgono in generale. Esercizio 5.185. Si dica se gli spazi delle funzioni Lipschitziane, Hölderiane, assolutamente continue, a variazione limitata, uniformemente continue, semicontinue inferiormente su un intervallo chiuso I ⊂ R sono spazi vettoriali. Nel caso, che norma proporreste per renderli Banach? Esercizio 5.186. Si dica se gli spazi delle funzioni limitate, monotone, continue, Lipschitziane, Hölderiane, assolutamente continue, a variazione limitata, uniformemente continue, semicontinue inferiormente, su un intervallo chiuso I ⊂ R (o su tutto R) sono “chiusi” per somma, differenza, modulo, operazioni di max/min e di sup/inf, prodotto, rapporto, composizione. Esercizio 5.187. Data una funzione f : [0, +∞) → R tale che per ogni x ∈ R l’insieme f ([0, x]) è limitato, si consideri la funzione g : [0, +∞) → R definita da g(x) = sup f (t) t≤x e si risponda alle seguenti domande, giustificando la risposta: (1) la funzione g è continua? Monotona? (2) Se f è limitata allora g è limitata? (3) Se f è monotona allora g è monotona? (4) Se f è continua allora g è continua? (5) Se f è uniformemente continua allora g è uniformemente continua? (6) Se f è Lipschitz allora g è Lipschitz? (7) Se f è Hölderiana allora g è Hölderiana? (8) Se f è AC allora g è AC? (9) Se f è BV allora g è BV ? (10) Se f ha la proprietà del valor intermedio allora anche g? Si ripeta il problema scambiando il ruolo di f e g nelle domande. 10. ESERCIZI 138 Esercizio 5.188. Data una funzione f : R → R e una costante ε > 0 tali che per ogni x ∈ R l’insieme f (x − ε, x + ε) è limitato, si consideri la funzione g : R → R definita da g(x) = sup f (t) t∈(x−ε,x+ε) e si risponda alle seguenti domande, giustificando la risposta: (1) la funzione g è continua? Monotona? (2) Se f è limitata allora g è limitata? (3) Se f è monotona allora g è monotona? (4) Se f è continua allora g è continua? (5) Se f è uniformemente continua allora g è uniformemente continua? (6) Se f è Lipschitz allora g è Lipschitz? (7) Se f è Hölderiana allora g è Hölderiana? (8) Se f è AC allora g è AC? (9) Se f è BV allora g è BV ? (10) Se f ha la proprietà del valor intermedio allora anche g? Si ripeta il problema scambiando il ruolo di f e g nelle domande. Esercizio 5.189 (Teorema delle Frittelle). F Dati due poligoni nel piano, si dimostri che esiste una retta (un taglio) tale che separi ognuno dei due poligoni (frittelle) in due parti di stessa area. Nota. Il risultato vale per ogni coppia di insiemi limitati nel piano, avendo a disposizione un concetto di area generale. Valgono inoltre degli analoghi n–dimensionali (si provi ad enunciarli) però di dimostrazione più complessa. Con idee simili si può provare il fatto che ci sono sempre due punti antipodali sulla terra (sulla sfera) tali che hanno la stessa temperatura e la stessa pressione (i valori di due funzioni continue sulla sfera). Il caso 1–dimensionale è dato dal fatto che per ogni funzione continua sulla circonferenza, esistono sempre due punti opposti con lo stesso valore della funzione (lo si dimostri). CAPITOLO 6 SUCCESSIONI E SERIE DI FUNZIONI Si danno per noti i risultati fondamentali del calcolo differenziale in una variabile, in particolare la nozione di derivata, le regole di derivazione di base1, il teorema di Lagrange2, il teorema di Cauchy3, lo sviluppo di Taylor4. 1. Convergenza puntuale e uniforme Sia E un insieme. Consideriamo una successione fn : E −→ R , di funzioni a valori reali definite in E. Definizione 6.1 (Convergenza puntuale). Si dice che la successione (fn ) converge puntualmente su E a f : E −→ R se lim fn (x) = f (x) ∀x ∈ E . n→∞ Esempi. (1) Con E = R, la successione fn (x) = nx/(1 + nx2 ) converge puntualmente a 1 se x 6= 0 , f (x) = x 0 se x = 0 . (2) Sempre con E = R, si ponga fn (x) = xn . La successione di numeri reali fn (x) ha limite finito solo per −1 < x ≤ 1. Quindi la successione di funzioni (fn ) non converge puntualmente su R. Tuttavia, restringendosi a E0 = (−1, 1], si ha convergenza puntuale su E0 e la funzione limite è ( 0 se x ∈ (−1, 1) , (1.1) f (x) = 1 se x = 1 . Introduciamo ora una nozione più restrittiva di convergenza, la convergenza uniforme. Come sopra, E è un insieme e le funzioni fn sono definite su E e a valori reali. 1Somma: (f + g)0 = f 0 + g 0 ; prodotto: (f g)0 = f 0 g + f g 0 ; composizione: (f ◦ g)0 = (f 0 ◦ g)g 0 ; inversa: (f −1 )0 = 1/f 0 ◦ f −1 . 2 Per ogni intervallo [a, b] ⊆ R limitato e per ogni funzione f : [a, b] → R continua in tutti i punti di [a, b] e derivabile in tutti i punti di (a, b), esiste c ∈ (a, b) tale che f (b) − f (a) = f 0 (c)(b − a). 3 Per ogni intervallo [a, b] ⊆ R limitato, se f, g : [a, b] → R sono continue in tutti i punti di [a, b] e derivabili in tutti i punti di (a, b), esiste c ∈ (a, b) tale che g 0 (c)(f (b) − f (a)) = f 0 (c)(g(b) − g(a)). 4 Se n ≥ 1 è intero, r > 0 e f : (x0 − r, x0 + r) → R è derivabile (n − 1) volte in (x0 − r, x0 + r) e f (n−1) è derivabile n P f (i) (x0 ) in x0 , allora f (x) = (x − x0 )i + o((x − x0 )n ), con le convenzioni f (0) = f , derivabile 0 volte=continua e i! i=0 (x − x0 )0 = 1 per ogni x ∈ R. 139 2. CONTINUITÀ DEL LIMITE UNIFORME 140 Definizione 6.2 (Convergenza uniforme). Si dice che la successione (fn ) converge uniformemente su E a f : E −→ R se, per ogni ε > 0, esiste un indice n0 tale che, per ogni n ≥ n0 e ogni x ∈ E, si ha fn (x) − f (x) < ε . Le due nozioni, di convergenza puntuale e convergenza uniforme, si confrontano bene esprimendo le due condizioni in forma esplicita. • Convergenza puntuale: (1.2) ∀ ε > 0, ∀ x ∈ E, ∃ n0 (ε, x) : ∀ n ≥ n0 (ε, x) , fn (x) − f (x) < ε . • Convergenza uniforme: (1.3) ∀ ε > 0, ∃ n0 (ε) : ∀ x ∈ E, ∀ n ≥ n0 (ε) , fn (x) − f (x) < ε . La differenza sta nel fatto che, dato ε, l’indice richiesto n0 , a partire dal quale fn (x) debba distare da f (x) per meno di ε, possa dipendere da x, oppure debba esistere indipendentemente da x. Il seguente enunciato è dunque ovvio. Proposizione 6.3 (Convergenza uniforme implica convergenza puntuale). Se una successione di funzioni converge uniformemente su E alla funzione f , allora vi converge puntualmente. Il seguente esempio mostra che, in generale, il viceversa non vale. Esempio. Si considerino le funzioni fn (x) = xn del precedente Esempio 2. Sull’insieme E0 = (−1, 1] si ha convergenza puntuale, ma non uniforme. Si fissi infatti ε < 1. Se la convergenza alla funzione f in (1.1) fosse uniforme, dovrebbe esistere un indice n0 tale che, per ogni n ≥ n0 e ogni x ∈ (−1, 1), |xn | < ε. Ma questo è assurdo perché limx→±1 |xn | = 1. Restringiamo ora le funzioni fn a un intervallo Eδ = [−1 + δ, 1 − δ], dove δ ∈ (0, 1/2). Dato ε > 0, esiste n0 tale che (1 − δ)n0 < ε. Se n ≥ n0 e x ∈ Eδ , si ha n x − f (x) = |xn | ≤ (1 − δ)n < ε . Quindi la convergenza alla funzione f è uniforme su Eδ . Osservazione 6.4. Si osservi che le nozioni di convergenza puntuale e uniforme si estendono in modo naturale a successioni a valori in un qualunque spazio metrico (Y, dY ): basta nelle formule (1.2) e (1.3) sostituire |fn (x) − f (x)| con dY (fn (x), f (x)). Nel seguito non ci servirà tuttavia tutta questa generalità, salvo il caso di funzioni a valori in Rm (o a valori complessi). 2. Continuità del limite uniforme Gli esempi visti nel paragrafo precedente mostrano che funzioni continue possono convergere puntualmente a funzioni discontinue. Il teorema seguente dimostra invece che la continuità delle funzioni fn “si trasmette” alla funzione limite f quando la convergenza è uniforme. Teorema 6.5 (Continuità del limite uniforme). Sia (E, d) uno spazio metrico. Se le funzioni fn : E −→ R convergono a una funzione f uniformemente su E, e ogni fn è continua in un punto x0 ∈ E, allora anche f è continua in x0 . 3. LA CONVERGENZA UNIFORME COME CONVERGENZA IN UNO SPAZIO METRICO 141 Dimostrazione. Si fissi ε > 0. Per l’ipotesi di convergenza uniforme, esiste un indice n tale che f (x) − fn (x) < ε . 3 Per la continuità di fn in x0 , esiste r > 0 tale che fn (x) − fn (x0 ) < ε . ∀ x ∈ Br (x0 ) , 3 Allora, per ogni x ∈ Br (x0 ) risulta f (x) − f (x0 ) = f (x) − fn (x) + fn (x) − fn (x0 ) + fn (x0 ) − f (x0 ) ≤ f (x) − fn (x) + fn (x) − fn (x0 ) + fn (x0 ) − f (x0 ) <ε. ∀x ∈ E , Per l’arbitrarietà di ε, f è continua in x0 . 3. La convergenza uniforme come convergenza in uno spazio metrico Sia E un insieme. Indichiamo con B(E) lo spazio vettoriale delle funzioni limitate f : E −→ R. Date f, g ∈ B(E), definiamo la cosiddetta distanza del sup (3.1) d(f, g) = sup f (x) − g(x) . x∈E Lemma 6.6. La formula (3.1) definisce una distanza su B(E). Dimostrazione. Chiaramente, d(f, g) ≥ 0 per ogni f, g ∈ B(E) e d(f, g) = 0 se e solo se f = g. Altrettanto chiaramente, vale l’identità d(f, g) = d(g, f ). Rimane dunque da verificare la disuguaglianza triangolare. Siano f, g, h ∈ B(E). Per ogni x ∈ E, f (x) − h(x) ≤ f (x) − g(x) + g(x) − h(x) ≤ d(f, g) + d(g, h) . Ma allora d(f, h) = sup f (x) − h(x) ≤ d(f, g) + d(g, h) . x∈E La seguente proposizione mostra che la convergenza uniforme è precisamente quella indotta in B(E) dalla distanza del sup: si dice informalmente che la convergenza uniforme è “metrizzata” dalla distanza del sup. Proposizione 6.7. Una successione (fn ) di elementi di B(E) converge uniformemente su E a f : E −→ R se e solo se f ∈ B(E) e lim d(f, fn ) = 0 . n→∞ Dimostrazione. Si supponga che le funzioni fn convergano uniformemente su E a una funzione f . Dato ε > 0 esiste un indice n0 tale che, per ogni n ≥ n0 vale f (x) − fn (x) < ε (3.2) ∀x ∈ E . Sia M tale che fn0 (x) ≤ M per ogni x ∈ E. Allora f (x) ≤ f (x) − fn (x) + fn (x) < M + ε , 0 0 4. DERIVABILITÀ DELLA FUNZIONE LIMITE 142 per ogni x ∈ E. Dunque f ∈ B(E). Inoltre, per n ≥ n0 , la disuguaglianza (3.2) implica d(f, fn ) = sup f (x) − fn (x) ≤ ε . x∈E Per l’arbitrarietà di ε, limn d(f, fn ) = 0. Viceversa, se f ∈ B(E) e limn d(f, fn ) = 0, dato ε > 0, esiste n0 tale che d(f, fn ) < ε per ogni n ≥ n0 . Ma questo implica che, per ogni x ∈ E e ogni n ≥ n0 , |f (x) − fn (x)| < ε. Quindi le fn convergono uniformemente a f . Teorema 6.8 (Completezza di B(E)). Per ogni insieme E lo spazio metrico B(E), d è completo. Dimostrazione. Sia (f ) una successione di Cauchy in B(E). Si fissi x ∈ E. Siccome n fn (x)− fm (x) ≤ d(fn , fm ), si deduce immediatamente che la successione di numeri reali fn (x) è pure di Cauchy. Allora il limite f (x) = lim fn (x) n→∞ esiste finito per ogni x ∈ E. Resta da mostrare che f ∈ B(E) e che fn → f uniformemente in E. Dato ε > 0, sia n0 tale che, per ogni m, n ≥ n0 , d(fm , fn ) < ε. Per ogni x ∈ E e n, m ≥ n0 , si ha fm (x) − fn (x) < ε. Dunque, passando al limite per m → ∞ in questa relazione, otteniamo che per n ≥ n0 vale f (x) − fn (x) = lim fm (x) − fn (x) ≤ ε . m→∞ Applicando questa proprietà con n = n0 , dato che fn0 è limitata, otteniamo che sup |f | ≤ sup |fn0 |+ ε, quindi f è limitata. Passando ora all’estremo superiore otteniamo d(f, fn ) ≤ ε per n ≥ n0 , quindi fn → f in B(E). Più in generale, se consideriamo funzioni non necessariamente limitate, la stessa dimostrazione mostra che (3.3) lim sup |fn (x) − fm (x)| = 0 m,n→∞ x∈E =⇒ ∃ f tale che fn → f uniformemente in E . Sia ora E uno spazio metrico compatto, per esempio un sottoinsieme chiuso e limitato di Rn . Indicando come nel capitolo precedente con C(E) l’insieme delle funzioni continue su E, il teorema di Weierstrass ci garantisce che C(E) ⊆ B(E). Il Teorema 6.5 ha la seguente conseguenza immediata, dato che i chiusi di uno spazio metrico completo sono essi stessi completi. Corollario 6.9. Se (E, d) è compatto, C(E) è uno spazio vettoriale chiuso in B(E). In particolare, C(E), d è pure uno spazio metrico completo. 4. Derivabilità della funzione limite Consideriamo in questo paragrafo successioni di funzioni definite su un intervallo I ⊆ R. Più in generale, per trattare intervalli I non necessariamente aperti, per “funzione derivabile su I” intenderemo una funzione che è derivabile in ˚ I e ammette derivata laterale in ognuno degli eventuali estremi di I che appartengono I. Se è vero che il limite uniforme di funzioni continue è continuo, non è vero in generale che il limite uniforme di funzioni derivabili sia derivabile. Esempio. Ci sono molti modi di ottenere la funzione f (x) = |x|, non derivabile in 0, come limite √ uniforme su I = R di funzioni derivabili. Si prenda per esempio fn (x) = x2 + n−2 , il cui grafico 4. DERIVABILITÀ DELLA FUNZIONE LIMITE 143 è il ramo superiore di un’iperbole equilatera con asintoti y = ±x e vertice nel punto (0, 1/n). Chiaramente fn è derivabile su R. Essendo r 1 1 |x| < x2 + 2 ≤ |x| + , n n si ha limn fn = f uniformemente. Un altro modo è il seguente. Sull’intervallo − n1 , n1 si modifichi il grafico della funzione f (x) = |x| 1 1 sostituendolo con il quarto di cerchio tangente al grafico stesso nei punti ± n , n . La funzione gn cosı̀ ottenuta è derivabile e limn→∞ gn = f uniformemente. Il secondo procedimento descritto nell’esempio si generalizza facilmente al caso in cui f è una funzione continua lineare a tratti, cioè una funzione continua il cui grafico sia l’unione di un numero localmente finito di segmenti su intervalli adiacenti di R. Utilizzando questa osservazione, possiamo dimostrare il risultato che segue. Teorema 6.10 (Le funzioni ovunque derivabili sono dense nelle funzioni continue). Sia [a, b] un intervallo chiuso e limitato5. Ogni funzione continua su [a, b] è limite uniforme di una successione di funzioni derivabili su [a, b]. Dimostrazione. Fissato un intero n > 0, si suddivida I in n sottointervalli adiacenti di lunghezza (b − a)/n. Poniamo aj = a + j (b − a) , n j = 0, . . . , n , e indichiamo con Ij = [aj−1 , aj ], j = 1, . . . , n, il j-esimo sottointervallo della suddivisione. Chiamiamo quindi fn la funzione tale che • fn (aj ) = f (aj ) per j = 0, . . . , n, • per j = 1, . . . , n, (fn )|Ij è lineare. Dimostriamo che le fn convergono uniformemente a f su [a, b]. Per la continuità uniforme di f , dato ε > 0, esiste δ > 0 tale che x, x0 ∈ [a, b] , |x − x0 | < δ =⇒ |f (x) − f (x0 )| < ε . Si prenda ora n tale che (b − a)/n < δ e siano I1 , . . . , In i sottointervalli di I descritti sopra. Se x ∈ Ij , per la monotonia di fn su Ij , il valore fn (x) è compreso tra i due valori fn (aj−1 ) = f (aj−1 ) e fn (aj ) = f (aj ). Quindi f (x) − fn (x)| ≤ max f (x) − f (aj−1 )|, f (x) − f (aj )| < ε , essendo |x − aj−1 | e |x − aj | minori di δ. Siccome la condizione (b − a)/n < δ è verificata definitivamente, si ottiene che d(f, fn ) < ε definitivamente. Per quanto detto a proposito delle funzioni continue e lineari a tratti, ogni fn è limite uniforme su [a, b] di funzioni derivabili su [a, b]. Si prenda quindi, per ogni n, una funzione gn derivabile su [a, b] tale che d(fn , gn ) < 1/n. Allora si ha definitivamente d(fn , gn ) < ε, e dunque d(fn , gn ) < 2ε. Per l’arbitrarietà di ε si ha la conclusione. 5La conclusione vale in realtà per tutti gli intervalli, lo si dimostri per esercizio. Approssimando con più cura le funzioni lineari a tratti nell’intorno dei punti di discontinuità della derivata prima è possibile ottenere anche funzioni derivabili infinite volte. 4. DERIVABILITÀ DELLA FUNZIONE LIMITE 144 Passiamo ora a discutere quali ipotesi possano garantire che se le funzioni fn sono derivabili su un intervallo I e convergono a una funzione f , allora anche f è derivabile su I e f 0 è uguale al limite delle fn0 . Si vuole cioè avere l’uguaglianza di commutazione tra derivata e limite: 0 lim fn = lim fn0 . n→∞ n→∞ Vogliamo in sostanza sapere sotto quali ipotesi vale che “la derivata del limite è il limite delle derivate”. Consideriamo prima di tutto il caso in cui I è chiuso e limitato. Teorema 6.11. Sia (fn ) una successione di funzioni derivabili sull’intervallo I = [a, b]. Si supponga che (i) le derivate fn0 convergano uniformemente su I a una funzione g; (ii) esista un punto x0 ∈ I tale che lim fn (x0 ) = ` ∈ R . n→∞ Allora le funzioni fn convergono uniformemente su I alla funzione f che soddisfa le condizioni ( f 0 (x) = g(x) ∀ x ∈ I , (4.1) f (x0 ) = ` . Prima di dare la dimostrazione si noti che se due funzioni soddisfano entrambe le condizioni (4.1), allora coincidono. Infatti la loro differenza ha derivata nulla su tutto I, dunque è costante per il teorema di Lagrange. Ma la differenza è nulla in x0 , da cui la conclusione. La funzione f nella (4.1) è quella che si chiama una primitiva di g. Dimostrazione. Dimostriamo per cominciare che la successione (fn ) converge uniformemente (si veda anche l’osservazione alla fine della dimostrazione). Per ipotesi, la successione (fn0 ) delle derivate converge uniformemente e la successione dei valori fn (x0 ) ha limite. Quindi, fissato ε > 0, esiste n0 ∈ N tale che, per n, m ≥ n0 , si ha 0 fn (x0 ) − fm (x0 ) < ε . |fn0 (t) − fm (t)| < ε ∀t ∈ I e Sia allora x ∈ [a, b]. Applicando il teorema di Lagrange alla funzione fn − fm si ha fn (x) − fm (x) ≤ (fn (x) − fm (x)) − fn (x0 ) − fm (x0 ) + fn (x0 ) − fm (x0 ) = |x − x0 |(fn − fm )0 (tx,n,m ) + fn (x0 ) − fm (x0 ) , dove tx,n,m è un punto strettamente compreso tra x0 e x. Dunque per n, m ≥ n0 vale 0 max fn (x) − fm (x) ≤ (b − a) sup |fn0 (t) − fm (t)| + fn (x0 ) − fm (x0 ) ≤ (b − a + 1)ε . x∈[a,b] t∈I Per l’arbitrarietà di ε, la successione (fn ) è di Cauchy in C(I). Essendo C(I) completo, si ottiene una funzione f ∈ C(I) come limite uniforme delle fn . Ovviamente, f (x0 ) = `. Dobbiamo ora dimostrare che f è derivabile in I e che la sua derivata è g.6 6Se le funzioni f 0 fossero continue, anche g sarebbe continua e si potrebbe mostrare questo fatto anche usando il n R x teorema fondamentale del calcolo integrale, passando al limite per n → ∞ nella relazione fn (x) − fn (y) = y fn0 (s)ds Rx per ottenere f (x) − f (y) = y g(s)ds, grazie alla continuità dell’integrale rispetto alla convergenza uniforme. Questa in effetti è la dimostrazione presente in molti testi. 4. DERIVABILITÀ DELLA FUNZIONE LIMITE 145 Fissiamo un punto x ∈ I e consideriamo la successione di funzioni fn (x) − fn (x) se x 6= x , hn (x) = x−x f 0 (x) se x = x . n Queste funzioni sono ovviamente continue in I e convergono puntualmente alla funzione f (x) − f (x) se x 6= x , h(x) = x−x g(x) se x = x . Se dimostriamo che le hn convergono uniformemente, ne consegue che la convergenza a h è uniforme (visto che convergenza uniforme implica convergenza puntuale), e dunque h è continua in x. Ma questo vuol dire che f (x) − f (x) g(x) = lim = f 0 (x) , x→x x−x che è la tesi del teorema. Fissiamo dunque x 6= x. Riapplicando il teorema di Lagrange a fn − fm , si ha (fn (x) − fm (x)) − fn (x) − fm (x) 0 0 , hn (x) − hm (x) = = fn (tx,x,n,m ) − fm (t ) x,x,n,m x−x con tx,x,n,m strettamente compreso tra x e x. Quindi 0 (t)| , max hn (x) − hm (x) = sup hn (x) − hm (x) ≤ sup |fn0 (t) − fm x∈[a,b] x∈[a,b]\{x} t∈I e questo prova, grazie alla (3.3), la convergenza uniforme. Notiamo infine che applicando la seconda parte del ragionamento con x̄ = x0 e usando le formule fn (x) = fn (x0 ) + hn (x)(x − x0 ), avremmo potuto dedurre la proprietà di Cauchy di (fn ) nello spazio C(I) direttamente da quella di (hn ), applicando una sola volta il teorema di Lagrange a fn − fm . √ √ Si noti che nell’esempio già considerato delle funzioni x2 + n−2 , le cui derivate valgono x/ x2 + n−2 , non si ha (e non si potrebbe avere, visto che il limite delle funzioni è non derivabile) convergenza uniforme delle derivate. Infatti si ha convergenza puntuale delle derivate, alla funzione discontinua che vale 1 per x > 0, 0 per x = 0, −1 per x < 0. Nella dimostrazione del Teorema 6.11 si è fatto uso dell’ipotesi di limitatezza dell’intervallo I. Semplici esempi mostrano che su intervalli illimitati non si può dedurre dalle stesse ipotesi la convergenza uniforme delle fn . Si ponga per esempio, su I = R, x fn (x) = . n Le ipotesi del Teorema 6.11 sono soddisfatte, ma le fn non convergono uniformemente su R. Si noti però che su ogni sottointervallo compatto si ha convergenza uniforme. Si parla in questo caso di convergenza uniforme sui compatti.7 Si ha quindi la seguente semplice estensione del Teorema 6.11. Corollario 6.12. Sia (fn ) una successione di funzioni derivabili su un intervallo I. Si supponga che 7Si vede facilmente che se una successione converge uniformemente su un insieme E, converge uniformemente su ogni E 0 ⊆ E. Quindi la convergenza uniforme sui compatti di un intervallo aperto (a, b) equivale alla convergenza uniforme su una qualsiasi successione di sottointervalli [an , bn ] con inf n an = a e supn bn = b. 5. CONVERGENZA UNIFORME DI SERIE DI FUNZIONI E SPAZI VETTORIALI NORMATI 146 (i) le derivate fn0 convergano a una funzione g uniformemente sui compatti di I; (ii) esista un punto x0 ∈ I tale che lim fn (x0 ) = ` ∈ R . n→∞ Allora le funzioni fn convergono uniformemente sui compatti di I alla funzione f che soddisfa le condizioni (4.1). 5. Convergenza uniforme di serie di funzioni e spazi vettoriali normati I risultati dei paragrafi precedenti relativi alla convergenza uniforme (rispettivamente, puntuale) di successioni di funzioni si applicano allo studio della convergenza uniforme (risp. puntuale) di una serie di funzioni. Naturalmente, si dice che la serie ∞ X fn n=0 di funzioni a valori reali definite su uno stesso insieme E converge uniformemente (risp. puntualmente) su E alla funzione s se la successione delle somme parziali sn = f0 + · · · + fn converge uniformemente (risp. puntualmente) a s su E. Come per le serie numeriche, è importante avere a disposizione criteri di semplice verifica che assicurino la convergenza uniforme di una serie di funzioni. Vedremo più avanti il criterio di Weierstrass, che è bene però inquadrare in un contesto più generale. Per far questo, osserviamo che ha senso parlare di somma di una serie solo quando lo spazio ambiente è dotato, da un lato, di una struttura algebrica che consenta di calcolare somme finite di suoi elementi, e dall’altro, di una distanza che consenta di calcolare limiti. Il caso che ci interessa è quello di particolari metriche definite su spazi vettoriali, e da questo cominciamo. La nozione di norma, introdotta nella prossima definizione, formalizza la nozione intuitiva di lunghezza di un vettore in uno spazio vettoriale. Definizione 6.13 (Norma in uno spazio vettoriale). Sia V uno spazio vettoriale su R. Si chiama norma su V una funzione k k : V −→ [0, +∞) , che soddisfi le seguenti proprietà: (i) kvk = 0 se e solo se v = 0; (ii) per ogni λ ∈ R e v ∈ V , kλvk = |λ|kvk; (iii) per ogni v, w ∈ V , kv + wk ≤ kvk + kwk. Se k k è una norma su V , la coppia (V, k k) si chiama spazio normato. Il seguente enunciato stabilisce la corrispondenza tra norme su V e distanze con particolari proprietà. La dimostrazione, molto semplice, è lasciata al lettore. Proposizione 6.14. Sia k · k una norma su uno spazio vettoriale V . Allora d(v, w) = kv − wk v, w ∈ V è un distanza su V , detta distanza indotta dalla norma data, che gode delle ulteriori proprietà: (a) (1–omogeneità) per ogni λ ∈ R e v, w ∈ V , d(λv, λw) = |λ|d(v, w); (b) (invarianza per traslazioni) per ogni v, w, z ∈ V , d(v + z, w + z) = d(v, w). 5. CONVERGENZA UNIFORME DI SERIE DI FUNZIONI E SPAZI VETTORIALI NORMATI 147 Viceversa, ogni distanza d su V che soddisfi le proprietà (a) e (b) è indotta da una norma, data da kvk = d(v, 0) . Esempi di distanze indotte da norme sono le distanze dp su Rn del § 6.1 del Capitolo 5, nonché la distanza del sup definita dalla formula (3.1) su B(E). P In analogia a quanto avviene per le somme numeriche, la somma di una serie ∞ 0 vn di elementi di uno spazio vettoriale normato (V, k · k) si definisce come il limite, se esiste, della successione delle somme parziali sn = v0 + · · · + vn rispetto alla distanza su V indotta dalla norma k · k. P Definizione 6.15 (Somma di una serie convergente). La serie ∞ 0 vi si dice convergente se la successione (sn ) delle sue somme parziali converge. In tal caso si pone ∞ X vi = lim i=0 n X n→∞ vi . i=0 Nello studio delle serie numeriche, è particolarmente importante il criterio di convergenza assoluta. Ci si può domandare se vale, per serie in spazi normati, un analogo criterio di convergenza totale: ∞ X kvn k < +∞ ? =⇒ n=0 ∞ X vn converge. n=0 La risposta è positiva, a condizione che lo spazio normato (V, k · k) sia completo. Anzi, come ora vedremo, la validità dell’implicazione “convergenza totale ⇒ convergenza” è equivalente alla completezza dello spazio. Teorema 6.16. Sia (V, k · k) uno spazio vettoriale normato. Le due condizioni seguenti sono equivalenti: (i) rispetto alla distanza d(v, v 0 ) = kv − v 0 k indotta dalla norma k k, d) è completo; P(V, ∞ (ii) data P∞ comunque una successione (vn ) di elementi di V tale che 0 kvn k < +∞, la serie 0 vn converge a un elemento di V . P Dimostrazione. Supponiamo che valga la condizione (i) e sia (vn ) tale che ∞ 0 kvn k < +∞. Dato ε > 0, esiste dunque n0 ∈ N tale che, per n > m ≥ n0 , kvm+1 k + · · · + kvn k < ε. Posto sn = v0 + · · · + vn , si ha allora d(sn , sm ) = ksn − sm k = kvn+1 + · · · + vm k ≤ kvn+1 k + · · · + kvm k < ε , per n, m ≥ n0 . Per la completezza di V , si ha la convergenza delle somme sn a un elemento di V . Supponiamo ora che valga la condizione (ii), e sia (xn ) una successione di Cauchy in V rispetto alla distanza indotta dalla norma. Per ogni k ∈ N, esiste allora un indice n(k) tale che ∀ n, m ≥ n(k) kxn − xm k < 1 . 2k Sostituendo se necessario n(k) con 1 + max{n(i) : 0 ≤ i ≤ k} possiamo supporre la successione degli indici n(k) sia crescente, quindi n(k) → ∞ per k → ∞. Allora kxn(k+1) − xn(k) k < 1 2k ∀k ∈ N . 5. CONVERGENZA UNIFORME DI SERIE DI FUNZIONI E SPAZI VETTORIALI NORMATI Definiamo allora (vk ) nel modo seguente: ( xn(0) vk = xn(k) − xn(k−1) k=0, k≥1. Siccome stiamo assumendo la condizione (ii), possiamo concludere che la serie V . Ma la somma parziale k–esima di questa serie è k X 148 P∞ 0 vk converge in vi = xn(k) , i=0 per cui la sottosuccessione (xn(k) ) della successione data converge. Possiamo allora concludere che (xn ) converge, dunque V è completo, sfruttando il fatto che ogni successione di Cauchy in uno spazio metrico che abbia una sottosuccessione convergente è essa stessa convergente. Infatti, preso ε > 0, esistono: • un indice n0 tale che d(xn , xm ) < ε/2 per ogni n, m ≥ n0 ; • un indice k0 tale che, detto x il limite della sottosuccessione (xn(k) ), d(x, xn(k) ) < ε/2 per ogni k ≥ k0 . Allora, se k ≥ k0 è scelto in modo tale che n(k) ≥ n0 (si ricordi che n(k) → ∞, quindi una tale scelta è possibile), si ha, per n ≥ n0 , ε ε d(x, xn ) ≤ d(x, xn(k) ) + d(xn(k) , xn ) < + = ε . 2 2 Corollario 6.17 (Criterio di Weierstrass e continuità di una serie). Sia (fn ) una successioni di funzioni a valori reali definite su un insieme E, e si supponga che: (i) per ogni n ∈ N esiste una costante Mn ≥ 0 tale che fn (x) ≤ Mn ∀x ∈ E ; (ii) ∞ P Mn < +∞. P Allora la serie ∞ se (E, d) è uno spazio metrico 0 fn converge uniformemente su E. In particolare, P∞ e le funzioni fn sono continue, anche la somma della serie 0 fn è continua. n=0 Dimostrazione. Per ipotesi, le funzioni fn sono in B(E) e kfn k = sup fn (x) ≤ Mn . x∈E P∞ Quindi 0 kfn k < +∞. Per il Teorema 6.8, B(E) è completo e la prima parte della tesi segue allora dal Teorema 6.16. La continuità della serie, se le fn sono continue, segue dalla continuità delle somme parziali e dal Corollario 6.9. Sulla retta reale, e senza ipotesi di limitatezza, si ha anche il seguente corollario del Teorema 6.12. Teorema 6.18 (Derivabilità di una serie). Sia (fn ) una successioni di funzioni derivabili su un intervallo I ⊆ R e si supponga che P 0 (i) la serie derivata ∞ 0 fn converga Puniformemente sui compatti di I; (ii) esista un punto x0 ∈ I tale che ∞ 0 fn (x0 ) converga. 6. SERIE DI POTENZE Allora la serie e si ha P∞ 0 149 fn converge uniformemente sui compatti di I, la somma della serie è derivabile ∞ X ∞ 0 X fn (x) = fn0 (x) n=0 ∀x ∈ I . n=0 6. Serie di potenze Si chiama serie di potenze una serie di funzioni della forma ∞ X an (x − x0 )n = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · , n=0 dove i coefficienti an sono valori assegnati8. Il punto x0 si chiama il centro della serie. Nella prima parte della trattazione, studieremo le serie di potenze in campo complesso, assumendo che sia i coefficienti an , sia il centro x0 , sia la variabile x appartengono a C. L’uso dei simboli z, z0 , invece di x, x0 , aiuterà a ricordare che si è in ambito complesso. Osserviamo preliminarmente che il contenuto dei paragrafi precedenti di questo capitolo si applica senza modifiche a funzioni a valori complessi, intendendo la convergenza puntuale (risp. uniforme) come convergenza puntuale (risp. uniforme) delle parti reali e immaginarie. Se poi si lavora con funzioni limitate, la definizione degli spazi B(E) e C(E) si generalizza immediatamente gli spazi B(E, C) e C(E, C), usando la distanza di C invece di quella euclidea su R. Come già osservato varie volte, tutte le questioni di continuità e derivabilità si trattano facilmente applicando i teoremi validi per funzioni a valori reali alle singole componenti. Il cambiamento di variabile z = w − c trasforma una serie di potenze centrata in z0 in una serie di potenze, nella variabile w, centrata in w0 = z0 + c. Per questo motivo enunceremo alcuni risultati generali solo per serie di potenze centrate in 0, cioè della forma ∞ X (6.1) an z n . n=0 È evidente che la serie (6.1) converge per z = 0 (in generale nel suo centro), e la sua somma dà a0 . È ben possibile che il centro sia l’unico punto di convergenza di una serie di potenze. Si prenda ad esempio ∞ X nn z n . n=0 Se z 6= 0, lim |nn z n | = lim |nz|n = +∞ , n→∞ n→∞ e la serie non può dunque convergere. Indichiamo con E l’insieme degli z ∈ C in cui la serie converge. Il lemma che segue è alla base della descrizione delle proprietà di E. Lemma 6.19 (Convergenza puntuale e assoluta delle serie). Si supponga che la serie (6.1) converga in un punto z0 6= 0. Allora essa converge assolutamente in ogni punto z con |z| < |z0 | e uniformemente su ogni disco chiuso di centro 0 e raggio r < |z0 |. 8Per n = 0 bisogna convenire che (x − x )0 = 1 anche per x = x . 0 0 6. SERIE DI POTENZE 150 P n n Dimostrazione. Dalla convergenza della serie ∞ n=0 an z0 , segue che limn→0 an z0 = 0 e dunn que che esiste una costante M > 0 tale che |an z0 | ≤ M per ogni n ∈ N. Se |z| < |z0 |, si ha allora n |z| n n n z . |an z | = |an z0 | n ≤ M z0 |z0 | La serie geometrica di ragione |z|/|z0 | < 1 converge e dunque si ha la prima parte della tesi. La seconda parte della tesi si ricava facilmente, perché la disuguaglianza ottenuta dimostra anche che r n n per ogni z con |z| ≤ r . |an z | ≤ M |z0 | Basta dunque applicare il criterio di Weierstrass. Sia dunque (6.2) ∞ n o X E= z∈C: an z n converge . n=0 Il seguente enunciato segue facilmente dal Lemma 6.19. Teorema 6.20 (Raggio di convergenza di una serie). Sia R = sup |z| ∈ [0, +∞] . z∈E Allora ogni z ∈ C con |z| < R appartiene a E. In particolare, (i) se R = 0, E = {0}; (ii) se R = +∞, E = C; (iii) se 0 < R < +∞, indicando con DR ⊂ C il disco aperto di centro 0 e raggio R, DR ⊆ E ⊆ DR , e la serie converge uniformemente sui compatti di DR . La dimostrazione del seguente enunciato è lasciata per esercizio. P∞ P n n Proposizione 6.21. Siano ∞ 0 bn z due serie di potenze centrate in 0 con raggi di 0 an z e 0 convergenza R e R . Allora la loro somma e il loro prodotto alla Cauchy hanno raggi di convergenza maggiori o uguali a min{R, R0 }. Il raggio di convergenza è esprimibile come funzione dei coefficienti della serie. Proposizione 6.22. Data la serie (6.1), sia ` = lim sup n→∞ p n |an | ∈ [0, +∞] . Allora R= 1 , ` con la convenzione che 1/0 = +∞ e 1/(+∞) = 0. Dimostrazione. Sia z 6= 0. Allora p p lim sup n |an z n | = |z| lim sup n |an | = |z|` . n→∞ n→∞ Per il criterio della radice, la serie converge se |z|` < 1 e non converge se |z|` > 1. La conclusione si deduce facilmente. 7. DERIVABILITÀ SULL’ASSE REALE 151 P n Sia ∞ 0 an z una serie di potenze con raggio di convergenza R > 0. Chiamiamo f (z) la funzione somma, definita sull’insieme di convergenza E in (6.2). Teorema 6.23. La funzione f è continua su DR . Dimostrazione. Per la convergenza uniforme della serie sui compatti di DR , f è continua su ognuno di tali compatti. Ovviamente questo è equivalente alla continuità su DR . 7. Derivabilità sull’asse reale P n Sia f (z) = ∞ 0 an z , dove la serie ha raggio di convergenza R > 0. Restringiamo f a DR ∩ R = (−R, R), e discutiamone la derivabilità. Per far questo consideriamo la serie derivata ∞ X (7.1) n 0 (an x ) = n=0 ∞ X nan x n−1 = n=1 ∞ X (n + 1)an+1 xn . n=0 Teorema 6.24 (Derivabilità di una serie di potenze). La serie (7.1) ha raggio di convergenza R. Quindi f è derivabile su (−R, R) e 0 f (x) = ∞ X nan xn−1 ∀x ∈ (−R, R) . n=1 P∞ P n n−1 e Dimostrazione. Le due serie ∞ 1 nan x convergono per gli stessi valori di x. 1 nan x Calcoliamo dunque p p √ 1 lim sup n n|an | = lim n n lim sup n |an | = . n→∞ R n→∞ n→∞ La conclusione segue dalla convergenza uniforme sui compatti di (−R, R) di entrambe le serie e dal Teorema 6.18. Iterando l’applicazione di questo teorema alle derivate successive, si ottiene: Corollario 6.25. La funzione f è di classe C ∞ su (−R, R) e per ogni k ∈ N vale f (k) (x) = ∞ X n(n − 1) · · · (n − k + 1)an xn−k ∀x ∈ (−R, R) . n=k Più in generale, per serie di potenze centrate in x0 con raggio di convergenza R, possiamo scrivere (7.2) ∞ ∞ X X f (k) (x) = n(n−1) · · · (n−k +1)an (x−x0 )n−k = (m+k)(m+k −1) · · · (m+1)an+m (x−x0 )m m=0 n=k per ogni x ∈ (x0 − R, x0 + R). Esempi. P n (1) La serie ∞ 1 x /n ha raggio di convergenza R = 1. Se f (x) è la sua somma, si ha (7.3) 0 f (x) = ∞ X n=1 x n−1 = ∞ X m=0 xm = 1 . 1−x 8. SERIE DI POTENZE E SERIE DI TAYLOR 152 Pertanto f è una primitiva di 1/(1 − x) sull’intervallo (−1, 1), ossia esiste c ∈ R tale che f (x) = − log(1 − x) + c. Ma c = f (0) = 0, e dunque ∞ X xn = − log(1 − x) ∀x ∈ (−1, 1) . n n=0 (2) In modo analogo si dimostra che ∞ X (−1)n 2n+1 x = arctan x 2n + 1 ∀x ∈ (−1, 1) , n=0 usando il fatto che il raggio di convergenza della serie è 1. Usando il Lemma di Abel, vedremo che la validità di questa formula si può estendere fino a x = 1, ottenendo la formula notevole 1 1 1 1 π 1 − + − + ··· = . 3 5 7 9 4 8. Serie di potenze e serie di Taylor Sia f una funzione definita in un intervallo I, derivabile infinite volte in un punto x0 ∈ I. La formula di Taylor con resto di Peano è dunque applicabile a ogni ordine n ∈ N: f 00 (x0 ) f (n) (x0 ) f (x) = f (x0 )+f 0 (x0 )(x−x0 )+ (x−x0 )2 +· · ·+ (x−x0 )n +o (x−x0 )n (x → x0 ) . 2 n! Si può quindi costruire la serie di Taylor ∞ X f (n) (x0 ) (x − x0 )n n! n=0 e domandarsi se essa converge, almeno in un intorno di x0 , alla funzione f . La risposta è in generale negativa per due motivi: • la serie può avere raggio di convergenza nullo; • la serie può avere raggio di convergenza positivo, ma convergere a una funzione diversa da f. Un esempio esplicito mostra che si può presentare la seconda possibilità. Si prenda ( 2 e−1/x se x 6= 0 , (8.1) f (x) = 0 se x = 0 . Si vede facilmente che f è continua anche in x0 = 0. Dimostriamo per induzione che f ha derivate di ogni ordine su R e che f (n) (0) = 0 per ogni n. Per prima cosa si verifica facilmente, sempre per induzione, che f è C ∞ su R \ {0} e che, per x 6= 0, 1 2 e−1/x , f (n) (x) = pn x 9 dove i pn sono opportuni polinomi . Allora, assumendo come ipotesi induttiva che f (n) (0) = 0, si ha che 1 −1/x2 p (n) (n) n x e f (x) − f (0) 2 (n+1) = lim = lim tpn (t)e−t = 0 , f (0) = lim t→±∞ x→0 x→0 x x 3 2 0 9La relazione ricorsiva tra i polinomi è: p (t) = 1, p 0 n+1 (t) = 2t pn (t) − t pn (t). 8. SERIE DI POTENZE E SERIE DI TAYLOR 153 perché, per ogni k, 2 e−t = o(e−|t| ) = o(|t|k ) (t → ±∞) . Quindi la serie di Taylor di f centrata in 0 ha tutti i termini identicamente nulli. Dunque ha raggio di convergenza infinito ma non converge a f (x) per x 6= 0. Che la prima possibilità (raggio di convergenza nullo della serie di Taylor) sia concreta si ricava dal seguente teorema. Teorema 6.26 (Teorema di Borel). Data una qualunque successione (an ) di numeri reali, esiste una funzione f di classe C ∞ su R tale che f (n) (0) = an per ogni n ∈ N. Dimostrazione. Sia Cc∞ (R) lo spazio vettoriale delle funzioni in C ∞ (R) con supporto compatto, cioè identicamente nulle al di fuori di un compatto (variabile da funzione a funzione). Dato n ∈ N, si ponga Mn [f ] = max sup |f (m) (x)| . 0≤m≤n x∈R Costruiamo per prima cosa una funzione ϕ ∈ Cc∞ (R), nulla fuori dall’intervallo [−1, 1] tale che ϕ(0) = 1 e ϕ(n) (0) = 0 per ogni n ∈ N∗10 Dato che la funzione ϕ (x) = ϕ(x/ε) è identicamente nulla fuori dall’intervallo [−ε, ε], con un semplice cambiamento di variabili otteniamo lim Mn xn+1 ϕε (x) = 0 ∀n ∈ N . ε→0+ Si costruiscano ora ricorsivamente numeri εn > 0 tali che Mn xn+1 ϕεn−1 (x) ≤ 1 an+1 per ogni n tale che an+1 6= 0 e poniamo f (x) = a0 + ∞ X an n=1 n! xn ϕ x εn−1 . Segue che tale funzione f appartiene a C ∞ (R) (più precisamente f − a0 ∈ Cc∞ (R), con supporto contenuto in [−ε0 , ε0 ]) e, usando ϕ(n) (0) = 0 per ogni n ≥ 1, che f (n) (0) = an , per ogni n ∈ N. Questa semplice verifica è lasciata al lettore. Prendendo, ad esempio, an = n! nn , e una corrispondente f come nella tesi del teorema di P funzione n xn , che ha raggio di convergenza nullo. Borel, la serie di Taylor di f centrata in 0 è data da ∞ n 0 Queste considerazioni motivano la seguente definizione. Definizione 6.27 (Funzioni analitiche). Una funzione f : I → R di classe C ∞ si dice analitica sull’intervallo aperto I ⊆ R se per ogni x0 ∈ I la serie di Taylor di f centrata in x0 converge a f in un intervallo di (x0 − r, x0 + r) ⊆ I con r > 0. 10Una tale funzione può essere elementarmente costruita come segue: si consideri la funzione φ1/3,1 = e , posta uguale a 0 fuori di (1/3, 1); tale funzione è non negativa e di classe C ∞ , positiva nell’intervallo (1/3, 1); si costruiscano in modo analogo funzioni φ−1,−1/3 e φ−2/3,2/3 . Allora la funzione −1/((1−x)(3x−1)) ϕ := φ−2/3,2/3 , φ−1,−1/3 + φ−2/3,2/3 + φ1/3,1 posta uguale a 0 fuori di (−2/3, 2/3), soddisfa tutte le proprietà richieste (è addirittura costante in (−1/3, 1/3)). 8. SERIE DI POTENZE E SERIE DI TAYLOR 154 2 L’esempio della funzione e−1/x mostra che non tutte le funzioni C ∞ sono analitiche (la proprietà fallisce, come abbiamo visto, per x0 = 0). Una definizione apparentemente più debole, ma equivalente, di funzione analitica consiste nel richiedere che per ogni x0 ∈ I la funzione coincida in un intervallo (x0 − r, x0 + r) con la somma di una serie di potenze centrata in x0 . Infatti il teorema di derivabilità delle serie, e in particolare la formula (7.2), implicano che an = f (n) (x0 )/n!, quindi se c’è una serie per la quale questa proprietà vale, questa è quella di Taylor. Per lo stesso motivo, mentre il teorema di Borel implica che non vi è restrizione alcuna sulla successione f (n) (x0 ), con f di classe C ∞ , lo stesso non vale per funzioni analitiche: dovendo essere il raggio di convergenza positivo, dovrà essere11 r n |f (n) (x0 )| lim sup < +∞. n! n→∞ Usando le corrispondenti proprietà delle serie, è facile mostrare che l’insieme delle funzioni analitiche è un’algebra, i.e. le funzioni analitiche sono stabili per somma e prodotto. Le funzioni analitiche godono di proprietà sorprendenti (e ancora di più nell’ambito complesso, che non tratteremo). Una di queste è la seguente proprietà di unicità del prolungamento, se analitico, da un intervallo J a un intervallo I ⊇ J: Proposizione 6.28 (Principio del prolungamento analitico). Se due funzioni analitiche f, g in un intervallo aperto I coincidono su un intervallo J ⊆ I, allora f ≡ g in tutto l’intervallo I. Dedurremo il principio del prolungamento analitico applicando la proposizione seguente, che riguarda gli insiemi di livello delle funzioni analitiche, alla differenza f −g, con c = 0. In una formulazione più forte, basta che {x ∈ I : f (x) = g(x)} abbia un punto di accumulazione in I per avere f ≡ g in I. Ovviamente il principio non vale per funzioni “solo” di classe C ∞ , basta prendere ad esempio come f questa variante, ancora di classe C ∞ , dell’esempio (8.1) ( e−1/x se x > 0 , f (x) = 0 se x ≤ 0 , e come g la funzione identicamente nulla. Il principio può essere dedotto, per differenza, dalla seguente proposizione: Proposizione 6.29 (Insiemi di livello di funzioni analitiche). Sia I ⊆ R un intervallo aperto e f : I → R analitica. Allora, per ogni c ∈ R, o l’insieme di livello x ∈ I : f (x) = c è discreto in I (i.e. privo di punti di accumulazione in I) o f è identicamente nulla. Dimostrazione. Senza perdita di generalità possiamo supporre c = 0. Supponiamo che il derivato E dell’insieme di livello f −1 (0) contenga almeno un punto di I. Per la continuità di f , l’insieme di livello è chiuso in I, quindi f è identicamente nulla su E ∩ I. L’insieme complementare I \ E è evidentemente aperto; per la connessione di I ci basterà mostrare che E ∩ I è aperto: in tal caso E ∩ I deve coincidere con I e quindi f ogni punto di I è di accumulazione per f −1 (0); per la continuità di f segue che f è identicamente nulla in I. Mostriamo dunque che E ∩ I è aperto. Se x ∈ E ∩ I, mostriamo per induzione su k ∈ N che esiste (k) (k) una successione strettamente monotona (xn ) convergente a x per n → ∞ e tale che f (k) (xn ) = 0 (0) per ogni n. Per k = 0 basta scegliere una successione strettamente monotona (xn ) ⊆ f −1 (0) \ {x} 11Usando la formula di Stirling si ha (n!)1/n /(n/e) → 1 per n → ∞, quindi la condizione equivale a lim supn p n |f (n) (x0 )|/n < +∞. 8. SERIE DI POTENZE E SERIE DI TAYLOR 155 convergente a x (essendo x di accumulazione per f −1 (0), ne esiste sempre una). Per fare il passaggio (k) (k) induttivo basta applicare il teorema di Rolle alla funzione f (k) nell’intervallo di estremi xn e xn+1 (k+1) per trovare un punto intermedio, che chiamiamo xn , ove f (k+1) si annulla. Abbiamo allora f (k) (x) = lim f (k) (x(k) n )=0 ∀x ∈ E . n→∞ Dato che x è arbitrario segue che f (k) ≡ 0 su E ∩ I per ogni k ∈ N. Quindi le serie di Taylor centrate su punti di E ∩ I sono identicamente nulle e la proprietà di analiticità ci dice che E ∩ I è aperto. Possiamo ora mostrare che le serie di potenze sono analitiche all’interno del loro dominio di convergenza. Come conseguenza di questo teorema abbiamo una terza definizione equivalente di funzione analitica: nell’intorno di ogni punto x0 del dominio la funzione coincide con una serie di potenze (non necessariamente centrata in x0 ). P∞ n Teorema 6.30 (Le serie di potenze sono analitiche). Sia 0 an x una serie di potenze centrata in 0 con raggio di convergenza R > 0 e sia f (x) la sua somma. Allora f è analitica in (−R, R). Dimostrazione. Dobbiamo verificare che per ogni x0 ∈ (−R, R) la funzione f coincide con una serie di potenze centrata in x0 , in un intervallo Ix0 centrato in x0 . Per come è definita f , questo è ovvio per x0 = 0 e possiamo prendere I0 = (−R, R). Prendiamo ora un generico punto x0 ∈ (−R, R). Per il Corollario 6.25, f è di classe C ∞ su (−R, R) e la serie di Taylor di f centrata in x0 è ∞ ∞ ∞ X X f (k) (x0 ) 1X k (x − x0 )k = (m + k) · · · (m + 1)am+k xm 0 (x − x0 ) k! k! m=0 k=0 k=0 (8.2) ∞ X ∞ X m+k m = am+k x0 (x − x0 )k . k k=0 m=0 N2 Consideriamo la sommatoria su a termini positivi X m + k |am+k ||x0 |m |x − x0 |k , k (k,m)∈N2 e partizioniamo N2 negli insiemi Ep = (m, k) : m + k = p . Si ha X m + k p |am+k ||x0 |m |x − x0 |k = |ap | |x0 | + |x − x0 | , k (k,m)∈Ep e, per il Teorema 4.16 del Capitolo 4, ∞ X m + k X p m k |am+k ||x0 | |x − x0 | = |ap | |x0 | + |x − x0 | . k 2 p=0 (k,m)∈N Quest’ultima serie converge per |x0 | + |x − x0 | < R, condizione che individua il massimo intervallo centrato in x0 e contenuto in (−R, R). Chiamiamo Ix0 = (x0 − R + |x0 |, x0 + R − |x0 |) tale intervallo (che ha sempre un estremo in comune con (−R, R)). Dunque per x ∈ Ix0 la sommatoria X m + k k am+k xm 0 (x − x0 ) k 2 (k,m)∈N 8. SERIE DI POTENZE E SERIE DI TAYLOR 156 converge, e pertanto la serie di Taylor (8.2) può essere ricombinata come serie in p delle sommatorie sugli insiemi Ep . Ma X m + k am+k xn0 (x − x0 )k = ap xp , k (k,m)∈Ep per cui concludiamo che, per x ∈ Ix0 , ∞ X f (k) (x0 ) k=0 k! k (x − x0 ) = ∞ X ap xp = f (x) . p=0 Sia f una funzione di classe C ∞ in un intorno di x0 . Concretamente, il problema della convergenza a f in un intervallo I contenente x0 della sua serie di Taylor centrata in x0 si riduce a dimostrare che, per x ∈ U , il resto dello sviluppo di Taylor all’ordine n nel punto x0 , n X f (k) (x0 ) (x − x0 )k , Rn (x0 ; x) = f (x) − k! k=0 tende a 0 per n → ∞. In molti casi, la questione si risolve facendo uso di una delle due formule del resto Rn (x0 ; ·), la forma di Lagrange e la forma integrale. Si noti che il caso n = 0 del punto (i) corrisponde al teorema del valor medio di Lagrange, mentre il caso n = 0 del punto (ii) corrisponde al teorema fondamentale del calcolo integrale. Teorema 6.31 (Formule del resto). Siano I ⊆ R un intervallo, x0 ∈ I, n ∈ N e f : I → R. (i) (Resto in forma di Lagrange) Si supponga che f sia derivabile n volte in I, con derivata n–sima continua e che, in I \ {x0 }, esista anche f (n+1) . Allora, per ogni x ∈ I \ {x0 }, esiste un punto tx , strettamente compreso tra x0 e x, tale che Rn (x0 ; x) = f (n+1) (tx ) (x − x0 )n+1 . (n + 1)! (ii) (Resto in forma integrale) Si supponga che f sia derivabile n + 1 volte in I, con derivata (n + 1)–sima continua in I. Allora Z 1 x (n+1) Rn (x0 ; x) = f (t)(x − t)n dt ∀x ∈ I . n! x0 Dimostrazione. (i) L’idea è di considerare y = x0 come un parametro, differenziando rispetto a y. La formula del resto si dimostra infatti applicando il teorema classico di Cauchy al rapporto F (x) − F (x0 ) F 0 (tx ) = 0 , G(x) − G(x0 ) G (tx ) ove F (y) e G(y) sono definite rispettivamente da n X f (k) (y) F (y) = (x − y)k , G(y) = −(x − y)n+1 . k! k=0 P 1 (k) Si noti che F (x) = f (x) e che F (x0 ) = n0 k! f (x0 )(x − x0 )k , quindi Rn (x0 ; x) = F (x) − F (x0 ) e G(x) − G(x0 ) = (x − x0 )n+1 . Vale quindi (8.3) Rn (x0 ; x) F 0 (tx ) = . (x − x0 )n+1 (n + 1)(x − tx )n 8. SERIE DI POTENZE E SERIE DI TAYLOR 157 Inoltre, per la regola di Leibniz di derivazione del prodotto, vale 0 F (y) = = n X f (k+1) (y) k=0 n X k=0 k! f (k+1) (y) k! k (x − y) − (x − y)k − n X kf (k) (y) k=1 n−1 X k=0 k! (x − y)k−1 f (n+1) (y) f (k+1) (y) (x − y)k = (x − y)n . k! n! F 0 (y) Inserendo questa formula per con y = tx nell’equazione (8.3) si ha la prima formula del resto. (ii) Procediamo per induzione su n ≥ 0. Per n = 0 l’enunciato corrisponde al teorema fondamentale del calcolo integrale. Per passare da n − 1 ≥ 0 a n integriamo prima per parti e poi usiamo l’ipotesi induttiva per ottenere x Z Z x 1 1 (n) 1 x (n+1) n (n) n−1 n f (t)(x − t) dt = f (t)(x − t) dt + f (t)(x − t) n! (n − 1)! n! x0 x0 = f (x) − n−1 X k=0 x0 f (k) (x0 ) f (n) (x0 ) (x − x0 )k − (x − x0 )n k! n! = Rn−1 (x0 ; x) − f (n) (x0 ) (x − x0 )n = Rn (x0 ; x) . n! Esempio. Per α ∈ R si consideri la funzione fα (x) = (1 + x)α , che è di classe C ∞ sulla semiretta (−1, +∞), qualunque sia α. Trascurando il caso α ∈ N, in cui fα si riduce a un polinomio, negli altri casi non si ha prolungamento C ∞ fuori da questa semiretta. Essendo fα(n) (x) = α(α − 1) · · · (α − n + 1)(1 + x)α−n , il resto Rn (x0 ; x) della formula di Taylor in forma integrale è dato da Z α(α − 1) · · · (α − n) x Rn (x0 ; x) = (1 + t)α−n−1 (x − t)n dt . n! 0 Per analogia con il caso in cui α è intero possiamo porre α α(α − 1) · · · (α − n + 1) , = n n! potendo in questo modo scrivere la serie di Taylor centrata in 0 nel modo seguente: ∞ X α n (8.4) x . n n=0 Questa è nota come serie binomiale. Per α 6∈ N, è facile applicare il criterio del rapporto ai coefficienti della serie (8.4), ottenendo che ha raggio di convergenza 1. Per |x| < 1 si ha Z x Rn (0; x) ≤ α(α − 1) · · · (α − n) |x − t|n (1 + t)α−n−1 dt n! 0 α(α − 1) · · · (α − n) Z x |x − t| n = (1 + t)α−1 dt . n! 1+t 0 9. IL LEMMA DI ABEL 158 Per a > 0 fissato, è facile studiare i problemi di massimo |t − a| |t + a| , max , 0≤t≤a t + 1 −a≤t≤0 t + 1 verificando che entrambi i valori massimi sono pari a a. Quindi, applicando questa proprietà con a = |x|, per x ∈ (−1, 1) otteniamo Z x α − 1 n α α−1 |x| . Rn (0; x) ≤ α(α − 1) · · · (α − n) |x|n (1 + t) dt = (1 + x) − 1 n n! 0 max Applicando il criterio del rapporto, si ottiene che limn Rn (0; x) = 0. Dunque ∞ X α n x = (1 + x)α per x ∈ (−1, 1) . n n=0 Abbiamo qui un altro bell’esempio di applicazione del principio di continuazione analitica: la funzione a sinistra, definita dalla somma della serie, è analitica e definita solo nell’intervallo (−1, 1); d’altro canto, con la formula del resto di Lagrange e con il criterio del rapporto si verifica12 che la funzione a destra è analitica in I = (0, ∞). Dato che coincidono in J = (0, 1), possiamo dire che la funzione somma della serie ha un (unico) prolungamento analitico a tutto l’insieme (−1, +∞), dato dalla funzione (1 + x)α . 9. Il Lemma di Abel P n Sia ∞ 0 an z una serie di potenze di raggio R centrata in 0, con R finito e strettamente positivo. Supponiamo che in un dato punto z0 con |z0 | = R la serie converga. Il Teorema 6.23 non dice nulla sulla continuità della funzione somma in z0 . Per esempio, sappiamo che la serie logaritmica (7.3) ∞ X xn n=1 n converge in [−1, 1) e che la somma è uguale a − log(1 − x) per x ∈ (−1, 1). Non possiamo però dire se, per x = −1, la somma della serie (cioè della serie armonica a segni alterni con primo termine negativo) è uguale a − log 2. Per ottenere questa conclusione, ci basterebbe sapere che la serie converge uniformemente su un intervallo comprendente il punto −1, diciamo su [−1, 0]: in tal caso, infatti, entrambi i membri sarebbero restrizioni di funzioni continue su [−1, 1) che, coincidendo in (−1, 1), dovrebbero anche coincidere nel punto −1. Vedremo in questo paragrafo che il lemma di Abel garantisce che convergenza in z0 implica convergenza uniforme su certi sottoinsiemi chiusi del disco DR (z0 ) detti non tangenziali. In particolare dedurremo la convergenza uniforme sul segmento chiuso congiungente 0 a z0 , che ci dà l’enunciato del lemma di Abel nel caso reale. Con vertice in z0 , si consideri un angolo di ampiezza 2θ < π, avente per bisettrice il raggio congiungente 0 a z0 e troncato in modo da non contenere punti di modulo R all’infuori di z0 . Non è importante come si effettua il troncamento, perché la differenza tra due regioni cosı̀ costruite per lo stesso valore di θ è comunque un sottoinsieme compatto del disco aperto DR (z0 ), e su di esso si ha già la convergenza uniforme della serie per il Teorema 6.20. Indichiamo con Sz0 ,θ una tale regione. 12Lo si faccia per esercizio, in questo caso si può sfruttare il fatto i valori di x sono maggiori di 0 per stimare l’errore in modo molto più semplice. 9. IL LEMMA DI ABEL 159 6 ........................................................................ ............. ........... .......... ......... ......... ....... ....... ....... . . . . . . ...... ..... . . ...... . . .... ..... 0 . . . . .... .. . . . .... .. . . .... . . . ........... . .... ........ .... ... ....... ... . ... ...... .. . . . ... .... .. ... . . .... .. ... . . .... .. ... . ... . .. ... ... . ... z0 ,θ ..... ... .. .. ... .. ... .. . .. .. .. .. .. .. .. . .. .. .. . . .. .. ... ... ... ... ... .. ... . ... ... ... .. .... ... .... .... . . .... . ... .... ... ..... .... ...... ...... ...... ...... . ....... . . . . . ....... ... ......... ....... .......... ......... ............. .......... ............................. ........................................ ..... • z θ θ S - P n Teorema 6.32 (Lemma di Abel). Sia R ∈ (0, +∞) il raggio di convergenza della serie ∞ 0 an z , e si supponga che essa converga in un punto z0 con |z0 | = R. Allora essa converge uniformemente in ogni regione Sz0 ,θ , con 0 ≤ θ < π/2.13 Dimostrazione. Il cambiamento di variabile z = z0 w trasforma la serie data nella serie ∞ X an z0n wn n=0 nella variabile w. Essa converge in un punto w se e solo se la serie data converge in z0 w. Dunque ha raggio di convergenza 1 e converge per w = 1. Inoltre essa converge uniformemente su un insieme A se e solo se la serie data converge uniformemente sull’insieme z0 A = {z0 w : w ∈ A}. P In questo n modo possiamo ricondurre la dimostrazione del teorema al caso particolare in cui la serie ∞ 0 an z abbia raggio di convergenza R = 1 e il punto di convergenza sul bordo sia z0 = 1. Lavoreremo nella regione (ottenuta con un troncamento di r = |z − 1| dipendente dall’angolo θ) S1,θ := z ∈ C : z = 1 + reiϕ , 0 ≤ r ≤ − cos(π + θ), ϕ ∈ (π − θ, π + θ) . Un’altra semplificazione della dimostrazione consiste nel ridursi al caso in cui il valore della somma in z0 = 1 è uguale a 0, cioè ∞ X an = 0 . n=0 Ciò si ottiene modificando opportunamente il coefficiente iniziale a0 . Questa variazione non altera gli insiemi di convergenza puntuale e uniforme della serie. Assumendo dunque queste ipotesi, indichiamo con E ⊆ D1 l’insieme di convergenza puntuale della serie e poniamo s(z) = ∞ X k=0 ak z k , sn (z) = n X k=0 ak z k , An = sn (1) = n X ak . k=0 13Restringendosi alla retta reale, l’enunciato è più semplice: ogni serie di potenze converge uniformemente in ogni intervallo chiuso e limitato contenuto nell’insieme di convergenza puntuale. 9. IL LEMMA DI ABEL 160 Sommando e sottraendo si ha (formula di sommazione di Abel) sn (z) = a0 + (a0 + a1 )z − a0 z+ (a0 + a1 + a2 )z 2 − (a0 + a1 )z 2 + ··· (a0 + a1 + · · · + an )z n − (a0 + a1 + · · · + an−1 )z n . Quindi, raggruppando per diagonali, otteniamo (9.1) sn (z) = n−1 X Ak (z k − z k+1 ) + An z n ∀z ∈ C . k=0 Si ottiene dall’identità (9.1) e dall’inclusione E ⊆ D1 , tenendo conto del fatto che An è infinitesima, che ∞ X Ak (z k − z k+1 ) = lim sn (z) − An z n = s(z) ∀z ∈ E . n→∞ k=0 Quindi per ogni z ∈ E vale n−1 ∞ X X k k+1 Ak (z k − z k+1 ) − An z n |s(z) − sn (z)| = Ak (z − z )− k=0 k=0 ∞ X = Ak (z k − z k+1 ) − An z n ≤ k=n ∞ X |Ak ||z k − z k+1 | + |An | . k=n Dato ε > 0, si fissi n0 ∈ N tale che |An | < ε per ogni n ≥ n0 . Si ha allora, per n ≥ n0 e z ∈ E, |s(z) − sn (z)| ≤ ε ∞ X ∞ X |z k − z k+1 | + 1 ≤ ε |z k − z k+1 | + 1 . k=n k=0 Restringiamoci ora a z ∈ S1,θ con θ < π/2. Poiché i punti di S1,θ , tranne il punto 1, hanno modulo strettamente minore di 1, si ha ∞ ∞ 0 se z = 1 , X X k k+1 k |z − z |= |1 − z||z| = |1 − z| se z ∈ S1,θ \ {1} . k=0 k=0 1 − |z| Dunque, per n ≥ n0 , sup |s(z) − sn (z)| ≤ ε 1 + z∈S1,θ |1 − z| . z∈S1,θ \{1} 1 − |z| sup La dimostrazione è conclusa se si mostra che questo estremo superiore è finito. Allora abbiamo, nelle coordinate usate per specificare S1,θ , che |1 − z| vale r, mentre |z| = p r2 1 + r2 + 2r cos ϕ ≤ 1 + + r cos ϕ . 2 11. ESERCIZI 161 Quindi per z ∈ S1,θ \ {1} vale r r 1 1 − |z| ≥ |1 − z|(− − cos ϕ) ≥ |1 − z|(− − cos(π + θ)) ≥ − |1 − z| cos(π + θ) , 2 2 2 da cui possiamo concludere che l’estremo superiore si maggiora con 2(cos θ)−1 (si noti che la stima degenera quando θ ↑ π/2). 10. Alcune serie notevoli Elenchiamo alcune serie di potenze (centrate in 0) di particolare rilevanza, con l’espressione della funzione somma e il relativo raggio di convergenza. Tabella 1. Alcune serie di uso frequente ∞ X 1 n x n! n=0 1 ∞ X 2 n=0 ex ∞ sin x ∞ cos x ∞ sinh x ∞ cosh x ∞ log(1 + x) 1 1+x 1−x 1 (−1)n 2n+1 x (2n + 1)! ∞ X (−1)n 2n x (2n)! n=0 3 ∞ X 4 n=0 1 x2n+1 (2n + 1)! ∞ X 5 n=0 1 x2n (2n)! ∞ X (−1)n−1 n x n n=1 6 ∞ X 7 n=1 1 x2n+1 2n + 1 1 2 log 8 ∞ X (−1)n 2n+1 x 2n +1 n=1 arctg x 1 9 ∞ X α n x n n=0 (1 + x)α 1 (α 6∈ N) arcsin x 1 10 ∞ X n=0 2n 1 x2n+1 (2n + 1)4n n 11. Esercizi Esercizio 6.1. Siano 1 , n ∈ N, 1 + (x − n)2 si mostri che la successione di funzioni fn converge puntualmente ma non uniformemente su R. fn (x) = 11. ESERCIZI 162 Esercizio 6.2. Siano ( 1 fn (x) = 0 se n ≤ x ≤ n + 1, altrimenti, si mostri che la successione di funzioni fn converge puntualmente a zero, converge uniformemente su ogni insieme della forma (−∞, a] ma non su tutto R. Esercizio 6.3. Si dica se la successione di funzioni x n converge puntualmente in ogni punto di [0, π] e si dica se la convergenza è uniforme. Si dica se la successione di funzioni x n fn (x) = 1 − cos n converge puntualmente in ogni punto di [0, 2π] e se la convergenza è uniforme. fn (x) = n sin Esercizio 6.4. Data f : R → R continua in 0, siano x , n ∈ N∗ . n Si studino le proprietà di convergenza puntuale e uniforme di fn . fn (x) = f Esercizio 6.5. Data f : R → R con limx→−∞ f (x) = A, limx→+∞ f (x) = B, siano fn (x) = f (nx), n ∈ N∗ . Si studino le proprietà di convergenza puntuale e uniforme di fn Esercizio 6.6. Data f : R → R continua, se la famiglia di funzioni fn (x) = f (nx), n ∈ N∗ , è equicontinua su [0, 1] cosa si può dire su f ? Esercizio 6.7. Data f : R → R, siano 1 fn (x) = f x + . n Si mostri che se f è continua, allora fn → f puntualmente, per n → ∞. Si mostri che se f è uniformemente continua, allora fn → f uniformemente, per n → ∞. Esercizio 6.8. Sia fn : I → R una successione di funzioni tale che fn → f uniformemente e f : I → R è continua. Si provi che se x, xn ∈ I e xn → x allora limn→∞ fn (xn ) = f (x). Si dica se la conclusione vale assumendo la convergenza solo puntuale, inoltre si discuta se vale il viceversa, cioè assumendo che la conclusione valga per ogni x ∈ I e xn → x si ha che la convergenza fn → f è uniforme. 11. ESERCIZI 163 Esercizio 6.9. Siano x , ∀n ∈ N . 1 + nx2 Si mostri che fn → 0 uniformemente su R, per n → ∞, ma fn0 converge per ogni x ∈ R ma non sempre a zero. fn (x) = Esercizio 6.10. Si provi che ogni funzione continua su [a, b] è limite uniforme di una successione di funzioni continue affini a tratti. Esercizio 6.11 (Inf–Convoluzione). Sia (X, d) uno spazio metrico e f : X → R ∪ {+∞} semicontinua inferiormente e limitata dal basso. Si definiscano le funzioni fn (x) = inf {f (y) + nd(x, y)} y∈X e si mostri che la successione fn è una successione crescente di funzioni Lipschitziane convergente puntualmente a f . Esercizio 6.12 (Teorema del Dini). F Sia K ⊂ R un compatto e sia fn una successione di funzioni continue su K, convergente puntualmente ad una funzione f continua su K. Si mostri che se fn ≥ fn+1 , la convergenza è uniforme su K. Si esibiscano degli esempi che mostrino che le ipotesi di monotonia, continuità e compattezza di K non possono essere eliminate. Esercizio 6.13. F Sia fn una successione di funzioni monotone non decrescenti su [a, b] che converga puntualmente ad una funzione continua su [a, b]. Si mostri che la convergenza è uniforme su [a, b]. Si esibiscano degli esempi che mostrino che le ipotesi di monotonia, continuità e compattezza dell’intervallo [a, b] non possono essere eliminate. Esercizio 6.14 (Teorema di Selezione di Helly). F Sia fn : I → R una successione di funzioni monotone non decrescenti su un intervallo I ⊆ R, uniformemente limitate dall’alto e dal basso, si provi che esiste una funzione monotona non decrescente f : I → R e una successione ni ∈ N tale che f (x) = limi→∞ fni (x) per ogni x ∈ I. Esercizio 6.15. F Sia fn : R → R una successione di funzioni continue che converge puntualmente ad una funzione f . Si dimostri che l’insieme dei punti di discontinuità di f è un insieme di prima categoria. Se ne deduca che la funzione f è continua su un denso di R. Ogni funzione f : R → R discontinua su un insieme di prima categoria è limite puntuale di una successione di funzioni continue? Nota. Lo spazio vettoriale delle funzioni f : R → R che sono limite puntuale di una successione di funzioni continue si dice prima classe di Baire, la classe zero sono le funzioni continue, le classi successive si ottengono considerando i limiti puntuali di successioni di funzioni nelle classi precedenti. Per induzione transfinita si ottengono cosı̀ tutte le classi di Baire associate agli ordinali numerabili. Le funzioni nell’unione di tutte queste classi si dicono funzioni di Baire. Lebesgue ha mostrato che ogni classe di Baire contiene strettamente tutte le precedenti e che ci sono funzioni che non sono funzioni di Baire. Un esempio di una funzione nella seconda classe di Baire ma non nella prima è dato dalla funzione caratteristica dei razionali, si veda il Problema 6.17. 11. ESERCIZI 164 Esercizio 6.16. F Sia f : (0, 1) → R una funzione derivabile in ogni punto. Si mostri che f 0 è continua in un denso (di seconda categoria). Esercizio 6.17. F Si dimostri che la funzione di Dirichlet ( 1 f (x) = 0 se x ∈ Q, se x ∈ 6 Q, non è il limite puntuale di una successione di funzioni continue. Si mostri però che sin2 (n!πx) = f (x) , n→∞ m→∞ sin2 (n!πx) + 1/m2 lim lim per ogni x ∈ R. Esercizio 6.18. F Sia pn ∈ R[x] una successione di polinomi di grado non superiore a k ∈ N, uniformemente convergente su un intervallo chiuso [a, b]. Si mostri che la funzione limite è un polinomio di grado non superiore a k. La stessa conclusione vale se la convergenza è solo puntuale su un intervallo qualunque? Esercizio 6.19. Sia fn una successione di funzioni definite su di un sottoinsieme di R a valori reali che converga uniformemente ad una funzione f limitata. Si provi che tutte le funzioni fn sono limitate in modulo da una stessa costante. Si dica se la stessa conclusione vale se la convergenza è solo puntuale. Esercizio 6.20. Sia fn una successione di funzioni definite su R a valori reali e limitate. Si supponga che fn converga uniformemente su R a una funzione f . Si provi che • le funzioni fn sono limitate in modulo da una stessa costante, • per ogni funzione g continua su R, le composizioni g ◦fn convergono uniformemente a g ◦f . Esercizio 6.21. Sia fn : I → R una successione di funzioni uniformemente continue, convergenti uniformemente ad una funzione f : I → R. Allora la funzione f è uniformemente continua e la famiglia {f } ∪ {fn } è equicontinua. Viceversa, se la famiglia {fn } è equicontinua e la successione fn converge puntualmente alla funzione f : I → R, la funzione f è continua con lo stesso modulo di continuità comune alle fn e la convergenza è uniforme. Esercizio 6.22. Si discuta la chiusura per convergenza puntuale o uniforme delle seguenti classi di funzioni f : I → R, dove I è un intervallo di R (si distinguano i vari casi a seconda dell’intervallo). • Le funzioni limitate. • Le funzioni monotone non decrescenti. • Le funzioni che ammettono limite destro e sinistro finiti in ogni punto. • I polinomi e i polinomi di grado minore di n, per n ∈ N fissato. • Le funzioni continue. • Le funzioni continue e monotone non decrescenti. • Le funzioni uniformemente continue. • Le funzioni con un fissato comune modulo di continuità. 11. ESERCIZI • • • • • • • Le Le Le Le Le Le Le funzioni funzioni funzioni funzioni funzioni funzioni funzioni 165 Lipschitziane (con o meno la stessa costante di Lipschitz). Hölderiane (con o meno la stessa costante di Hölder). assolutamente continue. a variazione limitata. che hanno la proprietà del valor intermedio. derivabili (con o meno derivata limitata in modulo da una costante comune). convesse. Esercizio 6.23. F Si mostri che, fissati un polinomio p ∈ R[x], un numero reale ε > 0 e n ∈ N, esiste una funzione continua f : [0, 1] → [0, 1] tale che • sup |p(x) − f (x)| < ε , x∈[0,1] • per ogni x esiste y tale che f (x) − f (y) > n. x−y Se ne deduca che l’insieme f (x) − f (y) n o Fn = f ∈ C([0, 1]) : esiste x ∈ [0, 1] tale che ≤ n per ogni y 6= x x−y è un chiuso con parte interna vuota nello spazio metrico C([0, 1]) con la norma uniforme. Si mostri allora che l’insieme delle funzioni che non sono derivabili in nessun punto è un denso (di seconda categoria) in tale spazio. Esercizio 6.24. Si mostri che per ogni C ∈ R e α ∈ (0, 1), l’insieme di funzioni continue n o WC,α = f ∈ C([0, 1]) : |f (x) − f (y)| ≤ C|x − y|α per ogni x 6= y , è un chiuso con parte interna vuota nello spazio metrico C([0, 1]) con la norma uniforme. Si deduca che l’insieme delle funzioni che non sono Hölderiane è un denso (di seconda categoria) in tale spazio. Esercizio 6.25. F Sia W un sottospazio dello spazio metrico C([0, 1]) con la norma uniforme tale che tutti i suoi elementi siano funzioni derivabili. Si mostri che la chiusura dell’insieme n o BW (1) = f ∈ W : sup |f 0 (x)| ≤ 1 e f (0) = 0 x∈[0,1] è un compatto. Esercizio 6.26 (Teorema di Ascoli–Arzelà). F Sia K uno spazio metrico compatto e sia S un sottoinsieme di C(K) con la norma uniforme. Si mostri che S è compatto se e solo se è chiuso e consiste di una famiglia di funzioni puntualmente equilimitate ed equicontinue. Esercizio P 6.27. P∞ Siano ∞ n=0 fn (x) e n=0 gn (x) due serie di funzioni fn , gn : X → R totalmente convergenti (una 11. ESERCIZI 166 P P∞ serie di funzioni ∞ n=0 supx∈X |fn (x)| n=0 fn (x) si dice totalmente convergente se la serie numerica converge). Si provi che allora anche le serie di funzioni ∞ X fn (x) + gn (x) , n=0 ∞ X fn (x)gn (x), n=0 X fn (x)gm (x) n,m∈N convergono totalmente. Esercizio 6.28. Sia E ⊆ R e siano fn , gn : E → R e P • la serie di funzioni ∞ n=0 fn (x) ha somme parziali uniformemente limitate in E, • gn (x) → 0 uniformemente su E, • si ha g1 (x) ≥ g2 (x) ≥ g3 (x) ≥ . . . per ogni x ∈ E. P Si provi che allora la serie di funzioni ∞ n=0 fn (x)gn (x) converge uniformemente su E. Esercizio 6.29. Sia ( fn (x) = 1 n 0 per n ≤ x < n + 1 altrove. P∞ Si mostri che la serie di funzioni n=1 fn (x) è assolutamente convergente e uniformemente convergente su R, ma non è totalmente convergente. Esercizio 6.30. Si trovino le discontinuità della funzione f definita dalla serie di funzioni ∞ X f (x) = {nx}/n2 n=1 e si provi che formano un denso numerabile di R (con {·} indichiamo la parte frazionaria di un numero reale). Esercizio 6.31. P 3 Si mostri che la serie di funzioni ∞ n=1 [nx]/n converge uniformemente su ogni intervallo limitato ad una funzione f continua in ogni punto irrazionale, e tale che se a = p/q, con p, q interi primi tra loro e q > 0, si ha ∞ 1 X 1 lim f (x) − lim f (x) = 3 x→a+ x→a− q k3 k=1 (con [·] indichiamo la parte intera di un numero reale). Esercizio 6.32. Si mostri che la serie di funzioni ∞ X sin(2n πx) n=0 2n non può essere differenziata termine a termine. Esercizio 6.33. Si studi la convergenza semplice e uniforme delle serie di funzioni ∞ ∞ X X sin nx cos nx , . n n n=1 n=1 11. ESERCIZI Esercizio 6.34. Sia ( 0 I(x) = 1 167 per x ≤ 0, per x > 0, si mostri che se xn è una successione di punti distinti nell’intervallo (a, b) e se allora la serie di funzioni ∞ X f (x) = cn I(x − xn ) P∞ n=0 |cn | converge, n=0 converge uniformemente in (a, b) e f è continua in tutti i punti x 6∈ {xn }n∈N . Esercizio 6.35. Si consideri la serie di funzioni ∞ X n sin (nx) . 2n n=0 • Si mostri che la sua somma f è una funzione di classe C ∞ . • Si indichi una procedura per trovare, dati ε, R > 0, un polinomio P (x) tale che |f (x) − P (x)| < ε per ogni x ∈ [−R, R]. • Si determini la funzione f . Esercizio 6.36 (Una Curva che Riempie lo Spazio). F Sia f : R → R una funzione continua tale che 0 ≤ f (t) ≤ 1, f (t + 2) = f (t) per ogni t ∈ R e ( 0 per t ∈ [0, 1/3], f (t) = 1 per t ∈ [2/3, 1]. Si ponga γ(t) = x(t), y(t) dove x(t) = ∞ X 2−n f (32n−1 t), n=1 y(t) = ∞ X 2−n f (32n t) , n=1 e si provi che la curva γ è continua e mappa l’intervallo I = [0, 1] sul quadrato unitario I 2 ⊂ R2 surgettivamente. Più precisamente l’immagine per la curva γ dell’insieme di Cantor è tutto il quadrato unitario del piano euclideo. Esercizio 6.37. Si determini il raggio di convergenza e (se possibile) la funzione somma delle seguenti serie di potenze: ∞ ∞ ∞ ∞ n X X X X xn n k n nx , (−1) n x , (−1) , nk xn , nk nk n=0 n=1 n=0 n=1 dove x ∈ R e k ∈ N∗ . Esercizio 6.38. Si consideri la seguente funzione (ipergeometrica): ∞ X a(a + 1) . . . (a + n − 1) · b(b + 1) . . . (b + n − 1) n I(a, b, c, z) = 1 + z , n! · c(c + 1) . . . (c + n − 1) n=1 con a, b, c ∈ R, c 6= 0, −1, −2, . . . e z ∈ C. Si stabilisca il raggio di convergenza e si studi la convergenza assoluta sulla circonferenza del disco di convergenza. 11. ESERCIZI 168 Esercizio 6.39. Si determini il raggio di convergenza delle seguenti serie di potenze: x+ ∞ X 1 · 3 · 5 . . . (2n − 1) n=1 x+ ∞ X (−1)n · n=1 2 · 4 · 6 . . . (2n) · x2n+1 , 2n + 1 1 · 3 · 5 . . . (2n − 1) x2n+1 · . 2 · 4 · 6 . . . (2n) 2n + 1 Si calcoli la somma delle precedenti serie per x ∈ R, e si deduca che 1+ √ 1·3 1 1·3·5·7 1 π 1 · + · + · · · = + log(1 + 2) . 2·4 5 2·4·6·8 9 4 2 Esercizio 6.40. P n Si trovi una serie di potenze y(x) = ∞ n=0 an x che risolva l’equazione di Bessel xy 00 + y 0 + xy = 0 . Esercizio 6.41. P n Si determini una serie di potenze y(x) = ∞ n=0 an x che risolva in un intorno di x = 0 il problema y 0 + x2 y = 1, y(0) = 0, Esercizio 6.42. Si mostri che la funzione f (x) = ∞ X n=1 y 0 (0) = 1 . xn (n − 1)! soddisfa la relazione xf 0 (x) = (x + 1)f (x). Esercizio 6.43. Si dimostri che esiste una e una sola funzione continua f sull’intervallo [0, 1] tale che x f (x) = 1 + f (x2 ) . 2 Si dimostri che f è rappresentabile su [0, 1] come somma di una serie di potenze centrata in 0. Esercizio 6.44. F P n Una funzione f (x) = ∞ n=0 an x , analitica in un intorno di 0 ∈ R, soddisfa sul suo dominio le condizioni ( f 0 (x) = 1 + f (−x) , f (0) = a . Si determini la funzione f e si provi che la funzione trovata è l’unica funzione derivabile in un intorno di zero del sistema. Esercizio 6.45 (Teorema di Stone–Weierstrass). F Si mostri che per ogni intervallo chiuso e limitato [a, b] ⊆ R, i polinomi sono densi in C([a, b]) con la . Se ne deduca che C([a, b]) è uno spazio metrico separabile. Esercizio 6.46 (Teorema della Mappa Aperta). FF Siano (V1 , k·k1 ) e (V2 , k·k2 ) due spazi di Banach, si mostri che una applicazione lineare A : V1 → V2 continua e bigettiva ha inversa continua. 11. ESERCIZI 169 Esercizio 6.47. F Sia (X, d) uno spazio metrico completo e F una famiglia di funzioni continue da X in R tale che per ogni x ∈ X, l’insieme {f (x) : f ∈ F} sia limitato. Si mostri che esiste un aperto di X su cui le funzioni di F sono equilimitate. Esercizio 6.48 (Principio di Uniforme Limitatezza). F Siano (V1 , k · k1 ) uno spazio di Banach e (V2 , k · k2 ) uno spazio normato, se una famiglia F di applicazioni lineari continue tra V1 e V2 ha la proprietà che per ogni x ∈ X, l’insieme {kA(x)k2 : A ∈ F} è limitato, allora F è una famiglia di applicazioni Lipschitziane con la stessa costante, in particolare sono equicontinue. Esercizio 6.49. √ P n z n al variare di a > 0. Si discuta la convergenza della serie di potenze ∞ n=0 a Esercizio P 6.50. F n Sia f (x) = ∞ n=0 an z con an ∈ {0, 1}. Si mostri che il raggio di convergenza è maggiore o uguale a 1 e che se f (1/2) ∈ Q allora f è una funzione razionale. Esercizio 6.51. Si trovi il raggio di convergenza e la somma della serie di potenze ∞ X xn . n(n + 1) n=1 Esercizio 6.52. P n Si mostri che una serie di potenze ∞ n=0 an z ha raggio di convergenza positivo se e solo se esiste n una costante C tale che |an | ≤ C per ogni n ∈ N. Esercizio 6.53. Date due serie di potenze f (z) = ∞ X an z n , g(z) = n=0 ∞ X bn z n , an , bn ∈ R, n=0 con raggio rispettivamente R1 e R2 , si mostri che la serie prodotto secondo Cauchy P di convergenza Pn n , dove c = a b h(z) = ∞ c z n n=0 n k=0 k n−k , ha raggio di convergenza R ≥ min{R1 , R2 } e si ha h(z) = f (z)g(z) all’interno del disco di convergenza. Esercizio P∞ 6.54. n Sia P∞ n=0nan z una serie di potenze, si mostri che se a0 6= 0 si puó trovare una serie di potenze di Cauchy sia la serie identicamente costante uguale a 1. Si n=0 bn z tale che il loro prodotto P n mostri che se inoltre laPserie f (z) = ∞ n=0 an z , con a0 6= 0, ha raggio di convergenza R > 0 allora ∞ n anche la serie g(z) = n=0 bn z ha raggio di convergenza positivo e in un intorno di 0 ∈ C vale g(z) = 1/f (z). Esercizio 6.55. Date due serie di potenze f (z) = ∞ X n=0 n an z , g(z) = ∞ X bn z n , an , bn ∈ R, n=0 con raggio di convergenza rispettivamente R1 , R2 > 0 e valga g(0) = 0. Si mostri che la serie di P n , composta formale di f e g, ha raggio di convergenza positivo e vale potenze h(z) = ∞ c z n n=0 h(z) = (f ◦ g)(z). 11. ESERCIZI 170 Esercizio 6.56. FF P a xn una serie per x ∈ R, si mostri che se a0 = 0 e a1 6= 0 si puó trovare Sia ∞ n n=0 P di potenze n tale che la loro serie composta formale sia la serie identicamente una serie di potenze ∞ b x n=0 n P n uguale a x. Si mostri che sePinoltre la serie f (x) = ∞ n=0 an x ha raggio di convergenza R > 0 ∞ n allora anche la serie g(x) = n=0 bn x ha raggio di convergenza positivo e in un intorno di 0 ∈ R vale g(x) = f −1 (x). Esercizio 6.57. FF Sia f : R → R una funzione analitica in un intorno di 0 con raggio di convergenza R > 0 e tale che f (0) = 0 e f 0 (0) 6= 0, dal problema precedente segue che allora f ha un’inversa f −1 anch’essa analitica in un intorno di zero. Se la funzione f è bigettiva e ha raggio di convergenza R = +∞, anche la funzione f −1 ha raggio di convergenza uguale a +∞? Esercizio 6.58. F P∞ Data una successione an ∈ R tale che an → 0 e n=0 |an − an+1 | sia convergente, si dimostri P∞ n converge per |z| ≤ 1, eccetto al più z = 1 e la convergenza è uniforme in a z che f (z) = n=0 n z ∈ C : |z| ≤ 1, |z − 1| ≥ δ , per ogni δ > 0. Si provi inoltre che limz→1− (1 − z)f (z) = 0. Esercizio 6.59. Sia f : [0, 1] → R una funzione C ∞ tale che f (n) (0) = 0 per ogni n ∈ N e sup |f (n) (x)| ≤ n!C , x∈[0,1] per una costante C ∈ R. Si mostri che f = 0 in [0, 1]. Esercizio 6.60. P n Sia f (x) = ∞ n=0 an x una serie di potenze con raggio di convergenza positivo tale che f (0) = n è estendibile f 0 (0) = · · · = f (n) (0), per n ∈ N. Si mostri che la funzione definita da g(x) P∞= f (x)/x n in x = 0 e tale estensione coincide con una serie di potenze g(x) = n=0 bn x . Che raggio di convergenza ha tale serie? Esercizio 6.61. F Si dimostri che se f ∈ C ∞ (R) e per ogni n ∈ N e ogni x ∈ R si ha f (n) (x) ≥ 0, allora la funzione f è analitica. CAPITOLO 7 CALCOLO DIFFERENZIALE IN PIÙ VARIABILI Si danno per note le nozioni fondamentali di algebra lineare, in particolare le nozioni di spazio vettoriale, trasformazione lineare, base. 1. Derivate parziali e direzionali Consideriamo una funzione f definita su un insieme A ⊆ Rn a valori reali. Definizione 7.1 (Derivata parziale). Sia x = (x1 , . . . , xn ) un punto interno ad A. Si chiama derivata parziale di f in x nella variabile xj la derivata in 0, se esiste, della funzione di una variabile g(t) = f (x1 , . . . , xj−1 , xj + t, xj+1 , . . . , xn ) , cioè si pone f (x1 , . . . , xj−1 , xj + h, xj+1 , . . . , xn ) − f (x) ∂f (x) = lim , h→0 ∂xj h se questo limite esiste finito. Non esiste un’unica notazione in letteratura per le derivate parziali, anzi ne coesistono molte: a seconda della convenienza useremo anche la notazione ∂xj f (x), o anche ∂j f (x). Il calcolo della derivata parziale nella variabile xj si effettua dunque “congelando” le variabili diverse dalla j–esima e considerando variabile solo la variabile xj . Ad esempio ∂ sin(x2 y) = 2xy cos(x2 y) , ∂x ∂ sin(x2 y) = x2 cos(x2 y) . ∂y La definizione di derivata direzionale è più generale e ha il vantaggio di essere indipendente dal sistema di coordinate. Definizione 7.2 (Derivata direzionale). Siano f , A e x come sopra. Dato v ∈ Rn , si chiama derivata direzionale di f rispetto a v in x la derivata in 0, se esiste, della funzione di una variabile g(t) = f (x + tv), cioè si pone ∂v f (x) = lim t→0 f (x + tv) − f (x) , t se questo limite esiste finito. La derivata ∂0 f (x) esiste e vale 0, qualunque sia f . È immediato verificare che (1.1) ∂λv f (x) = λ∂v f (x) ∀λ ∈ R , nel senso che se esiste la derivata a destra, esiste quella a sinistra e sono legate da questa relazione lineare. 171 2. DIFFERENZIALE 172 Ovviamente, se ej = (0, . . . , 1, . . . , 0) è il versore j–esimo della base canonica di Rn , ∂ej f (x) = ∂f (x) . ∂xj Vediamo l’interpretazione grafica della derivata direzionale, per v ∈ Rn non nullo. Consideriamo il piano affine 2–dimensionale “verticale” π ⊆ Rn ×R passante per P = (x, 0) e parallelo al sottospazio generato dai due vettori w1 = (v, 0) e w2 = (0, 1), vale a dire π = {P + tw1 + yw2 : t, y ∈ R} . Intersecando π con il grafico di f (1.2) Gf = x, f (x) : x ∈ A ⊆ A × R si ottiene l’insieme di punti {P + tw1 + f (x + tv)w2 : t ∈ R} ⊆ π che corrisponde al grafico y = f (x + tv), nelle variabili (t, y) che parametrizzano il piano π. Se poi v è un versore, cioè |v| = 1, le coordinate (t, y) sul piano π inducono proprio la distanza euclidea e ∂v f (x) rappresenta il coefficiente angolare della tangente al grafico. Si osservi, che a differenza di quanto succede con funzioni di una variabile, l’esistenza di tutte le derivate parziali o direzionali di una funzione in un punto non implica la continuità nel punto stesso. La funzione (8.1) del Capitolo 5, che è discontinua nell’origine, ha tutte le derivate direzionali, uguali a 0, in quel punto. 2. Differenziale Per funzioni f : I ⊆ R → R di una variabile, le due seguenti proprietà sono equivalenti: (i) f è derivabile in un punto x interno a I; (ii) esiste una funzione lineare g(h) = ah che approssimi l’incremento di f da x a x + h a meno di un infinitesimo superiore al primo, cioè tale che f (x + h) − f (x) = g(h) + o(h) per h → 0. Dividendo per h si verifica anche facilmente che, quando queste condizioni sono verificate, la costante a è univocamente determinata ed è uguale a f 0 (x0 ). Proviamo a riformulare le due proprietà per funzioni f : A ⊆ Rn → R di più variabili nel modo seguente: (i’) f ha tutte le derivate direzionali in un punto x interno a A; (ii’) esiste una funzione lineare da Rn a R, g(h) = a1 h1 + · · · + an hn = a · h, che approssimi l’incremento di f da x a x + h a meno di un infinitesimo superiore al primo, cioè tale che (2.1) f (x + h) − f (x) = g(h) + o |h| (h → 0) . Ponendo h = tv, con v fissato, dividendo per t e prendendo il limite per t → 0 si vede che che (ii’) implica (i’) e che ∂v f (x) = g(v) ∀v ∈ Rn . Infatti f (x + tv) − f (x) = ta · v + o |tv| = tg(v) + o(t) , da cui f (x + tv) − f (x) lim = g(v) . t→0 t 2. DIFFERENZIALE 173 Quindi, se esiste una funzione lineare g che soddisfi (ii’), questa è univocamente determinata dalle derivate direzionali di f lungo una base di Rn . D’altro canto, siccome g è continua in 0, la condizione (ii’) implica anche che lim f (x) = f (x) , x→x cioè che f è continua in x. Tuttavia, come già osservato in precedenza, l’esempio (8.1) del Capitolo 5 (la funzione non nulla solo nella regione x2 < y < 3x2 ) mostra che la (i’) non implica la continuità di f in x, e dunque le condizioni (i’) e (ii’) non sono equivalenti, si veda anche l’esempio (2.2). Possiamo quindi formalizzare la (ii’) in una definizione. Definizione 7.3 (Differenziabilità in un punto). Siano A ⊆ Rn e x interno ad A. Si dice che f : A −→ R è differenziabile in x se esiste una funzione lineare g di Rn in R per cui valga la formula (2.1). Per quel che abbiamo detto in connessione a (i’) e (ii’), vale il seguente teorema. Teorema 7.4 (Differenziabilità implica continuità, esistenza di ∂v f e linearità in v). Sia f : A ⊆ Rn → R differenziabile in un punto interno x ∈ A. Allora (i) f è continua in x; (ii) f ammette derivate direzionali rispetto a ogni vettore v ∈ Rn e esiste a ∈ Rn tale che ∀v ∈ Rn . ∂v f (x) = a · v In particolare, scegliendo v tra i vettori coordinati ej , vale ∂f (a) per ogni j = 1, . . . , n, (x) = aj ; ∂xj (b) la funzione lineare g(h) = a · h per cui vale la (2.1) è unica. Il seguente esempio mostra che la combinazione di (i’) e continuità non è ancora sufficiente per la differenziabilità. Lo otteniamo con una piccola variante dell’esempio (8.1). Esempio. Consideriamo la funzione se y ≥ 3x2 o y ≤ x2 ; 0 p (2.2) f (x, y) = y − x2 se x2 < y ≤ 2x2 ; p |x| − y − 2x2 se 2x2 < y < 3x2 . p Dato che |f (x, y)| ≤ |x|, f è continua in (0, 0). D’altro canto, tutte le derivate direzionali in (0, 0) sono nulle, quindi se f fosse ivi differenziabile dovrebbe essere f (x, y) = o(|(x, y)|) per (x, y) → (0, 0). Ma sul grafico y = 2x2 questo non succede. La condizione di differenziabilità in un punto consente, note le derivate parziali nel punto (o, più in generale, note le derivate direzionali rispetto ai vettori di una base di Rn ), di determinare tutte le altre derivate direzionali. Infatti, se v = (v1 , . . . , vn ) = v1 e1 + · · · + vn en , ∂v f (x) = n X j=1 vj ∂f (x) . ∂xj In altri termini, i valori delle derivate direzionali sono “vincolati” ai valori delle derivate parziali. Questo non succede in generale se la funzione, pur avendo tutte le derivate direzionali in un punto, non è ivi differenziabile, come mostra l’esempio seguente. 2. DIFFERENZIALE 174 Esempio. Consideriamo la funzione f : R2 → R definita da 2 x y se (x, y) 6= (0, 0) , f (x, y) = x2 + y 2 0 se (x, y) = (0, 0) . Dato che |f (x, y)| ≤ |y|, f è continua in (0, 0). Se la restringiamo a una retta y = λx otteniamo f (x, λx) = λx 1 + λ2 quindi la derivata nell’origine di f lungo la direzione v = (1, λ) vale λ/(1 + λ2 ). Nella direzione verticale v = (0, 1), la derivata di f vale 0. Si noti, più in generale, che v 7→ ∂v f (0, 0) = v12 v2 v12 + v22 è 1–omogenea in R2 (proprietà sempre vera osservata nella relazione (1.1)), ma non lineare, quindi f non può essere differenziabile in (0, 0). Con il cambiamento di variabile x = x + h, si ottiene la formula seguente. Corollario 7.5. Sia f : A ⊆ Rn → R dotata di derivate parziali in un punto x interno a A. Allora f è differenziabile in x se e solo se ammette lo sviluppo al primo ordine per x → x (2.3) f (x) = f (x) + n X ∂f (x)(xj − xj ) + o |x − x| ∂xj (x → x) . j=1 Definizione 7.6 (Gradiente, differenziale, iperpiano tangente). • Il vettore ∂f ∂f ∇f (x) = (x), . . . , (x) ∈ Rn ∂x1 ∂xn si chiama gradiente di f in x. • L’applicazione lineare (2.4) dx f (h) = ∇f (x) · h si chiama il differenziale di f in x. • L’iperpiano di Rn+1 , con coordinate (x1 , . . . , xn , y), di equazione y = f (x) + ∇f (x) · (x − x) si chiama iperpiano tangente (spesso anche “piano tangente”) al grafico Gf di f definito dalla (1.2) nel punto (x, f (x)). Anche se grazie al teorema di Riesz le applicazioni lineari da Rn in R possono essere identificate con vettori, è bene tenere concettualmente distinta la nozione di differenziale, che non dipende dalla scelta delle coordinate, dal vettore che lo rappresenta come nella formula (2.4) in un dato sistema di coordinate mediante il prodotto scalare, i.e. il gradiente. Quando f è differenziabile in x, il piano tangente in x è l’unione delle rette tangenti ai grafici ottenuti su ciascun piano (bidimensionale) verticale passante per (x, 0) intersecandolo con il grafico di f . Definizione 7.7 (Punti stazionari). Un punto x in cui una funzione f : A ⊆ Rn → R è differenziabile si dice stazionario se ∇f (x) = 0. 3. IL TEOREMA DEL DIFFERENZIALE TOTALE 175 Questo equivale a dire che tutte le derivate direzionali in x sono nulle, o anche che il piano tangente al grafico in x è orizzontale (cioè di equazione y =costante). Proposizione 7.8. Sia f : A ⊆ Rn → R differenziabile in un punto interno x e supponiamo che x non sia stazionario. Possiamo allora scrivere ∇f (x) = |∇f (x)|v0 , dove v0 è il versore di ∇f (x). Al variare di v tra i versori di Rn , la derivata direzionale ∂v f (x) assume valore massimo per v = v0 , e ∂v0 f (x) = |∇f (x)|. Dimostrazione. Per ogni versore v, ∂v f (x) = ∇f (x) · v = |∇f (x)|(v0 · v) . Per la disuguaglianza di Cauchy–Schwarz (Teorema 5.2 del Capitolo 5), |v0 · v| ≤ 1 e vale l’uguaglianza se e solo se v = ±v0 . Ma allora v0 · v assume valore massimo, uguale a 1, se e solo se v = v0 . Possiamo dire che ∇f (x) indica la direzione di “massima pendenza” del grafico di f in x̄, e il suo verso quello di “massima crescita”. 3. Il teorema del differenziale totale Il teorema che presentiamo fornisce condizioni sufficienti per la differenziabilità di una funzione in un punto. Esso è utile sia per gli sviluppi teorici che nel calcolo concreto con funzioni di più variabili. Teorema 7.9 (Teorema del differenziale totale). Sia f : A ⊆ Rn → R dotata di derivate parziali in un intorno di un punto x ∈ A. Se tali derivate sono continue in x, allora f è differenziabile in x. Dimostrazione. Per valutare l’incremento f (x)−f (x) seguiremo una spezzata, come in figura. 6 (x1 , x2 ) • (t1 , x2 ) • • (x1 , x2 ) (x1 , t2•) (x1 , x2•) - È quindi comodo supporre che l’intorno di x su cui esistono le derivate parziali di f sia un cubo Qr (x) = x + (−r, r)n . Dimostriamo che vale la formula (2.3) partendo dall’uguaglianza, per x ∈ 3. IL TEOREMA DEL DIFFERENZIALE TOTALE 176 Qr (x), (3.1) f (x) − f (x) = f (x1 , x2 , . . . , xn−1 , xn ) − f (x1 , x2 , . . . , xn−1 , xn ) + f (x1 , x2 , . . . , xn−1 , xn ) − f (x1 , x2 , . . . , xn−1 , xn ) ··· + f (x1 , x2 , . . . , xn−1 , xn ) − f (x1 , x2 , . . . , xn−1 , xn ) = ∆1 (x) + ∆2 (x) + · · · + ∆n (x) . Per ogni j = 1, . . . , n, la differenza ∆j (x) rappresenta l’incremento da xj a xj della funzione di una variabile hj (t) = f (x1 , . . . , xj−1 , t, xj+1 , . . . , xn ) . Per ipotesi, hj è derivabile su un intervallo aperto contenente xj e xj e h0j (t) = ∂f (x1 , . . . , xj−1 , t, xj+1 , . . . , xn ) . ∂xj Applicando il teorema di Lagrange, otteniamo che esiste tj = tj (x), strettamente compreso tra xj e xj , tale che ∂f ∆j (x) = (x1 , . . . , xj−1 , tj , xj+1 , . . . , xn ) (xj − xj ) . ∂xj Essendo le derivate parziali continue in x, dato ε > 0, esiste δ ∈ (0, r] tale che ∂f ∂f ε y ∈ Qδ (x) =⇒ (y) − (x) < ∀j = 1, . . . , n . ∂xj ∂xj n Dato che lavoriamo su un cubo, per x ∈ Qδ (x), anche i punti yj = (x1 , . . . , xj−1 , tj , xj+1 , . . . , xn ) sono in Qδ (x). Quindi ∂f ε ε (3.2) j = 1, . . . , n , (x)(xj − xj ) < |xj − xj | ≤ |x − x| ∆j (x) − ∂xj n n per x ∈ Qδ (x). Sommando le n disuguaglianze in (3.2) e tenendo conto della (3.1) otteniamo |f (x) − f (x) − n X ∂f (x)(xj − xj )| ≤ ε|x − x| ∂xj ∀x ∈ Qδ (x) . j=1 Definizione 7.10 (Funzioni di classe C 1 ). Una funzione f reale definita su un aperto A ⊆ Rn si dice di classe C 1 su A se ammette le derivate parziali in ogni punto di A e le funzioni ∂f /∂x1 , . . . , ∂f /∂xn sono continue su A. Chiaramente una funzione di classe C 1 su un aperto A è continua in A e la funzione ∇f : A −→ Rn è pure continua su A. Definizione 7.11 (Campo vettoriale e potenziale). Sia A ⊆ Rn aperto. Una funzione F : A −→ Rn si dice un campo vettoriale su A. Una funzione V : A −→ R è detta potenziale di F se F = ∇V su A.1 1In Fisica, se F = −∇V . 4. CURVE REGOLARI IN Rn 177 4. Curve regolari in Rn Sia I ⊆ R un intervallo chiuso e limitato, e γ = (γ1 , . . . , γn ) : I −→ Rn una curva. Definizione 7.12 (Vettore tangente e curve regolari). Se ogni componente γ1 , . . . , γn di γ è derivabile in t ∈ I, il vettore γ 0 (t) = γ10 (t), . . . , γn0 (t) si chiama vettore tangente a γ in t. La curva γ si dice regolare su I se ciascuna componente di γ è di classe C 1 in I e il vettore tangente non si annulla in I. Si noti che non ha senso parlare di “vettore tangente a γ in un punto x del sostegno” quando la curva non è semplice. È possibile che x = γ(t1 ) = γ(t2 ), ma γ 0 (t1 ) 6= γ 0 (t2 ). Anche per questo motivo il riferimento alla parametrizzazione della curva è essenziale. Applicando lo sviluppo espresso nella (2.1) a ogni componente γj di γ, si ottiene l’enunciato seguente. Lemma 7.13. Siano γ : I −→ Rn una curva regolare, t ∈ I, x = γ(t), v = γ 0 (t). La retta parametrica r(h) = x + hv è l’unica che soddisfi la condizione γ(t + h) = r(h) + o(h) (h → 0) . Sia ora f una funzione di classe C 1 su un aperto A e sia γ : I −→ A una curva regolare con sostegno contenuto in A. Allora la composizione f ◦ γ : I −→ R è derivabile in I e la seguente formula per il calcolo della derivata, la cosiddetta “chain rule”. Proposizione 7.14 (Regola di derivazione della funzione composta). La funzione f ◦ γ è derivabile in ˚ I e (f ◦ γ)0 (t) = n X ∂f γ(t) γj0 (t) = ∇f (γ(t)) · γ 0 (t) ∂xj ◦ ∀t ∈ I . j=1 Analogo enunciato vale agli estremi di I. Dimostrazione. Siano t ∈ ˚ I, x = γ(t) ∈ A. Per il Corollario 7.5, (x → x) . f (x) = f (x) + ∇f (x) · (x − x) + o |x − x| Sostituendo x = γ(t + h) e usando il Lemma 7.13, si ha, per h → 0, f ◦ γ(t + h) = f x + hγ 0 (t) + o(h) = f (x) + ∇f (x) · hγ 0 (t) + o(h) + o hγ 0 (t) + o(h) . Essendo 0 hγ (t) + o(h) ≤ |h||γ 0 (t)| + o(h) = O(h) (h → 0) , l’ultimo termine è o(h), e dunque f ◦ γ(t + h) = f ◦ γ(t) + h∇f (x) · γ 0 (t) + o(h) . 4. CURVE REGOLARI IN Rn 178 Definizione 7.15 (Lunghezza e parametrizzazione per lunghezza d’arco). La lunghezza `(γ) di una curva regolare γ : [a, b] → Rn è definita da2 Z b |γ 0 (s)| ds . `(γ) := a Una curva regolare γ : [a, b] → Rn si dice parametrizzata per lunghezza d’arco se |γ 0 | ≡ 1 in [a, b]. La parametrizzazione per lunghezza d’arco garantisce questa importante proprietà: se la curva è derivabile due volte possiamo differenziare l’identità |γ 0 |2 = 1 per ottenere n X 2 γi0 (t)γi00 (t) = 0 . i=1 Quindi il vettore γ 00 , detto curvatura di γ, è ortogonale alla curva. La quantità κ = |γ 00 | è invece chiamata curvatura scalare della curva. Si noti che il piano generato affine generato da γ 0 (t) e γ 00 (t) passante per γ(t) è quello che meglio approssima la curva nell’intorno del punto t. Se siamo in R3 e γ 00 (t) 6= 0, il sistema di coordinate indotto dalla base ortonormale γ 00 (t) γ 00 (t) , γ 0 (t) ∧ κ κ 3 (ove ∧ indica il prodotto vettore in R ) “agganciato” alla curva è molto utile nelle applicazioni. Tra curve regolari si può definite una relazione di equivalenza più fine di quella data nella Definizione 5.54 del Capitolo 5. γ 0 (t), Definizione 7.16. Siano γ : I −→ Rn e δ : J −→ Rn due curve regolari. Si pone γ ≈ δ se esiste una funzione bigettiva ϕ : I −→ J di classe C 1 , con ϕ0 > 0 in I e tale che γ = δ ◦ ϕ. Con le notazioni della definizione, δ è detta riparametrizzazione di γ. In sostanza, ≈ è più fine perché si richiede alla funzione di riparametrizzazione ϕ di essere di classe C 1 e con derivata positiva. Alla relazione ≈ si applica quanto detto per la relazione ∼ nel Capitolo 5. Vale inoltre la seguente proprietà: γ =δ◦ϕ≈δ =⇒ γ 0 (t) = ϕ0 (t)δ 0 ϕ(t) . In altri termini, i vettori tangenti di γ e δ in t̄ hanno stessa direzione e stesso verso. Le rette tangenti parametriche sono quindi equivalenti, si passa dall’una all’altra con una trasformazione lineare ϕ(t) = at con a > 0 (con a dato dal rapporto dei moduli di γ 0 (t̄) e δ 0 (t̄)). È proprio questa invarianza rispetto a riparametrizzazioni che giustifica la terminologia “vettore tangente alla curva”. Più in generale, valgono inoltre le seguenti proprietà di invarianza. Entrambe si mostrano facilmente usando la formula di cambiamento di variabili nell’integrale. Teorema 7.17. Curve equivalenti secondo la relazione ≈ hanno la stessa lunghezza. Se γ : [a, b] → Rn è regolare, posto Z t ϕ(t) := |γ 0 (s)| ds ϕ : [a, b] → [0, `(γ)] a la curva γ ◦ ϕ−1 : [0, `(γ)] → Rn è parametrizzata per lunghezza d’arco e equivalente a γ secondo la relazione ≈. 2È interessante osservare che esiste una nozione di lunghezza anche per curve continue γ : [a, b] → Rn : si Pn prende l’estremo superiore della somma 1 |γ(ti+1 ) − γ(ti )| (lunghezza delle spezzate) al variare delle partizioni a = t1 < t2 < · · · < tn+1 = b. La lunghezza può essere naturalmente infinita e non è troppo difficile mostrare che le due definizioni coincidono sulla classe delle curve regolari. 6. GRAFICI E INSIEMI DI LIVELLO: IL TEOREMA DELLA FUNZIONE IMPLICITA 179 5. Curve regolari e grafici Sia f una funzione di classe C 1 su un intervallo aperto I ⊆ R a valori reali. Allora la curva (5.1) γ(t) = t, f (t) t∈I , è semplice, il suo sostegno è il grafico di f ed è orientata con percorrenza “da sinistra a destra”. Inoltre γ è regolare, essendo γ 0 (t) = 1, f 0 (t) 6= 0 . Lemma 7.18. Sia γ = (γ1 , γ2 ) : I −→ R2 una curva di classe C 1 , e si supponga che γ10 > 0 in I. Allora γ ≈ δ, con δ della forma (5.1), con f di classe C 1 . Valgono enunciati analoghi se γ10 < 0 in I (in questo caso il verso di percorrenza è opposto) o se γ20 ha segno constante in I (in questo caso il grafico è del tipo x = g(y)). Dimostrazione. La funzione γ1 applica in modo bigettivo I su un intervallo J. Ponendo la curva δ = γ ◦ γ1−1 : J −→ R2 ha la forma (5.1) con f = γ2 ◦ γ1−1 ed è equivalente a γ. Dalla continuità del vettore tangente otteniamo che ogni curva regolare è localmente equivalente, nel senso della relazione ≈, a un grafico, scegliendo in modo opportuno il verso di percorrenza e il sistema di coordinate. Teorema 7.19. Sia γ : I −→ R2 una curva di classe C 1 . Per ogni t ∈ I esiste un intorno It di t tale che γ|It sia equivalente a δ(±s), con δ(s) del tipo s, f (s) , oppure a δ̃(±s), con δ̃(s) del tipo g(s), s . Dimostrazione. Per ogni t ∈ I, γ 0 (t) 6= 0. Supponiamo che γ10 (t) > 0. Essendo γ10 continua su I, esiste un intorno It di t su cui γ10 > 0. Ricadiamo quindi nelle ipotesi del Lemma 7.18. Se γ10 (t) < 0, basta sostituire γ con −γ per ricadere nel caso precedente. In modo analogo si procede, a componenti scambiate, se γ20 (t) 6= 0. 6. Grafici e insiemi di livello: il teorema della funzione implicita Sia f : A −→ R una funzione definita su A ⊆ Rn , con n ≥ 2. Dato a ∈ R, l’insieme Ea = x ∈ A : f (x) = a = f −1 (a) , si chiama un insieme di livello della funzione f . Si vuole conoscere la natura di questo insieme, e in particolare si vuol sapere se esso coincide con il grafico di una funzione di n − 1 variabili, cioè, a meno di una rinumerazione delle variabili, Ea = x0 , g(x0 ) : x0 = (x1 , . . . , xn−1 ) ∈ B} , con B ⊆ Rn−1 . In altri termini, data l’equazione f (x1 , . . . , xn ) = a , si vuole sapere se si può esplicitare una delle n variabili in funzione delle altre, cioè stabilire che, per qualche j, l’equazione è equivalente a xj = g(x1 , . . . , xj−1 , xj+1 , . . . , xn ) . Quando questo succede, si dice che la funzione g è implicitamente definita dall’equazione f (x) = a. È ben noto che la risposta generale a questo problema è negativa, anche con funzioni f molto regolari, per esempio, come supporremo d’ora in poi, di classe C 1 su un aperto A. L’insieme Ea può essere 6. GRAFICI E INSIEMI DI LIVELLO: IL TEOREMA DELLA FUNZIONE IMPLICITA 180 vuoto: x21 + x22 = −1, discreto: x21 + x22 = 0, non rappresentabile come grafico: x21 − x22 = 0, rappresentabile come grafico, ma non di una funzione derivabile: x21 − x32 = 0, non rappresentabile globalmente come un unico grafico, ma scomponibile nell’unione di più grafici: x21 + x22 = 1, • ecc. • • • • • Accontentiamoci dunque di porre il problema nella forma seguente: dare condizioni sulla funzione f , di classe C 1 sull’aperto A, perché, dato un punto x ∈ Ea , si possa concludere che esiste un intorno U di x tale che Ea ∩ U sia il grafico di una funzione C 1 di n − 1 variabili. Per semplicità, discuteremo in dettaglio il problema per funzioni f di due variabili (che indicheremo con x, y anziché x1 , x2 ), anche se le conclusioni che trarremo ammettono naturali estensioni a funzioni di più variabili (si veda il Teorema 7.22). Partiamo dalla seguente osservazione elementare. Lemma 7.20 (Il gradiente è ortogonale agli insiemi di livello). Siano A aperto di R2 , f di classe C 1 su A e γ : I −→ A una curva regolare con sostegno contenuto nell’insieme di livello Ea di f . Allora, per ogni t ∈ I, i vettori γ 0 (t) e ∇f (γ(t)) sono ortogonali. Dimostrazione. La funzione composta f ◦ γ è di classe C 1 su I e costantemente uguale ad a. Per la Proposizione 7.14, ∇f (γ(t)) · γ 0 (t) = (f ◦ γ)0 (t) = 0 per ogni t ∈ I . La relazione di ortogonalità è certamente verificata se il punto (x, y) = γ(t) è stazionario per f , indipendentemente dalla direzione di γ 0 (t). Ma si noti che negli esempi elencati sopra sono proprio i punti stazionari quelli in cui si verificano “irregolarità” dell’insieme di livello. Per poter formulare un risultato positivo, è dunque opportuno limitarsi a punti di Ea che non siano stazionari per f . Supponiamo allora che y = g(x) sia implicitamente definita, nell’intorno di un punto non stazionario 1 (x, y) ∈ Ea , dall’equazione f (x, y) = a, con g di classe C sull’intervallo I, e poniamo γ(t) = t, g(t) . Allora, se γ(x) = (x, y), differenziando al tempo x e sostituendo l’espressione per γ(x) nella formula di derivazione della funzione composta otteniamo l’identità ∂f ∂f (x, y) + (x, y)g 0 (x) = 0 . ∂x ∂y Deve necessariamente essere ∂y f (x, y) 6= 0, perché altrimenti si annullerebbe anche l’altra derivata parziale. Il teorema che segue mostra che un piccolo rafforzamento di questa condizione è anche sufficiente per poter esplicitare y in funzione di x nell’intorno di (x, y). Teorema 7.21 (Teorema delle funzioni implicite in R2 ). Sia f : A → R continua, con A aperto di R2 , e sia (x, y) ∈ A tale che ∂y f esiste in un intorno di (x, y), è continua in (x, y) e ∂y f (x, y) 6= 0. Esiste allora un intorno U = (x − δ1 , x + δ1 ) × (y − δ2 , y + δ2 ) di (x, y) tale che, posto a = f (x, y), l’insieme U ∩ f −1 ({a}) sia il grafico y = g(x), con g continua da (x − δ1 , x + δ1 ) a valori in (y − δ2 , y + δ2 ). Inoltre, se f è di classe C 1 in (x−δ1 , x+δ1 )×(y −δ2 , y +δ2 ), allora g è di classe C 1 in (x−δ1 , x+δ1 ) 6. GRAFICI E INSIEMI DI LIVELLO: IL TEOREMA DELLA FUNZIONE IMPLICITA 181 e vale ∂f x, g(x)) g 0 (x) = − ∂x ∂f x, g(x)) ∂y (6.1) per ogni x ∈ (x − δ1 , x + δ1 ) . Dimostrazione. Possiamo supporre che a = 0 e che ∂y f (x, y) > 0 e fissare un rettangolo chiuso iniziale [x − α, x + α] × [y − β, y + β] su cui ∂y f > 0. La funzione hx (y) = f (x, y) è dunque strettamente crescente su [y − β, y + β], per cui f (x, y − β) < 0 , f (x, y + β) > 0 . Esiste allora δ1 ∈ (0, α], tale che f (x, y − β) < 0 , f (x, y + β) > 0 per ogni x ∈ [x − δ1 , x + δ1 ] . Per il teorema di esistenza degli zeri, per ogni x ∈ [x − δ1 , x + δ1 ], la funzione hx (y) = f (x, y) si annulla sull’intervallo [y − β, y + β]. Essendo h0x (y) = ∂y f (x, y) > 0, hx si annulla in un unico punto, che chiamiamo g(x). 6 + + + + (x + α, y + β) • (x, y) (x − α, y − β) − − − − - La funzione g è dunque implicitamente definita dall’equazione f (x, y) = 0 in un intorno di (x, y). Mostriamo ora che g è continua su [x − δ1 , x + δ1 ]. Supponiamo per assurdo che, per una data successione (xn ) ⊂ [x − δ1 , x + δ1 ], si abbia xn → x ma g(xn ) non converge a g(x). Esiste allora > 0 tale che |g(xn ) − g(x)| ≥ per infiniti indici n. Considerando solo questi indici, troviamo una sottosuccessione n(k) tale che g(xn(k) ) converge a un certo z 6= g(x), con z ∈ [y − δ2 , y + δ2 ]. Ma, passando al limite per k → ∞ nella relazione f (xn(k) , g(xn(k) )) = 0, otteniamo f (x, z) = 0, contro l’unicità di g(x). Quindi l’assurdo mostra la continuità di g. Vogliamo dimostrare, nell’ipotesi aggiuntiva che f sia di classe C 1 nel rettangolo, che g ammette derivata continua su (x − δ1 , x + δ1 ). Prendiamo due punti xe x + h in tale intervallo e poniamo k = k(h) = g(x+h)−g(x). Congiungiamo quindi i punti x, g(x) e x+h, g(x+h) = x+h, g(x)+k(h) per mezzo del segmento γ(t) = x + th, g(x) + tk(h) , t ∈ [0, 1] . 6. GRAFICI E INSIEMI DI LIVELLO: IL TEOREMA DELLA FUNZIONE IMPLICITA 182 La funzione composta f ◦ γ è continua su [0, 1], derivabile all’interno e nulla agli estremi. Per il teorema di Rolle, esiste θ = θ(h) ∈ (0, 1) tale che ∂f ∂f x + θh, g(x) + θk(h) + k x + θh, g(x) + θk(h) . 0 = (f ◦ γ)0 (θ) = h ∂x ∂y Essendo ∂y f diversa da 0 sul rettangolo compatto U = [x − δ1 , x + δ1 ] × [y − β, y + β], la funzione |∂x f /∂y f | è continua su U . Allora, per la continuità di ∂x f e di g, la funzione u(h) definita da ∂f ∂f u(h) = x + θ(h)h, g(x) + θ(h)k(h) = x + θ(h)h, g(x) + θ(h) g(x + h) − g(x) ∂x ∂x è continua in h = 0, e dunque ∂f ∂f x + θ(h)h, g(x) + θ(h)k(h) = x, g(x) + o(1) (h → 0) . ∂x ∂x Analogamente per ∂f /∂y. Si ha quindi che ∂f ∂f x + θ(h)h, g(x) + θ(h)k(h)) x, g(x)) k(h) g(x + h) − g(x) = = − ∂x −→ − ∂x per h → 0 . ∂f ∂f h h x + θ(h)h, g(x) + θ(h)k(h)) x, g(x)) ∂y ∂y Abbiamo quindo mostrato la derivabilità di g e la formula (6.1). Da tale formula ricaviamo la continuità di g 0 . La condizione ∇f (x) 6= 0 è dunque sufficiente per poter esplicitare una delle due variabili in funzione dell’altra in un intorno del punto dato. Tuttavia questa condizione non è affatto necessaria. Supponendo a = 0, si noti infatti che f e f 2 definiscono lo stesso insieme di livello E0 , ma ∇f 2 = 2f ∇f è identicamente nullo su E0 . Esempio. Il teorema delle funzioni implicite ci consente ad esempio di dire che il luogo di zeri x5 y − cos(xy 3 ) + y + 1 = 0 coincide nell’intorno di (0, 0) con il grafico di una funzione g(x) (di classe C ∞ , come vedremo tra un attimo), anche se è probabilmente impossibile esprimere g mediante le funzioni “elementari”. Osserviamo che una maggiore regolarità di f implica una maggiore regolarità di g; ad esempio, se tutte le derivate ∂xx f = ∂x (∂x f ), ∂xy f = ∂x (∂y f ), ∂yx f = ∂y (∂x f ), ∂yy f = ∂y (∂y f ) sono continue (almeno in un intorno), allora la regola di derivazione della funzione composta dà che g è di classe C2 e 1 1 g 00 (x) = − (∂xx f + ∂yx f g 0 (x)) + (∂x f ∂xy f + ∂x f ∂yy f g 0 (x)) ∂y f (∂y f )2 1 = − ∂xx f (∂y f )2 − ∂xy f ∂x f ∂y f − ∂yx f ∂x f ∂y f + ∂yy f (∂x f )2 , 3 (∂y f ) ove si intende che tutte le derivate parziali sono valutate in (x, g(x)). Il discorso si può iterare, mostrando che se f ha tutte le derivate parziali di ordine k continue, allora g è di classe C k .3 Il teorema delle funzioni implicite ha il seguente analogo per funzioni di n variabili, che ci limitiamo a enunciare, anche se la dimostrazione è del tutto analoga a quella del caso bidimensionale. 3Si veda la Sezione 11 per maggiori informazioni sulle derivate parziali di ordine superiore. 7. *FUNZIONI DIFFERENZIABILI DA Rn A Rm 183 Per comodità, indichiamo i punti x ∈ Rn come coppie (x0 , xn ) con x0 = (x1 , . . . , xn−1 ) ∈ Rn−1 . Teorema 7.22 (Teorema delle funzioni implicite in Rn ). Sia f : A ⊆ Rn → R continua, con A aperto, e sia x = (x0 , xn ) ∈ A tale che ∂xn f esiste in un intorno di x, è continua in x e ∂xn f (x) 6= 0. Esiste allora un intorno U = U 0 × (xn − δ, xn + δ) di x (dove U 0 è un intorno di x0 in Rn−1 ) tale che, posto a = f (x), l’insieme U ∩ f −1 ({a}) sia il grafico xn = g(x0 ), con g continua da U 0 a valori in (xn − δ, xn + δ). Inoltre, se f è di classe C k su A per qualche k ∈ N∗ , allora g è di classe C k su U 0 e vale ∂f 0 x , g(x0 )) ∂g 0 ∂xi (x ) = − per ogni x0 ∈ U 0 e 1 ≤ i ≤ n − 1 . (6.2) ∂f 0 ∂xi x , g(x0 )) ∂xn 7. *Funzioni differenziabili da Rn a Rm 4 Consideriamo una funzione F : A → Rm , con A sottoinsieme di Rn . Siano (f1 , . . . , fm ) le componenti scalari di F , e sia x un punto interno a A. Supponiamo che ogni fj , j = 1, . . . , m, ammetta derivate parziali ∂xk fj in x per ogni k = 1, . . . , n. I valori di queste derivate si raggruppano nella matrice derivata, detta anche matrice Jacobiana ∂f1 ∂f1 (x) · · · (x) ∂x1 ∂xn ∂fj . . . . . . DF (x) = = (x) , . . . ∂xk j=1,...,m , k=1,...,n ∂fm ∂fm (x) · · · (x) ∂x1 ∂xn con m righe e n colonne. Si noti che • le riga j–esima della matrice è il gradiente in x della componente fj , • la colonna k–esima è il vettore delle derivate parziali rispetto a xk , o equivalentemente il vettore tangente in xk della curva γk (xk ) = F (x1 , . . . , xk−1 , xk , xk+1 , . . . , xn ) . Le nozioni introdotte per funzioni a valori reali si estendono come segue alle funzioni a valori in Rm . Definizione 7.23 (Differenziabilità e differenziale). La funzione F si dice differenziabile nel punto x interno al suo dominio se esiste un’applicazione lineare G : Rn −→ Rm tale che (7.1) F (x + h) − F (x) = G(h) + o |h| (h → 0) . La funzione lineare G, univocamente determinata dall’equazione (7.1), è detta differenziale di F in x ed è indicata con dx F . Lo studio della differenziabilità di una funzione si riduce a quello della differenziabilità delle sue componenti scalari, come mostra il seguente risultato. Proposizione 7.24. La funzione F è differenziabile in x se e solo se ivi sono differenziabili tutte le sue componenti scalari f1 , . . . , fm . 4Facoltativa 8. *COMPOSIZIONE DI FUNZIONI DIFFERENZIABILI 184 Dimostrazione. Nell’equazione (7.1) poniamo G(h) = Ah, con A = (ajk )j=1,...,m , k=1,...,n una matrice m × n. Indichiamo con vj = (aj1 , . . . , ajn ) la riga j–esima di A. Allora la condizione (7.1) equivale alle m condizioni fj (x + h) − fj (x) = vj · h + o |h| (h → 0) . Quindi esiste un’applicazione G che soddisfi la formula (7.1) se e solo se ogni fj è differenziabile in x. Questa riduzione alle componenti scalari ha una serie di conseguenze sulla base dei risultati visti finora. Corollario 7.25 (Relazioni tra differenziale e derivate parziali e direzionali). (i) Se F è differenziabile in x, nella formula (7.1) si ha G(h) = DF (x)h. (ii) Se F è differenziabile in x, essa ammette derivate direzionali, date da ∂F (x) = DF (x)v = dx F (v) ∀v ∈ Rn . ∂v (iii) Se ogni fj ammette derivate parziali in un intorno di x e continue in x, F è differenziabile in x. 8. *Composizione di funzioni differenziabili 5 Siano date due funzioni F : Rn → Rm e G : Rm → Rk . Più in generale, F = (f1 , . . . , fm ) : A −→ Rm , G = (g1 , . . . , gk ) : B −→ Rk , con A ⊆ Rn , F (A) ⊆ B ⊆ Rm , in modo che la funzione composta G ◦ F : A → Rk sia definita. Sotto opportune ipotesi sulla differenziabilità di F e G, vogliamo discutere la differenziabilità di G ◦ F. Teorema 7.26. Siano F e G come sopra. Si supponga che (i) F sia differenziabile in un punto x interno ad A; (ii) F (x) = y sia interno a B e G sia differenziabile in y. Allora G ◦ F è definita in un intorno di x, differenziabile in x e valgono le identità D(G ◦ F )(x) = DG(y)DF (x) , dx (G ◦ F ) = (dF (x) G) ◦ (dx F ) . Si noti che le dimensioni delle due matrici derivate rendono possibile il prodotto nell’ordine indicato. Dimostrazione. Essendo y interno a B, esiste una palla Br (y) ⊆ B. Per la continuità di G in y, esiste una palla Br0 (x), che possiamo supporre contenuta in A, tale che F (Br0 (x)) ⊆ Br (y). Quindi G ◦ F è definita su Br0 (x). Si ha dunque, per x + h ∈ Br0 (x) e y + k ∈ Br (y) F (x + h) − F (x) = DF (x)h + o |h| (h → 0) , G(y + k) − G(y) = DG(y)k + o |k| (k → 0) . Ponendo k = k(h) = F (x + h) − F (x) = F (x + h) − y = DF (x)h + o |h| 5Facoltativa (h → 0) , 9. *PUNTI STAZIONARI LIBERI E VINCOLATI 185 nella seconda formula e osservando che |k(h)| = O(|h|), si ottiene G F (x + h) − G F (x) = DG(y) DF (x)h + o |h| + o |h| = DG(y)DF (x)h + o |h| , e questo dà la tesi. Corollario 7.27 (Formula di derivazione della funzione composta). Nelle ipotesi del Teorema 7.26, ponendo G ◦ F = H = (h1 , . . . , hk ), vale la formula m X ∂gj ∂fp ∂hj (x) = (F (x)) (x) , ∂xi ∂yp ∂xi i = 1, . . . , n , j = 1, . . . , k . p=1 9. *Punti stazionari liberi e vincolati 6 Per studiare i massimi e i minimi di una funzione continua su un intervallo [a, b] ⊆ R, derivabile all’interno dell’intervallo, sappiamo che basta esaminare i valori della funzione agli estremi dell’intervallo e poi cercare gli eventuali punti di massimo e minimo tra i punti stazionari interni all’intervallo. In più variabili, supponiamo che f sia continua sull’insieme {F ≤ 0}, con F : Rn → R di classe C 1 e avente gradiente non nullo sull’insieme Γ := x ∈ Rn : F (x) = 0 = ∂ x ∈ Rn : F (x) < 0 . Allora come sempre possiamo cercare i punti di massimo e minimo della restrizione di f a {F ≤ 0} (che certamente esistono se {F ≤ 0} è non solo chiuso ma anche compatto), tra i punti stazionari nell’insieme aperto A = {F < 0}. Per cercare i punti di massimo e minimo di f sul bordo dell’insieme A è utile trovare una condizione differenziale che caratterizza i massimi e minimi locali (e quindi anche quelli globali) della restrizione di f a un insieme. Questo sarà possibile perchè l’insieme Γ è, almeno localmente, descrivibile come grafico grazie al teorema delle funzioni implicite. Diamo allora la seguente definizione. Definizione 7.28 (Punti stazionari liberi). Sia f : A −→ R, con A ⊆ Rn . Un punto x interno ad A si dice un punto stazionario libero di f se f è differenziabile in x e ∇f (x) = 0. Vale allora il Lemma 7.29 (I punti di massimo o minimo locale sono stazionari liberi). Sia f : A −→ R, con A ⊆ Rn , differenziabile in un punto x interno ad A. Se x è un punto di massimo o di minimo locale per f , allora ∇f (x) = 0. Dimostrazione. Supponiamo che x sia un punto di massimo locale. Per ogni j = 1, . . . , n, la funzione gj (t) = f (x1 , . . . , xj−1 , t, xj+1 , . . . , xn ) , definita per t in un intorno di xj in R, ha un massimo locale in xj ed è derivabile in xj . Quindi gj0 (xj ) = ∂f (x) = 0 . ∂xj 6Facoltativa 9. *PUNTI STAZIONARI LIBERI E VINCOLATI 186 Se la funzione f è di classe C 1 su un aperto A, la ricerca dei punti di massimo o minimo locale va dunque limitata ai punti in cui il gradiente è nullo. Come per le funzioni di una variabile, l’annullarsi del gradiente in un punto non assicura che il punto sia di massimo o di minimo. Già in una variabile le configurazioni possibili non sono facilmente catalogabili (punti di flesso, infinite oscillazioni nell’intorno del punto, ecc.). Una situazione che si presenta solo con più variabili è il cosiddetto punto di sella, esemplificato dalla funzione f (x, y) = x2 − y 2 nell’origine di R2 : la restrizione a una retta y = ax passante per l’origine presenta un massimo locale stretto se |a| > 1 e un minimo locale stretto se |a| < 1. Siano ora A ⊆ Rn un aperto e f una funzione di classe C 1 su A. Dentro A si abbia poi l’insieme di livello (che chiameremo vincolo e supporremo non vuoto) (9.1) Ea = x : F (x) = a , dove F : A −→ R è una funzione di classe C 1 con ∇F (x) 6= 0 per ogni x ∈ Ea . Definizione 7.30 (Massimi e minimi vincolati). Chiamiamo punto di massimo di f vincolato a Ea un punto di x ∈ Ea che sia di massimo per f |Ea . Diremo che x ∈ Ea è un massimo locale vincolato se esiste r > 0 tale che x sia di massimo per f |Ea ∩Br (x) . Un’analoga definizione può essere data per i punti di minimo (locale) vincolato. Si osservi che se x ∈ A è un punto di massimo libero per f , allora è necessariamente di massimo vincolato, qualunque sia il vincolo contenente x. Al contrario, un punto di massimo, o minimo, vincolato non è necessariamente di massimo, o minimo, libero, e può anche non essere un punto stazionario libero. Si prenda, ad esempio, la funzione f (x, y) = x2 + y 2 , e come vincolo la retta y = 1. Il punto (0, 1) è di minimo vincolato, ma non è stazionario libero. Teorema 7.31. Siano f, F di classe C 1 su A ⊆ Rn , siano a, Ea come nella formula (9.1), con Ea 6= Ø, e si supponga che ∇F (x) 6= 0 su Ea . Sia poi x ∈ Ea un punto di massimo (o di minimo) di f locale vincolato a Ea . Allora ∇f (x) è un multiplo scalare di ∇F (x). Dimostrazione. Supponiamo che x sia di massimo vincolato. Per ipotesi, ∇F (x) 6= 0. Supponiamo, a meno di riordinare le variabili, che ∂xn F (x) = 6 0. Per il Teorema 7.22, in un intorno U = U 0 × (xn − δ, xn + δ) di x, Ea coincide con il grafico xn = g(x0 ) , con g di classe C 1 su U 0 . Allora x0 è un punto di massimo locale libero della funzione h(x0 ) = f x0 , g(x0 ) . La funzione h è la composizione di f con la funzione G(x0 ) = x0 , g(x0 ) , G : U 0 −→ A , dove U 0 ⊂ Rn−1 e A ⊂ Rn . Per il Teorema 7.26 e il Lemma 7.29, (9.2) ∇h(x0 ) = (∇f (x))DG(x0 ) = 0 . 9. *PUNTI STAZIONARI LIBERI E VINCOLATI 187 Ma 1 0 .. . ··· ··· .. . 0 1 .. . 0 0 .. . 0 , DG(x ) = 0 ··· 1 0 ∂g ∂g ∂g (x0 ) (x0 ) · · · (x0 ) ∂x1 ∂x2 ∂xn−1 dove le n − 1 colonne sono linearmente indipendenti e generano il sottospazio parallelo all’iperpiano tangente al grafico di g (cioè a Ea ) in x. Quindi la condizione (9.2) indica che ∇f (x) è ortogonale a tale iperpiano. D’altra parte, la stessa conclusione vale per ∇F (x), in quanto la funzione ψ(x0 ) = F x0 , g(x0 ) è costantemente uguale ad a. Siccome il sottospazio ortogonale a un iperpiano ha dimensione 1, esiste λ ∈ R tale che ∇f (x) = λ∇F (x) (si noti che ∇F (x) 6= 0). Definizione 7.32 (Punti stazionari vincolati). Siano f, F, A, a, Ea come nel Teorema 7.31. Un punto x ∈ Ea si dice un punto stazionario di f vincolato a Ea se ∇f (x) è un multiplo scalare di ∇F (x). Si deduce che, nelle ipotesi del Teorema 7.31, i punti di massimo e minimo vincolati a Ea vanno ricercati tra i punti stazionari vincolati a Ea . La ricerca dei punti stazionari vincolati consiste dunque nella risoluzione del sistema ( ∇f (x) = λ∇F (x) (9.3) F (x) = a , nelle incognite x, λ. Il numero λ è detto moltiplicatore di Lagrange ed il metodo è noto come metodo dei moltiplicatori di Lagrange (il plurale deriva dal fatto che, per vincoli di codimensione più alta, ad esempio l’intersezione di due luoghi di zeri, serve più di un “moltiplicatore”). È anche interessante osservare che i punti stazionari vincolati del sistema (9.3) possono essere visti come punti stazionari “liberi” della funzione H(x, λ) := f (x) − λ(F (x) − a) , ottenuta aggiungendo a f un multiplo della funzione F − a che definisce il vincolo. Esempio. Dati a1 , . . . , an reali non tutti nulli, vogliamo trovare i punti di massimo e minimo della restrizione della funzione continua n 1X f (x) := ai x3i 3 i=1 Rn , alla sfera unitaria P di che certamente esistono. Descriveremo il vincolo sferico mediante la funzione F (x) = 12 i x2i , il cui livello 1/2 corrisponde alla sfera. Cercheremo i massimi e i minimi studiando i punti stazionari, con il metodo dei moltiplicatori di Lagrange. Abbiamo allora il sistema di (n + 1) equazioni in (n + 1) incognite n X i=1 x2i = 1, ai x2i = λxi , 1 ≤ i ≤ n . 10. *DIAGONALIZZAZIONE DI MATRICI SIMMETRICHE 188 Dato che almeno uno dei xi è non nullo, otteniamo che ai xi = λ per ogni i tale che xi 6= 0. Se λ 6= 0 deve allora essere ai 6= 0 per tutti questi i e abbiamo quindi X X a−2 x2i = λ2 . 1= i i: xi 6=0 i: xi 6=0 D’altro canto, se λ = 0 allora ai = 0 per tutti gli i tali che xi 6= 0, quindi f (x) = 0, ne segue che x evidentemente non è un punto di massimo o di minimo. Quindi un punto stazionario x con λ 6= 0 è caratterizzato dall’avere un certo numero di componenti P −2 −1/2 non nulle, mentre le altre sono date da λ/ai , con |λ| = . Ora, calcolando il valore i:xi 6=0 ai di f su tali punti otteniamo 1 X λ f (x) = λx2i = . 3 3 i: xi 6=0 Essendo f dispari e il vincolo pari, basta cercare tra questi i punti di massimo. È evidente dalla formula sopra che il valore massimo di |λ| si ottiene quando tutti gli xi sono nulli tranne uno, scelto in corrispondenza di un indice i per cui |ai | è massimo. Scegliendo xi = ±1 a seconda del segno di ai si ottiene che il valore massimo di f sulla sfera vale maxj |aj |/3 (mentre il valore minimo è l’opposto). 10. *Diagonalizzazione di matrici simmetriche 7 Una interessante applicazione del metodo dei moltiplicatori di Lagrange è il teorema di diagonalizzabilità sul campo dei numeri reali delle matrici reali simmetriche, cioè delle matrici quadrate S con tS = S.8 Premettiamo alcune nozioni relative al prodotto scalare e alcune proprietà delle matrici simmetriche. Un insieme E ⊆ Rn si dice un sistema ortonormale se, per ogni v, w ∈ E, ( 1 se v = w v·w = 0 se v 6= w . Lemma 7.33 (Proprietà dei sistemi ortonormali). (i) Un sistema ortonormale di vettori è linearmente indipendente. (ii) Se V è un sottospazio vettoriale di Rn ed E è un sistema ortonormale di vettori di V , allora E può essere ampliato ad una base ortonormale di V . (iii) Ogni sottospazio V di Rn ha una base ortonormale. Dimostrazione. Sia E un sistema ortonormale, e si supponga che k elementi distinti v1 , . . . vk di E soddisfino la relazione λ 1 v1 + · · · + λ k vk = 0 , per opportuni λ1 , . . . , λk ∈ R. Allora, per ogni j = 1, . . . , k, 0 = vj · (λ1 v1 + · · · + λk vk ) = λj . 7Facoltativa 8La dimostrazione che presentiamo non fa uso del teorema fondamentale dell’algebra e del polinomio caratteristico det (λI − S). 10. *DIAGONALIZZAZIONE DI MATRICI SIMMETRICHE 189 Questo dimostra il punto (i). Sappiamo ora che un sistema ortonormale E di un sottospazio V di Rn è finito e che la sua cardinalità k non supera dim V . Se E = {v1 , . . . , vk } con k < dim V , si prenda v ∈ V linearmente indipendente da E. Allora k X v =v− (v · vj )vj 0 j=1 è non nullo, in V , e ortogonale a ogni vj . Ponendo vk+1 = 1 0 v , |v 0 | il sistema E 0 = {v1 , . . . , vk , vk+1 } continua ad essere ortonormale. Iterando questo procedimento, si ottiene la conclusione del punto (ii). Il punto (iii) è una diretta conseguenza del punto (ii), partendo da E = Ø. Sia V un sottospazio vettoriale di Rn . Il sottospazio ortogonale a V , si definisce come V ⊥ = {w ∈ Rn : w · v = 0 ∀ v ∈ V } , (che è chiaramente uno spazio vettoriale). Lemma 7.34. Rn è la somma diretta di V e V ⊥ . Dimostrazione. Sia {v1 , . . . , vk } una base ortonormale di V , la si completi in una base Pnorton ⊥ normale {v1 , . . . , vn } di R . Allora {vk+1 , . . . , vn } è un sistema ortonormale in V . Se v = 1 cj vj è in V ⊥ , allora cj = v · vj = 0 per j ≤ k. Quindi v è combinazione lineare di vk+1 , . . . , vn . Quindi {vk+1 , . . . , vn } è una base di V ⊥ e la conclusione segue facilmente. Siano ora V un sottospazio vettoriale di Rn e sia T : V −→ V un’applicazione lineare. Si dice che T è simmetrica se (T v) · w = (T w) · v ∀v, w ∈ V . Lemma 7.35. T : V −→ V lineare, e sia {v1 , . . . , vk } una base ortonormale di V . Allora T è simmetrica se e solo se la matrice S = (sij ) che rappresenta T nella base data è simmetrica (cioè sij = sji per ogni i, j). Dimostrazione. P Se la matrice S rappresenta una qualunque applicazione lineare T in una data base, si ha T vj = i sij vi . Essendo la base ortonormale, si vede facilmente che sij = (T vj ) · vi . Se T è simmetrica, segue che sij = sji per ogni i, j. Viceversa, se sij = sji per ogni i, j, vale l’uguaglianza (T vj ) · vi = (T vi ) · vj per ogni i, j. Presi allora due vettori v= k X λ j vj , w= j=1 k X µj v j , j=1 si ha (T v) · w = k X i, j=1 λj µi (T vj ) · vi = k X λj µi (T vi ) · vj = (T w) · v . i, j=1 Lemma 7.36. Sia T un’applicazione lineare simmetrica di Rn in sé, e sia V un sottospazio tale che T V ⊆ V . Allora si ha anche T V ⊥ ⊆ V ⊥ . 11. DERIVATE DI ORDINE SUPERIORE 190 Dimostrazione. Sia w ∈ V ⊥ . Se v ∈ V , si ha (T w) · v = w · (T v) = 0, perché T v ∈ V . Quindi T w ∈ V ⊥. Nel seguito intendiamo i vettori di Rn come matrici colonna, x = t(x1 . . . xn ). Il prodotto scalare x · y si esprime dunque come prodotto matriciale tyx (identificando R con le matrici reali 1 × 1). Data una matrice simmetrica n × n, S = (sij ), indichiamo con T la corrispondente applicazione simmetrica di Rn in sé, riferita alla base canonica (che è ortonormale). Consideriamo la funzione n n X X X (10.1) QS (x) = (T x) · x = txSx = sij xi xj = sjj x2j + 2 sij xi xj , i, j=1 j=1 i<j detta la forma quadratica associata alla matrice S. Si consideri quindi il vincolo Γ := x : x21 + · · · + x2n = 1 , cioè la sfera euclidea di raggio 1, centrata nell’origine di Rn . La proprietà importante per noi è la seguente. Lemma 7.37. I punti stazionari vincolati di QS su Γ sono gli autovettori di S di modulo 1. Dimostrazione. Calcoliamo il gradiente di QS in un generico punto x. Fissato k, 1 ≤ k ≤ n, la variabile xk compare nei termini dell’ultimo membro dell’equazione (10.1) skk x2k , 2sik xi xk con i < k, e 2skj xk xj con j > k. Quindi, n X ∂QS (x) = 2 skj xj = 2(Sx)k , ∂xk j=1 e in conclusione, ∇QS (x) = 2Sx . Analogamente, essendo ϕ = QI , si ha ∇ϕ(x) = 2x. Il sistema (9.3) identifica dunque gli autovettori di QS su Γ e i corrispondenti autovalori λ. Teorema 7.38. Esiste una base ortonormale di Rn costituita da autovettori di T . Dimostrazione. Procediamo per induzione sulla dimensione n. Per n = 1 l’enunciato è ovvio. Supponiamo allora che la tesi sia vera per n − 1. Per la continuità di QS e la compattezza di Γ, possiamo dire per il teorema di Weierstrass che QS assume valore massimo su Γ. Sia v1 ∈ Γ un punto di massimo, che è stazionario, e quindi un autovettore di S. Il sottospazio V = Rv1 soddisfa la condizione T V ⊆ V , e dunque lo stesso vale per V ⊥ , che ha dimensione n − 1. Per l’ipotesi induttiva, V ha una base ortonormale {v2 , . . . , vn } di autovettori di T , che dà, con l’aggiunta di v1 , una base ortonormale di Rn . 11. Derivate di ordine superiore Se una funzione reale f di n variabili ammette la derivata parziale ∂xj f su un aperto A, e questa funzione derivata ammette la derivata parziale nella variabile xk in un punto x, il valore ∂ ∂f (x) ∂xk ∂xj 11. DERIVATE DI ORDINE SUPERIORE 191 è la derivata parziale seconda, indicata come ∂2f (x) . ∂xk ∂xj Più in generale, data una m–upla ordinata di indici (j1 , . . . , jm ), l’espressione ∂mf (x) , ∂xjm · · · ∂xj1 indica che f è stata prima derivata rispetto a xj1 , poi rispetto a xj2 , ecc. in un intorno di x, e infine rispetto a xjm in x. Le derivate di ordine superiore si chiamano pure se effettuate sempre rispetto alla stessa variabile e miste altrimenti. Limitandoci a considerare le derivate seconde, in linea di principio una funzione di n variabili può avere fino a n2 derivate seconde in un punto. Tuttavia è naturale porsi il problema dell’uguaglianza, per j 6= k, della derivata (11.1) ∂2f (x) = lim h→0 ∂xk ∂xj ∂f ∂xj (x + hek ) − ∂f ∂xj (x) h f (x + hek + h0 ej ) − f (x + hek ) − f (x + h0 ej ) + f (x) = lim lim , h→0 h0 →0 hh0 con l’altra derivata ∂2f (x) = lim h0 →0 ∂xk ∂xj ∂f ∂xk (x + h0 ej ) − ∂f ∂xk (x) h0 f (x + hek + h0 ej ) − f (x + hek ) − f (x + h0 ej ) + f (x) = lim lim . h0 →0 h→0 hh0 Trattandosi di uno scambio d’ordine di due limiti in due variabili diverse, dobbiamo aspettarci che l’uguaglianza non sia sempre vera. Infatti si può verificare facilmente che la funzione 3 xy per (x, y) 6= (0, 0) f (x, y) = x2 + y 2 0 per (x, y) = (0, 0) , (11.2) • è di classe C 1 su R2 , • è dotata di derivate seconde su R2 , • le due derivate miste sono continue su R2 \ {(0, 0)} ma non in (0, 0), ∂2f ∂2f • (0, 0) = 1 , (0, 0) = 0. ∂y∂x ∂x∂y Teorema 7.39 (Teorema di Schwarz). Sia A ⊆ Rn aperto e supponiamo che f : A → R ammetta le due derivate seconde ∂x2k xj f e ∂x2j xk f in A, e che almeno una delle derivate seconde sia continua in x ∈ A. Allora (11.3) ∂2f ∂2f (x) = (x) . ∂xk ∂xj ∂xj ∂xk Dimostrazione. Possiamo supporre j 6= k. Siccome tutti gli incrementi sono presi nelle sole variabili xj , xk , possiamo anche supporre che f dipenda da due sole variabili x1 , x2 . Si fissino h, h0 6= 0 tali che il rettangolo di estremi (x + he1 + h0 e2 ), (x + he1 + h0 e2 ), (x + he1 + h0 e2 ), 11. DERIVATE DI ORDINE SUPERIORE (x + he1 + h0 e2 ) sia contenuto in A. Per fissare le idee, supponiamo che x̄ = (x̄1 , x̄2 ). 192 ∂2f ∂x2 ∂x1 sia continua in 6 (x1 , x2 + h0 ) • (x1 , x2 ) (x1 + h, x2 + h0 ) • • • (x1 + h, x2 ) - Si consideri quindi l’espressione f (x + he1 + h0 e2 ) − f (x + he1 ) − f (x + h0 e2 ) + f (x) hh0 0 f (x1 + h, x2 + h ) − f (x1 + h, x2 ) − f (x1 , x2 + h0 ) + f (x1 , x2 ) = , hh0 che compare sia nella formula (11.1) che nella formula (11.2). Secondo il modo in cui si raggruppano a due a due gli addendi a numeratore, essa può essere espressa in due modi: (i) ponendo f (x1 , x2 + h0 ) − f (x1 , x2 ) , ϕh0 (x1 ) = h0 si ha ϕh0 (x1 + h) − ϕh0 (x1 ) (11.4) R(h, h0 ) = ; h (ii) ponendo f (x1 + h, x2 ) − f (x1 , x2 ) ψh (x2 ) = , h si ha ψh (x2 + h0 ) − ψh (x2 ) R(h, h0 ) = . h0 Consideriamo la formula (i). La funzione ϕh0 è continua sull’intervallo chiuso di estremi x1 e x1 + h e derivabile al suo interno. Per il teorema di Lagrange, esiste θ ∈ (0, 1) tale che R(h, h0 ) = ∂x1 f (x1 + θh, x2 + h0 ) − ∂x1 f (x1 + θh, x2 ) . h0 Siccome ∂x1 f ammette derivata rispetto a x2 su A, la funzione R(h, h0 ) = ϕ0h0 (x1 + θh) = u(x2 ) = ∂f (x1 + θh, x2 ) , ∂x1 12. CAMPI VETTORIALI, INTEGRALI CURVILINEI, POTENZIALI 193 è continua sull’intervallo chiuso di estremi x2 e x2 + h0 e derivabile al suo interno. Esiste quindi θ0 ∈ (0, 1) tale che ∂2f (x1 + θh, x2 + θ0 h0 ) . R(h, h0 ) = ∂x2 ∂x1 Si noti che θ, θ0 dipendono dalla scelta di h e h0 , ma sono comunque compresi tra 0 e 1. Per la continuità della derivata mista in x, si ha dunque la formula R(h, h0 ) = ∂2f (x1 , x2 ) + o(1) ∂x2 ∂x1 (h, h0 ) → (0, 0) . Tenendo temporaneamente h fissato, possiamo passare al limite per h0 → 0 e usare l’espressione (11.4) per R(h, h0 ), ottenendo ∂f ∂x2 (x̄1 + h, x̄2 ) − ∂f ∂x2 (x̄1 , x̄2 ) h = ∂2f (x1 , x2 ) + o(1) ∂x2 ∂x1 h→0. Infine con un secondo passaggio al limite, per h → 0, si ha la tesi. 12. Campi vettoriali, integrali curvilinei, potenziali In questa sezione studiamo il problema dell’esistenza di un potenziale di un campo vettoriale F : A → Rn , i.e. una funzione V il cui gradiente coincide con F in A. In tutta questa sezione intenderemo sempre che A è un insieme aperto di Rn . Per studiare questo problema sarà utile avere una classe di cammini stabile rispetto alle operazioni di concatenazione γ(t) se t ∈ [a, b] (γ + η)(t) := γ : [a, b] → Rn , η : [b, c] → Rn , γ(b) = η(b) η(t) se t ∈ [b, c] e di inversione −γ(t) := γ(b + t(a − b)) γ : [a, b] → Rn . Anche se potremmo solo lavorare con cammini lisci “regolarizzando” gli spigoli dovuti alla concatenazione, risulta molto più comodo lavorare con la classe dei cammini C 1 a tratti, che ora introduciamo. Ricordiamo che f ∈ C 1 ([a, b]) vuol dire f continua e derivabile, con derivata continua, in [a, b] (intendendo agli estremi le derivate destre e sinistre). Definizione 7.40 (Curve C 1 a tratti). Sia [a, b] ⊂ R un intervallo chiuso e limitato. Indichiamo con P C 1 ([a, b]) la classe delle funzioni continue f : [a, b] → R tali che esistono t0 = a < t1 < · · · < tk = b tali che f |[ti ,ti+1 ] è di classe C 1 in [ti , ti+1 ] per 0 ≤ i < k. Per mappe vettoriali la definizione è analoga e scriveremo P C 1 ([a, b]; Rn ). Definizione 7.41 (Integrale curvilineo). Sia F : A → Rn un campo vettoriale continuo e R γ ∈ P C 1 ([a, b]; Rn ). L’integrale curvilineo γ F è definito da Z (12.1) Z 0 hF (γ(t)), γ (t)i dt = F := γ b a Z bX n a i=1 Fi (γ(t))γi0 (t) dt . 12. CAMPI VETTORIALI, INTEGRALI CURVILINEI, POTENZIALI 194 La definizione (12.1) richiede qualche precisazione in più, perché γ 0 (t) potrebbe non essere definita in tutti i punti di [a, b] (negli eventuali punti dove non lo è, in numero finito, ha discontinuità a R tk Rb Rt , ognuno degli addendi ha senso se sappiamo salto). Tuttavia, spezzando a = t01 + · · · + tk−1 1 che γ|[ti ,ti+1 ] è di classe C . In alternativa, si può pensare di definire arbitrariamente la funzione integranda in (12.1) nei punti di discontinuità, visto che modificare una funzione in un numero finito di punti Rnon ne altera né l’integrabilità né l’integrale. La notazione γ F , che non fa esplicito riferimento al dominio di γ, è naturalmente giustificata dall’invarianza di F rispetto a riparametrizzazioni. Questa segue facilmente dalla formula di cambiamento di variabili, come già abbiamo osservato per la nozione di lunghezza di una curva, se γ : [a, b] → Rn è di classe P C 1 e ϕ : [c, d] → [a, b] è bigettiva e di classe C 1 con ϕ0 > 0, vale (spezzando gli insiemi di integrazione in [ti , ti+1 ] e [ϕ(ti ), ϕ(ti+1 )], 0 ≤ i ≤ k − 1) Z bX Z dX Z dX n n n 0 0 0 Fi (γ(t))γi (t) dt = Fi (γ ◦ ϕ(s))γi (ϕ(s))ϕ (s) ds = Fi (γ ◦ ϕ(s))(γi ◦ ϕ)0 (s) ds . a i=1 c c i=1 i=1 Abbiamo inoltre Z Z (12.2) Z F = γ+η Z F+ Z F =− F , γ −γ η F . γ La seguente proposizione ci dà una condizione necessaria e sufficiente per R l’esistenza di un potenziale. Chiameremo un campo continuo F : A → Rn conservativo in A se γ F = 0 per ogni cammino chiuso γ di classe P C 1 con immagine contenuta in A. Proposizione 7.42 (Campi conservativi e esistenza del potenziale). Condizione necessaria per l’esistenza di un potenziale V : A → R di un campo continuo F è che sia conservativo in A. Se A è connesso la condizione è sufficiente e il potenziale è univocamente determinato a meno di una costante additiva. Dimostrazione. Per la necessità basta osservare che Z Z Z bX Z b n ∂V d 0 F = ∇V = V (γ(t)) dt = V (γ(b)) − V (γ(a)) . (γ(t))γi (t) dt = ∂xi γ γ a a dt i=1 Per la sufficienza, fissato x̄ ∈ A, indichiamo con Γ(x̄, x) la classe dei cammini C 1 a tratti che congiungono x̄ a x (non vuota, perché gli aperti connessi sono, grazie al Teorema 5.63, connessi per archi) e poniamo Z V (x) := η ∈ Γ(x̄, x) . F η Dobbiamo verificare che la definizione è ben posta (i.e. che non dipende dal cammino scelto), che V è differenziabile e che ∇V = F in A. La definizione è ben posta perché, scelti η, η 0 ∈ Γ(x̄, x), il cammino γ = η − η 0 è chiuso e per la (12.2) vale Z Z Z F− η F = η0 F . η−η 0 Per mostrare che ∇V (x) = F (x) per ogni x ∈ A possiamo usare l’indipendenza della definizione di V dal cammino per scrivere Z 1 V (x + hej ) − V (x) = h Fj (x + thej ) dt ∀j ∈ {1, . . . , n}, h ∈ R . 0 12. CAMPI VETTORIALI, INTEGRALI CURVILINEI, POTENZIALI 195 Infatti basta concatenare un cammino tra x̄ e x al cammino lungo la direzione j-sima tra x e x+hej . Abbiamo allora (qui si può usare il teorema del valor medio e la continuità di F per fare il passaggio al limite) Z 1 V (x + hej ) − V (x) lim Fj (x + thej ) dt = Fj (x) . = lim h→0 h→0 0 h Il teorema del differenziale totale ci dà anche che V è differenziabile in A. Per l’unicità del potenziale basta osservare che se V = V1 − V2 è differenza di potenziali, allora ha gradiente identicamente nullo. In tal caso V è costante sui cubi contenuti in A (perché costante sui segmenti), quindi gli insiemi di livello {x ∈ A : V (x) = c} sono tutti aperti al variare di c in R. Per la connessione di A solo uno può essere non vuoto, quindi V è costante. Alla luce della proposizione precedente vogliamo ora capire quali ipotesi su F e A garantiscono che F sia conservativo in A. Consideriamo la condizione (che equivale a dire che il rotore del campo è nullo in dimensione n = 3) ∂Fj ∂Fi = 1 ≤ i, j ≤ n . (12.3) ∂xi ∂xj Diremo che un campo vettoriale F : A → Rn è chiuso se F è differenziabile e vale la (12.3) in tutti i punti di A. Per il Teorema 7.39 di Schwarz, se le derivate parziali di F sono anche continue la condizione (12.3) è necessaria per l’esistenza di un potenziale. Mostriamo che, anche senza questa ipotesi, la (12.3) diventa sufficiente se aggiungiamo un’ipotesi sulla struttura del dominio A. Per la dimostrazione ci sarà utile estendere alla classe delle funzioni P C 1 ([a, b]) alcune formule del calcolo integrale. La prima è la formula di integrazione per parti Z b Z b 0 f (t)g (t) dt = (f (b)g(b) − f (a)g(a)) − f 0 (t)g(t) dt , a a che si ottiene immediatamente dalla formula classica spezzando l’insieme di integrazione nell’unione degli intervalli [ti , ti+1 ], avendo scelto i ti in modo che f e g appartengano a C 1 ([ti , ti+1 ]). La seconda formula è il teorema di derivazione sotto il segno di integrale, che enunciamo e dimostriamo esplicitamente. Teorema 7.43 (Derivazione sotto il segno di integrale). Sia L : [a, b] × (c, d) → R continua d L(t, s) è continua in [a, b] × (c, d). Allora e tale che ds Z b Z b d d L(t, s) dt = L(t, s) dt ∀s ∈ (c, d) . ds a a ds Dimostrazione. Fissati s ∈ (c, d) e un intervallo [s − δ, s + δ] ⊂ (c, d), per h ∈ [−δ, δ] \ {0} abbiamo Rb Rb Z b Z b L(t, s + h) − L(t, s) d a L(t, s + h) dt − a L(t, s) dt = dt = L(t, s + θ(s, t, h)) dt h h a a ds d con |θ(s, t, h)| < h. Grazie all’uniforme continuità di ds L(s, t) in [a, b] × [s − δ, s + δ] garantita da (ii) abbiamo d d L(t, s + θ(s, t, h)) → L(t, s) uniformemente in [a, b], per h → 0 . ds ds Quindi il teorema di passaggio al limite sotto il segno di integrale9 ci consente di concludere. 9Se g sono funzioni integrabili secondo Riemann in [a, b], convergenti uniformemente in [a, b] a g, allora g è h Rb h→∞ a integrabile secondo Riemann in [a, b] e lim gh (t) dt = Rb a g(t) dt. 12. CAMPI VETTORIALI, INTEGRALI CURVILINEI, POTENZIALI 196 Teorema 7.44 (Esistenza di potenziali per campi chiusi). Sia A ⊂ Rn aperto convesso e F : A → Rn un campo vettoriale chiuso e di classe C 1 . Allora F ha un potenziale V ∈ C 2 (A). Dimostrazione. Tenendo presente la Proposizione 7.42, basterà dimostrare che F è conservativo R in A, i.e. γ F = 0 per ogni cammino γ ∈ P C 1 ([a, b]; Rn ) chiuso contenuto in A. Sia γ un tale cammino e poniamo Z bX Z n F =s Fi (x̄ + s(γ(t) − x̄))γi0 (t) dt , I(s) := a i=1 γs ove γs è il cammino deformato con un’omotetia di centro x̄, i.e. γs (t) := x̄ + s(γ(t) − x̄), 0 ≤ s ≤ 1. È immediato verificare grazie al teorema di passaggio al limite sotto il segno di integrale che I è una funzione continua in [0, 1]. Calcoliamo la derivata di I(s), usando il teorema di derivazione sotto il segno di integrale nei domini [ti , ti+1 ] × (0, 1) e con la funzione L(t, s) = n X Fi (x̄ + s(γ(t) − i=1 x̄))γi0 (t) , n X d ∂Fi L(t, s) = s (x̄ + s(γ(t) − x̄))γj (t)γi0 (t) ds ∂xj i, j=1 intendendo nei valori estremi t = ti ,t = ti+1 le derivate destre e sinistre rispettivamente. Usando prima il fatto che F è chiuso, poi la formula di integrazione per parti e infine il fatto che γ è un cammino chiuso otteniamo: Z b X Z bX n n ∂Fi 0 0 I (s) = Fi (x̄ + s(γ(t) − x̄))γi (t) dt + s (x̄ + s(γ(t) − x̄))(γj (t) − x̄)γi0 (t) dt a i=1 a i, j=1 ∂xj Z bX Z b X n n ∂Fj (x̄ + s(γ(t) − x̄))(γj (t) − x̄)γi0 (t) dt = Fi (x̄ + s(γ(t) − x̄))γi0 (t) dt + s ∂x i a i=1 a i, j=1 Z bX Z bX n n d = Fi (x̄ + s(γ(t) − x̄))γi0 (t) dt + Fj (x̄ + s(γ(t) − x̄)) (γj (t) − x̄) dt a i=1 a i=1 dt Z bX Z n n bX = Fi (x̄ + s(γ(t) − x̄))γi0 (t) dt − Fj (x̄ + s(γ(t) − x̄))γj0 (t) dt = 0 . a i=1 a j=1 Abbiamo R quindi che I ha derivata nulla in (0, 1), quindi è costante in [0, 1]. Dato che I(0) = 0 e I(1) = γ F , questo mostra che F ha integrale nullo su ogni cammino chiuso. Si noti che con la sola connessione (per archi) di A la definizione di V avrebbe avuto potenzialmente senso, ma in genere la definizione non sarebbe stata ben posta. Si consideri ad esempio l’aperto connesso A = R2 \ {(0, 0)} e il campo x −y F (x, y) = 2 , 2 . 2 x + y x + y2 È facile verificare che il campo F è chiuso, quindi in ogni aperto convesso contenuto in A il campo ha un potenziale (ad esempio V (x, y) = arctg (y/x) nelle regioni in cui x 6= 0, V (x, y) = arcctg (x/y) nelle regioni in cui y 6= 0). Tuttavia questi potenziali locali non possono dar luogo a un potenziale R globale, dato che per γ(t) = (sin t, cos t) si ha γ F = −2π 6= 0. Osservazione 7.45 (Approfondimenti). (1) Anche se abbiamo trattato l’argomento in un fissato sistema di coordinate, è bene tenere presente che tutto quello che abbiamo detto può essere formulato nel linguaggio degli spazi vettoriali, dei vettori e dei co-vettori (si ricordi la distinzione 13. *LA MATRICE HESSIANA 197 tra gradiente e differenziale), senza far riferimento a un sistema privilegiato di coordinate. Da questo punto di vista, un campo vettoriale F va inteso in realtà come campo di covettori, i.e. in ogni punto di x ∈ A è definito un funzionale lineare Fx : Rn → R, mentre γ 0 (t) è inteso come vettore tangente alla curva in x = γ(t), dimodoché Fγ(t) (γ 0 (t)) ha senso e l’integrale curvilineo diventa Z b Z Fγ(t) (γ 0 (t)) dt γ : [a, b] → Rn . F = γ a La definizione di potenziale allora è F = dV , i.e. Fx (v) = dx V (v) per ogni vettore v. Nel sistema di coordinate canonico, usando il prodotto scalare per scrivere dx V (v) = h∇V (x), vi, questi concetti si riducono a quelli usuali. (2) Osserviamo infine che in tutta questa sezione sarebbe stato sufficiente lavorare nella sottoclasse dei cammini affini a tratti (i.e. richiedendo a γ 0 di essere costante negli intervalli [ti , ti+1 ]), dato che gli aperti connessi sono connessi per archi affini a tratti. (2) L’esempio precedente mostra che qualche ipotesi sull’insieme A è necessaria per poter costruire un potenziale a partire da un campo chiuso. Tuttavia, la convessità non è la condizione ottimale, ad esempio in dimensione 3 il risultato sarebbe valido per A = R3 \ {0}, che non è convesso. L’ipotesi ottimale richiede la possibilità di rappresentare ogni cammino semplice e chiuso contenuto in A come frontiera orientata in senso orario o antiorario di una superficie U interamente contenuta in A. La dimostrazione richiede la possibilità di decomporre ogni cammino chiuso γ come somma, finita (se i cammini sono affini a tratti) o numerabile (nel caso generale) di cammini semplici e chiusi γi che percorrono in senso orario o antiorario la frontiera di opportuni insiemi Ui , con Ui poliedrale se γ è affine a tratti; a ognuno di questi cammini γi si applica poi in dimensione n = 2 la formula di Green che lega l’integrale curvilineo lungo γi a un integrale doppio esteso al dominio Ui : Z Z ∂F2 ∂F1 (x, y) − (x, y) dxdy (il segno dipende dal verso di percorrenza) . F =± ∂x γi Ui ∂y R Tale teorema consente di concludere, se F è chiuso, che γi F = 0. In dimensione n = 3 o superiore è necessario usare il cosiddetto teorema di Stokes, e in ogni caso le tecniche richieste per una trattazione rigorosa non sono elementari, neanche in dimensione 2. 13. *La matrice Hessiana Sia f : A → R una funzione dotata di derivate parziali seconde continue in un aperto A ⊆ Rn , continue in un punto x ∈ A. Per il Teorema 7.39, la matrice Hessiana di f in x, avente come righe i gradienti delle derivate parziali di f , 2 ∂ f ∂2f ∂2f (x) (x) · · · (x) ∂x2 ∂x1 ∂xn ∂x1 1 ∂x∂12∂x f ∂2f ∂2f (x) (x) · · · ∂x2 ∂x2 ∂xn ∂x2 (x) ∂x1 ∂x2 .. .. .. .. Hf (x) = D∇f (x) = . . . . 2 2 2 ∂ f ∂ f ∂ f ∂x1 ∂xn (x) ∂x2 ∂xn (x) · · · ∂xn ∂xn (x) è simmetrica. La matrice Hessiana Hf compare nello sviluppo di Taylor al secondo ordine di una funzione di classe C 2 . 13. *LA MATRICE HESSIANA 198 Teorema 7.46. Sia f : A → R una funzione di classe C 2 in un aperto A ⊆ Rn , e sia x ∈ A. Si ha allora lo sviluppo di Taylor del secondo ordine centrato in x, 1 f (x + h) = f (x) + ∇f (x) · h + th(Hf (x))h + o |h|2 (h → 0) 2 n n X 1 X ∂2f ∂f = f (x) + (x)hj + (x)hi hj + o |h|2 (h → 0) . ∂xj 2 ∂xi ∂xj j=1 i,j=1 Dimostrazione. Sia Br (x) una palla con centro in x contenuta in A. Dato h con |h| < r, si consideri la funzione g(t) = f (x + th) = f (x1 + th1 , . . . , xn + thn ) . Essa è definita (almeno) sull’intervallo (−1 − δ, 1 + δ), con δ = r − |h|. Applicando due volte la regola di derivazione della funzione composta, si ha n X ∂f g (t) = (x + th)hj ∂xj 0 e 00 g (t) = j=1 n X i,j=1 ∂2f (x + th)hi hj . ∂xi ∂xj Applicando ora la formula di Taylor in una variabile con resto di Lagrange, esiste θ = θ(h) ∈ (0, 1) tale che g(1) = g(0) + g 0 (0) + g 00 (θ) , ossia (13.1) n n X ∂f 1 X ∂2f f (x + h) = f (x) + (x)hj + (x + θh)hi hj . ∂xj 2 ∂xi ∂xj i,j=1 j=1 Allora la differenza n n X ∂f 1 X ∂2f (x)hj − (x)hi hj f (x + h) − f (x) − ∂xj 2 ∂xi ∂xj j=1 i,j=1 è uguale a n n X 1 X ∂2f ∂2f (x + θh)hi hj − (x)hi hj . 2 ∂xi ∂xj ∂xi ∂xj i, j=1 i,j=1 |h0 | Dato ε > 0, sia δ > 0 tale che, per < δ e per ogni i, j, ∂2f ∂2f (x + h0 ) − (x) < ε . ∂xi ∂xj ∂xi ∂xj Se |h| < δ si ha allora n n n ε X X ∂f 1 X ∂2f (x)hj − (x)hi hj ≤ |hi ||hj | f (x + h) − f (x) − ∂xj 2 ∂xi ∂xj 2 j=1 i,j=1 i,j=1 ≤ che dà la tesi. n2 2 ε|h|2 , Si noti incidentalmente che la formula (13.1) fornisce lo sviluppo di Taylor al primo ordine con resto di Lagrange. 14. *DISCUSSIONE DELLA NATURA DEI PUNTI STAZIONARI LIBERI 199 14. *Discussione della natura dei punti stazionari liberi Sia f : A → R una funzione di classe C 2 su un aperto A ⊆ Rn , e sia x ∈ A un punto stazionario, cioè con ∇f (x) = 0. Lo studio della matrice Hessiana può consentire di determinare se x è un punto di massimo o minimo locale, o di sella, o altro. Diamo la seguente definizione. Definizione 7.47 (Segno di matrici simmetriche). Una matrice simmetrica S si dice: • definita positiva, e scriveremo S > 0 (risp. definita negativa, S < 0), se i suoi autovalori sono tutti strettamente positivi (risp. strettamente negativi); • semidefinita positiva, e scriveremo S ≥ 0 (risp. semidefinita negativa, S ≤ 0) se i suoi autovalori sono tutti maggiori o uguali a 0 (risp. minori o uguali a 0); • indefinita se ha autovalori sia positivi sia negativi. Vale la seguente proprietà. Lemma 7.48. Sia S una matrice simmetrica, e siano λmin e λmax i suoi autovalori minimo e massimo, rispettivamente. Allora la forma quadratica QS (x) = txSx soddisfa le disuguaglianze (14.1) λmin |x|2 ≤ QS (x) ≤ λmax |x|2 ∀x ∈ Rn , e da ciascun lato vale l’uguaglianza per un certo x 6= 0 se e solo se x è autovettore del corrispondente autovalore. In particolare, • S ≥ 0 se e solo se QS ≥ 0 in Rn ; • S > 0 se e solo se QS > 0 in Rn \ {0}; • S è indefinita se e solo se QS assume sia valori positivi che negativi. In dimensione n = 2, i tre casi sono esemplificati, nell’ordine, dalle tre forme quadratiche x2 , x2 + y 2 , x2 − y 2 . Dimostrazione. P Sia {v1 , . . . , vn } una base ortonormale di Rn in cui ogni vj è autovettore di autovalore λj . Se x = n1 yj vj , si ha QS (x) = n X yi yj tvi Svj = In particolare, per S = I, vale vale l’uguaglianza yi yj λj tvi vj = i, j=1 i, j=1 |x|2 n X = Pn 2 1 yi . n X i=1 n X λi yi2 . i=1 Le disuguaglianze (14.1) sono dunque ovvie. Inoltre λi yi2 = λmin n X yi2 i=1 se e solo se vale la condizione λj 6= λmin ⇒ yj = 0, cioè se e solo se x è nell’autospazio dell’autovalore λmin . Analogamente per la seconda disuguaglianza. Il resto dell’enunciato segue facilmente. Torniamo dunque ai punti stazionari. Come per funzioni di variabili reale il seguente criterio dà condizioni solo sufficienti ma non necessarie per minimalità/massimalità locale, o necessarie ma non sufficienti. Teorema 7.49 (Condizioni per la massimalità/minimalità locale). Sia f : A → R di classe C 2 su un aperto A ⊆ Rn , e sia x ∈ A un suo punto stazionario. Allora 15. ESERCIZI 200 (i) se la matrice Hessiana Hf (x) è definita positiva, allora x è un punto di minimo locale; (ii) se la matrice Hessiana Hf (x) è definita negativa, allora x è un punto di massimo locale; (iii) se la matrice Hessiana Hf (x) è indefinita, allora x non è né di massimo, né di minimo locale. Dimostrazione. Se Hf (x) = S è definita positiva, si consideri la differenza 1 f (x + h) − f (x) = QS (h) + o |h|2 h → (0, 0) , 2 per il Teorema 7.46. Esiste δ > 0 tale che, per |h| < δ, il resto o |h|2 è minore, in valore assoluto di (λmin /4)|h|2 . Per la formula (14.1), sempre per |h| < δ, f (x + h) − f (x) > λmin 2 |h| , 4 e dunque x è di minimo locale. Il punto (ii) è analogo. Per il punto (iii), sia vmax e vmin autovettori di autovalore λmax > 0 e λmin < 0. Le due funzioni g+ (t) = f (x + tvmax ) e g− (t) = f (x + tvmin ) hanno in t = 0 un punto rispettivamente di minimo e di massimo stretti. Quindi x non può essere né di massimo, né di minimo locale. Nel caso in cui la matrice Hessiana è solo semidefinita, ma con un autovalore nullo, non si può concludere in modo analogo. Le tre funzioni f1 (x, y) = x2 + y 4 , f2 (x, y) = x2 − y 4 , f3 (x, y) = x2 + y 3 , 2 0 hanno tutte matrice Hessiana nell’origine uguale a , ma nel primo caso (0, 0) è un punto di 0 0 minimo (stretto), nel secondo si ha una configurazione che somiglia al “punto di sella”, nel terzo una configurazione ancora diversa. La nozione di punto di sella non è facilmente formulabile in modo rigoroso in termini geometrici, soprattutto per funzioni di più di 2 variabili. La definizione comunemente adottata è quella espressa al punto (iii) (funzione C 2 con matrice Hessiana indefinita). Togliendo l’ipotesi che x sia un punto stazionario, la condizione Hf (x) definita positiva implica10 che, per x = x + h in un intorno di x, vale la condizione di convessità stretta nel punto x: (14.2) f (x + h) > f (x) + ∇f (x) · h . 15. Esercizi Esercizio 7.1. Sia f : R2 → R una funzione tale che p f (x, y) = a + bx + cy + o( x2 + y 2 ) , con a, b, c ∈ R. Si provi che f è differenziabile nell’origine di R2 e si dica che differenziale ha. Se f : R2 → R è una funzione tale che |f (x, y)| ≤ C(x2 + y 2 ) , per una costante C ∈ R. Si provi che f è differenziabile nell’origine di R2 e si dica che differenziale ha. 10con una piccola modifica alla dimostrazione precedente. 15. ESERCIZI 201 Esercizio 7.2. Sia L : Rn → Rm una mappa lineare, si provi che dLx = L, per ogni x ∈ Rn . Sia f : Rn → Rm una mappa affine, cioè f = L + v con L lineare e v ∈ Rm , allora dLx = L, per ogni x ∈ Rn . Sia B : Rn × Rm → Rk una mappa bilineare, cioè B(·, y) : Rn → Rk è lineare per ogni y ∈ Rm e B(x, ·) : Rm → Rk è lineare per ogni x ∈ Rn . Si calcoli il suo differenziale in un punto (x, y) ∈ Rn × Rm . Esercizio 7.3. Sia L : Rn → Rn una mappa lineare e f : Rn → R differenziabile infinite volte, si calcoli il differenziale n–esimo di f ◦ L. Esercizio 7.4. Sia γ : (a, b) → Rn una curva differenziabile a valori nella sfera unitaria Sn−1 di Rn . Si provi che vale hγ 0 (t) | γ(t)i = 0 per ogni t ∈ (a, b). Sia f : Ω → Rn una mappa differenziabile in un aperto Ω ∈ Rn a valori nella sfera unitaria Sn−1 di Rn . Si provi che vale hdfx (v) | f (x)i = 0 per ogni x ∈ Ω e v ∈ Rn . Esercizio 7.5. Sia f : [a, b] → Rn una curva continua, differenziabile in (a, b), si mostri con un esempio che il teorema di Lagrange non vale in generale, cioè potrebbe non esistere un punto ξ ∈ (a, b) tale che f (b) − f (a) = f 0 (ξ)(b − a) . Si mostri che vale la disuguaglianza di valor medio: esiste ξ ∈ (a, b) tale che kf (b) − f (a)k ≤ kf 0 (ξ)k |b − a| . Esercizio 7.6. Sia f : [a, b] → R2 una curva continua, differenziabile in (a, b), esiste sempre un punto ξ ∈ (a, b) tale che f 0 (ξ) = λ f (b) − f (a) , per qualche λ ∈ R? Lo stesso vale per una curva in R3 o Rn ? Si può richiedere che la costante λ sia positiva (cioè che il vettore tangente in ξ alla curva abbia lo stesso “verso” del vettore f (b) − f (a))? Esercizio 7.7. Si mostri una curva chiusa γ : [a, b] → Rn differenziabile tale che γ 0 (t) 6= 0, per ogni t ∈ [a, b]. Esercizio 7.8. Sia f : Rn → R una funzione differenziabile e x, y ∈ Rn , si mostri che esiste ξ nell’interno del segmento che unisce x a y tale che f (x) − f (y) = h ∇f (ξ) | x − y i . In particolare, se k∇f (x)k ≤ C per ogni x ∈ Rn , si ha |f (x) − f (y)| ≤ Ckx − yk e la funzione f è Lipschitziana di costante C. 15. ESERCIZI 202 Esercizio 7.9. Sia f : Rn → Rm una mappa differenziabile e x, y ∈ Rn , si mostri che esiste ξ nell’interno del segmento che unisce x a y tale che kf (x) − f (y)k ≤ kdfξ k2 kx − yk , dove kdfξ k2 indica la norma quadratica della matrice Jacobiana in ξ . In particolare, se kdfx k2 ≤ C per ogni x ∈ Rn , si ha kf (x) − f (y)k ≤ Ckx − yk e la mappa f è Lipschitziana di costante C. Esercizio 7.10. Si provi che i risultati dei due problemi precedenti valgono anche se le funzioni sono definite in un convesso aperto di Rn . Si dica inoltre se in tali problemi la condizione di differenziabilità della funzione f si può sostituire con la sola esistenza delle derivate parziali in ogni punto. Esercizio 7.11. Sia f : Rn → R una mappa differenziabile e x, y ∈ Rn , sia γ : [a, b] → Rn una curva affine a tratti (poligonale) con γ(a) = x e γ(b) = y. Se k∇f (x)k ≤ C per ogni x ∈ Rn , si mostri che vale |f (x) − f (y)| ≤ C · L(γ) , dove L(γ) è la lunghezza della curva γ. Esercizio 7.12. Sia f : Ω → Rm una mappa differenziabile in un aperto Ω di Rn , si mostri che se kdfx k2 ≤ C per ogni x ∈ Rn , la mappa f è localmente Lipschitziana di costante C. Si mostri che se una mappa f : Ω → Rm è di classe C 1 in un aperto Ω di Rn , allora è localmente Lipschitziana. Esercizio 7.13. Sia f : Ω → R una funzione tale che esistano le sue derivate parziali coordinate in ogni punto di un aperto Ω di Rn e siano tutte limitate√in modulo da una costante C. Si mostri che la mappa f è localmente Lipschitziana di costante C n. Si estenda la conclusione alle mappe f : Ω → Rm . Esercizio 7.14. Sia f : Ω → R una funzione da un aperto connesso in R tale che esistano le sue derivate parziali coordinate e siano tutte nulle in ogni punto di Ω. si mostri che la funzione f è costante. Esercizio 7.15. Si dia un esempio di un aperto limitato e connesso Ω ⊂ Rn e di una funzione differenziabile f : Ω → R con k∇f (x)k ≤ C per ogni x ∈ Ω, tale che f non sia Lipschitziana. Esercizio 7.16. Se f : Ω → R è una funzione differenziabile da un sottoinsieme aperto e non connesso di Rn con k∇f (x)k ≤ C per ogni x ∈ Ω, vale la disuguaglianza |f (x) − f (y)| ≤ Ckx − yk , per ogni x, y ∈ Ω? 15. ESERCIZI 203 Esercizio 7.17. F Sia Ω ⊂ Rn un aperto connesso che soddisfa la seguente condizione: esiste una costante D tale che per ogni due punti x, y ∈ Ω, definendo δΩ (x, y) = inf L(γ), dove l’inf è preso su tutte le curve affini a tratti γ che congiungono x a y e L(γ) è la lunghezza di γ, si ha δΩ (x, y) ≤ Dkx − yk . Si provi che allora se per una funzione differenziabile f : Ω → R si ha k∇f (x)k ≤ C per ogni x ∈ Ω, tale funzione f è Lipschitziana. Esercizio 7.18. Sia f : Ω → R una funzione continua, differenziabile in Ω, con Ω ⊂ Rn aperto limitato. Se f |∂Ω = 0, si provi che esiste x ∈ Ω tale che ∇f (x) = 0. Esercizio 7.19. Sia T un triangolo di vertici A, B, C nel piano e f : T → R una funzione differenziabile in un aperto di R2 contenente T e tale che f (A) = f (B) = f (C) = 0. Esiste sempre un punto x ∈ T tale che ∇f (x) = 0? Esercizio 7.20. Si studino le proprietà di continuità, Lipschitzianità, differenziabilità, esistenza di derivate parziali in 0 ∈ R2 delle funzioni f, g, h : R2 → R definite da xy f (x, y) = p , per (x, y) 6= (0, 0) e f (0, 0) = 0, x2 + y 2 x2 y 2 , per (x, y) 6= (0, 0) e f (0, 0) = 0, g(x, y) = p x2 + y 2 x3 y 3 h(x, y) = p , per (x, y) 6= (0, 0) e f (0, 0) = 0. x2 + y 2 Esercizio 7.21. Si dia un esempio di una funzione f : R2 → R differenziabile dappertutto ma con derivate parziali coordinate non continue in 0 ∈ R2 . Esercizio 7.22. Si dia un esempio di una funzione f : R2 → R che sia C ∞ in R2 \ {0}, C ∞ su tutte le rette del piano (quindi esistano tutte le derivate parziali anche nell’origine), ma non continua in 0 ∈ R2 . Esercizio 7.23. F Sia f : Rn → R Lipschitziana. Fissato x ∈ Rn , si consideri l’insieme D = v ∈ Rn : esiste ∂v f (x) . Si mostri che D è chiuso. Se D = Rn e la mappa v 7→ ∂v f (x) è lineare, si mostri che f è differenziabile in x. Esercizio 7.24. Sia f : R2 → R la funzione definita da p x2 y x2 + y 2 , f (x, y) = x4 + y 2 per (x, y) 6= (0, 0) e f (0, 0) = 0. Si mostri che esiste ∂v f (0) ed è uguale a zero per ogni v ∈ Rn , che la mappa v 7→ ∂v f (0) è lineare ma che f non è differenziabile in 0 ∈ R2 (f non è Lipschitziana, né continua nell’origine). 15. ESERCIZI 204 Esercizio 7.25. Sia f : R2 → R la funzione definita da x3 , x2 + y 2 per (x, y) 6= (0, 0) e f (0, 0) = 0. Si mostri che esiste ∂v f (0) con k∂v f (0)kR2 ≤ 1 per ogni v ∈ Rn , la mappa f è Lipschitziana ma f non è differenziabile in 0 ∈ R2 (la mappa v 7→ ∂v f (0) non è lineare). f (x, y) = Esercizio 7.26. Se una funzione f : Rn → R è continua, differenziabile in Rn \ {0} e dfx → L per x → 0, allora f è differenziabile anche nell’origine con df0 = L? Esercizio 7.27. F Sia f : Rn → R una funzione tale che esistano le sue derivate parziali. Si mostri che se n − 1 derivate parziali sono continue nell’origine, la funzione f è differenziabile in 0 ∈ Rn . Esercizio 7.28. FF Sia f : Rn → R una funzione tale che per ogni curva differenziabile γ : (−ε, ε) → Rn con γ(0) = 0 si ha che la funzione f ◦ γ : (−ε, ε) → R è derivabile in t = 0 con derivata nulla. Allora la funzione f è differenziabile nell’origine di Rn con differenziale nullo? E se la condizione vale solo per le curve C 1 , C 2 , . . . , C ∞ ? O solo per le curve parametrizzate in lunghezza d’arco? Esercizio 7.29. Si dia un esempio di una funzione f : R2 → R tale che la derivata seconda ∂2f ∂x∂y esista ma non esista ∂f ∂x . Esercizio 7.30. Si provi che la funzione definita da f (x, y) = xy(x2 − y 2 ) , x2 + y 2 per (x, y) 6= (0, 0) e f (0, 0) = 0, soddisfa ∂2f (0, 0) = 1 ∂x∂y e ∂2f (0, 0) = −1 . ∂y∂x Esercizio 7.31. F Sia f : Ω → R una funzione tale che esistano le sue derivate parziali prime e seconde in Ω aperto 2f di Rn . Si provi che se la derivata seconda mista ∂x∂i ∂x (x) è continua in x ∈ Ω, allora j ∂2f ∂2f (x) = (x) . ∂xi ∂xj ∂xj ∂xi Esercizio 7.32. Sia f : Ω → R di classe C k nell’aperto Ω ⊆ Rn , si provi che allora ∂kf ∂kf = , ∂xi1 ∂xi2 . . . ∂ik ∂xj1 ∂xj2 . . . ∂jk per ogni permutazione j1 , j2 , . . . , jk degli indici i1 , i2 , . . . , ik . Quante sono le possibili derivate parziali di ordine k distinte della funzione f ? Esercizio 7.33. Si trovino tutte le funzioni differenziabili f : Rn → R tali che dfx sia costante, per x ∈ Rn . 15. ESERCIZI 205 Esercizio 7.34. Si trovino tutte le funzioni differenziabili f : Rn → R tali che Si trovino tutte le funzioni due volte differenziabili f : R2 ∂f ∂x1 = 0. → R tali che Si trovino tutte le funzioni due volte differenziabili f : R2 → R tali che ∂2f ∂x∂y = 0. ∂2f = 0. ∂x2 Esercizio 7.35. Si caratterizzino le funzioni differenziabili f : R2 → R tali che ∂f ∂f x (x, y) + y (x, y) = 0 , ∂x ∂y per ogni (x, y) ∈ R2 . Si caratterizzino le funzioni differenziabili f : R2 → R tali che ∂f ∂f x (x, y) − y (x, y) = 0 , ∂y ∂x per ogni (x, y) ∈ R2 . Esercizio 7.36 (Teorema di Eulero). Una funzione F : R2 → R tale che esista n ∈ N tale che valga F (tx, ty) = tn F (x, y) per ogni (x, y) ∈ R2 e t > 0 si dice (positivamente) omogenea di grado n. Si mostri che se la funzione differenziabile f : R2 → R è omogenea di grado n, si ha ∂F ∂F x (x, y) + y (x, y) = nF (x, y) , ∂x ∂y per ogni (x, y) ∈ R2 . Esercizio 7.37 (Laplaciano – Funzioni Armoniche). Data una funzione u : Ω → R, con Ω aperto di Rn , si definisce il suo Laplaciano ∆u : Ω → R come ∆u(x) = ∂2u ∂2u ∂2u (x) . (x) + (x) + · · · + ∂x2n ∂x21 ∂x22 Una funzione che soddisfi ∆u = 0 (equazione di Laplace) in Ω si dice armonica. Si trovi per quali α ∈ R la funzione 1 fα (x) = , kxkα con n 6= 2, è armonica in Rn \ {0}. Si mostri una funzione armonica dipendente solo da kxk su R2 \ {0}. Esercizio 7.38. Si trovino tutte le funzioni armoniche dipendenti solo da kxk su Rn \ {0}. Esercizio 7.39. Si calcoli il Laplaciano della funzione f (x, y) = arctan(x/y) in R2 \ {y = 0}. Esercizio 7.40. Data una funzione armonica in un aperto Ω ⊆ Rn , si trovino tutte le funzioni ϕ ∈ C 2 (R) tali che ϕ ◦ u sia ancora armonica. Esercizio 7.41. Si calcoli il Laplaciano di una funzione u : R2 → R in coordinate polari. Si mostri che se φ : Rn → Rn è un’isometria, si ha ∆(u ◦ φ) = ∆u ◦ φ. 15. ESERCIZI 206 Esercizio 7.42 (Equazione del Calore). Una funzione u : Ω × (a, b) → R, con Ω aperto di Rn , soddisfa l’equazione del calore se ∂u (x, t) = ∆u(x, t) , ∂t per ogni x ∈ Ω e t ∈ (a, b). Si mostri che la funzione kxk2 1 u(x, t) = n/2 e− 4t t soddisfa l’equazione del calore in R+ × Rn (questa funzione è detta nucleo del calore in 0 ∈ Rn ). Esercizio 7.43 (Equazione della Corda Vibrante). F Una funzione u : R × (a, b) → R, soddisfa l’equazione della corda vibrante se 2 ∂2u 2 ∂ (x, t) = c (x, t) , ∂t2 ∂x2 per ogni x ∈ R e t ∈ (a, b), dove c è una costante reale diversa da zero. Si mostri che date due funzioni f, g ∈ C 2 (R), la funzione u(x, t) = f (x + ct) + g(x − ct) soddisfa l’equazione della corda vibrante in R × R. Ci sono altre soluzioni? Nota. La versione n–dimensionale di questa equazione è l’equazione delle onde (detta anche equazione di d’Alembert). Una funzione u : Ω × (a, b) → R la soddisfa se ∂2u (x, t) = c2 ∆u(x, t) , ∂t2 per ogni x ∈ Ω e t ∈ (a, b), dove c è una costante reale diversa da zero. Esercizio 7.44. F Si provi che tutte le soluzioni u : R × (a, b) → R di classe C 2 dell’equazione 2 ∂2u ∂u 2∂ u (x, t) = x (x, t) + x (x, t) ∂t2 ∂x2 ∂x hanno la forma u(x, t) = f (xet ) + g(xe−t ) , dove f, g sono due funzioni in C 2 (R). Esercizio 7.45. F Una funzione f = (f1 , f2 ) : R2 → R2 soddisfa nel punto (x0 , y0 ) le equazioni di Cauchy–Riemann se è differenziabile in (x0 , y0 ) e si ha ∂f1 ∂f2 ∂f1 ∂f2 (x0 , y0 ) = (x0 , y0 ) e (x0 , y0 ) = − (x0 , y0 ) . ∂x ∂y ∂y ∂x Si provi che allora, vedendo f come una mappa da C in C, posto z0 = x0 + iy0 , esiste il limite (derivata complessa di f in z0 ) f (z) − f (z0 ) lim z→z0 z − z0 ∂f1 ∂f2 ed è uguale a ∂x (x0 , y0 ) + i ∂x (x0 , y0 ). Si mostri che vale anche il viceversa e si provi che soddisfare le equazioni di Cauchy–Riemann è equivalente al fatto che il differenziale della funzione f in (x0 , y0 ), visto come una funzione da C in C, è C–lineare. Una funzione f : Ω → R2 di classe C 1 , con Ω ⊆ R2 , vista come una mappa da un aperto Ω di C in 15. ESERCIZI 207 C, che soddisfi le equazioni di Cauchy–Riemann in ogni punto di Ω, si dice olomorfa (o analitica) in Ω. Esercizio 7.46. F Si mostri che la famiglia delle funzioni olomorfe in un aperto Ω ⊂ R2 ≈ C è uno spazio vettoriale, chiuso per prodotto e che se f : Ω → C è olomorfa e mai nulla, anche 1/f lo è. Si mostri inoltre che per ogni n ∈ N, la funzione f (z) = z n è olomorfa su tutto C, quindi anche ogni polinomio p ∈ C[z]. Esercizio 7.47. F Si mostri che se una funzione olomorfa in un aperto Ω ⊂ R2 ≈ C ha derivata complessa in z0 ∈ Ω diversa da zero, allora è localmente invertibile in un intorno di z0 e la sua inversa è olomorfa. Esercizio 7.48. Si mostri che se f = (f1 , f2 ) : Ω → R2 è una funzione C 2 ed olomorfa, le due componenti f1 e f2 sono funzioni armoniche. Tali funzioni f1 e f2 si dicono armoniche coniugate. Esercizio 7.49 (Principio del Massimo per Funzioni Armoniche). Sia u : B → R una funzione continua da una palla chiusa B di Rn armonica nell’interno B. • Supponendo che u prenda massimo in x0 ∈ B e che tale massimo sia maggiore del massimo di u ristretta al bordo ∂B della palla, si mostri che per ε > 0 abbastanza piccolo, le funzioni uε : B → R definite da uε (x) = u(x) + εkx − x0 k2 , per ogni x ∈ B, assumono massimo in un punto xε0 all’interno della palla. • Si mostri che ∆uε = ∆u + 2ε = 2ε > 0 in ogni punto di B. • Si provi che ∆uε (xε0 ) ≤ 0 in contraddizione col punto precedente. Si concluda che per una funzione armonica u : B → R vale min u ≤ u(x) ≤ max u ∂B ∂B e che se due funzioni armoniche coincidono sul bordo di una palla allora coincidono anche all’interno. Esercizio 7.50. Dati a1 , a2 , . . . ak ∈ Rn si trovi il minimo (si dica se esiste e se è unico) della funzione f (x) = k X kx − ai k2 . i=1 Esercizio 7.51. Si mostri che l’ipotesi di continuità del differenziale è necessaria nel teorema della funzione inversa, anche nel caso unidimensionale. Si consideri la funzione da R in R f (x) = x + 2x2 sin (1/x) , per x 6= 0 e f (0) = 0, si ha f 0 (0) = 1, la derivata f 0 è limitata in (−1, 1) ma non è invertibile in alcun intorno di 0 ∈ R. Esercizio 7.52. Si enunci/provi un analogo n–dimensionale della formula/teorema di Taylor per una funzione f : Ω → R di classe C k nell’intorno di un punto x ∈ Ω ⊆ Rn . Si usi tale formula per definire una procedura di analisi dei punti critici di una funzione nella situazione in cui in un punto del dominio di definizione sia il gradiente che tutte le derivate seconde di una funzione sono nulli. 15. ESERCIZI 208 Esercizio 7.53. Si dimostri che se la matrice Hessiana Hf (x) è semidefinita positiva in ogni punto x di un aperto convesso Ω ⊆ Rn , allora l’epigrafico della funzione f : Ω → R, (x, t) ∈ Ω × R : t > f (x) è un insieme convesso. Esercizio 7.54. Si mostri che se C è un convesso compatto di Rn e L : Rn → R è una mappa lineare, il massimo e il minimo di L sono presi sul bordo di C (non necessariamente solo sul bordo). Esercizio 7.55. Si mostri che se Ω è un aperto limitato di Rn e f : Ω → R è una funzione continua e armonica in Ω, il massimo e il minimo di f sono presi sul bordo di Ω (non necessariamente solo sul bordo). Si mostri che se due funzioni armoniche in Ω e continue in Ω, coincidono su ∂Ω, allora sono uguali in tutto Ω. Nota. In realtà vale il principio del massimo forte che dice che se una funzione armonica f : Ω → R assume massimo (anche locale) in un punto interno a Ω, allora è costante in tutta la componente connessa di tale punto. Esercizio 7.56. Sia f : Rn → Rn e g : R → Rn due funzioni di classe C 1 . Sia h : Rn → Rn definita da h(x1 , x2 , . . . , xn ) = f (g1 (x1 ), g2 (x2 ), . . . , gn (xn )) , si mostri che g10 (x1 ) 0 .. dh(x) = df (g1 (x1 ), g2 (x2 ), . . . , gn (xn )) ◦ . 0 . 0 gn (xn ) Esercizio 7.57. Sia mostri che il teorema della funzione implicita implica il teorema della funzione inversa e viceversa. Esercizio 7.58. F Sia A ⊂ Rn aperto e f : A → Rm , con m ≤ n, una funzione di classe C k . Sia x0 ∈ A con f (x0 ) = 0 e il rango di dfx0 uguale a m, si provi che esistono due intorni U e V di x0 e una mappa h : U → V di classe C k con inversa h−1 di classe C k tale che f (h(x1 , x2 , . . . , xn )) = (xn−m+1 , xn−m+2 , . . . , xn ) per ogni x = (x1 , x2 , . . . , xn ) ∈ U . Esercizio 7.59. F Sia f : Rn → Rm , con m ≤ n, una funzione di classe C k tale che il rango di dfx0 uguale a m. Si provi che un intorno di x0 è mandato dalla mappa f in un intorno di f (x0 ). Esercizio 7.60. F Sia GL(n, R) l’insieme delle matrici n × n invertibili, con la metrica indotta da Rn×n (si mostri che GL(n, R) ẽ un aperto in Rn×n con tale metrica). Si dica se le seguenti mappe da GL(n, R) in sé o in R sono differenziabili e, possibilmente, se ne calcoli il differenziale: A 7→ A2 , A 7→ kAk22 , A 7→ A−1 , A 7→ det A , A 7→ kAk2 , A 7→ traccia A . 15. ESERCIZI 209 Esercizio 7.61. Sia f : R2 → R di classe C 1 con ∇f 6= 0 in ogni punto dove f si annulla. Si mostri che allora {f = 0} è l’unione disgiunta di una famiglia al più numerabile di sostegni di curve semplici γn : In → R2 di classe C 1 , con In = (0, 1) oppure In = S1 . Esercizio 7.62. Sia Ω ⊆ R3 aperto e siano f, g : Ω → R di classe C 1 tali che in x0 ∈ Ω si abbia f (x0 ) = g(x0 ) = 0 e ∇f (x0 ) e ∇g(x0 ) siano linearmente indipendenti. Si mostri che l’insieme {x ∈ Ω : f (x) = 0} ∩ {x ∈ Ω : g(x) = 0} è una curva di classe C 1 in un intorno di x0 in Ω. Esercizio 7.63. Sia trovi, usando il teorema dei moltiplicatori di Lagrange, tra tutti i triangoli inscritti in un cerchio, quello di area massima. Esercizio 7.64. F Sia f : B → R2 , dove B è la palla unitaria chiusa di R2 , una funzione C 1 fino al bordo tale che kf (x)k = 1 per ogni x ∈ B, in altre parole f è una funzione da B in S1 ⊂ R2 , inoltre si abbia che f (x) = x, se x ∈ ∂B = S1 . Diciamo che x ∈ B è un punto regolare se dfx ha rango 1, singolare se dfx = 0. Diciamo che y ∈ S1 è un valore regolare se non è immagine per f di alcun punto singolare. • Si mostri che se y ∈ S1 è un valore regolare allora f −1 (y) è l’unione disgiunta di una famiglia finita di curve chiuse semplici di classe C 1 , contenute in B e di una famiglia di archi semplici di classe C 1 con estremi in y ∈ S1 . • Si provi che se un arco di curva C 1 ha estremi in y ∈ S1 , allora il punto y non può essere un punto regolare, di conseguenza nemmeno un valore regolare in quanto f (y) = y. • Si mostri che l’insieme dei valori regolari è denso in S1 . • Si concluda che una siffatta funzione f non esiste. Esercizio 7.65. F Sia f : B → B una funzione C 1 fino al bordo. Si mostri che se f non ha punti fissi, allora si può costruire una funzione g : B → S1 di classe C 1 tale che ristretta al bordo ∂B = S1 sia l’identità. Si concluda che ogni funzione C 1 da una palla chiusa di R2 in sé ha almeno un punto fisso. Esercizio 7.66. Si mostri, (per approssimazione) usando il risultato del problema precedente, che ogni funzione continua da una palla chiusa di R2 in sé ha almeno un punto fisso (teorema di Brouwer in dimensione 2 – vale in realtà in ogni dimensione). CAPITOLO 8 EQUAZIONI DIFFERENZIALI ORDINARIE Si richiede la conoscenza di nozioni e risultati relativi all’integrale di Riemann (proprio e improprio) e all’integrazione indefinita. In particolare useremo il teorema fondamentale del calcolo integrale nella seguente formulazione: siano I ⊆ R un intervallo, x0 ∈ I e f : I → R continua; allora la funzione integrale F : I → R definita da Z x F (x) := f (t) dt x0 Ra Rb (qui adottiamo la convenzione, coerente con la teoria degli integrali curvilinei, a = − b , quindi non importa che gli estremi dell’insieme di integrazione siano ordinati) è derivabile in I e la sua derivata vale f . 1. Definizioni e primi esempi Un’equazione differenziale ordinaria di ordine n ha come incognita una funzione y(x) definita su intervallo aperto I ⊆ R (spesso non assegnato a priori) e ivi derivabile n volte. L’equazione consiste nel richiedere che, per ogni x ∈ I, gli n + 2 numeri x, y(x), y (1) (x), . . . , y (n) (x) , soddisfino una data relazione. Continuando a usare le notazioni tradizionali y 0 , y 00 , y 000 per derivate di ordine fino a 3, esempi di equazioni differenziali sono: y 0 = xy , 2 y2 + y0 = 1 , y 000 = y 00 , y0 + x ecc. L’aggettivo “ordinaria” attribuito all’equazione differenziale si riferisce al fatto che le funzioni incognite dipendono da una sola variabile. Il termine serve quindi a distinguere le equazioni ordinarie dalle equazioni alle derivate parziali. Siccome di queste non parleremo (a parte il sistema di equazioni alle derivate parziali ∇V = F trattato nel capitolo precedente), perchè argomento di corsi (molto) più avanzati di Analisi, diremo brevemente “equazione differenziale” sottintendendo il termine “ordinaria”. In generale, un’equazione differenziale è definita in termini di una funzione g di n + 2 variabili, definita su un insieme A ⊆ Rn+2 , ponendo (1.1) g x, y(x), y (1) (x), . . . , y (n) (x) = 0 . Ovviamente, se y(x), definita su un intervallo I, è soluzione di un’equazione differenziale, la sua restrizione a un qualunque sottointervallo I 0 ⊆ I è pure una soluzione. È dunque interessante conoscere l’insieme delle soluzioni massimali, cioè quelle non prolungabili (mantenendo la continuità 210 1. DEFINIZIONI E PRIMI ESEMPI 211 e la differenziabilità) a soluzioni definite su intervalli più ampi. L’insieme delle soluzioni massimali si chiama integrale generale dell’equazione differenziale. Una singola soluzione dell’equazione differenziale si chiama anche integrale particolare dell’equazione. L’equazione differenziale si dice in forma normale se A = B ×R con B ⊆ Rn+1 e nell’equazione (1.1) è possibile isolare l’ultima variabile, i.e. la derivata di ordine massimo, a primo membro: (1.2) y (n) (x) = f x, y(x), y (1) (x), . . . , y (n−1) (x) per una qualche funzione f : B → R. Per equazioni differenziali in forma normale il problema di Cauchy consiste nel risolvere l’equazione (1.2) in un dato intervallo I ⊆ R con le n condizioni iniziali y(x0 ) = y0,1 , y (1) (x0 ) = y0,2 . . . y (n−1) (x0 ) = y0,n per un certo x0 ∈ I e y0 = (y0,1 , . . . , y0,n ) ∈ Rn . Esempi. 1. Data una funzione continua h(x) su un intervallo I, l’equazione y 0 (x) = h(x) ∀x ∈ I ha come soluzioni massimali le primitive di h su I. Quindi, se H(x) è una tale primitiva, l’integrale generale dell’equazione coincide con l’integrale indefinito di h, ossia l’insieme delle funzioni y(x) = H(x) + c c∈R. Già a livello di questa semplicissima equazione differenziale le questioni dell’esistenza e dell’unicità delle soluzioni per il problema di Cauchy (i.e. avendo assegnato y(x0 ) = y0 ) diventano interessanti. Applicando il teorema di Lagrange alla differenza di due soluzioni troviamo subito che l’unicità vale sempre, mentre una condizione sufficiente per l’esistenza è, perRil teorema fondamentale del calcolo, x che h sia continua in I; in tal caso la soluzione è y(x) = y0 + x0 h(t) dt. 2. L’integrale generale di un’equazione differenziale può avere una struttura più complessa. Per esempio, l’equazione 2 y2 + y0 = 1 ha come soluzioni le sinusoidi y(x) = sin(x + α) con α ∈ [0, 2π), le due funzioni costanti y(x) = ±1, ma anche tutte le funzioni ottenute raccordando con continuità, su intervalli adiacenti, alternativamente sinusoidi e tratti con valore costante ±1. 3. Per un’equazione del primo ordine in forma normale, y 0 (x) = f (x, y) , il grafico delle soluzioni deve essere ovviamente contenuto nel dominio della funzione f . La funzione f assegna in ogni punto del dominio la “pendenza” che il graficop di una soluzione deve avere se passa per quel punto. La figura mostra il caso dell’equazione y 0 = 1 − x2 − y 2 . 2. METODI RISOLUTIVI PER ALCUNI TIPI DI EQUAZIONI DEL PRIMO ORDINE 212 4. Nei casi più comuni in cui serva studiare un’equazione in forma non normale, si cerca di ricondurla a una, o più, equazioni in forma normale risolvendo l’equazione implicita g(t, u0 , u1 , . . . , un ) = 0 nella variabile un (cioè ricercando nell’equazione implicita g = 0 le eventuali funzioni un = f (t, u0 , u1 , . . . , un−1 ) implicitamente definite in essa). L’equazione dell’Esempio 2 si riduce in forma normale dando luogo alle due equazioni p p y0 = − 1 − y2 . (1.3) y0 = 1 − y2 , Si noti tuttavia che le soluzioni della prima equazione sono crescenti e quelle della seconda decrescenti. Quindi non tutte le soluzioni massimali trovate nell’Esempio 2 rientrano in uno dei due integrali generali delle equazioni in (1.3) (però rientrano “a tratti” in uno dei due alternativamente). Nel seguito ci limiteremo a considerare solo equazioni differenziali in forma normale, anche senza specificarlo esplicitamente. 2. Metodi risolutivi per alcuni tipi di equazioni del primo ordine Poter risolvere esplicitamente un’equazione differenziale è un caso piuttosto raro. In questo paragrafo vediamo i casi più comuni in cui si possono dare metodi di calcolo esplicito. 1. Equazioni a variabili separabili. Si chiamano in tal modo le equazioni della forma (2.1) y 0 (x) = f (x)g(y) , con f, g continue sugli intervalli I, J rispettivamente. Per prima cosa si osserva che, se α ∈ J è uno zero di g, cioè g(α) = 0, la funzione costante (2.2) y(x) = α sull’intervallo I è soluzione. Si fissi quindi un intervallo J 0 ⊆ J che non contenga zeri di g e massimale rispetto a questa proprietà. 2. METODI RISOLUTIVI PER ALCUNI TIPI DI EQUAZIONI DEL PRIMO ORDINE 213 Si supponga che y(x) sia una soluzione dell’equazione con grafico contenuto in I × J 0 , definita su un intervallo I 0 ⊆ I da determinarsi. Vale allora l’identità y 0 (x) = f (x) , ∀ x ∈ I0 . g y(x) Si prenda ora una primitiva G di 1/g su J 0 e si osservi che y 0 (x) = (G ◦ y)0 (x) , g y(x) per cui (G ◦ y)0 (x) = f (x) , ∀ x ∈ I0 . Si prenda ora una primitiva F di f su I. Esiste una costante c tale che G y(x) = F (x) + c , ∀ x ∈ I0 . Avendo g segno costante su J 0 , G è strettamente monotona, e dunque invertibile. Quindi (2.3) y(x) = G−1 F (x) + c . Il dominio di questa soluzione sarà dunque Ic0 = x ∈ I : F (x) + c ∈ im G . Queste funzioni, al variare degli intervalli J 0 scelti come sopra e insieme alle soluzioni costanti dell’equazione (2.2), consentono di esprimere l’integrale generale1. Un metodo pratico per trovare le soluzioni non costanti (ma che sottintende il ragionamento rigoroso esposto sopra) è il seguente. Si scriva l’equazione (2.1) nella forma dy = f (x)g(y) , dx e la si trasformi, in modo puramente formale in dy = f (x) dx . g(y) Inserendo in ambo i membri il segno di integrazione indefinita, si arriva all’espressione Z Z dy = f (x) dx . g(y) Fissate due primitive, F di f e G di 1/g, come sopra, si ottiene la relazione G(y) = F (x) + c , dipendente dal parametro c, che va risolta in y. Questo vuol dire trovare le funzioni inverse dei singoli rami monotoni di G, e dunque arrivare alla formula (2.3). 2. Equazioni lineari. Un’equazione differenziale lineare del primo ordine ha la forma (2.4) y 0 = a(x)y + b(x) , con a, b funzioni continue su un intervallo I. L’equazione si dice omogenea se b = 0. Per risolvere l’equazione (2.4), si studia prima l’equazione omogenea associata y 0 = a(x)y , 1L’espressione esplicita dell’integrale generale completo può essere complicata, perché è possibile che due soluzioni tra quelle trovate sopra si raccordino in punti particolari dando luogo a possibili ramificazioni. Si veda l’esempio di non unicità (3.2) più avanti. 2. METODI RISOLUTIVI PER ALCUNI TIPI DI EQUAZIONI DEL PRIMO ORDINE 214 che è a variabili separabili. L’integrale generale (si veda la sezione precedente) è dato dalla formula seguente, dove A(x) è una primitiva di a in I, y(x) = ceA(x) , c∈R, che comprende anche la soluzione costante y(x) = 0. Risolta l’equazione omogenea applicata, si trova l’integrale generale dell’equazione (2.4) con il cosiddetto metodo della variazione delle costanti. Si cerca cioè una soluzione della forma y(x) = c(x)eA(x) . Sostituendo questa espressione nell’equazione (2.4), si ha c0 (x)eA(x) + c(x)a(x)eA(x) = a(x)c(x)eA(x) + b(x) . Semplificando, si arriva a c0 (x) = b(x)e−A(x) , che si risolve con una integrazione indefinita. Le soluzioni massimali dell’equazione (2.4) sono tutte e sole le funzioni definite su I della forma Z x (2.5) y(x) = eA(x) b(t)e−A(t) dt + c , x0 dove c ∈ R e x0 è un punto di I fissato. Tornando al problema di Cauchy, può essere utile scegliere tra tutte le primitive di a quella che si Rx annulla in x0 , i.e. A(x) = x0 a(t) dt. In tal caso la costante c in (2.5) coincide proprio con y0 e possiamo anche scrivere la soluzione trovata nella forma Z x Rx y(x) = b(t)e t a(s) ds dt + y0 . x0 Svolgendo i passaggi a ritroso, si mostri che questa è effettivamente l’unica soluzione del problema di Cauchy (fatto che poi ci verrà garantito, per equazioni più generali, dal teorema di Cauchy– Lipschitz). 3. Equazioni di Bernoulli. Sono equazioni non lineari del tipo u0 (t) = a(t)u(t) + b(t)uα (t) α 6= 0, 1 u1−α (t) con a e b continue. Col cambio di variabile v(t) = si riducono a equazioni lineari del primo ordine: v 0 (t) = (1 − α)a(t)v(t) + (1 − α)b(t) . 4. Inversione delle variabili. Alcune equazioni non lineari si semplificano prendendo t come variabile dipendente e u come variabile indipendente. Ad esempio l’equazione u0 (t) = t3 t4 + u(t) diventa un’equazione del tipo di Bernoulli: t0 (u) = t(u) + t−3 (u)u . 5. Equazioni omogenee. Sono del tipo u0 (t) = g(u(t)/t). Si riducono all’equazione a variabili separabili g(v(t)) − v(t) v 0 (t) = t con il cambio di variabili u(t) = tv(t). 3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE 215 3. Problemi di Cauchy per equazioni del primo ordine Si consideri un’equazione differenziale del primo ordine, y 0 = f (x, y) , con f definita su un insieme aperto A ⊆ R2 , che tipicamente supporremo almeno continua. Dato un punto (x0 , y0 ) ∈ A, si vogliono conoscere le soluzioni dell’equazione il cui grafico passi per tale punto. Si vuole cioè studiare il sistema ( y 0 (x) = f (x, y(x)) x∈I (3.1) y(x0 ) = y0 . Questo problema prende il nome di problema di Cauchy. Le questioni fondamentali riguardano l’esistenza e l’unicità di tali soluzioni. Si noti che, come abbiamo già detto, ha senso porsi il problema solo per funzioni il cui grafico è contenuto in A, perchè f non è definita fuori di A e in molti casi concreti non ha un’estensione continua a un insieme più grande di A. Cercheremo quindi funzioni continue e derivabili definite su intervalli aperti I contenenti x0 , il cui grafico sia contenuto in A; tali funzioni sono necessariamente di classe C 1 , dato che y 0 (x) = f (x, y(x)); se poi f avesse una regolarità maggiore, di classe C k , dall’equazione stessa si dedurrebbe anche, per induzione su k, che y è derivabile con continuità k + 1 volte in I. Senza ipotesi ulteriori sulla funzione f , l’esistenza e l’unicità (o entrambe) non sono verificate in generale, come mostrano i seguenti esempi. • Non esistenza: posto sgn y = −1 per y < 0 e sgn y = 1 per y ≥ 0, il problema di Cauchy ( y 0 = 1 + sgn y y(0) = 0 non può avere soluzione. Infatti una sua ipotetica soluzione avrebbe derivata y 0 (0) = 2 e sarebbe dunque strettamente negativa in un intorno sinistro di 0. Ma se y(x) < 0 allora y 0 (x) = 0, quindi y(x) sarebbe costante (e strettamente negativa) in un intorno sinistro di 0, il che è incompatibile con il dato iniziale. • Non unicità: il problema di Cauchy ( p y0 = 3 3 y2 (3.2) y(0) = 0 ha almeno due soluzioni: y(x) = x3 e y(x) = 0.2 I due paragrafi successivi saranno dedicati alla dimostrazione di un fondamentale teorema che garantisce l’esistenza e l’unicità locale della soluzione di un problema di Cauchy, noto anche come teorema di Cauchy–Lipschitz. Per introdurre le ipotesi del teorema, diamo una definizione. Definizione 8.1 (Funzioni Lipschitz e localmente Lipschitz nella variabile y). Sia f una funzione definita su un prodotto cartesiano R = I × J. Si dice che f è Lipschitziana3 nella variabile y se esiste una costante L ≥ 0 tale che f (x, y1 ) − f (x, y2 ) ≤ L|y1 − y2 | ∀x ∈ I, ∀y1 , y2 ∈ J . 2Se ne trovino infinite altre. 3Si sottointende: uniformemente rispetto alla variabile x ∈ I. 3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE 216 Se f : A → R è definita su un aperto A ⊆ R2 , diremo che f è localmente Lipschitziana nella variabile y se per ogni (x0 , y0 ) esiste un rettangolo R ⊆ A contenente (x0 , y0 ) tale che f |R è Lipschitziana rispetto alla variabile y. Il teorema ha il seguente enunciato. Teorema 8.2 (Teorema di esistenza e unicità locale). Sia A ⊆ R2 aperto e sia f : A → R continua, localmente Lipschitziana nella variabile y. Dato un punto (x0 , y0 ) ∈ A, esiste un rettangolo aperto R = I × J ⊂ A contenente (x0 , y0 ) ed esiste una funzione y : I → J di classe C 1 che risolve il problema di Cauchy (3.1), ed è l’unica soluzione tra quelle definite di classe C 1 in I e a valori in J. È inoltre possibile scegliere `(x0 , y0 ) > 0 e b̄(x0 , y0 ) > 0 in modo che: (a) per ogni rettangolo R = (x0 − `0 /2, x0 + `0 /2) × (y0 − b̄/2, y0 + b̄/2) con `0 ∈ (0, `(x0 , y0 )] vale la tesi di esistenza e unicità; (b) `−1 (x0 , y0 ) e b̄−1 (x0 , y0 ) sono localmente limitati in A. Se inoltre y1 : I1 → R e y2 : I2 → R sono soluzioni del problema di Cauchy (3.1) (in particolare x0 ∈ I1 ∩ I2 ), necessariamente y1 ≡ y2 in I1 ∩ I2 . Abbiamo già osservato che se f stessa è di classe C 1 allora, per derivazione della funzione composta, y è di classe C 2 (e, più un generale, y ha sempre un ordine di derivazione in più di f ). Si ottiene allora che w = y 0 soddisfa la cosiddetta equazione linearizzata (3.3) w0 (x) = a(x) + b(x)w(x) con a(x) = ∂f (x, y(x)), ∂x b(x) = ∂f (x, y(x)) , ∂y i cui coefficienti a, b dipendono dalla soluzione y stessa. Nella classe delle soluzioni del problema di Cauchy (3.1), definite su intervalli aperti, esiste una naturale relazione d’ordine y1 y2 se Dom(y1 ) ⊆ Dom(y2 ) e y2 ristretta a Dom(y1 ) coincide con y1 . Rispetto a questa relazione d’ordine esistono elementi massimali y(x), come vedremo nel prossimo teorema, e il loro comportamento al bordo del loro dominio massimale di definizione Imax può essere sovente studiato usando il fatto che la distanza dal bordo di A di (x, y(x)) tende a 0 al tendere di x ad uno degli estremi di Imax (se finito). Per trattare domini illimitati come ad esempio A = R2 (privo di bordo) si formula tuttavia la proprietà dicendo che (x, y(x)) “evade” da ogni compatto K contenuto in A. Teorema 8.3 (Soluzione massimale). Nelle ipotesi del teorema precedente, per ogni (x0 , y0 ) ∈ A esiste ed è unica la soluzione massimale y : Imax → R con x0 ∈ Imax e y(x0 ) = y0 . Inoltre, se z ∈ R è un estremo dell’intervallo Imax , deve valere la proprietà: (3.4) per ogni compatto K ⊂ A esiste r > 0 tale che |x − z| < r implica (x, y(x)) ∈ / K. In particolare, se A = I × R e z è interno a I, |y(x)| → +∞ per x ∈ Imax → z. Dimostrazione. L’unicità della soluzione massimale è ovvia grazie al teorema precedente: due soluzioni massimali y1 e y2 , rispettivamente definite su intervalli aperti I1 e I2 contenenti x0 e coincidenti nel punto x0 , coincidono in I1 ∩ I2 ; se fosse I1 6= I2 , sarebbe possibile definire y1 (x) se x ∈ I1 ; y(x) := y2 (x) se x ∈ I2 , contraddicendo la massimalità di y1 o di y2 . 3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE 217 Mostriamo ora l’esistenza. Dato l’insieme delle coppie (I, yI ), con I intervallo aperto contenente x0 e yI : I → R soluzione del problema di Cauchy, possiamo definire Imax come l’unione degli intervalli I e definiamo y : Imax → R ponendo y = yI su I . La definizione è ben posta grazie alla proprietà yI ≡ yI 0 su I ∩ I 0 e evidentemente definisce una soluzione massimale. Mostriamo infine la proprietà (3.4). Supponiamo che esista un compatto K ⊂ A per la quale non vale e supponiamo per fissare le idee che z = sup Imax . Esiste allora (xn ) ⊆ Imax con xn → z e (xn , y(xn )) ∈ K. Se (x∞ , y∞ ) ∈ K è un punto limite di questa successione, lungo una sottosuccessione n(k), deve essere x∞ = z. Dato che (xn(k) , y(xn(k) )) convergono a un punto interno ad A, sappiamo che le soluzioni del problema di Cauchy con dato iniziale (xn(k) , y(xn(k) )) si possono definire in un intervallo aperto Ik centrato in xn(k) di lunghezza `k ≥ 2c > 0. Non appena z − xn(k) < c abbiamo una contraddizione, in quanto possiamo prolungare, prendendo (xn(k) , yn(k) ) come condizione iniziale del problema di Cauchy, a un intervallo (xn(k) − `k /2, xn(k) + `k /2) che contiene z al suo interno. Come conseguenza del teorema precedente, abbiamo che i grafici delle soluzioni massimali, al variare di (x0 , y0 ), sono una partizione dell’insieme A: per ogni punto ne deve passare almeno uno (Teorema 8.3) e se si intersecano in un solo punto coincidono (Teorema 8.2 applicato nel punto di intersezione). Vediamo ora altri due importanti strumenti nello studio delle equazioni differenziali, il teorema di confronto e il criterio di esistenza globale. Premettiamo un lemma elementare, ma estremamente utile nelle applicazioni. Lemma 8.4 (Gronwall). Siano I ⊆ R un intervallo aperto, x0 ∈ I e L ∈ [0, +∞). Sia w : I → R derivabile in I, con derivata continua. Allora: (a) w(x0 ) ≤ 0 (risp. w(x0 ) < 0) per un certo x0 ∈ I e w0 (x) ≤ L|w(x)| per ogni x ∈ I tale che x > x0 implicano w(x) ≤ 0 (risp. w(x) < 0) per ogni x ∈ I, x ≥ x0 ; (b) w(x0 ) ≥ 0 (risp. w(x0 ) > 0) per un certo x0 ∈ I e w0 (x) ≥ −L|w(x)| per ogni x ∈ I tale che x > x0 implicano w(x) ≥ 0 (risp. w(x) > 0) per ogni x ∈ I, x ≥ x0 ; (c) w(x0 ) ≤ 0 per un certo x0 ∈ I e w0 (x) < L|w(x)| per ogni x ∈ I tale che x > x0 implicano w(x) < 0 per ogni x ∈ I, x > x0 ; (d) w(x0 ) ≥ 0 per un certo x0 ∈ I e w0 (x) > −L|w(x)| per ogni x ∈ I tale che x > x0 implicano w(x) > 0 per ogni x ∈ I, x > x0 . Dimostrazione. Non è restrittivo supporre L > 0 e che I abbia lunghezza ` finita. (a) Per evitare una potenziale divisione per 0, partiamo dalla disuguaglianza w0 ≤ L|w| + δ per δ > 0. Per x ∈ I con x ≥ x0 si ha allora (essenzialmente stiamo separando le variabili in una “disequazione differenziale”) Z x Z x w0 (s) ds ≤ ds = x − x0 . x0 x0 δ + L|w(s)| Cambiando variabili si ottiene4 Z w(x) w(x0 ) 1 dz ≤ ` . δ + L|z| 4Si noti che qui applichiamo la formula di cambiamento di variabili con una funzione w non necessariamente monotona, o bigettiva; perché la formula vale? Basta derivare ambo i membri per convincersene. 3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE 218 Se w(x0 ) ≤ 0 e per assurdo fosse w(x) > 0 per un certo x ∈ I con x > x0 , tenendo conto della disuguaglianza w(x0 ) ≤ 0 si avrebbe Z w(x) 1 1 Lw(x) = log 1 + dz ≤ ` . L δ δ + Lz 0 Dato che log(1 + Lw(x)/δ) diverge per δ → 0+ si ha una contraddizione. Analogamente, se w(x0 ) < 0 e fosse w(x) ≥ 0 per un certo x > x0 avremmo una contraddizione dalla disuguaglianza Z 0 1 dz ≤ ` ∀δ > 0 . w(x0 ) δ − Lz (b) Basta applicare (a) alla funzione −w. (c) Per il punto (a), sappiamo già che w(x) ≤ 0 per ogni x ∈ I, x ≥ x0 . Se fosse w(x) = 0 per un certo x ∈ I ∩ (x0 , +∞) avremmo w0 (x) = 0, essendo x di massimo relativo, contro la validità della stretta disuguaglianza w0 (x) < L|w(x)|. (d) Basta applicare (c) alla funzione −w. È anche utile, a volte, applicare il lemma di Gronwall all’indietro nel tempo. Precisamente, invertendo il verso delle disuguaglianze differenziali in (a), (b), (c), (d) (il che corrisponde a invertire la direzione del tempo), otteniamo le implicazioni: (a’) w(x0 ) ≤ 0 (risp. w(x0 ) < 0) per un certo x0 ∈ I e w0 (x) ≥ −L|w(x)| per ogni x ∈ I tale che x < x0 implicano w(x) ≤ 0 (risp. w(x) < 0) per ogni x ∈ I, x ≤ x0 ; (b’) w(x0 ) ≥ 0 (risp. w(x0 ) > 0) per un certo x0 ∈ I e w0 (x) < −L|w(x)| per ogni x ∈ I tale che x < x0 implicano w(x) ≥ 0 (risp. w(x) > 0) per ogni x ∈ I, x ≤ x0 ; (c’) w(x0 ) ≤ 0 e per un certo x0 ∈ I e w0 (x) > −L|w(x)| per ogni x ∈ I tale che x < x0 implicano w(x) < 0 per ogni x ∈ I, x < x0 ; (d’) w(x0 ) ≥ 0 per un certo x0 ∈ I e w0 (x) < −L|w(x)| per ogni x ∈ I tale che x < x0 implicano w(x) > 0 per ogni x ∈ I, x < x0 . Proposizione 8.5 (Criterio di confronto). Sia I ⊆ R un intervallo aperto, x0 ∈ I e siano f, g : I × R → R continue, con g Lipschitziana nella seconda variabile in ogni rettangolo compatto R = I 0 × J contenuto in I × R. Siano u e v funzioni di classe C 1 in I, rispettivamente una “sottosoluzione” e una “soprasoluzione” dei problemi di Cauchy relativi a f e g, vale a dire (3.5) u0 (x) ≤ f (x, u(x)) , v 0 (x) ≥ g(x, v(x)) ∀x ∈ I, x > x0 . Supponiamo inoltre che risulti (3.6) f (x, u(x)) ≤ g(x, u(x)) Allora valgono le implicazioni ( u(x0 ) ≤ v(x0 ) (3.7) u(x0 ) < v(x0 ) ⇒ ⇒ ∀x ∈ I, x > x0 . u(x) ≤ v(x) ∀x ∈ I, x ≥ x0 , u(x) < v(x) ∀x ∈ I, x ≥ x0 . Se invece le condizioni (3.5) e (3.6) valgono per x ∈ I, x < x0 , allora ( u(x0 ) ≥ v(x0 ) ⇒ u(x) ≥ v(x) ∀x ∈ I, x ≤ x0 , (3.8) u(x0 ) > v(x0 ) ⇒ u(x) > v(x) ∀x ∈ I, x ≤ x0 . 3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE 219 Dimostrazione. Limitiamoci a mostrare la prima delle due implicazioni, la prova dell’altra è simile. Fissato a ∈ I con a > x0 , poniamo I 0 = [x0 , a] e indichiamo con J un intervallo chiuso e limitato che contiene u(I 0 ) ∪ v(I 0 ). Ora, posto w = u − v, per x ∈ I 0 vale w0 (x) = u0 (x) − v 0 (x) ≤ f (x, u(x)) − g(x, v(x)) ≤ g(x, u(x)) − g(x, v(x)) ≤ L|u(x) − v(x)| = L|w(x)| , ove L è l’estremo superiore delle costanti di Lipschitz di g(x, ·) in J, al variare di x in I 0 . La tesi segue allora dal lemma di Gronwall, parte (a). Osservazione 8.6 (Forma stretta del principio di confronto). Usando la parte (c), (c’) del lemma di Gronwall si ottengono delle disuguaglianze strette come conseguenza della disuguaglianza stretta nella formula (3.6), vale a dire f (x, u(x)) < g(x, u(x)) per ogni x ∈ I, x > x0 , garantisce la validità delle implicazioni: ( u(x0 ) ≤ v(x0 ) ⇒ u(x) < v(x) ∀x ∈ I, x > x0 , (3.9) u(x0 ) ≥ v(x0 ) ⇒ u(x) > v(x) ∀x ∈ I, x < x0 . Spesso nella pratica, non potendo calcolare esplicitamente la soluzione u, la (3.6) si verifica usando l’informazione che f ≤ g globalmente. Si noti anche che avremmo potuto sostituire la (3.6) con f (x, v(x)) ≤ g(x, v(x)), supponendo invece che sia f e non g ad essere Lipschitziana nella variabile y sui rettangoli compatti contenuti in I × R. Vediamo ora un’applicazione, ottenendo un criterio di esistenza globale, e discutiamo poi alcuni esempi tratti dalla raccolta di esercizi risolti: E.Acerbi, L.Modica, S.Spagnolo, Problemi scelti di Analisi Matematica II, Liguori, 1986. Proposizione 8.7 (Criterio di esistenza globale). Sia I ⊆ R un intervallo aperto, K ∈ [0, +∞) e sia f : I × R → R continua e localmente Lipschitziana nella seconda variabile, tale che (3.10) |f (x, y)| ≤ K(1 + |y|) ∀(x, y) ∈ I × R . Allora per ogni x0 ∈ I e y0 ∈ R, la soluzione massimale del problema di Cauchy (3.1) è definita su tutto l’insieme I. Dimostrazione. Sia y : Imax → R la soluzione p massimale tale che y(x0 ) = y0 . Per studiare la crescita di y consideriamo la funzione w(x) = 1 + y 2 (x) (come sostituto di |y(x)|, che non è a priori derivabile). Abbiamo allora y(x)y 0 (x) p ≤ |f (x, y(x))| 1 + |y 2 (x)| ≤ K(1 + |y(x)|) ≤ 2Kw(x) |w0 (x)| = per ogni x ∈ I. La formula risolutiva (2.5) delle equazioni lineari e il criterio di confronto ci dicono allora che |y(x)| ≤ w(x) ≤ w(x0 )e2K|x−x0 | ∀x ∈ Imax . Se fosse z = sup Imax < sup I, vicino a z la funzione y dovrebbe essere illimitata, per la proprietà (3.4). Discorso analogo se inf Imax > inf I. 3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE Esempio 1. Consideriamo il problema di Cauchy ( y 0 (x) = 1 − log(x + y(x)) , (3.11) y(x0 ) = y0 > −x0 , 220 x + y(x) > 0 e studiamo il comportamento delle soluzioni al variare della condizione iniziale. Con il cambiamento di variabili x + y(x) = z(x) l’equazione diventa z 0 (x) = 2 − log z(x). Per il teorema di Cauchy–Lipschitz esiste un’unica soluzione massimale z(x) passante per ogni punto (x0 , z0 ) con z0 > 0. La soluzione costante z(x) = e2 e il teorema di confronto consentono di concludere che z(x) > e2 o z(x) < e2 a seconda che z0 > e2 o z0 < e2 . Se z0 > e2 la soluzione è globalmente definita a destra di x0 , per il criterio (3.4), inoltre z è strettamente decrescente. Il limite per x → +∞, essendo finito, deve valere e2 ; infatti, grazie al teorema di Lagrange applicato in intervalli di lunghezza 1 possiamo trovare xn → +∞ tale che z 0 (xn ) → 0, da cui segue che il limite di z(xn ), e quindi di tutta la funzione z, deve valere e2 . Per studiarne il comportamento a sinistra di x0 usiamo la disuguaglianza log t ≤ t − 1 per ottenere z 0 (x) = 2 − log z(x) ≥ 3 − z(x) . Il teorema di confronto ci dice allora che z(x) ≤ w(x) per ogni x ≤ x0 , dove w(x) è la soluzione del problema di Cauchy w0 = 3 − w, w(x0 ) = z0 . Dato che w è limitata sui limitati, deduciamo per la proprietà (3.4) che la z è definita globalmente anche alla sinistra di x0 . Il fatto che il limite per x → −∞ di z(x) sia +∞ può essere dedotto dalla (stretta) convessità di z: vale infatti z 00 (x) = − z 0 (x) >0. z(x) Analogamente, se z0 < e2 deduciamo che la soluzione massimale è strettamente crescente e concava, definita globalmente a destra di x0 , con z(x) → e2 per x → +∞. Per studiarne il comportamento a sinistra osserviamo che, per concavità, z(x) ≤ z(0) + z 0 (0)(x − x0 ) per ogni x ∈ Imax e, dato che la funzione a destra ha uno zero alla sinistra di x0 (perchè z(0) > 0 e z 0 (0) > 0), deduciamo che Imax = (a, +∞) con a > −∞ e y 0 (a+ ) = +∞. Per esercizio, si ridimostrino le proprietà qualitative della funzione z usando l’espressione Z z(x) 1 du = x − x0 , 2 − log u z0 ottenuta per separazione delle variabili, che definisce implicitamente z(x). In particolare, quando z0 < e2 , vale la formula Z z0 a = x0 − (2 − log u)−1 du . 0 Esempio 2. Consideriamo il problema di Cauchy ( y 0 (x) = y 2 (x) − (arctg x)2 , (3.12) y(1) = 0 x∈R e dimostriamo che la soluzione massimale esiste ed è globale. La funzione f (x, y) = y 2 − (arctg x)2 è di classe C ∞ in R2 , quindi localmente Lipschitziana. Il teorema di Cauchy–Lipschitz ci assicura l’esistenza di una soluzione massimale y : Imax = (a, b) → R con 1 ∈ Imax , di classe C ∞ . Per mostrare che Imax = R basta mostrare, tenendo conto del criterio (3.4), che non può succedere che a un estremo z = a, b di Imax la funzione tenda all’infinito. Mostreremo più precisamente che |y(x)| ≤ π/2. 3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE 221 Osserviamo che la funzione z identicamente nulla risolve z 0 (x) > f (x, z(x)) per x 6= 0, quindi y < 0 in (1, b) e y > 0 in (a, 1) (qui abbiamo applicato la versione “stretta” del teorema di confronto, vedi l’Osservazione 8.6). Posto ora g(x, y) = y 2 − (π/2)2 , abbiamo f > g, confrontando quindi con le soluzioni costanti z(x) = ±π/2 dell’equazione z 0 (x) = g(x, z(x)) otteniamo che y(x) ≤ π/2 in (a, 1) e y(x) ≥ −π/2 in (1, b). Si noti poi che, dato che y 2 (0) > 0 = (arctg 0)2 y 2 (1) = 0 < (arctg 1)2 , deve esistere c ∈ (0, 1) tale che y 0 (c) = y 2 (c) − (arctg c)2 = 0. Si potrebbe poi mostrare, usando la monotonia di f nella variabile x e studiando l’equazione differenziale (3.3) soddisfatta da y 0 , che y(x) è crescente in (0, c) e decrescente in (c, +∞). Analogamente, esiste d < 0 tale che y è decrescente in (−∞, d) e crescente in (d, 0). Per monotonia, devono allora esistere valori asintotici (finiti) `± per t → ±∞; applicando come nell’esempio precedente il teorema di Lagrange in intervalli di lunghezza 1, troviamo successioni (xn ) divergenti a ±∞ tali che y 0 (xn ) tende a 0. Deve allora essere y 2 (xn ) − (arctg xn )2 → 0, da cui deduciamo `+ = −π/2, `− = π/2. Esempio 3. Consideriamo il problema di Cauchy 1 0 y (x) = arctg(y(x)) − , x>0 (3.13) x y( 4 ) = 1 . π La funzione f (x, y) = arctg(y) − 1/x è di classe C ∞ in A = (0, +∞) × R, quindi localmente Lipschitziana. Il teorema di Cauchy–Lipschitz ci assicura l’esistenza di una soluzione massimale y : Imax = (a, b) → R con 4/π ∈ Imax , di classe C ∞ . Dato che y 0 (x) ≤ π/2, otteniamo dalla proprietà (3.4) che y è globalmente definita alla destra di 4/π; per quel che riguarda il comportamento alla sinistra, basta osservare che vale la disuguaglianza π 1 y 0 (x) ≥ − − n per x ∈ [ , +∞) 2 n per ottenere, sempre dalla (3.4), che Imax = (0, +∞). Osserviamo ora che y 0 (4/π) = 0, quindi studiando l’equazione differenziale linearizzata soddisfatta da y 0 otteniamo che y è crescente in (4/π, +∞) e decrescente in (0, 4/π). Integrando la disequazione differenziale y 0 (x) ≤ π/2 − 1/x otteniamo 4 π y(x) ≥ x − 1 + log − log x , 2 π + quindi y(x) → +∞ per x → 0 . Analogamente, integrando la disequazione differenziale y 0 (x) ≥ π/4 − 1/x, valida alla destra di 4/π, otteniamo π 4 y(x) ≥ x + log − log x , 4 π da cui deduciamo che y(x) → +∞ per x → +∞. Mostriamo anche che y è convessa: usando l’equazione linearizzata otteniamo y 00 (x) = y 0 (x) 1 arctg y(x) 1 1 + 2 = − + 2. 2 2 2 1 + y (x) x 1 + y (x) x(1 + y (x)) x Dalla prima uguaglianza ricaviamo subito la convessità per x ≥ 4/π; in (0, 4/π), nella seconda uguaglianza si verifica facilmente che il termine 1/x2 domina il termine 1/(x(1 + y 2 (x)), grazie al fatto che y(x) ≥ 1. 4. CONTRAZIONI IN SPAZI METRICI 222 4. Contrazioni in spazi metrici La dimostrazione del Teorema 8.2 è basata su una proprietà generale di applicazioni contrattive su spazi metrici completi. Sia (X, d) uno spazio metrico. Una funzione T : X −→ X si dice una contrazione di X se è Lipschitziana con costante di Lipschitz λ < 1. Teorema 8.8 (Teorema delle contrazioni). Sia (X, d) uno spazio metrico completo, e sia T una contrazione di X. Esiste allora un unico punto fisso x̄ di T in X, cioè tale che T (x̄) = x̄. Dato un qualsiasi x ∈ X, vale inoltre la stima d(x̄, x) ≤ (4.1) d(x, T (x)) , 1−λ con λ uguale alla costante di Lipschitz di T . Dimostrazione. Preso un punto x = x0 ∈ X, si definisca ricorsivamente xn+1 = T (xn ) . Essendo d(xn , xn+1 ) = d(T (xn−1 ), T (xn )), si verifica per induzione che vale la disuguaglianza d(xn , xn+1 ) ≤ λn d(x0 , x1 ) . Dati allora due interi m < n, si ha d(xm , xn ) ≤ d(xm , xm+1 ) + d(xm+1 , xm+2 ) + · · · + d(xn−1 , xn ) (4.2) ≤ (λm + · · · + λn−1 )d(x0 , x1 ) ∞ X λm m ≤λ λk d(x0 , x1 ) = d(x0 , x1 ) . 1−λ k=0 Essendo λ < 1, questo implica che la successione (xn ) è di Cauchy e dunque che converge a un punto x̄ ∈ X. Essendo T continua, si ha T (x̄) = lim T (xn ) = lim xn+1 = x̄ . n→∞ n→∞ Quindi x̄ è un punto fisso di T , e questo dimostra l’esistenza di un punto fisso. Per dimostrare l’unicità, si supponga che x̄, ȳ siano punti fissi. Allora d(x̄, ȳ) = d T (x̄), T (ȳ) ≤ λd(x̄, ȳ) . Essendo λ < 1, deve essere d(x̄, ȳ) = 0, cioè x̄ = ȳ. Infine la stima (4.1) si ottiene scegliendo m = 0 e passando al limite per n → ∞ nella disuguaglianza (4.2). Una dimostrazione alternativa usa le disuguaglianze d(x̄, x) ≤ d(x̄, T (x)) + d(T (x), x) = d(T (x̄), T (x)) + d(T (x), x) ≤ λd(x̄, x) + d(T (x), x). 5. DIMOSTRAZIONE DEL TEOREMA DI ESISTENZA E UNICITÀ LOCALE 223 5. Dimostrazione del teorema di esistenza e unicità locale Per prima cosa, riconduciamo il problema di Cauchy (3.1) a un’equazione integrale. Lemma 8.9. Siano I, J ⊆ R intervalli. Siano f continua sul rettangolo I ×J, y : I −→ J, e x0 ∈ I. Le due condizioni seguenti sono equivalenti: (i) y è di classe C 1 in I e soddisfa il sistema (3.1); (ii) y è continua in I e soddisfa l’equazione integrale Z x y(x) = y0 + f t, y(t) dt ∀x ∈ I . x0 Dimostrazione. Supponiamo che valga la condizione (i). Per il teorema fondamentale del calcolo integrale, Z x y(x) = y0 + y 0 (t) dt x0 Z x = y0 + f t, y(t) dt . x0 Viceversa, si supponga che valga la condizione (ii). Allora y(x0 ) = y0 . Inoltre, posto g(t) = f t, y(t) , la funzione del calcolo integrale R x g è continua su I. Segue allora 0dal teorema fondamentale che y(x) = y0 + x0 g(t) dt è derivabile in I e che y (x) = g(x) = f x, y(x) , quindi con derivata continua. Possiamo ora passare alla dimostrazione del teorema. Dimostrazione del Teorema 8.2. Sia (x̄, ȳ) ∈ A e siano ā, b̄ > 0 due numeri tali che, posto ā ā b̄ b̄ R2 = [x̄ − , x̄ + ] × [ȳ − , ȳ + ] , 2 2 2 2 sia R1 ⊂ A. Fissiamo ora (x0 , y0 ) ∈ R2 , indichiamo con I un qualsiasi intervallo aperto contenente x0 al suo interno e poniamo R1 = [x̄ − ā, x̄ + ā] × [ȳ − b̄, ȳ + b̄] , b̄ b̄ J = (y0 − , y0 + ) . 2 2 Mostreremo che se ` è abbastanza piccolo allora esiste, tra tutte le funzioni continue da I in J, un’unica soluzione del problema di Cauchy (in forma integrale) tale che y(x0 ) = y0 e inoltre tale funzione è a valori in J. Si ha quindi la tesi con R = I ×J. Imponiamo per prima cosa la condizione ` ≤ ā/2, che garantisce che I ⊆ (x̄ − ā, x̄ + ā), quindi I × J ⊂ R1 . Consideriamo ora lo spazio metrico X = y ∈ C(I) : y(I) ⊆ J , y(x0 ) = y0 , ` = lunghezza(I) , dotato della distanza del sup indotta da C(I), e definiamo una funzione T : X −→ C(I) ponendo, per y ∈ X, T [y] uguale alla funzione Z x T [y](x) = y0 + f t, y(t) dt . x0 Imponiamo ora che T applichi X in sé. La condizione T [y](x0 ) = y0 è ovviamente verificata. Rimane da imporre che, per ogni x ∈ I, si abbia T [y](x) − y0 ≤ b̄ . 2 5. DIMOSTRAZIONE DEL TEOREMA DI ESISTENZA E UNICITÀ LOCALE Ma Z T [y](x) − y0 = x x0 Z f t, y(t) dt ≤ 224 x f t, y(t) dt ≤ ` max f (x, y) . x0 (x,y)∈R1 Posto M = maxR1 |f |, la condizione richiesta è soddisfatta, anche con la disuguaglianza stretta, se (5.1) 2`M < b̄ . Imponiamo ora l’ulteriore condizione che T sia una contrazione di X. Date due funzioni y, z ∈ X, si consideri la distanza tra le loro immagini, d T [y], T [z] = max T [y] (x) − T [z] (x) . x∈I Per x ∈ I, si ha Z Z x x T [y](x) − T [z](x) = f t, y(t) dt − f t, z(t) dt x0 x0 Z x = f t, y(t) dt − f t, z(t) dt x Z x 0 ≤ f t, y(t) dt − f t, z(t) dt x0 Z x y(t) − z(t) dt ≤L x0 ≤ L` d(y, z) , dove L è la costante di Lipschitz di f nella seconda variabile, nel rettangolo R1 . Si ha quindi d T (y), T (z) ≤ L` d(y, z) , e la condizione da imporre è dunque (5.2) L` < 1 . Quindi, se ` > 0 soddisfa entrambe le condizioni (5.1) e (5.2), T è una contrazione di X in sé. D’altra parte, X è chiuso in C(I), che è completo, e dunque è uno spazio metrico completo. Per il Teorema 8.8, T ammette uno e un solo punto fisso in X. Per il Lemma 8.9, questa è dunque l’unica soluzione del problema di Cauchy (3.1) sull’intervallo I a valori tra quelle a valori in J. Si nota poi che y è a valori non solo in J ma in J, avendo scelto la disuguaglianza stretta in (5.1). Abbiamo quindi mostrato la prima parte dell’enunciato. La seconda parte, ovvero il fatto che `−1 può essere scelto in modo da essere limitato localmente in A, segue esaminando le condizioni imposte ` ≤ ā/2 e le disuguaglianze (5.1), (5.2) su `, che consentono di scegliere ` > 0 in maniera uniforme (dato che L e M dipendono da R1 e non da (x0 , y0 )) al variare di tutti i punti (x0 , y0 ) contenuti in R2 . Per dimostrare la parte finale dell’enunciato, relativa all’unicità, basta considerare l’insieme E := {t ∈ I1 ∩ I2 : y1 (t) 6= y2 (t)} . Se fosse non vuoto, sarebbe certamente aperto ed avrebbe complementare non vuoto perché x0 ∈ / E. Se mostriamo che E è anche chiuso otteniamo una contraddizione. Se t ∈ / E abbiamo y1 (t) = y2 (t) e quindi possiamo applicare la proprietà di unicità locale appena dimostrata con x0 = t, y0 = y1 (t) = y2 (t) per ottenere che y1 e y2 devono coincidere in un intorno di t: più precisamente, siano `(x0 , y0 ) e b̄/2 come nella prima parte dell’enunciato e troviamo un piccolo intervallo I = [x0 −δ, x0 +δ] contenuto in I1 ∩I2 tale che 0 < δ ≤ `(x0 , y0 ) e y1 (I) e y2 (I) sono entrambe contenute 6. SISTEMI DI EQUAZIONI DIFFERENZIALI ED EQUAZIONI DI ORDINE SUPERIORE 225 in [y0 − b̄/2, y0 + b̄/2]. Allora l’unicità per soluzioni il cui grafico è contenuto in I ×[y0 − b̄/2, y0 + b̄/2] dà y1 ≡ y2 in I, quindi y1 e y2 coincidono in un intorno di x0 . 6. Sistemi di equazioni differenziali ed equazioni di ordine superiore Un sistema di equazioni differenziali ordinarie del primo ordine in forma normale ha la forma 0 y1 (x) = f1 (x, y1 (x), . . . , yn (x)) y 0 (x) = f (x, y (x), . . . , y (x)) 2 1 n 2 · · · 0 yn (x) = fn (x, y1 (x), . . . , yn (x)) dove le n funzioni f1 , . . . , fn sono definite su uno stesso insieme A ⊆ Rn+1 . In forma compatta, ponendo Y = (y1 , . . . , yn ) , F = (f1 , . . . , fn ) : A −→ Rn , il sistema si scrive nella forma (6.1) Y 0 (x) = F (x, Y (x)) , dove la funzione incognita Y (x) si intende definita su un intervallo I ⊆ R, a valori in Rn , con grafico contenuto in A. Un problema di Cauchy associato al sistema (6.1) è dato da ( Y 0 (x) = F (x, Y (x)) (6.2) Y (x0 ) = Y0 , con (x0 , Y0 ) ∈ A. Enunciato e dimostrazione del Teorema 8.2 e il contenuto del Paragrafo 5 si estendono ai sistemi Rx con le ovvie modifiche notazionali e intendendo, nel Lemma 8.9, l’integrale definito x0 F t, Y (t) dt Rx come l’n-upla degli integrali x0 fi t, Y (t) dt, i = 1, . . . , n. Teorema 8.10 (Teorema di esistenza e unicità locale per sistemi). Sia A ⊆ Rn+1 aperto e sia F : A → R continua, localmente Lipschitziana nella variabile Y ∈ Rn . Dato un punto (x0 , Y0 ) ∈ A, esiste un plurirettangolo aperto R = I × Q ⊂ A contenente (x0 , Y0 ) ed esiste una funzione Y : I → Q di classe C 1 che risolve il problema di Cauchy (6.2), ed è l’unica soluzione tra quelle da I in Q. È inoltre possibile scegliere `(x0 , Y0 ) > 0 e b̄(x0 , Y0 ) > 0 in modo che: (a) per ogni plurirettangolo R = (x0 − `0 /2, x0 + `0 /2) × Qb̄ (Y0 ) (ove Qb̄ (Y0 ) ⊆ Rn indica il cubo aperto di lato b̄ centrato in Y0 ) con `0 ∈ (0, `] vale la tesi di esistenza e unicità; (b) `−1 (x0 , y0 ) e b̄−1 (x0 , y0 ) sono localmente limitati in A. Se inoltre Y1 : I1 → Rn e Y2 : I2 → Rn sono soluzioni del problema di Cauchy (6.2) (in particolare x0 ∈ I1 ∩ I2 ), necessariamente Y1 ≡ Y2 in I1 ∩ I2 . Si estendono a sistemi il teorema di esistenza della soluzione massimale (Teorema 8.3), il fatto che i grafici delle soluzioni massimali sono una partizione di A e il comportamento delle soluzioni massimali vicino a uno degli estremi dell’intervallo massimale (3.4). Non si estendono invece a sistemi, o almeno non si estendono facilmente, i risultati che dipendono dalla struttura di R come insieme ordinato, come il teorema di confronto. Tuttavia è a volte possibile associare quantità scalari alle soluzioni di sistemi, per poter applicare tecniche di confronto. Vediamo come questa idea funziona per l’estensione del criterio di esistenza globale (Proposizione 8.7) ai sistemi. 6. SISTEMI DI EQUAZIONI DIFFERENZIALI ED EQUAZIONI DI ORDINE SUPERIORE 226 Proposizione 8.11 (Criterio di esistenza globale per sistemi). Sia I ⊆ R un intervallo aperto, K ∈ [0, +∞) e sia F : I × Rn → Rn continua e localmente Lipschitziana nella seconda variabile, tale che (6.3) |F (x, Y )| ≤ K(1 + |Y |) ∀(x, Y ) ∈ I × Rn . Allora per ogni x0 ∈ I e Y0 ∈ R, la soluzione massimale del problema di Cauchy (6.2) è definita su tutto l’insieme I. Dimostrazione. Sia Y : Imax → R la soluzione massimale tale che Y (x0 ) = Y0 e, come nella dimostrazione dell’analogo risultato per funzioni scalari, per studiare la crescita di Y consideriamo p la funzione w(x) = 1 + |Y (x)|2 . Abbiamo allora hY (x), Y 0 (x)i p ≤ |Y 0 (x)| = |f (x, Y (x))| 1 + |Y 2 (x)| ≤ K(1 + |Y (x)|) ≤ 2Kw(x) |w0 (x)| = per ogni x ∈ I. La formula risolutiva (2.5) delle equazioni lineari e il criterio di confronto ci dicono allora che |Y (x)| ≤ w(x) ≤ w(x0 )e2K|x−x0 | ∀x ∈ Imax . Se fosse z = sup Imax < sup I, vicino a z la funzione |Y | dovrebbe essere illimitata, per la (3.4). Discorso analogo se inf Imax > inf I. Si consideri ora un’equazione di ordine n, (6.4) y (n) (x) = f x, y(x), y 0 (x), . . . , y (n−1) (x) , con f definita su un insieme A ⊆ Rn+1 e a valori reali. Lemma 8.12. L’equazione (6.4) è equivalente al sistema 0 y1 (x) = y2 (x) · · · 0 yn−1 (x) = yn (x) 0 yn (x) = f (x, y1 (x), . . . , yn (x)) nel senso che (i) se y(x) è soluzione dell’equazione (6.4), allora Y (x) = y(x), y 0 (x), . . . , y (n−1) (x) è soluzione del sistema (6.1); (ii) se Y (x) = y1 (x), . . . , yn (x) è soluzione del sistema (6.1), allora y1 (x) è soluzione dell’equazione (6.4). Tralasciamo la dimostrazione, del tutto ovvia. Da questo segue in modo naturale che i problemi di Cauchy per l’equazione (6.4) vanno posti nella forma seguente: y (n) (x) = f (x, y(x), y 0 (x), . . . , y (n−1) (x)) y(x0 ) = y0 y 0 (x0 ) = y00 (6.5) · · · y (n−1) (x ) = y (n−1) , 0 0 6. SISTEMI DI EQUAZIONI DIFFERENZIALI ED EQUAZIONI DI ORDINE SUPERIORE 227 (n−1) con (x0 , y0 , y00 , . . . , y0 ) ∈ A, ossia assegnando, per x = x0 , i valori della funzione incognita e delle sue derivate fino all’ordine n − 1. Da quanto detto finora segue facilmente il seguente enunciato. Teorema 8.13. Sia f (x, y1 , . . . , yn ) una funzione definita su un aperto A ⊆ Rn+1 a valori reali, continua e localmente Lipschitziana nelle variabili y1 , . . . , yn . (0) (1) (n−1) (i) Dato un punto (x0 , y0 , y0 , . . . , y0 ) ∈ A, esistono ` > 0 e b̄ > 0 tali che il problema di Cauchy (6.5) ammette una soluzione y definita in [x0 − `/2, x0 + `/2], a valori in (y0 − b̄, y0 + b̄), unica tra le funzioni z di classe C n ([x0 − `/2, x0 + `/2]) che soddisfano la condizione max x∈[x0 −`/2,x0 +`/2] (i) |z (i) (x) − y0 | ≤ b̄ 0 ≤ i ≤ (n − 1) . (ii) A è l’unione disgiunta dei grafici delle funzioni Y (x) = y(x), y 0 (x), . . . , y (n−1) (x) , al variare di y(x) tra le soluzioni massimali dell’equazione (6.4). In modo analogo si impostano e si discutono i problemi di Cauchy relativi a sistemi di equazioni differenziali di ordine superiore. In Fisica si incontrano frequentemente sistemi del tipo 00 0 0 0 mx = f1 (t, x, y, z, x , y , z ) my 00 = f2 (t, x, y, z, x0 , y 0 , z 0 ) 00 mz = f3 (t, x, y, z, x0 , y 0 , z 0 ) in cui la variabile indipendente t rappresenta il tempo, la funzione incognita x(t), y(t), z(t) la posizione di un punto materiale di massa m all’istante t, e F = (f1 , f2 , f3 ) la risultante delle forze agenti su un punto che all’istante t si trovi nella posizione (x, y, z) con velocità (x0 , y 0 , z 0 ). Tali forze possono dipendere dalla posizione (campi di forze), dalla velocità (per es. attrito), e possono essere variabili nel tempo. Il sistema rappresenta la legge ma = F, dove l’accelerazione è a = (x00 , y 00 , z 00 ). Come visto sopra per una singola equazione, questo sistema è equivalente a un sistema del primo ordine di 6 equazioni in 6 incognite, x0 = px /m y 0 = py /m z 0 = p /m z 0 px = f1 (t, x, y, z, mpx , mpy , mpz ) p0y = f2 (t, x, y, z, mpx , mpy , mpz ) 0 pz = f3 (t, x, y, z, mpx , mpy , mpz ) dove px , py , pz sono le tre componenti del momento del punto in movimento. Un problema di Cauchy consiste dunque nell’assegnazione, a un dato istante t0 , della posizione (x0 , y0 , z0 ) e del momento (px,0 , py,0 , pz,0 ). Il punto (ii) del Teorema 8.13 si applica ai grafici (in R7 ) delle funzioni t 7−→ x(t), y(t), z(t), px (t), py (t), pz (t) , dove x(t), y(t), z(t) è una soluzione massimale. Lo spazio 6-dimensionale con coordinate (x, y, z, px , py , pz ) è chiamato spazio delle fasi. 7. SISTEMI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI E MATRICE ESPONENZIALE 228 7. Sistemi differenziali lineari a coefficienti costanti e matrice esponenziale Un sistema differenziale lineare omogeneo a coefficienti costanti (del primo ordine) ha la forma 0 y1 a11 · · · a1n y1 y 0 a21 · · · a2n y2 2 (7.1) Y 0 = .. = .. .. .. = AY , .. . . . . . yn0 an1 · · · ann yn dove A è una matrice n×n (che possiamo anche supporre complessa, ammettendo soluzioni a valori complessi del sistema). Il caso n = 1, in cui il sistema si riduce all’equazione y 0 = ay, ha come soluzioni le funzioni y(x) = ceax (si veda il Paragrafo 2). Per n generico le soluzioni assumono una forma analoga introducendo un apposita nozione di matrice esponenziale. Adotteremo nello spazio delle matrici la norma Euclidea5 n X 1 2 . kAk = |aij |2 i, j=1 Premettiamo la seguente proprietà della norma euclidea. Lemma 8.14. Siano A, B matrici n × n. Allora kABk ≤ kAkkBk . Dimostrazione. Indichiamo con Ai = (ai1 , . . . , ain ) la i–esima riga della matricePA e con 2 2 B j = t(b 1j , . . . , bnj ) la j–esima colonna della matrice B. Vale ovviamente kAk = i |Ai | e P kBk2 = j |B j |2 . Allora se C = (cij ) = AB, si ha, per la disuguaglianza di Cauchy–Schwarz, |cij | = |Ai B j | ≤ |Ai ||B j | . Quindi kCk2 = ≤ = n X |cij |2 i, j=1 n X |Ai |2 |B j |2 i, j=1 n X |Ai |2 n X i=1 |B j |2 j=1 2 2 = kAk kBk . Proposizione 8.15 (Serie esponenziale e esponenziale di matrici). Sia A una matrice n × n, reale o complessa. La serie esponenziale nello spazio delle matrici n × n (7.2) ∞ X Ak k=0 k! 5Per matrici si chiama anche norma di Hilbert–Schmidt. 7. SISTEMI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI E MATRICE ESPONENZIALE 229 (dove si è posto 0! = 1 e A0 = I, I matrice identità n × n) è convergente. Si pone ∞ X Ak eA = k=0 k! , che viene detta matrice esponenziale di A. Vale inoltre e0 = I e keA k ≤ ekAk . 2 Si noti che, essendo lo spazio delle matrici n × n isomorfo a Rn , la convergenza si può intendere componente per componente, o equivalentemente nella norma euclidea. Dimostrazione della Proposizione 8.15. Applicando il Teorema 6.16 del Capitolo 6, studiamo la convergenza totale della serie (7.2). Per il Lemma 8.14 si ha ∞ ∞ X Ak X kAkk ≤ = ekAk < +∞ . k! k! k=0 k=0 Per ogni x ∈ R, la funzione expA (x) = exA è dunque ben definita da R nello spazio delle matrici n × n e k expA (x)k ≤ e|x|kAk . Proposizione 8.16 (Proprietà della funzione esponenziale). Valgono le seguenti proprietà: (i) la funzione expA è analitica su R (cioè ogni sua componente è analitica); (ii) vale l’identità d xA e = AexA = exA A ; dx (iii) Per ogni x, x0 ∈ R vale l’identità 0 0 0 e(x+x )A = ex A exA = exA ex A . In particolare (exA )−1 = e−xA , quindi exA è non singolare per ogni x ∈ R. Dimostrazione. Indichiamo con (Ak )ij il termine di posto (i, j) nella matrice Ak . Allora la componente (exA )ij di exA è ∞ X (Ak )ij k (exA )ij = x . k! k=0 Essendo questa una serie di potenze convergente per ogni x ∈ R, il suo raggio di convergenza è infinito e, per il Teorema 6.30 del Capitolo 6, è analitica su R. È dunque possibile derivare tale serie termine a termine, ottenendo che ∞ ∞ k=1 k=0 X (Ak )ij X (Ak+1 )ij d xA (e )ij = xk−1 = xk . dx (k − 1)! k! Ricomponendo la matrice, si ha ∞ d xA X Ak+1 k e = x . dx k! k=0 Da ogni termine si può raccogliere A a fattore, sia a destra che a sinistra, e il punto (ii) è dimostrato. 7. SISTEMI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI E MATRICE ESPONENZIALE 230 Il punto (iii) si può ottenere svolgendo il prodotto delle due serie esponenziali di xA e x0 A (possibile per la loro convergenza assoluta) e ricomponendo la somma raggruppando i termini dello stesso 0 grado in A. In alternativa, si può osservare che, fissato x0 , la funzione di x e(x+x )A e−xA ha derivata6 d (x+x0 )A −xA 0 0 (e e ) = e(x+x )A Ae−xA − e(x+x )A Ae−xA = 0 , dx 0 per il punto (ii). Quindi e(x+x )A e−xA è costante in x, e dunque uguale al suo valore in x = 0. Cioè 0 0 e(x+x )A e−xA = ex A . (7.3) Per x0 = 0 questo implica che e−xA = (exA )−1 , e da ciò segue la prima uguaglianza, moltiplicando ambo i membri dell’identità (7.3) a destra per exA . Scambiando x con x0 si ha la seconda. Osservazione 8.17. È anche possibile dimostrare la formula det eA = etr A . Una dimostrazione algebrica si può ottenere usando la forma canonica di Jordan (si veda la sezione successiva). Una dimostrazione di tipo differenziale è la seguente. Per prima cosa osserviamo che det(exA ) è sempre non nulla e positiva per x = 0, quindi sempre positiva, per continuità. Passando ai logaritmi basta mostrare che la funzione scalare φ(x) := log det exA soddisfa le condizioni φ0 ≡ tr A, φ(0) = 0, visto che queste implicano che det exA = extr A . La seconda condizione è ovviemente soddisfatta; per la prima, basta notare che per ogni x ∈ R dall’identità e(x+h)A = exA ehA e dallo sviluppo di Taylor det (I + B) = 1 + tr B + o(kBk)7 otteniamo φ(x + h) = φ(x) + φ(h) = φ(x) + log det ehA = φ(x) + log det(I + hA + o(h)) = φ(x) + log(1 + htr A + o(h)) = φ(x) + htr A + o(h) . Possiamo allora descrivere le soluzioni del sistema (7.1). Teorema 8.18. Le soluzioni massimali del sistema (7.1) sono definite su tutto R e sono tutte e sole le funzioni Y (x) = exA v , al variare di v ∈ Rn . In particolare, tali soluzioni formano uno spazio vettoriale di dimensione n nello spazio vettoriale reale C ∞ (R; Rn ) e le n colonne della matrice exA ne formano una base. Il problema di Cauchy ( Y 0 (x) = AY (x) (7.4) Y (x0 ) = v ha come unica soluzione Y (x) = e(x−x0 )A v. 6Si dimostri per esercizio che anche la derivazione di funzioni a valori matrici rispetta la regola di Leibniz (f g)0 = f 0 g + f g 0 . 7Per dimostrarlo, osserviamo che det (I + B) = X (−1)σ (δ1σ(1) + b1σ(1) ) · · · (δnσ(n) + bnσ(n) ) . σ In questa somma, tutte le permutazioni σ tranne quella identica danno un contributo O(kBk2 ) = o(kBk); sviluppando poi il prodotto corrispondente alla permutazione identica si ottiene che vale 1 + tr B + O(kBk2 ). 8. *CALCOLO DELLA MATRICE ESPONENZIALE 231 Dimostrazione. La funzione Y (x) = e(x−x0 )A v è soluzione del problema (7.4). D’altra parte la funzione F (x, Y ) = AY è continua e Lipschitziana in Y su tutto Rn+1 . Quindi tale soluzione è unica. Il resto segue facilmente grazie al fatto che la matrice exA è invertibile per ogni x ∈ R. In effetti, al variare di v1 , . . . , vn in una base di Rn , i vettori exA v1 , . . . , exA vn sono indipendenti per ciascun valore di x, quindi a maggior ragione lo sono le funzioni corrispondenti.8 Ripetendo quanto visto nel Paragrafo 7, il sistema differenziale lineare non omogeneo a coefficienti costanti Y 0 (x) = AY (x) + b(x) , dove b(x) è una funzione continua su un intervallo aperto I a valori in Rn è risolto da una formula analoga alla (2.5). La soluzione massimale passante per il punto (x0 , Y0 ) è data da Z x Z x Y (x) = exA e−tA b(t) dt + v = e(x−t)A b(t) dt + exA v con v = e−x0 A Y0 . x0 x0 8. *Calcolo della matrice esponenziale Il calcolo esplicito delle matrici esponenziali exA a partire da una data matrice A è possibile, in linea di principio, a condizione di averne determinato la cosiddetta forma canonica di Jordan. Siccome l’espressione della forma canonica di Jordan è più semplice in ambito complesso, considereremo il caso più generale delle matrici a coefficienti complessi. Sia dunque P una matrice complessa invertibile tale che A0 = P AP −1 sia nella forma a blocchi B1 0 · · · 0 0 B2 · · · 0 0 (8.1) A = .. .. .. .. . . . . 0 0 ··· Br dove i blocchi Bj , 1 ≤ j ≤ r, sono sottomatrici quadrate di dimensione mj × mj con mj ≥ 1 (ovviamente con m1 + · · · + mr = n) della forma λj 1 0 · · · 0 0 λj 1 · · · 0 . .. . .. (8.2) Bj = 0 0 λj . . . . . .. .. .. .. 1 0 0 0 · · · λj I termini λj che appaiono sulle diagonali dei blocchi non sono necessariamente distinti tra loro e sono gli autovalori di A. La molteplicità geometrica di un autovalore λ (cioè la dimensione del relativo autospazio) coincide con il numero di blocchi in cui λj = λ. Invece la somma delle dimensioni mj dei blocchi in cui λj = λ è uguale alla molteplicità algebrica di λ (cioè come radice del polinomio caratteristico). Indichiamo nel seguito con Ik la matrice identità k × k. Il calcolo delle matrici esponenziali è basato sulle seguenti proprietà, che si dimostrano subito per passaggio al limite in analoghe identità che coinvolgono le ridotte parziali della serie che definisce exA : 0 • dall’uguaglianza A = P −1 A0 P segue che exA = P −1 exA P ; 8In generale l’indipendenza “x per x” è ben più forte dell’indipendenza in C ∞ (R; Rn ); si mostri che, per soluzioni di sistemi lineari, i due fatti sono equivalenti. 8. *CALCOLO DELLA MATRICE ESPONENZIALE • con riferimento alla matrice (8.1), xB e 1 0 0 exA = . .. 0 exB2 .. . ··· ··· .. . 0 0 .. . 0 ··· exBr 0 232 • se due matrici A1 , A2 commutano, allora ex(A1 +A2 ) = exA1 exA2 = exA2 exA1 . Il calcolo di exA si riduce quindi al calcolo di un singolo blocco di Jordan. Inoltre, se mj = 1 allora Bj = λj I1 , se mj > 1 Bj = λj Imj + Nj , dove 0 0 Nj = 0 . .. 0 ··· ··· .. . 0 0 .. . . . . . . . 0 0 ··· 1 0 0 1 0 0 .. . . 1 0 Allora exBj = exλj Imj exNj = eλj x exNj . Il calcolo di exNj è molto semplice, perché le potenze Nj2 , Nj3 ecc. hanno una forma simile, con m un’unica diagonale di 1 spostata sempre più in alto. In particolare, Nj j = 0, per cui x2 2 xmj −1 m −1 Nj + · · · + Nj j 2 (mj − 1)! xmj −1 x2 1 x 2 · · · (mj −1)! 0 1 x · · · xmj −2 (mj −2)! .. = 0 0 1 . . . . . . . . .. ... .. .. x 0 0 0 ··· 1 exNj = I + xNj + In definitiva, exBj = exλj I1 se mj = 1 e 2 eλj x xeλj x x2 eλj x · · · 0 eλj x xeλj x · · · .. (8.3) exBj = 0 . 0 e λj x . . . . .. .. .. .. 0 0 0 ··· xmj −1 λj x (mj −1)! e xmj −2 λj x e (mj −2)! .. . xeλj x e λj x se mj > 1 . 9. *EQUAZIONI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI DI ORDINE SUPERIORE 233 9. *Equazioni differenziali lineari a coefficienti costanti di ordine superiore Consideriamo l’equazione differenziale lineare omogenea di ordine n (9.1) y (n) = a1 y (n−1) + a2 y (n−2) + · · · + an−1 y 0 + an y . Essa può essere ricondotta, in base al Lemma 8.12, al sistema 0 1 0 ··· 0 0 0 1 ··· 0 .. . . . .. .. .. (9.2) A= . . .. 0 0 0 ··· 0 an an−1 an−2 · · · a2 del primo ordine Y 0 = AY , con 0 0 .. . . 1 a1 Dal Teorema 7.4 segue il seguente enunciato. Corollario 8.19. L’integrale generale dell’equazione (9.1) è uno spazio vettoriale di dimensione n in C ∞ (R). Per determinare una base di tale spazio, si può, sempre in base al Lemma 8.12 e al Teorema 7.4, calcolare la matrice exA ed estrarne le n componenti della prima riga. Questo richiede tuttavia il calcolo della matrice esponenziale, che si può evitare procedendo in modo diverso. Sullo spazio vettoriale C ∞ (R) consideriamo l’operatore di derivazione D, che applica una funzione f nella sua derivata f 0 . L’operatore D può essere iterato un numero arbitrario di volte, di modo che Dk f = f (k) , per ogni k ∈ N (si intende che D0 è l’applicazione identica). Possiamo anche considerare combinazioni lineari degli operatori Dk , ossia polinomi nell’operatore D. Con questo formalismo, l’equazione (9.1) assume la forma P (D)y = 0 , dove (9.3) P (λ) = λn − a1 λn−1 − a2 λn−2 − · · · − an−1 λ − an , si chiama il polinomio caratteristico dell’equazione (9.1). La normale algebra dei polinomi si applica ai polinomi in D. Precisamente, vale l’identità P (D) ◦ Q(D) = (P Q)D , e dunque vale la proprietà commutativa P (D) ◦ Q(D) = Q(D) ◦ P (D) . Indichiamo allora con λ1 , λ2 , . . . , λr le soluzioni complesse distinte del polinomio (9.3), e con m1 , m2 , . . . , mr le rispettive molteplicità. Allora P (λ) = (λ − λ1 )m1 (λ − λ2 )m2 · · · (λ − λr )mr , e dunque (9.4) P (D) = (D − λ1 )m1 (D − λ2 )m2 · · · (D − λr )mr . Lemma 8.20. Per ogni j = 1, . . . , r, le soluzioni dell’equazione differenziale (D − λj )mj y = 0 sono anche soluzioni dell’equazione (9.1). 9. *EQUAZIONI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI DI ORDINE SUPERIORE 234 Dimostrazione. Essendo possibile riordinare a piacere i fattori nella (9.4), possiamo supporre che j = r. La conclusione è dunque ovvia. Lemma 8.21. Per ogni λ ∈ R le soluzioni dell’equazione differenziale (D − λ)m y = 0 sono tutte e sole le funzioni p(x)eλx , dove p è un polinomio di grado strettamente minore di m. Dimostrazione. Si ponga y(x) = eλx z(x). Allora (D − λ)y(x) = eλx z 0 (x) + λeλx z(x) − λeλx z(x) = eλx z 0 (x) . Induttivamente si ottiene che (D − λ)k y(x) = eλx z (k) (x) per ogni intero k. Quindi l’equazione differenziale (D − λ)m y = 0 si riduce a z (m) = 0, le cui soluzioni sono per l’appunto i polinomi di grado strettamente minore di m. Si ottengono in questo modo le seguenti n soluzioni dell’equazione (9.1): (9.5) eλ1 x xeλ1 x eλ2 x xeλ2 x ... eλr x xeλr x ... ... ... ... xm1 −1 eλ1 x xm2 −1 eλ2 x . ... xmr −1 eλr x Se dimostriamo che esse sono linearmente indipendenti, possiamo concludere che l’integrale generale dell’equazione (9.1) è dato dalle loro combinazioni lineari. La dimostrazione che proponiamo si basa sull’uso di derivazioni successive; un’altra dimostrazione, che fa uso del collegamento con i sistemi del I ordine e la decomposizione di Jordan, è descritta nell’Osservazione 8.24. Proposizione 8.22. Le n funzioni in (9.5) sono linearmente indipendenti in C ∞ (R). Dimostrazione. Siano ci,j , 1 ≤ i ≤ r, 0 ≤ j ≤ mj − 1 coefficienti complessi tali che r m i −1 X X ci,j xj eλi x = 0 ∀x ∈ R . i=1 j=1 Dobbiamo mostrare che tutti i ci,j si annullano. Dimostrare questo equivale a verificare che eλi x sono indipendenti se assumiamo come spazio dei coefficienti quello dei polinomi, i.e. se Fi sono polinomi tali che (9.6) r X Fi (x)eµi x ≡ 0 , i=1 con i µi ∈ C tutti distinti, allora Fi (x) ≡ 0 per 1 ≤ i ≤ r (e quindi, per il principio di identità del polinomi, i loro coefficienti sono tutti nulli). Basterà allora applicare questo risultato ai polinomi Fi (x) = m i −1 X ci,j xj eλi x j=1 per ottenere l’annullamento di tutti i ci,j . Premettiamo l’osservazione che, per un generico polinomio P , (P (x)eµx )0 = Q(x)eµx , con Q(x) = µP (x)+P 0 (x), quindi se µ 6= 0 il polinomio Q ha grado uguale a quello di P . Useremo in particolare il fatto che Q è nullo se e solo se P è nullo. 9. *EQUAZIONI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI DI ORDINE SUPERIORE 235 Ragioniamo ora per induzione su r. Il caso r = 1 è banale. Per fare il passaggio induttivo scriviamo l’ipotesi nella forma r−1 X Fi (x)e(λi −λr )x ≡ −Fr (x) i=1 e deriviamo kr + 1 volte, con kr pari al grado del polinomio Fr , per ottenere r−1 X (9.7) Qi (x)e(λi −λr )x ≡ 0 i=1 per opportuni polinomi Qi , 1 ≤ i ≤ r − 1, nulli se e solo se i polinomi Fi sono nulli (perché µi = λi − λr 6= 0 per 1 ≤ i ≤ r − 1). Allora, essendo i µi , 1 ≤ i ≤ r − 1, tutti distinti, per ipotesi induttiva dall’identità (9.7) ricaviamo che tutti i polinomi Qi , quindi anche tutti i Fi , sono nulli per 1 ≤ i ≤ r − 1. Inserendo questa informazione nell’equazione (9.6) otteniamo che Fr ≡ 0. È anche utile osservare l’esistenza di un legame stretto tra il polinomio caratteristico nella (9.3) e il polinomio caratteristico della matrice corrispondente, quando scriviamo l’equazione di ordine n come sistema del I ordine. Lemma 8.23. Il polinomio caratteristico Q(λ) = det(A − λI) della matrice A definita nella (9.2) è uguale a (−1)n P , dove P è il polinomio nella formula (9.3). Dimostrazione. Si consideri −λ 1 0 0 −λ 1 .. . .. .. A − λI = . . 0 0 0 an an−1 an−2 ··· ··· .. . ··· ··· 0 0 .. . 0 0 .. . −λ 1 a2 a1 − λ . Se n = 2, Q(λ) = −λ(a1 − λ) − a2 = λ2 − a1 λ − a2 = P (λ) . Supponendo la tesi vera per n − 1, chiamiamo A11 la matrice (n − 1) × (n − 1) ottenuta eliminando la prima riga e la prima colonna di A. Allora Q(λ) = −λ det(A11 − λI) + (−1)n+1 an , (9.8) e, per ipotesi induttiva, (9.9) det(A11 − λI) = (−1)n−1 (λn−1 − a1 λn−2 − · · · − an−2 λ − an−1 ) . La conclusione è dunque immediata, inserendo l’espressione a destra della (9.9) nella (9.8). Osservazione 8.24 (Dimostrazione alternativa della Proposizione 8.22). In base alla formula (8.3), la matrice exA = P −1 A0 P può contenere nella prima riga solo combinazioni lineari delle funzioni (9.5)9, e dunque ogni soluzione è combinazione lineare di queste. Per il Corollario 8.19, le funzioni (9.5) formano una base dell’integrale generale. 9Anzi, la presenza di xmj −1 eλj x tra le soluzioni (9.5) indica che, necessariamente, la forma canonica di Jordan di A contiene un unico blocco, di dimensione mj × mj , con autovalore λj . 10. ESERCIZI 236 10. Esercizi Esercizio 8.1. Sia I un intervallo chiuso e limitato e sia f : I → I una funzione continua. Si dimostri che f ha almeno un punto fisso. La conclusione vale anche per intervalli non limitati o non chiusi? Esercizio 8.2. Data f : R → R Lipschitziana di costante di Lipschitz minore di 1. Si provi che f ha un punto fisso. Esercizio 8.3. Si costruisca una applicazione 1–Lipschitziana di uno spazio metrico compatto in sé che non ha punti fissi. Esercizio 8.4. Si mostri che esiste una funzione continua f : R → R tale che per ogni x, y ∈ R, con x 6= y, si ha |f (x) − f (y)| < |x − y| ma f non ha punti fissi. Esercizio 8.5. F Sia (K, d) uno spazio metrico compatto e sia f : K → K una funzione tale che per ogni x, y ∈ K si ha d(f (x), f (y)) < d(x, y) . Si mostri che f ammette un unico punto fisso x e che per ogni x ∈ K la successione per ricorrenza delle iterate, xn+1 = f (xn ) con x0 = x, converge a x. La mappa f è necessariamente una contrazione? Esercizio 8.6. F Si mostri che esiste una funzione f da uno spazio metrico completo (X, d) in sé tale che per ogni x, y ∈ R si ha 1 d f (x), f (y) ≤ [d(x, y)]α , 2 con α < 1, ma f non ha punti fissi. Si provi però che tale controesempio non si può esibire se lo spazio metrico è R, cioè una tale funzione f : R → R ha almeno un punto fisso (vale anche in Rn ma la dimostrazione richiede strumenti più complessi). Esercizio 8.7. Sia f una funzione continua da una palla centrata nell’origine di R2 in R. Si mostri che l’equazione f (x) = f (−x) ha infinite soluzioni. Esercizio 8.8. Si mostri che non esistono funzioni continue f : R → R tali che f (f (x)) = −x per ogni x ∈ R. Esistono funzioni continue f : R → R tali che f (f (x)) = x diverse da f (x) = ±x? E dall’intervallo [0, 1] in sé? Esercizio 8.9. F Sia f : [0, 1] → [0, 1] una funzione continua tale che per ogni x ∈ [0, 1] si ha f (f (. . . (x) . . . )) = x (un numero dispari di volte), allora vale f (x) = x? 10. ESERCIZI 237 Esercizio 8.10. F Siano f, g : [0, 1] → [0, 1] due funzioni continue tali che f (g(x)) = g(f (x)) per ogni x ∈ [0, 1]. Si provi che allora esiste y ∈ [0, 1] tale che f (y) = g(y). Esercizio 8.11. Sia f : [a, b] → [a, b] una funzione crescente e sia A = {x ∈ [a, b] : f (x) ≥ x}. Si dimostri che S = sup A è un punto fisso per f . Esercizio 8.12. Sia f continua da R in R tale che esista la funzione inversa f −1 e sia f = f −1 . Si mostri che esiste almeno un punto fisso per f (cioè una soluzione dell’equazione f (x) = x). Se inoltre f è crescente, allora tutti i punti sono fissi per f , cioè f è la funzione identità. Esercizio 8.13. Sia f ∈ C([a, b]), derivabile in (a, b) con f (a) = 0 ed esista C > 0 tale che |f 0 (x)| ≤ C|f (x)| per ogni x ∈ (a, b) . Si mostri che f ≡ 0. Esercizio 8.14 (Lemma di Gronwall “integrale”). Siano f, u ∈ C([a, b]) con u ≥ 0, si provi che se vale Z x f (x) ≤ A + f (t)u(t) dt , a per una costante non negativa A ∈ R, allora si ha f (x) ≤ Ae Rx a u(t) dt . Si mostri che questo risultato implica il Lemma di Gronwall “differenziale”. Cosa si può concludere se invece di essere costante, A è una funzione continua A(x)? Esercizio 8.15. Si dimostri con metodi elementari che ex è l’unica funzione u : R → R derivabile in ogni punto tale che u0 = u, u(0) = 1 . Esercizio 8.16. Supponendo di non conoscere le proprietà delle funzioni seno e coseno, si provi che l’unica funzione u ∈ C 2 (R) che soddisfa u00 + u = 0, u(0) = 0, u0 (0) = 1 , verifica la relazione u0 2 + u2 = 1, è periodica e che per u e u0 valgono le formule di addizione del seno e coseno. Esercizio 8.17. Sia u : [0, 1] → R una funzione C ∞ tale che 00 u (t) = u7 (t) per ogni t ∈ (0, 1), u(0) = u(1) = 0 . Si provi che allora u = 0. Esercizio 8.18. 00 Sia f : [0, 1] → R una funzione C 2 tale che f (0) = f (1) = 0 e f 0 (x) = f (x)f (x) per ogni x ∈ [0, 1]. Si provi che la funzione f è identicamente nulla. 10. ESERCIZI 238 Esercizio 8.19. Si discutano le proprietà delle funzioni y = y(x) con y(0) = a, definite in un intorno dell’origine, tali che y 0 ≥ y 2 , al variare di a ∈ R. Si faccia lo stesso per le funzioni che soddisfano y 0 ≤ y 2 . Esercizio 8.20. Una equazione differenziale ordinaria in forma normale y (n) = f (x, y, y 0 , . . . , y n−1 ) si dice autonoma se la funzione f non dipende dalla variabile x. Si mostri che se y = y(x) è una soluzione, anche z = z(x) = y(x + c) è una soluzione, per ogni c ∈ R (invarianza per traslazione). Nel caso speciale y 00 = f (y), se la funzione F è una primitiva della funzione f , si mostri che per ogni soluzione, la quantità |y 0 |2 /2 − F (y) è costante. Nel caso speciale y 0 = f (y) con f ∈ C 1 (R), se f (a) = 0 si diano condizioni su f tali che per ogni soluzione y = y(x) definita su un intervallo illimitato a destra di R si abbia limx→+∞ y(x) = a. Esercizio 8.21. F Si provi che se la funzione continua f : I × R → R è limitata e localmente Lipschitziana nella seconda variabile oppure non limitata ma uniformemente Lipschitziana nella seconda variabile, il problema di Cauchy 0 y = f (x, y) y(x0 ) = y0 , ha esistenza globale nell’intervallo I per ogni dato iniziale y0 . Si discuta l’esistenza globale nel caso di f : R2 → R tale che valga, per ogni x, y, y 0 , |f (x, y) − f (x, y 0 )| ≤ h(x)|y − y 0 | dove h : R → R è una funzione continua, non negativa. Esercizio 8.22. F Sullo spazio delle funzioni continue y : [x0 , a] → R definiamo la norma kykC,L = sup e−CL(x−x0 ) |y(x)| . x∈[x0 ,a] Si mostri che C([x0 , a]) è uno spazio di Banach con questa norma. Sia f : [x0 , a] × R → R continua e uniformemente Lipschitziana nella seconda variabile con costante L. Si mostri che scegliendo una costante C abbastanza grande, l’operatore T da C([x0 , a]) in sé definito da Z x T (y)(x) = y0 + f (t, y(t)) dt , x0 per ogni y ∈ C([x0 , a]), è una contrazione se si considera su C([x0 , a]) la norma k · kC,L . Di conseguenza, esiste una soluzione globale del problema di Cauchy 0 y = f (x, y) y(x0 ) = y0 , in tutto l’intervallo [x0 , a]. Si provi ad estendere questo argomento al caso di intervalli illimitati. Esercizio 8.23 (Dipendenza continua dai dati). F Sia f : R2 → R una funzione globalmente Lipschitziana e limitata e siano x0 , y0 , x ∈ R, definiamo F (f, x0 , y0 , x) ∈ R come segue: sia y : R → R la soluzione (globalmente definita) del problema di Cauchy 0 y = f (x, y) y(x0 ) = y0 , 10. ESERCIZI 239 e poniamo F (f, x0 , y0 , x) = y(x). È quindi definita una funzione F : Lip(R2 ) × R × R × R → R, dove Lip(R2 ) è lo spazio (di Banach) delle funzioni Lipschitziane e limitate in R2 con la norma |f (z) − f (w)| kf kLip = kf k∞ + sup . kz − wk 2 z,w∈R Si provi che la funzione F è continua. Si enunci una versione “locale” di questo risultato. Nel caso che la funzione f sia in C 1 (R2 ) con derivate parziali limitate e Lipschitziane, si provi ad esprimere le derivate parziali della funzione F nelle tre variabili reali. Esercizio 8.24. F Sia f : [0, a) → R una funzione continua, R a non negativa e nulla solo nell’origine (non Lipschitziana). Si provi che se l’integrale improprio 0 fdx (x) è divergente, allora l’unica soluzione del problema di Cauchy 0 y = f (y) y(0) = 0 , è la funzione nulla sull’intervallo [0, a). Esercizio 8.25. Si dica se esistono funzioni derivabili f : R → R tali che 1 , f 0 (x) = f (x) per ogni x ∈ R ed eventualmente si determinino. Esercizio 8.26. Sia f : R → R derivabile e tale che f 0 (x) = arctan f (x) per ogni x ∈ R. Si mostri che: • se f si annulla in un punto, allora si annulla in tutti i punti, • se f (0) > 0 allora lim f (x) = +∞, x→+∞ lim f (x) = 0. x→−∞ Esercizio 8.27. Si studino le proprietà delle soluzioni (massimali) dei seguenti problemi di Cauchy, al variare del parametro a ∈ R: y0 = 1 + y2 y(0) = 0 , 2 y 0 = xey sin y y(0) = 1 , 2(y − 1) y0 = y(1) = a , x(x2 + 2x + 2) 1 y a y + y0 = 1+ y(1) = 0 . 2 x x Esercizio 8.28. Si studino le proprietà delle soluzioni delle seguenti equazioni differenziali: y0 = y − x , 1 y0 = x 1 + per x 6= 0 , y y 0 = 4y(1 − y) , 10. ESERCIZI 240 xy 0 + y = x arctan x , y0 = 2 − y2 . x2 Esercizio 8.29. Si determini il più esplicitamente possibile la soluzione massimale del seguente problema di Cauchy: y 0 = 1 + 2yx y(0) = 1 . Esercizio 8.30. Si dica se la seguente equazione differenziale ammette soluzioni periodiche per α ∈ R+ , α y 0 + y = sin x x Esercizio 8.31 (Equazioni di Riccati). Siano p, q, r ∈ C(I) con I ∈ R un intervallo, le seguenti equazioni differenziali ordinarie si dicono di equazioni di Riccati, y 0 (x) + p(x)y = q(x)y 2 (x) + r(x) . Si mostri che se y è una soluzione, le altre soluzioni sono della forma z = y + u dove u è una soluzione dell’equazione di Bernoulli u0 (x) + [p(x) − 2y(x)q(x)]u(x) = q(x)u2 (x) . Si studi inoltre l’equazione soddisfatta dalla funzione z supponendo che y+1/z sia un’altra soluzione. Si cerchino le soluzioni dell’equazione (1 + x2 )y 0 (x) − xy(x) + y 2 (x) = 1 + x2 , cercando inizialmente una soluzione affine. Esercizio 8.32 (Equazioni di Clairaut). Sia f ∈ C 1 (I) con I ∈ R un intervallo, le seguenti equazioni differenziali ordinarie si dicono di equazioni di Clairaut, y(x) = xy 0 (x) + f (y 0 (x)) . Si derivi l’equazione e si discutano le possibili soluzioni. Si cerchino le soluzioni delle equazioni y(x) = xy 0 (x) + [y 0 (x)]2 e y(x) = xy 0 (x) + [y 0 (x)]3 . Esercizio 8.33 (Equazioni di D’Alembert–Lagrange). FF Siano f, g ∈ C 1 (I) con I ∈ R un intervallo, le seguenti equazioni differenziali ordinarie si dicono di equazioni di D’Alembert–Lagrange, y(x) = xf (y 0 (x)) + g(y 0 (x)) . Si derivi l’equazione e si manipoli il risultato per ottenere un’equazione più semplice, assumendo che la funzione y 0 (x) sia invertibile, cioè si possa scrivere x = x(y 0 ). Si cerchino le soluzioni delle equazioni y(x) = x[y 0 (x)]2 + [y 0 (x)]2 e y(x) = x[y 0 (x)]2 + [y 0 (x)]3 . Esercizio 8.34 (Equazioni “esatte”). Siano A, B ∈ C 1 (Ω) con Ω ∈ R2 aperto. Si consideri l’equazione differenziale ordinaria A(x, y(x)) + B(x, y(x))y 0 (x) = 0 , 10. ESERCIZI 241 supponendo che esista una funzione F ∈ C 2 (Ω) tale che ∂F =A ∂x e ∂F =B, ∂y si provi che il grafico (connesso) di ogni soluzione è contenuto in un insieme di livello della funzione F. Si osservi che una condizione necessaria per l’esistenza di una tale funzione F è ∂B ∂A = , ∂y ∂x per il teorema di Schwarz. Tale condizione è anche sufficiente? Esercizio 8.35. Siano a, b ∈ C(I) con I ∈ R un intervallo, supponendo di conoscere una soluzione y1 della seguente equazione differenziale lineare a(x)y 00 (x) + b(x)y 0 (x) + c(x)y(x) = 0 , si mostri che si puó cercarne un’altra, linearmente indipendente da y1 , abbassando il grado dell’equazione, considerando le possibili soluzioni y2 = vy1 . Si cerchino le soluzioni dell’equazione (equazione di Legendre) (1 − x2 )y 00 (x) − 2xy 0 (x) + 2y(x) = 0 , osservando che y1 (x) = x è una soluzione. Si cerchino le soluzioni dell’equazione (equazione di Bessel) x2 y 00 (x) + xy 0 (x) + (x2 − 1/4)y(x) = 0 , osservando che sin √x x è una soluzione. Esercizio 8.36. Sia f ∈ C(I) con I ∈ R un intervallo, si mostri che il problema di Cauchy 00 y +y =f y(0) = y 0 (0) = 0 ha soluzione data da Z x f (t) sin(x − t) dt . y(x) = 0 Esercizio 8.37. FF Si discuta l’esistenza di una soluzione del problema di Cauchy 0 y = f (x, y) y(x0 ) = y0 con f solo continua in un intorno del punto x0 , y0 ∈ R2 , secondo le seguenti possibili linee: (1) approssimando la funzione f con funzioni Lipschitz o C 1 , risolvendo l’equazione corrispondente e cercando di passare al limite nelle soluzioni ottenute; (2) costruendo una successione di funzioni affini a tratti che soddisfa l’equazione nei punti di bordo dei sottointervalli dove ogni funzione è affine (considerando la derivata destra invece che la derivata), eventualmente convergente ad una soluzione del sistema. 10. ESERCIZI 242 Esercizio 8.38. Abbiamo definito l’esponenziale di una matrice A ∈ Mn (R) (o in Mn (C)) come la serie ∞ X An A e = . n! n=0 Si provi a definire le altre funzioni “elementari” sulle matrici usando le serie di potenze e si discuta il loro dominio di definizione e le loro proprietà. Esercizio 8.39. Si mostri che vale A n , eA = lim Id + n→∞ n per ogni matrice A ∈ Mn (R) (o in Mn (C)). Esercizio 8.40. −1 Si mostri che se A è invertibile si ha eABA = AeB A−1 . Esercizio 8.41. F Si provi che se due matrici A e B commutano, si ha AeB = eB A e vale la formula eA+B = eA eB . Si diano esempi in cui tale formula non vale se A e B non commutano. Si concluda che la matrice eA è sempre invertibile e la sua inversa è e−A . Esercizio 8.42. F Si provi che det eA = etr A . Esercizio 8.43. Sia consideri il seguente sistema autonomo di equazioni differenziali (bidimensionale) 0 x = f (x, y) y 0 = g(x, y) dove f, g ∈ C 1 (R2 ). Una soluzione massimale t 7→ (x(t), y(t)) si dice anche orbita del sistema. Un punto (x0 , y0 ) ∈ R2 si dice punto critico o stazionario se f (x0 , y0 ) = g(x0 , y0 ) = 0, isolato se non ve ne sono altri in un suo intorno. Un punto critico (x0 , y0 ) ∈ R2 si dice stabile se per ogni suo intorno U esiste un altro suo intorno V ⊆ U tale che se una soluzione (x(t), y(t)) “entra” in V non può più uscire da U , precisamente, se al tempo t0 ∈ R si ha (x(t0 ), y(t0 )) ∈ V , allora per ogni t ≥ t0 si ha (x(t), y(t)) ∈ U . Un punto critico si dice instabile se non è stabile. Un punto critico (x0 , y0 ) si dice asintoticamente stabile se è stabile e esiste un suo intorno U tale che se una soluzione (x(t), y(t)) “entra” in U , allora tende a (x0 , y0 ) asintoticamente, precisamente se al tempo t0 ∈ R si ha (x(t0 ), y(t0 )) ∈ U , allora si ha limt→+∞ (x(t), y(t)) = (x0 , y0 ). Si provi che una soluzione non può “passare” per un punto critico, a meno che non sia la soluzione costante “ferma” in tale punto. Si discuta e si cerchi di disegnare la struttura delle orbite dei seguenti sistemi: 0 0 0 x = −y x = −x x = x2 , , , 0 0 y =x−y y =y−x y 0 = y(2x − y) 0 0 0 x =x x = −xy x = y2 , , , y0 = y2 y0 = x y 0 = x2 + y 2 attorno al loro punto critico isolato (0, 0) ∈ R2 . 10. ESERCIZI 243 Esercizio 8.44. FF Sia consideri il seguente sistema autonomo di equazioni differenziali lineari 0 x = ax + by y 0 = cx + dy e si studino le orbite attorno al puntocriticonell’origine di R2 , mettendone la struttura in relazione a b con gli autovalori della matrice A = . c d Si studi, ad esempio, il seguente sistema 0 x = −2x + y/2 . y 0 = 2x − 2y Esercizio 8.45. FF Si studi (trasformandola in un sistema lineare del prim’ordine) la seguente equazione (oscillatore smorzato): mu00 + µu0 + ru = 0 , in dipendenza dei parametri m, µ, r. Esercizio 8.46. FF Sia consideri il seguente sistema autonomo di equazioni differenziali 0 x = f (x, y) y 0 = g(x, y) con f, g ∈ C 1 (R2 ) e f (0, 0) = g(0, 0) = 0, supponendo che l’origine sia un punto critico isolato del sistema. Si studino le orbite attorno al punto critico nell’origine di R2 , cercando di metterne la struttura in relazione con la struttura delle orbite del sistema lineare (detto linearizzato) 0 x = ax + by y 0 = cx + dy dove ∂f ∂f ∂g (0, 0), b = (0, 0), c = (0, 0), ∂x ∂y ∂x Si considerino, ad esempio, i seguente sistemi: 0 x = −x − 1 + eαy , y 0 = ex−y − 1 a= dove α ∈ R, x0 = y y 0 = −ky − g l sin x d= ∂g (0, 0) . ∂y , dove k, g, l ∈ R+ (pendolo smorzato). Esercizio 8.47. F Si studi il seguente sistema autonomo di equazioni differenziali 0 x = −x − logy r , y 0 = −y + logx r p con r = x2 + y 2 . Si verifichi che il comportamento delle sue orbite nell’intorno dell’origine di R2 è diverso dal comportamento delle orbite del suo sistema linearizzato. 10. ESERCIZI 244 Esercizio 8.48. Data l’equazione x00 + ϕ(x, x0 ) = 0 con ϕ ∈ C 1 (R2 ), si trasformi tale equazione in un sistema di due equazioni differenziali del prim’ordine e si verifichi che i suoi punti critici sono i punti (x0 , 0) ∈ R2 tali che ϕ(x0 , 0) = 0. Ovviamente, per ogni tale x0 ∈ R si ha che x(t) = x0 è una soluzione costante dell’equazione. Si mostri che il linearizzato del sistema ottenuto in tali punti critici (x0 , 0) corrisponde alla trasformazione in sistema dell’equazione lineare x00 + ∂y ϕ(x0 , 0)x0 + ∂x ϕ(x0 , 0)(x − x0 ) = 0 , detta linearizzazione dell’equazione originaria attorno alla soluzione costante x(t) = x0 . Esercizio 8.49. Dato un sistema autonomo di equazioni differenziali 0 x = f (x, y) y 0 = g(x, y) con f, g ∈ C 1 (R2 ), una funzione U differenziabile in un aperto Ω di R2 si dice un integrale primo del sistema se, escludendo i punti critici del sistema, il suo gradiente non è mai nullo e per ogni soluzione (x(t), y(t)) in Ω si ha che U (x(t), y(t)) costante. Le curve di livello della funzione U (che se è almeno C 1 sappiamo essere localmente delle curve, dal teorema della funzione implicita) si dicono allora curve integrali del sistema. Si mostri che se un’orbita interseca una curva integrale, allora vi è interamente contenuta e che ogni curva integrale è unione disgiunta di orbite. Si provi che in ogni punto (x, y) ∈ Ω il gradiente di un integrale primo U è ortogonale al vettore di R2 di componenti f (x, y) e g(x, y). Viceversa, si mostri che una funzione che soddisfi questa proprietà e abbia gradiente non nullo fuori dai punti critici del sistema è un integrale primo. Esercizio 8.50. F Si determini un integrale primo del sistema x0 = y y 0 = x3 − x e se ne descrivano le curve di livello. Esercizio 8.51. F Si provi che se U ∈ C 1 (Ω) è un integrale primo di un sistema e l’insieme di livello Γ = {(x, y) ∈ R2 : U (x, y) = c} è una curva chiusa che non contiene punti critici del sistema, allora Γ è un’orbita periodica, cioè ogni soluzione (x(t), y(t)) con un punto in comune con Γ è periodica e “percorre” tutto Γ. Esercizio 8.52. Si determinino integrali primi dei seguenti sistemi, 0 0 x = x(1 + y) x = x(xey − cos y) , , y 0 = −y(1 + x) y 0 = sin y − 2xey 0 0 x = y − x2 y − y 3 x = 2x2 y , , 0 2 2 y =x +y −1 y 0 = x(1 + y 2 ) e si cerchi di disegnarne gli insiemi di livello. 10. ESERCIZI 245 Esercizio 8.53. Si studino i seguenti sistemi di equazioni differenziali con particolare attenzione agli integrali primi: 0 0 x = 2y(y − 2x) x = x − xy , . y 0 = (1 − x)(y − 2x) y 0 = xy − y Esercizio 8.54. F Si studi la seguente equazione di Van der Pol: x00 − µ(1 − x2 )x0 + x = 0 , dove µ > 0. Libri Utili o per Approfondire 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. E. Acerbi, L. Modica, S. Spagnolo, Problemi scelti di analisi matematica I, Liguori Editore, 1985. A. Bruckner, Differentiation of real functions, CRM Monograph Series, vol. 5, AMS, 1994. F. Conti, Calcolo. Teoria e applicazioni, McGraw–Hill, 1993. J. Dugundji, Topology, Allyn and Bacon, 1966. B. R. Gelbaum, J. M. H. Olmsted, Counterexamples in analysis, Holden–Day, 1964. P. R. Halmos, Naive set theory, D. Van Nostrand Co., 1960. J. L. Kelley, General topology, D. Van Nostrand Co., 1955. A. B. Kharazishvili, Strange functions in real analysis, Pure and Applied Mathematics, vol. 272, Chapman & Hall/CRC, 2006. J. E. Marsden, Elementary classical analysis, W. H. Freeman and Co., 1974. L. C. Piccinini, G. Stampacchia, G. Vidossich, Equazioni differenziali ordinarie in Rn (problemi e metodi), Liguori Editore, 1978. G. Prodi, Analisi matematica, Bollati Boringhieri, 1972. W. Rudin, Principles of mathematical analysis, McGraw–Hill, 1976. L. A. Steen, J. A. Seebach Jr., Counterexamples in topology, Holt, Rinehart and Winston, 1970. 246