COMPLEMENTI DI MATEMATICA Seminario Fisico

Transcript

COMPLEMENTI DI MATEMATICA Seminario Fisico
COMPLEMENTI DI MATEMATICA
Seminario Fisico–Matematico – I anno
Note basate sugli appunti dei corsi tenuti da
F. Ricci, A. Mennucci e T. Pacini negli anni A.A. dal 2009 al 2013,
L. Ambrosio e C. Mantegazza nell’A.A. 2013–14,
L. Ambrosio e L. Mazzieri nell’A.A. 2014–15.
Indice
Capitolo 1. ELEMENTI DI TEORIA DEGLI INSIEMI
1. Connettivi logici e notazione di base
2. Prodotto cartesiano di due insiemi
3. Relazioni
4. Relazioni di equivalenza
5. Relazioni di ordine
6. Funzioni
7. Prodotti cartesiani multipli
8. L’insieme dei numeri naturali
9. Cardinalità di insiemi
10. Cardinalità di P(A)
11. Insiemi finiti e infiniti
12. Il Lemma di Zorn
13. Il Teorema di Zermelo
14. *Dimostrazione del Lemma di Zorn
15. Esercizi
6
6
8
8
9
10
11
13
14
18
21
21
22
24
26
27
Capitolo 2. INSIEMI NUMERICI E OPERAZIONI
1. Operazioni su N
2. Dai naturali agli interi
3. Dagli interi ai razionali
4. Campi
5. Costruzione del campo R dei numeri reali
6. Operazioni su R
7. Campi ordinati
8. Campi ordinati completi
9. Esercizi
36
36
38
39
40
41
42
44
46
48
Capitolo 3. COMPLEMENTI SULLE SUCCESSIONI DI NUMERI REALI
1. Massimo e minimo limite
2. Teoremi di Cesaro
3. Teorema di Stolz–Cesaro
4. Confronti asintotici tra successioni
5. Ordini di infinito e di infinitesimo
6. Esercizi
53
54
56
58
60
62
64
Capitolo 4. SOMMATORIE SU INSIEMI INFINITI
1. Somme di termini non negativi
2. Limiti lungo insiemi ordinati filtranti
67
67
68
3
INDICE
3.
4.
5.
6.
7.
8.
9.
*L’integrale di Riemann
Serie a termini di segno generico
Il caso I = N: confronto con la nozione di “somma di una serie”
Convergenza incondizionata di serie
Sommatorie a più indici
Prodotto secondo Cauchy di successioni
Esercizi
4
69
73
75
77
80
82
84
Capitolo 5. SPAZIO EUCLIDEO Rn , SPAZI METRICI E FUNZIONI CONTINUE
1. Struttura Euclidea di Rn : prodotto scalare, modulo e distanza
2. Insiemi aperti e chiusi di Rn , parte interna, chiusura, frontiera
3. Successioni a valori in Rn
4. Caratterizzazione per successioni della chiusura e del derivato di un insieme
5. Punti limite di una successione
6. Spazi metrici
7. *Il Teorema di Baire
8. Funzioni continue tra spazi Euclidei
9. Connessione, convessità, connessione per archi
10. Esercizi
89
89
92
95
97
98
99
109
110
113
116
Capitolo 6. SUCCESSIONI E SERIE DI FUNZIONI
1. Convergenza puntuale e uniforme
2. Continuità del limite uniforme
3. La convergenza uniforme come convergenza in uno spazio metrico
4. Derivabilità della funzione limite
5. Convergenza uniforme di serie di funzioni e spazi vettoriali normati
6. Serie di potenze
7. Derivabilità sull’asse reale
8. Serie di potenze e serie di Taylor
9. Il Lemma di Abel
10. Alcune serie notevoli
11. Esercizi
139
139
140
141
142
146
149
151
152
158
161
161
Capitolo 7. CALCOLO DIFFERENZIALE IN PIÙ VARIABILI
1. Derivate parziali e direzionali
2. Differenziale
3. Il teorema del differenziale totale
4. Curve regolari in Rn
5. Curve regolari e grafici
6. Grafici e insiemi di livello: il teorema della funzione implicita
7. *Funzioni differenziabili da Rn a Rm
8. *Composizione di funzioni differenziabili
9. *Punti stazionari liberi e vincolati
10. *Diagonalizzazione di matrici simmetriche
11. Derivate di ordine superiore
12. Campi vettoriali, integrali curvilinei, potenziali
13. *La matrice Hessiana
14. *Discussione della natura dei punti stazionari liberi
171
171
172
175
177
179
179
183
184
185
188
190
193
197
199
INDICE
15.
Esercizi
5
200
Capitolo 8. EQUAZIONI DIFFERENZIALI ORDINARIE
1. Definizioni e primi esempi
2. Metodi risolutivi per alcuni tipi di equazioni del primo ordine
3. Problemi di Cauchy per equazioni del primo ordine
4. Contrazioni in spazi metrici
5. Dimostrazione del teorema di esistenza e unicità locale
6. Sistemi di equazioni differenziali ed equazioni di ordine superiore
7. Sistemi differenziali lineari a coefficienti costanti e matrice esponenziale
8. *Calcolo della matrice esponenziale
9. *Equazioni differenziali lineari a coefficienti costanti di ordine superiore
10. Esercizi
210
210
212
215
222
223
225
228
231
233
236
Libri Utili o per Approfondire
246
CAPITOLO 1
ELEMENTI DI TEORIA DEGLI INSIEMI
1. Connettivi logici e notazione di base
Anche se le note del corso sono scritte in un linguaggio semi–formalizzato, sarà a volte utile
esprimere alcuni enunciati e alcune nozioni in termini più formali, usando:
• gli operatori di congiunzione ∧ (“e”) e disgiunzione ∨ (“o”);
• i quantificatori ∃ (“esiste”) e ∀ (“per ogni”);
• i simboli di implicazione ⇒, ⇐, ⇐⇒;
• il simbolo di negazione ¬ (“non”).
Ricordiamo anche le regole fondamentali per l’uso dell’operatore di negazione: ¬(¬P ) equivale a
P , ¬(P ∧ Q) equivale a (¬P ) ∨ (¬Q), ¬(P ∨ Q) equivale a (¬P ) ∧ (¬Q), ¬(∀xP (x)) equivale a
∃x¬P (x), ¬(∃xP (x)) equivale a ∀x¬P (x).
La lista dei simboli è in realtà ridondante, perché P ⇐ Q potrebbe essere sostituito da Q ⇒ P e
P ⇐⇒ Q potrebbe essere sostituito da (P ⇒ Q) ∧ (Q ⇒ P ), riducendo cosı̀ tutto all’operatore ⇒.
Ma, persino P ⇒ Q può essere sostituito da (¬P ) ∨ Q. Informalmente, l’implicazione P ⇒ Q è da
intendersi falsa quando P è vera e Q è falsa, è da intendersi vera in tutti gli altri 3 casi. Questo
è coerente con lo schema della “dimostrazione per assurdo”, con la quale si mostra l’implicazione
P ⇒ Q mostrando in realtà che (¬Q) ⇒ (¬P ): si ha infatti
(¬(¬Q)) ∨ (¬P )
equivale a Q ∨ (¬P )
che a sua volta equivale a
(¬P ) ∨ Q
per la regola che ¬(¬Q) corrisponde a Q e per la “commutatività” di ∨. Con ragionamenti simili,
potremmo usare le regole di negazione per fare a meno dei simboli ∀ e ∧, usando ∃, ∨ e ovviamente
¬.
Questa ridondanza nella scelta dei simboli, tuttavia, aiuta a generare formule non troppo lunghe,
come presto si vedrà. Per lo stesso motivo e per guadagnare in leggibilità, useremo a volte anche
“e” per ∧ e “o” per ∨.
Per non appesantire troppo questa trattazione, che vuole restare elementare, useremo anche senza
renderle esplicite tutte le regole fondamentali di deduzione, come ad esempio la deduzione di P ⇒ R
dalla combinazione di P ⇒ Q e Q ⇒ R o la commutatività di ∧ e ∨, che abbiamo già menzionato.
Diamo per note le nozioni e notazioni fondamentali della teoria degli insiemi, come:
• la nozione di appartenenza di un elemento a un insieme (x ∈ A) e la sua negazione x ∈
/ A,
i.e. ¬(x ∈ A),
• la nozione di insieme vuoto, indicato con Ø, i.e. l’insieme A che soddisfa ∀x(x ∈
/ A). Si
noti che l’insieme vuoto è unico grazie al cosiddetto assioma di estensionalità:
∀x((x ∈ A) ⇐⇒ (x ∈ B)),
A = B se e solo se vale
• la nozione di inclusione di un insieme in un altro (A ⊆ B), in formule
A ⊆ B se e solo se vale
∀x((x ∈ A) =⇒ (x ∈ B))
6
1. CONNETTIVI LOGICI E NOTAZIONE DI BASE
7
(useremo anche la notazione A ⊂ B per (A ⊆ B) ∧ ¬(A = B)),
• le operazioni di unione (A∪B) e intersezione (A∩B), le proprietà commutativa e associativa
di ciascuna di esse, la proprietà distributiva dell’una rispetto all’altra,
• le nozioni di differenza insiemistica (A \ B, B \ A) e differenza simmetrica (A4B) di due
insiemi,
• la nozione di complementare X \ A di un insieme A rispetto a un insieme ambiente X
dato, e a volte sottinteso (Ac ),1
• l’insieme potenza (o insieme delle parti) P(X) di un dato insieme X:2
P(X) := A : A ⊆ X ,
• le formule di De Morgan:
[ c \
Ai =
Aci ,
i∈I
i∈I
\
i∈I
Ai
c
=
[
Aci .
i∈I
Descriveremo un insieme elencando i suoi elementi, ad esempio con la notazione A = {a, b, c, d}, o
(specialmente per insiemi potenzialmente infiniti) attraverso la validità di una formula
A = x ∈ B : P (x) .
Informalmente, A è il sottoinsieme di B costituito dagli elementi x tali che vale P (x).3
A titolo di esempio, descriviamo in formule gli insiemi A ∪ B e A ∩ B:
∀x x ∈ (A ∪ B) ⇐⇒ (x ∈ A) ∨ (x ∈ B) ,
∀x x ∈ (A ∩ B) ⇐⇒ (x ∈ A) ∧ (x ∈ B) .
Analogamente l’insieme A \ B = A ∩ B c è descritto dalla formula
∀x x ∈ (A \ B) ⇐⇒ (x ∈ A) ∧ (x ∈
/ B)
e A4B si può intendere come una abbreviazione per (A \ B) ∪ (B \ A).
Infine, anche se gli insiemi
• N dei numeri naturali
0,
1,
2,
3,
.
.
.
,
e N∗ dei numeri naturali positivi {1, 2, 3, . . .},
• Z dei numeri interi . . ., −3, −2, −1, 0, 1, 2, 3, . . .},
∗
• Q dei numeri razionali p/q : p ∈ Z, q ∈ N
verranno “costruiti” e caratterizzati assiomaticamente nell’ambito della teoria, presupponiamo già
una certa familiarità con essi, per poter dare sin da subito esempi naturali di funzioni, relazioni,
etc.
1Come vedremo, c’è spesso bisogno di un insieme ambiente, visto che la considerazione dell’insieme di tutti gli
insiemi porta a paradossi. Per questa ragione useremo la notazione Ac solo quando l’insieme ambiente è chiaro dal
contesto.
2Il fatto che questa operazione produca un insieme è in realtà un assioma.
3Anche in questo caso, il fatto che questa operazione produca un insieme è in realtà un assioma, noto come
assioma di separazione.
3. RELAZIONI
8
2. Prodotto cartesiano di due insiemi
Siano a, b due elementi, non necessariamente distinti tra loro. Quando si parla di coppia ordinata
(a, b) si vuole specificare la posizione dei due termini nella coppia, e cioè che essa consiste di un
primo termine a e di un secondo termine b. Per questo motivo, la coppia (a, b) è un’entità del tutto
diversa dall’insieme {a, b}.
Due coppie (a, b) e (a0 , b0 ) sono uguali se e solo se sono uguali a due a due i termini corrispondenti.
In formule:
(a, b) = (a0 , b0 ) ⇐⇒ a = a0 e b = b0 .
In particolare, (a, b) 6= (b, a) se a 6= b.
Per poter accogliere una simile definizione nella teoria degli insiemi, una coppia va definita come
un opportuno insieme. La definizione più comunemente adottata è la seguente:
(a, b) = {a}, {a, b} .
È un semplice esercizio verificare che effettivamente
{a}, {a, b} = {a0 }, {a0 , b0 } ⇐⇒ a = a0 e b = b0 .
Siano ora A e B due insiemi. Si chiama prodotto cartesiano di A e B l’insieme A × B delle coppie
ordinate (a, b), al variare di a in A e di b in B:
A × B = (a, b) : a ∈ A , b ∈ B .
Convenzionalmente, si pone Ø × B = Ø e A × Ø = Ø. Si osservi che, se A 6= B,
A × B 6= B × A .
Il prodotto cartesiano A × A di un insieme A con se stesso si indica anche con A2 . Si chiama
diagonale di A2 l’insieme
diag (A2 ) = (a, a) : a ∈ A .
3. Relazioni
Si chiama relazione tra elementi di un insieme A ed elementi di un insieme B un qualunque
sottoinsieme R del prodotto cartesiano A × B.
Se la coppia (a, b) ∈ A × B appartiene a R, si dice che a è in relazione con b; si usa la notazione4
aRb.
Esempi.
(1) Con A = {1, 2, . . . , 100} e B = {1, 2, . . . , 200}, poniamo la relazione
aRb ⇐⇒ M CD(a, b) > 1 .
Una scrittura equivalente è
R = (a, b) ∈ A × B : M CD(a, b) > 1 .
(2) Con A = B = N (come ricordato prima, N indica l’insieme dei numeri naturali), l’insieme
(m, n) ∈ N2 : m ≤ n
fornisce la relazione ≤.
4Invece di lettere, come R, è anche comune usare simboli come ∼, ≤, ecc., secondo i casi (v. seguito).
4. RELAZIONI DI EQUIVALENZA
9
4. Relazioni di equivalenza
Una relazione R tra elementi di uno stesso insieme A si dice una relazione di equivalenza su A se
soddisfa le seguenti proprietà per qualsiasi scelta di a, b, c in A:
• riflessiva: aRa;
• simmetrica: aRb ⇒ bRa;
• transitiva: aRb e bRc ⇒ aRc.
Simboli comunemente usati per relazioni di equivalenza sono: ∼, ', ≈ e simili.
Sia dunque ∼ una relazione di equivalenza. Fissato a ∈ A, si chiama classe di equivalenza di a
modulo ∼ l’insieme
Ca = {b ∈ A : b ∼ a} .
Lemma 1.1. Se a ∼ a0 , allora Ca = Ca0 . Se a 6∼ a0 , allora Ca ∩ Ca0 = Ø.
Dimostrazione. Supponiamo a ∼ a0 e b ∈ Ca . Allora b ∼ a e per la proprietà transitiva
b ∼ a0 . Dunque b ∈ Ca0 . Questo prova che Ca ⊆ Ca0 . Allo stesso modo si dimostra che Ca0 ⊆ Ca .
Dalla doppia inclusione segue che Ca = Ca0 .
Dimostriamo ora che
(4.1)
Ca ∩ Ca0 6= Ø =⇒ a ∼ a0 .
Infatti, sia b ∈ Ca ∩ Ca0 . Allora b ∼ a e b ∼ a0 . Per le proprietà simmetrica e transitiva, a ∼ a0 .
Vale allora la contronominale della implicazione (4.1), cioè
a 6∼ a0 =⇒ Ca ∩ Ca0 = Ø .
Si chiama partizione di A una famiglia di sottoinsiemi non vuoti di A che siano a due a due disgiunti
e la cui unione sia tutto l’insieme A.
Teorema 1.2 (Classi di equivalenza e partizioni). Data una relazione di equivalenza ∼ in A,
le classi di equivalenza modulo ∼ costituiscono una partizione di A. Viceversa, data una partizione
di A, esiste un’unica relazione di equivalenza le cui classi di equivalenza siano gli elementi della
partizione stessa.
Dimostrazione. Il Lemma 1.1 dimostra che le classi di equivalenza distinte modulo ∼ sono
disgiunte. Inoltre, ogni a ∈ A appartiene alla classe Ca per la proprietà riflessiva. Quindi l’unione
delle classi distinte è tutto A.
S
Per il viceversa, sia {Ai : i ∈ I} una partizione di A, cioè con i∈I Ai = A, Ai 6= Ø per ogni i ∈ I,
e Ai ∩ Ai0 = Ø se i 6= i0 . Si verifica facilmente che la relazione
xRy ⇐⇒ ∃ i ∈ I tale che x, y ∈ Ai
è di equivalenza e che le sue classi di equivalenza sono gli Ai .
L’insieme delle classi di equivalenza si chiama insieme quoziente di A modulo ∼ ed è indicato con
la notazione A/∼. In formule,
A/∼ = {Ca : a ∈ A}.
∗
Ad esempio, dato n ∈ N , possiamo introdurre la relazione di equivalenza ∼n in Z richiedendo
che p ∼n q se p − q è un multiplo intero (relativo) di n. Le classi di equivalenza (le cosiddette
classi di resto modulo n) sono in questo caso n e possono essere indicizzate proprio dagli n valori
{0, 1, . . . , n − 1} del resto. In questo caso, quindi, l’insieme quoziente ha n elementi.
5. RELAZIONI DI ORDINE
10
5. Relazioni di ordine
Una relazione R tra elementi di uno stesso insieme A si chiama una relazione d’ordine, o un
ordinamento, su A se valgono le seguenti proprietà per qualsiasi scelta di a, b, c in A:
• riflessiva: aRa;
• antisimmetrica: aRb e bRa ⇒ a = b;
• transitiva: aRb e bRc ⇒ aRc.
Simboli comunemente usati per relazioni d’ordine sono: ≤, e simili. I corrispondenti simboli <,
≺, ecc. si usano allora per indicare che
aRb e a 6= b .
Un ordinamento si dice totale se inoltre vale la proprietà:
• tricotomia: ∀ a, b ∈ A, aRb o bRa.
Altrimenti si dice che l’ordinamento è parziale.
Esempi.
(1) La relazione ≤ su N è un ordinamento totale.
(2) La relazione ⊆ su P(X) (l’insieme dei sottoinsiemi di un insieme X) è un ordinamento,
solo parziale se X ha almeno due elementi.
(3) La relazione R su N data da
mRn ⇐⇒ mn
è un ordinamento parziale.
(4) Se R è un ordinamento su A, la relazione inversa
R−1 = (a, b) : (b, a) ∈ R
è pure un ordinamento.
(5) Se R è un ordinamento su A e B ⊆ A, la restrizione di R a B,
R|B = R ∩ B 2
è un ordinamento su B. Se R|B è un ordinamento totale su B, B si dice una catena (o
sottoinsieme totalmente ordinato) di A.
Uno stesso insieme può ammettere più ordinamenti. È perciò corretto dire che un insieme ordinato
è una coppia (A, ≤), dove A è un insieme e ≤ è un ordinamento su di esso.
Sia (A, ≤) un insieme ordinato. Un elemento m ∈ A si dice massimo di A se, per ogni a ∈ A,
a ≤ m.
In modo analogo si definisce il minimo di un insieme ordinato.
Lemma 1.3 (Unicità del massimo e del minimo). Se un insieme ordinato ha un massimo (risp.
minimo), esso è unico.
Dimostrazione. Siano m e m0 due massimi. Allora m0 ≤ m e m ≤ m0 e, per la proprietà
antisimmetrica, m = m0 . Analogamente per i minimi.
Le nozioni di massimo e di minimo si applicano ovviamente anche a sottoinsiemi di un insieme
ordinato.
Un elemento m ∈ A si dice massimale se non esiste alcun elemento a ∈ A tale che m < a (se la
relazione di ordine è totale questo equivale a dire che a ≤ m per ogni a ∈ A). In modo analogo si
definisce un elemento minimale di A.
6. FUNZIONI
11
Per un insieme A totalmente ordinato, le nozioni di elemento massimo ed elemento massimale
coincidono. Se l’ordinamento non è totale, il massimo è un elemento massimale, ma non viceversa.
Un insieme parzialmente ordinato può possedere più elementi massimali. Ad esempio, nell’insieme
A ⊆ N : A ha al più 5 elementi
con la relazione di ordine indotta dall’inclusione in P(N), ogni insieme di 5 elementi è massimale
e nessuno di questi insiemi è massimo. Considerazioni del tutto analoghe valgono per gli elementi
minimi e minimali.
Sia ora A0 un sottoinsieme di A. Un elemento a ∈ A si dice un maggiorante di A0 se, per ogni
a0 ∈ A0 , a0 ≤ a. In modo analogo di definisce un minorante di A0 .
Se l’insieme dei maggioranti di A0 ha un minimo, questo si chiama l’estremo superiore di A0 .
L’estremo inferiore di A0 si definisce come il massimo dei minoranti, quando questo esiste. Per il
Lemma 1.3, l’estremo superiore e l’estremo superiore, se esistono, sono unici.
I simboli max, min, sup, inf indicano rispettivamente massimo, minimo, estremo superiore ed
estremo inferiore di un sottoinsieme di un insieme ordinato.
Si noti che (con considerazioni analoghe per minimi, minoranti e estremo inferiore)
• un maggiorante a di A0 in A appartiene ad A0 se e solo se a = max A0 ;
• se A0 ⊆ A ha massimo, allora max A0 = sup A0 ;
• un elemento a ∈ A è massimale se e solo se A0 = {a} non ha maggioranti all’infuori di a
stesso.
Esempi.
(1) Si consideri N ordinato dalla relazione m n se mn. Allora min N = 1 e max N = 0.
Se prendiamo invece A = N \ {0, 1} con l’ordinamento indotto da , A non ammette né
minimo né massimo, i numeri primi sono gli elementi minimali, e non ci sono elementi
massimali.
(2) Nell’insieme Q dei
dell’ordinamento (totale) abituale, si consideri
numeri razionali, dotato
0 = m/n : (m/n)2 < 2 . Si dimostri che l’insieme dei maggioranti di A0 è
l’insieme
A
m/n > 0 : (m/n)2 > 2 e che tale insieme non ha minimo. Dunque A0 ha dei maggioranti
in Q, ma non l’estremo superiore.
6. Funzioni
Una relazione R ⊆ A × B si dice una funzione (o anche applicazione, mappa, trasformazione) di A
in B se vale la seguente proprietà:
(6.1)
per ogni a ∈ A, esiste un unico b ∈ B tale che aRb.
Si scrive abitualmente R(a) = b invece di (a, b) ∈ R. Una funzione R di A in B si indica con le
notazioni
R : A −→ B, a ∈ A 7→ R(a) ∈ B.
Pur non dimenticando che le funzioni sono relazioni, iniziamo a usare da subito, ma non esclusivamente, la notazione tradizionale f : A → B per una funzione f da A in B.
Data f : A → B, le seguenti definizioni e notazioni sono standard:
• A si chiama il dominio di f e B il suo codominio;
• dato A0 ⊆ A, la restrizione di f ad A0 è la funzione che corrisponde alla relazione R| A0 definita
da R ∩ (A0 × B), ove R ⊂ A × B è la relazione corrispondente a f (in parole più povere, il dominio
6. FUNZIONI
12
di questa nuova funzione è A0 e i valori di f e della sua restrizione coincidono su A0 );
• l’insieme
imf = b ∈ B : ∃ a ∈ A tale che f (a) = b ⊆ B
si chiama l’insieme immagine, o anche solo immagine, di f ;
• dato A0 ⊆ A, si chiama immagine di A0 secondo f l’insieme f (A0 )5 definito da
f (A0 ) = b ∈ B : ∃ a ∈ A0 tale che f (a) = b ;
• dato B 0 ⊆ B, si chiama controimmagine di B 0 secondo f l’insieme f −1 (B) definito da
f −1 (B 0 ) = a ∈ A : f (a) ∈ B 0 ;
Si noti che f (∅) = ∅ e che f −1 (∅) = ∅.
• f si dice surgettiva se imf = B (quindi, per ogni b ∈ B esiste almeno un a ∈ A tale che f (a) = b);
• R si dice iniettiva se
a, a0 ∈ A e a 6= a0 =⇒ f (a) 6= f (a0 )
(quindi, per ogni b ∈ B esiste al più un a ∈ A tale che f (a) = b);
• f si dice bigettiva o biunivoca, o anche corrispondenza biunivoca, se è iniettiva e surgettiva (quindi,
per ogni b ∈ B esiste esattamente un a ∈ A tale che f (a) = b);
• se f : A → B è bigettiva, f −1 : B → A è pure una funzione, detta funzione inversa di f ;
• se f : A −→ B e g : B −→ C, la funzione composta g ◦ f : A −→ C è definita da
g ◦ f (a) = g f (a) , ∀ a ∈ A
(più in generale, la composizione ha senso se il dominio di g contiene l’immagine di f );
• la diagonale di A2 è una funzione, detta funzione identica di un insieme A, e indicata con
ιA : A −→ A.
Osservazioni.
(1) Se una funzione R non è surgettiva e B 0 = im R, allora R ⊆ A × B 0 , e dunque R definisce una
funzione surgettiva di A su B 0 . Tuttavia è bene considerare R : A → B e R : A → B 0 come funzioni
diverse. Per tener conto di ciò in modo formalmente corretto, bisogna dire più precisamente che
una funzione da A a B è una terna (A, B, R), con R soddisfacente la proprietà (6.1).
(2) Se A è l’insieme vuoto e B è un insieme qualsiasi, la relazione R = Ø ⊆ A × B è, sia pure
formalmente, una funzione. Infatti ogni condizione della forma “∀ a ∈ Ø, P (a)” è verificata e qui
si prende come P l’enunciato “esiste un unico b tale che (a, b) ∈ Ø”.
(3) Data f : A → B, la funzione d’insieme B 0 7→ f −1 (B 0 ) tra P(B) e P(A) commuta con tutte le
operazioni insiemistiche, vale a dire
[ [
\ \
−1
0
00
−1
−1
00
−1
−1
−1
f (B \ B ) = f (B) \ f (B ) , f
Bi =
f (Bi ) , f
Bi =
f −1 (Bi ) .
i∈I
i∈I
i∈I
i∈I
Per la funzione di insieme
7→ f (A) tra P(A) e P(B), invece, in generale si può solo dire che
[ [
\ \
f
Ai =
f (Ai ),
f
Ai ⊆
f (Ai ) ,
A0
i∈I
i∈I
i∈I
i∈I
ma la seconda inclusione può essere stretta. Si noti anche che la validità di
f (A0 ∩ A00 ) = f (A0 ) ∩ f (A00 )
5La notazione è qui un po’ ambigua, in quanto il simbolo f viene usato sia per la funzione da A in B che per la
funzione indotta da P(A) in P(B). Tuttavia in genere nel contesto si capisce sempre di quale delle due funzioni si
sta parlando. Un’analoga osservazione vale per f −1 , introdotta più avanti.
7. PRODOTTI CARTESIANI MULTIPLI
13
per ogni coppia di insiemi A0 e A00 equivale all’iniettività di f .
7. Prodotti cartesiani multipli
Dati tre insiemi A, B, C, si possono costruire i prodotti
cartesiani
(A × B) × C e A × (B × C),
costituiti rispettivamente dagli elementi (a, b), c e a, (b, c) , al variare di a ∈ A, b ∈ B, c ∈ C.
Essi sono dunque insiemi diversi tra loro, pur potendo essere canonicamente messi in corrispondenza
biunivoca. Peraltro, anche se questa procedura potrebbe essere iterata per definire il prodotto di
un numero finito di insiemi, non è semplice adattarla per definire il prodotto di un numero infinito
(numerabile o persino più che numerabile) di insiemi.
Mirando a una costruzione più diretta ed estendibile ai prodotti infiniti, vorremmo definire, più
semplicemente, il prodotto cartesiano A × B × C come l’insieme delle “terne” (a, b, c), con a ∈ A,
b ∈ B, c ∈ C. Ma dobbiamo innanzitutto definire cosa sono le terne. Avendo a disposizione la
nozione di funzione, possiamo dare la seguente definizione:
• Siano A, B, C tre insiemi. Il prodotto cartesiano A × B × C è l’insieme delle funzioni6
f : {1, 2, 3} −→ A ∪ B ∪ C
tali che f (1) ∈ A, f (2) ∈ B, f (3) ∈ C.
Una terna è dunque una funzione f con le proprietà suddette.
Come avevamo anticipato, questa costruzione può essere facilmente adattata anche a un numero
maggiore di insiemi, finito o infinito7 nel modo seguente.
Sia I un insieme non vuoto di indici, introdotto per parametrizzare una famiglia di insiemi8
A = {Ai : i ∈ I} .
Definizione 1.4 (Prodotto cartesiano di insiemi). Il prodotto cartesiano
delle funzioni
[
f : I −→
Ai
Q
i∈I
Ai è l’insieme
i∈I
tali che f (i) ∈ Ai per ogni i ∈ I.
Q
Se tutti gli Ai sono uguali tra loro a un dato insieme A, il prodotto cartesiano i∈I A è l’insieme
di tutte funzioni f : I −→ A. Esso viene indicato con AI .
Se I è finito, tipicamente I = {1, 2, . . . , n}, si usa la notazione An anziché A{1,...,n} , e i suoi elementi
sono le n–uple (ordinate) di elementi di A, indicate abitualmente come (a1 , a2 , . . . , an ).
È un fatto ovvio che se uno degli insiemi Ai è vuoto, anche il prodotto cartesiano è vuoto, perché
la condizione f (i) ∈ Ai non può essere realizzata per quel particolare i; questo è coerente con la
convenzione che avevamo introdotto per il prodotto cartesiano di due
Q insiemi.
Viceversa, non è per nulla ovvio che se nessun Ai è vuoto, allora i∈I Ai è non vuoto. Questa
affermazione, certamente dimostrabile per induzione sulla cardinalità dell’insieme degli indici I
6Qui presupponiamo l’esistenza dell’insieme N dei numeri naturali, che costruiremo solo nella prossima sezione;
per aggirare questa imprecisione si potrebbe prendere {Ø} al posto di 1, {Ø, {Ø}} al posto di 2 e {Ø, {Ø, {Ø}}} al
posto di 3; saranno proprio i numeri 1, 2, 3 nella costruzione dei numeri naturali che presenteremo.
7Perché questa definizione non è utilizzabile per introdurre il prodotto di due insiemi? In che relazione è la
nozione di prodotto di due insiemi A e B con quella di funzioni f : {1, 2} → A ∪ B con f (1) ∈ A e f (2) ∈ B?
8Strettamente parlando, anche questa andrebbe intesa come una mappa S a valori insiemi, che associa a ogni
i ∈ I un sottoinsieme Ai di un certo dato insieme X, quindi Ai = S(i) per ogni i ∈ I.
8. L’INSIEME DEI NUMERI NATURALI
14
quando questo è finito9, è in effetti indipendente dagli assiomi della teoria degli insiemi comunemente
adottati (teoria di Zermelo–Fraenkel, o ZF). Pertanto può essere indifferentemente accettato oppure
no, dando luogo a due teorie degli insiemi, una più ampia e l’altra più ristretta.10 Nella matematica
moderna essa viene comunemente accettata, come assioma aggiuntivo,
detto Assioma della scelta.
Q
Esistono opzioni intermedie, come richiedere che il prodotto i∈I Ai sia non vuoto quando tutti gli
insiemi Ai sono non vuoti e I = N (o è equipotente a N), questo è il cosiddetto Assioma della scelta
numerabile (gran parte dell’Analisi Matematica moderna non potrebbe essere possibile se non si
accettasse almeno questo assioma, come presto vedremo).
Le seguenti sono formulazioni equivalenti dell’Assioma della scelta.
• Il prodotto cartesiano di una famiglia non vuota di insiemi non vuoti è non vuoto.
• Data una famiglia non vuotaS{Ai : i ∈ I} di insiemi non vuoti a due a due disgiunti,
esiste un sottoinsieme B di i∈I Ai tale che, per ogni i ∈ I, B ∩ Ai contenga un unico
elemento.
Si noti che dalla
Q prima alla seconda formulazione si passa prendendo B = f (I), ove f è una qualsiasi
funzione in i∈I Ai (per esercizio, si passi dalla seconda alla prima formulazione). La seconda
formulazione giustifica il nome di “Assioma della scelta”: è possibile “scegliere” simultaneamente
rispetto al parametro i un elemento da ciascun Ai .
8. L’insieme dei numeri naturali
Dato un insieme X, chiamiamo successore di X l’insieme
S(X) = X ∪ {X} .
Un insieme A si dice S–saturo se
(i) Ø ∈ A;
(ii) se X ∈ A, anche S(X) ∈ A.
È facile verificare che l’insieme intersezione di una famiglia qualsiasi di insiemi S–saturi è S–saturo:
Lemma 1.5. Sia {Ai }i∈I una famiglia di insiemi S–saturi. Allora anche la loro intersezione A0 =
T
i∈I Ai è S–satura.
Dimostrazione. Essendo Ø ∈ Ai per ogni i ∈ I, si ha Ø ∈ A0 . Dunque A0 soddisfa la
condizione (i). Inoltre, se X ∈ A0 , allora X ∈ Ai per ogni i ∈ I, e dunque anche S(X) ∈ Ai per
ogni i ∈ I. Quindi S(X) ∈ A0 , e A0 soddisfa anche la condizione (ii), cioè A0 è S–saturo.
Nel sistema assiomatico ZF, l’Assioma dell’infinito afferma che:
Assioma dell’infinito. Esistono insiemi S–saturi.
9I concetti di cardinalità e di insieme finito verranno precisati in seguito.
10L’Assioma della scelta è strettamente necessario in alcune dimostrazioni/costruzioni solo nei casi in cui non si
ha un criterio “effettivo” di scelta. In questi casi, l’assioma garantisce l’esistenza di una funzione generata in modo
“non costruttivo”. Supponiamo per esempio che Ai ⊂ N: in questo caso si può definire il minimo degli Ai come criterio
di scelta, ottenendo una funzione ben definita anche senza usare l’Assioma della scelta, a questo proposito si veda
anche il Teorema 1.23. Per quanto possa sembrare “innocuo”, l’Assioma della scelta ha conseguenze sorprendenti.
Forse la più sorprendente è il cosiddetto paradosso di Banach–Tarski (scoperto da S. Banach e A. Tarski nel 1924): è
possibile decomporre la palla (solida) di raggio 1 e centro nell’origine, nello spazio tridimensionale R3 , in un numero
finito di parti (il numero minimo, come poi mostrato da R. M. Robinson, è 5) in modo tale che, con opportune
traslazioni e rotazioni, è possibile ricomporre con queste parti due palle solide di raggio 1 e centro nell’origine.
8. L’INSIEME DEI NUMERI NATURALI
15
Il nome viene dal fatto che, come vedremo, l’assioma consente di mostrare l’esistenza di insiemi con
infiniti elementi. Si noti la differenza tra infinito potenziale e attuale: nel primo caso è sufficiente
considerare teorie degli insiemi in cui tutti gli insiemi sono finiti, ma non vi è alcuna limitazione
superiore al loro numero di elementi, nel secondo caso esistono insiemi con infiniti elementi (ma
questo, appunto, deve essere garantito da qualche assioma).
Grazie al lemma precedente ha senso pensare all’intersezione di tutti gli insiemi S–saturi come il più
piccolo insieme S–saturo possibile; questo sarà per noi l’insieme dei numeri naturali. Tuttavia (come
vedremo anche più avanti) la considerazione dell’“insieme di tutti gli insiemi con qualche proprietà”
può dar luogo a contraddizioni; per aggirare questo problema adottiamo la seguente costruzione.
Sia A un insieme S–saturo. Per il Lemma 1.5, l’intersezione NA di tutti i suoi sottoinsiemi S–saturi
è un insieme S–saturo. Vogliamo verificare che questo insieme è indipendente dalla scelta di A.
Lemma 1.6. Siano A, A0 due insiemi S–saturi e siano NA , NA0 le intersezioni dei loro rispettivi
sottoinsiemi S–saturi. Allora NA = NA0 .
Dimostrazione. Si noti che A ∩ A0 è non vuoto, perché contiene Ø, e che è un sottoinsieme
S–saturo di A. Per la minimalità di NA , deve essere NA ⊆ A ∩ A0 , quindi concludiamo che NA ⊆ A0 .
Ora, la minimalità di NA0 dà NA0 ⊆ NA . Ma le ipotesi su A e A0 sono perfettamente simmetriche,
quindi un discorso analogo dà anche l’inclusione opposta NA ⊆ NA0 .
L’insieme caratterizzato dal Lemma 1.6 è indicato con N ed è detto insieme dei numeri naturali (la
“costruzione” di N qui presentata è dovuta a Von Neumann, di qui il nome di interi di Von Neumann). Esso è il “più piccolo” insieme S–saturo esistente, rispetto alla relazione d’inclusione. Sono
elementi di N gli insiemi
0=Ø
1 = S(0) = Ø ∪ {Ø} = {Ø}
2 = S(1) = {Ø} ∪ {Ø} = Ø, {Ø}
n
o
3 = S(2) = Ø, {Ø}, Ø, {Ø}
n
o
4 = S(3) = Ø, {Ø}, Ø, {Ø} , Ø, {Ø}, Ø, {Ø}
.........
dove 0, 1, 2, . . . sono i simboli convenzionalmente usati. I puntini sospensivi sottintendono l’idea
intuitiva che tutti gli elementi di N siano ottenibili iterando l’operazione S. Gli enunciati che
seguono contengono la formalizzazione rigorosa di questa idea.
Lo strumento fondamentale per ricavare le proprietà di N è il Principio di induzione.
Teorema 1.7 (Principio di induzione). Sia P (n) un predicato11 dipendente da un numero
naturale n. Se vale P (0) e, per ogni intero n, vale l’implicazione P (n) ⇒ P (S(n)), allora vale
∀n ∈ N P (n). In formule
P (0) ∧ ∀n ∈ N P (n) ⇒ P (S(n)) =⇒ ∀n ∈ N P (n) .
Dimostrazione. Sia A = {n ∈ N : P (n) vale}. Allora, per ipotesi, A è un sottoinsieme
S–saturo di N. Dunque N ⊆ A. Ma anche A ⊆ N, per cui A = N.
Si noti che l’ipotesi del principio di induzione non fa riferimento alla validità (o verità) di P (n),
ma solo alla validità dell’implicazione P (n) ⇒ P (S(n)), che a volte si può cercare di dimostrare
11In logica, un enunciato che dipende da una o più variabili n, x ecc., variabili in dati insiemi, si chiama predicato.
8. L’INSIEME DEI NUMERI NATURALI
16
indipendentemente dal “valore di verità” di P (n); esistono inoltre facili esempi12 in cui l’implicazione
è logicamente corretta ma, dato che P (0) non vale, non possiamo usare il principio di induzione
per concludere che P (n) vale per ogni n. Tuttavia, dato che P (n) ⇒ P (S(n)) non vale solo quando
P (n) è vera e P (S(n)) è falsa, quello che si fa per mostrare la validità dell’implicazione è di mostrare
che P (S(n)) vale tutte le volte che P (n) vale.
Si noti che, per ogni n ∈ N, n ⊆ S(n) = n ∪ {n}. Più in generale, il seguente risultato evidenzia
che le relazioni di inclusione stretta e di appartenenza coincidono, se ristrette a N × N, e alcune
proprietà di N e della funzione S : N → N.
Proposizione 1.8 (Proprietà del successore).
(1)
(2)
(3)
(4)
(5)
Per ogni n, S(n) 6= Ø.
Per ogni n, n ∈
/ n. Di conseguenza, n ⊂ S(n) (inclusione stretta).
m ∈ n ⇔ m ⊂ n (inclusione stretta).
m ⊆ n ⇔ m ⊂ S(n).
S(m) = S(n) ⇒ m = n.
Infine, S : N → N \ {0} è una corrispondenza biunivoca, è quindi ben definita l’applicazione“predecessore” S −1 da N \ {0} a N, e per ogni intero n non esistono interi m tali che n ∈
m ∈ S(n).
Dimostrazione. Per ogni n, n ∈ S(n). Questo dimostra (1).
Dimostriamo ora, per induzione su n, una versione più debole di (3), ovvero che m ∈ n ⇒ m ⊆ n.
Per n = 0, è ovvio. Supponiamolo vero per n e dimostriamo che m ∈ S(n) ⇒ m ⊆ S(n). Se
m ∈ S(n) allora si hanno due casi: (i) m ∈ n, e quindi per ipotesi induttiva m ⊆ n ⊆ S(n), oppure
(ii) m = n, nel qual caso m ⊆ n ∪ {n} = S(n).
Sfruttando questo fatto, dimostriamo (2) per induzione su n. Per n = 0 è ovvio. Supponiamolo
vero per n e dimostriamo che S(n) ∈
/ S(n). Per assurdo, sia S(n) ∈ S(n). Allora S(n) ∈ n ∪ {n}
e quindi (i) S(n) ∈ n oppure (ii) S(n) ∈ {n}. Nel primo caso, per quanto visto sopra, S(n) ⊆ n e
quindi n ∈ n: assurdo per ipotesi induttiva. Nel secondo caso S(n) = n e quindi si ritrova l’assurdo
n ∈ n. Questo dimostra (2).
Sfruttando (2) possiamo migliorare l’affermazione precedente, dimostrando che m ∈ n ⇒ m ⊂ n.
Questo dimostra una implicazione nella (3). L’altra implicazione si dimostra di nuovo per induzione
su n ed è lasciata per esercizio.
Al punto (4) l’implicazione ⇒ segue immediatamente dalla (2). Supponiamo ora m ⊂ S(n) e
mostriamo che m ⊆ n. Da m ⊂ S(n), per la (3) si ha m ∈ n ∪ {n}; se m = n l’inclusione m ⊆ n da
dimostrare è ovvia. Se invece m ∈ n allora sempre per la (3) otteniamo m ⊆ n.
Dimostriamo ora la (5). Supponiamo che S(n) = S(m). Ne consegue che n ∈ m ∪ {m} e quindi
n = m oppure n ∈ m. Nel primo caso, abbiamo verificato la (5). Nel secondo caso, segue dalla (3)
che n ⊂ m e quindi S(n) = n ∪ {n} ⊆ m ⊂ m ∪ {m} = S(m): assurdo.
L’iniettività di S è l’enunciato (5). Se, per assurdo, l’immagine di S non contenesse un elemento
n 6= 0, l’insieme N \ {n} sarebbe S–saturo, in contrasto con la minimalità di N. Quindi, tenendo
anche conto del punto (1), S(N) = N \ {0}.
Infine, se per un certo n ∈ N esistesse m ∈ N tale che n ∈ m ∈ S(n), troveremmo per la (3) le
inclusioni strette n ⊂ m ⊂ S(n). D’altro canto S(n) = n ∪ {n} sarebbe un sottoinsieme di m,
assurdo.
12Ad esempio se P (n) è il predicato “1/(S(n)) < 0”, ove ≤ è l’ordinamento (naturale) in N che rispetta le regole
aritmetiche e che introdurremo rigorosamente nelle pagine successive.
8. L’INSIEME DEI NUMERI NATURALI
17
Osservazione 1.9 (Assioma di buona fondazione). Più in generale, nel sistema ZF, l’Assioma
di buona fondazione afferma ogni insieme non vuoto A ha almeno un elemento disgiunto da A, in
formule
∀A∃y (y ∈ A) ∧ (A ∩ y = ∅).
È facile vedere che questo assioma consente non solo di escludere che X ∈ X per qualsiasi insieme
X (si consideri A = {X}), ma anche di mostrare che la mappa S è “iniettiva”, i.e. X 6= Y implica
S(X) 6= S(Y ) (se S(X) = S(Y ) e X 6= Y , si consideri A = {X, Y }).
Si provi per esercizio, usando l’assioma di buona fondazione, che (a, b) = {a, {a, b}} è ancora una
buona definizione di coppia, oltre a quella (a, b) = {{a}, {a, b}} già vista in precedenza.
Definiamo ora le relazioni ≤ e < su N come segue:
m ≤ n ⇐⇒ m ⊆ n,
m < n ⇐⇒ m ⊂ n.
Per le proprietà dell’inclusione è chiaro che ≤ è una relazione d’ordine. Inoltre la Proposizione 1.8
afferma che, dato n ∈ N, non esistono elementi m ∈ N con n < m < S(n).
Proposizione 1.10.
(1) La relazione ≤ è un ordinamento totale su N.
(2) Ogni sottoinsieme di N non vuoto ha minimo.
Dimostrazione. Dimostriamo (1) per induzione su m, studiando la proposizione (ove per “n
confrontabile con m” si intende n ≤ m o m ≤ n)
P (m) : “ogni n ∈ N è confrontabile con m”.
Per ogni insieme X, Ø ⊆ X. Ne segue che P (0) è vera. Supponiamo vera P (m). Per ogni n ∈ N,
si hanno allora due casi: (i) n ≤ m, nel qual caso n < S(m), oppure (ii) m < n, i.e. m ⊂ n. In
questo secondo caso, per la Proposizione 1.8 (3), si hanno le seguenti implicazioni:
m ⊂ n =⇒ m ∈ n =⇒ m ∪ {m} ⊆ n =⇒ S(m) ≤ n .
Quindi in entrambi i casi n è confrontabile con S(m) e vale P S(m) .
Dimostriamo per prima cosa la (2) per assurdo, ma sotto l’ipotesi aggiuntiva che B sia una semiretta,
vale a dire n ∈ B e n ≤ n0 implica n0 ∈ B. Sia quindi B una semiretta non vuota e priva di minimo.
Mostriamo sotto queste ipotesi, per induzione su n, che n ∈
/ B per ogni n ∈ N, il che ci darà
l’assurdo. Evidentemente 0 ∈
/ B (altrimenti 0 sarebbe il minimo di B); se fosse n ∈
/ B e S(n) ∈ B,
la proprietà di semiretta ci darebbe S(n) ≤ m per ogni m ∈ B; se infatti fosse m < S(n), non
essendoci interi intermedi tra n e S(n) avremmo m ≤ n e quindi n ∈ B (grazie alla proprietà di
semiretta), assurdo. La (2) è quindi mostrata per semirette.
Per dimostrare la (2) in generale, sia B ⊆ N non vuoto e consideriamo la semiretta
B 0 = {n ∈ N : ∃ m ∈ B tale che m ≤ n}
dei naturali che maggiorano un elemento di B, che contiene B e quindi è non vuota. Allora B 0 ha
un elemento minimo n0 . Se mostriamo che n0 appartiene a B otteniamo che n0 è anche minimo di
B, per l’inclusione B 0 ⊆ B. Dal fatto che n0 ∈ B 0 deduciamo che esiste un elemento m di B tale
che m ≤ n0 ; per la minimalità di n0 deve essere m = n0 , quindi n0 ∈ B.
Grazie all’ordinamento totale di N possiamo generalizzare il principio di induzione come segue:
chiamiamo una proprietà P induttiva se vale l’implicazione P (n) ⇒ P (S(n)).
9. CARDINALITÀ DI INSIEMI
18
Corollario 1.11 (Induzione generalizzata). Sia P (n) una proprietà induttiva. Allora o P (n)
non vale per alcun n o esiste n0 ∈ N tale che
P (n)
⇐⇒
vale
n0 ≤ n .
Dimostrazione. Sia B = {n ∈ N : P (n) è vera} e supponiamo che B non sia vuoto, altrimenti
la tesi è ovvia. B ha quindi un minimo elemento n0 , da cui deduciamo che vale l’implicazione ⇒
nella tesi. Per ottenere l’implicazione ⇐ basta applicare il principio di induzione alla proprietà
induttiva
Q(n) = (n < n0 ) ∨ P (n)
per ottenere che Q(n) vale per ogni n, quindi P (n) vale per ogni n ∈ N tale che n0 ≤ n.
9. Cardinalità di insiemi
La teoria che illustreremo in questa sezione è dovuta, nelle sue linee generali, a G. Cantor, intorno
al 1870.
• Si dice che un insieme A ha la stessa cardinalità, o potenza, di un insieme B se esiste
una funzione bigettiva di A in B.
Si dice anche che A è equipotente a B. Si vede facilmente che:
• un insieme A è equipotente a se stesso (perché ιA è bigettiva);
• se A è equipotente a B, B è equipotente ad A (perché se f : A → B è bigettiva, anche
f −1 : B → A lo è);
• se A è equipotente a B e B è equipotente a C, allora A è equipotente a C (perché se
f : A → B e g : B → C sono bigettive, allora g ◦ f : A → C è bigettiva).
La “relazione” di equipotenza gode dunque delle proprietà riflessiva, simmetrica e transitiva che
caratterizzano le relazioni di equivalenza. Ma su quale insieme è definita la relazione?
Vorremmo poter prendere “l’insieme di tutti gli insiemi”, ma cosı̀ facendo andremmo in contrasto
con gli assiomi del sistema ZF.13 Accontentiamoci dunque di affermare che su un qualunque insieme
Ω, l’equipotenza (che indichiamo con ∼) è in effetti una relazione di equivalenza in P(Ω), le cui
classi di equivalenza chiameremo cardinalità.
L’idea intuitiva dietro queste nozioni è che due insiemi sono equipotenti se “sono ugualmente
numerosi”. Questa intuizione è corretta per insiemi finiti: un insieme con 37 elementi può essere
posto in corrispondenza biunivoca solo con un altro insieme di 37 elementi (v. Teorema 1.16).
Per insiemi infiniti la questione è molto più delicata, ed è per questo motivo che la trattazione
deve essere particolarmente accurata sul piano formale. Trasferire a insiemi infiniti la nostra prima
intuizione porta facilmente a errori. Si può ad esempio mostrare che gli insiemi N, Z, Q e Nn
(n ∈ N∗ ) sono equipotenti a due a due, cosı̀ come gli insiemi (molto più numerosi)
{0, 1}N ,
NN ,
R,
Rn ,
RN
(qui R indica l’insieme dei numeri reali, del quale si parlerà più avanti).
Proprio in relazione agli esempi appena illustrati, vogliamo ora dire che certi insiemi sono “meno
numerosi di altri”. Stabiliamo allora una relazione di “minore numerosità” R nel modo seguente:
Siano A, A0 sottoinsiemi di Ω; diciamo che A R A0 se esiste f : A → A0 iniettiva.
13L’insieme E di tutti gli insiemi avrebbe la proprietà E ∈ E, in contrasto con l’Assioma di buona fondazione
(vedi l’Osservazione 1.9).
9. CARDINALITÀ DI INSIEMI
19
La nostra intuizione con insiemi finiti ci dice che se A ha n elementi e A0 ha n0 elementi, esiste una
funzione iniettiva di A in A0 se e solo se n ≤ n0 . Dunque la validità della relazione A R A0 dipende
(per insiemi finiti) solo dalla cardinalità di A e A0 . Il seguente lemma afferma che ciò è vero per
insiemi generici.
Lemma 1.12. Supponiamo che A R A0 , e siano B, B 0 ∈ P(Ω) con B ∼ A, B 0 ∼ A0 . Allora B R B 0 .
Dimostrazione. Per ipotesi, esistono:
(1) f : A −→ A0 iniettiva;
(2) g : B −→ A bigettiva;
(3) h : B 0 −→ A0 bigettiva.
Consideriamo allora la composizione h−1 ◦ f ◦ g : B −→ B 0 ,
g
f
h−1
B −→ A −→ A0 −→ B 0 .
Essendo una composizione di funzioni iniettive, essa è iniettiva.
Possiamo allora “passare la relazione R al quoziente modulo ∼”, per definire una relazione sull’insieme quoziente delle cardinalità.
Siano C, C 0 due cardinalità. Diciamo che C C 0 se, presi A ∈ C e A0 ∈ C 0 , si ha A R A0 .
Il Lemma 1.12 ci assicura che questa è una buona definizione, ossia che la conclusione A R A0 non
dipende dalla scelta di A e A0 come rappresentanti di C e C 0 rispettivamente.
Vogliamo vedere che è una relazione d’ordine tra cardinalità. Le proprietà riflessiva e transitiva
sono facili da verificare (la transitività, in particolare, si basa sul fatto che la composizione di funzioni iniettive è iniettiva). Dimostrare la proprietà antisimmetrica vuol dire dimostrare il seguente
teorema.
Teorema 1.13 (Cantor–Bernstein). Siano A, B insiemi e supponiamo che esistano funzioni
f : A → B e g : B → A iniettive. Allora A e B sono equipotenti.
Dimostrazione. È utile pensare che A e B siano disgiunti. Questo non è restrittivo, sostituendo eventualmente A e B con insiemi di uguale cardinalità per ridursi a questo caso. Può anche
essere utile pensare che sia B \ f (A) che A \ g(B) siano non vuoti, altrimenti la tesi è banale. Dato
a ∈ A, possiamo generare consecutivamente “figli” f (a) ∈ B, “nipoti” g(f (a)) ∈ A, “pronipoti”
f (g(f (a))) ∈ B e cosı̀ via (vedi la Figura 1). In maniera analoga ogni elemento b ∈ B genera
successivamente g(b) ∈ A, f (g(b)) ∈ B, g(f (g(b))) ∈ A e cosı̀ via. L’idea chiave è che, essendo
tutte queste mappe iniettive (e quindi invertibili, se ristrette alla loro immagine), possiamo fare
il procedimento a ritroso, dividendo A in tre insiemi a due a due disgiunti: l’insieme AA degli
elementi a ∈ A che o appartengono a A \ g(B) o hanno come primo progenitore un elemento a0 di A
(che necessariamente dovrà appartenere a A \ g(B)), l’insieme AB degli elementi a ∈ A che hanno
come primo progenitore un elemento b di B (che necessariamente dovrà appartenere a B \ f (A)),
infine l’insieme A∞ degli elementi di A che non hanno un primo progenitore. Fatta una analoga
decomposizione dell’insieme B, in tre insiemi a due a due disgiunti BB ⊇ B \ f (A), BA e B∞ , è
evidente che la mappa f porta bigettivamente non solo A∞ in B∞ , ma anche AA in BA , perché ogni
elemento b ∈ BA deve essere immagine tramite f di un elemento a ∈ A, che andando a ritroso ha
necessariamente un primo progenitore in A (a stesso, eventualmente). Tuttavia, f non è surgettiva
da AB in BB , perché f (AB ) ⊆ f (A) e BB ⊇ B \ f (A) 6= Ø. Ma, per simmetria rispetto al ragionamento già fatto per f , g mappa bigettivamente BB in AB , quindi l’inversa h della restrizione di g
9. CARDINALITÀ DI INSIEMI
20
a BB mappa bigettivamente AB su BB . Incollando quindi queste due mappe, i.e. definendo


f (a) se a ∈ AA ∪ A∞ ;
H(a) :=


h(a) se a ∈ AB
otteniamo una bigezione tra A e B.
È un utile esercizio quello di tradurre in formule la dimostrazione discorsiva su riportata: indicata
con (g ◦ f )(n) l’n–sima iterata di g ◦ f : A −→ A (con la convenzione (g ◦ f )(0) = ιA ), si ha
A∞ =
∞
\
(g ◦ f )(n) (A),
n=0
∞
[
AA =
(g ◦ f )(n) (A \ g(B)) .
n=0
Gli insiemi B∞ e BB sono definiti analogamente e, posto AB = g(BB ) e BA = f (AA ), si tratta
di mostrare che con queste definizioni (A∞ , AA , AB ) e (B∞ , BB , BA ) sono partizioni di A e B
rispettivamente.
f
g
g(f(A))
f(g(B))
B
f
A
Figura 1
Corollario 1.14. La relazione tra cardinalità è un ordinamento.
Si noti che per il momento abbiamo solo dimostrato che è un ordinamento parziale. Come vedremo più avanti, facendo uso dell’Assioma della scelta, si dimostra che si tratta di un ordinamento
totale.
11. INSIEMI FINITI E INFINITI
21
10. Cardinalità di P(A)
Ricordiamo che l’insieme P(A) delle parti di A è l’insieme di tutti i sottoinsiemi di A, mentre indicheremo con Pfin (A) l’insieme delle parti finite di A. Dimostriamo due proprietà della cardinalità
di P(A):
Teorema 1.15. Valgono le seguenti relazioni:
(i) card P(A) = card {0, 1}A ;
(ii) card P(A) card A.
Dimostrazione. Per dimostrare la (i), definiamo per prima cosa la funzione caratteristica
χB : A → {0, 1} di B ⊆ A come segue:
(
1 se a ∈ B
χB (a) =
0 se a ∈ A \ B .
Definiamo ora la mappa Φ : P(A) → {0, 1}A che associa a B ∈ P(A) la funzione χB . Si verifica
facilmente che Φ è iniettiva. Per la surgettività,
basta osservare che ogni funzione f da A in {0, 1}
−1
è la funzione caratteristica di f
{1} .
Per dimostrare la (ii) bisogna provare che da A a P(A) esistono applicazioni iniettive, ma nessuna
che sia bigettiva. È evidente che la funzione f (a) = {a} è iniettiva da A in P(A). Supponiamo
per assurdo che g : A → P(A) sia surgettiva. Poniamo
A0 = a ∈ A : a 6∈ g(a) .
Allora esiste a0 tale che A0 = g(a0 ). Ci sono due casi, a0 ∈ A0 e a0 ∈
6 A0 . Se a0 ∈ A0 , allora
0
0
0
a0 6∈ g(a0 ) = A , il che è assurdo. Se a0 6∈ A , allora a0 ∈ g(a) = A , che è ancora assurdo.14
Questo teorema mostra che non esistono cardinalità massimali. Come vedremo, questo è particolarmente interessante per insiemi infiniti. Per esempio,
card N ≺ card P(N) ≺ card P P(N) ≺ · · ·
11. Insiemi finiti e infiniti
Vediamo in questo paragrafo come si definiscono rigorosamente gli insiemi finiti e le loro cardinalità.
Lemma 1.16. Per n ∈ N, sia En = {k ∈ N : k < n}. Se m < n, allora card Em è strettamente
minore di card En .
Dimostrazione. È evidente che card Em card En , perché Em ⊂ En e dunque esiste la
funzione iniettiva di inclusione ι : Em → En . Mostriamo che invece non può esistere un’applicazione
iniettiva di En in Em .
Proviamo per induzione su m che ∀ n > m, non esiste una funzione iniettiva di En in Em . Per
m = 0 la tesi è ovvia perché E0 = Ø mentre 0 ∈ En se n > 0. Supponiamo la tesi vera per m e sia
n > S(m). Ammettiamo per assurdo che esista f : En → ES(m) iniettiva. Poniamo n0 = S −1 (n).
È allora chiaro che En = En0 ∪ {n0 }, ES(m) = Em ∪ {m} e n0 > m.
14Si noti che questa dimostrazione trae ispirazione dalla famosa antinomia di Russel, dell’insieme {x : x ∈
/ x}
degli insiemi che non appartengono a se stessi. L’esistenza di questa antinomia ha determinato regole più restrittive
in ZF per la generazione di insiemi e ha ispirato l’assioma di buona fondazione.
12. IL LEMMA DI ZORN
22
Se f (n0 ) = m, allora, per l’iniettività, f (En0 ) ⊆ Em e dunque f |En0 sarebbe una funzione iniettiva
di Em in En0 , contro l’ipotesi induttiva.
Se f (n0 ) = k < m, si consideri l’applicazione bigettiva σ : ES(m) → ES(m) , tale che σ(k) = m,
σ(m) = k e σ(p) = p per ogni altro p ∈ ES(m) . Posto g = σ ◦ f , si ricade nel caso precedente. A questo punto, si definisce finito un insieme che sia equipotente a uno (e dunque uno solo) degli
En . Se A ∼ En , si pone card A = n. Un insieme non equipotente a nessun En si dice infinito.
Teorema 1.17. Se A è infinito, allora card A card N. In particolare, card A n per ogni n ∈ N.
Dimostrazione. Applichiamo l’assioma della scelta come segue:
(a) prendiamo Pfin (A) come insieme I degli indici;
(b) dato F ∈ Pfin (A), poniamo AF = A \ F .
Siccome A è infinito, AF è non vuoto per ogni F ∈ Pfin (A). Per l’assioma della scelta, a ogni
F ∈ Pfin (A) possiamo dunque associare un elemento σ(F ) ∈ A \ F . Definiamo allora f : N −→ A
con il seguente procedimento induttivo (questo tipo di definizione è anche detto ricorsivo e può
essere formalizzato usando il principio di induzione):
(i) scegliamo f (0) in modo arbitrario;
(ii) supponendo definiti f (0), f (1), . . . , f (n), definiamo f S(n) = σ {f (0), f (1), . . . , f (n)} .
Si noti che la (ii) implica che, se m < n, f (n) 6= f (m), e dunque f risulta iniettiva.
Un insieme infinito A equipotente a N si dice numerabile. La cardinalità di N si indica con il simbolo
ℵ0 (aleph con zero).
12. Il Lemma di Zorn
Il Lemma di Zorn è un enunciato equivalente all’Assioma della scelta. Di esso viene fatto frequente
uso in vari campi della matematica avanzata, per mostrare attraverso l’esistenza di opportuni
oggetti in modo non costruttivo (e in genere per tali oggetti una dimostrazione di esistenza per via
costruttiva non è possibile). Per poterlo enunciare, dobbiamo premettere alcune nozioni relative a
insiemi ordinati.
Il Lemma di Zorn riguarda una classe speciale di insiemi ordinati, detti induttivi, cosı̀ definiti:
• Un insieme ordinato (A, ≤) si dice induttivo se ogni catena C di A (cioè ogni sottoinsieme
totalmente ordinato) possiede maggioranti, ovvero esiste a ∈ A tale che c ≤ a per ogni
c ∈ C.
Si noti che la definizione stessa implica che un insieme induttivo non è vuoto. Infatti la catena
vuota deve avere un maggiorante in A.
Teorema 1.18 (Lemma di Zorn). Sia (A, ≤) un insieme ordinato induttivo. Per ogni a ∈ A
esiste un elemento massimale m tale che a ≤ m.
Si noti che per insiemi finiti la dimostrazione è elementare: se a stesso non è massimale, esiste
a1 ∈ A con a < a1 ; se neanche a1 lo è, esiste a2 ∈ A con a1 < a2 , e cosı̀ via. Essendo tutti
gli ai distinti, il processo termina su un elemento massimale. L’assioma della scelta consente di
formalizzare questo procedimento anche per insiemi infiniti: la difficoltà deriva dal fatto che, se il
processo su descritto non dovesse terminare, potremmo pure prendere un maggiorante m di tutti
gli ai , i ∈ N, ma nessuno ci assicurerebbe che esso sia massimale (troveremmo quindi m1 con
m < m1 ...., in una spirale senza fine di iterazioni).
12. IL LEMMA DI ZORN
23
Mostriamo ora alcune applicazioni del Lemma di Zorn, rinviando la dimostrazione di quest’ultimo
al paragrafo successivo. La prima applicazione riguarda l’ordinamento tra cardinalità.
Teorema 1.19. Dati due insiemi A e B, esiste sempre una funzione iniettiva di A in B o di B in
A. Quindi l’ordinamento tra cardinalità è totale.
Dimostrazione. La conclusione è ovvia se A o B è vuoto (se per esempio A = Ø, si prenda
la funzione vuota Ø : Ø → B). Supponiamo dunque che A e B siano non vuoti.
Indichiamo con X l’insieme delle funzioni bigettive f : A0 → B 0 , dove A0 ⊆ A, B 0 ⊆ B. Chiaramente
X non è vuoto, perché, fissati a ∈ A e b ∈ B, la funzione f : {a} → {b} tale che f (a) = b è bigettiva.
Per dimostrare la tesi, occorre dimostrare l’esistenza di una funzione f ∈ X che abbia come dominio
tutto A, oppure come immagine tutto B. Nel primo caso, allargando il codominio di f da B 0 a
B, otteniamo una funzione iniettiva da A in B; nel secondo caso, facciamo la stessa operazione su
f −1 : B → A0 , ottenendo una funzione iniettiva di B in A.
Su X definiamo il seguente ordinamento:
(f : A0 → B 0 ) (g : A00 → B 00 ) , ⇐⇒ A0 ⊆ A00 , B 0 ⊆ B 00 e f = g|A0 ,
(in termini puramente insiemistici, f ⊆ A0 × B 0 , g ⊆ A00 × B 00 ; allora f g se e solo se f ⊆ g).
Si verifica facilmente che è una relazione d’ordine (parziale a meno che A e B non contengano
un unico elemento). Mostriamo che (X, ) è induttivo.
S
S
Sia C = {fi : Ai → Bi : i ∈ I} una catena di X. Poniamo A = i∈I Ai , B = i∈I Bi , e sia
f : A → B la funzione il cui grafico è l’unione dei grafici delle fi .15 È evidente che fi f per ogni
i ∈ I, e dunque f è un maggiorante di C in X.
Essendo dunque X induttivo, per il Lemma di Zorn, esso ammette un elemento massimale f0 :
A0 → B 0 . Se A0 e B 0 fossero entrambi sottoinsiemi propri di A e B rispettivamente, potremmo
scegliere a ∈ A \ A0 e b ∈ B \ B 0 e definire f1 : A0 ∪ {a} → B 0 ∪ {b} ponendo
(
f0 (a) se a ∈ A0 ,
f1 (a) =
b
se a = a .
Avremmo allora f1 ∈ X e f0 ≺ f1 , in contrasto con l’ipotesi di massimalità di f0 .
Teorema 1.20 (Esistenza di ordinamenti totali). Ogni insieme ammette un ordinamento
totale.
Dimostrazione. Sia A un insieme, che supponiamo non vuoto16. Chiamiamo X l’insieme
delle coppie (A0 , ≤), dove A0 ⊆ A e ≤ è un ordinamento totale su A0 . Su X definiamo la relazione
(A0 , ≤) (A00 , v) ⇐⇒ A0 ⊆ A00 e v|A0 =≤ .
L’insieme X non è vuoto perché i sottoinsiemi di A contenenti un unico elemento ammettono
un ovvio ordinamento totale. In modo analogo al teorema precedente, si dimostra che (X, ) è
induttivo. Per il lemma di Zorn, esiste un elemento massimale (A0 , ≤). Se fosse A0 6= A, potremmo
prendere a ∈ A \ A0 e definire un ordinamento totale su A0 ∪ {a} che estenda ≤, stabilendo, per
esempio, che a sia l’elemento massimo. Questo contrasterebbe con l’ipotesi di massimalità.
Come abbiamo anticipato, il Lemma di Zorn è equivalente all’Assioma della scelta. La dimostrazione nel prossimo paragrafo mostrerà che, assumendo vero l’Assioma della scelta, si dimostra il
Lemma di Zorn. Mostriamo qui che, viceversa, assumendo vero il Lemma di Zorn, si dimostra
l’Assioma della scelta.
15Si noti che, in generale, l’unione di grafici non è un grafico.
16Se A = Ø, la relazione Ø è un ordinamento totale.
13. IL TEOREMA DI ZERMELO
24
Teorema 1.21. Il Lemma di Zorn implica l’Assioma della scelta.
Dimostrazione. Sia {Ai : i ∈ I} una famiglia non vuota di insiemi non vuoti a due a due
disgiunti. Poniamo
n
o
[
X= B⊂
Ai : ∀ i ∈ I , B ∩ Ai contiene al più un elemento .
i∈I
Chiaramente X è non vuoto (Ø ∈ X). Ordinando X per inclusione,
mostriamo che (X, ⊆) è
S
induttivo. Se C = {Bj : j ∈ J} è una catena, prendiamo B = j∈J Bj . Dobbiamo mostrare che
B ∈ X. Supponiamo per assurdo che esista i ∈ I tale che B ∩ Ai contenga due elementi distinti
b1 , b2 . Esisteranno allora j1 , j2 tali che b1 ∈ Bj1 e b2 ∈ Bj2 . Siccome C è totalmente ordinato,
uno dei due è contenuto nell’altro. Supponiamo che B2 ⊆ B1 , per cui b1 , b2 ∈ Bj1 . Ma allora
b1 , b2 ∈ Bj1 ∩ Ai . Ma poiché Bj1 ∈ X, deve essere b1 = b2 , da cui l’assurdo.
Per il Lemma di Zorn, X ammette un elemento massimale B0 . Mostriamo che per ogni i ∈ I,
B0 ∩ Ai contiene esattamente un elemento. Se, per assurdo, esistesse i0 tale che B0 ∩ Ai0 = Ø,
scegliendo17 un elemento b ∈ Ai0 , avremmo l’insieme B1 = B0 ∪ {b} ∈ X, strettamente maggiore
di B0 , contrariamente all’ipotesi di massimalità.
13. Il Teorema di Zermelo
Un ordinamento su A si dice un buon ordinamento se ogni sottoinsieme non vuoto possiede un
elemento minimo. Per esempio, la Proposizione 1.10 dimostra che l’ordinamento standard su N è
un buon ordinamento.
Un altro esempio è dato dall’ordinamento lessicografico su N2 :
(m, n) ≤ (m0 , n0 ) ⇐⇒ m < m0 oppure m = m0 e n ≤ n0 .
È chiaro che ogni buon ordinamento su A è totale: per confrontare due suoi elementi a e b basta
prendere in esame il sottoinsieme {a, b}. È anche chiaro che ogni buon ordinamento su A ammette
un minimo assoluto: basta prendere in esame il sottoinsieme A. Il seguente teorema, noto anche
come Principio del buon ordinamento, è invece più delicato; la sua dimostrazione è una variante di
quella utilizzata per mostrare il Teorema 1.20.
Teorema 1.22 (Teorema di Zermelo). Ogni insieme ammette un buon ordinamento.
Nel corso della dimostrazione diremo che un sottoinsieme B di un insieme ordinato (A, ≤) è un
segmento (iniziale) di A se
∀ b ∈ B , (a ∈ A e a < b) =⇒ a ∈ B .
Dimostrazione. Dato un insieme A, sia X l’insieme delle coppie (B, ≤) dove B ⊆ A e ≤ è un
buon ordinamento su B. Su X introduciamo la relazione d’ordine
(B, ≤) (B 0 , v) ⇐⇒ B è un segmento di B 0 e v|B =≤ .
S
S
è un insieme
Se (Bi , ≤i ) i∈I è una catena in X, si verifica facilmente che
i∈I Bi , i∈I ≤i S
ordinato, e che ogni Bi ne è un segmento. Mostriamo che è bene ordinato: se Z ⊆ i∈I Bi è non
vuoto, esiste i tale che Z ∩ Bi è non vuoto, esiste quindi il minimo z di Z ∩ Bi . Ogni elemento
z 0 ∈ Z minore di z appartiene, per la proprietà di segmento di Bi , anche a Bi , quindi la minimalità
di z in Z ∩ Bi implica la minimalità di z in Z. Quindi (X, ) è induttivo.
17Si sceglie qui da un unico insieme, quindi non stiamo usando l’assioma di scelta!
13. IL TEOREMA DI ZERMELO
25
Sia allora (B, ≤) un elemento massimale di X. Se B fosse un sottoinsieme proprio di A, potremmo
prendere un elemento a ∈ A \ B e introdurre su B ∪ {a} l’ordinamento che estende ≤, ponendo
a come massimo di B ∪ {a}. Si vede facilmente che questo sarebbe un buon ordinamento, contro
l’ipotesi di massimalità di (B, ≤).
Come si vede, nella dimostrazione è stato usato il Lemma di Zorn, ossia l’Assioma della scelta. In
realtà il Teorema di Zermelo è equivalente all’Assioma della scelta, come ora dimostriamo.
Teorema 1.23. Il prodotto cartesiano di qualunque famiglia non vuota di insiemi non vuoti contenuti in un insieme bene ordinato è non vuoto. In particolare il Teorema di Zermelo implica
l’Assioma della scelta.
S
Dimostrazione. Sia A = {Ai : i ∈ I} la famiglia di insiemi. Sia A = i∈I Ai la loro unione e
supponiamo che A sia bene ordinato. Allora, per ogni i ∈ I, il sottoinsieme Ai di A ammette un
minimo ai . La funzione
f : I → A,
i 7→ ai
è un elemento del prodotto cartesiano Πi∈I Ai .
Si noti che la definizione di f non richiede alcuna scelta arbitraria; in particolare questa definizione
non richiede l’Assioma della scelta.
Sugli insiemi bene ordinati (A, ≤) privi di massimo è possibile definire la funzione successore a 7→
S(a), i.e. un elemento b > a tale che a < b0 implica b ≤ b0 :
S(a) = min {b ∈ A : a < b} .
Si noti anche che S è iniettiva: infatti c < S(c) per definizione di S; se a < b allora a < S(a) ≤ b <
S(b). Tuttavia S non è in generale surgettiva, ad esempio nell’insieme bene ordinato N t N0 , dove
N0 = {n0 : n ∈ N} è una copia (distinta) di N come insieme ordinato e tutti gli elementi di N sono
minori di tutti gli elementi di N0 , l’elemento 0’ di N0 non appartiene all’immagine di S. Quindi la
funzione “predecessore” S −1 non è sempre definita su tutto A \ {min A}.
Un’altra operazione possibile in insiemi bene ordinati (A, ≤) è quella che associa a un insieme
B ⊆ A superiormente limitato il suo estremo superiore, ovvero il minimo dei maggioranti di B.
Vale inoltre la seguente forma estesa del principio di induzione.
Proposizione 1.24 (Induzione transfinita). Sia (A, ≤) un insieme bene ordinato e sia P (a) un
enunciato dipendente da a ∈ A. Se per ogni a ∈ A vale l’implicazione
(∀a0 < a P (a0 )) =⇒ P (a)
allora vale P (a) per ogni a ∈ A.
Dimostrazione. Si noti che, se a0 = min A, allora l’ipotesi della proposizione implica che
P (a0 ) vale (perché la premessa nell’implicazione, che andrebbe scritta più precisamente nella forma
∀a0 ((a0 ≥ a) ∨ P (a0 )), è verificata). Se l’insieme B degli elementi di A tali che P non vale è non
vuoto, l’implicazione nell’ipotesi è violata prendendo come a > a0 il minimo di B.
Si noti anche che la formulazione dell’induzione transfinita non usa la funzione successore, a differenza di quello che abbiamo visto in N. Questo è dovuto al fatto che non è possibile in generale
definire, al contrario di quello che abbiamo visto in N∗ , una funzione predecessore in A \ {min A}.
14. *DIMOSTRAZIONE DEL LEMMA DI ZORN
26
14. *Dimostrazione del Lemma di Zorn
Per la dimostrazione del lemma di Zorn faremo uso di alcune proprietà elementari degli insiemi
bene ordinati, ma non del teorema di Zermelo (che abbiamo mostrato usando il lemma di Zorn).
Sia (A, ≤) un insieme induttivo. Mostreremo che esiste in A un elemento m massimale. Per ottenere
la versione originale del lemma di Zorn che stabilisce, dato a ∈ A, l’esistenza di un elemento
massimale m tale che a ≤ m, basterà applicare il risultato all’insieme A0 = {x ∈ A : a ≤ x} che è
non vuoto, e induttivo se munito della relazione di ordine indotta da A.
Per l’assioma di scelta, esiste una funzione f : P(A) \ {∅} → A tale che f (B) ∈ B per ogni B ⊆ A
non vuoto. Indicheremo con a∗ il valore f (A).
Data una tale funzione di scelta f , definiamo f -catena un sottoinsieme non vuoto C di A tale che:
(a) C è bene ordinato (in particolare è una catena);
(b) per ogni a ∈ C vale
(14.1)
a = f {x ∈ A : b < x per ogni b ∈ C, b < a} .
Si noti che la (14.1) ha senso, perché l’insieme {x ∈ A : b < x per ogni b ∈ C, b < a} contiene
almeno a. Si noti anche che l’insieme delle f -catene è non vuoto. Basta prendere C = {a∗ }: in
questo caso l’insieme degli x ∈ A tali che b < x per ogni b ∈ C, b < a∗ , coincide con A. Per
esprimere la condizione b ∈ C e b < a useremo nel seguito di questa dimostrazione la notazione
suggestiva b ∈ C ∩ (−∞, a). Possiamo quindi riformulare la (14.1) come segue:
per ogni a ∈ C, vale a = f (Ma ), dove Ma è l’insieme dei maggioranti stretti di C ∩ (−∞, a).
Verifichiamo ora che:
(14.2)
date due f -catene C e C 0 , una è sempre un segmento iniziale dell’altra.
Più precisamente, mostreremo che C e C 0 hanno lo stesso minimo e che C ⊆ C 0 o C 0 ⊆ C. Se
c∗ = min C abbiamo infatti dalla (14.1) che c∗ = a∗ ; lo stesso ragionamento per C 0 mostra che a∗
deve anche essere il minimo di C 0 . Consideriamo ora la classe S dei segmenti non vuoti di C ∪ C 0
contenuti in C ∩ C 0 , vale a dire S ∈ S se e solo se S ⊆ C ∩ C 0 e vale l’implicazione
(14.3)
c ∈ C ∪ C 0 , x ∈ S, c < x
=⇒
c ∈ S.
Osserviamo che la classe S è non vuota, dato che {a∗ } ∈ S, e che l’unione di una famiglia qualsiasi
di elementi di S appartiene a S. Grazie a questa stabilità di S, l’elemento massimo S∗ di S esiste.
Mostreremo che S∗ = C o S∗ = C 0 , il che ci darà in particolare che C ⊆ C 0 o C 0 ⊆ C. A tal fine,
supponiamo per assurdo che C \ S∗ e C 0 \ S∗ siano entrambi non vuoti e indichiamo con b e b0 i
rispettivi elementi minimi (qui usiamo in maniera essenziale il fatto che le f -catene sono insiemi
bene ordinati). Mostriamo che
(14.4)
C ∩ (−∞, b) = C 0 ∩ (−∞, b0 ) .
Per simmetria, ci basta mostrare l’inclusione ⊆ nella (14.4). Se x ∈ C e x < b, allora per la
minimalità di b deve essere x ∈ S∗ , quindi x ∈ C 0 . Se non fosse x < b0 avremmo o x = b0 , ma questo
è escluso dal fatto che b0 ∈
/ S∗ , o b0 < x. In quest’ultimo caso la proprietà di segmento (14.3) di S∗
0
0
(con c = b ) darebbe b ∈ S∗ , che non può valere. Questo mostra la (14.4). Applicando la (14.1)
all’elemento b della f -catena C e all’elemento b0 della f -catena C 0 , otteniamo b = f (L) e b0 = f (L),
ove L è l’insieme dei maggioranti stretti dell’insieme nella (14.4). Ma allora b = b0 ∈ C ∩ C 0 .
Potremmo allora estendere S∗ aggiungendo b; si noti che per minimalità di b in C \ S∗ e di b0 in
C 0 \S∗ , l’insieme S∗ ∪{b} = S∗ ∪{b0 } resta ancora un segmento di C ∪C 0 , questo dà l’assurdo cercato
e mostra che per ogni coppia di catene una delle due è sempre un segmento iniziale dell’altra.
15. ESERCIZI
27
Ora possiamo concludere la dimostrazione usando (14.2) delle f -catene. Usando questa proprietà,
come abbiamo visto nella dimostrazione del teorema di Zermelo, otteniamo subito che l’unione di
una famiglia qualsiasi di f -catene è una f -catena. Indichiamo allora con C∗ l’unione di tutte le
f -catene, i.e. la f -catena massima. Per l’ipotesi di induttività di A, C∗ ha un maggiorante m. Se
m non fosse massimale, esisterebbe n ∈ A con m < n, quindi l’insieme M dei maggioranti stretti
di C∗ sarebbe non vuoto. Posto allora
C = C∗ ∪ {f (M )} ,
dato che f (M ) è un maggiorante stretto di C∗ avremmo che C è ancora un insieme bene ordinato
che contiene strettamente C∗ .
L’assurdo deriverà allora dalla dimostrazione che C è una f -catena. Per verificarlo, notiamo che
la (14.1) ovviamente vale se a ∈ C∗ , usando il fatto che C∗ è una f -catena e che C ∩ (−∞, a) =
C∗ ∩ (−∞, a). Se invece a = f (M ) abbiamo che C ∩ (−∞, a) = C∗ e si usa proprio il fatto che M
è l’insieme dei maggioranti stretti di C∗ .
15. Esercizi
Esercizio 1.1.
Si trovi una espressione proposizionale in termini di P, Q, R tale che risulti vera se e solo se
esattamente due di esse sono vere.
Esercizio 1.2.
Siano A e B due sottoinsiemi di un insieme X. Si dica (e si dimostri la risposta) per quali
sottoinsiemi Y ⊆ X valgono le seguenti relazioni
• A ∪ Y = B,
• A ∩ Y = B,
• A4Y = B.
Esercizio 1.3.
Dati tre insiemi A, B e C, si provi che
A × (B ∪ C) = (A × B) ∪ (A × C) ,
A × (B ∩ C) = (A × B) ∩ (A × C) .
Esercizio 1.4.
Siano A e B due insiemi non vuoti, si provi che se
(A × B) ∪ (B × A) = C × C
per un terzo insieme C, allora A = B = C.
Esercizio 1.5.
Dati quattro insiemi A, B, C e D, si determinino le relazioni tra le seguenti coppie di insiemi
(A × C) ∪ (B × D)
e
(A ∪ B) × (C ∪ D) ,
(A × C) ∩ (B × D)
e
(A ∩ B) × (C ∩ D) .
Esercizio 1.6.
Siano A ⊆ X e B ⊆ Y , si provi che
X × Y \ A × B = (Ac × Y ) ∪ (X × B c ) .
15. ESERCIZI
28
Esercizio 1.7.
Si provi che per una famiglia di insiemi Ai per i ∈ {1, . . . , n}, si ha
n
[
Ai = A1 ∪ (A2 \ S1 ) ∪ · · · ∪ (An \ Sn−1 ) ,
i=1
Sk
dove Sk = i=1 Ai e che tale unione è disgiunta.
Vale la formula analoga
∞
[
Ai = A1 ∪ (A2 \ S1 ) ∪ · · · ∪ (An \ Sn−1 ) ∪ . . .
i=1
(infinita) se la famiglia di insiemi Ai è numerabile (cioè i ∈ N)?
Esercizio 1.8.
Per una famiglia di insiemi Ai con i ∈ {1, . . . , n}, si determini se la seguente formula vale
n
n
[
\
Ai = (A1 \ A2 ) ∪ (A2 \ A3 ) ∪ · · · ∪ (An \ A1 ) ∪
Ai .
i=1
i=1
Esercizio 1.9.
Data una successione di insiemi (An ) per n ∈ N, si definiscano il limsup ed il liminf della successione,
rispettivamente, come segue
∞ [
∞
\
lim An =
An+k ,
lim An =
n=1 k=1
∞ \
∞
[
An+k .
n=1 k=1
Si provi che
∞
\
n=1
An ⊆ lim An ⊆ lim An ⊆
∞
[
An .
n=1
Esercizio 1.10.
S
Si provi che lim An sono tutti e soli gli elementi in ∞
n=1 An tali che appartengano ad un insieme
infinito di insiemi An .
S
Si provi che lim An sono tutti e soli gli elementi in ∞
n=1 An tali che appartengano definitivamente
agli insiemi An .
Esercizio 1.11.
Si provi che se tutti gli insiemi Ai sono sottoinsiemi di un insieme X, valgono le relazioni
c
lim Acn = lim An ,
c
lim Acn = lim An .
Esercizio 1.12.
Date due successioni di insiemi (An ) e (Bn ), si stabiliscano le relazioni tra le seguenti coppie di
insiemi
lim An ∪ lim Bn
e
lim (An ∪ Bn ) ,
e
lim (An ∩ Bn ) ,
lim An ∩ lim Bn
lim An ∪ lim Bn
e
lim (An ∪ Bn ) ,
lim An ∩ lim Bn
e
lim (An ∩ Bn ) .
15. ESERCIZI
29
Esercizio 1.13.
Si mostri che se A1 ⊆ A2 ⊆ . . . An ⊆ . . . allora lim An = lim An = ∪∞
n=1 An e se invece A1 ⊇ A2 ⊇
A
.
. . . An ⊇ . . . allora lim An = lim An = ∩∞
n=1 n
Esercizio 1.14.
Sia f : X → Y una funzione e siano A, B ⊆ X, si provino le seguenti relazioni, mostrando un
esempio quando l’uguaglianza non vale e discutendo se vale assumendo che f sia iniettiva/surgettiva:
f (A ∪ B) = f (A) ∪ f (B) ,
f (A ∩ B) ⊆ f (A) ∩ f (B) ,
f (A \ B) ⊇ f (A) \ f (B) ,
f
−1
(A ∪ B) = f −1 (A) ∪ f −1 (B) ,
f −1 (A ∩ B) = f −1 (A) ∩ f −1 (B) ,
f −1 (A \ B) = f −1 (A) \ f −1 (B) .
Esercizio 1.15.
Si discutano le relazioni del problema precedente in caso di unioni/intersezioni multiple e/o infinite
di insiemi.
Esercizio 1.16.
Sia f : X → Y una funzione, si provi che
f (A ∩ B) = f (A) ∩ f (B)
oppure
f (A \ B) = f (A) \ f (B) ,
per ogni coppia di insiemi A, B ⊆ X, se e solo se la funzione f è iniettiva.
Esercizio 1.17.
Sia f : X → Y una funzione e siano A ⊆ X e B ⊆ Y . Si provino le seguenti relazioni, mostrando
con un esempio che l’uguaglianza non vale in generale:
f −1 (f (A)) ⊇ A ,
f (f −1 (B)) ⊆ B .
Si provi inoltre che l’uguaglianza vale nella prima relazione per ogni insieme A ⊆ X se e solo se la
funzione f è iniettiva e che l’uguaglianza vale nella seconda relazione per ogni insieme B ⊆ X se e
solo se la funzione f è surgettiva.
Esercizio 1.18.
Con le stesse notazioni del problema precedente si provi in generale che
f −1 (f (f −1 (f (A)))) = f −1 (f (A)) ,
f (f −1 (f (f −1 (B)))) = f (f −1 (B)) .
Esercizio 1.19.
Considerate due funzioni g : X → Y e f : Y → Z, si risponda alle seguenti domande, motivando la
risposta.
• Se f e g sono iniettive, la funzione composta f ◦ g è iniettiva? Vale il viceversa?
• Se f e g sono surgettive, la funzione composta f ◦ g è surgettiva? Vale il viceversa?
• Se la funzione composta f ◦ g è iniettiva/surgettiva cosa si può dire sulle funzioni f e g?
15. ESERCIZI
30
• Se la funzione composta f ◦ g è iniettiva per ogni funzione g : X → Y iniettiva e X ha
almeno due elementi, cosa si può dire sulla funzione f ?
• Se la funzione composta f ◦ g è surgettiva per ogni funzione f : Y → Z surgettiva e Z ha
almeno due elementi, cosa si può dire sulla funzione g?
Esercizio 1.20. F
Esiste una funzione f : R → R tale che f (f (x)) = −x?
Per ogni funzione g : R → R esiste sempre una funzione f : R → R tale che f ◦ f = g?
Esercizio 1.21.
Dati due insiemi X e Y , si provi che esiste una funzione f : X → Y iniettiva (surgettiva) se e solo
se esiste una funzione g : Y → X surgettiva (iniettiva).
Esercizio 1.22.
Si provi che per ogni funzione f : X → Y esiste un insieme Z e due funzioni g : X → Z e h : Z → Y
tali che f = h ◦ g con g surgettiva e h iniettiva. È vero anche con g iniettiva e h surgettiva?
Esercizio 1.23.
Dato un sottoinsieme A ⊆ X, sia χA : X → {0, 1} la sua funzione caratteristica. Si provi che
χA∩B = χA · χB ,
χA∪B = χA + χB − χA · χB .
Esercizio 1.24.
Si provi che l’Assioma di buona fondazione (Osservazione 1.9) implica la non esistenza di catene
discendenti di appartenenza, i.e. una successione di insiemi (An ) tali che An+1 ∈ An per ogni
n ∈ N.
Esercizio 1.25.
Si provino per induzione le seguenti formule:
n
sin (n + 1/2)x
1 X
+
cos kx =
2
2 sin(x/2)
per n ≥ 1, x ∈ R e x 6= 2hπ per ogni h ∈ N ,
k=1
n
Y
k=1
cos
x
sin x
= n
k
2 sin 2xn
2
per n ≥ 1, x ∈ R e x 6= 2n hπ per ogni h ∈ N .
Esercizio 1.26.
Pk
Siano x1 , x2 , . . . , xn e y1 , y2 , . . . , yn numeri reali, posto Vk =
i=1 yi e V0 = 0 si dimostri per
induzione la seguente formula di sommazione per parti di Abel,
n
X
x i yi =
i=m
n−1
X
(xi − xi+1 )Vi + xn Vn − xm Vm−1
i=m
per ogni m ∈ {1, 2, . . . , n − 1}.
Esercizio 1.27.
Si dimostri che un insieme X è infinito se e solo se esiste un suo sottoinsieme proprio Y e una
funzione iniettiva f : X → Y , oppure una funzione surgettiva g : Y → X.
L’insieme X \ Y si può scegliere infinito?
Esercizio 1.28.
Si provi che
15. ESERCIZI
31
• l’unione di due insiemi numerabili è numerabile e cosı̀ ogni unione finita di insiemi numerabili,
• il prodotto di due insiemi numerabili è numerabile e cosı̀ ogni prodotto finito di insiemi
numerabili,
• che ogni insieme infinito contiene un insieme numerabile.
Esercizio 1.29.
Si provi che se X è un insieme infinito allora la cardinalità di X ∪ N è uguale a quella di X.
Si provi che se X è un insieme infinito di cardinalità maggiore di N allora la cardinalità di X \ Y ,
dove Y ⊆ X è numerabile, è uguale a quella di X.
Esercizio 1.30.
Si provi che un’unione numerabile di insiemi numerabili è numerabile e che l’insieme delle parti
finite di un numerabile è numerabile.
L’insieme delle parti numerabili di N è numerabile?
Esercizio 1.31. F
Si trovi un polinomio p(x, y) in due variabili a coefficienti interi tale che la funzione p : N∗ ×N∗ → N∗
sia iniettiva. Si trovi un polinomio q(x, y) in due variabili a coefficienti razionali tale che la funzione
q : N∗ × N∗ → N∗ sia bigettiva.18
Esercizio 1.32.
Si provi che la cardinalità di R (cardinalità del continuo c) è uguale a quella di 2N e delle successioni
in N, cioè di NN .
Esercizio 1.33.
Si provi che
• l’unione di due insiemi con cardinalità del continuo ha sempre cardinalità del continuo e
cosı̀ ogni unione finita,
• il prodotto di due insiemi con cardinalità del continuo ha sempre cardinalità del continuo
e cosı̀ ogni prodotto prodotto finito.
Esercizio 1.34.
Si provi che se X è un insieme di cardinalità maggiore di c allora le cardinalità di X ∪ R e di X \ R
sono uguali a quella di X.
Esercizio 1.35.
Si provi che un’unione numerabile di insiemi con cardinalità del continuo ha sempre cardinalità del
continuo.
Esercizio 1.36. F
Si dimostri che l’insieme delle parti finite di un insieme con cardinalità del continuo ha sempre
cardinalità del continuo.
L’insieme delle parti numerabili di R ha la cardinalità del continuo? E la sua cardinalità è uguale
a quella delle successioni in R, cioè di RN ?
Esercizio 1.37.
Si discutano le cardinalità dei seguenti insiemi:
18Lo stesso problema per p : Z × Z → Z o q : Q × Q → Q è aperto, per approfondire si vedano
http://mathoverflow.net/q/21003 e
http://mathoverflow.net/q/117390.
15. ESERCIZI
32
•
•
•
•
•
•
i numeri razionali e i numeri irrazionali,
i numeri complessi,
i polinomi a coefficienti interi o razionali,
i numeri algebrici19 e i numeri trascendenti,
le successioni a valori razionali/reali,
le successioni a valori in Q convergenti ad un limite in Q e quelle a valori in Q convergenti
ad un limite in R,
• le successioni a valori in R convergenti ad un limite in Q e quelle a valori in R semplicemente
convergenti,
• le funzioni continue da R in R.
Esercizio 1.38.
Dati tre insiemi A, B e C si provino le seguenti formule,
• card A × B = card B × A,
• card (AB )C = card AB×C ,
• card AB × AC = card AB∪C , se B e C sono disgiunti.
Esercizio 1.39.
Sia X infinito e Y di cardinalità minore di X, si provi allora che le cardinalità di X ∪ Y e di X \ Y
sono uguali alla cardinalità di X.
Esercizio 1.40. F
Si provi che se almeno uno dei due insiemi A e B è infinito, si ha
card A ∪ B = max{card A, card B}
e che di conseguenza
card 2A = card nA = card A
per ogni n ∈ N e A infinito.
Esercizio 1.41. F
Si provi che se X è infinito la cardinalità di X × N è uguale alla cardinalità di X.
Esercizio 1.42. FF
Si provi che se almeno uno dei due insiemi A e B è infinito, si ha
card A × B = max{card A, card B}
e che di conseguenza
card A × A = card An = card A
per ogni n ∈ N e A infinito.
Esercizio 1.43.
Sia X infinito, si provi che si può partizionare X in una famiglia di insiemi numerabili. Qual è la
cardinalità di tale famiglia?
Esercizio 1.44.
Sia X infinito, si provi che si può partizionare X in una famiglia numerabile di insiemi di cardinalità
uguale a quella di X.
19Un numero reale si dice algebrico se è la radice di un polinomio a coefficienti interi.
15. ESERCIZI
33
Esercizio 1.45.
Sia X di cardinalità minore o uguale a Y . Si può partizionare Y in una famiglia di insiemi ognuno
di cardinalità uguale a quella di X. Qual è la cardinalità di tale famiglia?
Esercizio 1.46.
Sia X di cardinalità minore o uguale a Y . Si provi che si può partizionare Y in una famiglia di
insiemi di cardinalità uguale a quella di X e la cardinalità di tale famiglia può essere scelta tra
tutte quelle minori o uguali a quella di Y .
Esercizio 1.47.
Dati due insiemi X e Y , si discutano le cardinalità degli insiemi delle funzioni f : X → Y iniettive,
surgettive, bigettive, in relazione alla cardinalità dell’insieme Y X .
Esercizio 1.48. F
La cardinalità delle parti numerabili di Y è la stessa della cardinalità di Y N ?
Sia X di cardinalità minore o uguale a Y , la cardinalità delle parti di cardinalità X di Y è la stessa
della cardinalità di Y X ?
Esercizio 1.49.
Si provi che se Y è un insieme infinito e card X ≤ card Y si ha card X Y = card 2Y .
Esercizio 1.50.
Si provi che se card X = card 2Z per un qualche insieme Z infinito, allora
card X Y = max{card X, card 2Y } ,
in particolare, card X N = card X.20
Esercizio 1.51. FF
Si provi il seguente Teorema di König. Se card Xi < card Yi per ogni i ∈ I si ha
[
Y
card
Xi < card
Yi .
i∈I
i∈I
Se ne deduca il fatto che card X < card 2X per ogni insieme infinito X.
Esercizio 1.52.
Date due relazioni R e S su di un insieme X, si definisca la relazione composta R ◦ S come segue:
a(R ◦ S)b se e solo se esiste c ∈ X tale che aRc e cSb.
• Si provi che la relazione R è simmetrica se e solo se R = R−1 .
• Si provi che la relazione R è transitiva se e solo se lo è R−1 .
• Si provi che se una relazione R è transitiva se e solo se R ◦ R ⊆ R e si dia un esempio in
cui tale inclusione è stretta. Se la relazione R è anche riflessiva vale l’uguaglianza?
• Si provi che una relazione R è di equivalenza se e solo se è riflessiva, R = R−1 e R◦R ⊆ R.
Esercizio 1.53.
Si provi che se una relazione R è riflessiva e transitiva allora la relazione R ∩ R−1 è di equivalenza.
Esercizio 1.54. Si mostri che, se vale l’assioma di buona fondazione, anche {a, {a, b}} soddisfa
l’assioma della coppia, i.e. {a, {a, b}} = {a0 , {a0 , b0 }} implica a = a0 e b = b0 .
20 Nel caso in cui l’insieme X non soddisfi card X = card 2Z per un qualche insieme infinito Z, determinare
la cardinalità di X Y quando card Y < card X può essere difficile (è legata al concetto di cofinalità di un numero
cardinale) e dipendere dall’assunzione o meno dell’ipotesi del continuo (generalizzata). Esistono comunque insiemi
infiniti X tali che card X N > card X (esempio complicato).
15. ESERCIZI
34
Esercizio 1.55.
Si dicano quali sono le proprietà soddisfatte dalle seguenti relazioni:
• R su R data da xRy se e solo se x − y ∈ Q,
• R0 su R data da xR0 y se e solo se x − y ∈ R \ Q,
• S su R \ {0} data da xSy se e solo se x/y ∈ Q.
• S 0 su R \ {0} data da xS 0 y se e solo se x/y ∈ R \ Q.
Esercizio 1.56.
L’intersezione e l’unione di due o più relazioni di equivalenza sono ancora relazioni di equivalenza?
L’intersezione e l’unione di due o più relazioni d’ordine sono ancora relazioni d’ordine?
Esercizio 1.57.
Date due relazioni R su X e S su Y , si definisca una relazione R × S su X × Y come segue:
(x1 , y1 )(R × S)(x2 , y2 ) se e solo se x1 Rx2 e y1 Sy2 .
Si dica se valgono:
• R e S relazioni d’equivalenza allora R × S è una relazione d’equivalenza,
• R e S relazioni d’ordine allora R × S è una relazione d’ordine.
Si dica se le due affermazioni sopra valgono se la relazione R × S su X × Y è invece definita come
segue: (x1 , y1 )(R × S)(x2 , y2 ) se e solo se vale almeno una delle due condizioni x1 Rx2 e y1 Sy2 .
Esercizio 1.58.
Sia R una relazione su X, si provi che R ∪ R−1 è la più piccola relazione simmetrica che contiene
R e che R ∩ R−1 è la più grande relazione simmetrica contenuta in R.
Esercizio 1.59.
Sia f : X → Y una funzione e definiamo la relazione aRb se f (a) = f (b). Si mostri che R è una
relazione d’equivalenza e che la mappa fe : X/R → Y è ben definita da fe([a]) = f (a) per ogni
a ∈ X, è iniettiva e soddisfa fe ◦ π = f , dove π : A → X/R è la mappa di proiezione nel quoziente.
Esercizio 1.60.
Sia f : X → Y una funzione e siano R su X e S su Y due relazioni d’equivalenza, inoltre si assuma
che per ogni coppia a, b in X con aRb si abbia f (a)Sf (b). Si provi che allora è ben definita e unica
una mappa fe : X/R → Y /S tale che
fe ◦ πR = πS ◦ f ,
dove πR : X → X/R e πS : Y → Y /S sono le rispettive mappe di proiezione sul quoziente delle
due relazioni R e S.
Esercizio 1.61.
Siano R e S rispettivamente una relazione di equivalenza e di ordine sull’insieme X, sia π : X →
X/R la mappa proiezione che manda ogni elemento x ∈ X nella sua classe di equivalenza [x] ∈ X/R.
Se si ha che per ogni coppia (x, y) e (z, w) con xRy e zRw, la relazione x ≤ z implica y ≤ w allora
si provi che Se = π
e(S) è una relazione d’ordine su X/R, dove la mappa π
e : X × X → X/R × X/R
è data da (x, z) 7→ ([x], [z]).
Si noti inoltre che la mappa π
e manda la relazione d’equivalenza R in una relazione d’equivalenza
e=π
R
e(R) su X/R consistente nella sola diagonale di X/R × X/R.
Esercizio 1.62. F
Sia V uno spazio vettoriale su un campo K. Diciamo che X ⊆ V è libero se ogni suo sottoinsieme
finito è linearmente indipendente. Diciamo che X è un sistema di generatori se per ogni v ∈ V
15. ESERCIZI
35
esistono x1 , x2 , . . . , xn ∈ X e λ1 , λ2 , . . . , λn ∈ K tali che v = λ1 x1 + λ2 x2 + · · · + λn xn . Una base di
Hamel B di V è un sistema libero di generatori.
• Si provi che B è una base di Hamel se e solo se è un sottoinsieme libero massimale.
• Si dimostri, usando il lemma di Zorn, che ogni spazio vettoriale ammette una base di
Hamel.
• Si dimostri che, dato X sottoinsieme libero di V , esiste una base di Hamel di V contenente
X.
• Si dimostri che, dato X sottoinsieme libero di V e una base di Hamel B di V , esiste un
sottoinsieme B 0 di B tale che X ∪ B 0 è una base di Hamel di V .
• Si dimostri che due basi di Hamel B1 e B2 di uno spazio vettoriale V hanno la stessa
cardinalità.
Esercizio 1.63.
Si provi che un insieme A è finito se e solo se ogni ordinamento totale su A è un buon ordinamento.
Esercizio 1.64.
Si provi che un insieme A è finito se e solo se possiede un buon ordinamento ≤ tale che la relazione
d’ordine inversa sia ancora un buon ordinamento.
Esercizio 1.65.
Si discuta la struttura di un insieme totalmente ordinato (A, ≤) in cui per ogni elemento esista sia
il suo successore che il suo predecessore.
Il predecessore di un elemento a ∈ A si definisce come il massimo degli elementi b < a e il suo
successore come il minimo degli elementi c > a.
Esercizio 1.66.
Sia (A, ≤) un insieme totalmente ordinato, si provi che se ogni sottoinsieme numerabile di A è bene
ordinato, allora A è bene ordinato.
CAPITOLO 2
INSIEMI NUMERICI E OPERAZIONI
In questo capitolo costruiremo, a partire dai numeri naturali, gli insiemi Z, Q e R. Con le costruzioni qui date sono rispettate le regole generali dell’aritmetica e dell’algebra. Daremo poi una
caratterizzazione assiomatica di R, quindi indipendente dalla particolare costruzione che qui viene
adottata, basata sulla struttura di campo, di insieme ordinato e sulla proprietà di completezza.
1. Operazioni su N
Definiamo l’operazione di somma:
+ : N × N −→ N ,
tra numeri naturali definendo ricorsivamente, per m ∈ N fissato, l’applicazione Σm : N → N (somma
per m):
(
Σm (0) = m ,
(1.1)
Σm (S(n)) = S(Σm (n)) .
L’applicazione +(m, n) risulta quindi definita da Σm (n). Rimane tuttavia inteso che useremo da
ora in poi la notazione classica m + n, abituale per le operazioni, in luogo di quella che sarebbe
formalmente più appropriata.
Si noti una facile induzione su n mostra che Σ0 = ιN e che, posto 1 = S(0), si ha
S(n) = Σ1 (n) = 1 + n
∀n ∈ N .
Più in generale, usando ripetutamente il principio di induzione si possono derivare le proprietà
fondamentali della somma.
Proposizione 2.1 (Proprietà della somma). La somma gode della proprietà commutativa (i.e.
n + m = m + n) e associativa (i.e. (m + n) + k = m + (n + k)). Inoltre Σm è bigettiva e strettamente
crescente tra N e {n ∈ N : m ≤ n}.
Dimostrazione. Per dimostrare la commutatività, dimostriamo preliminarmente che vale
l’identità
(1.2)
S(m + n) = S(m) + n ,
∀ m, n ∈ N ,
applicando il principio di induzione alla proprietà
P (n) : “S(m + n) = S(m) + n per ogni m ∈ N” .
P (0) è ovvia. Supponendo vera P (n), dimostriamo P S(n) , ossia che S m+S(n) = S(m)+S(n).
Applicando prima la definizione di Σm , poi l’ipotesi induttiva e infine la definizione di ΣS(m)
otteniamo
S m + S(n) = S ◦ S(m + n) = S S(m) + n = S(m) + S(n) ,
per ogni m ∈ N.
36
1. OPERAZIONI SU N
37
Possiamo ora dimostrare per induzione su n che
Q(n) : “m + n = n + m per ogni m ∈ N”
è vera per ogni n.
Per n = 0, dobbiamo dimostrare che 0 + m = m + 0 per ogni m ∈ N, i.e. Σ0 (m) = Σm (0) per
ogni m ∈ N. Ma abbiamo già osservato che, per induzione, vale Σ0 (m) = m, quindi l’identità da
mostrare si riduce alla prima delle (1.1).
Abbiamo dunque verificato che Q(0) è vera. Supponiamo ora vera Q(n). Allora usando prima la
definizione di Σm , poi l’ipotesi induttiva e infine la (1.2) otteniamo
m + S(n) = S(m + n) = S(n + m) = S(n) + m ,
∀m ∈ N .
Quindi Q S(n) è vera.
La dimostrazione della proprietà associativa è simile. Sempre per induzione su n0 si mostra che
m + n < m + n0 se n < n0 , quindi Σm è iniettiva, e sempre per induzione su n si mostra che Σm ha
valori nell’insieme {n ∈ N : m ≤ n}. Se l’insieme
n ∈ N : m ≤ n \ Σm (N)
fosse non vuoto, prendendone il minimo n0 (che, si noti, non può essere uguale a m) e considerando
il suo predecessore m0 ≥ m, si otterrebbe facilmente una contraddizione dal fatto che, scrivendo
m0 = Σm (k) per un certo k ∈ N (per minimalità di m0 ), si otterrebbe n0 = S(m0 ) = Σm (S(k)) ∈
Σm (N).
Si noti che iniettività di Σk e commutatività danno anche
m+k =n+k
=⇒
m = n.
Abbiamo già osservato che la somma per m è compatibile con la struttura d’ordine. Analizziamo
più a fondo la compatibilità delle due strutture.
Proposizione 2.2 (Compatibilità di somma e ordinamento).
(i) Siano m, n ∈ N. Allora m ≤ n se e solo se esiste k ∈ N tale che n = m + k.
(ii) Siano m, n, k ∈ N. Allora m ≤ n se e solo se m + k ≤ n + k.
Dimostrazione. (i) Per provare una delle due implicazioni, dimostriamo per induzione su
n ≥ m che esiste k ∈ N tale che n = m + k. Se n = m l’implicazione è vera con k = 0. Supponiamo
che l’implicazione valga per n. Allora
S(n) = S(m + k) = m + S(k) .
Per l’implicazione inversa, basta dimostrare per induzione su k ∈ N che m ≤ m + k. La verifica è
semplice e viene lasciata per esercizio.
La dimostrazione di (ii), per induzione su k, è lasciata per esercizio.
Attraverso un procedimento analogo possiamo definire il prodotto
· : N × N −→ N ,
come segue. Fissato m ∈ N, definiamo ricorsivamente la “moltiplicazione per m” come segue:
(
m·0=0 ,
m · (n + 1) = m · n + m .
Si verifica facilmente che m · 1 = m per ogni m ∈ N e che 0 · n = 0 per ogni n ∈ N. Vale inoltre la
legge di annullamento del prodotto: m · n = 0 se e solo se m = 0 o n = 0.
2. DAI NATURALI AGLI INTERI
38
È possibile verificare per induzione che anche il prodotto soddisfa le proprietà associativa e commutativa. Vale anche la proprietà distributiva della somma rispetto al prodotto1
(m + n) · p = m · p + n · p .
Infine, abbiamo anche qui relazioni di compatibilità con la struttura d’ordine:
Proposizione 2.3 (Compatibilità di prodotto e ordinamento). Siano m, n ∈ N, k ∈ N∗ .
Allora m ≤ n se e solo se k · m ≤ k · n.
2. Dai naturali agli interi
Su N2 introduciamo la relazione di equivalenza2
(m, n) ∼ (m0 , n0 ) ⇐⇒ m + n0 = n + m0 .
Indichiamo con (m, n) la classe di equivalenza dell’elemento (m, n) e indichiamo l’insieme quoziente N2 /∼ con il simbolo Z.
(2.1)
Lemma 2.4 (Ordinamento di Z). La relazione ≤Z
(m, n) ≤Z (p, q) ⇐⇒ m + q ≤ n + p
è ben definita su Z ed è un ordinamento totale.
Dimostrazione. Per poter dire che ≤Z è ben definita su Z, bisogna dimostrare che se (m, n) ∼
(m0 , n0 ), (p, q) ∼ (p0 , q 0 ) e m + q ≤ n + p, allora m0 + q 0 ≤ n0 + p0 . Usando ripetutamente la
Proposizione 2.2(ii) e la (2.1) si ottiene che m + n0 + q ≤ n + n0 + p, da cui m0 + n + q ≤ n + n0 + p,
e quindi m0 + q ≤ n0 + p. Aggiungendo p0 ad ambo i membri e procedendo allo stesso modo, si
conclude che m0 + q 0 ≤ n0 + p0 .
A questo punto, è molto semplice verificare che si tratti di un ordinamento totale.
Segue pure dalla Proposizione 2.2(i) che ogni classe di equivalenza [(a, b)] contiene un unico elemento
della forma (n, 0), oppure della forma (0, n) con n ≥ 1 (basta distinguere i casi a ≤ b e b ≤ a). Si
ha allora
Z = (0, n) : n ∈ N∗ ∪ (n, 0) : n ∈ N .
Inoltre, se 0 < m < n,
(0, n) <Z (0, m) <Z (0, 0) <Z (m, 0) <Z (n, 0) .
Le operazioni di somma e prodotto su Z si definiscono come segue:
(m, n) + (p, q) = (m + p, n + q) ,
(m, n) · (p, q) = (mp + nq, np + mq) .
Una serie di semplici verifiche mostra che sono ben definite (i.e. indipendenti dalla scelta dei
rappresentanti nella classe di equivalenza) e che valgono le seguenti proprietà:
(1) le proprietà associativa e commutativa sia per la somma che per il prodotto;
(2) la proprietà
distributiva della somma rispetto al prodotto;
(3) (0, 0) è l’elemento neutro per la somma, cioè (m, n) + (0, 0) = (m, n) per ogni
(m, n) ∈ Z;
1Useremo da ora in poi la convenzione standard relativa alla priorità tra somme e prodotti; senza di questa, la
formula sotto andrebbe scritta: (m · p) + (n · p).
2Si verifichi che lo è effettivamente.
3. DAGLI INTERI AI RAZIONALI
39
(4) (1, 0) è l’elemento neutro per il prodotto, cioè (m, n) · (1, 0) = (m, n) per ogni
(m, n) ∈ Z; (5) ogni elemento (m, n) ha un opposto
(l’elemento (n, m) ), indicato con −[(m, n)], tale
cioè che la somma dei due sia (0, 0) ;
(6) se il prodotto di due elementi di Z è nullo, cioè uguale a (0, 0) , allora almeno uno dei
due
è nullo;
(7) (n, m) ≤Z (n0 , m0 ) se e solo se esiste (p, q) tale che (n, m) + (p, q) ≤Z (n0 , m0 ) +
(p, q) ; (8) se (m, n) ≥Z (0, 0) e (p, q) ≥Z (0, 0) , anche (m, n) · (p, q) ≥Z (0, 0) .
Le proprietà (1)–(8) forniscono le abituali regole dell’aritmetica. Le proprietà (1)–(5) si riassumono
dicendo che Z è un anello commutativo. Includendo anche la (6), che segue facilmente dalla legge
di annullamento del prodotto in N, Z si dice, più precisamente, che Z è un dominio di integrità. Un
esempio classico, derivato da questo, di anello commutativo è costituito dall’insieme dei polinomi
a coefficienti interi:
A = a0 + a1 x + · · · + an xn : n ∈ N∗ , a0 , . . . , an ∈ Z ,
con le usuali regole algebriche di somma coefficiente per coefficiente e prodotto.
Infine, (7) e (8) esprimono le usuali relazioni di compatibilità tra ordine e somma, ordine e prodotto.
Osservazione 2.5 (N come sottoinsieme di Z). Alla luce di questi fatti, possiamo a tutti gli
effetti considerare N come un sottoinsieme di Z, identificando n ∈ N con la classe di equivalenza
[(n, 0)]. Questa identificazione rispetta le operazioni aritmetiche (e anche, come abbiamo notato,
l’ordinamento), vale a dire
[(n, 0)] + [(m, 0)] = [(n + m, 0)] ,
[(n, 0)] · [(m, 0)] = [(nm, 0)]
∀n, m ∈ N .
Sulla base dell’osservazione precedente, d’ora in poi adottiamo la abituale notazione semplificata
con n anche per gli elementi di Z, usando ≤ per l’ordinamento in Z. Useremo anche la classica
notazione n − m per n + (−m).
3. Dagli interi ai razionali
Con un procedimento non molto diverso, si arriva a costruire il campo Q dei numeri razionali a
partire da Z. Sul prodotto cartesiano Z×N∗ consideriamo la relazione di equivalenza delle “frazioni
equivalenti”
(m, n) ≈ (m0 , n0 ) ⇐⇒ mn0 = nm0 ,
3
e indichiamo con m
n la classe di equivalenza di (m, n). Con questa convenzione, si verifica facilmente
che è ben definita la relazione d’ordine
m
m0
≤ 0
⇐⇒ mn0 ≤ nm0 ,
n
n
(i.e. indipendente dalla scelta dei rappresentanti) e che sono ben definite le abituali operazioni di
somma e prodotto, con le regole abituali del calcolo con le frazioni:
m m0
mn0 + m0 n
m m0
mm0
+ 0 =
,
·
=
.
n
n
nn0
n n0
nn0
3Si noti che la nozione di frazione irriducibile corrisponde alla scelta di un rappresentante nella classe di
equivalenza su descritta.
4. CAMPI
40
In aggiunta alle proprietà (1)–(8) presentate per Z, valgono su Q le seguenti altre proprietà:
p
mp
(9) ogni elemento m
n 6= 0 ha un inverso, ossia un elemento q tale che n q = 1 (si prende
−n
se m > 0, pq = −m
altrimenti);
p
4
(10) vale la proprietà archimedea: dati m
n , q > 0, esiste k ∈ N tale che
k·
p
q
=
n
m
p
m
> .
n
q
L’insieme delle proprietà (1)–(10) conferisce a Q la struttura di campo totalmente ordinato archimedeo. Si noti che la validità della (6) su Q segue direttamente dalla (9). Seguendo l’uso comune,
ometteremo sovente il simbolo di prodotto, i.e. scrivendo qr per q · r.
È importante osservare una forte differenza tra gli ordinamenti su Z e su Q. Mentre in Z ogni
elemento n ha un “immediato predecessore”, n − 1, e un “immediato successore”, n + 1, Q è denso
p
p
m0
m
m0
in sé: dati comunque due elementi m
n < n0 , esiste un terzo elemento q tale che n < q < n0 (basta
prendere la media aritmetica dei due).
Osservazione 2.6 (Z come sottoinsieme di Q). Anche in questo caso, possiamo a tutti gli
effetti considerare Z come un sottoinsieme di Q, identificando n ∈ Z con n1 . Questa identificazione
rispetta le operazioni aritmetiche (e anche l’ordinamento), vale a dire
n+m
n m
n·m
n m
+
=
,
·
=
∀n, m ∈ Z .
1
1
1
1 1
1
4. Campi
Alcune delle proprietà aritmetiche appena viste su Q possono essere assiomatizzate, dando luogo
alla nozione di campo.
Definizione 2.7. Si chiama campo un insieme F dotato di due operazioni, indicate con “+” e “·”
e dette rispettivamente somma e prodotto, che soddisfino le seguenti proprietà:
(a) proprietà commutativa di entrambe:
∀ x, y ∈ F ,
x+y =y+x ,
x·y =y·x ;
(b) proprietà associativa di entrambe:
∀ x, y, z ∈ F ,
(x + y) + z = x + (y + z) ,
(x · y) · z = x · (y · z) ;
(c) proprietà distributiva della somma rispetto al prodotto:
∀ x, y, z ∈ F ,
(x + y) · z = x · z + y · z ;
(d) le due operazioni ammettono elementi neutri distinti (abitualmente indicati con 0 e 1
rispettivamente) cioè tali che 0 6= 1 e
∀x ∈ F ,
x+0=x ,
x·1=x ;
(e) esistenza dell’opposto:
∀ x ∈ F , ∃ x0 ∈ F :
x + x0 = 0 ;
4Prendendo k = np + 1, vale k · (m · q) ≥ k · 1 = k > np, da cui segue la disuguaglianza tra le frazioni.
5. COSTRUZIONE DEL CAMPO R DEI NUMERI REALI
41
(f) esistenza dell’inverso per elementi diversi da 0:
∀ x ∈ F \ {0} , ∃ x00 ∈ F :
x · x00 = 1 .
Esempi.
• Q e, come vedremo, il campo R dei numeri reali. Un altro esempio importante è il campo
C dei
che non sarà trattato in questi appunti.
√ numeri complessi,
√
• Q[ 2] = {p + q 2 : p, q ∈ Q} con le operazioni indotte da R.
• se p è unnumero
primo, Zp = {0, 1, . . . , p − 1} con le operazioni intese modulo p.
• F (x) = pq , dove p e q sono polinomi a coefficienti in un campo F e q non è il polinomio nullo, con le normali operazioni algebriche tra polinomi e frazioni, detto campo delle
funzioni razionali a coefficienti in F .
Dagli assiomi (a)–(f) che definiscono i campi, seguono numerose proprietà generali, di cui elenchiamo
le principali:
• dato x0 ∈ F , se esiste y tale che x0 + y = y, allora x0 = 0; in particolare F ammette un
unico elemento neutro per la somma;
• dato x0 ∈ F , se esiste y 6= 0 tale che x0 · y = y, allora x0 = 1; in particolare F ammette
un unico elemento neutro per il prodotto;
• l’opposto di un elemento di F e l’inverso di un elemento non nullo di F sono unici; essi
vengono indicati rispettivamente con −x e x−1 (o anche con 1/x);
• −(x + y) = −x + (−y), (xy)−1 = x−1 · y −1 ;
• −(−x) = x, (x−1 )−1 = x;
• per ogni x, x · 0 = 0 e x · (−1) = −x;
• x · y = 0 ⇐⇒ x = 0 o y = 0.
Definizione 2.8 (Omomorfismo di campi). Siano F e F 0 due campi. Si chiama omomorfismo
di F in F 0 un’applicazione ϕ : F −→ F 0 non identicamente nulla e tale che
(4.1)
∀ x, y ∈ F ,
ϕ(x + y) = ϕ(x) + ϕ(y) ,
ϕ(x · y) = ϕ(x) · ϕ(y) .
F0
Un omomorfismo ϕ di F in
si dice un isomorfismo se è bigettivo. In tal caso anche ϕ−1 è un
isomorfismo ed F e F 0 si dicono isomorfi.
Si dimostra facilmente che un omomorfismo soddisfa le condizioni
ϕ(0F ) = 0F 0 ,
ϕ(1F ) = 1F 0 ,
ϕ(−x) = −ϕ(x) ,
ϕ(x−1 ) = ϕ(x)−1 ;
e che la relazione di isomorfismo tra campi è una “relazione di equivalenza nell’insieme dei campi”.
Si noti che le relazioni ϕ(0F ) = 0F 0 e ϕ(1F ) = 1F 0 seguono dal fatto che ϕ(0F ) e ϕ(1F ) fungono
rispettivamente da elemento neutro per la somma e il prodotto per F 0 .
5. Costruzione del campo R dei numeri reali
Ci sono diversi modi di costruire il campo reale R, una volta analizzata la struttura di Q. Presentiamo il procedimento più elementare (ne vedremo altri, che usano concetti meno elementari ma
sono anche molto meno macchinosi), che usa la relazione di ordine su Q, dovuto a R. Dedekind.
Ricordiamo la nozione di segmento di un insieme ordinato (A, ≤), già usata nella dimostrazione del
teorema di Zermelo e del lemma di Zorn: B ⊆ A è un segmento se b ∈ B e a ≤ b implica a ∈ B.
Definizione 2.9. Si chiama sezione (di Dedekind) di Q un sottoinsieme S di Q che soddisfi le
seguenti tre proprietà:
6. OPERAZIONI SU R
42
(i) S è un segmento non vuoto;
(ii) S è superiormente limitato;
(iii) S non ha massimo.
Indichiamo con R l’insieme delle sezioni di Q.
Esempi. I seguenti esempi illustrano che vi sono due tipi di sezioni, intuitivamente quelle che
individuano un razionale e quelle che individuano un irrazionale.
(1) Sia p ∈ Q. Allora Sp = {q ∈ Q : q < p} è una sezione. Più in generale, se S è una
sezione che ha un estremo superiore (in Q, si intende), allora usando il fatto che S non ha
massimo si mostra facilmente che S = Ssup S .
(2) L’insieme S = {q ∈ Q : q < 0 ∨ q 2 < 2} è una sezione e non è del tipo descritto in
precedenza, a causa del fatto che non esistono razionali q tali che q 2 = 2.
Proposizione 2.10 (Proprietà delle sezioni).
(a)
(b)
(c)
(d)
La relazione di inclusione ⊆ tra sezioni di Q definisce un ordinamento totale su R.
Ogni E ⊆ R superiormente limitato ammette estremo superiore (proprietà di completezza).
L’applicazione ϕ : Q −→ R data da ϕ(p) = Sp è strettamente crescente, dunque iniettiva.
Date S, S 0 ∈ R con S ⊂ S 0 , esiste r ∈ Q tale che S ⊂ Sr ⊂ S 0 (densità di Q in R).
Dimostrazione. (a) Ovviamente si tratta di un ordinamento. Per verificare che esso è totale,
si usa ripetutamente la proprietà di segmento delle sezioni. Siano S, S 0 sezioni e supponiamo che
S 0 6⊆ S. Preso p ∈ S 0 \ S, per la proprietà di segmento di S si ha necessariamente q < p per ogni
q ∈ S, cioè S ⊆ Sp . Ma essendo p ∈ S 0 , la proprietà di segmento di S 0 dà Sp ⊆ S 0 . Quindi S ⊆ S 0 .
(b) Sia E ⊂ R superiormente limitato. Esiste quindi una sezione S ∗ di Q tale che S ⊆ S ∗ per ogni
S ∈ E. L’unione
[
S0 =
S,
S∈E
è pure una sezione. Infatti è non vuota ed è superiormente limitata perché contenuta in S ∗ . Se
S 0 avesse massimo, questo apparterrebbe a una sezione S ∈ E che dunque avrebbe un massimo, il
che è assurdo. Infine, dato q ∈ S 0 , esiste S ∈ E tale che q ∈ S. Se q 0 < q, allora q 0 ∈ S, e dunque
q 0 ∈ S 0 , quindi S 0 è un segmento. Chiaramente S 0 è un maggiorante di E, perché S ⊆ S 0 per ogni
S ∈ E. D’altra parte, ogni maggiorante Se di E contiene ogni S ∈ E, e dunque contiene S 0 . Quindi
S 0 è il minimo maggiorante di E.
La (c) è una conseguenza evidente della densità in sé di Q. Per dimostrare la (d) è sufficiente
migliorare il ragionamento fatto nella dimostrazione del punto (a). Questo dimostra che, nelle
presenti ipotesi, esiste p ∈ S 0 tale che S ⊆ Sp . Siccome S 0 non ha massimo, esiste un elemento
p0 ∈ S 0 con p0 > p. Allora S ⊂ Sr ⊂ S 0 con r = (p + p0 )/2.
6. Operazioni su R
Siano S, S 0 sezioni di Q. Definiamo
S + S 0 = q + q0 : q ∈ S , q0 ∈ S 0 .
Lemma 2.11. S + S 0 è una sezione di Q. Inoltre, per ogni p, p0 ∈ Q vale Sp + Sp0 = Sp+p0 .
6. OPERAZIONI SU R
43
Dimostrazione. Chiaramente, S +S 0 è non vuoto. Se m, m0 sono maggioranti rispettivamente
di S, S 0 in Q, allora m + m0 è un maggiorante di S + S 0 . Quindi S + S 0 è superiormente limitato.
Supponiamo per assurdo che S + S 0 abbia massimo m. Allora m = q + q 0 per qualche q ∈ S e
q 0 ∈ S 0 . Siccome q non è massimo di S, esiste r ∈ S con r > q. Ma allora r + q 0 ∈ S + S 0 e
r + q 0 > m, da cui l’assurdo.
Per dimostrare che S + S 0 soddisfa la condizione di segmento, si prendano q ∈ S, q 0 ∈ S 0 e r ∈ Q
con r < q + q 0 . Allora r − q < q 0 , e dunque r − q ∈ S 0 . Quindi r ∈ S + S 0 .
Passando alla seconda parte dell’enunciato, l’inclusione Sp + Sp0 ⊆ Sp+p0 è ovvia. Per ottenere
l’inclusione opposta, si prenda r ∈ Sp+p0 . Allora r = p + (r − p) e r − p ∈ Sp0 . Dato che Sp0 non
ha massimo, per > 0 abbastanza piccolo ho ancora r − p0 + ∈ Sp0 e concludo che r ∈ Sp + Sp0
osservando che p − ∈ Sp .
Definiamo ora
(6.1)
(
S−p
− S :=
Q \ {−q : q ∈ S}
se S = Sp per qualche p ∈ Q ;
altrimenti .
La complessità della definizione (6.1) è dovuta al fatto che Q \ {−q : q ∈ Sp } non è una sezione
(perché?).
Passiamo ora al prodotto, la cui definizione è altrettanto macchinosa, a causa della regola dei segni.
Definizione 2.12 (Prodotto di sezioni).
• per S, S 0 ⊇ S0 , si pone SS 0 = {qq 0 : q, q 0 ≥ 0 , q ∈ S , q 0 ∈ S 0 } ∪ {q ∈ Q : q < 0};
• per tutti gli altri casi, il prodotto si definisce in modo che siano soddisfatte le identità
(−S)S 0 = S(−S 0 ) = −(SS 0 ).
Anche in questo caso si verifica che il prodotto di sezioni è una sezione, inoltre
(6.2)
Sp Sp0 = Spp0
per ogni p, p0 ∈ Q .
Esempio. Se S = {q ∈ Q : q < 0 ∨ q 2 < 2}, allora S 2 = S2 .
Se S 6= S0 poniamo anche, distinguendo i due tipi di sezioni,
(Sp )−1 = Sp−1
(6.3)
se S = Sp per qualche p ∈ Q \ {0},
(
Q \ {q −1 : q ∈ S, q > 0}
−1
(6.4)
S :=
{q −1 : q ∈
/ S, q < 0}
se S0 ⊂ S ;
se S ⊂ S0
altrimenti (si noti che, anche in questo caso, l’espressione in (6.4), se applicata alle sezioni Sp non
dà luogo a una sezione).
Teorema 2.13 (R è un campo). L’insieme R delle sezioni di Q, munito della somma e del
prodotto su definiti, è un campo il cui elemento neutro per la somma è S0 e quello neutro per il
prodotto è S1 . L’opposto e l’inverso sono definiti rispettivamente da (6.1) e (6.3)-(6.4). Infine
valgono le proprietà
(6.5)
(6.6)
S ≤ S0
=⇒
S + S 00 ≤ S 0 + S 00 ∀S 00 ∈ R ;
S, S 0 ≥ 0
=⇒
SS 0 ≥ 0 .
7. CAMPI ORDINATI
44
La dimostrazione non è difficile, ma consiste in una lunga (e noiosa) serie di verifiche.
Nel seguito useremo le notazioni abituali per i numeri reali, facendo riferimento esplicito alle sezioni
di Dedekind solo quando sarà conveniente. Attraverso l’identificazione p ←→ Sp tra numeri razionali
e corrispondenti sezioni di Dedekind, consideriamo Q come un sottoinsieme (proprio, come abbiamo
visto) di R, grazie al fatto che il Lemma 2.11 e la formula (6.2) mostrano che p 7→ Sp è un
omomorfismo di campi (i.e. le operazioni algebriche sui numeri razionali coincidono con quelle sulle
corrispondenti sezioni). Inoltre indicheremo con l’abituale simbolo ≤ la relazione d’ordine su R.
L’enunciato che segue generalizza l’esempio presentato sopra.
Proposizione 2.14. Dato un numero reale x > 0 e un intero n ≥ 2 esiste uno e un solo numero
reale positivo y, detto radice n-sima di x, tale che y n = x.
Dimostrazione. L’unicità di y segue dal fatto che, se 0 < a < b, allora 0 < an < bn , e quindi
due numeri positivi diversi non possono avere la stessa potenza n–esima.
Per dimostrare l’esistenza di y, sia S la sezione di Q corrispondente a x. Essendo S0 ⊂ S, S contiene
numeri razionali positivi. Poniamo y uguale al numero corrispondente alla sezione (si verifichi che
lo è)
S 0 = q ∈ Q : qn ∈ S ∨ q < 0 .
Per verificare che S 0 ⊃ S0 (cioè y > 0), prendiamo p ∈ S con 0 < p ≤ 1. Allora pn ≤ p è pure in S,
dunque p ∈ S 0 . Si vede facilmente che (S 0 )n = S: infatti se qi ∈ S 0 , 1 ≤ i ≤ n, allora
n
q1 · q2 · · · qn−1 · qn ≤ max qi ∈ S ,
1≤i≤n
quindi (S 0 )n ⊆ S. Viceversa, se q ∈ S è positivo, per mostrare che q ∈ (S 0 )n ci basta mostrare
l’esistenza (visto che (S 0 )n ha la proprietà di segmento) di r ∈ S 0 tale che q < rn . Scelto q 0 ∈ S
tale che q 0 > q, ci basta allora trovare r ∈ Q tale che q < rn < q 0 . Scegliamo prima δ > 0
sufficientemente piccolo in modo che (1 + δ)n < q 0 /q. Poniamo ora
r = (1 + δ)k
dove k ∈ Z è il massimo intero tale che (1 + δ)kn < q 0 .5 Allora la massimalità di k dà
rn (1 + δ)n = (1 + δ)(k+1)n ≥ q 0 > (1 + δ)n q ,
da cui segue che q < rn .
7. Campi ordinati
Accanto alla struttura di campo, abbiamo visto che R ha anche una struttura di ordine. La
compatibilità tra queste due strutture espressa dalle formule (6.5) e (6.6) viene formalizzata in
astratto con questa definizione.
Definizione 2.15 (Campo ordinato). Un campo ordinato è un campo F dotato di un ordinamento totale ≤ tale che
(a) per ogni x, y, z ∈ F , x ≤ y =⇒ x + z ≤ y + z;
(b) x, y ≥ 0F =⇒ x · y ≥ 0F .
5La disuguaglianza di Bernoulli (Esercizio 2.10) (1 + δ)kn ≥ 1 + knδ per k ≥ 0 mostra che un tale massimo esiste.
7. CAMPI ORDINATI
45
Abbiamo visto che sia R che Q sono campi ordinati, anche se non per tutti i campi esiste una
relazione di ordine compatibile con la somma e il prodotto (l’esempio più famoso è il campo C dei
numeri complessi6). Dagli assiomi di campo ordinato possono essere dedotte numerose proprietà
generali, tra cui (come sempre usiamo a > b e a ≥ b come sinonimi di b < a e b ≤ a rispettivamente):
• per ogni x ∈ F , x2 ≥ 0F , in particolare 1F = (1F )2 > 0F ;
• x ≤ y , a ≥ 0 =⇒ a · x ≤ a · y ;
• x > 0F =⇒ −x < 0F e x−1 > 0F ;
• x · y ≥ 0F se e solo se x e y sono concordi.
Abbiamo anche visto che p 7→ Sp è un omomorfismo da Q in R; più in generale, vale il seguente
risultato che mostra come, a meno di isomorfismi, Q sia il più piccolo campo ordinato.
Lemma 2.16. Dato un campo ordinato F , esiste un unico omomorfismo ϕ : Q −→ F . Tale
omomorfismo è strettamente crescente, quindi iniettivo, e stabilisce un isomorfismo tra Q e un
sottocampo QF di F .
Dimostrazione. Per ogni omomorfismo ϕ : Q −→ F deve essere necessariamente ϕ(0) = 0F
e ϕ(1) = 1F , quindi iniziamo col definire ϕ in questo modo. Induttivamente, si deve anche avere,
per ogni n ∈ N
n volte
}|
{ def
z
ϕ(n) = 1F + · · · + 1F = nF .
Essendo (n + 1)F = nF + 1F > nF , ϕ è univocamente determinata e strettamente crescente su N.
Inoltre ogni omomorfismo ϕ deve soddisfare
ϕ(−n) = −ϕ(n) = −nF ,
quindi adottando questa come definizione si vede che ϕ si prolunga in modo univoco a una funzione
strettamente crescente su Z. Si verifica facilmente che le proprietà (4.1) sono soddisfatte per
x, y ∈ Z.
Preso ora p = m/n ∈ Q, per poter soddisfare alla condizione ϕ(m) = ϕ(m/n) · ϕ(n), deve
necessariamente essere
m
−1
= ϕ(m) · ϕ(n)
= mF · (nF )−1 .
ϕ
n
Questa è una buona definizione, perché sostituendo (mk)/(nk) al posto di m/n si ottiene lo stesso risultato, quindi la adottiamo per estendere ϕ a Q. Inoltre, prendiamo m/n < m0 /n0 in Q,
supponendo n, n0 > 0. Allora ϕ(n), ϕ(n0 ) > 0F , e dunque
mn0 < m0 n =⇒ ϕ(m)ϕ(n0 ) < ϕ(m0 )ϕ(n) =⇒ ϕ(m) · ϕ(n)−1 < ϕ(m0 ) · ϕ(n0 )−1 .
Quindi ϕ è strettamente crescente.
Abbiamo visto nel corso della dimostrazione precedente che possiamo individuare dentro un campo
F una copia isomorfa dei numeri naturali NF = ϕ(N), i cui elementi continueremo a indicare per
semplicità con n (facciamo eccezione solo per 0F e 1F ). Possiamo usarla per dare la definizione di
campo archimedeo.
Definizione 2.17 (Campo archimedeo). Un campo ordinato F si dice archimedeo se, dati
x, y > 0, esiste n ∈ NF tale che n · x > y.
Abbiamo visto che Q è un campo archimedeo.
6Qualunque assegnazione del segno dell’unità immaginaria i implica i2 = −1 > 0 , in contrasto con il fatto che
C
C
1F > 0F in tutti i campi ordinati F .
8. CAMPI ORDINATI COMPLETI
46
Proposizione 2.18. Sia F un campo ordinato. Le seguenti proprietà sono equivalenti:
(i) F è archimedeo;
(ii) NF non è superiormente limitato;
(iii) inf{n−1 : n ∈ N∗F } = 0F ;
(iv) dati x, y ∈ F con x < y, esiste q ∈ QF tale che x < q < y.
La condizione (iv) si esprime dicendo che QF è denso in F .
Dimostrazione. (i)⇒(ii). Basta prendere, dato un ipotetico maggiorante y, x = 1F .
(ii)⇔(iii). La (iii) vuol dire che
∀ x > 0F ∃ n ∈ N∗F : n−1 < x .
Sostituendo y = x−1 , questa condizione equivale a dire che per ogni y > 0F esiste n ∈ N+
F tale che
y < n, e questa è la (ii).
(iii)⇒(iv). Il caso in cui x < 0F < y è ovvio. Possiamo dunque supporre che x e y siano concordi.
Passando eventualmente agli opposti, ci riconduciamo al caso 0F < x < y.
Sia δ = y − x > 0F . Per la (iii), esiste allora k ∈ N∗F tale che k −1 < δ. Consideriamo l’insieme
{n · k −1 : n ∈ NF }. Per ipotesi, esso contiene elementi maggiori di x. Sia m ∈ N∗F il minimo intero
tale che m · k −1 > x. Allora (m − 1) · k −1 ≤ x e quindi
m · k −1 = (m − 1) · k −1 + k −1 < x + δ = y .
Dunque x < m · k −1 < y.
(iv)⇒(i). Siano u, v > 0F . Applicando (iv) con x = 0F e y = u/v, esistono m, n ∈ N∗F tali che
0F < m/n < u/v. In particolare nu > mv ≥ v.
Esempio. Su R(x), il campo delle funzioni razionali a coefficienti reali, consideriamo il seguente
ordinamento: p/q ≤ r/s se esiste a ∈ R tale che p(x)/q(x) ≤ r(x)/s(x) per ogni x > a tale che q(x)
e s(x) non si annullano.
Si dimostri per esercizio che: (a) R(x) è un campo ordinato; (b) R(x) non è archimedeo. Si verifichi
con opportuni controesempi che per R(x) non vale nessuna delle proprietà (ii), (iii), (iv) della
Proposizione 2.18.
8. Campi ordinati completi
Definizione 2.19 (Campo ordinato completo). Un campo ordinato si dice completo se ogni
suo sottoinsieme non vuoto e superiormente limitato ha estremo superiore.
Abbiamo già visto che R è un campo completo (Proposizione 2.10(b)). Il campo R è anche archimedeo: questa proprietà può essere dedotta da una delle formulazioni equivalenti della proprietà
archimedea date nella Proposizione 2.18 (la (iv)), tenendo conto del fatto che abbiamo già mostrato
la densità di Q in R (Proposizione 2.10(d)). Tuttavia si può anche dedurre questa proprietà dal
seguente lemma, che ci tornerà utile nella caratterizzazione assiomatica di R.
Lemma 2.20 (Completo implica archimedeo). Ogni campo ordinato e completo è archimedeo.
Dimostrazione. Sia F ordinato e completo, e supponiamo per assurdo che non sia archimedeo.
Allora NF sarebbe superiormente limitato, e dunque ammetterebbe estremo superiore s ∈ F . Dalla
condizione s ≥ n per ogni n ∈ NF segue che anche s − 1F ≥ n per ogni n ∈ NF . Ma allora s − 1F
sarebbe un maggiorante di NF strettamente minore di s, da cui l’assurdo.
8. CAMPI ORDINATI COMPLETI
47
Abbiamo visto che R è un campo ordinato completo. Il seguente risultato mostra che questa
proprietà identifica R univocamente, a meno di isomorfismi (a posteriori, possiamo quindi dire che
il lemma precedente vale perchè R è archimedeo).
Teorema 2.21 (Caratterizzazione di R a meno di isomorfismi). Sia F un campo ordinato
completo. L’omomorfismo canonico ϕ : Q → F si estende, in modo unico, a un isomorfismo
strettamente crescente di R su F . Quindi ogni campo ordinato completo è isomorfo a R.
Dimostrazione. Ricordiamo che, grazie al lemma precedente, F è archimedeo. Per t ∈ R,
poniamo
ϕ(t)
e = sup ϕ(q) : q ∈ Q , q < t .
Tale elemento ϕ(t)
e
è certamente definito, perché F è completo e l’insieme è maggiorato da un
qualunque elemento ϕ(r) con r ∈ Q, r > t. Inoltre ϕ
e è non decrescente, perché l’insieme del quale
di calcola l’estremo superiore cresce al crescere di t. Dimostriamo una per una le proprietà che ci
fanno concludere che ϕ
e è un omomorfismo strettamente crescente che estende ϕ.
Per ogni t ∈ Q, ϕ(t)
e = ϕ(t): la disuguaglianza ϕ(t)
e ≤ ϕ(t) è ovvia, perché ϕ(t) è un maggiorante.
Se fosse ϕ(t)
e < ϕ(t), per la Proposizione 2.18(iv) esisterebbe f = ϕ(q) ∈ QF tale che ϕ(t)
e < ϕ(q) <
ϕ(t). Ma allora dovrebbe essere q < t, contro il fatto che ϕ(t)
e maggiora tutti gli elementi ϕ(r) per
r < t.
La mappa ϕ
e è strettamente crescente, dunque iniettiva: se t < t0 sono reali, esistono q1 , q2 ∈ Q tali
che t < q1 < q2 < t0 . Quindi ϕ(t)
e ≤ ϕ(q1 ) < ϕ(q2 ) ≤ ϕ(t
e 0 ).
La mappa ϕ
e è surgettiva: dato f ∈ F , poniamo α = {q ∈ Q : ϕ(q) < f } e notiamo che α è
superiormente limitata perché F è archimedeo, sia quindi t = sup α ∈ R (α è proprio la sezione di
Q che definisce il numero reale t, ma questo non ci servirà nel seguito) e mostriamo che ϕ(t)
e = f.
0
Per definizione di ϕ,
e si ha ϕ(t)
e = sup{ϕ(q) : q < t}. Dato che per ogni q < t esiste q > q con
q 0 ∈ α, i.e. ϕ(q 0 ) < f , deduciamo che ϕ(q) < f e quindi che ϕ(t)
e ≤ f . Se valesse la disuguaglianza
stretta, grazie alla Proposizione 2.18(iv) potremmo trovare q 0 < q 00 razionali tali che
ϕ(t)
e < ϕ(q 0 ) < ϕ(q 00 ) < f .
Ma allora avremmo q 0 < q 00 e q 00 ∈ α, quindi q 0 < t. La disuguaglianza ϕ(t)
e < ϕ(q 0 ) contraddirebbe
allora la definizione di ϕ(t).
e
Per ogni t, u ∈ R, ϕ(t+u)
e
= ϕ(t)+
e
ϕ(u):
e
sia q ∈ Q, q < t+u. Scegliendo q1 ∈ Q con q −u < q1 < t,
si ottiene una scomposizione di q, q = q1 + q2 , con q1 < t, q2 = q − q1 < u e q2 ∈ Q. Allora
ϕ(q) = ϕ(q1 ) + ϕ(q2 ) < ϕ(t)
e + ϕ(u)
e
.
Passando quindi all’estremo superiore rispetto ai q < t + u, si ottiene che ϕ(t
e + u) ≤ ϕ(t)
e + ϕ(u).
e
D’altra parte, dati q1 < t, q2 < u, con q1 , q2 ∈ Q, si ha
ϕ(q1 ) + ϕ(q2 ) = ϕ(q1 + q2 ) < ϕ(t
e + u) .
Passando all’estremo superiore rispetto a q1 < t, si ottiene che ϕ(t)
e + ϕ(q2 ) ≤ ϕ(t
e + u). In modo
analogo, passando all’estremo superiore rispetto a q2 < u, si ottiene la disuguaglianza ϕ(t)+
e
ϕ(u)
e
≤
ϕ(t
e + u).
Per ogni t, u ∈ R, ϕ(tu)
e
= ϕ(t)
e ϕ(u):
e
per quanto visto prima, ϕ(0)
e
= 0 e ϕ(−t)
e
= −ϕ(t).
e
Quindi
basta considerare il caso t, u > 0. Si procede in modo analogo a quanto visto per l’additività. 9. ESERCIZI
48
9. Esercizi
Esercizio 2.1.
Siano A e B due sottoinsiemi di R, si definiscano
−A = {−x : x ∈ A} ,
A + B = {x + y : x ∈ A e y ∈ B} ,
A − B = {x − y : x ∈ A e y ∈ B} ,
A · B = {x, y : x ∈ A e y ∈ B} .
Si determinino (quando è possibile o sotto delle ipotesi) sup(−A), inf(−A), sup(A + B), inf(A + B),
sup(A − B), inf(A − B), sup(A · B), inf(A · B), sup(A ∪ B), inf(A ∪ B), sup(A ∩ B), inf(A ∩ B),
sup(A \ B), inf(A \ B), in termini di sup A, inf A, sup B e inf B.
Esercizio 2.2.
√
Si provi che Q, R \ Q, Q[ 2], i numeri algebrici e i numeri trascendenti sono tutti sottoinsiemi densi
di R.
Esercizio 2.3.
√ √
√
√
√
√
I seguenti numeri sono razionali o irrazionali? 2, p con p primo, n + m e n − m con
√
almeno uno di n, m ∈ N non quadrato perfetto, k n con k, n ∈ N ed n non k–potenza perfetta di
un naturale.
Esercizio 2.4.
Si trovino sup e inf dei seguenti insiemi
n nm
n2 + m 2
n nm
o
: n, m ∈ N, n, m ∈ N∗ ,
o
: n, m ∈ N, n, m ∈ N∗ ,
n+m
nm − 2
o
: n, m ∈ N, n > 0 ,
3n
n xy
o
:
x,
y
∈
(0,
1)
,
x2 + y 2
o
n nλ + m1/λ
: n, m ∈ N∗ ,
n+m
in quest’ultimo caso al variare di λ ∈ R∗ .
Esercizio 2.5. F
Sia a ∈ R e n ∈ N, si provi che almeno un elemento dell’insieme {a, 2a, . . . (n − 1)a} dista al
massimo 1/n da un intero.
Esercizio 2.6.
Si trovino sup e inf degli insiemi
{sin n : n ∈ N}
e
{sin nx : n ∈ N}
al variare di x ∈ R .
Esercizio 2.7. F
Dati due numeri reali α e β, si trovino le condizioni su di essi tali che l’insieme {αm+βn : n, m ∈ Z}
sia denso in R. Lo stesso per l’insieme {αm + βn : n, m ∈ N}.
9. ESERCIZI
49
Esercizio 2.8. F
Dato un numero irrazionale x si dimostri che esistono infiniti razionali m/n tali che
m 1
x − < 2 .
n
n
Esercizio 2.9. F
√
Si trovino sup e inf dell’insieme n n : n ∈ N .
Esercizio 2.10.
Si provino le seguenti disuguaglianze di tipo Bernoulli e si discutano gli eventuali casi di uguaglianza:
(1 + x)n ≥ 1 + nx
per x > −1 e n ∈ N,
(1 − x)n ≥ 1 − nx
1
(1 + x)n ≤
1 − nx
1
(1 − x)n ≤
1 + nx
x m x n
1+
1−
≤1
m
n
per x < 1 e n ∈ N,
per −1 < x < 1/n e n ∈ N,
per −1/n < x < 1 e n ∈ N,
per 1 < x < n e n, m ∈ N∗ .
Esercizio 2.11. F
Usando i risultati del problema precedente, si provino le seguenti disuguaglianze (analoghe con
esponente razionale) e si discutano gli eventuali casi di uguaglianza:
(1 + x)q ≥ 1 + qx
per x > −1 e q ≥ 1, q ∈ Q,
q
per x > −1 e q ∈ Q ∩ (0, 1],
q
per x < 1 e q ≥ 1, q ∈ Q,
q
per x < 1 e q ∈ Q ∩ (0, 1],
(1 + x) ≤ 1 + qx
(1 − x) ≥ 1 − qx
(1 − x) ≤ 1 − qx
1
(1 + x)q ≤
1 − qx
1
(1 − x)q ≤
1 + qx
x p x q
1+
1−
≤1
p
q
per −1 < x < 1/q e q ≥ 1, q ∈ Q,
per −1/q < x < 1 e q ≥ 1, q ∈ Q,
per 1 < x < q e p, q ≥ 1, p, q ∈ Q.
Si discuta poi il passaggio agli esponenti reali.
Esercizio 2.12. F
n
Si provi che la successione 1 + n1
è monotona crescente e limitata dall’alto da 3.
n+1
Si provi che per ogni x ∈ R la successione 1 + n1
è monotona decrescente e limitata dal basso
da 2.
Esercizio 2.13. F
Si provi la disuguaglianza aritmetico–geometrica, cioè, dati a1 , a2 , . . . , an numeri reali positivi si ha
√
n
a1 a2 . . . an ≤
a1 + a2 + · · · + an
,
n
9. ESERCIZI
50
e se ne deduca la disuguaglianza tra la media armonica e geometrica
1/a + 1/a + · · · + 1/a −1
√
1
2
n
≤ n a1 a2 . . . an
n
e la disuguaglianza tra la media quadratica e aritmetica degli stessi numeri
r
a1 + a2 + · · · + an
a21 + a22 + · · · + a2n
≤
.
n
n
Esercizio 2.14.
Si provi la seguente disuguaglianza di tipo Young, prima con α e β naturali e poi razionali positivi,
con x, y > 0:
1
αx + βy
xα y β α+β ≤
α+β
e si veda che è equivalente a
xp y q
+
xy ≤
p
q
con p, q ∈ Q, p, q > 1 tali che 1/p + 1/q = 1.
Si discuta poi il passaggio agli esponenti reali.
Esercizio 2.15.
Si provi che per ogni x > 1 e n ∈ N si ha
0<
√
n
x−1≤
x−1
.
n
Esercizio 2.16.
Si dimostri che per ogni α ≥ 0 e n ≥ 1 si ha
n1+α
(n + 1)1+α
≤ 1 + 2 α + · · · + nα ≤
.
1+α
1+α
Esercizio 2.17.
Si provi la seguente disuguaglianza prima con α naturale e poi razionale maggiore o uguale a uno
e 0 < y ≤ x:
αy α−1 (x − y) ≤ xα − y α ≤ αxα−1 (x − y) .
Si discuta poi il passaggio agli esponenti reali.
Esercizio 2.18.
Si provi che per p ≥ q reali positivi e x ≥ 1 si ha
xq − 1
xp − 1
≥
.
p
q
Esercizio 2.19.
Si provi che per q reale maggiore o uguale a uno, x > 0 e h > −1 valgono le disuguaglianze
q(x − 1)xq−1 ≥ xq − 1 ≥ q(x − 1) ,
1 + qh(1 + h)q−1 ≥ (1 + h)q ≥ 1 + qh .
Esercizio 2.20.
Si determinino i numeri n ∈ N tali che
22n
(2n)!
≤
≤ 22n .
2n
(n!)2
9. ESERCIZI
51
Esercizio 2.21.
Si provi la disuguaglianza di Cauchy–Schwarz (o di prodotto scalare): dati a1 , a2 , . . . , an e b1 , b2 , . . . , bn
numeri reali, si ha
n
n
n
X
1/2 X
1/2
X
ai bi ≤
a2i
b2i
.
i=1
i=1
i=1
Quando vale l’uguaglianza?
Verificare inoltre la seguente identità di Lagrange,
! n
!
!2
n
n
X
X
X
X
a2i
b2i −
ai bi
=
(ai bj − aj bi )2 .
i=1
i=1
i=1
i<j
Esercizio 2.22.
Si provi che se a1 , . . . , an sono positivi si ha
a1 + a2 + · · · + an ≤
√
n a21 + a22 + · · · + a2n
1
2
.
Esercizio 2.23. F
Si provi la disuguaglianza di Hölder: dati a1 , a2 , . . . , an e b1 , b2 , . . . , bn numeri reali e due esponenti
p, q > 1 con 1/p + 1/q = 1, si ha
n
X
ai bi ≤
n
X
i=1
|ai |
p
n
1/p X
i=1
|bi |q
1/q
.
i=1
Si discutano poi i casi di uguaglianza.
Cosa succede se si permette a p, q di essere minori o uguali a 1?
Esercizio 2.24.
Si provi che dati a1 , a2 , . . . , an numeri reali positivi e p ≥ 1 vale
n
n
X
p
X
p−1
ai ≤ n
api .
i=1
i=1
Quando vale l’uguaglianza?
Esercizio 2.25. F
Si provi la disuguaglianza di Minkowski: dati a1 , a2 , . . . , an e b1 , b2 , . . . , bn numeri reali e p ≥ 1 , si
ha
n
n
n
X
1/p X
1/p X
1/p
p
p
|ai + bi |
≤
|ai |
+
|bi |p
.
i=1
i=1
i=1
Si discutano poi i casi di uguaglianza.
Cosa succede se si permette a p di essere minore di 1?
Esercizio 2.26.
Si provi la disuguaglianza di riarrangiamento: dati a1 ≤ a2 ≤ · · · ≤ an e b1 ≤ b2 ≤ · · · ≤ bn numeri
reali, allora si ha
n
n
n
X
X
X
ai bn+1−i ≤
ai bσ(i) ≤
ai bi ,
i=1
i=1
per ogni permutazione σ : {1, 2, . . . , n} → {1, 2, . . . , n}.
i=1
9. ESERCIZI
52
Esercizio 2.27.
Si provi la disuguaglianza di Chebyshev: dati a1 ≤ a2 ≤ · · · ≤ an e b1 ≤ b2 ≤ · · · ≤ bn numeri reali,
allora si ha
n
n
n
1 X
1 X
1X
ai bi ≥
ai
bi .
n
n
n
i=1
i=1
i=1
Si provi che se invece a1 ≤ a2 ≤ · · · ≤ an e b1 ≥ b2 ≥ · · · ≥ bn la disuguaglianza vale nel verso
opposto.
Esercizio 2.28. F
Si provi la disuguaglianza generale delle medie: definita la media p–esima, con p ∈ R∗ , di n numeri
reali positivi a1 , a2 , . . . , an come
Pn ap 1/p
i=1 i
Mp =
n
e posto M0 uguale alla media geometrica, si ha
min{ai } ≤ Mp1 ≤ Mp2 ≤ M0 ≤ Mq1 ≤ Mq2 ≤ max{ai }
per ogni insieme di reali p1 ≤ p2 < 0 < q1 ≤ q2 .
Esercizio 2.29. F
Si dimostrino le seguenti disuguaglianze con a, b, c, d ≥ 0
√
√
√
√
√
√
√
√
√
√
3
√
abc + 3 abd + 3 acd + 3 bcd
ab + bc + cd + da + ac + bd
a+b+c+d
4
abcd ≤
≤
≤
.
4
6
4
Esercizio 2.30.
Sia P un punto interno ad un triangolo ABC, si cerchi il minimo della somma dei quadrati delle
distanze di P dai tre lati, al variare di P .
CAPITOLO 3
COMPLEMENTI SULLE SUCCESSIONI DI NUMERI REALI
Indicheremo nel seguito con (xn ) una successione di numeri reali, i.e. una mappa x : N → R il cui
valore in n ∈ N viene indicato con xn (si noti la distinzione tra la notazione usata per la successione
e quella usata per il suo valore n–simo). Useremo anche la notazione (xn )n∈N quando vogliamo dare
maggiore evidenza all’insieme degli indici. Una sottosuccessione (detta anche successione estratta)
(xn(k) ) è una successione che si ottiene mediante la composizione x◦n, ove n : N → N è strettamente
crescente (intuitivamente, la funzione n corrisponde alla scelta di un sottoinsieme di indici e n(k)
è il (k + 1)–mo indice scelto, da qui l’aggettivo “estratta”).
In questo capitolo diamo per noti nozioni e teoremi principali relativi alle successioni di numeri
reali, e in particolare:
• definizione di limite reale per una successione (xn ) ⊆ R (chiameremo tali successioni
convergenti)
lim xn = `
n→∞
⇐⇒
∀ > 0 ∃m ∈ N∀n ∈ N (n ≥ m ⇒ |xn − `| < )
e analoghe definizioni per i casi ` = ±∞ (chiameremo queste ultime divergenti a ±∞);
• teorema di unicità del limite, finito o infinito;
• permanenza del segno (se xn ≥ 0 frequentemente1, allora ` ≥ 0, se ` > 0 allora xn > 0
definitivamente2);
• criterio del confronto (se limn an = a, limn bn = b, allora an ≤ bn frequentemente, implica
a ≤ b, mentre a > b implica, per ogni δ ∈ R tale che a > b + δ, che an > bn + δ vale
definitivamente);
• criterio “dei due carabinieri” per l’esistenza del limite, finito o infinito (se limn an = ` =
limn cn e an ≤ bn ≤ cn definitivamente allora limn bn = `);
• esistenza del limite, finito o infinito, per successioni monotone (in questo enunciato, per il
caso delle successioni monotone limitate, è cruciale la completezza di R);
• limitatezza di una successione convergente;
• permanenza del limite per sottosuccessioni di successioni convergenti o divergenti a ±∞;
• somme e prodotti di successioni convergenti;
• criterio di convergenza di Cauchy (se (xn ) soddisfa la proprietà che per ogni > 0 esiste
n0 ∈ N tale che |xn − xm | < per ogni n, m ≥ n0 , allora (xn ) è convergente). Anche in
questo enunciato è cruciale la completezza di R.
1Abbreviazione che useremo d’ora in poi per: “per infiniti indici n ∈ N”.
2Abbreviazione che useremo d’ora in poi per: “esiste n ∈ N tale che vale per ogni n ≥ n ”.
0
0
Si noti che “definitivamente” implica “frequentemente” e che ¬ “P (n) vale definitivamente” equivale a “¬P (n) vale
frequentemente”.
53
1. MASSIMO E MINIMO LIMITE
54
1. Massimo e minimo limite
In questa sezione introdurremo le nozioni di massimo e minimo limite, sovente utili per snellire
alcune dimostrazioni nelle quali l’esistenza del limite non è nota a priori.
Definizione 3.1 (Massimo e minimo limite). Sia (xn ) ⊆ R una successione. Il massimo e
minimo limite di (xn ) sono definiti rispettivamente da: 3
lim sup xn = lim sup xn ,
lim inf xn = lim inf xn .
n→∞
k→∞ n≥k
n→∞
k→∞ n≥k
La definizione è ben posta, nel senso che il massimo e minimo limite esistono sempre, finiti o infiniti.
Infatti le successioni k 7→ sup xn e k 7→ inf xn sono monotone; inoltre il criterio di confronto tra
n≥k
n≥k
successioni dà
lim inf xn ≤ lim sup xn .
n→∞
n→∞
È inoltre facile verificare che vale la proprietà
lim sup xn = − lim inf −xn ,
n→∞
n→∞
e, con la convenzione (+∞) + (−∞) = +∞ per la subadditività del lim sup e (+∞) + (−∞) = −∞
per la superadditività del lim inf,

lim sup (xn + yn ) ≤ lim sup xn + lim sup yn ,
n→∞
n→∞
n→∞
lim inf (xn + yn ) ≥ lim inf xn + lim inf yn .
n→∞
n→∞
n→∞
Alcuni dei fatti elencati nella sezione precedente possono essere migliorati o riformulati usando i
massimi e minimi limiti, vediamo come:
• (criterio di convergenza) (xn ) ha limite, finito o infinito, se e solo se lim supn xn ≤
lim inf n xn , e in tal caso il valore comune del massimo e minimo limite è il valore del
limite;
• (permanenza del segno) se xn ≥ 0 frequentemente allora lim supn xn ≥ 0, se xn ≥ 0
definitivamente allora lim inf n xn ≥ 0;4
• (criterio “dei due carabinieri”) an ≤ bn ≤ cn definitivamente e lim supn cn ≤ lim inf n an
implica che le tre successioni hanno limite, finito o infinito, e che i tre limiti coincidono.
Con riferimento all’ultimo criterio, nelle ipotesi enunciate sulle tre successioni vale infatti
lim sup cn ≤ lim inf an ≤ lim inf cn ,
n→∞
n→∞
n→∞
lim sup an ≤ lim sup cn ≤ lim inf an ,
n→∞
n→∞
n→∞
dalle quali deduciamo che (cn ) e (an ) convergono, e che i limiti sono gli stessi.
A titolo di esempio, vediamo anche come si dimostra con il massimo e il minimo limite la convergenza
delle successioni di Cauchy.
Teorema 3.2. Ogni successione (xn ) ⊆ R di Cauchy è convergente.
3Usiamo la notazione (più intuitiva) corrente in lingua inglese, lim sup e lim inf al posto rispettivamente di maxlim
e minlim.
4Le contronominali sono rispettivamente: se lim sup x < 0 allora x < 0 definitivamente, se lim inf x < 0
n
n n
n n
allora xn < 0 frequentemente.
1. MASSIMO E MINIMO LIMITE
55
Dimostrazione. Scegliendo = 1 e M = max{|x0 |, |x1 |, . . . , |xn0 | + 1} si vede facilmente che
|xn | ≤ M per ogni n ∈ N, quindi (xn ) è limitata. Per > 0 arbitrario, esiste n ∈ N tale che
xn ≤ + xm
∀n, m ≥ n .
Passando al limite superiore in n otteniamo lim supn xn ≤ + xm per ogni m ≥ n . Possiamo allora
passare al limite inferiore in m, ottenendo
lim sup xn ≤ + lim inf xm .
m→∞
n→∞
Dato che è arbitrario, è soddisfatto il criterio di convergenza lim sup ≤ lim inf.
La seguente proposizione chiarisce l’origine dei termini “massimo e minimo limite”. Osserviamo
preliminarmente che
lim sup xn(k) ≤ lim sup xn ,
(1.1)
k→∞
lim inf xn(k) ≥ lim inf xn
k→∞
n→∞
n→∞
per ogni successione estratta (xn(k) ) (la semplice verifica è lasciata per esercizio, si veda anche la
(1.2)).
Proposizione 3.3 (Caratterizzazione del massimo e minimo limite). Per ogni successione (xn ) ⊆ R
vale

lim sup xn = max lim xn(k) : (xn(k) ) successione estratta, avente limite, di (xn ) ,
n→∞
k→∞
lim inf xn = min lim xn(k) : (xn(k) ) successione estratta, avente limite, di (xn ) .
n→∞
k→∞
Dimostrazione. Sostituendo eventualmente (xn ) con (−xn ), possiamo limitarci a considerare
la prima formula. Per ogni successione estratta (xn(k) ) vale
xn(k) ≤ sup xi
(1.2)
∀k ∈ N .
i≥n(k)
Dato che la successione a destra è estratta di una successione il cui limite è lim supn xn , se anche
la successione a sinistra ha limite si ottiene limk xn(k) ≤ lim supn xn .
Viceversa, dobbiamo ora costruire una successione estratta (xn(k) ) il cui limite è proprio lim supn xn ,
che indicheremo con `. Supponiamo che −∞ < ` < +∞ e per ogni k ≥ 1 determiniamo (grazie alla
definizione di limite, con = 1/k) un intero n(k) tale che
xn(k) > ` −
1
∀k ≥ 1
k
e
n(k) > n(k − 1) ∀k ≥ 2 .
Si noti che questo è possibile, in quanto a k fissato la disuguaglianza xn > ` − 1/k vale per infiniti
indici n, grazie alla convergenza di supn≥m xn a ` per m → ∞. Abbiamo allora per costruzione (e
per la proprietà archimedea)
lim inf xn(k) ≥ ` ,
k→∞
mentre la (1.1) dà lim supk xn(k) ≤ `. Concludiamo quindi che (xn(k) ) ha limite e che il limite vale
`.
Se ` = −∞ la tesi è banale, se ` = +∞ si ripete la dimostrazione precedente sostituendo ` − 1/k
con k.
2. TEOREMI DI CESARO
56
Come conseguenza della caratterizzazione variazionale del massimo e minimo limite otteniamo il
teorema di Bolzano–Weierstrass sulla retta reale. Un’altra classica dimostrazione del teorema passa
attraverso il metodo di bisezione.5
Teorema 3.4 (Bolzano–Weierstrass). Ogni successione (xn ) ha una sottosuccessione avente
limite. In particolare ogni successione limitata ha una sottosuccessione convergente.
2. Teoremi di Cesaro
La media di Cesaro n–esima σn , n ≥ 1, di una successione (an ) di numeri reali è la media aritmetica
σn dei primi n termini a0 , . . . , an−1 :
n−1
(2.1)
σn =
a0 + a1 + · · · + an−1
1X
=
ak .
n
n
k=0
Teorema 3.5 (Primo teorema di Cesaro). Se la successione (an ) tende al limite ` (finito o
infinito), anche la successione (σn ) tende a `.
Dimostrazione. Consideriamo per primo il caso in cui ` = +∞. Dato un numero M > 0,
esiste un intero n0 tale che, per ogni n ≥ n0 , an > M . Se n ≥ n0 si ha dunque
a0 + · · · + an0 −1
n − n0
σn >
+M
.
n
n
Prendendo il limite inferiore in n e usando la superadditività del lim inf otteniamo
lim inf σn ≥ M .
n→∞
Dato che M è arbitrario, lim inf n σn = +∞ quindi limn σn = +∞.
Per il caso ` = −∞ basta sostituire alla successione degli an la successione dei −an .
Supponiamo ora che ` sia finito. Sostituendo alla successione degli an la successione dei bn = an − `,
e osservando che le medie di Cesaro τn dei bn sono τn = σn − `, possiamo ridurci al caso ` = 0.
Dato ε > 0, esiste un intero n0 tale che, per ogni ≥ n0 , |bn | < ε. Allora, per n ≥ n0 ,
n − n0
|b0 | + · · · + |bn0 −1 |
+ε
.
n
n
Prendendo il limite superiore in n e usando la subadditività del lim sup otteniamo lim supn |τn | ≤ ε,
quindi l’arbitrarietà di ε dà che limn |τn | = lim supn |τn | = 0.
|τn | ≤
L’implicazione inversa a quella dimostrata nel teorema, limn σn = ` ⇒ limn an = ` non è vera. È
possibile infatti che le medie σn abbiano limite e che gli an non lo abbiano. Per esempio, si prenda
an = (−1)n , le cui medie di Cesaro, uguali a
(
0 se n è pari
σn = 1
se n è dispari ,
n
tendono a 0.
5Supponendo ad esempio la successione (x ) contenuta in [0, L], si divide l’intervallo [0, L] in due intervalli
n
chiusi di lunghezza L/2, scegliendone uno nel quale la successione cade infinite volte; iterando questo procedimento,
abbiamo intervalli Ik ⊆ [0, L] di lunghezza L/2k nei quali la successione cade infinite volte. Basta allora scegliere
ricorsivamente n(k) in modo che n(k + 1) > n(k) e xn(k+1) ∈ Ik+1 per avere una successione (xn(k) ) di Cauchy, quindi
convergente. Si noti che, scegliendo tutte le volte che è possibile l’intervallo di destra (sinistra) si seleziona proprio
una successione convergente al lim sup (lim inf).
2. TEOREMI DI CESARO
57
Corollario 3.6. Sia (an ) una successione di numeri reali, e si supponga che limn (an+1 − an ) = `
(finito o infinito). Allora limn an /n = `.
Dimostrazione. Si consideri la successione (bn ), dove b0 = a0 e, per n ≥ 1, bn = an+1 − an .
Le medie di Cesaro dei bn sono
b0 + · · · + bn−1
an
=
.
n
n
Quindi limn an /n = limn σn = `, per il Teorema 3.5.
σn =
Si noti che in realtà il Corollario 3.6 è equivalente al primo teorema di Cesaro. Basta osservare che
la (2.1) è equivalente all’identità
an−1 = nσn − (n − 1)σn−1 .
Quindi, applicando il Corollario 3.6 alla successione (nσn ), si ottiene il Teorema 3.5.
Teorema 3.7 (Secondo teorema di Cesaro). Sia (an ) una successione di numeri reali strettamente positivi. Se limn an = ` (finito o infinito), anche la successione delle medie geometriche
√
γn = n a0 a1 · · · an−1
tende a `.
Dimostrazione. Osserviamo che, essendo an > 0 per ogni n, si ha necessariamente ` ≥ 0.
Supponiamo ` = +∞. Dato un numero M > 0, esiste un intero n0 tale che, per ogni n ≥ n0 ,
an > 2M . Se n ≥ n0 si ha dunque
p
n−n0
1
γn > (a0 a1 · · · an0 −1 ) n (2M ) n = 2M n a0 a1 · · · an0 −1 (2M )−n0 .
√
Poiché limn→∞ n b = 1 per ogni b > 0, esiste n1 ≥ n0 tale che γn > M per ogni n ≥ n1 .
Per il caso ` = 0, basta sostituire agli an i loro reciproci 1/an .
Consideriamo dunque il caso 0 < ` < +∞. Sostituendo gli an con an /`, possiamo supporre che
` = 1. Dato ε > 0, esiste un intero n0 tale che, per ogni n ≥ n0 , 1 − 2ε < an < 1 + 2ε . Allora, se
n ≥ n0 ,
n−n
n−n
1
1
ε n 0
ε n 0
< γn < (a0 a1 · · · an0 −1 ) n 1 +
.
(a0 a1 · · · an0 −1 ) n 1 −
2
2
Il limite del primo termine è 1 − 2ε , mentre il limite del terzo termine è 1 + 2ε . Quindi esiste un
indice n1 ≥ n0 tale che, per n ≥ n1 , 1 − ε < γn < 1 + ε.
Usando la continuità delle funzioni logaritmo ed esponenziale (che qui non diamo ancora per note),
il Teorema 3.7 si ottiene più semplicemente applicando il Teorema 3.5 alla successione (log an ). È
fondamentale, per la validità del Teorema 3.7, che gli an siano tutti strettamente positivi. Se uno
solo di essi è nullo, da quell’indice in poi tutte le medie geometriche γn sono nulle, e tendono quindi
a 0 indipendentemente dal limite degli an .
Corollario 3.8. Sia (an ) una successione di numeri reali strettamente positivi, tale che limn an+1 /an =
√
` (finito o infinito). Allora limn n an = `.
Come prima, questo enunciato è equivalente al Teorema 3.7, e si dimostra in modo del tutto analogo
al Corollario 3.6 (anche qui, una dimostrazione alternativa si basa sulla funzione logaritmo).
3. TEOREMA DI STOLZ–CESARO
58
3. Teorema di Stolz–Cesaro
Il Teorema di Stolz–Cesaro può essere visto come una forma “discretizzata” della regola di de
l’Hôpital.
La “discretizzazione” si riferisce, in una analogia tra funzioni della variabile “continua” x ∈ R e
funzioni (successioni) della variabile intera n ∈ N, a una corrispondenza tra operazioni del calcolo
differenziale e integrale da un lato e operazioni aritmetiche dall’altro, come quelle indicate in tabella:
Continuo
Discreto
derivata: f 0 (x)
differenza: an+1 − an
integrale:
RT
0
somma: sn = a0 + · · · + an
f (x) dx
media integrale:
1
T
RT
integrale improprio:
0
f (x) dx
R +∞
0
media di Cesaro:
a0 +···+an−1
n
f (x) dx somma della serie:
P∞
n=0 an
Teorema 3.9 (Teorema di Stolz–Cesaro). Siano (an ), (bn ) successioni. Si supponga che
(i) (bn ) sia strettamente monotona;
(ii) valga una delle seguenti condizioni:
(3.1)
lim an = lim bn = 0 ,
n→∞
n→∞
oppure
lim bn = +∞ (oppure − ∞) ;
(3.2)
n→∞
an+1 − an
= `, finito o infinito.
n→∞ bn+1 − bn
(iii) lim
Allora
(3.3)
an
=`.
n→∞ bn
lim
Si noti che nel caso (3.1), il limite (3.3) si presenta nella forma indeterminata 0/0, mentre il
caso (3.2) comprende quello di limiti nella forma indeterminata ∞/∞. Si noti anche che il teorema
nella forma (3.2) comprende il Corollario 3.6 come caso particolare, con bn = n.
Dimostrazione. Consideriamo separatamente i quattro casi, secondo che valga l’uguaglianza (3.1) o l’uguaglianza (3.2) e secondo che ` sia finito o infinito.
Forma indeterminata 0/0 e ` infinito. A meno di cambiar segno ai termini di una o di entrambe
le successioni, possiamo supporre che la successione (bn ) sia strettamente decrescente, e dunque
bn > 0 per ogni n, e inoltre che ` = +∞.
3. TEOREMA DI STOLZ–CESARO
59
Fissato M > 0, esiste n0 ∈ N tale che, per ogni n ≥ n0 ,
an+1 − an
> M , ossia an − an+1 > M (bn − bn+1 ) .
bn+1 − bn
Per ogni p > 0 si ha
(3.4)
an − an+p = (an − an+1 ) + (an+1 − an+2 ) + · · · + (an+p−1 − an+p )
> M (bn − bn+1 ) + (bn+1 − bn+2 ) + · · · + (bn+p−1 − bn+p )
= M (bn − bn+p ) .
Passando al limite per p → ∞, si ha an ≥ M bn per ogni n ≥ n0 . Si ha cosı̀ la tesi.
Forma indeterminata 0/0 e ` finito. Come sopra, possiamo supporre che la successione (bn ) sia
strettamente decrescente, e dunque bn > 0 per ogni n. Sostituendo, se necessario, an con an − `bn ,
possiamo anche supporre che ` = 0.
Fissato ε > 0, esiste n0 ∈ N tale che, per ogni n ≥ n0 ,
|an − an+1 | < ε(bn − bn+1 ) .
Per ogni p > 0, ragionando come in (3.4), si ha allora che
|an − an+p | < ε(bn − bn+p ) .
Passando al limite per p → ∞, si ha |an | ≤ εbn per ogni n ≥ n0 , e dunque la tesi.
Caso bn → ±∞ e ` infinito. Possiamo supporre che sia ` che limn bn siano +∞, e dunque che la
successione (bn ) sia strettamente crescente.
Fissato M > 0, esiste n0 ∈ N tale che, per ogni n ≥ n0 , an > 0 e inoltre
an+1 − an
> M , ossia an+1 − an > M (bn+1 − bn ) .
bn+1 − bn
Per n > n0 si ha
an − an0
= (an − an−1 ) + (an−1 − an−2 ) + · · · + (an0 +1 − an0 )
> M (bn − bn−1 ) + (bn−1 − bn−2 ) + · · · + (bn0 +1 − bn0 )
= M (bn − bn0 ) .
Dividendo per bn , si deduce che, per n > n0 ,
bn an
bn an
>M 1− 0 + 0 >M 1− 0 .
bn
bn
an
bn
Ma
bn lim 1 − 0 = 1 ,
n→∞
bn
an
M
per cui si ha definitivamente
>
.
bn
2
Caso bn → ±∞ e ` finito. Come sopra, possiamo supporre che limn bn = +∞, e dunque che (bn )
sia strettamente crescente, e inoltre che ` = 0.
Fissato ε > 0, esiste n0 tale che, per ogni n ≥ n0 , bn > 0 e
|an+1 − an | < ε(bn − bn+1 ) .
Si ha allora, per n > n0 ,
|an | ≤ |an − an−1 | + |an−1 − an−2 | + · · · + |an0 +1 − an0 | + |an0 |
< ε (bn − bn−1 ) + (bn−1 − bn−2 ) + · · · + (bn0 +1 − bn0 ) + |an0 |
4. CONFRONTI ASINTOTICI TRA SUCCESSIONI
60
= ε(bn − bn0 ) + |an0 | .
Dividendo per bn , si ha, per n > n0 ,
a bn |an0 |
|an0 |
n
<ε+
.
<ε 1− 0 +
bn
bn
bn
bn
an |an0 |
Essendo lim
= 0, definitivamente si ha < 2ε.
n→∞ bn
bn
4. Confronti asintotici tra successioni
Definizione 3.10 (I simboli O e o di Landau). Siano (an ) e (bn ) due successioni.
(a) Si dice che
an = O(bn ) ,
se esistono un indice n0 e una costante M ≥ 0 tali che
∀ n ≥ n0 ,
|an | ≤ M |bn | .
(b) Si dice che
an = o(bn ) ,
se per ogni ε > 0 esiste un indice n0 tale che
∀ n ≥ n0 ,
|an | ≤ ε|bn | .
Si noti che se bn 6= 0 definitivamente, dimodoché il rapporto an /bn abbia senso, allora
(4.1)
an = O(bn )
⇐⇒
lim sup
n→∞
|an |
< +∞ ,
|bn |
an = o(bn )
⇐⇒
lim
n→∞
an
=0.
bn
Le proprietà seguenti, di transitività e stabilità rispetto a somme e prodotti delle relazioni o e O,
sono di semplice verifica, che viene lasciata per esercizio:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
an
an
an
an
an
an
an
an
= o(bn ) =⇒ an = O(bn );
= O(bn ) , bn = O(cn ) =⇒ an = O(cn );
= O(bn ) , bn = o(cn ) =⇒ an = o(cn );
= o(bn ) , bn = O(cn ) =⇒ an = o(cn );
= O(bn ) , a0n = O(bn ) =⇒ an + a0n = O(bn );
= o(bn ) , a0n = o(bn ) =⇒ an + a0n = o(bn );
= O(bn ) , a0n = O(b0n ) =⇒ an a0n = O(bn b0n );
= O(bn ) , a0n = o(b0n ) =⇒ an a0n = o(bn b0n ).
La relazione an = o(bn ) si esprime anche dicendo che an è trascurabile rispetto a bn . Questa
terminologia si riferisce al fatto che nel calcolo dei limiti si applica spesso il:
Teorema 3.11 (Principio di eliminazione degli infinitesimi di ordine superiore).
(4.2)
an + o(an )
an
= lim
.
n→∞ cn + o(cn )
n→∞ cn
lim
Più precisamente, se esiste uno dei due limiti, allora esiste l’altro, e sono uguali.
4. CONFRONTI ASINTOTICI TRA SUCCESSIONI
61
Dimostrazione. Mostriamo il principio nel caso o(cn ) = 0, ripetendo due volte il ragionamento
poi si arriva alla formula (4.2). Supponiamo quindi che esista ` := limn an /cn e mostriamo che
` = limn (an +o(an ))/cn (l’implicazione inversa si mostra considerando a0n = an +o(an )). Cambiando
se necessario il segno a numeratore e denominatore possiamo supporre che cn > 0 per ogni n ∈ N;
per ogni ε ∈ (0, 1) sia n0 ∈ N tale che |o(an )| ≤ ε|an | per ogni n ≥ n0 ; abbiamo allora
(an + o(an )) ≤ an (1 + ε)
se an ≥ 0 ,
(an + o(an )) ≤ an (1 − ε)
se an ≤ 0 .
Da questo deduciamo, dividendo per cn , che lim supn (an + o(an ))/cn ≤ max{(1 + ε)`, (1 − ε)`}.
Essendo ε arbitrario si ottiene lim supn (an + o(an ))/cn ≤ `.
La disuguaglianza lim inf n (an + o(an ))/cn ≥ ` si mostra analogamente.
Definizione 3.12. Siano (an ) e (bn ) due successioni. Si dice che an bn se an = O(bn ) e
bn = O(an ).
Usando le proprietà (2) e (3), si dimostra facilmente quanto segue.
Proposizione 3.13.
(i) La relazione è una relazione di equivalenza sull’insieme delle successioni a valori reali.
(ii) Se an bn , per ogni successione (cn ) vale
(4.3)
cn = O(an ) ⇐⇒ cn = O(bn )
e
cn = o(an ) ⇐⇒ cn = o(bn ) ,
(4.4)
an = O(cn ) ⇐⇒ bn = O(cn )
e
an = o(cn ) ⇐⇒ bn = o(cn ) .
Le classi di equivalenza modulo si chiamano ordini di grandezza di successioni.
Definizione 3.14. Siano a, b due ordini di grandezza e siano (an ) ∈ a, (bn ) ∈ b. Diciamo che
a b se an = O(bn ).
Si vede facilmente, grazie alle implicazioni (4.3) e (4.4), che la validità di questa condizione è
indipendente dalla scelta degli elementi di a e b.
Proposizione 3.15. La relazione è ben definita sull’insieme degli ordini di grandezza di successioni, ed è una relazione d’ordine.
Osserviamo che
• La relazione non è un ordinamento totale: si prendano, per esempio
(
(
n se n è pari ,
1 se n è pari ,
an =
bn =
1 se n è dispari ;
n se n è dispari .
I rispettivi ordini di grandezza non sono confrontabili (per esercizio, si produca un esempio
simile con successioni non decrescenti).
an
• Se bn 6= 0 definitivamente e esiste, finito o infinito, ` = lim
, allora
n→∞ bn
an = O(bn ) ⇐⇒ ` ∈ R ,
an = o(bn ) ⇐⇒ ` = 0 ,
an bn ⇐⇒ ` ∈ R \ {0} .
• Siano (an ) ∈ a, (bn ) ∈ b. Le due condizioni an = o(bn ) e a ≺ b non coincidono né una
delle due implica l’altra. Si consideri infatti che la successione identicamente nulla è “o”
di se stessa, quindi an = o(bn ) 6⇒ a ≺ b. Si prendano poi, ad esempio, le successioni
(
n se n è pari
an =
,
bn = n .
1 se n è dispari
5. ORDINI DI INFINITO E DI INFINITESIMO
62
I rispettivi ordini di grandezza a e b soddisfano la condizione a ≺ b, ma an 6= o(bn ).
Introduciamo ora una relazione di equivalenza più fine (i.e. con classi di equivalenza più piccole)
di .
Definizione 3.16 (Asintotica equivalenza). Siano (an ), (bn ) successioni. Diciamo che sono
asintoticamente equivalenti, e scriveremo an ∼ bn , se an − bn = o(bn ).
Anche in questo caso si può mostrare, usando la proprietà (4.1), che per successioni definitivamente
non nulle una formulazione equivalente è limn an /bn = 1. In ogni caso, dalla uguaglianza (4.2)
deduciamo che vale il principio di sostituzione delle successioni equivalenti
an
bn
an ∼ bn , cn ∼ dn
=⇒
lim
= lim
,
n→∞ cn
n→∞ dn
con la solita convenzione che se esiste uno dei due limiti esiste l’altro, e coincidono. Che ∼ sia una
relazione di equivalenza è parte del seguente enunciato.
Proposizione 3.17.
(i) Vale l’implicazione an ∼ bn =⇒ an bn .
(ii) ∼ è una relazione di equivalenza tra successioni.
Dimostrazione. Se an ∼ bn , dato ε > 0, esiste n0 ∈ N tale che
|an − bn | ≤ ε|bn |
∀n ≥ n0 .
Per tali valori di n,
|an | ≤ |an − bn | + |bn | ≤ (1 + ε)|bn |
e
|an | ≥ |bn | − |an − bn | ≥ (1 − ε)|bn | .
Questo dimostra il punto (i). Per dimostrare il punto (ii) osserviamo innanzitutto che la proprietà
riflessiva di ∼ è ovvia, mentre la proprietà simmetrica segue dalla seconda equivalenza nella formula (4.3) con cn = an − bn . Assumendo poi che an ∼ bn e bn ∼ cn , si ha, per la proprietà
(5),
an − cn = (an − bn ) + (bn − cn ) = o(bn ) + o(cn ) = o(cn ) + o(cn ) = o(cn ) .
5. Ordini di infinito e di infinitesimo
Sia α un numero reale positivo. Una successione (an ) si dice un infinito di ordine α, rispettivamente
un infinitesimo di ordine α, se an nα , rispettivamente an n−α .
In modo analogo si definiscono infiniti e infinitesimi di ordine α rispetto a una successione “campione” (bn ) positiva e infinita, scelta in sostituzione della successione bn = n (per es., bn = en , oppure
bn = log n). Nel seguito ci limitiamo ad assumere bn = n come infinito campione, ma quello che
diremo ha evidenti estensioni al caso generale.
Se, per un dato α > 0,
an
lim α = c ∈ R \ {0} ,
n→∞ n
e quindi (an ) è infinita di ordine α, si ha
an ∼ cnα ,
ossia an = cnα + o(nα ) ,
e cnα si chiama la parte principale di an . In modo analogo si definisce, se esiste, la parte principale
di un infinitesimo di ordine α.
5. ORDINI DI INFINITO E DI INFINITESIMO
63
Esempio. Si prenda la successione
an =
Siccome
p
n2 − n .
√
n2 − n
=1,
n→∞
n
an è infinita di ordine 1 con parte principale n. Quindi
p
n2 − n = n + o(n) .
√
Il “resto” rn = n2 − n − n, che sappiamo essere o(n) può essere a sua volta analizzato, osservando
che
1
n
=− .
lim rn = − lim √
2
n→∞
n→∞
2
n −n+n
Quindi
1
an = n + rn = n − + o(1) ,
2
dove o(1) = o(n0 ) indica ovviamente un generico infinitesimo. Analizziamo dunque il nuovo resto
1
p
1
4
rn0 = n2 − n − n + = − √
.
2
n2 − n + n − 21
lim
1
Questo è infinitesimo di ordine 1 con parte principale − . Quindi
8
1
1
an = n − −
+ o(n−1 ) .
2 8n
Ripetendo questo procedimento, è possibile, calcolando iterativamente i coefficienti ck , giungere per
ogni k a una formula
1
c2
ck
1
+ 2 + · · · + k + o(n−k ) .
an = n − −
2 8n n
n
Questo tipo di formula costituisce lo sviluppo asintotico dei termini an della successione data.6
Osservazione 3.18. Le definizioni e notazioni introdotte in questi due paragrafi vengono utilizzate
anche per funzioni di variabile reale. Siccome esse possono riguardare sia il comportamento asintotico di una funzione per x → ±∞, sia quello per x → x0 con x0 ∈ R, è necessario accompagnare
le espressioni f (x) = O g(x) , f (x) ∼ g(x), ecc. dall’indicazione del punto, finito o infinito, verso
cui si intendono i limiti o nel cui intorno devono valere le maggiorazioni. Per esempio, si scrive
sin x ∼ x (x → 0) ,
sin x
per esprimere il fatto che lim
= 1.
x→0 x
oppure
sin x ∼x→0 x ,
6Con gli strumenti del calcolo differenziale è poi possibile determinare una formula esplicita per i coefficienti c :
k
√
n2 − n − n per n → ∞ è come studiare
r
√
1
1
1
1−x−1
f (x) =
−
−
=
x2
x
x
x
√
per x → 0+ (si pone x = 1/n). Lo sviluppo di Taylor di 1 − x − 1 nell’intorno di 0 è
√
1x
1 x2
3 x3
3 · 5 x4
3 · 5 · 7 x5
3 · 5 · 7 · 9 x6
1−x−1=−
−
+
−
+
−
+ ···
2 1!
4 2!
8 3!
16 4!
32 5!
64
6!
k −k−1
da cui si ricava, dopo aver diviso per x, che ck = (−1) 2
(1 · 3 · · · (2k − 1))/(k + 1)! per k ≥ 1.
studiare rn =
6. ESERCIZI
64
6. Esercizi
Esercizio 3.1.
Se (xn ) è una successione di numeri reali tale che per ogni k ∈ N si ha limn→∞ (xn − xn+k ) = 0, si
può concludere che (xn ) è di Cauchy?
Esercizio 3.2.
Sia (xn ) una successione di numeri reali tale che limn→∞ (xn − xn+2 ) = 0. Si provi che allora
xn − xn+1
lim
=0
n→∞
n
Esercizio 3.3.
La successione (xn + pxn−1 ) converge se e solo se converge (xn ). Dire per quali valori reali di p tale
affermazione è corretta.
Esercizio 3.4.
Sia (an ) una successione di reali positivi tali che
an−1 + an−2
an <
.
2
Dimostrare che allora (an ) converge.
Esercizio 3.5.
Sia (xn ) una successione di numeri reali. Provare che è sempre possibile trovare una sottosuccessione
monotona.
Esercizio 3.6.
Sia (xn ) una successione di numeri positivi. Provare che è sempre possibile trovare o una sottosuccessione convergente o una sottosuccessione che diverge a +∞.
Esercizio 3.7. F
Dire se esistono i limiti delle seguenti successioni e eventualmente calcolarli:
p
√
√
√
√
√
n
n2
n log n
n
a per a ∈ R+ , n n, n n log n,
n!,
n!,
n! ,
Pn 1
n
X
1
k=1 k
,
− log n ,
log n
k
k=1
√
n
p
√
n!
n!
n
n+1
per
α
∈
R,
,
(n
+
1)!
−
n! ,
α
n
n
n
Pn
Pn
Pn
α−1
k=1 k
k=1 log k
k=1 log k
,
− log n .
per
α
>
−1,
nα
n log n
n
Esercizio 3.8. F
Studiare il limite di
p
xn = sin π n2 + λn
al variare del parametro λ ∈ R.
Nel caso il limite sia zero si studi l’ordine di infinitesimo della successione.
Esercizio 3.9. F
√
Quali sono i possibili limiti della successione delle parti frazionarie di n?
6. ESERCIZI
65
Esercizio 3.10. F
La successione (1/(n sin n)) ha una sottosuccessione che converge a zero? Si discuta se ne ha una
che converge a +∞? (ATTENZIONE!!! Questo secondo è un PROBLEMA APERTO!!! Cercare
in letteratura o in rete informazioni al riguardo).
Esercizio 3.11.
Studiare il comportamento delle seguenti successioni definite per ricorrenza, al variare del parametro
λ,
an
(1) a1 = λ, an+1 = 1+a
,
n
(2) a1 = λ, an+1 = sin an ,
(3) a1 = λ, an+1 = a2n + an 2 .
Esercizio 3.12.
Sia (an ) una successione di numeri reali tale che a1 = a, a2 = b e
an+1 =
an + an−1
2
Si studi la convergenza di (an ) e si calcoli l’eventuale limite.
Esercizio 3.13.
Studiare il comportamento della successione
√
r q
q
√
√
2, 2 2, 2 2 2, ...
Esercizio 3.14.
Si trovi una formula esplicita per la successione dei numeri di Fibonacci, definita per ricorrenza da
F0 = 1, F1 = 1 e Fn+2 = Fn + Fn+1 .
Esercizio 3.15.
Sia (an ) la successione definita per ricorrenza da a0 = 1 e an+1 = 2an + n. Si trovi una formula
esplicita per (an ).
Esercizio 3.16.
Si consideri la seguente successione definita per ricorrenza,
(
a0 = 0, a1 = 1
an = 4an−1 + an−2 se n > 1 .
√
Trovare limn→∞ n an .
Esercizio 3.17.
Dati due numeri reali e positivi a e b, definiamo
a+b
√2
G(a, b) = ab
A(a, b) =
H(a, b) =
1
a
Media Aritmetica,
Media Geometrica,
!1
+ 1b 2
2ab
=
Media Armonica.
2
a+b
6. ESERCIZI
66
Consideriamo le successioni (xn ) e (yn ), definite per ricorrenza da


x0 = a, y0 = b
xn = A(xn−1 , yn−1 )


yn = G(xn−1 , yn−1 )
Si provi che entrambe le successioni convergono ad uno stesso limite (tale limite si dice Media
Aritmetico–Geometrica di a e b).
Esercizio 3.18.
Mostrare che la successione (xn ) definita da
x0 = 1,
diverge a +∞ e valutarne l’ordine di crescita.
xn+1 = xn +
1
xn
CAPITOLO 4
SOMMATORIE SU INSIEMI INFINITI
In questo capitolo diamo per noti nozioni e teoremi principali relativi alle serie numeriche, e in
particolare:
• definizione di somma di una serie (come limite delle somme finite, dei primi n termini);
• condizione necessaria per la convergenza (termine n–esimo infinitesimo);
• criteri di convergenza per serie con termini
P non negativi: confronto (se anP≤ bn definitivaquella della serie n an , quindi la
mente allora la convergenza
della
serie
n bn implica P
P
√
divergenza della serie n an implica quella della serie n bn ), radice (se n an → `, allora
P
la serie Pn an converge se ` < 1, diverge se ` > 1), rapporto1 (se an+1 /an → `, allora
la serie n an converge se ` < 1, diverge se ` > 1), infine condensazione di Cauchy (se
P
P
0 ≤ an+1 ≤ an , la serie n an converge se e solo se k 2k a2k converge, più precisamente
P∞
P∞ k
P∞
1 an );
0 2 a2k ≤ 2
1 an ≤
P
• criterio di convergenza
assoluta
per serie di segno variabile (se la serie n |an | converge,
P
allora anche la serie n an converge);
• criterio di convergenza di Leibniz
P per serie di segno alternante (se (an ) ⊂ [0, +∞) è
infinitesima e decrescente, allora n (−1)n an converge).
1. Somme di termini non negativi
Dato un insieme I, indichiamo con Pfin (I) l’insieme dei sottoinsiemi finiti di I. Data a : I −→ R,
conveniamo di indicare con ai il valore a(i) e, come per le successioni, con (ai ) la funzione a.
Definizione 4.1 (Somma su insiemi arbitrari di indici). Sia ai ≥ 0 per ogni i ∈ I. Si chiama
sommatoria su I degli ai il valore
X
X
ai = sup
ai ∈ [0, +∞] .
i∈I
F ∈Pfin (I) i∈F
Si dice che la sommatoria converge se tale valore è finito.
Vediamo alcune proprietà generali.
Proposizione 4.2. Se la sommatoria
massimo numerabile.
P
i∈I
ai converge, allora l’insieme {i ∈ I : ai > 0} è al
Dimostrazione. Sia S il valore della sommatoria. Se S = 0, allora necessariamente ai = 0
per ogni i ∈ I. Supponiamo allora 0 < S < +∞. Per ogni n ∈ S
N∗ , sia En = {i ∈ I : ai ≥ S/n}.
Ovviamente En non può contenere più di n elementi. Quindi n>0 En = {i ∈ I : ai > 0} è al
massimo numerabile.
1Applicando il secondo teorema di Cesaro a a
n+1 /an si deduce il criterio del rapporto da quello della radice.
67
2. LIMITI LUNGO INSIEMI ORDINATI FILTRANTI
68
Per determinare il comportamento di una sommatoria a termini non negativi, è possibile limitarsi
a considerare le somme finite su particolari sottofamiglie F di Pfin (I), come ora vedremo.
Definizione 4.3 (Famiglia cofinale in Pfin (I)). Una famiglia F di sottoinsiemi finiti di I si
dice cofinale se, per ogni F ∈ Pfin (I), esiste F 0 ∈ F tale che F ⊆ F 0 .
Proposizione 4.4. Sia F una sottofamiglia cofinale di Pfin (I). Allora
X
X
ai = sup
ai .
F ∈F i∈F
i∈I
Dimostrazione. La disuguaglianza
X
sup
ai ≤
F ∈F i∈F
sup
X
ai =
F ∈Pfin (I) i∈F
X
ai
i∈I
è ovvia. D’altra parte, dato G ∈ Pfin (I) sia F ∈ F tale che G ⊆ F . Allora
X
X
X
ai ≤
ai ≤ sup
ai .
i∈G
i∈F
F ∈F i∈F
Prendendo l’estremo superiore delle somme a primo membro al variare di G in Pfin (I), si conclude
che
X
X
ai ≤ sup
ai .
i∈I
F ∈F i∈F
Corollario 4.5. Sia I = N e sia (an ) una successione a termini non negativi. La definizione di
sommatoria secondo la Definizione 4.1 coincide con quella di somma della serie (cioè come limite
delle somme parziali).
Dimostrazione. Basta osservare che F = {0, 1, . . . , n} : n ∈ N soddisfa le ipotesi della
Proposizione 4.4.
Come vedremo al Paragrafo 5, la stessa equivalenza non varrà più per successioni di segno generico.
2. Limiti lungo insiemi ordinati filtranti
La nozione di serie di termini (ai ) non negativi è stata data come un estremo superiore di somme
finite, e questo ha consentito di definirla per un insieme generico I infinito. Tuttavia, per estendere
la nozione di serie a termini di segno qualunque, è necessario esprimerla come limite. Per far questo,
occorre introdurre la nozione di insieme ordinato filtrante e di limite di una funzione definita su un
insieme filtrante. È anche utile estendere la definizione di insieme cofinale a un qualsiasi insieme
ordinato.
Definizione 4.6 (Insiemi cofinali e insieme ordinato filtrante). Un sottoinsieme Y di un
insieme ordinato (X, ) si dice cofinale se per ogni x ∈ X esiste y ∈ Y tale che x y. Un insieme
ordinato (X, ) si dice filtrante se, dati comunque x, y ∈ X, esiste z ∈ X tale che x ≺ z e y ≺ z.
L’insieme filtrante a cui saremo interessati è X = Pfin (I), con I infinito, ordinato per inclusione.
È inoltre filtrante un qualunque insieme non vuoto, totalmente ordinato e privo di massimo.
3. *L’INTEGRALE DI RIEMANN
69
Definizione 4.7. Sia (X, ) un insieme ordinato filtrante e sia f : X −→ R. Si dice che ` ∈ R è
limite di f lungo X, e si scrive
` = lim f (x) ,
x∈X
se per ogni ε > 0 esiste x ∈ X tale che
∀x x ,
|f (x) − `| < ε .
In modo analogo si definiscono i limiti a ±∞.
Osservazione 4.8. La dimostrazione dei seguenti teoremi per limiti lungo insiemi filtranti è lasciata
per esercizio. Si noti che il ruolo delle sottosuccessioni è giocato dagli insiemi cofinali, nell’enunciato
(6), e che l’ipotesi che l’insieme sia filtrante è essenziale per avere l’unicità del limite.
(1) unicità del limite;
(2) esistenza del limite di funzioni crescenti, cioè tali che x ≺ y ⇒ f (x) ≤ f (y), e uguaglianza
limx∈X f (x) = supx∈X f (x);
(3) esistenza del limite di funzioni decrescenti, cioè tali che x ≺ y ⇒ f (x) ≥ f (y), e
uguaglianza limx∈X f (x) = inf x∈X f (x);
(4) teoremi di confronto;
(5) limiti di somme e prodotti;
(6) se limx∈X f (x) = ` e Y è cofinale in X, allora anche limy∈Y f (y) = `;
(7) se ` ∈ R non è il limite di f lungo X, esiste un intervallo I = (` − ε, ` + ε) tale che
l’insieme{f 6∈ I} è cofinale in X (analogo enunciato se ` = ±∞);
(8) esistenza di lim supx∈X f (x) = inf x∈X supyx f (x) e di lim inf x∈X f (x) = supx∈X ∈yx
f (x);
(9) criterio di convergenza di Cauchy: f ha limite finito lungo X se e solo se per ogni ε > 0
esiste x0 tale che, ∀ x, y x0 , vale |f (x) − f (y)| < ε.2
3. *L’integrale di Riemann
3
Un esempio importante di limite lungo insiemi filtranti è dato dall’integrale di Riemann. Ricordiamo
prima le definizioni tradizionali di integrale e di funzione integrabile secondo Riemann, vedremo
poi come entrambi questi concetti possono essere espressi in modo più efficace usando la nozione
di limite lungo un insieme filtrante.
Sia [a, b] ⊆ R un intervallo chiuso e limitato e indichiamo con Σ l’insieme delle partizioni di [a, b],
Σ := (t0 , . . . , tn ) : n ∈ N∗ , a = t0 < t1 < · · · < tn−1 < tn = b ,
indicando con σ l’elemento generico di Σ. L’insieme Σ, munito della relazione di ordine insiemistica,
è filtrante.
2A differenza del caso I = N, non è detto che le successioni di Cauchy (o, il che è lo stesso, convergenti) siano
limitate. Ad esempio, se I = Z munito della usuale struttura d’ordine, allora la successione (2−n ) ha limite uguale a
0, ma non è limitata.
3Sezione facoltativa
3. *L’INTEGRALE DI RIEMANN
70
Indichiamo ora con S([a, b)) le funzioni f : [a, b) → R semplici, caratterizzate dall’essere costanti
sugli intervalli [ti , ti+1 ) su un’opportuna partizione σ = (t0 , . . . , tn+1 ) ∈ Σ. Si verifica facilmente
che S([a, b)) è uno spazio vettoriale, che la definizione
I(g) :=
n−1
X
g(ti )(ti+1 − ti )
se g è costante su [ti , ti+1 ), i = 0, . . . , n − 1
i=0
è ben posta e che I definisce un funzionale4 lineare e monotono su S([a, b)). Verifichiamo a titolo
di esempio che S([a, b)) è vettoriale, le altre verifiche sono del tutto analoghe: se f è costante sugli
intervalli di σ, lo è anche su ogni partizione più fine di σ (basta verificarlo aggiungendo un punto
alla volta). Quindi se f è costante sugli intervalli di σ e g è costante sugli intervalli di η, αf + βg
è costante sugli intervalli di σ ∪ η, quindi αf + βg è semplice.
Diremo che una funzione limitata f : [a, b) → R è integrabile secondo Riemann, in breve Rintegrabile, se I∗ (f ) = I ∗ (f ), ove
I ∗ (f ) := inf I(g) : g ≥ f, g ∈ S([a, b))
e
I∗ (f ) := sup I(h) : h ≤ f, h ∈ S([a, b)) .
Si noti che I∗ (f ) ≤ I ∗ (f ) e che
−∞ < (b − a) inf f ≤ I∗ (f ) ≤ I ∗ (f ) ≤ (b − a) sup f < ∞.
Rb
Quando f è R-integrabile, il valore comune a I∗ (f ) e I ∗ (f ) è indicato con a f (x) dx.
Il classico esempio di funzione non integrabile è la funzione f di Dirichlet, identicamente uguale
a 1 su Q e identicamente nulla su R \ Q. In tal caso per ogni intervallo [a, b] vale I∗ (f ) = 0 e
I ∗ (f ) = (b − a).
È possibile dimostrare che:
(a) l’insieme delle funzioni R-integrabili è uno spazio vettoriale e l’integrale agisce linearmente
su di esso;
(b) sono R-integrabili le funzioni semplici (per definizione, si prende f = g = h) e l’integrale
di Riemann coincide con I su questa classe di funzioni;
(c) sono R-integrabili le funzioni continue in [a, b]5
(d) sono R-integrabili le funzioni monotone limitate.6
Per tutte queste classi di funzioni e in realtà, come vedremo tra un attimo, per tutte le funzioni
integrabili, vale anche la formula
Z b
n−1
X (b − a)
i
f (ti ) con ti = a + (b − a) .
(3.1)
f (x) dx = lim
n→∞
n
n
a
i=0
Proposizione 4.9. Per ogni f : [a, b) → R R-integrabile vale la (3.1).
4In genere le funzioni definite su spazi di funzioni sono chiamate funzionali.
5Infatti, per l’uniforme continuità, per ogni ε > 0 esiste δ > 0 tale che |f (x) − f (y)| < ε tutte le volte che
|x − y| < δ; preso n ∈ N tale che n > δ −1 , dividendo [a, b) in n intervalli Ji = [a + i(b − a)/n, a + (i + 1)(b − a)/n)
e prendendo come minorante (risp. maggiorante) la funzione h (risp. g) che vale minJ i f (risp. maxJ i f ), dalla
disuguaglianza maxJ i f − minJ i f < ε si deduce che I(g) ≤ I(h) + ε(b − a).
6
Se f è crescente, basta prendere una suddivisione come in (c) e poi definire h uguale a f (a + i(b − a)/n) in Ji e
g uguale a f (a + (i + 1)(b − a)/n), ottenendo I(g) ≤ I(h) + (b − a) sup |f |.
3. *L’INTEGRALE DI RIEMANN
71
Dimostrazione. Abbiamo già osservato che il risultato vale per funzioni continue f : [a, b] →
R, con un ragionamento simile a quello seguito in (c). Osserviamo ora che per ogni ε > 0 ed ogni
funzione semplice h minorante (risp. g maggiorante) possiamo trovare, con un piccolo raccordo tra
Rb
le successive discontinuità a salto, una funzione continua h1 ≤ h tale che a (h − h1 ) dx < ε (risp.
Rb
una funzione continua g1 ≥ g tale che a (g1 − g) dx < ε). Allora
lim sup
n→∞
n−1
X
i=0
n−1
X (b − a)
(b − a)
f (ti ) ≤ lim sup
g1 (ti ) =
n
n
n→∞
Z
i=0
b
g1 (x) dx ≤ I(g) + .
a
Minimizzando rispetto a ε e g otteniamo
lim sup
n→∞
n−1
X
i=0
(b − a)
f (ti ) ≤ I ∗ (f )
n
e, con ragionamento analogo basato su h1 ,
lim inf
n→∞
n−1
X
i=0
(b − a)
f (ti ) ≥ I∗ (f ) .
n
La R-integrabilità di f implica allora che il limite esiste e coincide con l’integrale.
Tuttavia, quando trattiamo funzioni molto discontinue, il limite in (3.1) potrebbe non esistere o
dipendere dalla partizione. Ad esempio, nel caso della funzione di Dirichlet, il limite in (3.1) esiste
ma può valere 0 o 1 a seconda dell’appartenenza a Q di a e di b. Quindi l’esistenza del limite in
(3.1) non implica l’integrabilità.
Ci chiediamo quindi: è possibile caratterizzare la R-integrabilità e non solo l’integrale con un
processo di limite? Per capire questo partiamo dall’osservazione che, nella Proposizione 4.9, non vi
è nulla di essenziale nella scelta di una partizione in intervalli di uguale lunghezza, né nella scelta
del punto più a destra dell’intervallo: se avessimo scelto partizioni
σk = {(t0,k , . . . , tnk ,k )}
e punti ξi,k ∈ [ti,k , ti+1,k ), avremmo ancora avuto (con dimostrazione simile)
b
Z
f (x) dx = lim
a
k→∞
nX
k −1
(ti+1,k − ti,k )f (ξi,k )
i=0
purché la finezza della partizione σk , vale a dire supi (ti+1,k − ti,k ), fosse stata infinitesima.
Queste considerazioni suggeriscono l’introduzione dell’insieme Σp delle partizioni puntate
Σp := {(σ, ξ) : σ = (t0 , . . . , tn ) ∈ Σ, ξi ∈ [ti , ti+1 ), i = 0, . . . , n − 1}
munito della relazione d’ordine parziale definita come segue:
0
(σ, ξ) = (t0 , . . . , tn ; ξ1 , . . . , ξn−1 ) (t00 , . . . , t0m ; ξ10 , . . . , ξm−1
) = (σ 0 , ξ 0 )
se e solo se σ ⊆ σ 0 .
Consideriamo anche la funzione I : Σp → R definita da
I(σ, ξ) :=
n−1
X
i=0
f (ξi )(ti+1 − ti )
per (σ, ξ) ∈ Σp , σ = (t0 , . . . , tn ) .
3. *L’INTEGRALE DI RIEMANN
72
Per caratterizzare la R-integrabilità senza menzionare l’integrale è anche utile considerare la funzione
n−1
X
Oσ (f ) :=
sup f − inf f (ti+1 − ti )
=
i=0 [ti ,ti+1 )
n−1
X
sup
[ti ,ti+1 )
(f (ξ) − f (ξ 0 ))(ti+1 − ti )
0
i=0 ξ, ξ ∈ti ,ti+1 )
per σ = (t0 , . . . , tn ) .
Non è difficile verificare la proprietà di monotonia (come sempre, aggiungendo un punto alla volta)
Oσ (f ) ≥ Oσ0 (f )
(3.2)
se σ ≤ σ 0 .
Teorema 4.10. Sia f : [a, b) → R limitata. Allora le seguenti tre proprietà sono equivalenti:
(i) f è integrabile secondo Riemann;
(ii) lim Oσ (f ) = 0;
σ∈Σ
(iii) esiste lim(σ,ξ)∈Σp I(σ, ξ).
Per f integrabile secondo Riemann vale la formula
Z b
(3.3)
f (x) dx = lim
I(σ, ξ) .
(σ,ξ)∈Σp
a
Dimostrazione. (i) =⇒ (ii). Per ogni > 0 esistono h minorante e g maggiorante tali che
Z b
Z b
∗
I(g) ≤ I (f ) + =
f (x) dx + ,
I(h) ≥ I∗ (f ) − =
f (x) dx − ,
a
a
quindi I(g)−I(h) ≤ 2. Raffinando se necessario le due partizioni lungo le quali g e h sono costanti,
possiamo trovare una partizione σ = (t0 , . . . , tn ) tale che sia g che h sono costanti sugli intervalli
[ti , ti+1 ). Dato che h è minorante e g è maggiorante, vale evidentemente
sup f − inf f ≤ g(ti ) − h(ti )
[ti ,ti+1 )
[ti ,ti+1 )
e moltiplicando per (ti+1 − ti ) e sommando otteniamo Oσ (f ) ≤ I(g) − I(h) ≤ 2. Dalla (3.2)
otteniamo allora che Oσ0 (f ) ≤ 2 per ogni σ 0 ≥ σ, quindi limσ Oσ (f ) = 0.
(ii) =⇒ (i). Per ogni > 0 possiamo trovare una partizione σ = (t0 , . . . , tn−1 ) tale che
n−1
X
sup f − inf f (ti+1 − ti ) < .
[ti ,ti+1 )
i=0 [ti ,ti+1 )
Definendo h uguale a
inf f su [ti , ti+1 ) e g uguale a
[ti ,ti+1 )
sup f su [ti , ti+1 ) otteniamo funzioni
[ti ,ti+1 )
semplici minoranti e maggioranti f tali che
I(g − h) < .
Quindi I ∗ (f ) ≤ I(g) < I(h) + ≤ I∗ (f ) + ed essendo arbitrario otteniamo che f è integrabile
secondo Riemann.
(i) =⇒ (iii). Sia ε > 0 e siano g, h maggioranti e minoranti rispettivamente tali che I(g) − I(h) < ε.
Indicando con σ = (t0 , . . . , tn ) un elemento di Σ tale che sia g che h sono costanti sugli intervalli
[ti , ti+1 ) individuati da σ, per ogni (σ, ξ) ∈ Σp , dato che h(ti ) ≤ f ≤ g(ti ) in [ti , ti+1 ) abbiamo
I(h) =
n−1
X
i=0
h(ti )(ti+1 − ti ) ≤
n−1
X
i=0
f (ξi )(ti+1 − ti ) ≤
n−1
X
i=0
g(ti )(ti+1 − ti ) = I(g) .
4. SERIE A TERMINI DI SEGNO GENERICO
73
Spezzando ciascun intervallo di σ in sottointervalli, la stessa disuguaglianza vale per ogni (σ 0 , ξ 0 ) ∈
Rb
Σp con σ ≤ σ 0 , quindi per l’arbitrarietà di ε esiste il limite in (c) e coincide con a f (x) dx.
(iii) =⇒ (ii). Per ogni ε > 0 esiste, per la proprietà di Cauchy, σε = (t0 , . . . , tn ) ∈ Σ tale che
|I(σ, ξ) − I(σ, ξ 0 )| < ε tutte le volte che σε ≤ σ. Per σ = σε , se calcoliamo l’estremo superiore di
n−1
X
X
X
n−1
n−1
|I(σ, ξ) − I(σ, ξ 0 )| = f (ξi )(ti+1 − ti ) −
f (ξi0 )(ti+1 − ti ) = (f (ξi ) − f (ξi0 ))(ti+1 − ti )
i=0
al variare di ξ e
ξ0
i=0
i=0
vale proprio Oσε (f ). Abbiamo quindi, per monotonia, Oσ (f ) ≤ ε per σε ≤ σ. In sostanza, la proprietà (3.3) risulta sufficientemente forte per caratterizzare la R-integrabilità, a
differenza dell’esistenza del limite (3.1). Si noti anche che l’insieme delle partizioni
2
h−1
1
∗
(a, a + (b − a), a + (b − a), . . . , a +
(b − a), b) : h ∈ N
h
h
h
non è cofinale in Σ, e non lo è in Σp neanche l’insieme delle partizioni puntate che compaiono in
(3.1). Quindi la Proposizione 4.9 non è conseguenza diretta del Teorema 4.10(iii).
4. Serie a termini di segno generico
Sia I un insieme infinito e Pfin (I) ordinato per inclusione.
Definizione 4.11. Sia (ai ) definita su I e a valori reali. Si chiama serie degli ai il limite
X
X
ai ,
ai = lim
F ∈Pfin (I)
i∈I
i∈F
se tale limite esiste. La serie si dice convergente, divergente o indeterminata secondo che il limite
esista finito, esista infinito o non esista rispettivamente.
Per F ∈ Pfin (I), poniamo
s(F ) =
X
ai .
i∈F
Dimostriamo subito, per funzioni a termini non negativi, l’equivalenza di questa definizione con la
Definizione 4.1.
Proposizione 4.12. Se ai ≥ 0 per ogni i ∈ I, allora
lim
F ∈Pfin (I)
s(F ) =
sup
s(F ) .
F ∈Pfin (I)
Dimostrazione. Se gli ai sono non negativi, la funzione s(F ) è crescente su Pfin (I). La tesi
segue allora dall’Osservazione 4.8(2).
Nel resto di questo paragrafo, dimostreremo che una serie converge se e solo se converge la serie
dei suoi valori assoluti. Per cominciare, diamo un’apposita formulazione del criterio di convergenza
di Cauchy adattata alle sommatorie su insiemi infiniti.
P
Lemma 4.13 (Criterio di convergenza di Cauchy per serie infinite). La serie i∈I ai converge se e solo se per ogni ε > 0 esiste un insieme F0 ∈ Pfin (I) tale che, per ogni F ∈ Pfin (I)
disgiunto da F0 , si abbia |s(F )| < ε.
4. SERIE A TERMINI DI SEGNO GENERICO
74
Dimostrazione. Supponiamo che la serie converga a s ∈ R. Allora, dato ε > 0 esiste F0 ∈
Pfin (I) tale che |s(F 0 ) − s| < ε per ogni F 0 ⊇ F0 finito. Dato F finito e disgiunto da F0 , si consideri
F 0 = F ∪ F0 . Allora
|s(F )| = |s(F 0 ) − s(F0 )| ≤ |s(F 0 ) − s| + |s − s(F0 )| < 2ε .
Viceversa, si supponga che, per ogni ε > 0, esista un insieme F0 ∈ Pfin (I) tale che, per ogni
F ∈ Pfin (I) disgiunto da F0 , si abbia |s(F )| < ε. Si considerino due sottoinsiemi finiti di I, F 0 e
F 00 , entrambi contenenti F0 . Allora le due differenze F 0 \ F 00 e F 00 \ F 0 sono entrambe disgiunte da
F0 . Quindi |s(F 0 \ F 00 )| < ε e analogamente per |s(F 00 \ F 0 )|. Osservando che
s(F 0 ) − s(F 00 ) = s(F 0 \ F 00 ) − s(F 00 \ F 0 ) ,
si ottiene che
|s(F 0 ) − s(F 00 )| ≤ |s(F 0 \ F 00 )| + |s(F 00 \ F 0 )| < 2ε .
Per il criterio di convergenza di Cauchy, vedi l’Osservazione 4.8(9), la serie converge.
P
P
Teorema 4.14. La serie i ai converge se e solo se converge la serie i |ai |. In tal caso,
X X
(4.1)
ai ≤
|ai | .
i∈I
i∈I
Dimostrazione. Per ogni F ∈ Pfin (I), poniamo
X
X
s(F ) =
ai ,
σ(F ) =
|ai | .
i∈F
i∈F
Ovviamente, per ogni F ∈ Pfin (I),
(4.2)
s(F ) ≤ σ(F ) .
Supponiamo che converga la serie dei valori assoluti degli ai . Allora, per il Lemma 4.13, dato
ε > 0, esiste F0 ∈ Pfin (I) tale che, per ogni F ∈ Pfin (I) disgiunto da F0 , σ(F ) < ε. Per la (4.2)
e il criterio di convergenza di Cauchy, anche la sommatoria degli ai converge. Passando al limite
nella (4.2) otteniamo (4.1).
Viceversa, supponiamo che converga la serie degli ai . Allora, dato ε > 0, esiste F0 ∈ Pfin (I)
tale che, per ogni F ∈ Pfin (I) disgiunto da F0 , |s(F )| < ε. Fissato un tale F , lo si scomponga
nell’unione disgiunta di
F+ = i ∈ F : ai ≥ 0 ,
F− = i ∈ F : ai < 0 .
Allora anche F+ e F− sono disgiunti da F0 , per cui
σ(F+ ) = s(F+ ) < ε ,
σ(F− ) = −s(F− ) < ε .
Pertanto,
σ(F ) = σ(F+ ) + σ(F− ) < 2ε ,
e, per il criterio di convergenza di Cauchy, anche la sommatoria
P
i |ai |
converge.
5. IL CASO I = N: CONFRONTO CON LA NOZIONE DI “SOMMA DI UNA SERIE”
75
5. Il caso I = N: confronto con la nozione di “somma di una serie”
Se I = N, occorre dunque distinguere tra la nozione di “sommatoria di una successione” (an )
secondo la Definizione 4.11 e quella di “somma della serie”,
∞
X
an = lim
N
X
N →∞
n=0
an .
n=0
Siccome la famiglia F degli insiemi En = {0, 1, . . . , n} è cofinale, vale l’implicazione
lim
F ∈Pfin (N)
s(F ) = s =⇒ lim s(F ) = lim s(En ) = s .
n→∞
F ∈F
P
Mantenendo la distinzione simbolica tra n∈N an per la sommatoria secondo la Definizione 4.11, e
P∞
7
0 an per la somma della serie , si ha dunque che
X
an = s =⇒
∞
X
an = s .
n=0
n∈N
L’implicazione inversa non vale,
considerare una qualsiasi serie convergente, non assolutaP basta
n /n). Riprendendo l’analogia sottosuccessioni-insiemi cofinali
mente (il classico esempio è ∞
(−1)
1
P∞
fatta in precedenza, la nozione di serie
0 an corrisponde al
P limite “lungo la sottosuccessione
delle parti finite {0, . . . , n}”, mentre la nozione di sommatoria n∈N an corrisponde al limite pieno
nell’insieme filtrante delle parti finite.
In relazione all’implicazione inversa, si ha la seguente caratterizzazione della convergenza della
sommatoria.
Teorema 4.15. Per una successione (an ) le seguenti proprietà sono equivalenti:
P
(1) La sommatoria
n∈N an converge;
P∞
(2) la serie 0 an converge assolutamente.
Dimostrazione.
Per il Teorema 4.14, la condizione (1) equivale alla convergenza
P della somP
matoria n∈N |an |. Per il Corollario 4.5, questo equivale alla convergenza della serie ∞
0 |an |. Dimostriamo infine che una sommatoria convergente su un insieme I si può scomporre in una
sommatoria (finita o infinita) di sommatorie parziali.
8
Teorema 4.16. Sia {I
Pk }k∈K una partizione dell’insieme I, e sia (ai ) una funzione da I a R.
Allora la sommatoria i∈I ai converge se e solo se valgono le seguenti proprietà:
P
(i) per ogni k ∈ K, la sommatoria i∈Ik |ai | converge;
P
P
(ii) posto sk =
|ai |, la sommatoria
sk converge.
i∈Ik
In tal caso convergono anche
(5.1)
k∈K
P
a
k∈K
i∈Ik i e vale
XX ai =
ai .
P
i∈Ik ai e
X
i∈I
P
k∈K
i∈Ik
7Si faccia attenzione al fatto che questa distinzione terminologica e notazionale tra “sommatoria” e “serie” è
stata introdotta perché funzionale alla presente trattazione, ma non è del tutto standard.
8Nelle applicazioni, K sarà finito o numerabile. Si noti che sia l’insieme K, sia uno o più degli insiemi I possono
k
essere finiti. In tal caso la condizione di convergenza della corrispondente sommatoria è automaticamente verificata.
Per completezza di dimostrazione, si assumerà implicitamente che tutti questi insiemi siano infiniti.
5. IL CASO I = N: CONFRONTO CON LA NOZIONE DI “SOMMA DI UNA SERIE”
76
Dimostrazione. Consideriamo prima il caso in cui ai ≥ 0 per ogni i ∈ I.
Supponiamo che
X
ai = sup s(F ) = s
F ∈Pfin (I)
i∈I
sia finito. Fissiamo E ∈ Pfin (K) e, per ogni k ∈ E, Fk ∈ Pfin (Ik ). Posto F =
si ha
X
s(Fk ) = s(F ) ≤ s .
S
k∈E
Fk ∈ Pfin (I),
k∈E
Dall’insieme E isoliamo un suo singolo elemento k0 e teniamo a primo membro il termine corrispondente:
X
s(Fk ) .
s(Fk0 ) ≤ s −
k∈E\{k0 }
Mantenendo fissati gli Fk a secondo membro, prendiamo l’estremo superiore al variare di Fk0 in
Pfin (Ik0 ). Si ottiene che
X
X
ai ≤ s −
s(Fk ) .
i∈Ik0
k∈E\{k0 }
P
In particolare, la sommatoria i∈Ik ai converge, e la proprietà (i) è soddisfatta. Chiamiamo sk0
0
la sua somma. Abbiamo allora la disuguaglianza
X
sk0 +
s(Fk ) ≤ s .
k∈E\{k0 }
Ripetendo lo stesso procedimento iterativamente per ognuno degli altri elementi di E, si ottiene
che
X
sk ≤ s .
k∈E
Passando all’estremo superiore rispetto a E ∈ Pfin (K), si ottiene la condizione (ii), e inoltre che
X
X
(5.2)
sk ≤
ai .
k∈K
i∈I
Supponiamo viceversa che siano soddisfatte le condizioni (i) e (ii). Dato F ∈ Pfin (I), poniamo,
per k ∈ K, Fk = F ∩ Ik , e inoltre chiamiamo E ∈ Pfin (K) l’insieme dei k per cui Fk 6= Ø. Essendo
F l’unione disgiunta degli Fk con k ∈ E, si ha allora
X
X
X
s(F ) =
s(Fk ) ≤
sk ≤
sk .
k∈E
k∈E
k∈K
Passando all’estremo superiore rispetto a F ∈ Pfin (I), si ottiene la disuguaglianza
X
X
(5.3)
ai ≤
sk .
i∈I
k∈K
Abbiamo dunque dimostrato, nel caso ai ≥ 0 per ogni i, l’equivalenza tra la convergenza della
sommatoria su I da un lato, e le condizioni (i) e (ii) dall’altro. Inoltre, le due disuguaglianze (5.2)
e (5.3) forniscono l’uguaglianza (5.1).
Consideriamo ora il caso generale. Poniamo
(5.4)
a+
i = max{ai , 0} ,
a−
i = max{−ai , 0} .
6. CONVERGENZA INCONDIZIONATA DI SERIE
Supponiamo che la sommatoria
Essendo
anche le due sommatorie
P
i ai
77
converga. Allora, per il Teorema 4.14,
P
i |ai |
converge.
0 ≤ a±
i ≤ |ai | ,
±
+
−
i∈I ai convergono. Inoltre, essendo ai = ai − ai ,
X
X
X
ai =
a+
a−
i −
i .
P
i∈I
i∈I
i∈I
Applicando quanto dimostrato per sommatorie a termini positivi, possiamo allora affermare che
P
P
• per ogni k ∈ K, le due sommatorie i∈Ik a+
a−
i∈IkP
i ,
i convergono,
P
0
00
• chiamate sk , sk le rispettive somme, le sommatorie k∈K s0k , k∈K s00k convergono,
P
P
P
P
+
−
0
00
•
k∈K sk =
i∈I ai ,
k∈K sk =
i∈I ai .
Da questo si deduce che
P
• per ogni k ∈ K, sk = i∈Ik |ai | = s0k + s00k , e dunque vale la conclusione al punto (i),
P
P
• Pk∈K sk = i∈I |ai |, e dunque vale la conclusione al punto (ii),
•
a = s0k − s00k ,
P
P
P
Pi∈Ik i0
+
−
00
•
i∈I ai −
i∈I ai =
i∈I ai , cioè vale la formula (5.1).
k∈K (sk − sk ) =
Rimane da dimostrare l’implicazione inversa. Supponiamo che valgano (i) e (ii). Per confronto, le
−
stesse due condizioni valgono con a+
Quindi, per la prima parte della
i , oppure ai , al posto di |ai |.P
dimostrazione, possiamo dire che convergono le due sommatorie i∈I a±
i e che
X
XX a±
a±
.
i =
i
i∈I
k∈K
i∈Ik
P
Ma allora la sommatoria i ai converge e
X
X
X
XX XX XX +
−
ai =
ai −
ai =
a+
−
a−
=
ai .
i
i
i∈I
i∈I
i∈I
k∈K
i∈Ik
k∈K
i∈Ik
k∈K
i∈Ik
6. Convergenza incondizionata di serie
Data una successione (an ), si consideri un suo riordinamento,
bn = aσn ,
dove σ : N −→ N è una funzione bigettiva.
È facile verificare che le due sommatorie
X
an ,
n∈N
X
aσn
n∈N
hanno
lo stesso comportamento e, se convergenti, la stessa somma.
P
a
n∈N n converga a s. Dato ε > 0, esiste F0 ∈ Pfin (N) tale che
X
an − s < ε
n∈F
per ogni F ⊇ F0 . Allora
X
aσn − s < ε
n∈F 0
Infatti, supponiamo che
6. CONVERGENZA INCONDIZIONATA DI SERIE
78
P
per ogni F 0 ⊇ σ −1 (F0 ). Quindi anche n∈N aσn = s. L’implicazione inversa si dimostra allo stesso
modo.
Per quanto riguarda invece il confronto tra le due serie
∞
∞
X
X
an ,
aσn ,
n=0
n=0
si deve considerare che le rispettive somme parziali sono difficilmente confrontabili tra loro. Vediamo
prima il caso più semplice.
Teorema 4.17. Se la serie
∞
P
an è assolutamente convergente, per ogni riordinamento σ dei suoi
n=0
termini si ha
∞
X
aσn =
n=0
∞
X
an .
n=0
Dimostrazione.
P Per il Teorema 4.15 converge la sommatoria
sopra, è uguale a n∈N |aσn |. Quindi, per gli stessi motivi, si ha
∞
X
n=0
aσn =
X
aσn =
n∈N
X
an =
n∈N
∞
X
P
n∈N |an |
che, per quanto detto
an .
n=0
Se invece una serie converge, ma non assolutamente, si ha una situazione molto diversa.
Teorema 4.18. Sia
∞
P
an una serie convergente, ma non assolutamente. Allora, per ogni ` ∈
n=0
R ∪ {±∞}, esiste un riordinamento σ di N tale che
∞
X
aσn = ` .
n=0
+
n an =
P
+
negativi ∞
0 an
Più in generale, la stessa conclusione vale se limn an = 0 e
P
−
n an = +∞.
P
−
e ∞
0 an divergono
P
entramDimostrazione. Per ipotesi le serie a termini non
be (almeno unaPdeve divergere, altrimenti ci sarebbe convergenza assoluta, devono farlo entrambe
perché la serie n an è supposta convergente). Questo implica, in particolare, che gli insiemi
E + = {n ∈ N : an ≥ 0} ,
E − = {n ∈ N : an < 0} ,
sono entrambi infiniti. Inoltre E + , E − formano una partizione di N.
Diamo una dimostrazione completa solo del caso ` ∈ R, lasciando per esercizio i casi ` = +∞,
` = −∞, che non richiedono idee molto dissimili. L’idea della costruzione del riordinamento è
questa: si cominciano a prendere, nell’ordine, i primi an positivi, fino a giungere a una somma
maggiore di `. A questo punto, si riparte dall’inizio e si aggiungono ai termini precedenti i primi
an negativi, fermandosi quando la somma ottenuta diventa minore di `. Quindi si riprende ad
aggiungere, in sequenza, termini positivi non ancora utilizzati, finché non si torna ad avere una
somma maggiore di `, ecc.
Vediamo ora di seguire questa idea con espressioni precise e con le dimostrazioni necessarie. Definiamo ricorsivamente σ(n) ponendo σ(0) = 0 e, supponendo di aver già scelto σ(0), . . . , σ(n),
scegliamo σ(n + 1) come:
P
• il minimo intero m in E + \ {σ(0), . . . , σ(n)}, se n0 aσ(i) ≤ `;
6. CONVERGENZA INCONDIZIONATA DI SERIE
79
P
• il minimo intero m in E − \ {σ(0), . . . , σ(n)}, se n0 aσ(i) > `.
Essendo E ± infiniti il procedimento non si arresta mai, ed è chiaro che σ : N → N è iniettiva, perché
ad ogni
Ppasso si sceglie un indice tra quelli non ancora scelti. Resta da mostrare che σ è surgettiva
e che ∞
0 aσ(i) = `.
Per mostrare che σ è surgettiva basta considerare l’insieme S degli interi n per i quali la strategia
viene invertita, i.e. σ(n) ∈ E + e σ(n + 1) ∈ E − , oppure σ(n) ∈ E − e σ(n + 1) ∈ E + . Questo
insieme S deve essere infinito, altrimenti si avrebbe σ(n) ∈ E + definitivamente oppure σ(n) ∈
E − definitivamente. Ma, nel primo caso, si avrebbe che l’immagine di σ
Pconterrebbe tutti gli
interi di E + e un numero finito di interi in E − , quindi le somme parziali n0 aσ(i) supererebbero
P +
P
a un certo punto λ, per la divergenza della serie
n an =
n∈E + an ; il secondo caso si può
escludere con considerazioni analoghe. È allora chiaro che l’indice m deve appartenere all’insieme
{σ(0), . . . , σ(n)}, se scegliamo n cosı̀ grande che l’intervallo [1, n] ∩ S contenga più di 2m elementi:
in tal caso, infatti, si è “pescato” per almeno m volte dentro l’insieme E + ed almeno m volte dentro
l’insieme E − .
Fino ad adesso non abbiamo
mai usato l’ipotesi che limn an = 0; questa entra proprio nella dimoP
strazione del fatto che n aσ(n) = λ. Osserviamo preliminarmente che, anche se (aσ(n) ) non è una
sottosuccessione (l’unica permutazione di N strettamente crescente è l’identità), si ha comunque
limn aσ(n) = 0 perché σ è iniettiva.9 Ora, la successione dei resti
n
X
δn+1 := ` −
aσ(i) i=0
soddisfa, per n ≥ 1,
(6.1)
(
δn+1 ≤ δn
δn+1 ≤ |aσ(n) |
se n ∈
/S,
se n ∈ S .
Il caso n ∈
/ S è semplice, ad esempio se σ(n) ∈ E + e σ(n+1) ∈ E + (il caso σ(n) ∈ E − , σ(n+1) ∈ E −
è analogo) abbiamo
n−1
n
X
X
aσ(i) ≤
aσ(i) ≤ ` ,
i=0
i=0
da cui la disuguaglianza δn+1 ≤ δn segue subito.
Quando n ∈ S, verifichiamo il caso in cui σ(n) ∈ E + e σ(n + 1) ∈ E − (il caso σ(n) ∈ E − ,
σ(n + 1) ∈ E + è analogo). Abbiamo allora
n−1
X
i=0
aσ(i) ≤ ` <
n
X
aσ(i) ,
i=0
da cui deduciamo facilmente δn+1 ≤ aσ(n) .
Resta da verificare che ogni successione (δn ) che soddisfa la condizione (6.1) è infinitesima. Useremo
quindi il fatto che (δn ) decresce finché non arriva a un indice di S, dove comunque non supera il
valore di una successione già infinitesima. Per dimostrarlo, posto per semplicità zn = |aσ(n) |, ci
siamo ridotti a dimostrare che
(
δn+1 ≤ δn se n ∈
/S,
(6.2)
δn+1 ≤ zn se n ∈ S ,
9Si verifichi con maggiori dettagli questa affermazione; una dimostrazione astratta si può ad esempio dare
osservando che la famiglia {σ(0), . . . , σ(n)}, n ≥ 0, è cofinale.
7. SOMMATORIE A PIÙ INDICI
80
con (zn ) infinitesima e S infinito, implicano che (δn ) è infinitesima. Questo è dimostrato nel seguente
lemma.
Lemma 4.19. Sia S ⊆ N infinito e (zn ) ⊆ [0, +∞) infinitesima. Allora ogni successione (δn ) ⊆
[0, +∞) soddisfacente la (6.2) è infinitesima.
Dimostrazione. Per > 0, sia n tale che zn ≤ per n ≥ n ; sia poi n0 ≥ n appartenente
a S. Allora δm ≤ per m = n0 + 1 e per induzione su m, usando la (6.2) e il fatto che zm ≤ per ogni m ≥ n0 + 1, otteniamo subito che la stessa proprietà vale per ogni m ≥ n0 + 1. Essendo arbitrario si ha la tesi.
7. Sommatorie a più indici
La differenza tra sommatoria e serie va tenuta ancora maggiormente in considerazione quando si
prendono in esame “serie multiple”, ossia con indici variabili in Nk con k ≥ 2.
Supponiamo che l’insieme I degli indici di una sommatoria sia il prodotto cartesiano di k insiemi,
I = I1 × I2 × · · · × Ik ,
di modo che la sommatoria assume la forma “a più indici”
X
ai1 ,i2 ,...,ik .
(i1 ,i2 ,...,ik )∈I1 ×I2 ×···×Ik
Per semplicità di notazioni ci limiteremo a considerare il caso k = 2, denotando con I e J, anziché I1
e I2 , i due insiemi di indici. I risultati che dimostreremo hanno naturali estensioni al caso generale,
che vengono lasciate per esercizio.
Ci interessa discutere la validità di alcune proprietà che sono ovvie per somme finite, in particolare:
• la sommazione “per orizzontali” o “per verticali”:
XX
X
XX
(7.1)
ai,j =
ai,j =
ai,j ;
(i,j)∈I×J
(7.2)
• la “proprietà distributiva”:
X
(i,j)∈I×J
j∈J
ai bj =
i∈I
X
i∈I
i∈I
j∈J
X ai ·
bj .
j∈J
Il teorema che segue è una diretta conseguenza del Teorema 4.16.
Teorema 4.20. Si consideri una successione a due indici (ai,j )(i,j)∈I×J a valori reali. Le seguenti
condizioni sono equivalenti:
P
(a)
(i,j)∈I×J ai,j converge;
P
(b) per ogni j fissato,
i∈I |ai,j | converge e, chiamata sj la sua somma,
P la sommatoria
converge anche j∈J sj ;
P
0
(c) per ogni i fissato, la sommatoria
j∈J |ai,j | converge e, chiamata si la sua somma,
P
0
converge anche i∈I si .
Se queste condizioni sono verificate, hanno senso tutti i termini e le uguaglianze in (7.1).
Dimostrazione. Basta applicare il Teorema 4.16 alle due partizioni I×{j} j∈J e {i}×J i∈I
di I × J.
A questo punto, si ottiene facilmente il seguente risultato sulla proprietà distributiva.
7. SOMMATORIE A PIÙ INDICI
81
P
P
P
Teorema 4.21. Date due sommatorie convergenti, i∈I ai e j∈J bj , la sommatoria (i,j)∈I×J ai bj
è pure convergente e vale l’uguaglianza (7.2).
P
P
Dimostrazione. Posto A = i∈I ai , per j fissato, la sommatoria i∈I ai bj converge a sj =
bj A. Inoltre converge la sommatoria
X
X
sj = A
bj .
j∈J
j∈J
La conclusione segue dunque dall’implicazione (b)⇒(a) del Teorema 4.20 e dalla (7.1) con ai,j =
ai bj .
• Data una “successione doppia” (am,n )(m,n)∈N2 , la formulazione per serie della seconda
uguaglianza nella formula (7.1) diventa:
∞ X
∞
∞ X
∞
X
X
(7.3)
am,n =
am,n .
m=0
n=0
n=0
m=0
È facile vedere che in generale questa identità non vale in generale: se si prende ad
esempio


se m = n
1
am,n = −1 se m = n + 1


0
altrimenti,
si verifica che il primo membro dell’uguaglianza dà 1 e il secondo 0.
• Siccome N2 non ha un ordinamento naturale, non è univocamente definibile cosa sia una
“serie doppia”. Si ricorre allora a opportune famiglie cofinali F = {FN : N ∈ N} di
Pfin (N2 ), a ciascuna delle quali si collega una diversa nozione di “somma della serie
doppia”.
Per esempio, si ha la sommazione per quadrati se si utilizza il limite
X
lim
am,n ,
N →∞
m, n≤N
o la sommazione per cerchi
X
lim
N →∞
am,n ,
m2 +n2 ≤N 2
oppure per triangoli
X
lim
N →∞
am,n ,
m+n≤N
ecc. L’esempio che segue mostra che diversi metodi di sommazione danno luogo a diverse
nozioni di convergenza.
Esempio. Si prenda
am,n

1



n
= −1


n

0
se m = 0 , n > 0
se m = n > 0
altrimenti.
8. PRODOTTO SECONDO CAUCHY DI SUCCESSIONI
82
Sommando per quadrati, si ha
X
am,n = 0 ,
m, n≤N
qualunque sia N . Sommando invece per triangoli, si ha, per N = 2k pari,
X
am,n =
k
X
n=1
m+n≤2k
−
2k
2k
X
1 X1
1
1
+
=
> .
n
n
n
2
n=1
n=k+1
Tuttavia, i problemi citati sopra non si presentano in situazioni di assoluta convergenza, ossia
quando le serie in questione coincidono con le sommatorie studiate nei paragrafi precedenti. Per
esempio, riguardo all’inversione dell’ordine di sommazione nella (7.3), il Teorema 4.20 con I = J =
N implica:
Corollario 4.22. Sia (am,n )(m,n)∈N2 una funzione a valori reali definita su N2 . Le seguenti
condizioni sono equivalenti:
P
am,n converge;
(a)
(m,n)∈N2
∞
P
(b) per ogni m fissato, la serie
converge anche la serie
∞
P
sm ;
m=0
(c) per ogni n fissato, la serie
converge anche la serie
∞
P
n=0
|am,n | converge e, chiamata sm la somma di questa serie,
n=0
∞
P
m=0
|am,n | converge e, chiamata s0n la somma di questa serie,
s0n .
Se queste condizioni sono verificate, vale l’uguaglianza
∞ X
∞
∞ X
∞
X
X
X
am,n =
am,n =
am,n .
m=0
(m,n)∈N2
n=0
n=0
m=0
8. Prodotto secondo Cauchy di successioni
Definizione 4.23 (Prodotto di Cauchy). Date due successioni (an ) e (bn ), si chiama prodotto
secondo Cauchy delle due successioni la successione (cn ) il cui termine n–esimo è
cn =
n
X
ak bn−k =
k=0
X
aj bk .
j+k=n
Si vede facilmente che, se i termini an e bn sono definitivamente nulli, e dunque si ha a che fare solo
con somme finite, vale l’uguaglianza
∞
∞
∞
X
X
X
cn =
aj
bk .
n=0
j=0
k=0
Per discutere la validità di questa uguaglianza in generale, cominciamo dal caso in cui i termini an
e bn sono non negativi.
8. PRODOTTO SECONDO CAUCHY DI SUCCESSIONI
83
Proposizione 4.24. Siano (an ) e (bn ) due successioni a termini non negativi, e sia (cn ) il loro
prodotto secondo Cauchy. Allora
∞
∞
∞
X
X
X
bn ,
an
cn =
n=0
n=0
n=0
con la convenzione che “ 0 · ∞ = 0”.
Dimostrazione. Basta osservare che valgono le disuguaglianze
n
X
ai
n
2n
2n
2n
X
X
X
X
bi ≤
ci ≤
ai
bi
i=0
i=0
i=0
i=0
i=0
e passare al limite per n → ∞.
Per il prodotto secondo Cauchy di successioni a valori di segno qualunque, spezzando come nella dimostrazione del Teorema 4.16 in parte positiva e negativa, si deduce facilmente il seguente
corollario.
Corollario 4.25. Siano (an ) e (bn ) due successioni le cui serie sono assolutamente convergenti,
e sia (cn ) il loro prodotto secondo Cauchy. Allora
∞
∞
∞
X
X
X
(8.1)
cn =
an
bn .
n=0
n=0
n=0
Osservazione 4.26. L’uguaglianza (8.1) non vale in generale in assenza di convergenza assoluta.
P
(−1)n
√
(convergente per il
Si dimostri, per esempio, che il prodotto secondo Cauchy della serie ∞
n=1
n
criterio di Leibniz) con se stessa è una serie il cui termine n–simo cn non tende a zero, e dunque non
converge. Tuttavia è possibile dimostrare che l’uguaglianza vale se almeno una delle serie converge
assolutamente (Teorema di Mertens).10
Il prodotto secondo Cauchy interviene in vari problemi riguardanti serie di funzioni. Uno di questi
riguarda la convergenza di serie di potenze (che saranno studiate ampiamente più avanti). Si
supponga di avere due serie
∞
∞
X
X
an xn ,
bn xn ,
n=0
n=0
entrambe dipendenti da una variabile x (i coefficienti an e bn sono numeri reali assegnati). Si
supponga di sapere che entrambe le serie convergono quando a x vengono assegnati valori in un
dato insieme E ⊆ R. Esse allora definiscono due funzioni definite su E a valori in R,
f (x) =
∞
X
an xn ,
n=0
g(x) =
∞
X
bn xn .
n=0
Moltiplicando i termini delle due serie a due a due, risulta naturale raggruppare insieme i prodotti
contenenti la stessa potenza di x. Si ottiene cosı̀ una nuova serie di potenze,
∞ X
X
aj bk xn ,
n=0
Pn
0
j+k=n
10Detta (a ) la successione la cui serie converge assolutamente, la dimostrazione si basa sulla scrittura C =
n
n
P
an−i Bi = n
0 an−i (Bi − B) + An B, ove An , Bn , Cn sono le somme parziali delle tre serie.
9. ESERCIZI
84
che non è altro, per x fissato, che il prodotto secondo Cauchy delle due serie date. Si vuole sapere se
essa converge a f (x)g(x) quando x ∈ E e la (8.1) dà risposta positiva, in presenza della convergenza
assoluta.
9. Esercizi
Esercizio 4.1.
Dimostrare la seguente identità
1
1
1
1 1
1
+
+ ··· +
= 1 − + − ··· −
n+1 n+2
2n
2 3
2n
(Identità di Catalan) .
Esercizio 4.2.
Calcolare
1 + 2x + 3x2 + · · · + nxn−1
e
1 + 4x + 9x2 + · · · + n2 xn−1 .
Esercizio 4.3.
Provare che le seguenti serie sono convergenti e calcolarne la somma
∞
X
n=1
∞
X
n=2
∞
X
n=1
1
n(n + 1)
∞
X
1
,
2
n −1
n=1
√
(Serie di Mengoli),
√
n+1− n
√
,
n2 + n
1
,
n(n + 1)(n + 2)
∞
X
n6=m
∞
X
n=1
1
n2 − m2
2n + 1
,
+ 1)2
n2 (n
per m ∈ N∗ ,
1
1
1
1
+
+
+
+ ...
1·3 3·5 5·7 7·9
Esercizio 4.4.
Provare che le seguenti serie sono convergenti e calcolarne la somma
∞
X
n=1
n
,
(2n − 1)(2n + 1)(2n + 3)
∞
X
n=0
1
,
(2n + 1)(2n + 3)(2n + 5)
Esercizio 4.5.
Provare che la seguente serie è convergente e calcolarne la somma
∞
X
1
arctan
.
1 + n(n + 1)
n=0
Esercizio 4.6.
Sia h un intero positivo. Provare che
∞
X
n=1
1
1
=
.
n(n + 1)(n + 2) . . . (n + h)
hh!
∞
X
n=1
n4
n
.
+ n2 + 1
9. ESERCIZI
85
Esercizio
4.7.
P
a
una serie convergente con an+1 ≤ an . Si provi che la successione nan è infinitesima.
Sia ∞
n
n=1
(Osservare che da questo si può dedurre che la serie armonica è divergente).
Esercizio 4.8.
P∞
Sia an una successione
P∞infinitesima e decrescente. Provare che se la serie n=1 an è convergente,
allora anche la serie n=1 n(an − an+1 ) lo è, e le due serie hanno la stessa somma.
Esercizio 4.9.
P
Provare che la serie ∞
n=1 an , ove i termini an sono definiti ricorsivamente da
an
a1 = 1, an+1 =
,
2 + an
è convergente. Provare invece che l’analoga serie definita da
an
a1 = 1, an+1 =
,
1 + an
è divergente.
Esercizio 4.10.
Si provi che la serie
∞
X
n=1
1
,
(a + 1)(a + 2) . . . (a + n)
con a > 0, è convergente.
Esercizio
4.11 (Criterio di Raabe).
P
a
Sia ∞
n=1 n una serie a termini positivi. Si provi che se esiste un numero k > 1 tale che
an
n
− 1 ≥ k,
an+1
per ogni n, allora la serie è convergente, mentre se si verifica che
an
n
− 1 ≤ 1,
an+1
per ogni n, allora la serie è divergente.
Esercizio 4.12.
Si utilizzi il criterio di Raabe per lo studio della convergenza della serie
2 1
1·4 2
1 · 4 · 7 . . . (3n − 2) 2
+
+ ··· +
+ ...
3
3·6
3 · 6 · 9 . . . (3n)
Esercizio 4.13.
Sia xn un successione di punti distinti di (0, 1), densa in [0, 1]. I numeri x1 , x2 , . . . , xn−1 dividono
[0, 1] in n parti e xn divide una di queste in due intervalli. Siano an e bn le lunghezze di questi due
intervalli. Dimostrare che
∞
X
1
an bn (an + bn ) = .
3
n=1
Esercizio 4.14 (Criterio di Condensazione di Cauchy).
P
Sia an una successione decrescente di numeri positivi. Si provi che ∞
n=0 an è convergente se e
P∞ k
solo se la serie
2
a
è
convergente.
Come
applicazione
si
dimostri
che la serie armonica
k
P n=0 a 2
generalizzata ∞
1/n
risulta
convergente
se
a
>
1.
n=1
9. ESERCIZI
Esercizio 4.15.
Si determini il comportamento delle serie
∞
∞
X
X
1
1
,
,
α
nα
n logβ n
n=1
n=2
∞
X
n=3
86
1
,...
nα (log n)β (log log n)γ
per α, β, γ > 0.
Esercizio 4.16.
Mostrare che le serie
∞
X
n=2
1
,
(log n)log n
∞
X
n=2
1
(log n)log log n
sono una convergente e l’altra divergente.
Esercizio
4.17 (Criterio di Dirichlet I).
P
a
è una serie le cui somme parziali costituiscono una successione limitata
e bn è una sucSe ∞
n
n=1
P
cessione di numeri positivi decrescente e infinitesima, dimostrare che la serie ∞
n=1 an bn converge.
Come applicazione, si mostri che convergono le serie
∞
∞
∞
X
X
X
√
an
n
n
an x ,
,
nan ,
n
n=0
n=1
n=1
P
se ∞
n=1 an è convergente e |x| < 1.
Si mostri inoltre che questo criterio implica il criterio di Leibniz sulle serie a segni alterni.
Esercizio 4.18.
Sia an una successione di numeri reali tale che
∞
X
|an+1 − an | < +∞
n=1
(una tale successione si dice a variazione limitata), si mostri che è convergente.
Esercizio 4.19 (Criterio di Dirichlet II).
Siano an e bn due successioni di numeri reali tali che
∞
X
|an+1 − an | < +∞,
an → 0
n=1
ed esiste M > 0 tale che
∞
X
bn < M ,
P n=1
per ogni n ∈ N. Si mostri che la serie ∞
n=1 an bn converge e si ha
∞
∞
X
X
an bn ≤ 2M
|an+1 − an | .
n=1
n=1
Si mostri che questo criterio implica il criterio classico sulle serie a segni alterni.
Esercizio 4.20.
Si mostrino dei controesempi alla conclusione del problema precedente nel caso che
• la successione an non sia a variazione limitata,
• la successione an non sia infinitesima,
9. ESERCIZI
• le somme parziali della serie
P∞
n=1 bn
87
non siano limitate.
Esercizio 4.21 (Criterio di Abel).
Siano an e bn due successioni di numeri reali tali che
∞
X
|an+1 − an | < +∞ ,
n=1
e la serie
P∞
n=1 bn
è convergente. Si mostri allora che la serie
P∞
n=1 an bn
converge.
Esercizio 4.22. F
P
n
Si costruiscano due P
successioni di numeri positivi an e bn tali che an /bn → 1 e ∞
n=1 (−1) an è
∞
n
convergente mentre n=1 (−1) bn non converge o è divergente.
Esercizio 4.23. F
Si dimostri che, nelle ipotesi del Teorema 4.18, esistono riordinamenti che danno luogo a una serie
indeterminata.
Esercizio 4.24.
Si dica per quali valori del parametro reale α la seguente serie converge
1−
1
1
1
1
1
+ − α + − α + ...
α
2
3 4
5 6
Esercizio 4.25.
√
P
n
Mostrare che la serie ∞
n=1 (−1) / n + 1 converge, però il prodotto di questa serie con se stessa
non converge.
Esercizio 4.26.
P
P
−n . Si calcoli
Si calcoli il prodotto alla Cauchy della serie ∞
2−n e lo si usi per calcolare ∞
n=1 n2
P∞ an=1
P∞ b n
n
il prodotto alla Cauchy delle due serie n=1 n! e n=1 n! , con a, b ∈ R.
Esercizio 4.27.
Si dica per quali α ≥ 0 la sommatoria
X
(n,m)∈N2
1
(n + m + 1)α
converge.
Esercizio 4.28 (Teorema di Goldbach–Eulero). F
Sia P l’insieme di tutte le potenze perfette dei naturali: 4,8,9,16,25,27,. . . . Si provi che la serie
P
1
n∈P n−1 è convergente ed ha somma 1.
Esercizio 4.29. FF
Dimostrare che la serie il cui termine n–esimo è il reciproco dell’n–esimo numero primo diverge.
Indicato con π(n) il numero di numeri primi minori o uguali a n, si provi che π(n) = o(n) per
n → ∞.
Esercizio 4.30.
P
2
2
Sapendo che ∞
n=1 1/n = π /6, si dimostri che
∞
X
(−1)n−1
n=1
n2
=
π2
.
12
9. ESERCIZI
Esercizio 4.31. F
Si provi che
∞
X
(−1)n−1
n
n=1
Esercizio 4.32.
La serie
88
= log 2 .
n(n+1)
∞
X
(−1) 2
n=1
n
è convergente?
Esercizio 4.33.
Pn
Dimostrare che la successione delle somme parziali
k=1 sin k è limitata e usare tale fatto per
dedurre che la serie
∞
X
sin n
n
n=1
è convergente.
Esercizio 4.34.
Q
Data una successione an di numeri reali, si dice che il prodotto infinito ∞
n=0 an converge se
lim
n→∞
n
Y
k=0
ak = lim a0 a1 . . . an
n→∞
esiste finito.
Si dimostri che
Q
an = 1,
• se ∞
n=0 an converge
P ad un numero non zero, allora limQn→∞
∞
• se an ≥ 1, la serie ∞
(a
−
1)
converge
se
e
solo
se
a
n=0 n
n=0 n converge.
CAPITOLO 5
SPAZIO EUCLIDEO Rn , SPAZI METRICI E FUNZIONI
CONTINUE
Da questo punto in poi diamo per noti:
(1)
(2)
(3)
(4)
la struttura di Rn come spazio vettoriale;
i fatti di base della teoria dei limiti di funzioni a valori reali in una variabile reale;
la caratterizzazione del limite in un punto tramite successioni;
il teorema della permanenza del segno.
Nel seguito chiameremo intervallo di R ogni sottoinsieme non vuoto della forma (a, b), [a, b), (a, b]
e [a, b], ammettendo nei casi in cui gli estremi non sono inclusi anche i valori a = −∞ e b = +∞
(in questo modo tutte le semirette e anche lo stesso insieme R sono intervalli). Daremo anche per
noti i risultati di base della teoria delle funzioni continue, e in particolare:
(1) il teorema dei valori intermedi (l’immagine tramite una funzione continua di un intervallo
è un intervallo);
(2) la nozione di continuità uniforme;
(3) il teorema di Heine–Cantor (ogni funzione continua in un intervallo chiuso e limitato è
uniformemente continua);
(4) le relazioni tra monotonia e invertibilità per funzioni continue su un intervallo: (a) ogni
funzione continua e iniettiva su un intervallo è monotona,1 (b) se una funzione monotona
g definita su un intervallo ha come immagine un intervallo, allora è continua,2 (c) se I, J
sono intervalli e f : I → J è continua e bigettiva, allora f −1 : J → I è continua.3
1. Struttura Euclidea di Rn : prodotto scalare, modulo e distanza
Nello spazio Euclideo Rn , ma vedremo anche in altri spazi, è possibile dedurre dal prodotto scalare
una nozione di lunghezza (modulo di un vettore) e, da questa, una nozione di distanza. Non
sempre, come vedremo, questo percorso si può invertire: esistono nozioni di lunghezza non associate
a prodotti scalari e distanze non associate a nozioni di lunghezza.
Siano
x = (x1 , x2 , . . . , xn ) ,
y = (y1 , y2 , . . . , yn )
due elementi, o punti o vettori, di Rn .
1Se ad esempio x < y < z, f (x) < f (y) e f (y) > f (z), basta scegliere ` compreso tra max{(x), f (z)} e f (y) e
applicare il teorema dei valori intermedi in [x, y] e [y, z] per avere una contraddizione.
2Se avesse una discontinuità, necessariamente a salto, in un punto t, allora l’intervallo aperto avente come estremi
i limiti destri e sinistri in t non sarebbe contenuto nell’immagine, che quindi non sarebbe un intervallo.
3Basta applicare (b) all’inversa di f , che è monotona per (a).
89
1. STRUTTURA EUCLIDEA DI Rn : PRODOTTO SCALARE, MODULO E DISTANZA
90
Definizione 5.1 (Prodotto scalare). Si chiama prodotto scalare tra x e y il numero reale
x · y = x1 y1 + x2 y2 + · · · + xn yn .
Si chiama modulo di x il numero non negativo
q
√
|x| = x · x = x21 + x22 + · · · + x2n .
Le proprietà fondamentali del prodotto scalare sono le seguenti:
• per ogni x, y ∈ Rn , x · y = y · x;
• per ogni x, x0 , y ∈ Rn e λ ∈ R, (x + λx0 ) · y = x · y + λx0 · y;
• per ogni x ∈ Rn , x · x ≥ 0 ed è uguale a 0 se e solo se x = 0.
La seconda proprietà è la linearità nella prima componente. Per la prima proprietà, di simmetria,
si ha anche linearità nella seconda componente. Una conseguenza importante e non ovvia di queste
proprietà è la seguente disuguaglianza.
Teorema 5.2 (Disuguaglianza di Cauchy–Schwarz). Per ogni x, y ∈ Rn ,
|x · y| ≤ |x| |y| ,
con uguaglianza se e solo se x e y sono linearmente dipendenti.
Si noti che a primo membro compare il modulo (valore assoluto) di un numero reale, mentre i
moduli a secondo membro sono moduli di vettori.
Dimostrazione. Se almeno uno tra x e y è il vettore nullo, si hanno l’uguaglianza 0 = 0 e la
lineare dipendenza, in coerenza con quanto enunciato. Supponiamo allora che x e y siano entrambi
diversi da 0. Si consideri, al variare di λ in R, il prodotto scalare
p(λ) = (x + λy) · (x + λy)
= x · (x + λy) + λ y · (x + λy)
= (x + λy) · x + λ (x + λy) · y
= |x|2 + 2λx · y + λ2 |y|2 .
Si osservi che p(λ) è un polinomio di secondo
grado in λ, sempre non negativo su R. Quindi il suo
discriminante, ∆ = 4 (x · y)2 − |x|2 |y|2 deve essere minore o uguale a 0, cioè
(x · y)2 ≤ |x|2 |y|2 .
Estraendo le radici quadrate positive di ambo i membri, si ottiene la disuguaglianza di Cauchy–
Schwarz. Si noti poi che vale l’uguaglianza se e solo se ∆ = 0, e dunque se e solo se esiste λ0 ∈ R
per cui p(λ0 ) = 0. Ma questo equivale a dire che x + λ0 y = 0, e dunque che x e y sono linearmente
dipendenti.
Corollario 5.3. Il modulo in Rn soddisfa la disuguaglianza triangolare
|x + y| ≤ |x| + |y| ,
con uguaglianza se e solo se esiste λ ≥ 0 per cui x = λy oppure y = λx.
1. STRUTTURA EUCLIDEA DI Rn : PRODOTTO SCALARE, MODULO E DISTANZA
91
Dimostrazione. Per la disuguaglianza di Cauchy–Schwarz si ha
|x + y|2 = (x + y) · (x + y)
= |x|2 + 2x · y + |y|2
≤ |x|2 + 2|x · y| + |y|2
≤ |x|2 + 2|x| |y| + |y|2
2
= |x| + |y| .
Questo dimostra la disuguaglianza. Per avere l’uguaglianza, devono valere le due condizioni x·y ≥ 0
e |x · y| = |x| |y|. Per il Teorema 5.2, x e y devono essere linearmente dipendenti, e inoltre la
condizione x · y ≥ 0 implica che la costante di proporzionalità tra le loro componenti deve essere
non negativa.
Siano x, y elementi non nulli di Rn . Essendo
−1 ≤
x·y
≤1,
|x||y|
esiste uno e uno solo θ ∈ [0, π] tale che
x · y = |x||y| cos θ .
Si dice che θ è l’angolo compreso tra x e y. Due elementi x, y di Rn si dicono ortogonali se x · y = 0.
A questo punto elenchiamo le proprietà fondamentali del modulo:
• per ogni x ∈ Rn , |x| ≥ 0, e |x| = 0 se e solo se x = 0;
• per ogni x ∈ Rn e λ ∈ R, |λx| = |λ||x|;
• per ogni x, y ∈ Rn , |x + y| ≤ |x| + |y|.
Definizione 5.4. Si chiama distanza euclidea su Rn la funzione
d : Rn × Rn −→ [0, +∞)
data da
d(x, y) = |x − y| .
Dalle proprietà del modulo si deducono le seguenti proprietà della distanza:
•
•
•
•
per
per
per
per
ogni
ogni
ogni
ogni
x,
x,
x,
x,
y ∈ Rn , d(x, y) = 0 se e solo se x = y;
y ∈ Rn , d(y, x) = d(x, y);
y ∈ Rn e λ ∈ R, d(λx, λy) = |λ|d(x, y);
y, z ∈ Rn , d(x, z) ≤ d(x, y) + d(y, z) (disuguaglianza triangolare).
Dalla proprietà triangolare si deduce facilmente che
d(x, z) − d(y, z) ≤ d(x, y) .
(1.1)
∀ x, y, z ∈ Rn ,
Dati tre punti x, y, z nel piano R2 , le tre distanze d(x, y), d(x, z), d(y, z) rappresentano le lunghezze
dei lati del triangolo (possibilmente degenere) di vertici x, y, z. La disuguaglianza triangolare dice
che la lunghezza di un lato è minore o uguale della somma delle altre due, mentre la disuguaglianza (1.1) dice che la lunghezza di un lato è maggiore o uguale della differenza delle altre due. Questa
proprietà si estende dunque a triangoli in spazi di dimensione superiore.
2. INSIEMI APERTI E CHIUSI DI Rn , PARTE INTERNA, CHIUSURA, FRONTIERA
92
2. Insiemi aperti e chiusi di Rn , parte interna, chiusura, frontiera
In questo paragrafo e nei due seguenti elenchiamo le nozioni principali relative alla topologia4 di
Rn , presentando le principali relazioni tra di esse.
Si chiama palla aperta di centro x0 e raggio r > 0 in Rn l’insieme
Br (x0 ) = {x ∈ Rn : d(x, x0 ) < r} .
Indicheremo anche con B r (x0 ) la palla chiusa {x ∈ Rn : d(x, x0 ) ≤ r}. Notiamo che la proprietà
triangolare della distanza ha delle conseguenze in termini di inclusioni di palle (si veda la formula (2.2) più avanti) e di intersezioni: se due palle aperte (risp. chiuse) hanno intersezione non vuota
allora la distanza dei centri è strettamente minore (risp. minore o uguale) della somma dei raggi.
2.1. Insiemi aperti e chiusi.
Definizione 5.5 (Insiemi aperti). Un sottoinsieme A di Rn si dice aperto se è unione di una
famiglia (possibilmente vuota) di palle aperte.
Si noti che, in particolare, l’insieme vuoto è aperto, cosı̀ come le palle aperte (si prendere la famiglia
costituita da un solo elemento).
Questa definizione si può formulare, in modo equivalente, come segue:
(2.1)
∀ x0 ∈ A ∃ r > 0 : Br (x0 ) ⊆ A .
Infatti, se vale la (2.1) è evidente che A è unione di una famiglia di palle aperte. Viceversa, possiamo
verificare che per ogni punto x contenuto in una palla aperta B esiste una palla B 0 centrata in x e
contenuta in B, per la disuguaglianza triangolare vale infatti
(2.2)
Br−d(x,x0 ) (x) ⊆ Br (x0 )
per ogni x ∈ Br (x0 ) .
Grazie a questa considerazione possiamo verificare che ogni insieme aperto soddisfa la condizione
(2.1), visto che questa è soddisfatta dalle palle aperte.
Non tutti i sottoinsiemi di Rn sono aperti. Per esempio, un insieme costituito da un unico punto x0
non può contenere nessuna palla di centro x0 . Per esercizio, si dimostri che la palla chiusa B 1 (0)
non è aperta.
La seguente proposizione segue subito dalla formula (2.1).
Proposizione 5.6 (Stabilità degli insiemi aperti). La famiglia degli insieme aperti di Rn gode
delle seguenti proprietà:
(i) Ø e Rn sono aperti;
(ii) l’unione di una qualsiasi famiglia di aperti è aperta;
(iii) l’intersezione di una famiglia finita di aperti è aperta.
Definizione 5.7 (Insiemi chiusi di Rn ). Un sottoinsieme di Rn si dice chiuso se il suo complementare è aperto.
Usando le formule di De Morgan, si dimostra facilmente il seguente enunciato.
Proposizione 5.8 (Stabilità degli insiemi chiusi). La famiglia degli insiemi chiusi di Rn gode
delle seguenti proprietà:
(i) Ø e Rn sono chiusi;
(ii) l’intersezione di una qualsiasi famiglia di insiemi chiusi è chiusa;
4Il significato di questo termine verrà chiarito nell’Osservazione 5.35.
2. INSIEMI APERTI E CHIUSI DI Rn , PARTE INTERNA, CHIUSURA, FRONTIERA
93
(iii) l’unione di una famiglia finita di insiemi chiusi è chiusa.
Si mostri per esercizio che le palle chiuse B r (x0 ) sono, per l’appunto, chiuse. Si noti anche che
Ø e Rn sono sia aperti che chiusi, mentre esistono insiemi che non sono né aperti né chiusi: per
esempio, in R, gli intervalli semiaperti [a, b), (a, b] con a < b.
2.2. Parte interna, chiusura e frontiera di un insieme.
Definizione 5.9 (Parte interna). Dato E ⊆ Rn , indicheremo con E̊ la parte interna di E, ovvero
il più grande aperto contenuto in E.
Per le proprietà di stabilità degli insiemi aperti, la definizione di parte interna è ben posta e un
insieme E è aperto se e solo se E̊ = E. La seguente proposizione dà una caratterizzazione più
operativa della parte interna.
Proposizione 5.10. Per ogni insieme E ⊆ Rn non vuoto vale
◦
(2.3)
E = x ∈ E : esiste r > 0 tale che Br (x) ⊆ E .
Dimostrazione. Se x0 ∈ E̊, dato che E̊ è aperto esiste una palla Br (x0 ) tale che Br (x0 ) ⊆ E̊.
Quindi a maggior ragione Br (x0 ) ⊆ E e abbiamo stabilito l’inclusione ⊆ nell’uguaglianza (2.3).
Viceversa, l’insieme A a destra nella (2.3) è contenuto in E ed è aperto. Infatti, se x ∈ A e
Br (x) ⊆ E allora Br/2 (y) ⊆ Br (x) ⊆ E per ogni y ∈ Br/2 (x), quindi Br/2 (x) ⊂ A. Quindi la
massimalità di E̊ implica l’uguaglianza cercata.
Definizione 5.11 (Chiusura). Dato un insieme E ⊆ Rn , indicheremo con E il più piccolo chiuso
contenente E.
Per le proprietà degli insiemi chiusi, la definizione è ben posta. Inoltre, per passaggio al complementare abbiamo le relazioni
◦
Rn \ E = Rn \ E ,
◦
Rn \ E = Rn \ E .
Con la formula (2.3), si verifichi per esercizio che la parte interna della palla chiusa è la palla aperta.
Si mostri anche che per A aperto e E chiuso valgono rispettivamente le inclusioni
◦
A⊇A,
◦
E⊆E ,
e che, in generale, non sono uguaglianze.
Per poter dare una caratterizzazione più operativa della chiusura, chiameremo un punto x0 ∈ E
aderente a E se vale
∀ r > 0 , E ∩ Br (x0 ) 6= Ø .
Ovviamente gli elementi di E sono tutti aderenti a E, ma potrebbero essercene altri. Per esempio,
un qualunque punto della palla chiusa B r (x0 ) è aderente all’insieme E = Br (x0 ).
Sempre per passaggio al complementare, dalla uguaglianza (2.3) deduciamo la seguente proposizione.
Proposizione 5.12. Dato E ⊆ Rn , E è l’insieme dei punti aderenti ad E.
Con questo criterio, si verifichi per esercizio che la chiusura della palla aperta è la palla chiusa. Più
in generale possiamo dare la seguente definizione.
2. INSIEMI APERTI E CHIUSI DI Rn , PARTE INTERNA, CHIUSURA, FRONTIERA
94
Definizione 5.13 (Insieme denso). Sia E ⊆ Rn un insieme, e sia E 0 un suo sottoinsieme. Si dice
che E 0 è denso in E se E 0 ⊇ E, equivalentemente se per ogni x ∈ E e per ogni r > 0 l’intersezione
Br (x) ∩ E 0 non è vuota.
Esempio. Qn è denso in Rn , basta infatti scegliere per ogni x ∈ Rn e per ogni r > 0 razionali qi
tali che |xi − qi | < /n, ottenendo cosı́ |x − q| < per q = (q1 , . . . , qn ).
Definizione 5.14 (Frontiera). L’insieme
◦
∂E = E \ E = E ∩ Rn \ E
si chiama frontiera di E.
Osserviamo che ∂E = ∂(Rn \ E). Ad esempio, la frontiera della palla aperta (o anche della palla
chiusa) è la sfera
Sr (x0 ) := x ∈ Rn : d(x, x0 ) = r .
Tuttavia, la frontiera di un insieme piccolo può anche essere molto grande: ad esempio la frontiera
di Qn è Rn .
2.3. Punti di accumulazione, punti isolati e derivato di un insieme.
Definizione 5.15 (Punti di accumulazione e isolati). Un punto x0 ∈ Rn è di accumulazione
per l’insieme E se
∀ r > 0 , E ∩ Br (x0 ) \ {x0 } 6= Ø .
L’insieme dei punti di accumulazione per E si chiama insieme derivato di E e si indica con D(E).
Un punto x0 di E si dice isolato in E se
∃ r > 0 : E ∩ Br (x0 ) \ {x0 } = Ø .
Si noti, nella definizione di D(E), la differenza con la nozione di punto aderente, a causa del fatto
che x0 viene escluso nell’intersezione. Chiaramente valgono le seguenti proprietà:
• i punti di accumulazione per E sono aderenti a E, i.e. D(E) ⊆ E;
• i punti aderenti a E che non siano in E sono di accumulazione per E, i.e. E = E ∪ D(E);
• ogni punto di E è di accumulazione per E o isolato in E.
Esempio. In R, sia E = n1 : n ∈ N∗ . Tutti i punti di E sono isolati in E, ed E ha un unico
punto di accumulazione, l’origine, che non appartiene a E. Si noti che Ø = D(D(E)) ( D(E) ( E.
Proposizione 5.16. L’insieme derivato di un insieme E è un sottoinsieme chiuso di E.
Dimostrazione. Dimostriamo che Rn \ D(E) è aperto. Se x0 6∈ D(E), esiste r > 0 tale che
Br (x0 ) \ {x0 } è disgiunto da E. Se x0 ∈
/ E deduciamo che Br (x0 ) ∩ E = Ø e quindi che nessun
punto di Br (x0 ) può essere di accumulazione per E, i.e. Br (x0 ) ⊂ Rn \ D(E). Se x0 ∈ E allora x0
è un punto isolato in E e vale la stessa conclusione.
3. SUCCESSIONI A VALORI IN Rn
95
3. Successioni a valori in Rn
Sia a : N −→ Rn una successione di punti di Rn , che indicheremo con l’abituale simbolo (ak ). D’ora
in poi, con lieve abuso di notazione, scriveremo anche (ak ) ⊆ E per dire che la successione prende
i suoi valori nell’insieme E.
Definizione 5.17. Si dice che ` ∈ Rn è limite della successione (ak ) se, per ogni ε > 0, esiste
k0 ∈ N tale che, per ogni k ≥ k0 , d(ak , `) < ε.
È immediato verificare che il limite, se esiste, è unico. Infatti d(ak , `) < ε e d(ak , `0 ) < ε con
2ε ∈ (0, d(`, `0 )) contraddice la disuguaglianza triangolare
d(`, `0 ) ≤ d(`, ak ) + d(ak , `0 ) < ε + ε < d(`, `0 ) .
Sempre usando la disuguaglianza triangolare, si mostra subito che ogni successione convergente è
limitata, i.e. contenuta in una palla (e, sempre per la disuguaglianza triangolare, il centro della
palla può essere scelto arbitrariamente, pur di aumentare il raggio).
Altre formulazioni equivalenti della convergenza sono: ` è limite della successione se, per ogni
ε > 0, i punti ak sono definitivamente contenuti nella palla Bε (`), o anche
lim ak = ` ⇐⇒ lim d(ak , `) = 0 ,
(3.1)
k→∞
k→∞
dove il limite a secondo membro riguarda una successione di numeri reali. Da questo (o anche da
una verifica diretta) si può dedurre che anche questa nozione di limite è stabile per passaggio a
sottosuccessioni.
Vediamo ora due proprietà importanti dei limiti in Rn .
Proposizione 5.18 (Convergenza dei moduli e delle distanze). Se limk ak = `, allora
limk |ak | = |`|. Più in generale, limk d(ak , b) = d(`, b) per ogni b ∈ Rn .
Dimostrazione. Per la disuguaglianza (1.1) si ha
0 ≤ |ak | − |`| = d(ak , 0) − d(`, 0) ≤ d(ak , `) .
Per la (3.1), limk |ak | − |`| = 0, da cui la tesi. Lo stesso ragionamento, sostituendo l’origine con
un qualsiasi altro punto b fissato, dà l’enunciato più generale.
P
D’ora in poi useremo spesso le disuguaglianze elementari maxi |xi | ≤ |x| ≤ i |xi |.
Proposizione 5.19 (Convergenza componente per componente). Posto ak = (a1k , a2k , . . . , ank )
e ` = (`1 , `2 , . . . , `n ), si ha l’equivalenza
lim ak = `
k→∞
⇐⇒
∀ j = 1, . . . , n ,
lim aj
k→∞ k
= `j .
Dimostrazione. Se limk ak = `, dato che |ajk − `j | ≤ |ak − `| per ogni j = 1, . . . , n, per
confronto deduciamo la convergenza delle componenti. L’altra implicazione segue da
|a − `| ≤
n
X
|aj − `j |
j=1
con a = ak .
3. SUCCESSIONI A VALORI IN Rn
96
La Proposizione 5.19 consente di ridurre lo studio di una successione di punti di Rn allo studio di
n successioni numeriche. Questo è utile per estendere a questa classe di successioni il criterio di
convergenza di Cauchy e il teorema di Bolzano–Weierstrass.5
Proposizione 5.20 (Criterio di convergenza di Cauchy). Una successione (ak ) in Rn converge
se e solo se è di Cauchy, vale a dire per ogni ε > 0 esiste k0 ∈ N tale che d(ak , ak0 ) < ε per ogni
k, k 0 ≥ k0 .
Teorema 5.21 (Bolzano–Weierstrass). Ogni successione limitata (ak ) in Rn ha una sottosuccessione convergente.
Dimostrazione. Estraiamo una prima sottosuccessione s1 : N → N in modo tale che (a1s1 (k) )
converga a un limite `1 . Dalla successione (as1 (k) ) possiamo estrarre un’altra sottosuccessione
s2 : N → N in modo tale che (a2s1 (s2 (k)) ) converga a un limite `2 . Si noti che, essendo (a1s1 (s2 (k)) ) una
sottosuccessione di (a1s1 (k) ), questa continua a convergere a `1 . In sostanza, la prima e la seconda
componente di (as1 (s2 (k)) ) convergono. Se n > 2, proseguendo cosı̀ per altri n − 2 passi si guadagna
la convergenza di tutte le componenti. Posto ` = (`1 , . . . , `n ), la sottosuccessione
as1 (s2 (s3 (···sn (k)··· )))
converge a ` grazie alla Proposizione 5.19.
Sempre ragionando componente per componente, non è difficile mostrare le seguenti proprietà:
(1) se due successioni (ak ), (bk ) a valori in Rn sono convergenti, rispettivamente a ` e `0 , allora
lim (ak + bk ) = ` + `0 ;
k→∞
(2) se due successioni (ak ) a valori in Rn e (λk ) a valori in R sono convergenti, rispettivamente
a ` e λ, allora
lim λk ak = λ` ;
k→∞
(3) se due successioni (ak ), (bk ) a valori in C sono convergenti6, rispettivamente a ` e `0 , allora
lim ak bk = ``0 ;
k→∞
(4) vale il teorema di convergenza assoluta per serie di elementi di Rn :7
∞
X
|ak | converge =⇒
k=0
∞
X
ak converge ,
k=0
e in questo caso
(3.2)
∞
∞
X
X
|ak |.
ak ≤
k=0
k=0
Si noti però che la stima (3.2) non si deduce ragionando
P componente per componente
(almeno se si usano le disuguaglianze maxi |xi | ≤ |x| ≤ i |xi |). Bisogna prima osservare
5È un utile esercizio cercare di dimostrare il teorema di Bolzano–Weierstrass attraverso un metodo di bisezione,
senza ragionare componente per componente.
6Le successioni di numeri complessi vengono considerate come a valori in R2 , con componenti (<e a , =m a ).
k
k
7Per serie di vettori di Rn la convergenza va intesa componente per componente o, equivalentemente, come
convergenza in Rn delle somme parziali da 0 a N .
4. CARATTERIZZAZIONE PER SUCCESSIONI DELLA CHIUSURA E DEL DERIVATO DI UN INSIEME
97
che, per passaggio al limite per N → ∞ nelle somme parziali da 0 a N , la serie commuta
con il prodotto scalare:
∞
∞
X
X
h
ak , vi =
hak , vi
∀v ∈ Rn .
k=0
k=0
P
Poi, se k ak 6= 0, prendendo come v il vettore unitario S/|S| e stimando il membro di
destra con la disuguaglianza di Schwarz si ha la tesi.
Osservazione 5.22. In dimensione n ≥ 2 il “limite infinito” si intende come segue:
lim ak = ∞ ⇐⇒ lim |ak | = +∞ .
k→∞
k→∞
Ovviamente, relativamente a successioni di punti di Rn con n ≥ 2, i simboli ±∞ non hanno
senso. La distinzione tra un “infinito positivo” e un “infinito negativo” è strettamente legata
all’ordinamento di R.
4. Caratterizzazione per successioni della chiusura e del derivato di un insieme
Il seguente teorema mostra che possiamo caratterizzare mediante successioni la chiusura di un
insieme e l’insieme dei suoi punti di accumulazione.
Teorema 5.23.
(i) Un punto x0 ∈ Rn è aderente a un insieme E se e solo se esiste una successione (ak ) tale
che ak ∈ E per ogni k e limk ak = x0 .
(ii) Un punto x0 ∈ Rn è di accumulazione per un insieme E se e solo se esiste una successione
(ak ) tale che ak ∈ E \ {x0 } per ogni k e limk ak = x0 .
(iii) Un insieme E è chiuso se e solo se è chiuso per successioni, vale a dire, per ogni successione
(ak ) di elementi di E convergente a un limite `, anche ` ∈ E.
Dimostrazione. Dimostriamo solo l’enunciato (i), le altre dimostrazioni essendo analoghe o
facilmente deducibili da questa. Se x0 ∈ E, per ogni k ≥ 1, esiste un punto ak ∈ B1/k (x0 ) ∩ E.
Essendo |ak − x0 | < 1/k, la successione (ak ) converge a x0 .
Viceversa, se x0 = limk ak , con ak ∈ E per ogni k, dato r > 0, gli ak sono definitivamente in Br (x0 ).
Quindi E ∩ Bx0 ,r non è vuoto, e dunque x0 è aderente a E.
In termini di successioni si dà anche la nozione di sottoinsieme compatto di Rn .
Definizione 5.24 (Compatti in Rn ). Un sottoinsieme E di Rn si dice compatto se, data comunque
una successione (ak ) di elementi di E, esiste una sua sottosuccessione (ak(p) ) convergente a un
elemento di E.
Come nel caso n = 1, si ha la seguente caratterizzazione dei sottoinsiemi compatti di Rn .
Teorema 5.25. Un sottoinsieme di Rn è compatto se e solo se è chiuso e limitato (i.e. contenuto
in una palla).
Dimostrazione. Sia E compatto. Se E non fosse limitato, esisterebbe una successione (ak )
di punti di E con limk |ak | = +∞. D’altra parte, esisterebbe anche una sottosuccessione (ak(p) )
convergente a ` ∈ E. Ma questo è assurdo per la Proposizione 5.18. Sia ora x0 ∈ E. Per
il Teorema 5.23, esiste una successione (ak ) di punti di E convergente a x0 . Allora esiste una
5. PUNTI LIMITE DI UNA SUCCESSIONE
98
sottosuccessione (akp ) convergente a un elemento di E, ma grazie alla permanenza del limite questo
deve essere x0 . Dunque x0 ∈ E ed E è chiuso.
Viceversa, sia E chiuso e limitato, e sia (ak ) una successione di punti di E. Per il teorema di
Bolzano–Weierstrass in Rn (Teorema 5.21), esiste una sottosuccessione (ak(p) ) convergente a un
limite ` ∈ Rn . Dato che E è chiuso, ` ∈ E. Quindi E è compatto.
5. Punti limite di una successione
Definizione 5.26. Sia (ak ) una successione a valori in Rn . Si dice che x ∈ Rn è un punto limite
della successione se esiste una sottosuccessione (ak(p) ) convergente a x.
Le seguenti proprietà sono evidenti o di facile verifica:
• una successione (ak ) non ha punti limite se e solo se limk |ak | = +∞ (Teorema di Bolzano–
Weierstrass), equivalentemente una successione (ak ) ha punti limite se e solo se lim inf k |ak | <
+∞;
• una successione limitata (ak ) ha un unico punto limite x se e solo se limk ak = x. Infatti una
implicazione è ovvia, per la stabilità del limite rispetto a sottosuccessioni. Viceversa, se (ak ) ha un
unico punto limite x, se supponiamo per assurdo che (ak ) non tenda a x troviamo ε > 0 tale che
|ak −x| > per infiniti indici k. Usando questi indici per costruire una sottosuccessione convergence,
troviamo un punto limite necessariamente diverso da x.
Proposizione 5.27. Data una successione (ak ), sia Ek = {ak0 : k 0 ≥ k}. Allora l’insieme L dei
punti limite della successione è uguale a
\
Ek .
k∈N
In particolare, L è chiuso.
Si noti che Ek+1 ⊆ Ek per ogni k e che la stessa relazione vale per le chiusure.
Dimostrazione. Sia x un punto limite, x = limp ak(p) . Dato che k(p) ≥ k definitivamente, x
è limite di
T una successione di elementi di Ek , da cui segue che x ∈ E k . Abbiamo quindi mostrato
che L ⊆ k E k .
Viceversa, se x ∈ ∩k E k , per ogni m ∈ N e ogni p ∈ N \ {0} esiste k > m tale che ak ∈ B1/p (x). Si
scelga allora induttivamente
k0 tale che xk(0) ∈ B1 (x) ,
k(p + 1) > k(p) tale che ak(p+1) ∈ B1/(p+1) (x) .
La sottosuccessione (ak(p) ) converge allora a x.
La Proposizione 5.27 mostra che per ogni successione a valori in un insieme E l’insieme dei punti
limite è un sottoinsieme chiuso di E. Mostriamo ora che questa inclusione, in generale, non può
essere migliorata.
Teorema 5.28. Sia E un sottoinsieme chiuso non vuoto di Rn . Esiste allora una successione (ak )
di elementi di E avente E come insieme dei suoi punti limite.
6. SPAZI METRICI
99
Dimostrazione. Sia q : N → Qn una numerazione dei punti a coordinate razionali di Rn . Per
ogni k ∈ N scegliamo un elemento xk ∈ E che quasi minimizza la distanza in E da qk , i.e. tale che8
1
|xk − qk | < inf |y − qk | +
y∈E
k
(se qk ∈ E si può prendere xk = qk ). Mostriamo che la successione (xk ) ha la proprietà richiesta.
Dato x ∈ E, per la densità di Qn in Rn esiste una successione (qk(p) ) ⊆ Qn convergente a x. La
corrispondente successione (xk(p) ) è costituita da elementi di E e, per come sono stati scelti xk ,
soddisfa
1
1
≤ |x − qk(p) | +
.
|xk(p) − qk(p) | < inf |y − qk(p) | +
y∈E
k(p)
k(p)
Dunque anche (xk(p) ) converge a x.
6. Spazi metrici
Molte delle proprietà descritte nei paragrafi precedenti non dipendono da proprietà specifiche della
distanza euclidea, ma solo da tre proprietà di base che, assiomatizzate, conducono alle nozioni
astratte di distanza e di spazio metrico.
6.1. Distanze, spazi metrici, esempi.
Definizione 5.29 (Distanza e spazio metrico). Si chiama distanza9 su un insieme X una
funzione d : X × X −→ [0, +∞) che soddisfi le seguenti proprietà:
(i) (non degenerazione) d(x, y) = 0 se e solo se x = y;
(ii) (simmetria) per ogni x, y ∈ X vale d(x, y) = d(y, x);
(iii) (disuguaglianza triangolare) per ogni x, y, z ∈ X vale d(x, z) ≤ d(x, y) + d(y, z).
Uno spazio metrico è una coppia (X, d), dove d è una distanza sull’insieme X.
Si noti che su un insieme X possono essere definite diverse distanze, come illustrato dagli esempi
seguenti, per questo lo spazio metrico va inteso come coppia (X, d). Se (X, d) è uno spazio metrico
e Y ⊆ X, si chiama distanza indotta da X su Y la distanza d|Y ×Y .
Elenchiamo ora una serie di concetti e di risultati che si estendono, praticamente senza alcuna
modifica nelle dimostrazioni10, quando a Rn munito della distanza euclidea sostituiamo un generico
spazio metrico (X, d):
• palle aperte Br (x) e chiuse B r (x), insiemi aperti e chiusi, Br (x) è aperto, B r (x) è un chiuso;11
• parte interna, chiusura, insieme denso, frontiera, punti di accumulazione e isolati;
• per le successioni x : N → X, unicità e permanenza del limite rispetto a sottosuccessioni, convergenza delle distanze da un punto di X fissato, le successioni convergenti sono limitate e di
Cauchy;
• caratterizzazione per successioni della chiusura e del derivato di un insieme.
8In effetti si potrebbe anche mostrare che l’inf è raggiunto, usando il teorema di Bolzano-Weierstrass. Lo si
mostri per esercizio.
9Le distanze sono a volte anche chiamate metriche, ma in Geometria Riemanniana la parola metrica ha un
significato diverso, quindi non useremo mai questo termine. Nonostante questo, la terminologia “spazi metrici” è
troppo consolidata per non doverla adottare, anche se alcuni puristi chiamano questi spazi “spazi di distanza”.
10Proprio per questo, in tutte le dimostrazioni dei fatti citati, abbiamo sempre usato d(x, y) e non |x − y|.
11In generale, la chiusura di B (x) potrebbe essere un sottoinsieme proprio di B (x), B (x) potrebbe essere un
r
r
r
˚ (x), le palle potrebbero essere contemporaneamente aperte e chiuse.
sottoinsieme proprio di B
r
6. SPAZI METRICI
100
Si noti che mancano dall’elenco il criterio di convergenza di Cauchy, che può non valere (si prenda
X = Q con la distanza euclidea indotta), cosı̀ come il teorema di Bolzano–Weierstrass (si prenda
X = (0, 1) con la distanza euclidea indotta).
Esempi.
(1). Oltre alla distanza euclidea, su Rn sono interessanti le seguenti distanze:
1/p
dp (x, y) = |x1 − y1 |p + · · · + |xn − yn |p
dove 1 ≤ p < +∞ e
d∞ (x, y) = max |xk − yk | .
1≤k≤n
Le proprietà (i) e (ii) sono ovvie. La proprietà triangolare (iii) è di semplice verifica per d1 e d∞ ,
ed è stata dimostrata per la distanza euclidea d2 . Per p generico, la verifica è più complessa e viene
qui tralasciata.
(2). Su un qualunque insieme X,
(
0 se x = y
d(x, y) =
1 se x 6= y ,
è una distanza, nota come distanza discreta (le cui palle aperte sono punti o tutto lo spazio, a
seconda che r ≤ 1 o r > 1).
(3). (distanza p–adica su Q) Ogni numero razionale x 6= 0 si scompone in modo unico come
prodotto
(6.1)
mk
1 m2
x = ±pm
1 p2 · · · pk ,
dove p1 < p2 < · · · < pk sono numeri primi e gli mj interi relativi. Fissato un numero primo p, si
definisce il valore assoluto p–adico di x ∈ Q come
(
0
se x = 0
|x|p =
p−m se pm è il fattore con base p nella scomposizione (6.1) .
Si verifica facilmente che |x + y|p ≤ max |x|p , |y|p per ogni x, y ∈ Q. Da questo segue che
dp (x, y) = |x − y|p è una distanza su Q. In realtà vale una proprietà più forte della disuguaglianza
triangolare, cioè
dp (x, z) ≤ max dp (x, y), dp (y, z) ,
∀ x, y, z ∈ Q .
(4). Si consideri l’insieme R, detto retta reale estesa, ottenuto aggiungendo a R due elementi, che
indichiamo con −∞ e +∞:
R = R ∪ {−∞, +∞} .
Su R è possibile definire la distanza (con le convenzioni arctan ± ∞ = ±π/2):
(6.2)
δ(x, y) := arctan x − arctan y x, y ∈ R .
Si verifichi per esercizio che le successioni di R aventi limite, finito o infinito, convergono in R. Da
questo, usando il teorema di Bolzano–Weierstrass (o la caratterizzazione variazionale del massimo
e del minimo limite), si deduca che ogni successione (xn ) ⊂ R ha una sottosuccessione convergente
rispetto alla distanza δ.
(5). Se (X, dX ) e (Y, dY ) sono spazi metrici, la distanza prodotto è definita da
q
d (x, y), (x0 , y 0 ) := d2X (x, x0 ) + d2Y (y, y 0 )
(x, y), (x0 , y 0 ) ∈ X × Y .
6. SPAZI METRICI
101
Si noti che se tutti i fattori sono uguali a R con la distanza euclidea, ripetendo n volte questa
costruzione si ottiene proprio la distanza d2 euclidea in Rn+1 .
(6). Sulla sfera S1 (0) di Rn possiamo definire δ(x, y) = θ(x, y), ove θ ∈ [0, π] è l’angolo tra i vettori
x e y. Si verifichi che è una distanza, detta distanza geodetica. Si noti che la distanza geodetica è
più grande di quella indotta dalla distanza euclidea, se consideriamo la sfera come un sottoinsieme
di Rn .
(7). Dato I ⊆ R, lo spazio vettoriale C(I) delle funzioni continue da I in R, munito della distanza
“del sup”
d(f, g) := sup |f (x) − g(x)|
f, g ∈ C(I)
x∈I
è uno spazio metrico. Più in generale, la stessa distanza ha senso anche nello spazio vettoriale delle
funzioni limitate su I.
(8). Sia N ∈ N∗ . Nell’insieme {0, 1}N delle stringhe binarie di lunghezza N la distanza di Hamming
è definita da
1
d (a1 , . . . , aN ), (b1 , . . . , bN ) = card {i : ai 6= bi } .
N
Per funzioni tra spazi metrici si adotta la seguente terminologia.
Definizione 5.30 (Isometrie, funzioni Lipschitziane e contrazioni). Siano (X, d), (X 0 , d0 )
spazi metrici e sia f : X −→ X 0 una funzione.
(i) Si dice che f è una isometria di X sulla sua immagine f (X) ⊆ X 0 se
d0 f (x), f (y) = d(x, y) ,
∀ x, y ∈ X .
(ii) Si dice che f è Lipschitziana se esiste una costante reale L ≥ 0 tale che
(6.3)
d0 f (x), f (y) ≤ Ld(x, y) ,
∀ x, y ∈ X .
(iii) Si dice che f è una contrazione se è Lipschitziana con costante L ≤ 1, una contrazione
stretta se L < 1.
Ad esempio le rotazioni di Rn sono isometrie, mentre le trasformazioni
qPaffini x 7→ Ax + c con
n
2
c ∈ R e A = (aij ) matrici n × n sono Lipschitziane, con costante L =
ij aij . Un altro esempio
interessante è la mappa (intendendo naturalmente l’angolo in radianti)
θ ∈ R 7→ (cos θ, sin θ) ∈ S1 (0)
che è una isometria, se ristretta a intervalli di lunghezza inferiore a π, tra l’intervallo e la sfera
S1 (0) di R2 , munita della distanza geodetica.
Si noti che le isometrie sono iniettive, grazie all’assioma di non degenerazione, e che la composizione
di funzioni Lipschitziane (risp. contrazioni) è Lipschitziana (risp. una contrazione).
Due spazi metrici (X, d), (X 0 , d0 ) si dicono isometrici se esiste una isometria surgettiva (quindi una
bigezione) di X in X 0 , mentre due distanze d1 e d2 nello stesso insieme X si dicono bi–Lipschitz
equivalenti se la mappa identità ι : (X, d1 ) −→ (X, d2 ) è Lipschitziana con inversa Lipschitziana, in
termini equivalenti
(6.4)
cd1 (x, y) ≤ d2 (x, y) ≤ Cd1 (x, y)
∀x, y ∈ X
per opportune costanti positive c, C.
Si osservi che la traduzione geometrica delle disuguaglianze (6.4) è (indicando con Brdi (x) la palla
relativa alla distanza di )
d1
d1
Br/C
(x) ⊆ Brd2 (x) ⊆ Br/c
(x)
∀x ∈ X, r > 0.
6. SPAZI METRICI
102
Da questo si deduce subito che tutte le nozioni che abbiamo elencato prima (convergenza di successioni, insiemi aperti e chiusi, parte interna, chiusura) ed altre che discuteremo più avanti (continuità, uniforme continuità, completezza, compattezza, connessione) sono invarianti nella classe
di bi–Lipschitz equivalenza, i.e. se una proprietà vale per una distanza, vale per tutte le distanze
bi–Lipschitz equivalenti ad essa.
Esempi.
1. Le distanze d1 , d2 , d∞ su Rn sono a due a due bi–Lipschitz equivalenti. Questo segue dalle
disuguaglianze
d∞ (x, y) ≤ d2 (x, y) ≤ d1 (x, y) ≤ nd∞ (x, y) ,
tutte facilmente verificabili (con ragionamenti simili si mostra che tutte le distanze dp , 1 ≤ p ≤ ∞,
sono a due a due equivalenti). Più in generale, dati spazi metrici (X, dX ) e (Y, dY ), le distanze
max{dX (x, x0 ), dY (y, y 0 )} ,
dX (x, x0 ) + dY (y, y 0 )
sono bi–Lipschitz equivalenti alla distanza prodotto.
2. Per ogni intervallo limitato I ⊂ R, la distanza euclidea deu e la distanza δ nella (6.2), indotta
dall’inclusione in R, sono bi–Lipschitz equivalenti. Non lo sono, tuttavia, su tutto l’insieme R: più
precisamente, la distanza euclidea maggiora d (quindi ι : (R, deu ) → (R, δ) è una contrazione, non
stretta) ma non esiste nessuna costante C tale che deu (x, y) ≤ Cδ(x, y), perchè δ è limitata).
3. Si verifichi per esercizio che nessuna distanza p–adica su Q è bi–Lipschitz equivalente alla
distanza euclidea (indotta da R).
4. Nello spazio {0, 1}N delle stringhe binarie di lunghezza N , ogni trasformazione indotta da
una permutazione degli indici 1, . . . , N è una isometria. La trasformazione che manda la stringa
(i1 , . . . , iN ) nella stringa (1 − i1 , . . . , 1 − iN ) è anch’essa una isometria.
6.2. Limiti e funzioni continue tra spazi metrici. Le nozioni di limite, continuità, continuità in un punto di una funzione tra spazi metrici si possono definire, in perfetta analogia con il
caso di variabile reale, come segue.
Definizione 5.31 (Limite e continuità in un punto). Siano (X, dX ), (Y, dY ) spazi metrici,
E ⊆ X e f : E −→ Y . Sia inoltre x0 un punto di accumulazione di E in X. Si pone lim f (x) =
x→x0
` ∈ Y se
∀ε > 0 ∃δ > 0 :
x ∈ E ∧ 0 < dX (x, x0 ) < δ ⇒ dY (f (x), `) < ε .
Se x0 ∈ E, si dice che f è continua in x0 se lim f (x) = f (x0 ), in termini equivalenti
x→x0
∀ε > 0 ∃δ > 0 :
x ∈ E ∧ dX (x, x0 ) < δ ⇒ dY (f (x), f (x0 )) < ε .
Usando le palle, possiamo esprimere in maniera più sintetica le implicazioni sopra con f (Bδ (x0 ) \
{x0 }) ⊆ Bε (f (x0 )) e f (Bδ (x0 )) ⊆ Bε (f (x0 )) rispettivamente.
Definizione 5.32 (Continuità). Siano (X, dX ), (Y, dY ) spazi metrici. Si dice che f : X −→ Y è
continua se f è continua in ogni punto x ∈ X.
Passiamo ora alla continuità uniforme, una nozione di continuità più forte di quella puntuale.
Definizione 5.33 (Uniforme continuità). Siano (X, dX ), (Y, dY ) spazi metrici. Si dice che
f : X −→ X 0 è uniformemente continua se, per ogni ε > 0, esiste δ > 0 tale che
(6.5)
∀ x, x0 ∈ X ,
dX (x, x0 ) < δ =⇒ dY f (x), f (x0 ) < ε .
6. SPAZI METRICI
103
Si noti che le funzioni Lipschitziane sono uniformemente continue: per la formula (6.3) basta
scegliere δ = ε/L se L > 0, se L = 0 la funzione è costante (quindi uniformemente continua).
Abbiamo quindi le inclusioni
Lipschitziane ⊆ Uniformemente continue ⊆ Continue .
La funzione f (x) = 1/x su (0, 1] munito della distanza euclidea mostra che non tutte le funzioni
continue sono uniformemente continue. D’altro canto, sull’intervallo [0, 1] munito della distanza
euclidea tutte le funzioni continue sono uniformemente continue (Teorema di Heine–Cantor),
mentre
√
è facile costruire esempi di funzioni continue non Lipschitziane, ad esempio f (x) = x.
Teorema 5.34 (Formulazioni equivalenti della continuità). Siano (X, dX ), (Y, dY ) spazi
metrici e sia f : X −→ Y . Le seguenti condizioni sono equivalenti:
(i) f è continua;
(ii) per ogni aperto A di Y , f −1 (A) è aperto in X;
(iii) per ogni chiuso C di Y , f −1 (C) è chiuso in X.
Dimostrazione. Mostriamo che (i)⇒(ii). Dato A ⊆ Y aperto, mostriamo che f −1 (A) è aperto.
Si prenda x ∈ f −1 (A). Siccome A è un aperto contenente f (x), esiste ε > 0 tale che Bε (f (x)) ⊆ A.
Allora la continuità in x garantisce l’esistenza di δ > 0 tale che f (Bδ (x)) ⊆ Bε (f (x)). Segue che
Bδ (x) ⊆ f −1 (A) che quindi è aperto.
Mostriamo ora che (ii)⇒(i). Siano x0 ∈ X e ε > 0. Dato che f −1 (Bε (f (x0 ))) è aperto in X e
contiene x0 , esiste δ > 0 tale che Bδ (x0 ) ⊆ f −1 (Bε (f (x0 ))), quindi f (Bδ (x0 )) ⊆ Bε (f (x0 )).
Infine l’equivalenza (ii)⇔(iii) segue dall’identità f −1 (Y \ Y 0 ) = X \ f −1 (Y 0 ), valida per ogni
sottoinsieme Y 0 di Y .
Osservazione 5.35 (Spazi topologici). Il Teorema 5.34 mostra che la nozione di continuità può
essere formulata usando solo la classe degli aperti (o dei chiusi). Questo è il punto di vista alla base
della teoria, molto più generale, degli spazi topologici, che verrà trattata in corsi più avanzati. In
questa teoria si prescrive non una distanza ma una topologia, i.e. una classe di insiemi in P(X),
detti insiemi aperti della topologia, stabile per unioni arbitrarie e intersezioni finite, contenente X
e Ø. Con la classe degli aperti si possono formulare varie nozioni di convergenza, continuità, etc.
senza far ricorso a una distanza.
Proposizione 5.36 (Stabilità per composizione). Siano (X, dX ), (Y, dY ), (Z, dZ ) spazi metrici,
e siano f : X −→ Y , g : Y −→ Z funzioni continue. Allora anche g ◦ f : X −→ Z è continua.
Dimostrazione. Dato un aperto A in Z, g −1 (A) è aperto in Y , e dunque f −1 g −1 (A) =
(g ◦ f )−1 (A) è aperto in X.
Si noti che, dati un sottoinsieme E di X e una funzione f : X −→ Y , le due condizioni
• f è continua su E (cioè in ogni punto di E),
• f |E è continua (con E dotato della distanza indotta da X),
non sono equivalenti. Si prenda ad esempio f : R −→ R uguale alla funzione caratteristica χE di
un sottoinsieme E di R (ad esempio un intervallo [a, b]),
(
1 se x ∈ E
χE (x) =
0 se x 6∈ E .
6. SPAZI METRICI
104
Allora f |E ≡ 1 è continua, ma f non è continua nei punti della frontiera di E (nel caso dell’intervallo,
in a e in b). 12
Proposizione 5.37 (Continuità della distanza). Sia (X, d) uno spazio metrico. La funzione
d : X × X −→ R è continua rispetto alle distanza prodotto sul dominio e distanza euclidea sul
codominio.
Dimostrazione. Siano (x1 , x2 ), (y1 , y2 ) in X × X. Applicando la disuguaglianza triangolare
in R e poi quella su X, si ha
d(x1 , x2 ) − d(y1 , y2 ) ≤ d(x1 , x2 ) − d(x2 , y1 ) + d(x2 , y1 ) − d(y1 , y2 )
≤ d(x1 , y1 ) + d(x2 , y2 )
≤ 2dX×X (x, y), (x0 , y 0 ) .
Il teorema che segue mette in relazione la continuità di una funzione con la convergenza di successioni nel dominio e delle loro immagini nel codominio.
Teorema 5.38 (Caratterizzazione sequenziale della continuità). Siano (X, dX ), (Y, dY ) spazi metrici. Una funzione f : X −→ Y è continua in x ∈ X se e solo se, per ogni successione (xn )
di elementi di X convergente a x, la successione f (xn ) converge a f (x).
Dimostrazione. Se f è continua in x, per ogni ε > 0 esiste δ > 0 tale che f (Bδ (x)) ⊆ Bε (f (x)).
Quindi, dato che dX (xn , x) < δ definitivamente, dY (f (xn ), f (x)) < ε definitivamente. Ne segue che
(f (xn )) converge a f (x).
Viceversa, se f (xn ) → f (x) per ogni successione (xn ) convergente a x, se f non fosse continua
in x esisterebbe ε > 0 tale che f (Bδ (x)) \ Bε (f (x)) è non vuoto per ogni δ > 0. Scegliendo
δn = 1/(n + 1) e punti xn ∈ Bδn (x) tali che dY (f (xn ), f (x)) ≥ ε, avremmo una successione che
contraddice l’ipotesi.
In modo analogo si potrebbe caratterizzare l’esistenza del limite in x, considerando successioni
(xn ) ⊂ X \ {x} convergenti a x.
6.3. Spazi metrici compatti. La proprietà vista per successioni a valori in un intervallo
chiuso e limitato di R e, più in generale, per successioni a valori in un insieme chiuso e limitato
di Rn (Teorema 5.21 di Bolzano–Weierstrass) motiva la seguente definizione astratta, che estende
quella già data per sottoinsiemi di Rn .
Definizione 5.39 (Spazio metrico compatto). Uno spazio metrico (X, d) si dice compatto se
ogni successione di elementi di X ha una sottosuccessione convergente.
Ad esempio la retta reale estesa R munita della distanza δ(x, y) = | arctan x−arctan y| già introdotta
in (6.2) è uno spazio metrico compatto. Un sottoinsieme Y di uno spazio metrico (X, d) si dice
compatto se, con la distanza indotta dall’inclusione, è compatto. Senza riferimento esplicito alla
distanza indotta su Y , questa condizione equivale a dire che ogni successione di elementi di Y
ammette una sottosuccessione convergente in X a un elemento di Y . Sono quindi compatti i chiusi
e limitati di Rn . In generale, entrambe queste condizioni sono necessarie per la compattezza:
12Per esercizio, si mostri che la prima proprietà implica la seconda e che vale l’implicazione inversa se E ∩∂E = Ø,
i.e. E è aperto.
6. SPAZI METRICI
105
Proposizione 5.40. Ogni sottoinsieme compatto di uno spazio metrico (X, d) è chiuso e limitato
(i.e. contenuto in una palla).
Dimostrazione. Sia Y ⊆ X compatto. Basta verificare la chiusura per successioni. Se (xn ) ⊆
Y converge a x ∈ X, esiste per ipotesi una sottosuccessione (xn(k) ) convergente a un elemento
y ∈ Y . Per l’unicità del limite x = y ∈ Y .
Se per assurdo Y non fosse limitato, fissato x ∈ X avremmo che per ogni n esisterebbe xn ∈ Y tale
che d(xn , x) ≥ n. Se allora (xn(k) ) converge a y, la convergenza delle distanze che viene da
d(xn(k) , x) − d(y, x) ≤ d(xn(k) , x)
darebbe d(xn(k) , x) → d(y, x), assurdo.
A differenza del caso degli spazi Euclidei, non tutti gli insiemi chiusi e limitati sono compatti.
Per convincersene basta fare la seguente osservazione generale: se (X, d) è uno spazio metrico,
(X, min{1, d}) è anch’esso uno spazio metrico, con distanza limitata, avente le stesse successioni
convergenti, gli stessi chiusi, gli stessi aperti, etc. Quindi, ad esempio, in (R, min{1, |x − y|}) ogni
insieme chiuso è limitato, ma i compatti restano quelli della distanza euclidea. Vedremo in seguito
altri esempi più naturali fatti con spazi di funzioni (ad esempio l’insieme delle funzioni continue da
[0, 1] in [0, 1] è un sottoinsieme chiuso e limitato, ma non compatto, di C([0, 1])).
Teorema 5.41 (Immagine continua di compatti è compatta). Siano (X, d), (X 0 , d0 ) spazi
metrici, con (X, d) compatto e f : X −→ X 0 continua. Allora f (X) è compatto.
Dimostrazione. Sia (yn ) una successione di elementi di f (X). Per ogni n, si prenda xn ∈ X
tale che f (xn ) = yn . Per la compattezza di X, esiste una sottosuccessione (xn(k) ) convergente a x.
Per la continuità di f , si ha
lim yn(k) = lim f (xn(k) ) = f (x) ∈ f (X) .
k→∞
k→∞
Dunque f (X) è compatto.
Teorema 5.42 (Continuità su compatti implica uniforme continuità). Siano (X, d), (X 0 , d0 )
spazi metrici, con (X, d) compatto e f : X −→ X 0 continua. Allora f è uniformemente continua.
Dimostrazione. Si supponga per assurdo che f non sia uniformemente continua. Esiste quindi
ε0 > 0 tale che, per ogni δ > 0 la condizione (6.5) sia violata. Prendendo δ = 1/n, esistono quindi
xn , yn ∈ X con
1
d(xn , yn ) < ,
d0 f (xn ), f (yn ) ≥ ε0 .
n
Per la compattezza di X, esiste una sottosuccessione (xn(k) ) convergente a x ∈ X. Essendo
d(x, yn(k) ) ≤ d(x, xn(k) ) + d(xn(k) , yn(k) ) < d(x, xn(k) ) +
1
,
n(k)
anche (yn(k) ) converge a x. Per la continuità di f ,
lim f (xn(k) ) = lim f (yn(k) ) = f (x) .
k→∞
k→∞
Per la disuguaglianza triangolare, otteniamo che d0 f (xn(k) ), f (yn(k) ) → 0, contraddicendo il fatto
che queste distanze sono tutte più grandi di ε0 .
Dato che i compatti di R, essendo chiusi e limitati, hanno massimo e minimo, otteniamo il seguente
teorema di esistenza di massimi e minimi per funzioni continue definite su insiemi compatti.
6. SPAZI METRICI
106
Corollario 5.43 (Teorema di Weierstrass). Sia (X, d) uno spazio metrico compatto e sia
f : X −→ R continua. Allora f assume valore massimo e valore minimo.
6.4. Spazi metrici completi, completamento. Abbiamo già osservato che non sempre le
successioni di Cauchy sono convergenti. Questo fornisce la base per una definizione di completezza
totalmente svincolata dalla struttura d’ordine, ma compatibile con quella già vista su R.
Definizione 5.44 (Completezza). Uno spazio metrico (X, d) si dice completo se ogni successione
di Cauchy di elementi di X converge a un elemento di X. Un sottoinsieme Y di uno spazio metrico
(X, d) si dice completo in X se (Y, d|Y ×Y ) è uno spazio completo.
È facile verificare, lo si faccia per esercizio, che ogni successione di Cauchy avente una sottosuccessione convergente è convergente. Da questo deduciamo il
Teorema 5.45 (Compattezza implica completezza). Ogni spazio metrico compatto è completo.
Dimostrazione. Consideriamo uno spazio compatto e una successione (xn ) in questo spazio.
Per compattezza (xn ) ha una sottosuccessione convergente ad un elemento x dello spazio. Se poi è
di Cauchy, per quanto detto prima la successione (xn ) e non solo la sottosuccessione converge a x.
Quindi lo spazio è completo.
Il viceversa evidentemente non vale: basta prendere R con la distanza euclidea. Miglioriamo ora
l’implicazione tra compattezza e chiusura mostrando che la sola completezza (che è implicata dalla
compattezza) implichi la chiusura.
Proposizione 5.46 (Completezza e chiusura). Se Y è completo in uno spazio metrico (X, d),
allora Y è chiuso. Se (X, d) è completo, ogni suo sottoinsieme chiuso è completo.
Dimostrazione. Sia Y completo in X. Dato x ∈ Y , esiste una successione (yn ) di elementi di
Y convergente a x. Tale successione è di Cauchy e, essendo (Y, d) completo, converge a un elemento
di Y . Per l’unicità del limite, x ∈ Y . Dunque Y è chiuso.
Si supponga ora (X, d) completo e sia Y chiuso in X. Ogni successione di Cauchy di elementi di Y
ha un limite in X. Ma, essendo Y chiuso, tale limite è in Y . Dunque (Y, d|Y ×Y ) è completo.
Esempio. Vedremo in seguito che lo spazio C(I), munito della distanza del sup, è completo. La
completezza di C(I) è lo strumento fondamentale per lo studio delle equazioni differenziali; più in
generale, serve a mostrare che certi procedimenti iterativi, come le somme parziali di una serie di
funzioni, effettivamente convergono. Si consideri ad esempio le serie
∞
X
an sin(bn πx)
x∈R
n=0
con a ∈ (0, 1). È facile verificare che la serie definisce una funzione f : R → R con |f | ≤ 1/(1 − a),
per il criterio della convergenza assoluta. Tuttavia, è solo con la completezza di C(R) che si può
mostrare che f è continua. Storicamente, questo è il primo esempio di funzione continua non
derivabile in nessun punto: nel 1872 K. Weierstrass mostrò che questa proprietà vale se b è un
intero dispari e ab > 1 + π/2.13
13In tempi più recenti sono stati trovati altri esempi espliciti di tipo “frattale”, ad esempio P∞ (3/4)n ϕ(4n x), ove
0
ϕ : R → [0, 1] è la funzione “a tenda” che misura la distanza dall’insieme degli interi pari, si veda J. McCarthy, American Mathematical Monthly, Vol. LX, 10, 1953, o anche http://www.math.ubc.ca/~feldman/m321/nondiffble.pdf
per una semplice dimostrazione.
6. SPAZI METRICI
107
La seguente proposizione consente di estendere una funzione f da un dominio E alla chiusura del
dominio, a patto che il codominio sia completo e che la funzione f sia uniformemente continua (si
diano esempi che mostrano che l’estensione potrebbe non esistere se una di queste ipotesi viene a
mancare). Basta in realtà che la funzione f sia localmente uniformemente continua in un aperto A,
vale a dire, per ogni x ∈ A esiste r > 0 tale che f |E∩Br (x) è uniformemente continua.
Proposizione 5.47 (Estensione per completamento). Siano (X, dX ) e (Y, dY ) spazi metrici,
con (Y, dY ) completo. Allora ogni funzione f : E ⊆ X −→ Y uniformemente continua (rispettivamente localmente uniformemente continua in A ⊆ X aperto) ha un unico prolungamento continuo
fe : E −→ Y (rispettivamente fe : E ∩ A −→ Y ). Tale prolungamento è anche (localmente in A)
uniformemente continuo.
Dimostrazione. Diamo la dimostrazione nel caso localmente uniformemente continuo. Dato
x ∈ E ∩ A sia (xn ) ⊂ E convergente a x. Dato che per ogni r > 0 si ha xn ∈ Br (x) definitivamente,
per la locale uniforme continuità, (f (xn )) è di Cauchy visto che (xn ) lo è, quindi (f (xn )) ha limite
` ∈ Y . Poniamo fe(x) = `. Questa definizione non dipende dalla scelta della successione (xn ):
infatti se (xn ) e (x0n ) sono successioni contenute in E e convergenti entrambe a x, da dX (xn , x0n ) → 0
deduciamo, grazie ancora alla locale uniforme continuità, dY (f (xn ), f (x0n )) → 0, quindi (f (xn )) e
(f (x0n )) hanno lo stesso limite.
È evidente che se vogliamo un’estensione continua, che quindi commuti con l’operazione di limite,
quella data è l’unica possibile. Mostriamo che fe è localmente uniformemente continua, se f lo è,
usando la continuità della distanza: per ogni x ∈ A sia r > 0 tale che f |Br (x)∩E è uniformemente
continua e mostriamo che anche f˜|Br (x)∩E lo è. Dato ε > 0, sia δ > 0 tale che dY (f (x), f (x0 )) <
ε/2 tutte le volte che x, x0 ∈ Br (x) ∩ E e dX (x, x0 ) < δ. Se x, x0 ∈ Br (x) ∩ E, dX (x, x0 ) < δ
e (xn ) e (x0n ) sono successioni contenute in E e convergenti rispettivamente a x e x0 , allora la
continuità della distanza dX implica dX (xn , x0n ) < δ e xn , xn0 ∈ Br (x) definitivamente, quindi
dY (f (xn ), f (xn )) < ε/2 definitivamente. Usando ora la continuità della distanza dY otteniamo
dY (fe(x), fe(x0 )) ≤ ε/2 < ε. In modo analogo si mostra che se f è globalmente uniformemente
continua, anche fe lo è.
Nella dimostrazione dell’unicità del completamento ci servirà questo caso particolare della Proposizione 5.47: se f è un’isometria, allora lo è anche fe. Questo si dimostra con lo stesso ragionamento
usato per costruire fe: se x, y ∈ E allora possiamo trovare successioni (xn ), (yn ) contenute in E e
convergenti rispettivamente a x e y; dato che dY (f (xn ), f (yn )) = dX (xn , yn ), usando la continuità
della distanza in X e in Y otteniamo, per passaggio al limite, dY (fe(x), fe(y)) = dX (x, y).
Definizione 5.48 (Completamento). Dato uno spazio metrico (X, d), chiamiamo completamento
di (X, d) uno spazio metrico (X ∗ , d∗ ) tale che:
(i) (X ∗ , d∗ ) è completo;
(ii) esiste un’isometria j : X → X ∗ tale che j(X) è denso in X ∗ .
Spesso si “identifica” X con la sua copia isometrica j(X) dentro X ∗ , vedendo X come un sottoinsieme di X ∗ . In quest’ottica, si noti che la proposizione precedente garantisce questa proprietà
universale del completamento: ogni funzione (localmente in A ⊂ X ∗ aperto) uniformemente continua f : X → Y , con (Y, dY ) completo, si estende in modo unico a una funzione (localmente in A)
uniformemente continua su X ∗ .
Il seguente teorema mostra che il completamento esiste, ed è unico nel solo senso possibile, a meno
di isometrie. La dimostrazione si basa su un adattamento dell’argomento diagonale di Cantor, visto
che costruiremo una successione a partire da una successione di successioni.
6. SPAZI METRICI
108
Teorema 5.49 (Esistenza e unicità del completamento). Ogni spazio metrico (X, d) ammette
un completamento. Il completamento è unico a meno di isometrie.
Dimostrazione. Per l’esistenza, consideriamo il sottoinsieme Y di X N costituito dalle successioni di Cauchy di X. Definiamo
d (xn ), (x0n ) := lim sup d(xn , x0n )
(xn ), (x0n ) ∈ Y .
n→∞
È facile verificare, usando la subadditività del lim sup, che valgono la proprietà simmetrica e triangolare.14 Tuttavia non vale l’assioma di non degenerazione: due successioni, pur distinte, potrebbero essere asintoticamente vicine. Per ovviare a questo problema consideriamo la relazione di
equivalenza
(xn ) ∼ (x0n )
se lim d(xn , x0n ) = 0
n→∞
0
e osserviamo d (xn ), (xn ) dipende solo dalla classe di equivalenza di (xn ) e (x0n ), quindi possiamo
passare al quoziente, definendo X ∗ = Y /∼ e d∗ come la distanza indotta da d.
È evidente che esiste una isometria j da X in X ∗ : basta associare a x la classe di equivalenza della
successione (x) costantemente uguale a x. Resta da verificare che j(X) è denso in X ∗ e che (X ∗ , d∗ )
è completo.
Densità di j(X) in X ∗ . Sia (xn ) ∈ Y , [(xn )] ∈ X ∗ la sua classe di equivalenza. Per ogni
ε > 0 esiste n0 ∈ N tale che d(xn , xn0 ) < ε per ogni n ≥ n0 . Si ha allora d∗ ([(xn )], j(xn0 )) =
lim supn d(xn , xn0 ) ≤ ε, quindi per l’arbitrarietà di (xn ) e di ε concludiamo che j(X) è denso in
X ∗.
Completezza di (X ∗ , d∗ ). Sia (zn ) ⊆ X ∗ una successione di Cauchy. Dato che j(X) è denso in X ∗ ,
per ogni n ∈ N possiamo trovare xn ∈ X tale che d∗ (zn , j(xn )) < 1/(n + 1). Mostriamo che la
successione (xn ) è di Cauchy. Per ogni ε > 0 esiste n0 ∈ N tale che d∗ (zn , zn0 ) < ε/2 per n, n0 ≥ n0 .
Se scegliamo n0 sufficientemente grande in modo che valga anche la disuguaglianza 2/(n0 +1) < ε/2
otteniamo
d(xn , xn0 ) = d∗ (j(xn ), j(xn0 )) ≤ d∗ (j(xn ), zn ) + d∗ (zn , zn0 ) + d∗ (zn0 , j(xn0 ))
ε
1
ε ε
1
+ + 0
< + =ε
∀n, n0 ≥ n0 .
≤
n+1 2 n +1
2 2
Posto z = [(xn )] ∈ X ∗ , mostriamo ora che zn → z in X ∗ . Vale infatti
d∗ (z, zn ) ≤ d∗ (z, j(xn )) + d∗ (j(xn ), zn ) < lim sup d(xm , xn ) +
m→∞
1
.
n+1
Per la proprietà di Cauchy di (xn ), lim supm d(xm , xn ) ha limite nullo per n → ∞, quindi d∗ (z, zn ) →
0.
Unicità del completamento. Siano (X1∗ , d1 ), (X2∗ , d2 ) completamenti, ji : X → Xi∗ , i = 1, 2,
le rispettive immersioni isometriche. Allora grazie alla Proposizione 5.47 e all’osservazione fatta
immediatamente dopo, l’isometria j1 ◦ j2−1 : j2 (X) → X1∗ si estende in modo unico, essendo (X1∗ , d1 )
completo, a una isometria j12 : X2∗ → X1∗ . La sua immagine è un insieme chiuso (essendo (X2∗ , d2 )
completo) che contiene l’immagine di j1 ◦ j2−1 , vale a dire j1 (X). Essendo quest’ultimo insieme
denso in X1∗ , j12 è anche surgettiva.
14In realtà questo vale in tutto l’insieme X N ×X N , mentre si può anche osservare che in Y ×Y il lim sup è un limite,
grazie al fatto che le successioni sono di Cauchy e alla disuguaglianza |d(xn , x0n )−d(xm , x0m )| ≤ d(xn , xm )+d(x0n , x0m ),
ma questo non ci servirà.
7. *IL TEOREMA DI BAIRE
109
6.5. R come completamento metrico di Q. Con la notazione della sezione precedente, possiamo facilmente mettere in relazione l’insieme R (i.e. l’unico campo ordinato completo, costruito
con le sezioni di Dedekind di Q) con Q∗ , il completamento metrico di Q. Si noti che Q∗ non ha a
priori altra struttura se non quella di spazio metrico, quindi la proposizione qui sotto è la migliore
possibile.
Proposizione 5.50. Q∗ è isometrico a R, quest’ultimo inteso come spazio metrico munito della
distanza Euclidea.
Dimostrazione. Abbiamo mostrato nel Teorema 3.2, usando la completezza di R come insieme
ordinato (i.e. l’esistenza dell’estremo superiore e inferiore), che R è anche completo come spazio
metrico. D’altro canto, abbiamo anche mostrato che Q interseca ogni intervallo di R, quindi Q è
denso in R anche nel senso metrico. Quindi l’unicità del completamento metrico dà la tesi.
Senza presupporre la costruzione di Dedekind, ma usando invece la Proposizione 5.47, è possibile
munire direttamente Q∗ della struttura di campo ordinato, verificandone poi la completezza. In
questo modo si ha una dimostrazione alternativa dell’esistenza di campi ordinati completi. Non
faremo vedere questo nei dettagli, ma sottolineiamo solo che in questo caso, pensando Q come un
sottoinsieme di Q∗ , l’estensione delle operazioni di somma e prodotto
+ : Q × Q −→ Q∗ ,
· : Q × Q −→ Q∗ ,
cosı̀ come l’estensione delle operazioni x 7→ −x e x 7→ x−1 (la prima da Q in Q∗ , la seconda da Q\{0}
in Q∗ ) sono automaticamente garantite dalla Proposizione 5.47, perché uniformemente continue (la
somma e l’opposto) o almeno localmente uniformemente continue (il prodotto e l’inverso, prendendo
per il prodotto come insieme A un qualsiasi insieme limitato e per l’inverso A = Q∗ \ {0}).
Anche la relazione di ordine si può facilmente estendere, ponendo
(qn ) ≤ (qn0 )
⇐⇒
∀ > 0, qn < qn0 + definitivamente .
Vediamo come le proprietà di campo si estendono “per densità” da Q a Q∗ , limitandoci per
semplicità solo a trattare l’esistenza dell’inverso destro (si verificano in modo del tutto simile
commutatività, associatività, distribuitività, etc). Osserviamo per prima cosa che l’applicazione
Q∗ × (Q∗ \ {0}) 3 (x, y) → x · y −1 ∈ Q∗ è continua (si verifica facilmente che è localmente Lipschitziana, quindi localmente uniformemente continua). Allora la mappa x 7→ x · x−1 , ottenuta
componendo la precedente a sinistra con x 7→ (x, x), è localmente uniformemente continua in
Q∗ \ {0} ed è costantemente uguale a 1 su Q \ {0}, quindi è costante anche su Q∗ \ {0}.
7. *Il Teorema di Baire
15
Teorema 5.51 (Baire). Sia (X, d) uno spazio metrico completo e sia (Fn )n≥1 una successione di
chiusi la cui unione è X. Allora almeno uno dei chiusi ha parte interna non vuota.
Dimostrazione. Supponiamo per assurdo che tutti gli insiemi Fn abbiano parte interna vuota.
Costruiremo una successione di palle Brn (xn ) tali che Brn+1 (xn+1 ) ⊆ Brn (xn ), rn → 0 e B rn (xn ) ⊂
X \ Fn . Se ci riusciamo, dall’inclusione delle palle Brm (xm ) in Brn (xn ) per m ≥ n otteniamo
d(xm , xn ) < rn
15Sezione facoltativa
per m ≥ n ,
8. FUNZIONI CONTINUE TRA SPAZI EUCLIDEI
110
quindi (xn ) è di Cauchy e converge a x. D’altro canto, passando al limite per n → ∞ nella
disuguaglianza d(xk , xn ) < rk (valida per n ≥ k) otteniamo d(x, xk ) ≤ rk , quindi x ∈
/ Fk per ogni
k, assurdo.
Per costruire le palle iniziamo con una prima palla chiusa B(x1 , r1 ) disgiunta da F1 , con r1 ∈ (0, 1].
Essendo F˚2 = ∅, esiste x2 ∈ Br1 (x1 ) ∩ X \ F2 e possiamo scegliere r2 ∈ (0, 1/2] in modo tale che
Br2 (x2 ) ⊆ Br1 (x1 ) (per questo basta che r2 < r1 − d(x2 , x1 )) e B r2 (x2 ) sia disgiunta da F2 (e
questo è possibile perché X \ F2 è aperto). Continuando in questo modo generiamo la successione
dei centri xn e dei raggi rn ≤ 1/n richiesta.
Passando ai complementari, una formulazione equivalente è: in uno spazio metrico completo, se
(An ) è una successione di aperti la cui intersezione è vuota, allora almeno uno degli aperti non è
denso, oppure: in uno spazio metrico completo, intersezione numerabile di aperti densi è densa.
8. Funzioni continue tra spazi Euclidei
Si consideri una funzione f : E −→ Rm , con E ⊆ Rn , e siano f1 , . . . , fm : E −→ R le sue componenti
scalari, tali cioè che
f (x) = f1 (x), . . . , fm (x) .
La nozione di continuità di f in un punto di E rientra nella Definizione 5.32. Sulla base della
Proposizione 5.19 e del Teorema 5.38, punto (ii), possiamo affermare quanto segue.
Proposizione 5.52. La funzione f : E ⊆ Rn −→ Rm è continua in x0 ∈ E se e solo se ciascuna
delle sue componenti scalari fk , 1 ≤ k ≤ m, è continua in x0 .
8.1. *Curve in Rm .
16
Definizione 5.53 (Curve parametriche e archi di curva). Sia I un intervallo di R. Una funzione continua γ : I −→ Rm si chiama curva parametrica. La restrizione di γ a un sottointervallo
compatto [a, b] di I si chiama arco della curva parametrica γ.
Spesso ometteremo l’aggettivo “parametrica”. Per le curve e per gli archi (caso particolare di curve)
si adotta una apposita terminologia.
• La variabile t ∈ I si chiama anche parametro della curva γ;
• se γ : [a, b] −→ Rm è un arco, i punti x = γ(a) e y = γ(b) si chiamano rispettivamente il
primo e il secondo estremo di γ; si dice anche che γ congiunge x a y;
• un arco γ si dice chiuso se i suoi estremi coincidono;
• una curva γ si dice semplice se è iniettiva come funzione da I in Rm ;
• l’insieme immagine γ(I) ⊆ Rm si chiama17 sostegno di γ.
Si noti che nessuna curva chiusa può essere iniettiva; per esprimere il fatto che il difetto di iniettività
è solo dovuto agli estremi, si dice che una curva γ : [a, b] → Rm è semplice e chiusa se è chiusa ed
è iniettiva da (a, b] in Rm .
Le curve parametriche non sono dunque sottoinsiemi di Rm , ma funzioni. La nozione di curva
è legata piuttosto all’idea di un punto di Rm che si sposta nel tempo. Nelle applicazioni alla
meccanica, infatti, si usa questa nozione di curva per rappresentare la legge del moto di un punto
materiale nello spazio. Del resto, una nozione di curva come sottoinsieme di Rm si scontra con serie
16Sezione facoltativa
17Si usa anche il termine traiettoria, o curva non parametrica.
8. FUNZIONI CONTINUE TRA SPAZI EUCLIDEI
111
difficoltà. L’esempio della curva di Peano, che ha come sostegno un intero quadrato, mostra come
il sostegno di una curva possa non avere alcun aspetto di “unidimensionalità”.18
Si presenta spesso, comunque, l’esigenza di svincolare la nozione di curva dalla definizione di una
specifica parametrizzazione. Questo risultato si ottiene, in parte, introducendo una opportuna
relazione di equivalenza tra curve.
Definizione 5.54. Siano γ : I −→ Rm e δ : J −→ Rm due curve in Rm . Si pone γ ∼ δ se esiste
una funzione continua, surgettiva e strettamente crescente ϕ : I −→ J tale che γ = δ ◦ ϕ.
Si verifica facilmente quanto segue:
• ∼ è effettivamente una relazione di equivalenza;
• se γ e δ sono equivalenti, esse hanno lo stesso sostegno;
• se γ e δ sono equivalenti, γ è semplice (risp. chiusa) se e solo se lo è δ.
La seconda affermazione non ammette in generale un’implicazione inversa. Per esempio, gli archi
γ(t) = (cos t, sin t) , t ∈ [0, 2π] ,
δ(t) = (cos t, sin t) , t ∈ [0, 3π] ,
hanno come sostegno il cerchio di centro l’origine e raggio 1 in R2 , ma non sono equivalenti.
Più chiara è la situazione per quanto riguarda gli archi semplici. Nella dimostrazione useremo
questa proprietà delle funzioni di variabile reale (già richiamata all’inizio del capitolo), che daremo
per nota: se φ : I → J è continua e bigettiva, con I e J intervalli, allora φ è strettamente monotona;
inoltre la funzione inversa φ−1 : J → I è continua.
Teorema 5.55 (Orientamento di archi semplici). Sia γ : [a, b] −→ Rm un arco semplice.
Esistono allora esattamente due classi di equivalenza di archi semplici con lo stesso sostegno di γ:
la classe Cγ e la classe C−γ , dove −γ è l’arco
−γ(t) = γ(−t) , t ∈ [−b, −a] .
Dimostrazione. Sia E = γ [a, b] il sostegno di γ. Proviamo innanzitutto che γ −1 : E −→
[a, b] è continua, dimostrando che soddisfa la condizione (iii) del Teorema 5.34 (controimmagini
di chiusi sono chiuse). Sia F un chiuso di [a, b]. Allora (γ −1 )−1 (F ) = γ(F ). Ma F è un insieme
compatto, dunque γ(F ) è compatto e, per il Teorema 5.41(ii), γ(F ) è pure compatto.
Sia allora δ : [c, d] −→ E un altro arco semplice con sostegno E. La composizione
ϕ = γ −1 ◦ δ : [c, d] −→ [a, b] ,
è continua e bigettiva, quindi o è strettamente crescente, o è strettamente decrescente. Nel primo
caso, δ = γ ◦ ϕ ∼ γ, nel secondo δ ∼ −γ.
Le due classi di equivalenza Cγ e C−γ rappresentano dunque i due possibili orientamenti con cui
si può percorrere E senza passare due volte per lo stesso punto. Il Teorema 5.55 non ammette un
18Anche la costruzione di G. Peano, cosı̀ come l’esempio di Weierstrass e le sue varianti che abbiamo già discusso, si
basa sulla completezza dello spazio delle funzioni continue. Indicate con Iin , Qn
j rispettivamente le suddivisioni di [0, 1]
in 22n intervalli chiusi di lunghezza 1/22n e [0, 1]2 in 22n quadrati chiusi di lato 1/2n , si costruiscano delle curve γn tali
2n
che γn (t), per t ∈ Iin , prende valori in un opportuno quadrato Qn
σn (i) , con σn permutazione di {1, . . . , 2 }. Costruendo
n+1
n
n
le curve γn in maniera tale che per t ∈ Ii
⊂ Ik , per qualche k, la curva γn+1 resta nel quadrato Qσn (k) che conteneva
la curva γn per t ∈ Ikn (e questo è possibile, vedi ad
√ esempio http://it.wikipedia.org/wiki/Curva_di_Peano), la
successione di curve γn soddisfa max |γm − γn | ≤ 2/2n per m ≥ n ≥ 1, quindi è una successione di di Cauchy in
[0,1]
C([0, 1]; [0, 1]2 ) e il suo limite “riempie” [0, 1]2 .
8. FUNZIONI CONTINUE TRA SPAZI EUCLIDEI
112
analogo per curve semplici definite su intervalli aperti o semiaperti. Si consideri per esempio una
curva semplice definita su I = [a, b), e tale che esista c ∈ I per cui
lim γ(t) = γ(c) ,
t→b
(si pensi a un sostegno a forma di 9). In questo caso esistono quattro, e non due, modi non
equivalenti di ottenere lo stesso sostegno con curve semplici.
8.2. Funzioni continue da Rn a Rm . Iniziamo con il trattare il caso m = 1. Valgono
per le funzioni da Rn a R i teoremi sulla continuità delle funzioni somma prodotto, reciproco di
funzioni continue come nel caso n = 1. Ricordiamo poi la Proposizione 5.36 sulla continuità della
funzione composta. Aggiungiamo questa semplice osservazione, che è in realtà un caso particolare
dell’affermazione precedente19: se g è una funzione di una variabile, continua su I ⊆ R, allora
f (x1 , . . . , xn ) = g(x1 ) ,
è continua su I × Rn−1 . Con questi strumenti si dimostra facilmente la continuità di funzioni di
più variabili definite in termini di funzioni elementari, per esempio
x + sin y .
f (x, y, z) = exp
1 + y2 + z2
In situazioni diverse, la determinazione della continuità di una funzione può presentare aspetti
problematici, e tentativi di riduzione a metodi “di una variabile” possono dar luogo a conclusioni
sbagliate.
Partiamo da questa semplice conseguenza della Proposizione 5.36: se f è una funzione a valori
reali, continua su E ⊆ Rn , e γ : I −→ E è una curva, allora f ◦ γ : I −→ R è continua. In
particolare, se prendiamo γx0 ,v (t) = x0 + tv, parametrizzazione affine della retta passante per x0 e
parallela al vettore v, la funzione
g(t) = f (x0 + tv) ,
è continua sull’insieme t : x0 + tv ∈ E . Con un abuso di linguaggio, diremo che g è la restrizione
di f alla retta data.
Mostriamo ora con un esempio in due variabili che una funzione può avere restrizioni continue a
tutte le rette senza essere tuttavia continua.
Esempio. Partiamo da una funzione ϕ(t) continua su R, nulla fuori dall’intervallo [1, 3] e uguale
a 1 per t = 2, per esempio


t − 1 se 1 ≤ t ≤ 2,
ϕ(t) = 3 − t se 2 ≤ t ≤ 3,


0
altrimenti,
e poniamo
( y
ϕ 2
se x 6= 0,
x
(8.1)
f (x, y) =
0
se x = 0.
Si ha allora che:
• f è diversa da 0 solo nei punti (x, y) con x2 < y < 3x2 (regione aperta compresa tra due
parabole con vertice nell’origine);
• f = 1 sui punti della parabola y = 2x2 con x 6= 0, ma f (0, 0) = 0; quindi f non è continua
in 0.
19Basta considerare la proiezione sulla prima coordinata
9. CONNESSIONE, CONVESSITÀ, CONNESSIONE PER ARCHI
113
Tuttavia:
• la restrizione di f a una qualunque retta del piano è continua (lo si mostri per esercizio).
Questo esempio mostra i problemi che si possono incontrare nel trattamento di limiti di funzioni di
più variabili. Dato che limx→0 f (x, y) = 0 per ogni y e limy→0 f (x, y) = 0 per ogni x, si ha infatti
lim lim f (x, y) = 0 ,
lim lim f (x, y) = 0 ,
x→0
y→0
y→0
x→0
mentre non esiste
lim
f (x, y) .
(x,y)→(0,0)
Quindi il calcolo di un limite non può essere sempre ridotto a una sequenza di limiti nelle singole
variabili. In termini sequenziali, la differenza consiste essenzialmente nel fatto che, per avere il
limite in n variabili, serve considerare tutte le successioni che si avvicinano al punto, non solo quelle
che si muovono lungo rette o lungo una prescritta famiglia di curve.
Infine, nel caso f : Rn → Rm , m ≥ 1, in base alla Proposizione 5.52, sarà sufficiente considerare la
continuità delle componenti f1 , . . . , fm , funzioni a valori in R.
9. Connessione, convessità, connessione per archi
Cosı̀ come le nozioni di completezza e compattezza per spazi metrici generalizzano e formalizzano
proprietà note della retta reale (rispettivamente il criterio di convergenza di Cauchy e il teorema
di Bolzano–Weierstrass), la nozione di connessione consente di estendere a contesti più generali il
teorema del valore intermedio, richiamato all’inizio del capitolo e che qui daremo per noto: ogni
funzione continua in un intervallo assume tutti i valori compresi tra due qualsiasi valori assunti
nell’intervallo (equivalentemente: una funzione continua manda intervalli in intervalli).
Definizione 5.56 (Connessione). Uno spazio metrico (X, d) si dice connesso se non è scomponibile
nell’unione disgiunta di due aperti non vuoti. Un sottoinsieme non vuoto Y di uno spazio metrico
(X, d) si dice connesso in X se, posto dY = d|Y ×Y , (Y, dY ) è uno spazio metrico connesso.
La formulazione che abbiamo dato della connessione per sottoinsiemi Y ne sottolinea il carattere
intrinseco (i.e. la proprietà dipende solo dalla restrizione della distanza all’insieme e non dallo “spazio ambiente” X). Tuttavia, sul piano operativo, una formulazione equivalente della connessione
per sottoinsiemi Y è il fatto che non esistono aperti A1 , A2 di X, tali che A1 ∩ Y e A2 ∩ Y sono
non vuoti, Y ⊆ A1 ∪ A2 e A1 ∩ A2 ∩ Y = Ø. Infatti, se questa proprietà vale, allora A0i = Ai ∩ Y
sono aperti non vuoti e disgiunti nello spazio metrico (Y, dY ) la cui unione contiene Y , quindi Y è
sconnesso. Il viceversa si ottiene mostrando (lo si faccia per esercizio) che ogni aperto A0 di (Y, dY )
è rappresentabile come A ∩ Y , per un opportuno aperto A di X.
Le seguenti due proprietà sono di facile dimostrazione.
Proposizione 5.57.
(i) Uno spazio metrico (X, d) è connesso se e solo se gli unici sottoinsiemi di X contemporaneamente aperti e chiusi sono X e Ø.
(ii) Se due spazi (X, dX ) e (Y, dY ) sono bi–Lipschitz equivalenti20, e uno dei due è connesso,
anche l’altro è connesso.
20Qui basta in realtà che siano omeomorfi, vale a dire che esista una mappa bigettiva, continua con inversa
continua, tra i due spazi.
9. CONNESSIONE, CONVESSITÀ, CONNESSIONE PER ARCHI
114
La proprietà (ii) segue anche da un fatto più generale che estende, come vedremo, il teorema dei
valori intermedi.
Teorema 5.58 (Immagine continua di connessi è connessa). Sia (X, dX ) uno spazio metrico
connesso e sia (Y, dY ) un altro spazio metrico. Se f : X −→ Y è continua, allora f (X) è un
sottoinsieme connesso di Y .
Dimostrazione. Per assurdo, supponiamo che f (X) non sia connesso. Esisterebbero allora
A, A0 aperti di Y e disgiunti in f (X), aventi intersezione non vuota con f (X), tali che A∪A0 ⊇ f (X).
Si considerino ora i sottoinsiemi di X
B = f −1 (A) ,
B 0 = f −1 (A0 ) .
Essendo A e A0 aperti in Y , B e B 0 sono aperti in X, per la continuità di f . Inoltre essi sono non
vuoti, disgiunti e X ⊆ B ∪ B 0 , contraddicendo la connessione di X.
Caratterizziamo ora i sottoinsiemi connessi di R (inteso come sempre munito della distanza euclidea). Useremo nella dimostrazione il fatto elementare che la proprietà di intervallo equivale
a
x, y ∈ I =⇒ [x, y] ⊂ I .
Si noti che, esprimendo l’intervallo [x, y] in forma parametrica {(1−t)x+ty : t ∈ [0, 1]}, la proprietà
sopra ha senso anche in spazi vettoriali reali ed è nota come convessità. Quindi i convessi di R sono
tutti e soli gli intervalli.
Teorema 5.59 (Insiemi connessi di R). I sottoinsiemi connessi di R sono tutti e soli gli
intervalli.
Dimostrazione. Dimostriamo che se E ⊆ R non è un intervallo, allora non è connesso. Sia
M = sup E e m = inf E; dato che E non è un intervallo, per la proprietà di convessità deve
esistere y ∈ (m, M ) \ E (in caso contrario, si avrebbe uno dei 4 casi E = (m, M ), E = [m, M ),
E = (m, M ], E = [m, M ], tutti intervalli). Per definizione di estremo superiore e inferiore abbiamo
quindi x < y < z con x, z ∈ E e y 6∈ E. Poniamo
A = (−∞, y) ,
A0 = (y, +∞) .
Allora A, A0 sono aperti disgiunti di R la cui unione contiene E perché y ∈
/ E. Dato che x ∈ A ∩ E
e z ∈ A0 ∩ E concludiamo che E non è connesso.
Dimostriamo ora che ogni intervallo I è connesso, per fissare le idee lo dimostriamo per un intervallo
aperto I = (a, b). Si supponga per assurdo che I = (A ∩ I) ∪ (A0 ∩ I), con A, A0 aperti di R, A ∩ I
e A0 ∩ I non vuoti e disgiunti. Fissato x0 ∈ A ∩ I, o esistono punti di A0 ∩ I maggiori di x0 , o
esistono punti minori. Consideriamo, per fissare le idee, il primo caso e sia x1 l’estremo superiore
degli x ≥ x0 tali che [x0 , x] ⊂ A ∩ I. Allora non può essere x1 = b, quindi x1 ∈ I. D’altro canto
x1 ∈
/ A ∩ I per la massimalità di x1 e se fosse x1 ∈ A0 ∩ I vi sarebbe un intervallo (x1 − δ, x1 ) tutto
contenuto in A0 ∩ I, contro il fatto che x1 è aderente a A ∩ I. 21
21Una dimostrazione alternativa, che usa il teorema dei valori intermedi, è la seguente. Si consideri la funzione
f : I −→ R data da
(
f (x) =
0
1
se x ∈ I ∩ A ,
se x ∈ I ∩ A0 .
La funzione f assume in I esattamente due valori perché A ∩ I e A0 ∩ I sono non vuoti. Dato un punto x ∈ A, la
funzione f è costante in I ∩ (x − r, x + r) per un certo r > 0 (precisamente per r > 0 tale che (x − r, x + r) ⊆ A),
dunque è continua in x. Analogamente se x ∈ A0 . Quindi f è continua in ogni punto di I. Ma questo contrasta con
il teorema (classico) dei valori intermedi, da cui si ha un assurdo.
9. CONNESSIONE, CONVESSITÀ, CONNESSIONE PER ARCHI
115
Corollario 5.60 (Teorema dei valori intermedi). Sia (X, d) uno spazio metrico e sia f :
X −→ R continua. Se Y ⊆ X è connesso, f (Y ) è un intervallo.
Introduciamo ora un’altra nozione di connessione, basata sul principio espresso dal Teorema 5.58
quando X è un intervallo chiuso e limitato di R.
Definizione 5.61 (Connessione per archi). Un sottoinsieme E di uno spazio metrico (X, d) si
dice connesso per archi se, dati comunque punti x, y ∈ E, esiste una curva continua γ : [a, b] −→ E
congiungente x a y, i.e. tale che γ(a) = x e γ(b) = y.
Anche la nozione di connessione per archi è intrinseca, come è facile verificare. Inoltre, se lo spazio
ambiente X è uno spazio vettoriale, gli insiemi E convessi sono connessi per archi: dati x, y ∈ E
basta considerare la curva γ(t) = (1 − t)x + ty, t ∈ [0, 1].
Proposizione 5.62 (Connessione per archi implica connessione). Ogni insieme E connesso
per archi è connesso. In particolare gli insiemi convessi sono connessi.
Dimostrazione. Per assurdo, supponiamo che esista un insieme E che sia connesso per archi,
ma non connesso. Possiamo allora scomporre E come unione disgiunta (E ∩ A) ∪ (E ∩ A0 ) con A, A0
aperti dello spazio metrico ambiente X e E ∩ A, E ∩ A0 non vuoti. Si prendano ora x ∈ E ∩ A e
y ∈ E ∩ A0 . Per ipotesi, esiste una curva continua γ : [a, b] −→ E congiungente x a y. Abbiamo
allora che γ −1 (A) e γ −1 (A0 ) sono aperti non vuoti e disgiunti la cui unione è [a, b], assurdo.
Esempi. (1) Siano I un intervallo di R e f : I −→ R continua. Il grafico di f ,
E = x, f (x) : x ∈ I ,
è connesso per archi: basta infatti usare la stessa funzione f per definire gli archi congiungenti due
punti di E, considerando la mappa continua x 7→ (x, f (x)). Dunque E è connesso.
(2) Esistono in Rn insiemi connessi, anche chiusi, che non sono connessi per archi. Un esempio in
dimensione n = 2 è dato dall’insieme chiuso
o
n
1
: x ∈ (0, 1] = E0 ∪ E1 .
E = (0, t) : −1 ≤ t ≤ 1 ∪ x, sin
x
Mostriamo che E è connesso. Supponiamo che E = (E ∩ A) ∪ (E ∩ A0 ) con A, A0 aperti, disgiunti
in E e aventi intersezione non vuota con E. Allora E1 è unione disgiunta
E1 = (E1 ∩ A) ∪ (E1 ∩ A0 ) .
Essendo E1 connesso per l’esempio precedente, uno dei due termini dell’unione deve essere vuoto,
e dunque E1 è contenuto o in A o in A0 . Lo stesso vale per E0 , che pure è connesso per l’esempio
1. Quindi, dato che A e A0 hanno intersezione non vuota con E, deve essere E0 ⊆ A e E1 ⊆ A0 ,
o viceversa. Supponiamo che sia vera la prima delle due alternative. Prendendo ad esempio
x = (0, 0) ∈ E0 , questo vuol dire che esiste r > 0 tale che Br (x) ⊆ A e quindi Br (x) non può
contenere punti di E1 (che sono tutti contenuti in A0 , che è disgiunto da A ∩ E). Questo è assurdo,
perché x è punto di accumulazione di punti in E1 e quindi E1 ∩ Br (x) è non vuoto.
Quindi E è connesso. Tuttavia non è connesso per archi, perché non esiste alcun arco con sostegno
in E congiungente il punto (0, 0) ∈ E0 con un punto y ∈ E1 (la dimostrazione, non del tutto banale,
è lasciata per esercizio22).
22Traccia della dimostrazione per y = (1, sin 1): sia γ = (γ , γ ) : [a, b] → E un arco continuo con γ(a) = (0, 0) e
1
2
γ(b) = (1, sin 1). Dato che γ1 (a) = 0 e γ1 (b) = 1 possiamo definire a∗ come il massimo dei t ∈ [a, b] tale che γ1 (t) = 0.
È evidente che a∗ < b; a seconda del segno di γ2 (a∗ ), scegliamo tn ∈ (a∗ , b] tali che γ1 (tn ) = (±π/2 + 2nπ)−1 , in
modo che sin(γ1 (tn )) ∈ {−1, 1} disti almeno 1 da γ2 (a∗ ). È semplice verificare che ogni punto limite di (tn ) vale a∗ ,
10. ESERCIZI
116
Mostriamo infine che, per aperti di Rn (e più in generale di uno spazio vettoriale normato, o di uno
spazio metrico connesso per archi), connessione e connessione per archi si equivalgono.
Teorema 5.63. Sia A ⊆ Rn aperto. Allora A è connesso se e solo se è connesso per archi.
Dimostrazione. Avendo a disposizione la Proposizione 5.62, rimane da dimostrare che se A
è connesso allora è connesso per archi.
Fissato un punto x0 ∈ A, si consideri l’insieme A0 degli x ∈ A che si possono congiungere a x0
con un arco con sostegno contenuto in A. Tale insieme è non vuoto perché contiene almeno x0
stesso. Dimostriamo che A0 è aperto. Fissato x ∈ A0 , si prenda una palla Br (x) contenuta in
A. Ogni punto y ∈ Br (x) si può congiungere a x0 nel modo seguente: per ipotesi esiste un arco
γ : [a, b] −→ A con γ(a) = x0 e γ(b) = x. Definiamo allora un nuovo arco δ : [a, b + 1] −→ A
ponendo
(
γ(t)
se t ∈ [a, b] ,
(9.1)
δ(t) =
x + (t − b)(y − x) se t ∈ (b, b + 1] .
In questo modo si percorre, per t ∈ [b, b + 1], il segmento congiungente x a y. Si vede facilmente
che δ è continua, e dunque è un arco. Essendo x arbitrario, questo prova che A0 è aperto.
Dimostriamo ora che A0 è anche chiuso in A, o, in modo equivalente, che A1 = A \ A0 è aperto. Se
x ∈ A1 , si prenda una palla Br (x) contenuta in A e si fissi un punto y ∈ Br (x). Se fosse y ∈ A0 ,
esso sarebbe congiungibile a x0 con un arco in A. Ma allora la stessa costruzione usata in (9.1)
(scambiando x con y) consentirebbe di congiungere x0 a x, il che è assurdo.
Essendo A connesso ed essendo A0 un suo sottoinsieme aperto, chiuso e non vuoto, deve essere
A0 = A. Dunque ogni punto di A è congiungibile a x0 con un arco in A. Per l’arbitrarietà di x0 si
ha la conclusione.
Una dimostrazione un po’ diversa si può dare come segue: definiamo una relazione x ∼ y se x è
congiungibile a y con un arco contenuto in A; con una operazione di concatenazione di archi simile
a quella in (9.1) (dove abbiamo concatenato γ con un arco rettilineo) si mostra che questa è una
relazione di equivalenza. Ora, proprio la costruzione in (9.1) mostra che le classi di equivalenza
sono aperte. Ma allora, se ve ne fosse più di una, prendendo una classe e l’unione di tutte le altre
avremmo sconnesso A. Quindi esiste una sola classe, i.e. tutti i punti sono connettibili a tutti gli
altri.
Si osservi anche che, se definissimo A0 come l’insieme degli x ∈ A congiungibili a x0 con una curva
lineare a tratti, otterremmo lo stesso risultato, quindi la tesi vale in maniera più forte: per ogni
aperto connesso A e per ogni coppia di punti x, y ∈ A esiste una curva lineare a tratti congiungente
x a y e interamente contenuta in A. Attraverso un’ulteriore approssimazione, è poi possibile
ottenere curve completamente liscie, i.e. derivabili infinite volte.
10. Esercizi
10.1. Topologia di Rn .
Esercizio 5.1.
Si dica cosa sono la chiusura, l’apertura e la frontiera di Q e di R \ Q.
visto che a∗ è l’unico punto in [a∗ , b] ove γ1 si annulla, quindi tn → a∗ . Considerando i limiti di γ2 (tn ) = sin(γ1 (tn ))
per n → ∞ si ha una contraddizione.
10. ESERCIZI
117
Esercizio 5.2.
Si provi che gli unici sottoinsiemi di R sia aperti che chiusi sono il vuoto e R stesso.
Esercizio 5.3.
Si provi che l’interno di un insieme A ⊆ R è l’unione di tutti gli aperti contenuti in A.
Esercizio 5.4.
Dati gli insiemi A, B ⊆ R, si determinino le relazioni tra le seguenti coppie di insiemi
A∪B
e
A∪B,
A∩B
e
A∩B,
e
A∪B,
e
A∩B.
◦
A∪B
◦
A∩B
◦
◦
◦
◦
Esercizio 5.5.
Dato A ⊆ R, si dimostrino le relazioni
◦
◦
◦
A = A,
◦ c
A = Ac ,
◦
c
A = Ac ,
A = A,
◦ c
Ac = A
◦
c
A = A
c
,
,
◦
A = A ∪ ∂A,
A = A \ ∂A .
Esercizio 5.6.
Sia A ⊆ R, si dica se sono vere o false le seguenti relazioni:
∂A = ∂(Ac ),
◦
∂A = ∂A,
∂A = ∂ A,
∂A = ∂A,
∂A = A ∩ Ac ,
∂∂A ⊆ ∂A .
Esercizio 5.7.
Si provi che per A ⊆ R è aperto,
∂A ⊆ Ac ,
A = A \ ∂A .
Esercizio 5.8.
Si provi che per A ⊆ R,
∂A = (A ∩ Ac ) ∪ (A \ A) .
Esercizio 5.9.
Si provi che per A, B ⊆ R,
∂(A ∪ B) ⊆ ∂A ∪ ∂B ⊆ ∂(A ∪ B) ∪ A ∪ B .
Esercizio 5.10.
Sia A ⊆ R limitato, si provi che sup(A) ∈ ∂A.
Esercizio 5.11.
Sia A ⊆ R, quanti insiemi diversi ci possono essere nella seguente sequenza?
A,
∂A,
∂∂A,
∂∂∂A, . . .
Esercizio 5.12.
Qual è la cardinalità della famiglia degli insiemi aperti di R? E quella della famiglia dei chiusi?
10. ESERCIZI
118
Esercizio 5.13.
◦
Si provi che se A è un sottoinsieme aperto contenuto in B ⊆ R si ha A ⊆ B
Esercizio 5.14. F
Trovare un insieme A di R tale che i seguenti 7 sottoinsiemi di R risultino tutti distinti:
A,
A,
◦
◦
◦
◦
◦
◦
◦
A,
A
A,
A,
A.
Dimostrare inoltre che non se ne possono creare altri proseguendo nella stessa maniera.
Esercizio 5.15.
Se A e B sono due sottoinsiemi aperti di R, l’insieme A + B = {x + y : x ∈ A, y ∈ B} è aperto?
Si discuta anche il caso in cui uno solo dei due insiemi A, B è aperto.
Esercizio 5.16.
Se A e B sono due sottoinsiemi chiusi di R, l’insieme A + B = {x + y : x ∈ A, y ∈ B} è chiuso?
Si discuta anche il caso in cui uno dei due insiemi A, B è compatto.
Esercizio 5.17.
Si provi che ogni aperto di R è un’unione numerabile di intervalli aperti a due a due disgiunti.
Esercizio 5.18. F
Si provi che ogni chiuso di R è un’intersezione numerabile di aperti di R.
Esercizio 5.19. FF
Si provi che non è possibile ottenere R o un intervallo I ⊆ R come unione numerabile di intervalli
chiusi e limitati, a due a due disgiunti.
Esercizio 5.20 (Teorema di Baire). FF
Si provi che non è possibile ottenere R o un intervallo I ⊆ R come unione numerabile di sottoinsiemi
chiusi con parte interna vuota.
Esercizio 5.21. FF
Si provi l’intersezione di una famiglia numerabile di aperti densi di R è non vuota. È un insieme
denso?
Si provi un’unione numerabile di sottoinsiemi chiusi di R con parte interna vuota ha parte interna
vuota.
Nota. Un insieme si dice di prima categoria se è un’unione numerabile di sottoinsiemi chiusi con
parte interna vuota, di seconda categoria altrimenti.
Esercizio 5.22.
Si provi che se A ⊆ R è composto solo da punti isolati allora ha cardinalità al più numerabile.
Più in generale, si mostri che l’insieme dei punti isolati di un qualunque insieme A ⊆ R è al più
numerabile.
Esercizio 5.23.
Si diano esempi di:
• un sottoinsieme infinito di R senza punti di accumulazione,
• un insieme non vuoto A ⊆ R tale che A ⊆ A0 ,
• un insieme A ⊆ R con infiniti punti di accumulazione e tale che A ∩ A0 = Ø,
• un insieme non vuoto A ⊆ R tale che ∂A = A.
10. ESERCIZI
119
Esercizio 5.24.
Si provi che l’insieme derivato A0 di un insieme A ⊆ R è chiuso e che A = A ∪ A0 .
Esercizio 5.25.
Si provi che un insieme A è chiuso se e solo se A0 ⊆ A.
Esercizio 5.26.
Si provi che vale la relazione (A)0 = A0 .
Esercizio 5.27.
Si provi la relazione (A ∪ B)0 = A0 ∪ B 0 .
Esercizio 5.28.
Si provi che ogni sottoinsieme di R di cardinalità del continuo ha insieme derivato non vuoto.
Esercizio 5.29. F
Si provi che se l’insieme derivato A0 di un insieme A ⊆ R è finito, l’insieme A è numerabile. La
stessa conclusione vale se A0 è numerabile?
Esercizio 5.30. F
Si diano esempio di insiemi A ⊆ R tali che A00 6= A0 . Per quali n ∈ N la successione
A, A0 , A00 A000 . . .
può avere i primi n insiemi tutti diversi tra loro? Può esserci una successione composta di insiemi
tutti diversi tra loro?
Esercizio 5.31. FF
Si dimostri che un sottoinsieme perfetto e non vuoto di Rn non può essere numerabile.
Esercizio 5.32.
Si provi che A ⊆ R è compatto se e solo se ogni suo sottoinsieme infinito ha un punto di accumulazione in A.
Esercizio 5.33.
Si provi che ogni successione di Cauchy in un compatto A ⊆ R converge in A.
Esercizio 5.34.
Se A ⊆ R è infinito e A0 consiste di un singolo punto, allora A è compatto?
Esercizio 5.35. F
Dimostrare che C ⊆ R è compatto se e solo se, data una qualunque famiglia {Ai }i∈I di insiemi
aperti che ricopre C (cioè C ⊆ ∪i∈I Ai ), esiste una sottofamiglia finita {Ai1 , Ai2 , . . . , Ain } che ricopre
ancora C.
Esercizio 5.36.
Si dia un esempio di una famiglia di insiemi aperti che ricopre l’intervallo (0, 1) che non abbia una
sottofamiglia finita che ricopre ancora (0, 1).
Esercizio 5.37 (Insieme di Cantor).
Si consideri la successione di insiemi di R definita per ricorrenza da I1 = [0, 1] e
In 2 In In+1 =
∪
+
.
3
3
3
(1) Si provi che In è l’unione di 2n intervalli chiusi disgiunti di lunghezza 3−n .
10. ESERCIZI
120
S
(2) si mostri che C = n∈N In (insieme di Cantor) è un chiuso non vuoto e se ne determini la
cardinalità.
(3) Si mostri che x ∈ R appartiene a C se e solo se esiste una successione an tale che an ∈ {0, 2}
e
∞
X
x=
an 3−n .
n=0
Esercizio 5.38.
Dimostrare che l’insieme di Cantor è perfetto, i.e. ogni suo punto è di accumulazione.
Esercizio 5.39.
Sia E il sottoinsieme di [0, 1] dei numeri tali che nella loro espansione decimale contengano solo le
cifre 4 e 7. L’insieme E è denso in [0, 1]? Compatto? Perfetto?
Esercizio 5.40.
Si provi che se C1 , C2 sono due chiusi disgiunti di Rn , allora esistono due aperti A1 ⊇ C1 e A2 ⊇ C2
tali che A1 ∩ A2 = Ø.
Esercizio 5.41.
Sia F1 ⊇ F2 ⊇ · · · ⊇ Fn ⊇ . . . una successione di chiusi non vuoti di Rn . Si provi che se almeno
uno degli Fn è limitato, allora ∩∞
n=1 Fn è non vuoto.
Esercizio 5.42.
Sia AS⊆ Rn aperto, dimostrare che esiste una successione Kn di compatti con Kn ⊂ K̊n+1 tale che
A= ∞
1 Kn .
10.2. Spazi Metrici, Normati e Topologici.
Esercizio 5.43.
Sia (X, d) uno spazio metrico costituito da tre punti, si provi che si può immergere isometricamente
in R2 . Si mostri un esempio di spazio metrico (X, d) costituito da quattro punti che non si può
immergere isometricamente in nessun Rn e si discutano condizioni per cui invece ciò sia possibile.
Esercizio 5.44.
Sia X un insieme infinito. Per p, q ∈ X si ponga
(
1
d(p, q) =
0
se p 6= q,
se p = q.
Si provi che d è una metrica (detta metrica discreta) completa e si determinino gli aperti, i chiusi,
i limitati, i connessi e i compatti dello spazio metrico (X, d).
Si mostri inoltre che ogni punto è isolato e che una successione è convergente se e solo se è costante.
Esercizio 5.45.
Sia (X, d) uno spazio metrico e si definisca
d(A, B) = inf d(a, b) : a ∈ A, b ∈ B ,
per ogni coppia di sottoinsiemi A e B di X. Si provi che d non è una distanza su P(X) e che
esistono due chiusi A e B disgiunti con d(A, B) = 0.
Esercizio 5.46.
Dati x, y ∈ R si definiscano
d1 (x, y) = (x − y)2 ,
10. ESERCIZI
d2 (x, y) =
121
p
|x − y| ,
d3 (x, y) = |x2 − y 2 | ,
d4 (x, y) = |x − 2y| ,
d5 (x, y) =
|x − y|
.
1 + |x − y|
Si determinino quali di queste funzioni sono metriche su R.
Esercizio 5.47.
Dati x, y ∈ Rn si definiscano
n
X
d1 (x, y) =
|xi − yi | ,
i=1
d2 (x, y) =
n
X
|xi − yi |2
1/2
,
i=1
d∞ (x, y) =
max |xi − yi | .
i=1,2,...,n
Si mostri che sono metriche e che vale
d∞ (x, y) ≤ d2 (x, y) ≤ d1 (x, y) ≤ nd∞ (x, y) .
Esercizio 5.48.
Due metriche d e δ su X si dicono equivalenti se esiste una costante C > 0 tale che
Cd(x, y) ≤ δ(x, y) ≤
1
d(x, y)
C
per ogni x, y ∈ X.
Si provi che d e δ determinano la stessa topologia su X e che le loro successioni di Cauchy coincidono.
Esercizio 5.49.
Per ogni x, y ∈ R poniamo
d(x, y) = •
•
•
•
Si
Si
Si
Si
x
y −
.
1 + |x| 1 + |y|
provi che d è una distanza su R.
mostri che (R, d) non è completo.
mostri che d induce su R la topologia usuale
mostri che il completamento di (R, d) è omeomorfo a [0, 1].
Esercizio 5.50.
Dato uno spazio metrico (X, d) si definiscano
d0 (x, y) =
d(x, y)
,
1 + d(x, y)
d00 (x, y) = min{d(x, y), 1} ,
per ogni x, y ∈ X,
e si provi che sono distanze su X, non equivalenti a d, ma che ma determinano la stessa topologia
su X e le loro successioni di Cauchy coincidono.
Esercizio 5.51.
Sia (X, d) uno spazio metrico e xn una successione di Cauchy. Si provi che se xn ha una sottosuccessione convergente, allora tutta la successione è convergente.
10. ESERCIZI
122
Esercizio 5.52.
Siano (X1 , d1 ) e (X2 , d2 ) due spazi metrici. Si mostri che la topologia prodotto su X1 × X2 coincide
con quella generata dalla distanza
δ((x1 , x2 ), (y1 , y2 )) = d1 (x1 , y1 ) + d2 (x2 , y2 ) ,
dove (x1 , x2 ), (y1 , y2 ) ∈ X1 × X2 .
Esercizio 5.53.
Sia (X, d) uno spazio metrico. Si provi che d : X × X → R è continua. È anche Lipschitziana?
Esercizio 5.54.
Dato uno spazio metrico (X, d) e un suo sottoinsieme A non vuoto, si definisca la funzione distanza
da A come
dA (x) = inf d(x, y) .
y∈A
(1)
(2)
(3)
(4)
(5)
Dimostrare che la funzione dA è ben definita e Lipschitziana.
Si provi che dA = dA .
Si dimostri che {x ∈ X : dA (x) = 0} = A.
Si provi che ogni aperto di X è un’unione numerabile di chiusi.
Se X = Rn e dA (x) = r si provi che esiste y ∈ A tale che d(x, y) = r. Se inoltre A è chiuso
si mostri che per ogni x ∈ Rn esiste almeno un punto y ∈ A di distanza minima da x.
(6) Se X = Rn e A è un chiuso non vuoto, si provi che {x ∈ X : dA (x) ≤ r} = A + Dr dove
Dr è il disco chiuso di raggio r in Rn .
(7) Se X = Rn e A è un convesso chiuso non vuoto, si provi che la funzione dA è convessa e
per ogni x ∈ Rn il punto y ∈ A di distanza minima da x è unico.
Esercizio 5.55.
Sia p ∈ N un numero primo e per ogni x ∈ Q \ {0} con x = apn /b, dove a, b sono interi non divisibili
per p, sia ord(x) = n. Definiamo
(
p−ord(x)
se x ∈ Q \ {0} ,
|x|p =
0
se x = 0 .
Sia poi d : Q × Q → R definita da d(x, y) = |x − y|p .
• Si mostri che per ogni x, y, z ∈ Q si ha d(x, z) ≤ max{d(x, y), d(y, x)}.
• Si mostri che d è una distanza su Q.
• Si dica se (Q, d) è uno spazio metrico completo.
• Sia (Q, d) il completamento di (Q, d). Si dica se i limitati di (Q, d) sono compatti.
Nota. Questa distanza prende il nome di distanza p–adica su Q.
Esercizio 5.56.
Sia X l’insieme delle successioni a valori in [−1, 1]. Per A = (an ) e B = (bn ) si ponga
d(A, B) =
∞
X
2−n |an − bn | .
n=0
Si dimostri che (X, d) è uno spazio metrico e che una successione Ak = (akn ) di elementi di X
converge a un elemento limite A = (an ) se e solo se per ogni n ∈ N si ha limk→∞ akn = an . È uno
spazio completo?
10. ESERCIZI
123
Esercizio 5.57.
Sull’insieme GL(n, R) delle matrici n × n si consideri la funzione
d(A, B) =
kAx − Bxk .
sup
x∈Rn , kxk=1
Si mostri che d è una distanza completa su GL(n, R).
Data una successione di matrici Ai , si mostri che An → A rispetto a d se e solo se tutte le “entrate”
(An )ij di An convergono alle entrate Aij di A.
La distanza d è equivalente alla distanza Euclidea
n
X
1/2
dE (A, B) =
|Aij − Bij |2
?
i,j=1
Esercizio 5.58 (Distanza di Hausdorff).
Sia (X, d) uno spazio metrico e si indichi con K(X) l’insieme dei suoi sottoinsiemi compatti e
non vuoti. Fissati due compatti K e K 0 si definisce la loro distanza come l’inf su r > 0 tali che
l’r–intorno di K contiene K 0 e l’r–intorno di K 0 contiene K. In formule,
δ(K, K 0 ) = inf{r ∈ R : K 0 ⊆ Ur (K) e K ⊆ Ur (K 0 )} .
Si mostri che δ è una distanza su K(X), detta distanza di Hausdorff.
Si calcoli in K(R) la distanza tra le seguenti coppie di compatti:
[0, 1],
[0, 1],
[2, 3] ;
[0, 1/2] ;
[0, 1],
C;
{1/2},
C,
dove C è l’insieme di Cantor.
Esercizio 5.59.
Si mostri che una definizione equivalente della distanza di Hausdorff tra due compatti K e K 0 è
data da
δ(K, K 0 ) = sup {d(x, K 0 ) : x ∈ K} ∪ {d(x0 , K) : x0 ∈ K 0 } .
Esercizio 5.60.
Si mostri che una successione Kn di compatti di (X, d) converge in (K(X), δ) ad un compatto
K ⊆ X se e solo se le due seguenti condizioni si verificano:
• per ogni successione (xn(k) ) tale che xn(k) ∈ Kn(k) , esiste una sottosuccessione convergente
ad un elemento x appartenente a K;
• per ogni x ∈ K esiste una successione xn → x con xn ∈ Kn .
Si calcoli, se esiste, il limite in K(R) delle seguenti successioni di compatti:
Kn = {1/n} ,
Kn = [1/n, n] ,
Kn = [1/n, 1 − 1/n]
e, se esiste, il limite in
K(R2 )
di
Kn = {(x, y) : |x|n + |y|n ≤ 1} ,
Kn = {(e−t/n cos t, e−t/n sin t) t ≥ 0} .
10. ESERCIZI
124
Esercizio 5.61.
Sia Kn una successione decrescente Kn+1 ⊆ Kn di compatti di uno spazio metrico (X, d). Si mostri
che tale successione ammette limite in (K(X), δ) uguale a ∩n∈N Kn .
Si consideri la seguente successione di compatti definita per ricorrenza
I0 = [0, 1],
In+1 = 1/3In ∪ (2/3 + 1/3In )
e se ne calcoli il limite.
Esercizio 5.62. F
Sia (X, d) uno spazio metrico compatto, si mostri che allora anche (K(X), δ) è compatto.
Esercizio 5.63. F
Sia Kn una successione di Cauchy in in (K(X), δ), con (X, d) spazio metrico completo. Si mostri
che per ogni k ∈ N l’insieme
[
Kn
Bk =
n≥k
è compatto.
Si provi che esiste B = limk→∞ Bk e che B = limn→∞ Kn , se ne deduca che (K(X), δ) è completo.
Esercizio 5.64.
Si mostri che la funzione F : K(X) → R che associa ad ogni compatto di uno spazio metrico (X, d)
il suo diametro, dato da diam(K) = supx,y∈K d(x, y), è continua.
Esercizio 5.65.
Sia Kn una successione in (K(X), δ) convergente a K. Se tutti i Kn sono connessi, anche K è
connesso?
Esercizio 5.66.
Siano f1 , f2 , . . . , fn : (X, d) → (X, d) funzioni Lipschitziane di costante r < 1.
• Si mostri che per ogni i ∈ {1, 2, . . . , n} la mappa
fi,∗ : K(X) → K(X)
definita da fi,∗ (K) = fi (K) è Lipschitziana di constante r.
• Si mostri che la mappa
F : K(X) → K(X)
definita da F (K) = f1 (K) ∪ f2 (K) ∪ · · · ∪ fn (K) è Lipschitziana di constante r.
• Si deduca che se (X, d) è completo esiste un unico compatto non vuoto K ⊆ X tale che
K = f1 (K) ∪ f2 (K) ∪ · · · ∪ fn (K) .
• Nel caso speciale X = [0, 1] con l’usuale distanza Euclidea, si determinino f1 e f2 tale che
l’unico insieme K ⊆ [0, 1] con K = f1 (K) ∪ f2 (K) sia l’insieme di Cantor.
Esercizio 5.67.
Sia V uno spazio vettoriale normato con una norma k · k. Si mostri che l’operazione somma
+ : V × V → V è continua.
Esercizio 5.68.
Sia V uno spazio vettoriale normato con una norma k · k. Si mostri che d(x, y) = kx − yk definisce
una distanza su V .
Se lo spazio metrico (V, d) è completo, si dice spazio di Banach.
10. ESERCIZI
125
Esercizio 5.69.
Sia V uno spazio vettoriale con una metrica d. Si discutano le condizioni su d per cui la mappa
k · k = d(·, 0) è una norma e d(x, y) = kx − yk.
Esercizio 5.70.
Sia V uno spazio vettoriale con una norma k · k. Si mostri che la palla unitaria di V è convessa. Si
discutano le condizioni per cui un convesso di V è la palla unitaria di una qualche norma.
Esercizio 5.71.
Provare che per ogni x, y ∈ Rn vale l’identità
2kxk2 + 2kyk2 = kx + yk2 + kx − yk2 ,
detta identità del parallelogramma .
Esercizio 5.72.
Dati x, y ∈ Rn si definiscano
kxk1 =
kxk2 =
n
X
|xi | ,
i=1
n
X
|xi |2
1/2
,
i=1
kxk∞ =
max |xi | .
i=1,2,...,n
Si mostri che sono norme e che vale
kxk∞ ≤ kxk1 ≤
√
nkxk2 ≤ nkxk∞ .
Esercizio 5.73.
Siano V1 e V2 due spazi vettoriali con norme k · k1 e k · k2 , rispettivamente. Si mostri che la mappa
k · k : V1 × V2 → R, definita da
k(x1 , x2 )k = kx1 k1 + kx2 k2
dove x1 ∈ V1 , x2 ∈ V2 è una norma sullo spazio vettoriale V1 × V2 .
Esercizio 5.74.
Sia V è uno spazio vettoriale, un prodotto scalare su V è una forma bilineare h·|·i : X × X → R
tale che hx|xi ≥ 0 ed è uguale a zero se e solo se x = 0. Si provi che vale
|hx|yi|2 ≤ hx|xi · hy|yi
1/2
e che x 7→ hx|xi
è una norma su V .
Esercizio 5.75.
Si mostri che una norma k · k su uno spazio vettoriale V viene da un prodotto scalare h· | ·i se e solo
se vale l’identità del parallelogramma
2kxk2 + 2kyk2 = kx + yk2 + kx − yk2 ,
per ogni x, y ∈ V .
Se lo spazio V è completo con la distanza indotta da tale norma si dice spazio di Hilbert.
10. ESERCIZI
126
Esercizio 5.76.
Si provi che due norme k · k1 e k · k2 su uno stesso spazio vettoriale V inducono la stessa topologia
se e solo se sono equivalenti, cioè esiste una costante C > 0 tale che
1
Ckxk1 ≤ kxk2 ≤ kxk1
C
per ogni x ∈ V .
Esercizio 5.77. F
Si provi che se V è uno spazio vettoriale di dimensione finita, tutte le norme sono equivalenti. Si
dia un esempio di uno spazio vettoriale di dimensione infinita con due norme non equivalenti.
Esercizio 5.78.
Si provi che se V è uno spazio vettoriale normato e W un suo sottospazio vettoriale di dimensione
finita, si provi che W è un chiuso di V . Si costruisca un esempio esplicito di uno spazio vettoriale
e di un suo sottospazio vettoriale non chiuso.
Esercizio 5.79.
Sia V è uno spazio vettoriale normato con norma k · k. Si mostri che le seguenti due condizioni
sono equivalenti:
• V con la distanza d(x, y) = kx − yk è uno spazio metrico completo;
• per ogni sequenza xn si ha
∞
∞
X
X
kxn k < +∞ =⇒
xn converge.
n=1
n=1
Esercizio 5.80.
Sia V uno spazio vettoriale normato. Si mostri che la norma è una funzione convessa.
Esercizio 5.81.
P
Per p ≥ 1, su Rn definiamo la mappa x 7→ |x|p = ni=1 |xi |p . Si provi che | · |p è una norma e che
la topologia indotta è quella usuale di Rn . Lo stesso per la mappa x 7→ |x|∞ = max{|xi |}.
Si disegni la palla unitaria per tutte queste norme.
Esercizio 5.82. F
Si mostri che la palla unitaria chiusa di uno spazio normato o di Banach di dimensione infinita non
è compatta.
Esercizio 5.83.
Si considerino gli spazi vettoriali
`∞ = {x ∈ RN : sup |xn | < +∞} ,
n∈N
N
c = {x ∈ R
N
c0 = {x ∈ R
: esiste finito lim xn } ,
n→∞
: lim xn = 0} .
n→∞
Si mostri che |x|∞ = supn∈N |xn | è una norma per questi spazi che li rende spazi di Banach.
Esercizio 5.84.
Dato p ∈ [1, +∞), si consideri lo spazio vettoriale
∞
n
o
X
p
N
` = x∈R :
|xn |p < +∞ .
n=1
10. ESERCIZI
Si mostri che |x|p =
P
∞
p
n=1 |xn |
1/p
127
è una norma su `p che lo rende uno spazio di Banach.
Esercizio 5.85.
Si mostri che nessuna palla di `2 è compatta.
Si trovi una successione xk non convergente in `2 tale che per ogni n ∈ N la successione numerica
xkn converge a zero.
Esercizio 5.86.
Sia F un sottoinsieme di uno spazio metrico compatto. Si provi che F è compatto se e solo se è
chiuso.
Esercizio 5.87.
Si provi che uno spazio vettoriale normato localmente compatto è completo.
Esercizio 5.88 (Numero di Lebesgue).
Sia (X, d) uno spazio metrico. Dato un ricoprimento di X con una famiglia di aperti U = {Ui } si
definisca il numero di Lebesgue del ricoprimento U come il sup dei ρ ∈ R+ tali che per ogni x ∈ X,
esiste un aperto Ui che contiene la palla aperta di centro x e raggio ρ, se un tale ρ positivo non
esiste diciamo che il ricoprimento ha numero di Lebesgue zero.
Si mostri che se (X, d) è compatto, ogni suo ricoprimento ha numero di Lebesgue positivo.
Esercizio 5.89.
Sia F1 ⊇ F2 ⊇ · · · ⊇ Fn ⊇ . . . una successione di compatti non vuoti di uno spazio metrico (X, d).
Si provi che ∩∞
n=1 Fn è non vuoto.
Esercizio 5.90.
Uno spazio metrico si dice separabile se contiene un sottoinsieme numerabile denso. Si mostri che
Rn è separabile.
Esercizio 5.91. F
Si provi che ogni spazio metrico compatto è separabile.
Esercizio 5.92.
Sia K un sottoinsieme di uno spazio metrico (X, d). Si provi che le tre seguenti condizioni sono
equivalenti.
• Ogni successione xn ∈ K ha una sottosuccessione convergente a x ∈ K (compattezza
sequenziale).
• Da ogni famiglia di aperti che ricopre K si può estrarre una sottofamiglia finita che lo
ricopre (compattezza per ricoprimenti, o semplicemente compattezza).
• L’insieme K è completo e per ogni ε > 0 esiste un insieme finito di punti x1 , x2 , . . . , xn ∈ K
tale che K ⊆ ∪ni=1 B(xi , ε) (totale limitatezza).
Esercizio 5.93.
Si provi che uno spazio metrico è separabile se e solo se ha una base numerabile della sua topologia.
Esercizio 5.94.
Si provi che ogni spazio metrico compatto ha una base numerabile della sua topologia.
Esercizio 5.95.
Si provi che se in uno spazio metrico possiamo trovare una famiglia più che numerabile di aperti
non vuoti a due a due disgiunti, lo spazio non è separabile.
10. ESERCIZI
128
Esercizio 5.96.
Si mostri che lo spazio metrico `∞ non è separabile. Si provi che tutti gli spazi `p , per p ≥ 1, sono
separabili. E gli spazi c e c0 ?
Esercizio 5.97. Sia X lo spazio delle funzioni continue da R in [0, 1] con la distanza
d∞ (f, g) = sup |f (x) − g(x)| ,
x∈R
detta distanza uniforme. Si provi che tale spazio non è separabile, quindi la sua topologia non ha
base numerabile.
Cambia qualcosa considerando invece lo spazio delle funzioni continue da [0, 1] in sé?
Esercizio 5.98 (Teorema di Lindelöf). F
Si provi che se (X, d) è uno spazio metrico separabile, allora da ogni ricoprimento aperto di X si
può estrarre un sottoricoprimento numerabile. Vale anche il viceversa?
Esercizio 5.99. F
Si dia un esempio di uno spazio metrico che non soddisfa il secondo assioma di numerabilità, cioè
tale che la sua topologia non abbia una base numerabile.
Esercizio 5.100 (Teorema di Baire). F
Si provi che se (X, d) è uno spazio metrico completo, non è possibile ottenere X come unione
numerabile di sottoinsiemi chiusi con parte interna vuota.
Esercizio 5.101. F
Si provi che se (X, d) è uno spazio metrico completo, allora l’intersezione di una famiglia numerabile
di aperti densi di X è un insieme denso.
Si provi che un’unione numerabile di sottoinsiemi chiusi di X con parte interna vuota ha parte
interna vuota.
Esercizio 5.102.
◦
∞ F è un aperto
Sia (X, d) uno spazio metrico completo, se X = ∪∞
F
con
F
chiusi,
allora
∪
n
n
n=1
n=1 n
denso di X.
Esercizio 5.103. FF
Si provi che ogni chiuso di uno spazio metrico separabile è l’unione disgiunta di un insieme perfetto
e di un numerabile. Inoltre, tale decomposizione è unica.
Esercizio 5.104.
Sia (X, d) uno spazio metrico contenente almeno due punti. Si mostri che se X è connesso, allora
la sua cardinalità è almeno quella del continuo.
Esercizio 5.105.
Si mostri che la palla unitaria e la sfera unitaria di Rn , se n ≥ 2 sono spazi connessi.
Esercizio 5.106.
La chiusura e la parte interna di un sottoinsieme connesso di uno spazio metrico (topologico) sono
connessi?
Esercizio 5.107. F
Si mostri che se X è uno spazio metrico e An è una famiglia di sottoinsiemi connessi di X tali che
∞
∩∞
n=1 An 6= Ø, allora ∪n=1 An 6= Ø è connesso.
10. ESERCIZI
129
Esercizio 5.108.
Si consideri sullo spazio X la relazione x ∼ y se esiste un sottoinsieme connesso di X che contenga
x e y. Si mostri che tale relazione è di equivalenza. Le classi di equivalenza si dicono componenti
connesse di X.
Esercizio 5.109.
Si mostri che le componenti connesse sono chiuse. Sono anche aperte?
Esercizio 5.110.
Sia (X, d) uno spazio metrico e sia An una successione di sottoinsiemi non vuoti di X tali che
An+1 ⊆ An e sia A = ∩∞
n=1 An .
• Si provi che se ogni An è compatto e connesso, allora A è compatto, connesso e non vuoto.
• Si provi che ci sono casi in cui tutti gli An sono connessi per archi ma A è non vuoto e
non connesso.
• Si provi che ci sono casi in cui tutti gli An sono compatti e connessi per archi ma A non
è connesso per archi.
10.3. Funzioni Continue.
Esercizio 5.111.
Una funzione f : R → R che trasforma ogni successione xn convergente in una successione
convergente f (xn ), è necessariamente continua?
Esercizio 5.112.
Se f : R → R porta intervalli in intervalli, si può concludere che f è continua?
Esercizio 5.113.
Se f : R → R porta aperti in aperti, si può concludere che f è continua? E chiusi in chiusi?
Esercizio 5.114.
Sia f : R → R una funzione tale che f 3 + 2f + 1 è una funzione continua. Si provi che allora f è
continua.
Esercizio 5.115.
Sia f : R → R una funzione tale che
f lim sup xn = lim sup f (xn )
n→∞
n→∞
per ogni successione limitata di numeri reali xn . Dimostrare che f è continua e monotona.
Esercizio 5.116. F
Sia f : R → R una funzione surgettiva tale che per ogni successione xn non convergente, la
successione f (xn ) è non convergente. Si provi che allora f è continua.
Esercizio 5.117. F
Sia f : R → R una funzione tale che
lim [f (x + h) − f (x − h)] = 0
h→0+
per ogni x ∈ R. La funzione f è allora continua?
Esercizio 5.118.
Si mostri che una funzione continua f : C → R su un chiuso C di uno spazio metrico (X, d) si può
estendere ad una funzione continua su tutto X.
10. ESERCIZI
130
Esercizio 5.119.
Sia f : R → R continua, si discuta se f e f −1 come funzioni insiemistiche, mandano aperti in
aperti, chiusi in chiusi, limitati in limitati, densi in densi, perfetti in perfetti, compatti in compatti,
connessi in connessi, di I/II categoria in I/II categoria, etc.. ed eventualmente si trovino ipotesi
che lo garantiscano.
Si discutano le stesse questioni per funzioni continue f : X → Y dove X, Y siano due spazi metrici
o topologici.
Esercizio 5.120.
Si discutano le stesse questioni del problema precedente se V e W sono due spazi normati (o di
Banach) e f : V → W è un’applicazione lineare e continua.
Esercizio 5.121.
Sia f : R → R continua, si discutano le relazioni tra le seguenti coppie di insiemi ed eventualmente
si trovino ipotesi che ne garantiscano l’uguaglianza:
f (A) e f (A),
f (A◦ ) e f (A)◦ ,
f (∂A) e ∂f (A),
f (A0 ) e f (A)0 ,
f −1 (A) e f −1 (A), f −1 (A◦ ) e f −1 (A)◦ , f −1 (∂A) e ∂f −1 (A), f −1 (A0 ) e f −1 (A)0 .
Si discutano le stesse questioni per funzioni continue f : X → Y dove X, Y siano due spazi metrici
o topologici.
Si discutano le stesse questioni se V e W sono due spazi normati (o di Banach) e f : V → W è
un’applicazione lineare e continua.
Esercizio 5.122.
Sia f : R → R limitata e sia
Γ(f ) = {(x, y) ∈ R2 : y = f (x)}
il grafico di f . Si mostri che f è continua se e solo se Γ(f ) è un chiuso di R2 .
La conclusione vale anche se f non è limitata?
Esercizio 5.123.
Sia V uno spazio vettoriale con una norma k · k che viene da un prodotto scalare h· | ·i. Si mostri
che le funzioni f : X × X → X, g : X × X → R e h : X × R → X date da f (x, y) = x + y,
g(x, y) = hx|yi e h(x, λ) = λx sono funzioni continue.
Esercizio 5.124.
Siano (X, d) e (Y, δ) due spazi metrici di cui X compatto, T : X → Y e S : Y → X due isometrie
(cioè δ(T (x), T (y)) = d(x, y) per ogni coppia x, y ∈ X e lo stesso per S).
Provare che allora T ed S sono iniettive e surgettive.
Esercizio 5.125. F
Sia f : X → X un’isometria di uno spazio metrico (X, d), si provi che f è iniettiva ma non
necessariamente surgettiva. Se X è compatto si mostri che f è bigettiva. Si dia un esempio di due
spazi metrici (X, d) e (Y, δ), non isometrici tra loro, per cui esistano due isometrie f : X → Y ,
g : Y → X.
Esercizio 5.126.
Si provi che l’inversa di una isometria bigettiva tra due spazi metrici è ancora un’isometria.
Esercizio 5.127.
Siano (X, d) e (Y, d0 ) due spazi metrici, con (X, d) compatto. Sia f : X → Y una funzione continua
e iniettiva, si mostri che allora è un omeomorfismo tra X e la sua immagine f (X).
10. ESERCIZI
131
Esercizio 5.128.
Siano (V1 , k · k1 ) e (V2 , k · k2 ) due spazi vettoriali normati, si mostri che una applicazione lineare
A : V1 → V2 è continua se e solo se esiste una costante C > 0 tale che
kA(x)k2 ≤ Ckxk1
per ogni x ∈ V1 .
Esercizio 5.129.
Sia f : R → R una funzione continua tale che ogni punto di R è un punto di minimo relativo per
f . Dimostrare che f è costante.
Esercizio 5.130. F
Sia f : R → R una funzione qualunque. Si mostri che l’insieme dei suoi minimi (o massimi) stretti
è al più numerabile.
Esercizio 5.131. FF
Si determinino le funzioni f : R → R tali che ogni punto di R è o un massimo o un minimo relativo
per f e si descriva la sottoclasse delle continue con tale proprietà.
Esercizio 5.132. F
Si consideri una funzione f : [0, +∞) → R limitata e continua in 0, tale che f (0) = 0 e f (x) > 0
per ogni x > 0. È possibile trovare una funzione g : [0, +∞) → R che sia continua, valga g(0) = 0
e g ≥ f dappertutto?
Esercizio 5.133.
Sia f : R → R una funzione tale che f (x + y) = f (x) + f (y) per ogni x, y ∈ R (tale funzione si dice
additiva).
• Si mostri che se f è continua in almeno un punto, allora è lineare.
• Si mostri che se f è monotona, allora è lineare.
• Si mostri che se f è limitata in un qualche intervallo di R, allora è lineare.
Esercizio 5.134. F
Si mostri che esistono f : R → R additive ma non lineari.
Esercizio 5.135.
Sia f : R → R una funzione tale che
|f (x) − f (y)| ≤ h(x − y) ,
dove h : R → R è una funzione tale che limx→0 h(x) = 0. Si mostri che f è continua.
Esercizio 5.136.
Sia f una funzione reale tale che soddisfi una delle seguenti ipotesi
(1)
(2)
(3)
(4)
f (λx) = λf (x) per ogni λ ∈ Q e x ∈ R,
f (xy) = f (x)f (y) per ogni x, y ∈ R,
f (x + y) = f (x)f (y) per ogni x, y ∈ R,
f (xy) = f (x) + f (y) per ogni x, y ∈ R∗ ,
è vero che se f è continua in un punto, allora è continua dappertutto? E se è solo limitata? O
monotona?
Assumendo f continua, si descrivano gli insiemi delle funzioni che soddisfano tali condizioni.
10. ESERCIZI
132
Esercizio 5.137.
Sia f : R → R una funzione continua tale che i limiti
lim f (x)
x→−∞
e
lim f (x) ,
x→+∞
esistono (finiti o infiniti) e sono uguali. Si dimostri che allora f ha minimo o massimo in R (nel
senso che ne ha almeno uno dei due oppure entrambi).
Esercizio 5.138.
Una funzione f : X → R (lo spazio topologico R è definito da R = R ∪ {−∞, +∞} con base della
sua topologia la famiglia di insiemi
(a, b) ,
[−∞, a) ,
(a, +∞] ,
dove a, b ∈ R) con (X, d) spazio metrico, si dice semicontinua inferiormente (superiormente) – talvolta si scrive SCI (SCS) – se per ogni x0 ∈ X si ha lim inf x→x0 f (x) ≥ f (x0 ) (lim supx→x0 f (x) ≤
f (x0 )).
Si mostri che le seguenti affermazioni sono equivalenti:
• f è semicontinua inferiormente.
• Per ogni t ∈ R, il sottolivello St = {x ∈ X : f (x) ≤ t} è un chiuso di X.
• L’epigrafico E = {(x, t) ∈ X × R : f (x) ≤ t} è un chiuso di X × R.
Si formuli poi l’equivalente conclusione per le funzioni semicontinue superiormente.
Esercizio 5.139.
Si dica se gli spazi delle funzioni semicontinue inferiormente e superiormente da R in R sono spazi
vettoriali.
Esercizio 5.140.
Si mostri che se {fi : X → R}i∈I è una famiglia di funzioni semicontinue inferiormente, allora la
funzione f : X → R, definita da f (x) = supi∈I fi (x) per ogni x ∈ X, è semicontinua inferiormente.
Esercizio 5.141. F
Si mostri che se f : Rn → R è semicontinua inferiormente e mai uguale a −∞, esiste una successione
crescente di funzioni continue fk : Rn → R tale che limk→∞ fk (x) = f (x), per ogni x ∈ Rn .
Esercizio 5.142.
Si mostri che se f : X → R è una funzione semicontinua inferiormente, mai uguale a −∞, e X
è uno spazio compatto, allora f assume minimo. Si discuta l’analogo enunciato per le funzioni
semicontinue superiormente.
Esercizio 5.143.
Sia f : (a, b) → R una funzione continua e iniettiva, si mostri che deve essere monotona e che
l’inversa f −1 : f (a, b) → (a, b) è continua.
Esercizio 5.144.
Dati n numeri reali positivi a1 , a2 , . . . , an , si mostri che la funzione
Pn ap 1/p
i=1 i
p 7→ Mp =
n
definita su R∗ è continua e monotona e che
• limp→0 Mp = G, dove G è la media geometrica dei valori a1 , a2 , . . . , an ,
• limp→−∞ Mp = min{ai },
• limp→+∞ Mp = max{ai }.
10. ESERCIZI
133
Esercizio 5.145.
P
Data una serie convergente a termini positivi ∞
n=1 an , si definisca la funzione
∞
X
1/p
p 7→ Sp =
apn
n=1
per p ∈ [1, +∞). Si mostri che limp→+∞ Sp = max{an }.
Esercizio 5.146.
Sia f : [a, b] → R una funzione continua, si mostri che per ogni ε > 0 esiste una funzione g : [a, b] →
R costante a tratti, che assume un numero finito di valori, tale che |f (x) − g(x)| < ε per ogni
x ∈ [a, b]. La conclusione va modificata se invece di [a, b] si considera tutto R, oppure un intervallo
aperto, assumendo che la funzione f sia o meno limitata?
Se la funzione non è continua ma è soltanto limitata, cosa si può dire?
Esercizio 5.147.
Sia f : R2 → R data da f (x, y) =
lim f (t, mt) ,
t→0
x2 y
x4 +y 2
e sia m ∈ R. Si calcolino, se esistono, i limiti
lim f (0, t) ,
t→0
lim f (t, t2 ) ,
t→0
lim f (x, y) .
(x,y)→0
Esercizio 5.148.
Si consideri la funzione f : (0, +∞) → R definita da
(
0 per x ∈ R+ \ Q+ ,
f (x) = 1
per x = pq > 0, p e q primi tra loro
q
e se ne discuta l’iniettività, la surgettività e i punti di continuità o di semicontinuità inferiore e
superiore.
Esercizio 5.149.
Sia f : R → R una funzione qualunque, si dimostri che l’insieme dei punti x ∈ R dove f ha una
discontinuità a salto oppure una discontinuità eliminabile è al più numerabile.
Esercizio 5.150. FF
Sia f : R+ → R una funzione tale che, per ogni x ∈ R+
lim f (nx) = 0.
n→∞
Si può concludere allora che
lim f (x) = 0 ?
x→+∞
E se f è uniformemente continua? E se è solo continua?
Esercizio 5.151.
Dare un esempio di una funzione u : R → R tale che i suoi punti di discontinuità siano tutti e soli
i numeri razionali.
Una funzione u con questa proprietà può essere monotona?
Esercizio 5.152.
Data f : R → R, si indichi con D(f ) l’insieme dei punti in cui f non è continua. Si dimostri che
D(f ) è un’unione numerabile di insiemi chiusi, cioè un Fσ .
Esercizio 5.153. F
Esiste una funzione f : R → R tale che i suoi punti di discontinuità siano tutti e soli i numeri
irrazionali?
10. ESERCIZI
134
Esercizio 5.154. F
Supponendo che lo spazio metrico (X, d) abbia un sottoinsieme denso D con parte interna vuota,
si mostri che dato E ⊆ X che sia un Fσ , esiste una funzione f : X → R tale che l’insieme dei suoi
punti di discontinuità D(f ) sia esattamente E.
Esercizio 5.155.
Una funzione ω : [0, +∞) → [0, +∞] si dice modulo di continuità se è continua in 0, ω(0) = 0 ed è
monotona crescente. Si dice che ω è un modulo di continuità per f : A → R con A ⊆ R se
f (x) − f (y) ≤ ω(|x − y|)
∀x, y ∈ A .
Dimostrare che f è uniformemente continua se e solo se ammette un modulo di continuità finito
(cioè a valori in (0, +∞)). Scrivere un modulo di continuità per una funzione Lipschitziana o
Hölderiana.
Esercizio 5.156.
Sia F una famiglia di funzioni su R con un modulo comune di continuità finito ω e tali che
f (x) = sup{f (x) : f ∈ F} < +∞
Dimostrare che allora ω è un modulo di continuità anche per la funzione f che quindi è continua.
Esercizio 5.157.
Data una funzione f : X → R, dove (X, d) è uno spazio metrico, si definisca la funzione oscillazione,
per ogni x ∈ X, come
θf (x) = inf diam f (Bε (x)) ,
ε>0
dove per un insieme A ⊆ R definiamo diam(A) come l’estremo inferiore delle lunghezze degli
intervalli che contengono A.
(1) Si mostri che
θf (x) = inf sup{f (Bε (x))} − inf{f (Bε (x))} .
ε>0
(2) Si mostri che
θf (x) = lim sup max{f (y), f (x)} − lim inf min{f (y), f (x)} .
y→x
y→x
(3) Si mostri che θf (x) ≥ 0 e che f è continua in x ∈ X se e solo se θf (x) = 0.
(4) Si mostri che per ogni n ∈ N∗ l’insieme An = {x ∈ R : θf (x) ≥ 1/n} è chiuso.
(5) Si concluda che θf : X → R è semicontinua superiormente.
Esercizio 5.158. F
Si dimostri che l’insieme dei punti di R in cui una funzione semicontinua inferiormente non è
continua è un insieme di prima categoria (un sottoinsieme di R si dice di prima categoria se è
contenuto in un’unione numerabile di chiusi con parte interna vuota).
Esercizio 5.159.
Si provi che una funzione uniformemente continua f : X → R trasforma ogni successione di Cauchy
in una successione di Cauchy. Vale il viceversa?
Esercizio 5.160.
Nella relazione ε–δ che vale per una funzione continua f : R → R, la scelta di δ in generale dipende
da x ∈ R e da ε > 0. Fissato ε, si può sempre scegliere δ dipendente in modo continuo da x?
10. ESERCIZI
135
Esercizio 5.161.
Siano f, g : [0, +∞) → R due funzioni continue tali che limx→+∞ (f (x) − g(x)) = 0. Si mostri che
se g è uniformemente continua, lo è anche f .
Esercizio 5.162.
Si provi che una funzione uniformemente continua su uno spazio vettoriale normato è limitata su
ogni sottoinsieme limitato. Si mostri con un esempio che la stessa conclusione non vale in generale
per uno spazio metrico.
Esercizio 5.163.
Si dimostri che una funzione continua sull’intervallo aperto e limitato (a, b) è uniformemente
continua se e solo se esistono finiti i limiti di f (x) per x che tende ad a e b.
Esercizio 5.164.
Sia f definita e continua in R. Si mostri che se esistono finiti i limiti limx→±∞ f (x), allora f è
uniformemente continua.
Esercizio 5.165.
Per ogni n ∈ N, definiamo In = [2n, 2n + 1] e sia E = ∪n∈N In . Sia f : E → R definita da f (x) = 2n
se x ∈ In . Si mostri che esiste un’estensione continua di f a tutto R+ ma non esiste un’estensione
uniformemente continua.
Esercizio 5.166.
Si mostri che la composizione di due funzioni uniformemente continue è uniformemente continua.
Esercizio 5.167.
Sia f : R → R una funzione continua, si dica quali delle seguenti affermazioni sono corrette:
• se f è periodica, f è uniformemente continua,
• se f è limitata, f è uniformemente continua,
• se f è limitata e uniformemente continua, allora f 2 (cioè la funzione x 7→ [f (x)]2 ) è
uniformemente continua,
• se f è uniformemente continua esistono a, b ∈ R tali che |f (x)| ≤ a|x| + b, per ogni x ∈ R,
• se esistono a, b ∈ R tali che |f (x)| ≤ a|x| + b, per ogni x ∈ R, allora f è uniformemente
continua.
Esercizio 5.168.
Sia f : R → R uniformemente continua, si mostri che esistono due costanti C, M ∈ R tale che
|f (x)| ≤ C|x| per |x| ≥ M .
Esercizio 5.169.
Si mostri che una funzione continua f : I → R, monotona e limitata, dove I ⊆ R è un intervallo
limitato o illimitato, è uniformemente continua.
Esercizio 5.170. F
Si trovi una funzione continua f : R → R tale che non sia monotona in nessun intervallo non vuoto.
Esercizio 5.171.
Una funzione si dice aperta se manda insiemi aperti in aperti. Si mostri che una funzione f : R → R
continua e aperta è strettamente monotona.
Esercizio 5.172.
Si mostri che una funzione f : R → R strettamente monotona e con la proprietà del valor intermedio
è continua.
10. ESERCIZI
136
Esercizio 5.173.
Sia f : [a, b] → R continua tale che per ogni x ∈ [a, b] esiste h > 0 tale che per ogni y ∈ [x, x + h] si
ha f (x) ≤ f (y). Si provi che f è monotona non decrescente. La stessa conclusione vale se f non è
continua?
Esercizio 5.174.
Sia f : (0, +∞) → R una funzione Lipschitziana. Si provi che esiste finito il limite limx→0+ f (x).
Esercizio 5.175.
Sia A ⊆ R e sia f : A → R. La funzione f si dice α–Hölderiana (per α > 0) se esiste una costante
C ≥ 0 tale che
|f (x) − f (y)| ≤ C|x − y|α ∀x, y ∈ A .
(1)
(2)
(3)
(4)
Si
Si
Si
Si
Si
dica per quali β ≥ 0 la funzione xβ da [0, +∞) in R è α–Hölderiana.
provi che ogni funzione Hölderiana è uniformemente continua.
dia un esempio di una funzione continua ma non α–Hölderiana per ogni α > 0.
mostri che se A è limitato e β < α, allora ogni funzione α–Hölderiana è β–Hölderiana.
dica se lo stesso vale se A = R.
Esercizio 5.176.
Sia f : R → R tale che
|f (x) − f (y)| ≤ C(x − y)α , ∀x, y ∈ R ,
con α > 1 e C > 0. Si mostri che f è costante (da cui nella definizione di funzione α–Hölderiana si
considera sempre α ≤ 1).
Esercizio 5.177.
Si esibisca una funzione f : [a, b] → R uniformemente continua ma non α–Hölderiana per ogni
α > 0.
Esercizio 5.178.
Si provi che l’insieme di discontinuità di una funzione monotona f : R → R è al più numerabile.
Esercizio 5.179.
Siano f e g funzioni Lipschitziane da R in R. Si dica quali delle seguenti funzioni risultano ancora
Lipschitziane, precisando le relative costanti: f + g, f − g, f ∧ g, f ∨ g, f g, f /g, f ◦ g.
Si discuta il problema analogo con f e g Hölderiane.
Esercizio 5.180.
Si mostri che una funzione Lipschitziana su di un sottoinsieme di R si estende sempre ad una
funzione Lipschitziana su tutto R.
La costante di Lipschitz si può mantenere invariata nell’estensione?
Esercizio 5.181.
Si mostri che una funzione Lipschitz su tutto R è sempre differenza di due funzioni monotone. Si
possono scegliere entrambe crescenti o decrescenti? O una crescente e l’altra decrescente?
Esercizio 5.182.
Una funzione f : [a, b] → R si dice a variazione limitata (talvolta indicato come BV ) se esiste una
costante C > 0 tale che per ogni suddivisione x0 = a < x1 < · · · < xn−1 < xn = b si ha
n
X
i=1
|f (xi ) − f (xi−1 )| ≤ C .
10. ESERCIZI
137
Si mostri che una funzione a variazione limitata è sempre differenza di due funzioni monotone. Si
possono scegliere entrambe crescenti o decrescenti? O una crescente e l’altra decrescente?
Vale il viceversa?
Esercizio 5.183.
Si mostri che una funzione Lipschitziana è a variazione limitata.
Esercizio 5.184. F
Una funzione f : [a, b] → R si dice assolutamente continua (talvolta indicato come AC) se per ogni
ε > 0 esiste un δ > 0 tale che per ogni famiglia
P finita {[a1 , b1 ], [a2 , b2 ], . . . , [an , bn ]} di sottointervalli
chiusi di [a, b], a due a due disgiunti, con ni=1 (bi − ai ) < δ si ha
n
X
|f (bi ) − f (ai )| ≤ ε .
i=1
Si mostri che vale la seguente catena di implicazioni:
f è Lipschitziana =⇒ f è AC =⇒ f è BV e continua =⇒ f è uniformemente continua .
Si mostri con controesempi che le implicazioni opposte non valgono in generale.
Esercizio 5.185.
Si dica se gli spazi delle funzioni Lipschitziane, Hölderiane, assolutamente continue, a variazione
limitata, uniformemente continue, semicontinue inferiormente su un intervallo chiuso I ⊂ R sono
spazi vettoriali.
Nel caso, che norma proporreste per renderli Banach?
Esercizio 5.186.
Si dica se gli spazi delle funzioni limitate, monotone, continue, Lipschitziane, Hölderiane, assolutamente continue, a variazione limitata, uniformemente continue, semicontinue inferiormente, su un
intervallo chiuso I ⊂ R (o su tutto R) sono “chiusi” per somma, differenza, modulo, operazioni di
max/min e di sup/inf, prodotto, rapporto, composizione.
Esercizio 5.187.
Data una funzione f : [0, +∞) → R tale che per ogni x ∈ R l’insieme f ([0, x]) è limitato, si consideri
la funzione g : [0, +∞) → R definita da
g(x) = sup f (t)
t≤x
e si risponda alle seguenti domande, giustificando la risposta:
(1) la funzione g è continua? Monotona?
(2) Se f è limitata allora g è limitata?
(3) Se f è monotona allora g è monotona?
(4) Se f è continua allora g è continua?
(5) Se f è uniformemente continua allora g è uniformemente continua?
(6) Se f è Lipschitz allora g è Lipschitz?
(7) Se f è Hölderiana allora g è Hölderiana?
(8) Se f è AC allora g è AC?
(9) Se f è BV allora g è BV ?
(10) Se f ha la proprietà del valor intermedio allora anche g?
Si ripeta il problema scambiando il ruolo di f e g nelle domande.
10. ESERCIZI
138
Esercizio 5.188.
Data una funzione f : R → R e una costante ε > 0 tali che per ogni x ∈ R l’insieme f (x − ε, x + ε)
è limitato, si consideri la funzione g : R → R definita da
g(x) =
sup
f (t)
t∈(x−ε,x+ε)
e si risponda alle seguenti domande, giustificando la risposta:
(1) la funzione g è continua? Monotona?
(2) Se f è limitata allora g è limitata?
(3) Se f è monotona allora g è monotona?
(4) Se f è continua allora g è continua?
(5) Se f è uniformemente continua allora g è uniformemente continua?
(6) Se f è Lipschitz allora g è Lipschitz?
(7) Se f è Hölderiana allora g è Hölderiana?
(8) Se f è AC allora g è AC?
(9) Se f è BV allora g è BV ?
(10) Se f ha la proprietà del valor intermedio allora anche g?
Si ripeta il problema scambiando il ruolo di f e g nelle domande.
Esercizio 5.189 (Teorema delle Frittelle). F
Dati due poligoni nel piano, si dimostri che esiste una retta (un taglio) tale che separi ognuno dei
due poligoni (frittelle) in due parti di stessa area.
Nota. Il risultato vale per ogni coppia di insiemi limitati nel piano, avendo a disposizione un
concetto di area generale. Valgono inoltre degli analoghi n–dimensionali (si provi ad enunciarli)
però di dimostrazione più complessa. Con idee simili si può provare il fatto che ci sono sempre due
punti antipodali sulla terra (sulla sfera) tali che hanno la stessa temperatura e la stessa pressione
(i valori di due funzioni continue sulla sfera). Il caso 1–dimensionale è dato dal fatto che per ogni
funzione continua sulla circonferenza, esistono sempre due punti opposti con lo stesso valore della
funzione (lo si dimostri).
CAPITOLO 6
SUCCESSIONI E SERIE DI FUNZIONI
Si danno per noti i risultati fondamentali del calcolo differenziale in una variabile, in particolare la
nozione di derivata, le regole di derivazione di base1, il teorema di Lagrange2, il teorema di Cauchy3,
lo sviluppo di Taylor4.
1. Convergenza puntuale e uniforme
Sia E un insieme. Consideriamo una successione
fn : E −→ R ,
di funzioni a valori reali definite in E.
Definizione 6.1 (Convergenza puntuale). Si dice che la successione (fn ) converge puntualmente
su E a f : E −→ R se
lim fn (x) = f (x)
∀x ∈ E .
n→∞
Esempi.
(1) Con E = R, la successione fn (x) = nx/(1 + nx2 ) converge puntualmente a

1
se x 6= 0 ,
f (x) = x
0
se x = 0 .
(2) Sempre con E = R, si ponga fn (x) = xn . La successione di numeri reali fn (x) ha
limite finito solo per −1 < x ≤ 1. Quindi la successione di funzioni (fn ) non converge
puntualmente su R. Tuttavia, restringendosi a E0 = (−1, 1], si ha convergenza puntuale
su E0 e la funzione limite è
(
0 se x ∈ (−1, 1) ,
(1.1)
f (x) =
1 se x = 1 .
Introduciamo ora una nozione più restrittiva di convergenza, la convergenza uniforme. Come sopra,
E è un insieme e le funzioni fn sono definite su E e a valori reali.
1Somma: (f + g)0 = f 0 + g 0 ; prodotto: (f g)0 = f 0 g + f g 0 ; composizione: (f ◦ g)0 = (f 0 ◦ g)g 0 ; inversa: (f −1 )0 =
1/f 0 ◦ f −1 .
2
Per ogni intervallo [a, b] ⊆ R limitato e per ogni funzione f : [a, b] → R continua in tutti i punti di [a, b] e
derivabile in tutti i punti di (a, b), esiste c ∈ (a, b) tale che f (b) − f (a) = f 0 (c)(b − a).
3
Per ogni intervallo [a, b] ⊆ R limitato, se f, g : [a, b] → R sono continue in tutti i punti di [a, b] e derivabili in
tutti i punti di (a, b), esiste c ∈ (a, b) tale che g 0 (c)(f (b) − f (a)) = f 0 (c)(g(b) − g(a)).
4
Se n ≥ 1 è intero, r > 0 e f : (x0 − r, x0 + r) → R è derivabile (n − 1) volte in (x0 − r, x0 + r) e f (n−1) è derivabile
n
P
f (i) (x0 )
in x0 , allora f (x) =
(x − x0 )i + o((x − x0 )n ), con le convenzioni f (0) = f , derivabile 0 volte=continua e
i!
i=0
(x − x0 )0 = 1 per ogni x ∈ R.
139
2. CONTINUITÀ DEL LIMITE UNIFORME
140
Definizione 6.2 (Convergenza uniforme). Si dice che la successione (fn ) converge uniformemente su E a f : E −→ R se, per ogni ε > 0, esiste un indice n0 tale che, per ogni n ≥ n0 e ogni
x ∈ E, si ha
fn (x) − f (x) < ε .
Le due nozioni, di convergenza puntuale e convergenza uniforme, si confrontano bene esprimendo
le due condizioni in forma esplicita.
• Convergenza puntuale:
(1.2)
∀ ε > 0, ∀ x ∈ E, ∃ n0 (ε, x) : ∀ n ≥ n0 (ε, x) , fn (x) − f (x) < ε .
• Convergenza uniforme:
(1.3)
∀ ε > 0, ∃ n0 (ε) : ∀ x ∈ E, ∀ n ≥ n0 (ε) , fn (x) − f (x) < ε .
La differenza sta nel fatto che, dato ε, l’indice richiesto n0 , a partire dal quale fn (x) debba distare
da f (x) per meno di ε, possa dipendere da x, oppure debba esistere indipendentemente da x.
Il seguente enunciato è dunque ovvio.
Proposizione 6.3 (Convergenza uniforme implica convergenza puntuale). Se una successione di funzioni converge uniformemente su E alla funzione f , allora vi converge puntualmente.
Il seguente esempio mostra che, in generale, il viceversa non vale.
Esempio. Si considerino le funzioni fn (x) = xn del precedente Esempio 2. Sull’insieme E0 =
(−1, 1] si ha convergenza puntuale, ma non uniforme. Si fissi infatti ε < 1. Se la convergenza alla
funzione f in (1.1) fosse uniforme, dovrebbe esistere un indice n0 tale che, per ogni n ≥ n0 e ogni
x ∈ (−1, 1), |xn | < ε. Ma questo è assurdo perché limx→±1 |xn | = 1.
Restringiamo ora le funzioni fn a un intervallo Eδ = [−1 + δ, 1 − δ], dove δ ∈ (0, 1/2). Dato ε > 0,
esiste n0 tale che (1 − δ)n0 < ε. Se n ≥ n0 e x ∈ Eδ , si ha
n
x − f (x) = |xn | ≤ (1 − δ)n < ε .
Quindi la convergenza alla funzione f è uniforme su Eδ .
Osservazione 6.4. Si osservi che le nozioni di convergenza puntuale e uniforme si estendono in
modo naturale a successioni a valori in un qualunque spazio metrico (Y, dY ): basta nelle formule (1.2) e (1.3) sostituire |fn (x) − f (x)| con dY (fn (x), f (x)). Nel seguito non ci servirà tuttavia
tutta questa generalità, salvo il caso di funzioni a valori in Rm (o a valori complessi).
2. Continuità del limite uniforme
Gli esempi visti nel paragrafo precedente mostrano che funzioni continue possono convergere puntualmente a funzioni discontinue. Il teorema seguente dimostra invece che la continuità delle
funzioni fn “si trasmette” alla funzione limite f quando la convergenza è uniforme.
Teorema 6.5 (Continuità del limite uniforme). Sia (E, d) uno spazio metrico. Se le funzioni
fn : E −→ R convergono a una funzione f uniformemente su E, e ogni fn è continua in un punto
x0 ∈ E, allora anche f è continua in x0 .
3. LA CONVERGENZA UNIFORME COME CONVERGENZA IN UNO SPAZIO METRICO
141
Dimostrazione. Si fissi ε > 0. Per l’ipotesi di convergenza uniforme, esiste un indice n tale
che
f (x) − fn (x) < ε .
3
Per la continuità di fn in x0 , esiste r > 0 tale che
fn (x) − fn (x0 ) < ε .
∀ x ∈ Br (x0 ) ,
3
Allora, per ogni x ∈ Br (x0 ) risulta
f (x) − f (x0 ) = f (x) − fn (x) + fn (x) − fn (x0 ) + fn (x0 ) − f (x0 )
≤ f (x) − fn (x) + fn (x) − fn (x0 ) + fn (x0 ) − f (x0 )
<ε.
∀x ∈ E ,
Per l’arbitrarietà di ε, f è continua in x0 .
3. La convergenza uniforme come convergenza in uno spazio metrico
Sia E un insieme. Indichiamo con B(E) lo spazio vettoriale delle funzioni limitate f : E −→ R.
Date f, g ∈ B(E), definiamo la cosiddetta distanza del sup
(3.1)
d(f, g) = sup f (x) − g(x) .
x∈E
Lemma 6.6. La formula (3.1) definisce una distanza su B(E).
Dimostrazione. Chiaramente, d(f, g) ≥ 0 per ogni f, g ∈ B(E) e d(f, g) = 0 se e solo se
f = g. Altrettanto chiaramente, vale l’identità d(f, g) = d(g, f ). Rimane dunque da verificare la
disuguaglianza triangolare.
Siano f, g, h ∈ B(E). Per ogni x ∈ E,
f (x) − h(x) ≤ f (x) − g(x) + g(x) − h(x) ≤ d(f, g) + d(g, h) .
Ma allora
d(f, h) = sup f (x) − h(x) ≤ d(f, g) + d(g, h) .
x∈E
La seguente proposizione mostra che la convergenza uniforme è precisamente quella indotta in
B(E) dalla distanza del sup: si dice informalmente che la convergenza uniforme è “metrizzata”
dalla distanza del sup.
Proposizione 6.7. Una successione (fn ) di elementi di B(E) converge uniformemente su E a
f : E −→ R se e solo se f ∈ B(E) e
lim d(f, fn ) = 0 .
n→∞
Dimostrazione. Si supponga che le funzioni fn convergano uniformemente su E a una funzione f . Dato ε > 0 esiste un indice n0 tale che, per ogni n ≥ n0 vale
f (x) − fn (x) < ε
(3.2)
∀x ∈ E .
Sia M tale che fn0 (x) ≤ M per ogni x ∈ E. Allora
f (x) ≤ f (x) − fn (x) + fn (x) < M + ε ,
0
0
4. DERIVABILITÀ DELLA FUNZIONE LIMITE
142
per ogni x ∈ E. Dunque f ∈ B(E). Inoltre, per n ≥ n0 , la disuguaglianza (3.2) implica
d(f, fn ) = sup f (x) − fn (x) ≤ ε .
x∈E
Per l’arbitrarietà di ε, limn d(f, fn ) = 0.
Viceversa, se f ∈ B(E) e limn d(f, fn ) = 0, dato ε > 0, esiste n0 tale che d(f, fn ) < ε per ogni
n ≥ n0 . Ma questo implica che, per ogni x ∈ E e ogni n ≥ n0 , |f (x) − fn (x)| < ε. Quindi le fn
convergono uniformemente a f .
Teorema 6.8 (Completezza di B(E)). Per ogni insieme E lo spazio metrico B(E), d è
completo.
Dimostrazione.
Sia
(f
)
una
successione
di
Cauchy
in
B(E).
Si
fissi
x
∈
E.
Siccome
n
fn (x)−
fm (x) ≤ d(fn , fm ), si deduce immediatamente che la successione di numeri reali fn (x) è pure di
Cauchy. Allora il limite
f (x) = lim fn (x)
n→∞
esiste finito per ogni x ∈ E. Resta da mostrare che f ∈ B(E) e che fn → f uniformemente in E.
Dato
ε > 0, sia n0 tale che, per ogni m, n ≥ n0 , d(fm , fn ) < ε. Per ogni x ∈ E e n, m ≥ n0 , si ha
fm (x) − fn (x) < ε. Dunque, passando al limite per m → ∞ in questa relazione, otteniamo che
per n ≥ n0 vale
f (x) − fn (x) = lim fm (x) − fn (x) ≤ ε .
m→∞
Applicando questa proprietà con n = n0 , dato che fn0 è limitata, otteniamo che sup |f | ≤ sup |fn0 |+
ε, quindi f è limitata. Passando ora all’estremo superiore otteniamo d(f, fn ) ≤ ε per n ≥ n0 , quindi
fn → f in B(E).
Più in generale, se consideriamo funzioni non necessariamente limitate, la stessa dimostrazione
mostra che
(3.3)
lim sup |fn (x) − fm (x)| = 0
m,n→∞ x∈E
=⇒
∃ f tale che fn → f uniformemente in E .
Sia ora E uno spazio metrico compatto, per esempio un sottoinsieme chiuso e limitato di Rn . Indicando come nel capitolo precedente con C(E) l’insieme delle funzioni continue su E, il teorema di
Weierstrass ci garantisce che C(E) ⊆ B(E). Il Teorema 6.5 ha la seguente conseguenza immediata,
dato che i chiusi di uno spazio metrico completo sono essi stessi completi.
Corollario 6.9. Se (E, d) è compatto, C(E) è uno spazio vettoriale chiuso in B(E). In particolare, C(E), d è pure uno spazio metrico completo.
4. Derivabilità della funzione limite
Consideriamo in questo paragrafo successioni di funzioni definite su un intervallo I ⊆ R. Più
in generale, per trattare intervalli I non necessariamente aperti, per “funzione derivabile su I”
intenderemo una funzione che è derivabile in ˚
I e ammette derivata laterale in ognuno degli eventuali
estremi di I che appartengono I.
Se è vero che il limite uniforme di funzioni continue è continuo, non è vero in generale che il limite
uniforme di funzioni derivabili sia derivabile.
Esempio. Ci sono molti modi di ottenere la funzione f (x) = |x|, non derivabile
in 0, come limite
√
uniforme su I = R di funzioni derivabili. Si prenda per esempio fn (x) = x2 + n−2 , il cui grafico
4. DERIVABILITÀ DELLA FUNZIONE LIMITE
143
è il ramo superiore di un’iperbole equilatera con asintoti y = ±x e vertice nel punto (0, 1/n).
Chiaramente fn è derivabile su R. Essendo
r
1
1
|x| < x2 + 2 ≤ |x| + ,
n
n
si ha limn fn = f uniformemente.
Un altro modo è il seguente. Sull’intervallo − n1 , n1 si modifichi il grafico della funzione
f (x) = |x|
1 1
sostituendolo con il quarto di cerchio tangente al grafico stesso nei punti ± n , n . La funzione gn
cosı̀ ottenuta è derivabile e limn→∞ gn = f uniformemente.
Il secondo procedimento descritto nell’esempio si generalizza facilmente al caso in cui f è una
funzione continua lineare a tratti, cioè una funzione continua il cui grafico sia l’unione di un numero
localmente finito di segmenti su intervalli adiacenti di R. Utilizzando questa osservazione, possiamo
dimostrare il risultato che segue.
Teorema 6.10 (Le funzioni ovunque derivabili sono dense nelle funzioni continue). Sia
[a, b] un intervallo chiuso e limitato5. Ogni funzione continua su [a, b] è limite uniforme di una
successione di funzioni derivabili su [a, b].
Dimostrazione. Fissato un intero n > 0, si suddivida I in n sottointervalli adiacenti di
lunghezza (b − a)/n. Poniamo
aj = a +
j
(b − a) ,
n
j = 0, . . . , n ,
e indichiamo con Ij = [aj−1 , aj ], j = 1, . . . , n, il j-esimo sottointervallo della suddivisione. Chiamiamo quindi fn la funzione tale che
• fn (aj ) = f (aj ) per j = 0, . . . , n,
• per j = 1, . . . , n, (fn )|Ij è lineare.
Dimostriamo che le fn convergono uniformemente a f su [a, b]. Per la continuità uniforme di f ,
dato ε > 0, esiste δ > 0 tale che
x, x0 ∈ [a, b] , |x − x0 | < δ =⇒ |f (x) − f (x0 )| < ε .
Si prenda ora n tale che (b − a)/n < δ e siano I1 , . . . , In i sottointervalli di I descritti sopra. Se
x ∈ Ij , per la monotonia di fn su Ij , il valore fn (x) è compreso tra i due valori fn (aj−1 ) = f (aj−1 )
e fn (aj ) = f (aj ). Quindi
f (x) − fn (x)| ≤ max f (x) − f (aj−1 )|, f (x) − f (aj )| < ε ,
essendo |x − aj−1 | e |x − aj | minori di δ. Siccome la condizione (b − a)/n < δ è verificata
definitivamente, si ottiene che d(f, fn ) < ε definitivamente.
Per quanto detto a proposito delle funzioni continue e lineari a tratti, ogni fn è limite uniforme su
[a, b] di funzioni derivabili su [a, b]. Si prenda quindi, per ogni n, una funzione gn derivabile su [a, b]
tale che d(fn , gn ) < 1/n. Allora si ha definitivamente d(fn , gn ) < ε, e dunque d(fn , gn ) < 2ε. Per
l’arbitrarietà di ε si ha la conclusione.
5La conclusione vale in realtà per tutti gli intervalli, lo si dimostri per esercizio. Approssimando con più cura le
funzioni lineari a tratti nell’intorno dei punti di discontinuità della derivata prima è possibile ottenere anche funzioni
derivabili infinite volte.
4. DERIVABILITÀ DELLA FUNZIONE LIMITE
144
Passiamo ora a discutere quali ipotesi possano garantire che se le funzioni fn sono derivabili su un
intervallo I e convergono a una funzione f , allora anche f è derivabile su I e f 0 è uguale al limite
delle fn0 . Si vuole cioè avere l’uguaglianza di commutazione tra derivata e limite:
0
lim fn = lim fn0 .
n→∞
n→∞
Vogliamo in sostanza sapere sotto quali ipotesi vale che “la derivata del limite è il limite delle
derivate”.
Consideriamo prima di tutto il caso in cui I è chiuso e limitato.
Teorema 6.11. Sia (fn ) una successione di funzioni derivabili sull’intervallo I = [a, b]. Si supponga
che
(i) le derivate fn0 convergano uniformemente su I a una funzione g;
(ii) esista un punto x0 ∈ I tale che
lim fn (x0 ) = ` ∈ R .
n→∞
Allora le funzioni fn convergono uniformemente su I alla funzione f che soddisfa le condizioni
(
f 0 (x) = g(x) ∀ x ∈ I ,
(4.1)
f (x0 ) = ` .
Prima di dare la dimostrazione si noti che se due funzioni soddisfano entrambe le condizioni (4.1),
allora coincidono. Infatti la loro differenza ha derivata nulla su tutto I, dunque è costante per il
teorema di Lagrange. Ma la differenza è nulla in x0 , da cui la conclusione. La funzione f nella (4.1)
è quella che si chiama una primitiva di g.
Dimostrazione. Dimostriamo per cominciare che la successione (fn ) converge uniformemente
(si veda anche l’osservazione alla fine della dimostrazione). Per ipotesi, la successione (fn0 ) delle
derivate converge uniformemente e la successione dei valori fn (x0 ) ha limite. Quindi, fissato ε > 0,
esiste n0 ∈ N tale che, per n, m ≥ n0 , si ha
0
fn (x0 ) − fm (x0 ) < ε .
|fn0 (t) − fm
(t)| < ε ∀t ∈ I
e
Sia allora x ∈ [a, b]. Applicando il teorema di Lagrange alla funzione fn − fm si ha
fn (x) − fm (x) ≤ (fn (x) − fm (x)) − fn (x0 ) − fm (x0 ) + fn (x0 ) − fm (x0 )
= |x − x0 |(fn − fm )0 (tx,n,m ) + fn (x0 ) − fm (x0 ) ,
dove tx,n,m è un punto strettamente compreso tra x0 e x. Dunque per n, m ≥ n0 vale
0
max fn (x) − fm (x) ≤ (b − a) sup |fn0 (t) − fm
(t)| + fn (x0 ) − fm (x0 ) ≤ (b − a + 1)ε .
x∈[a,b]
t∈I
Per l’arbitrarietà di ε, la successione (fn ) è di Cauchy in C(I).
Essendo C(I) completo, si ottiene una funzione f ∈ C(I) come limite uniforme delle fn . Ovviamente, f (x0 ) = `. Dobbiamo ora dimostrare che f è derivabile in I e che la sua derivata è g.6
6Se le funzioni f 0 fossero continue, anche g sarebbe continua e si potrebbe mostrare questo fatto anche usando il
n
R
x
teorema fondamentale del calcolo integrale, passando al limite per n → ∞ nella relazione fn (x) − fn (y) = y fn0 (s)ds
Rx
per ottenere f (x) − f (y) = y g(s)ds, grazie alla continuità dell’integrale rispetto alla convergenza uniforme. Questa
in effetti è la dimostrazione presente in molti testi.
4. DERIVABILITÀ DELLA FUNZIONE LIMITE
145
Fissiamo un punto x ∈ I e consideriamo la successione di funzioni

 fn (x) − fn (x)
se x 6= x ,
hn (x) =
x−x
f 0 (x)
se x = x .
n
Queste funzioni sono ovviamente continue in I e convergono puntualmente alla funzione

 f (x) − f (x)
se x 6= x ,
h(x) =
x−x
g(x)
se x = x .
Se dimostriamo che le hn convergono uniformemente, ne consegue che la convergenza a h è uniforme
(visto che convergenza uniforme implica convergenza puntuale), e dunque h è continua in x. Ma
questo vuol dire che
f (x) − f (x)
g(x) = lim
= f 0 (x) ,
x→x
x−x
che è la tesi del teorema.
Fissiamo dunque x 6= x. Riapplicando il teorema di Lagrange a fn − fm , si ha
(fn (x) − fm (x)) − fn (x) − fm (x) 0
0
,
hn (x) − hm (x) = = fn (tx,x,n,m ) − fm
(t
)
x,x,n,m
x−x
con tx,x,n,m strettamente compreso tra x e x. Quindi
0
(t)| ,
max hn (x) − hm (x) = sup hn (x) − hm (x) ≤ sup |fn0 (t) − fm
x∈[a,b]
x∈[a,b]\{x}
t∈I
e questo prova, grazie alla (3.3), la convergenza uniforme.
Notiamo infine che applicando la seconda parte del ragionamento con x̄ = x0 e usando le formule
fn (x) = fn (x0 ) + hn (x)(x − x0 ),
avremmo potuto dedurre la proprietà di Cauchy di (fn ) nello spazio C(I) direttamente da quella
di (hn ), applicando una sola volta il teorema di Lagrange a fn − fm .
√
√
Si noti che nell’esempio già considerato delle funzioni x2 + n−2 , le cui derivate valgono x/ x2 + n−2 ,
non si ha (e non si potrebbe avere, visto che il limite delle funzioni è non derivabile) convergenza
uniforme delle derivate. Infatti si ha convergenza puntuale delle derivate, alla funzione discontinua
che vale 1 per x > 0, 0 per x = 0, −1 per x < 0.
Nella dimostrazione del Teorema 6.11 si è fatto uso dell’ipotesi di limitatezza dell’intervallo I.
Semplici esempi mostrano che su intervalli illimitati non si può dedurre dalle stesse ipotesi la
convergenza uniforme delle fn . Si ponga per esempio, su I = R,
x
fn (x) = .
n
Le ipotesi del Teorema 6.11 sono soddisfatte, ma le fn non convergono uniformemente su R. Si noti
però che su ogni sottointervallo compatto si ha convergenza uniforme. Si parla in questo caso di
convergenza uniforme sui compatti.7 Si ha quindi la seguente semplice estensione del Teorema 6.11.
Corollario 6.12. Sia (fn ) una successione di funzioni derivabili su un intervallo I. Si supponga
che
7Si vede facilmente che se una successione converge uniformemente su un insieme E, converge uniformemente su
ogni E 0 ⊆ E. Quindi la convergenza uniforme sui compatti di un intervallo aperto (a, b) equivale alla convergenza
uniforme su una qualsiasi successione di sottointervalli [an , bn ] con inf n an = a e supn bn = b.
5. CONVERGENZA UNIFORME DI SERIE DI FUNZIONI E SPAZI VETTORIALI NORMATI
146
(i) le derivate fn0 convergano a una funzione g uniformemente sui compatti di I;
(ii) esista un punto x0 ∈ I tale che
lim fn (x0 ) = ` ∈ R .
n→∞
Allora le funzioni fn convergono uniformemente sui compatti di I alla funzione f che soddisfa le
condizioni (4.1).
5. Convergenza uniforme di serie di funzioni e spazi vettoriali normati
I risultati dei paragrafi precedenti relativi alla convergenza uniforme (rispettivamente, puntuale) di
successioni di funzioni si applicano allo studio della convergenza uniforme (risp. puntuale) di una
serie di funzioni. Naturalmente, si dice che la serie
∞
X
fn
n=0
di funzioni a valori reali definite su uno stesso insieme E converge uniformemente (risp. puntualmente) su E alla funzione s se la successione delle somme parziali
sn = f0 + · · · + fn
converge uniformemente (risp. puntualmente) a s su E.
Come per le serie numeriche, è importante avere a disposizione criteri di semplice verifica che
assicurino la convergenza uniforme di una serie di funzioni.
Vedremo più avanti il criterio di Weierstrass, che è bene però inquadrare in un contesto più generale.
Per far questo, osserviamo che ha senso parlare di somma di una serie solo quando lo spazio
ambiente è dotato, da un lato, di una struttura algebrica che consenta di calcolare somme finite di
suoi elementi, e dall’altro, di una distanza che consenta di calcolare limiti. Il caso che ci interessa
è quello di particolari metriche definite su spazi vettoriali, e da questo cominciamo.
La nozione di norma, introdotta nella prossima definizione, formalizza la nozione intuitiva di
lunghezza di un vettore in uno spazio vettoriale.
Definizione 6.13 (Norma in uno spazio vettoriale). Sia V uno spazio vettoriale su R. Si
chiama norma su V una funzione
k k : V −→ [0, +∞) ,
che soddisfi le seguenti proprietà:
(i) kvk = 0 se e solo se v = 0;
(ii) per ogni λ ∈ R e v ∈ V , kλvk = |λ|kvk;
(iii) per ogni v, w ∈ V , kv + wk ≤ kvk + kwk.
Se k k è una norma su V , la coppia (V, k k) si chiama spazio normato.
Il seguente enunciato stabilisce la corrispondenza tra norme su V e distanze con particolari proprietà. La dimostrazione, molto semplice, è lasciata al lettore.
Proposizione 6.14. Sia k · k una norma su uno spazio vettoriale V . Allora
d(v, w) = kv − wk
v, w ∈ V
è un distanza su V , detta distanza indotta dalla norma data, che gode delle ulteriori proprietà:
(a) (1–omogeneità) per ogni λ ∈ R e v, w ∈ V , d(λv, λw) = |λ|d(v, w);
(b) (invarianza per traslazioni) per ogni v, w, z ∈ V , d(v + z, w + z) = d(v, w).
5. CONVERGENZA UNIFORME DI SERIE DI FUNZIONI E SPAZI VETTORIALI NORMATI
147
Viceversa, ogni distanza d su V che soddisfi le proprietà (a) e (b) è indotta da una norma, data da
kvk = d(v, 0) .
Esempi di distanze indotte da norme sono le distanze dp su Rn del § 6.1 del Capitolo 5, nonché la
distanza del sup definita dalla formula (3.1) su B(E).
P
In analogia a quanto avviene per le somme numeriche, la somma di una serie ∞
0 vn di elementi di
uno spazio vettoriale normato (V, k · k) si definisce come il limite, se esiste, della successione delle
somme parziali
sn = v0 + · · · + vn
rispetto alla distanza su V indotta dalla norma k · k.
P
Definizione 6.15 (Somma di una serie convergente). La serie ∞
0 vi si dice convergente se
la successione (sn ) delle sue somme parziali converge. In tal caso si pone
∞
X
vi = lim
i=0
n
X
n→∞
vi .
i=0
Nello studio delle serie numeriche, è particolarmente importante il criterio di convergenza assoluta.
Ci si può domandare se vale, per serie in spazi normati, un analogo criterio di convergenza totale:
∞
X
kvn k < +∞
?
=⇒
n=0
∞
X
vn converge.
n=0
La risposta è positiva, a condizione che lo spazio normato (V, k · k) sia completo. Anzi, come
ora vedremo, la validità dell’implicazione “convergenza totale ⇒ convergenza” è equivalente alla
completezza dello spazio.
Teorema 6.16. Sia (V, k · k) uno spazio vettoriale normato. Le due condizioni seguenti sono
equivalenti:
(i) rispetto alla distanza d(v, v 0 ) = kv − v 0 k indotta dalla norma k k,
d) è completo;
P(V,
∞
(ii) data
P∞ comunque una successione (vn ) di elementi di V tale che 0 kvn k < +∞, la serie
0 vn converge a un elemento di V .
P
Dimostrazione. Supponiamo che valga la condizione (i) e sia (vn ) tale che ∞
0 kvn k < +∞.
Dato ε > 0, esiste dunque n0 ∈ N tale che, per n > m ≥ n0 , kvm+1 k + · · · + kvn k < ε. Posto
sn = v0 + · · · + vn , si ha allora
d(sn , sm ) = ksn − sm k = kvn+1 + · · · + vm k ≤ kvn+1 k + · · · + kvm k < ε ,
per n, m ≥ n0 . Per la completezza di V , si ha la convergenza delle somme sn a un elemento di V .
Supponiamo ora che valga la condizione (ii), e sia (xn ) una successione di Cauchy in V rispetto alla
distanza indotta dalla norma. Per ogni k ∈ N, esiste allora un indice n(k) tale che
∀ n, m ≥ n(k)
kxn − xm k <
1
.
2k
Sostituendo se necessario n(k) con 1 + max{n(i) : 0 ≤ i ≤ k} possiamo supporre la successione
degli indici n(k) sia crescente, quindi n(k) → ∞ per k → ∞. Allora
kxn(k+1) − xn(k) k <
1
2k
∀k ∈ N .
5. CONVERGENZA UNIFORME DI SERIE DI FUNZIONI E SPAZI VETTORIALI NORMATI
Definiamo allora (vk ) nel modo seguente:
(
xn(0)
vk =
xn(k) − xn(k−1)
k=0,
k≥1.
Siccome stiamo assumendo la condizione (ii), possiamo concludere che la serie
V . Ma la somma parziale k–esima di questa serie è
k
X
148
P∞
0
vk converge in
vi = xn(k) ,
i=0
per cui la sottosuccessione (xn(k) ) della successione data converge.
Possiamo allora concludere che (xn ) converge, dunque V è completo, sfruttando il fatto che ogni
successione di Cauchy in uno spazio metrico che abbia una sottosuccessione convergente è essa
stessa convergente. Infatti, preso ε > 0, esistono:
• un indice n0 tale che d(xn , xm ) < ε/2 per ogni n, m ≥ n0 ;
• un indice k0 tale che, detto x il limite della sottosuccessione (xn(k) ), d(x, xn(k) ) < ε/2 per
ogni k ≥ k0 .
Allora, se k ≥ k0 è scelto in modo tale che n(k) ≥ n0 (si ricordi che n(k) → ∞, quindi una tale
scelta è possibile), si ha, per n ≥ n0 ,
ε ε
d(x, xn ) ≤ d(x, xn(k) ) + d(xn(k) , xn ) < + = ε .
2 2
Corollario 6.17 (Criterio di Weierstrass e continuità di una serie). Sia (fn ) una successioni di funzioni a valori reali definite su un insieme E, e si supponga che:
(i) per ogni n ∈ N esiste una costante Mn ≥ 0 tale che
fn (x) ≤ Mn
∀x ∈ E ;
(ii)
∞
P
Mn < +∞.
P
Allora la serie ∞
se (E, d) è uno spazio metrico
0 fn converge uniformemente su E. In particolare,
P∞
e le funzioni fn sono continue, anche la somma della serie 0 fn è continua.
n=0
Dimostrazione. Per ipotesi, le funzioni fn sono in B(E) e
kfn k = sup fn (x) ≤ Mn .
x∈E
P∞
Quindi 0 kfn k < +∞. Per il Teorema 6.8, B(E) è completo e la prima parte della tesi segue
allora dal Teorema 6.16. La continuità della serie, se le fn sono continue, segue dalla continuità
delle somme parziali e dal Corollario 6.9.
Sulla retta reale, e senza ipotesi di limitatezza, si ha anche il seguente corollario del Teorema 6.12.
Teorema 6.18 (Derivabilità di una serie). Sia (fn ) una successioni di funzioni derivabili su
un intervallo I ⊆ R e si supponga che
P
0
(i) la serie derivata ∞
0 fn converga
Puniformemente sui compatti di I;
(ii) esista un punto x0 ∈ I tale che ∞
0 fn (x0 ) converga.
6. SERIE DI POTENZE
Allora la serie
e si ha
P∞
0
149
fn converge uniformemente sui compatti di I, la somma della serie è derivabile
∞
X
∞
0
X
fn (x) =
fn0 (x)
n=0
∀x ∈ I .
n=0
6. Serie di potenze
Si chiama serie di potenze una serie di funzioni della forma
∞
X
an (x − x0 )n = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · ,
n=0
dove i coefficienti an sono valori assegnati8. Il punto x0 si chiama il centro della serie.
Nella prima parte della trattazione, studieremo le serie di potenze in campo complesso, assumendo
che sia i coefficienti an , sia il centro x0 , sia la variabile x appartengono a C. L’uso dei simboli z, z0 ,
invece di x, x0 , aiuterà a ricordare che si è in ambito complesso.
Osserviamo preliminarmente che il contenuto dei paragrafi precedenti di questo capitolo si applica
senza modifiche a funzioni a valori complessi, intendendo la convergenza puntuale (risp. uniforme)
come convergenza puntuale (risp. uniforme) delle parti reali e immaginarie. Se poi si lavora con
funzioni limitate, la definizione degli spazi B(E) e C(E) si generalizza immediatamente gli spazi
B(E, C) e C(E, C), usando la distanza di C invece di quella euclidea su R. Come già osservato
varie volte, tutte le questioni di continuità e derivabilità si trattano facilmente applicando i teoremi
validi per funzioni a valori reali alle singole componenti.
Il cambiamento di variabile z = w − c trasforma una serie di potenze centrata in z0 in una serie di
potenze, nella variabile w, centrata in w0 = z0 + c. Per questo motivo enunceremo alcuni risultati
generali solo per serie di potenze centrate in 0, cioè della forma
∞
X
(6.1)
an z n .
n=0
È evidente che la serie (6.1) converge per z = 0 (in generale nel suo centro), e la sua somma dà a0 .
È ben possibile che il centro sia l’unico punto di convergenza di una serie di potenze. Si prenda ad
esempio
∞
X
nn z n .
n=0
Se z 6= 0,
lim |nn z n | = lim |nz|n = +∞ ,
n→∞
n→∞
e la serie non può dunque convergere.
Indichiamo con E l’insieme degli z ∈ C in cui la serie converge. Il lemma che segue è alla base della
descrizione delle proprietà di E.
Lemma 6.19 (Convergenza puntuale e assoluta delle serie). Si supponga che la serie (6.1)
converga in un punto z0 6= 0. Allora essa converge assolutamente in ogni punto z con |z| < |z0 | e
uniformemente su ogni disco chiuso di centro 0 e raggio r < |z0 |.
8Per n = 0 bisogna convenire che (x − x )0 = 1 anche per x = x .
0
0
6. SERIE DI POTENZE
150
P
n
n
Dimostrazione. Dalla convergenza della serie ∞
n=0 an z0 , segue che limn→0 an z0 = 0 e dunn
que che esiste una costante M > 0 tale che |an z0 | ≤ M per ogni n ∈ N. Se |z| < |z0 |, si ha
allora
n
|z| n
n
n z .
|an z | = |an z0 | n ≤ M
z0
|z0 |
La serie geometrica di ragione |z|/|z0 | < 1 converge e dunque si ha la prima parte della tesi.
La seconda parte della tesi si ricava facilmente, perché la disuguaglianza ottenuta dimostra anche
che
r n
n
per ogni z con |z| ≤ r .
|an z | ≤ M
|z0 |
Basta dunque applicare il criterio di Weierstrass.
Sia dunque
(6.2)
∞
n
o
X
E= z∈C:
an z n converge .
n=0
Il seguente enunciato segue facilmente dal Lemma 6.19.
Teorema 6.20 (Raggio di convergenza di una serie). Sia
R = sup |z| ∈ [0, +∞] .
z∈E
Allora ogni z ∈ C con |z| < R appartiene a E. In particolare,
(i) se R = 0, E = {0};
(ii) se R = +∞, E = C;
(iii) se 0 < R < +∞, indicando con DR ⊂ C il disco aperto di centro 0 e raggio R,
DR ⊆ E ⊆ DR ,
e la serie converge uniformemente sui compatti di DR .
La dimostrazione del seguente enunciato è lasciata per esercizio.
P∞
P
n
n
Proposizione 6.21. Siano ∞
0 bn z due serie di potenze centrate in 0 con raggi di
0 an z e
0
convergenza R e R . Allora la loro somma e il loro prodotto alla Cauchy hanno raggi di convergenza
maggiori o uguali a min{R, R0 }.
Il raggio di convergenza è esprimibile come funzione dei coefficienti della serie.
Proposizione 6.22. Data la serie (6.1), sia
` = lim sup
n→∞
p
n
|an | ∈ [0, +∞] .
Allora
R=
1
,
`
con la convenzione che 1/0 = +∞ e 1/(+∞) = 0.
Dimostrazione. Sia z 6= 0. Allora
p
p
lim sup n |an z n | = |z| lim sup n |an | = |z|` .
n→∞
n→∞
Per il criterio della radice, la serie converge se |z|` < 1 e non converge se |z|` > 1. La conclusione
si deduce facilmente.
7. DERIVABILITÀ SULL’ASSE REALE
151
P
n
Sia ∞
0 an z una serie di potenze con raggio di convergenza R > 0. Chiamiamo f (z) la funzione
somma, definita sull’insieme di convergenza E in (6.2).
Teorema 6.23. La funzione f è continua su DR .
Dimostrazione. Per la convergenza uniforme della serie sui compatti di DR , f è continua su
ognuno di tali compatti. Ovviamente questo è equivalente alla continuità su DR .
7. Derivabilità sull’asse reale
P
n
Sia f (z) = ∞
0 an z , dove la serie ha raggio di convergenza R > 0. Restringiamo f a DR ∩ R =
(−R, R), e discutiamone la derivabilità. Per far questo consideriamo la serie derivata
∞
X
(7.1)
n 0
(an x ) =
n=0
∞
X
nan x
n−1
=
n=1
∞
X
(n + 1)an+1 xn .
n=0
Teorema 6.24 (Derivabilità di una serie di potenze). La serie (7.1) ha raggio di convergenza R.
Quindi f è derivabile su (−R, R) e
0
f (x) =
∞
X
nan xn−1
∀x ∈ (−R, R) .
n=1
P∞
P
n
n−1 e
Dimostrazione. Le due serie ∞
1 nan x convergono per gli stessi valori di x.
1 nan x
Calcoliamo dunque
p
p
√ 1
lim sup n n|an | = lim n n lim sup n |an | =
.
n→∞
R
n→∞
n→∞
La conclusione segue dalla convergenza uniforme sui compatti di (−R, R) di entrambe le serie e dal
Teorema 6.18.
Iterando l’applicazione di questo teorema alle derivate successive, si ottiene:
Corollario 6.25. La funzione f è di classe C ∞ su (−R, R) e per ogni k ∈ N vale
f
(k)
(x) =
∞
X
n(n − 1) · · · (n − k + 1)an xn−k
∀x ∈ (−R, R) .
n=k
Più in generale, per serie di potenze centrate in x0 con raggio di convergenza R, possiamo scrivere
(7.2)
∞
∞
X
X
f (k) (x) =
n(n−1) · · · (n−k +1)an (x−x0 )n−k =
(m+k)(m+k −1) · · · (m+1)an+m (x−x0 )m
m=0
n=k
per ogni x ∈ (x0 − R, x0 + R).
Esempi.
P
n
(1) La serie ∞
1 x /n ha raggio di convergenza R = 1. Se f (x) è la sua somma, si ha
(7.3)
0
f (x) =
∞
X
n=1
x
n−1
=
∞
X
m=0
xm =
1
.
1−x
8. SERIE DI POTENZE E SERIE DI TAYLOR
152
Pertanto f è una primitiva di 1/(1 − x) sull’intervallo (−1, 1), ossia esiste c ∈ R tale che
f (x) = − log(1 − x) + c. Ma c = f (0) = 0, e dunque
∞
X
xn
= − log(1 − x)
∀x ∈ (−1, 1) .
n
n=0
(2) In modo analogo si dimostra che
∞
X
(−1)n 2n+1
x
= arctan x
2n + 1
∀x ∈ (−1, 1) ,
n=0
usando il fatto che il raggio di convergenza della serie è 1. Usando il Lemma di Abel,
vedremo che la validità di questa formula si può estendere fino a x = 1, ottenendo la
formula notevole
1 1 1 1
π
1 − + − + ··· = .
3 5 7 9
4
8. Serie di potenze e serie di Taylor
Sia f una funzione definita in un intervallo I, derivabile infinite volte in un punto x0 ∈ I. La
formula di Taylor con resto di Peano è dunque applicabile a ogni ordine n ∈ N:
f 00 (x0 )
f (n) (x0 )
f (x) = f (x0 )+f 0 (x0 )(x−x0 )+
(x−x0 )2 +· · ·+
(x−x0 )n +o (x−x0 )n
(x → x0 ) .
2
n!
Si può quindi costruire la serie di Taylor
∞
X
f (n) (x0 )
(x − x0 )n
n!
n=0
e domandarsi se essa converge, almeno in un intorno di x0 , alla funzione f . La risposta è in generale
negativa per due motivi:
• la serie può avere raggio di convergenza nullo;
• la serie può avere raggio di convergenza positivo, ma convergere a una funzione diversa da
f.
Un esempio esplicito mostra che si può presentare la seconda possibilità. Si prenda
(
2
e−1/x
se x 6= 0 ,
(8.1)
f (x) =
0
se x = 0 .
Si vede facilmente che f è continua anche in x0 = 0. Dimostriamo per induzione che f ha derivate
di ogni ordine su R e che f (n) (0) = 0 per ogni n.
Per prima cosa si verifica facilmente, sempre per induzione, che f è C ∞ su R \ {0} e che, per x 6= 0,
1
2
e−1/x ,
f (n) (x) = pn
x
9
dove i pn sono opportuni polinomi . Allora, assumendo come ipotesi induttiva che f (n) (0) = 0, si
ha che
1
−1/x2
p
(n)
(n)
n x e
f (x) − f (0)
2
(n+1)
= lim
= lim tpn (t)e−t = 0 ,
f
(0) = lim
t→±∞
x→0
x→0
x
x
3
2 0
9La relazione ricorsiva tra i polinomi è: p (t) = 1, p
0
n+1 (t) = 2t pn (t) − t pn (t).
8. SERIE DI POTENZE E SERIE DI TAYLOR
153
perché, per ogni k,
2
e−t = o(e−|t| ) = o(|t|k )
(t → ±∞) .
Quindi la serie di Taylor di f centrata in 0 ha tutti i termini identicamente nulli. Dunque ha raggio
di convergenza infinito ma non converge a f (x) per x 6= 0.
Che la prima possibilità (raggio di convergenza nullo della serie di Taylor) sia concreta si ricava dal
seguente teorema.
Teorema 6.26 (Teorema di Borel). Data una qualunque successione (an ) di numeri reali, esiste
una funzione f di classe C ∞ su R tale che f (n) (0) = an per ogni n ∈ N.
Dimostrazione. Sia Cc∞ (R) lo spazio vettoriale delle funzioni in C ∞ (R) con supporto compatto, cioè identicamente nulle al di fuori di un compatto (variabile da funzione a funzione). Dato
n ∈ N, si ponga
Mn [f ] = max sup |f (m) (x)| .
0≤m≤n x∈R
Costruiamo per prima cosa una funzione ϕ ∈ Cc∞ (R), nulla fuori dall’intervallo [−1, 1] tale che
ϕ(0) = 1 e ϕ(n) (0) = 0 per ogni n ∈ N∗10 Dato che la funzione ϕ (x) = ϕ(x/ε) è identicamente
nulla fuori dall’intervallo [−ε, ε], con un semplice cambiamento di variabili otteniamo
lim Mn xn+1 ϕε (x) = 0
∀n ∈ N .
ε→0+
Si costruiscano ora ricorsivamente numeri εn > 0 tali che
Mn xn+1 ϕεn−1 (x) ≤
1
an+1
per ogni n tale che an+1 6= 0 e poniamo
f (x) = a0 +
∞
X
an
n=1
n!
xn ϕ
x εn−1
.
Segue che tale funzione f appartiene a C ∞ (R) (più precisamente f − a0 ∈ Cc∞ (R), con supporto
contenuto in [−ε0 , ε0 ]) e, usando ϕ(n) (0) = 0 per ogni n ≥ 1, che f (n) (0) = an , per ogni n ∈ N.
Questa semplice verifica è lasciata al lettore.
Prendendo, ad esempio, an = n! nn , e una corrispondente
f come nella tesi del teorema di
P funzione
n xn , che ha raggio di convergenza nullo.
Borel, la serie di Taylor di f centrata in 0 è data da ∞
n
0
Queste considerazioni motivano la seguente definizione.
Definizione 6.27 (Funzioni analitiche). Una funzione f : I → R di classe C ∞ si dice analitica
sull’intervallo aperto I ⊆ R se per ogni x0 ∈ I la serie di Taylor di f centrata in x0 converge a f
in un intervallo di (x0 − r, x0 + r) ⊆ I con r > 0.
10Una tale funzione può essere elementarmente costruita come segue:
si consideri la funzione φ1/3,1 =
e
, posta uguale a 0 fuori di (1/3, 1); tale funzione è non negativa e di classe C ∞ , positiva nell’intervallo
(1/3, 1); si costruiscano in modo analogo funzioni φ−1,−1/3 e φ−2/3,2/3 . Allora la funzione
−1/((1−x)(3x−1))
ϕ :=
φ−2/3,2/3
,
φ−1,−1/3 + φ−2/3,2/3 + φ1/3,1
posta uguale a 0 fuori di (−2/3, 2/3), soddisfa tutte le proprietà richieste (è addirittura costante in (−1/3, 1/3)).
8. SERIE DI POTENZE E SERIE DI TAYLOR
154
2
L’esempio della funzione e−1/x mostra che non tutte le funzioni C ∞ sono analitiche (la proprietà
fallisce, come abbiamo visto, per x0 = 0). Una definizione apparentemente più debole, ma equivalente, di funzione analitica consiste nel richiedere che per ogni x0 ∈ I la funzione coincida in un
intervallo (x0 − r, x0 + r) con la somma di una serie di potenze centrata in x0 . Infatti il teorema
di derivabilità delle serie, e in particolare la formula (7.2), implicano che an = f (n) (x0 )/n!, quindi
se c’è una serie per la quale questa proprietà vale, questa è quella di Taylor. Per lo stesso motivo,
mentre il teorema di Borel implica che non vi è restrizione alcuna sulla successione f (n) (x0 ), con
f di classe C ∞ , lo stesso non vale per funzioni analitiche: dovendo essere il raggio di convergenza
positivo, dovrà essere11
r
n |f (n) (x0 )|
lim sup
< +∞.
n!
n→∞
Usando le corrispondenti proprietà delle serie, è facile mostrare che l’insieme delle funzioni analitiche
è un’algebra, i.e. le funzioni analitiche sono stabili per somma e prodotto. Le funzioni analitiche
godono di proprietà sorprendenti (e ancora di più nell’ambito complesso, che non tratteremo). Una
di queste è la seguente proprietà di unicità del prolungamento, se analitico, da un intervallo J a un
intervallo I ⊇ J:
Proposizione 6.28 (Principio del prolungamento analitico). Se due funzioni analitiche f, g
in un intervallo aperto I coincidono su un intervallo J ⊆ I, allora f ≡ g in tutto l’intervallo I.
Dedurremo il principio del prolungamento analitico applicando la proposizione seguente, che riguarda gli insiemi di livello delle funzioni analitiche, alla differenza f −g, con c = 0. In una formulazione
più forte, basta che {x ∈ I : f (x) = g(x)} abbia un punto di accumulazione in I per avere f ≡ g
in I. Ovviamente il principio non vale per funzioni “solo” di classe C ∞ , basta prendere ad esempio
come f questa variante, ancora di classe C ∞ , dell’esempio (8.1)
(
e−1/x se x > 0 ,
f (x) =
0
se x ≤ 0 ,
e come g la funzione identicamente nulla. Il principio può essere dedotto, per differenza, dalla
seguente proposizione:
Proposizione 6.29 (Insiemi di livello di funzioni analitiche). Sia I ⊆ R un intervallo aperto
e f : I → R analitica. Allora, per ogni c ∈ R, o l’insieme di livello
x ∈ I : f (x) = c
è discreto in I (i.e. privo di punti di accumulazione in I) o f è identicamente nulla.
Dimostrazione. Senza perdita di generalità possiamo supporre c = 0. Supponiamo che il
derivato E dell’insieme di livello f −1 (0) contenga almeno un punto di I. Per la continuità di f ,
l’insieme di livello è chiuso in I, quindi f è identicamente nulla su E ∩ I. L’insieme complementare
I \ E è evidentemente aperto; per la connessione di I ci basterà mostrare che E ∩ I è aperto: in tal
caso E ∩ I deve coincidere con I e quindi f ogni punto di I è di accumulazione per f −1 (0); per la
continuità di f segue che f è identicamente nulla in I.
Mostriamo dunque che E ∩ I è aperto. Se x ∈ E ∩ I, mostriamo per induzione su k ∈ N che esiste
(k)
(k)
una successione strettamente monotona (xn ) convergente a x per n → ∞ e tale che f (k) (xn ) = 0
(0)
per ogni n. Per k = 0 basta scegliere una successione strettamente monotona (xn ) ⊆ f −1 (0) \ {x}
11Usando la formula di Stirling si ha (n!)1/n /(n/e) → 1 per n → ∞, quindi la condizione equivale a
lim supn
p
n
|f (n) (x0 )|/n < +∞.
8. SERIE DI POTENZE E SERIE DI TAYLOR
155
convergente a x (essendo x di accumulazione per f −1 (0), ne esiste sempre una). Per fare il passaggio
(k)
(k)
induttivo basta applicare il teorema di Rolle alla funzione f (k) nell’intervallo di estremi xn e xn+1
(k+1)
per trovare un punto intermedio, che chiamiamo xn
, ove f (k+1) si annulla. Abbiamo allora
f (k) (x) = lim f (k) (x(k)
n )=0
∀x ∈ E .
n→∞
Dato che x è arbitrario segue che f (k) ≡ 0 su E ∩ I per ogni k ∈ N. Quindi le serie di Taylor
centrate su punti di E ∩ I sono identicamente nulle e la proprietà di analiticità ci dice che E ∩ I è
aperto.
Possiamo ora mostrare che le serie di potenze sono analitiche all’interno del loro dominio di convergenza. Come conseguenza di questo teorema abbiamo una terza definizione equivalente di funzione
analitica: nell’intorno di ogni punto x0 del dominio la funzione coincide con una serie di potenze
(non necessariamente centrata in x0 ).
P∞
n
Teorema 6.30 (Le serie di potenze sono analitiche). Sia
0 an x una serie di potenze
centrata in 0 con raggio di convergenza R > 0 e sia f (x) la sua somma. Allora f è analitica in
(−R, R).
Dimostrazione. Dobbiamo verificare che per ogni x0 ∈ (−R, R) la funzione f coincide con
una serie di potenze centrata in x0 , in un intervallo Ix0 centrato in x0 . Per come è definita f , questo
è ovvio per x0 = 0 e possiamo prendere I0 = (−R, R).
Prendiamo ora un generico punto x0 ∈ (−R, R). Per il Corollario 6.25, f è di classe C ∞ su (−R, R)
e la serie di Taylor di f centrata in x0 è
∞
∞
∞
X
X
f (k) (x0 )
1X
k
(x − x0 )k =
(m + k) · · · (m + 1)am+k xm
0 (x − x0 )
k!
k!
m=0
k=0
k=0
(8.2)
∞ X
∞ X
m+k
m
=
am+k x0 (x − x0 )k .
k
k=0
m=0
N2
Consideriamo la sommatoria su
a termini positivi
X m + k |am+k ||x0 |m |x − x0 |k ,
k
(k,m)∈N2
e partizioniamo N2 negli insiemi Ep = (m, k) : m + k = p . Si ha
X m + k p
|am+k ||x0 |m |x − x0 |k = |ap | |x0 | + |x − x0 | ,
k
(k,m)∈Ep
e, per il Teorema 4.16 del Capitolo 4,
∞
X m + k X
p
m
k
|am+k ||x0 | |x − x0 | =
|ap | |x0 | + |x − x0 | .
k
2
p=0
(k,m)∈N
Quest’ultima serie converge per |x0 | + |x − x0 | < R, condizione che individua il massimo intervallo
centrato in x0 e contenuto in (−R, R). Chiamiamo Ix0 = (x0 − R + |x0 |, x0 + R − |x0 |) tale intervallo
(che ha sempre un estremo in comune con (−R, R)). Dunque per x ∈ Ix0 la sommatoria
X m + k k
am+k xm
0 (x − x0 )
k
2
(k,m)∈N
8. SERIE DI POTENZE E SERIE DI TAYLOR
156
converge, e pertanto la serie di Taylor (8.2) può essere ricombinata come serie in p delle sommatorie
sugli insiemi Ep . Ma
X m + k am+k xn0 (x − x0 )k = ap xp ,
k
(k,m)∈Ep
per cui concludiamo che, per x ∈ Ix0 ,
∞
X
f (k) (x0 )
k=0
k!
k
(x − x0 ) =
∞
X
ap xp = f (x) .
p=0
Sia f una funzione di classe C ∞ in un intorno di x0 . Concretamente, il problema della convergenza
a f in un intervallo I contenente x0 della sua serie di Taylor centrata in x0 si riduce a dimostrare
che, per x ∈ U , il resto dello sviluppo di Taylor all’ordine n nel punto x0 ,
n
X
f (k) (x0 )
(x − x0 )k ,
Rn (x0 ; x) = f (x) −
k!
k=0
tende a 0 per n → ∞.
In molti casi, la questione si risolve facendo uso di una delle due formule del resto Rn (x0 ; ·), la forma
di Lagrange e la forma integrale. Si noti che il caso n = 0 del punto (i) corrisponde al teorema del
valor medio di Lagrange, mentre il caso n = 0 del punto (ii) corrisponde al teorema fondamentale
del calcolo integrale.
Teorema 6.31 (Formule del resto). Siano I ⊆ R un intervallo, x0 ∈ I, n ∈ N e f : I → R.
(i) (Resto in forma di Lagrange) Si supponga che f sia derivabile n volte in I, con derivata
n–sima continua e che, in I \ {x0 }, esista anche f (n+1) . Allora, per ogni x ∈ I \ {x0 },
esiste un punto tx , strettamente compreso tra x0 e x, tale che
Rn (x0 ; x) =
f (n+1) (tx )
(x − x0 )n+1 .
(n + 1)!
(ii) (Resto in forma integrale) Si supponga che f sia derivabile n + 1 volte in I, con derivata
(n + 1)–sima continua in I. Allora
Z
1 x (n+1)
Rn (x0 ; x) =
f
(t)(x − t)n dt
∀x ∈ I .
n! x0
Dimostrazione. (i) L’idea è di considerare y = x0 come un parametro, differenziando rispetto
a y. La formula del resto si dimostra infatti applicando il teorema classico di Cauchy al rapporto
F (x) − F (x0 )
F 0 (tx )
= 0
,
G(x) − G(x0 )
G (tx )
ove F (y) e G(y) sono definite rispettivamente da
n
X
f (k) (y)
F (y) =
(x − y)k ,
G(y) = −(x − y)n+1 .
k!
k=0
P 1 (k)
Si noti che F (x) = f (x) e che F (x0 ) = n0 k!
f (x0 )(x − x0 )k , quindi Rn (x0 ; x) = F (x) − F (x0 ) e
G(x) − G(x0 ) = (x − x0 )n+1 . Vale quindi
(8.3)
Rn (x0 ; x)
F 0 (tx )
=
.
(x − x0 )n+1
(n + 1)(x − tx )n
8. SERIE DI POTENZE E SERIE DI TAYLOR
157
Inoltre, per la regola di Leibniz di derivazione del prodotto, vale
0
F (y) =
=
n
X
f (k+1) (y)
k=0
n
X
k=0
k!
f (k+1) (y)
k!
k
(x − y) −
(x − y)k −
n
X
kf (k) (y)
k=1
n−1
X
k=0
k!
(x − y)k−1
f (n+1) (y)
f (k+1) (y)
(x − y)k =
(x − y)n .
k!
n!
F 0 (y)
Inserendo questa formula per
con y = tx nell’equazione (8.3) si ha la prima formula del resto.
(ii) Procediamo per induzione su n ≥ 0. Per n = 0 l’enunciato corrisponde al teorema fondamentale
del calcolo integrale. Per passare da n − 1 ≥ 0 a n integriamo prima per parti e poi usiamo l’ipotesi
induttiva per ottenere
x
Z
Z x
1
1 (n)
1 x (n+1)
n
(n)
n−1
n
f
(t)(x − t) dt =
f (t)(x − t)
dt + f (t)(x − t) n!
(n − 1)!
n!
x0
x0
= f (x) −
n−1
X
k=0
x0
f (k) (x0 )
f (n) (x0 )
(x − x0 )k −
(x − x0 )n
k!
n!
= Rn−1 (x0 ; x) −
f (n) (x0 )
(x − x0 )n = Rn (x0 ; x) .
n!
Esempio. Per α ∈ R si consideri la funzione
fα (x) = (1 + x)α ,
che è di classe C ∞ sulla semiretta (−1, +∞), qualunque sia α. Trascurando il caso α ∈ N, in cui
fα si riduce a un polinomio, negli altri casi non si ha prolungamento C ∞ fuori da questa semiretta.
Essendo
fα(n) (x) = α(α − 1) · · · (α − n + 1)(1 + x)α−n ,
il resto Rn (x0 ; x) della formula di Taylor in forma integrale è dato da
Z
α(α − 1) · · · (α − n) x
Rn (x0 ; x) =
(1 + t)α−n−1 (x − t)n dt .
n!
0
Per analogia con il caso in cui α è intero possiamo porre
α
α(α − 1) · · · (α − n + 1)
,
=
n
n!
potendo in questo modo scrivere la serie di Taylor centrata in 0 nel modo seguente:
∞ X
α n
(8.4)
x .
n
n=0
Questa è nota come serie binomiale. Per α 6∈ N, è facile applicare il criterio del rapporto ai
coefficienti della serie (8.4), ottenendo che ha raggio di convergenza 1. Per |x| < 1 si ha
Z x
Rn (0; x) ≤ α(α − 1) · · · (α − n) |x − t|n (1 + t)α−n−1 dt
n!
0
α(α − 1) · · · (α − n) Z x |x − t| n
=
(1 + t)α−1 dt .
n!
1+t
0
9. IL LEMMA DI ABEL
158
Per a > 0 fissato, è facile studiare i problemi di massimo
|t − a|
|t + a|
,
max
,
0≤t≤a t + 1
−a≤t≤0 t + 1
verificando che entrambi i valori massimi sono pari a a. Quindi, applicando questa proprietà con
a = |x|, per x ∈ (−1, 1) otteniamo
Z x
α − 1 n
α
α−1 |x| .
Rn (0; x) ≤ α(α − 1) · · · (α − n) |x|n (1 + t)
dt = (1 + x) − 1 n
n!
0
max
Applicando il criterio del rapporto, si ottiene che limn Rn (0; x) = 0. Dunque
∞ X
α n
x = (1 + x)α
per x ∈ (−1, 1) .
n
n=0
Abbiamo qui un altro bell’esempio di applicazione del principio di continuazione analitica: la
funzione a sinistra, definita dalla somma della serie, è analitica e definita solo nell’intervallo (−1, 1);
d’altro canto, con la formula del resto di Lagrange e con il criterio del rapporto si verifica12 che la
funzione a destra è analitica in I = (0, ∞). Dato che coincidono in J = (0, 1), possiamo dire che
la funzione somma della serie ha un (unico) prolungamento analitico a tutto l’insieme (−1, +∞),
dato dalla funzione (1 + x)α .
9. Il Lemma di Abel
P
n
Sia ∞
0 an z una serie di potenze di raggio R centrata in 0, con R finito e strettamente positivo.
Supponiamo che in un dato punto z0 con |z0 | = R la serie converga. Il Teorema 6.23 non dice nulla
sulla continuità della funzione somma in z0 .
Per esempio, sappiamo che la serie logaritmica (7.3)
∞
X
xn
n=1
n
converge in [−1, 1) e che la somma è uguale a − log(1 − x) per x ∈ (−1, 1). Non possiamo però dire
se, per x = −1, la somma della serie (cioè della serie armonica a segni alterni con primo termine
negativo) è uguale a − log 2. Per ottenere questa conclusione, ci basterebbe sapere che la serie
converge uniformemente su un intervallo comprendente il punto −1, diciamo su [−1, 0]: in tal caso,
infatti, entrambi i membri sarebbero restrizioni di funzioni continue su [−1, 1) che, coincidendo in
(−1, 1), dovrebbero anche coincidere nel punto −1.
Vedremo in questo paragrafo che il lemma di Abel garantisce che convergenza in z0 implica convergenza uniforme su certi sottoinsiemi chiusi del disco DR (z0 ) detti non tangenziali. In particolare
dedurremo la convergenza uniforme sul segmento chiuso congiungente 0 a z0 , che ci dà l’enunciato
del lemma di Abel nel caso reale. Con vertice in z0 , si consideri un angolo di ampiezza 2θ < π,
avente per bisettrice il raggio congiungente 0 a z0 e troncato in modo da non contenere punti di
modulo R all’infuori di z0 . Non è importante come si effettua il troncamento, perché la differenza
tra due regioni cosı̀ costruite per lo stesso valore di θ è comunque un sottoinsieme compatto del
disco aperto DR (z0 ), e su di esso si ha già la convergenza uniforme della serie per il Teorema 6.20.
Indichiamo con Sz0 ,θ una tale regione.
12Lo si faccia per esercizio, in questo caso si può sfruttare il fatto i valori di x sono maggiori di 0 per stimare
l’errore in modo molto più semplice.
9. IL LEMMA DI ABEL
159
6
........................................................................
.............
...........
..........
.........
.........
.......
.......
.......
.
.
.
.
.
.
......
.....
.
.
......
.
.
....
..... 0
.
.
.
.
....
..
.
.
.
....
..
.
.
....
.
.
.
...........
.
....
........
....
...
.......
...
.
...
......
..
.
.
.
...
....
..
...
.
.
....
..
...
.
.
....
..
...
.
...
.
..
...
...
.
...
z0 ,θ .....
...
..
..
...
..
...
..
.
..
..
..
..
..
..
..
.
..
..
..
.
.
..
..
...
...
...
...
...
..
...
.
...
...
...
..
....
...
....
....
.
.
....
.
...
....
...
.....
....
......
......
......
......
.
.......
.
.
.
.
.
.......
...
.........
.......
..........
.........
.............
..........
............................. ........................................
.....
•
z
θ θ
S
-
P
n
Teorema 6.32 (Lemma di Abel). Sia R ∈ (0, +∞) il raggio di convergenza della serie ∞
0 an z ,
e si supponga che essa converga in un punto z0 con |z0 | = R. Allora essa converge uniformemente
in ogni regione Sz0 ,θ , con 0 ≤ θ < π/2.13
Dimostrazione. Il cambiamento di variabile z = z0 w trasforma la serie data nella serie
∞
X
an z0n wn
n=0
nella variabile w. Essa converge in un punto w se e solo se la serie data converge in z0 w. Dunque ha
raggio di convergenza 1 e converge per w = 1. Inoltre essa converge uniformemente su un insieme
A se e solo se la serie data converge uniformemente sull’insieme z0 A = {z0 w : w ∈ A}. P
In questo
n
modo possiamo ricondurre la dimostrazione del teorema al caso particolare in cui la serie ∞
0 an z
abbia raggio di convergenza R = 1 e il punto di convergenza sul bordo sia z0 = 1. Lavoreremo nella
regione (ottenuta con un troncamento di r = |z − 1| dipendente dall’angolo θ)
S1,θ := z ∈ C : z = 1 + reiϕ , 0 ≤ r ≤ − cos(π + θ), ϕ ∈ (π − θ, π + θ) .
Un’altra semplificazione della dimostrazione consiste nel ridursi al caso in cui il valore della somma
in z0 = 1 è uguale a 0, cioè
∞
X
an = 0 .
n=0
Ciò si ottiene modificando opportunamente il coefficiente iniziale a0 . Questa variazione non altera
gli insiemi di convergenza puntuale e uniforme della serie.
Assumendo dunque queste ipotesi, indichiamo con E ⊆ D1 l’insieme di convergenza puntuale della
serie e poniamo
s(z) =
∞
X
k=0
ak z k ,
sn (z) =
n
X
k=0
ak z k ,
An = sn (1) =
n
X
ak .
k=0
13Restringendosi alla retta reale, l’enunciato è più semplice: ogni serie di potenze converge uniformemente in
ogni intervallo chiuso e limitato contenuto nell’insieme di convergenza puntuale.
9. IL LEMMA DI ABEL
160
Sommando e sottraendo si ha (formula di sommazione di Abel)
sn (z) = a0 +
(a0 + a1 )z − a0 z+
(a0 + a1 + a2 )z 2 − (a0 + a1 )z 2 +
···
(a0 + a1 + · · · + an )z n − (a0 + a1 + · · · + an−1 )z n .
Quindi, raggruppando per diagonali, otteniamo
(9.1)
sn (z) =
n−1
X
Ak (z k − z k+1 ) + An z n
∀z ∈ C .
k=0
Si ottiene dall’identità (9.1) e dall’inclusione E ⊆ D1 , tenendo conto del fatto che An è infinitesima,
che
∞
X
Ak (z k − z k+1 ) = lim sn (z) − An z n = s(z)
∀z ∈ E .
n→∞
k=0
Quindi per ogni z ∈ E vale
n−1
∞
X
X
k
k+1
Ak (z k − z k+1 ) − An z n |s(z) − sn (z)| = Ak (z − z
)−
k=0
k=0
∞
X
=
Ak (z k − z k+1 ) − An z n ≤
k=n
∞
X
|Ak ||z k − z k+1 | + |An | .
k=n
Dato ε > 0, si fissi n0 ∈ N tale che |An | < ε per ogni n ≥ n0 . Si ha allora, per n ≥ n0 e z ∈ E,
|s(z) − sn (z)| ≤ ε
∞
X
∞
X
|z k − z k+1 | + 1 ≤ ε
|z k − z k+1 | + 1 .
k=n
k=0
Restringiamoci ora a z ∈ S1,θ con θ < π/2. Poiché i punti di S1,θ , tranne il punto 1, hanno modulo
strettamente minore di 1, si ha

∞
∞
0
se z = 1 ,
X
X
k
k+1
k
|z − z
|=
|1 − z||z| = |1 − z|

se z ∈ S1,θ \ {1} .
k=0
k=0
1 − |z|
Dunque, per n ≥ n0 ,
sup |s(z) − sn (z)| ≤ ε 1 +
z∈S1,θ
|1 − z| .
z∈S1,θ \{1} 1 − |z|
sup
La dimostrazione è conclusa se si mostra che questo estremo superiore è finito. Allora abbiamo,
nelle coordinate usate per specificare S1,θ , che |1 − z| vale r, mentre
|z| =
p
r2
1 + r2 + 2r cos ϕ ≤ 1 +
+ r cos ϕ .
2
11. ESERCIZI
161
Quindi per z ∈ S1,θ \ {1} vale
r
r
1
1 − |z| ≥ |1 − z|(− − cos ϕ) ≥ |1 − z|(− − cos(π + θ)) ≥ − |1 − z| cos(π + θ) ,
2
2
2
da cui possiamo concludere che l’estremo superiore si maggiora con 2(cos θ)−1 (si noti che la stima
degenera quando θ ↑ π/2).
10. Alcune serie notevoli
Elenchiamo alcune serie di potenze (centrate in 0) di particolare rilevanza, con l’espressione della
funzione somma e il relativo raggio di convergenza.
Tabella 1. Alcune serie di uso frequente
∞
X
1 n
x
n!
n=0
1
∞
X
2
n=0
ex
∞
sin x
∞
cos x
∞
sinh x
∞
cosh x
∞
log(1 + x)
1
1+x
1−x
1
(−1)n 2n+1
x
(2n + 1)!
∞
X
(−1)n 2n
x
(2n)!
n=0
3
∞
X
4
n=0
1
x2n+1
(2n + 1)!
∞
X
5
n=0
1
x2n
(2n)!
∞
X
(−1)n−1 n
x
n
n=1
6
∞
X
7
n=1
1
x2n+1
2n + 1
1
2
log
8
∞
X
(−1)n 2n+1
x
2n
+1
n=1
arctg x
1
9
∞ X
α n
x
n
n=0
(1 + x)α
1 (α 6∈ N)
arcsin x
1
10
∞
X
n=0
2n
1
x2n+1
(2n + 1)4n n
11. Esercizi
Esercizio 6.1.
Siano
1
, n ∈ N,
1 + (x − n)2
si mostri che la successione di funzioni fn converge puntualmente ma non uniformemente su R.
fn (x) =
11. ESERCIZI
162
Esercizio 6.2.
Siano
(
1
fn (x) =
0
se n ≤ x ≤ n + 1,
altrimenti,
si mostri che la successione di funzioni fn converge puntualmente a zero, converge uniformemente
su ogni insieme della forma (−∞, a] ma non su tutto R.
Esercizio 6.3.
Si dica se la successione di funzioni
x
n
converge puntualmente in ogni punto di [0, π] e si dica se la convergenza è uniforme.
Si dica se la successione di funzioni
x n
fn (x) = 1 − cos
n
converge puntualmente in ogni punto di [0, 2π] e se la convergenza è uniforme.
fn (x) = n sin
Esercizio 6.4.
Data f : R → R continua in 0, siano
x
, n ∈ N∗ .
n
Si studino le proprietà di convergenza puntuale e uniforme di fn .
fn (x) = f
Esercizio 6.5.
Data f : R → R con limx→−∞ f (x) = A, limx→+∞ f (x) = B, siano
fn (x) = f (nx),
n ∈ N∗ .
Si studino le proprietà di convergenza puntuale e uniforme di fn
Esercizio 6.6.
Data f : R → R continua, se la famiglia di funzioni
fn (x) = f (nx),
n ∈ N∗ ,
è equicontinua su [0, 1] cosa si può dire su f ?
Esercizio 6.7.
Data f : R → R, siano
1
fn (x) = f x +
.
n
Si mostri che se f è continua, allora fn → f puntualmente, per n → ∞.
Si mostri che se f è uniformemente continua, allora fn → f uniformemente, per n → ∞.
Esercizio 6.8.
Sia fn : I → R una successione di funzioni tale che fn → f uniformemente e f : I → R è continua.
Si provi che se x, xn ∈ I e xn → x allora limn→∞ fn (xn ) = f (x).
Si dica se la conclusione vale assumendo la convergenza solo puntuale, inoltre si discuta se vale il
viceversa, cioè assumendo che la conclusione valga per ogni x ∈ I e xn → x si ha che la convergenza
fn → f è uniforme.
11. ESERCIZI
163
Esercizio 6.9.
Siano
x
, ∀n ∈ N .
1 + nx2
Si mostri che fn → 0 uniformemente su R, per n → ∞, ma fn0 converge per ogni x ∈ R ma non
sempre a zero.
fn (x) =
Esercizio 6.10.
Si provi che ogni funzione continua su [a, b] è limite uniforme di una successione di funzioni continue
affini a tratti.
Esercizio 6.11 (Inf–Convoluzione).
Sia (X, d) uno spazio metrico e f : X → R ∪ {+∞} semicontinua inferiormente e limitata dal basso.
Si definiscano le funzioni
fn (x) = inf {f (y) + nd(x, y)}
y∈X
e si mostri che la successione fn è una successione crescente di funzioni Lipschitziane convergente
puntualmente a f .
Esercizio 6.12 (Teorema del Dini). F
Sia K ⊂ R un compatto e sia fn una successione di funzioni continue su K, convergente puntualmente ad una funzione f continua su K. Si mostri che se fn ≥ fn+1 , la convergenza è uniforme su
K.
Si esibiscano degli esempi che mostrino che le ipotesi di monotonia, continuità e compattezza di K
non possono essere eliminate.
Esercizio 6.13. F
Sia fn una successione di funzioni monotone non decrescenti su [a, b] che converga puntualmente
ad una funzione continua su [a, b]. Si mostri che la convergenza è uniforme su [a, b].
Si esibiscano degli esempi che mostrino che le ipotesi di monotonia, continuità e compattezza
dell’intervallo [a, b] non possono essere eliminate.
Esercizio 6.14 (Teorema di Selezione di Helly). F
Sia fn : I → R una successione di funzioni monotone non decrescenti su un intervallo I ⊆ R, uniformemente limitate dall’alto e dal basso, si provi che esiste una funzione monotona non decrescente
f : I → R e una successione ni ∈ N tale che f (x) = limi→∞ fni (x) per ogni x ∈ I.
Esercizio 6.15. F
Sia fn : R → R una successione di funzioni continue che converge puntualmente ad una funzione
f . Si dimostri che l’insieme dei punti di discontinuità di f è un insieme di prima categoria. Se ne
deduca che la funzione f è continua su un denso di R.
Ogni funzione f : R → R discontinua su un insieme di prima categoria è limite puntuale di una
successione di funzioni continue?
Nota. Lo spazio vettoriale delle funzioni f : R → R che sono limite puntuale di una successione di
funzioni continue si dice prima classe di Baire, la classe zero sono le funzioni continue, le classi successive si ottengono considerando i limiti puntuali di successioni di funzioni nelle classi precedenti.
Per induzione transfinita si ottengono cosı̀ tutte le classi di Baire associate agli ordinali numerabili.
Le funzioni nell’unione di tutte queste classi si dicono funzioni di Baire.
Lebesgue ha mostrato che ogni classe di Baire contiene strettamente tutte le precedenti e che ci
sono funzioni che non sono funzioni di Baire. Un esempio di una funzione nella seconda classe di
Baire ma non nella prima è dato dalla funzione caratteristica dei razionali, si veda il Problema 6.17.
11. ESERCIZI
164
Esercizio 6.16. F
Sia f : (0, 1) → R una funzione derivabile in ogni punto. Si mostri che f 0 è continua in un denso
(di seconda categoria).
Esercizio 6.17. F
Si dimostri che la funzione di Dirichlet
(
1
f (x) =
0
se x ∈ Q,
se x ∈
6 Q,
non è il limite puntuale di una successione di funzioni continue. Si mostri però che
sin2 (n!πx)
= f (x) ,
n→∞ m→∞ sin2 (n!πx) + 1/m2
lim lim
per ogni x ∈ R.
Esercizio 6.18. F
Sia pn ∈ R[x] una successione di polinomi di grado non superiore a k ∈ N, uniformemente convergente su un intervallo chiuso [a, b]. Si mostri che la funzione limite è un polinomio di grado non
superiore a k.
La stessa conclusione vale se la convergenza è solo puntuale su un intervallo qualunque?
Esercizio 6.19.
Sia fn una successione di funzioni definite su di un sottoinsieme di R a valori reali che converga
uniformemente ad una funzione f limitata. Si provi che tutte le funzioni fn sono limitate in modulo
da una stessa costante. Si dica se la stessa conclusione vale se la convergenza è solo puntuale.
Esercizio 6.20.
Sia fn una successione di funzioni definite su R a valori reali e limitate. Si supponga che fn converga
uniformemente su R a una funzione f . Si provi che
• le funzioni fn sono limitate in modulo da una stessa costante,
• per ogni funzione g continua su R, le composizioni g ◦fn convergono uniformemente a g ◦f .
Esercizio 6.21.
Sia fn : I → R una successione di funzioni uniformemente continue, convergenti uniformemente
ad una funzione f : I → R. Allora la funzione f è uniformemente continua e la famiglia {f } ∪
{fn } è equicontinua. Viceversa, se la famiglia {fn } è equicontinua e la successione fn converge
puntualmente alla funzione f : I → R, la funzione f è continua con lo stesso modulo di continuità
comune alle fn e la convergenza è uniforme.
Esercizio 6.22.
Si discuta la chiusura per convergenza puntuale o uniforme delle seguenti classi di funzioni f : I →
R, dove I è un intervallo di R (si distinguano i vari casi a seconda dell’intervallo).
• Le funzioni limitate.
• Le funzioni monotone non decrescenti.
• Le funzioni che ammettono limite destro e sinistro finiti in ogni punto.
• I polinomi e i polinomi di grado minore di n, per n ∈ N fissato.
• Le funzioni continue.
• Le funzioni continue e monotone non decrescenti.
• Le funzioni uniformemente continue.
• Le funzioni con un fissato comune modulo di continuità.
11. ESERCIZI
•
•
•
•
•
•
•
Le
Le
Le
Le
Le
Le
Le
funzioni
funzioni
funzioni
funzioni
funzioni
funzioni
funzioni
165
Lipschitziane (con o meno la stessa costante di Lipschitz).
Hölderiane (con o meno la stessa costante di Hölder).
assolutamente continue.
a variazione limitata.
che hanno la proprietà del valor intermedio.
derivabili (con o meno derivata limitata in modulo da una costante comune).
convesse.
Esercizio 6.23. F
Si mostri che, fissati un polinomio p ∈ R[x], un numero reale ε > 0 e n ∈ N, esiste una funzione
continua f : [0, 1] → [0, 1] tale che
•
sup |p(x) − f (x)| < ε ,
x∈[0,1]
• per ogni x esiste y tale che
f (x) − f (y) > n.
x−y
Se ne deduca che l’insieme
f (x) − f (y) n
o
Fn = f ∈ C([0, 1]) : esiste x ∈ [0, 1] tale che ≤ n per ogni y 6= x
x−y
è un chiuso con parte interna vuota nello spazio metrico C([0, 1]) con la norma uniforme.
Si mostri allora che l’insieme delle funzioni che non sono derivabili in nessun punto è un denso (di
seconda categoria) in tale spazio.
Esercizio 6.24.
Si mostri che per ogni C ∈ R e α ∈ (0, 1), l’insieme di funzioni continue
n
o
WC,α = f ∈ C([0, 1]) : |f (x) − f (y)| ≤ C|x − y|α per ogni x 6= y ,
è un chiuso con parte interna vuota nello spazio metrico C([0, 1]) con la norma uniforme.
Si deduca che l’insieme delle funzioni che non sono Hölderiane è un denso (di seconda categoria) in
tale spazio.
Esercizio 6.25. F
Sia W un sottospazio dello spazio metrico C([0, 1]) con la norma uniforme tale che tutti i suoi
elementi siano funzioni derivabili. Si mostri che la chiusura dell’insieme
n
o
BW (1) = f ∈ W : sup |f 0 (x)| ≤ 1 e f (0) = 0
x∈[0,1]
è un compatto.
Esercizio 6.26 (Teorema di Ascoli–Arzelà). F
Sia K uno spazio metrico compatto e sia S un sottoinsieme di C(K) con la norma uniforme. Si
mostri che S è compatto se e solo se è chiuso e consiste di una famiglia di funzioni puntualmente
equilimitate ed equicontinue.
Esercizio
P 6.27.
P∞
Siano ∞
n=0 fn (x) e
n=0 gn (x) due serie di funzioni fn , gn : X → R totalmente convergenti (una
11. ESERCIZI
166
P
P∞
serie di funzioni ∞
n=0 supx∈X |fn (x)|
n=0 fn (x) si dice totalmente convergente se la serie numerica
converge). Si provi che allora anche le serie di funzioni
∞
X
fn (x) + gn (x) ,
n=0
∞
X
fn (x)gn (x),
n=0
X
fn (x)gm (x)
n,m∈N
convergono totalmente.
Esercizio 6.28.
Sia E ⊆ R e siano fn , gn : E → R e
P
• la serie di funzioni ∞
n=0 fn (x) ha somme parziali uniformemente limitate in E,
• gn (x) → 0 uniformemente su E,
• si ha g1 (x) ≥ g2 (x) ≥ g3 (x) ≥ . . . per ogni x ∈ E.
P
Si provi che allora la serie di funzioni ∞
n=0 fn (x)gn (x) converge uniformemente su E.
Esercizio 6.29.
Sia
(
fn (x) =
1
n
0
per n ≤ x < n + 1
altrove.
P∞
Si mostri che la serie di funzioni n=1 fn (x) è assolutamente convergente e uniformemente convergente su R, ma non è totalmente convergente.
Esercizio 6.30.
Si trovino le discontinuità della funzione f definita dalla serie di funzioni
∞
X
f (x) =
{nx}/n2
n=1
e si provi che formano un denso numerabile di R (con {·} indichiamo la parte frazionaria di un
numero reale).
Esercizio 6.31.
P
3
Si mostri che la serie di funzioni ∞
n=1 [nx]/n converge uniformemente su ogni intervallo limitato
ad una funzione f continua in ogni punto irrazionale, e tale che se a = p/q, con p, q interi primi tra
loro e q > 0, si ha
∞
1 X 1
lim f (x) − lim f (x) = 3
x→a+
x→a−
q
k3
k=1
(con [·] indichiamo la parte intera di un numero reale).
Esercizio 6.32.
Si mostri che la serie di funzioni
∞
X
sin(2n πx)
n=0
2n
non può essere differenziata termine a termine.
Esercizio 6.33.
Si studi la convergenza semplice e uniforme delle serie di funzioni
∞
∞
X
X
sin nx
cos nx
,
.
n
n
n=1
n=1
11. ESERCIZI
Esercizio 6.34.
Sia
(
0
I(x) =
1
167
per x ≤ 0,
per x > 0,
si mostri che se xn è una successione di punti distinti nell’intervallo (a, b) e se
allora la serie di funzioni
∞
X
f (x) =
cn I(x − xn )
P∞
n=0 |cn |
converge,
n=0
converge uniformemente in (a, b) e f è continua in tutti i punti x 6∈ {xn }n∈N .
Esercizio 6.35.
Si consideri la serie di funzioni
∞
X
n
sin (nx) .
2n
n=0
• Si mostri che la sua somma f è una funzione di classe C ∞ .
• Si indichi una procedura per trovare, dati ε, R > 0, un polinomio P (x) tale che |f (x) −
P (x)| < ε per ogni x ∈ [−R, R].
• Si determini la funzione f .
Esercizio 6.36 (Una Curva che Riempie lo Spazio). F
Sia f : R → R una funzione continua tale che 0 ≤ f (t) ≤ 1, f (t + 2) = f (t) per ogni t ∈ R e
(
0 per t ∈ [0, 1/3],
f (t) =
1 per t ∈ [2/3, 1].
Si ponga γ(t) = x(t), y(t) dove
x(t) =
∞
X
2−n f (32n−1 t),
n=1
y(t) =
∞
X
2−n f (32n t) ,
n=1
e si provi che la curva γ è continua e mappa l’intervallo I = [0, 1] sul quadrato unitario I 2 ⊂ R2
surgettivamente. Più precisamente l’immagine per la curva γ dell’insieme di Cantor è tutto il
quadrato unitario del piano euclideo.
Esercizio 6.37.
Si determini il raggio di convergenza e (se possibile) la funzione somma delle seguenti serie di
potenze:
∞
∞
∞
∞
n
X
X
X
X
xn
n k n
nx
,
(−1)
n
x
,
(−1)
,
nk xn ,
nk
nk
n=0
n=1
n=0
n=1
dove x ∈ R e k ∈ N∗ .
Esercizio 6.38.
Si consideri la seguente funzione (ipergeometrica):
∞
X
a(a + 1) . . . (a + n − 1) · b(b + 1) . . . (b + n − 1) n
I(a, b, c, z) = 1 +
z ,
n! · c(c + 1) . . . (c + n − 1)
n=1
con a, b, c ∈ R, c 6= 0, −1, −2, . . . e z ∈ C.
Si stabilisca il raggio di convergenza e si studi la convergenza assoluta sulla circonferenza del disco
di convergenza.
11. ESERCIZI
168
Esercizio 6.39.
Si determini il raggio di convergenza delle seguenti serie di potenze:
x+
∞
X
1 · 3 · 5 . . . (2n − 1)
n=1
x+
∞
X
(−1)n ·
n=1
2 · 4 · 6 . . . (2n)
·
x2n+1
,
2n + 1
1 · 3 · 5 . . . (2n − 1) x2n+1
·
.
2 · 4 · 6 . . . (2n)
2n + 1
Si calcoli la somma delle precedenti serie per x ∈ R, e si deduca che
1+
√
1·3 1 1·3·5·7 1
π 1
· +
· + · · · = + log(1 + 2) .
2·4 5 2·4·6·8 9
4 2
Esercizio 6.40.
P
n
Si trovi una serie di potenze y(x) = ∞
n=0 an x che risolva l’equazione di Bessel
xy 00 + y 0 + xy = 0 .
Esercizio 6.41.
P
n
Si determini una serie di potenze y(x) = ∞
n=0 an x che risolva in un intorno di x = 0 il problema
y 0 + x2 y = 1,
y(0) = 0,
Esercizio 6.42.
Si mostri che la funzione
f (x) =
∞
X
n=1
y 0 (0) = 1 .
xn
(n − 1)!
soddisfa la relazione xf 0 (x) = (x + 1)f (x).
Esercizio 6.43.
Si dimostri che esiste una e una sola funzione continua f sull’intervallo [0, 1] tale che
x
f (x) = 1 + f (x2 ) .
2
Si dimostri che f è rappresentabile su [0, 1] come somma di una serie di potenze centrata in 0.
Esercizio 6.44. F P
n
Una funzione f (x) = ∞
n=0 an x , analitica in un intorno di 0 ∈ R, soddisfa sul suo dominio le
condizioni
(
f 0 (x) = 1 + f (−x) ,
f (0) = a .
Si determini la funzione f e si provi che la funzione trovata è l’unica funzione derivabile in un
intorno di zero del sistema.
Esercizio 6.45 (Teorema di Stone–Weierstrass). F
Si mostri che per ogni intervallo chiuso e limitato [a, b] ⊆ R, i polinomi sono densi in C([a, b]) con
la . Se ne deduca che C([a, b]) è uno spazio metrico separabile.
Esercizio 6.46 (Teorema della Mappa Aperta). FF
Siano (V1 , k·k1 ) e (V2 , k·k2 ) due spazi di Banach, si mostri che una applicazione lineare A : V1 → V2
continua e bigettiva ha inversa continua.
11. ESERCIZI
169
Esercizio 6.47. F
Sia (X, d) uno spazio metrico completo e F una famiglia di funzioni continue da X in R tale che
per ogni x ∈ X, l’insieme {f (x) : f ∈ F} sia limitato. Si mostri che esiste un aperto di X su cui
le funzioni di F sono equilimitate.
Esercizio 6.48 (Principio di Uniforme Limitatezza). F
Siano (V1 , k · k1 ) uno spazio di Banach e (V2 , k · k2 ) uno spazio normato, se una famiglia F di
applicazioni lineari continue tra V1 e V2 ha la proprietà che per ogni x ∈ X, l’insieme {kA(x)k2 :
A ∈ F} è limitato, allora F è una famiglia di applicazioni Lipschitziane con la stessa costante, in
particolare sono equicontinue.
Esercizio 6.49.
√
P
n z n al variare di a > 0.
Si discuta la convergenza della serie di potenze ∞
n=0 a
Esercizio P
6.50. F
n
Sia f (x) = ∞
n=0 an z con an ∈ {0, 1}. Si mostri che il raggio di convergenza è maggiore o uguale
a 1 e che se f (1/2) ∈ Q allora f è una funzione razionale.
Esercizio 6.51.
Si trovi il raggio di convergenza e la somma della serie di potenze
∞
X
xn
.
n(n + 1)
n=1
Esercizio 6.52.
P
n
Si mostri che una serie di potenze ∞
n=0 an z ha raggio di convergenza positivo se e solo se esiste
n
una costante C tale che |an | ≤ C per ogni n ∈ N.
Esercizio 6.53.
Date due serie di potenze
f (z) =
∞
X
an z n ,
g(z) =
n=0
∞
X
bn z n ,
an , bn ∈ R,
n=0
con raggio
rispettivamente
R1 e R2 , si mostri che la serie prodotto secondo Cauchy
P di convergenza
Pn
n , dove c =
a
b
h(z) = ∞
c
z
n
n=0 n
k=0 k n−k , ha raggio di convergenza R ≥ min{R1 , R2 } e si ha
h(z) = f (z)g(z) all’interno del disco di convergenza.
Esercizio
P∞ 6.54.
n
Sia
P∞ n=0nan z una serie di potenze, si mostri che se a0 6= 0 si puó trovare una serie di potenze
di Cauchy sia la serie identicamente costante uguale a 1. Si
n=0 bn z tale che il loro prodotto P
n
mostri che se inoltre laPserie f (z) = ∞
n=0 an z , con a0 6= 0, ha raggio di convergenza R > 0 allora
∞
n
anche la serie g(z) = n=0 bn z ha raggio di convergenza positivo e in un intorno di 0 ∈ C vale
g(z) = 1/f (z).
Esercizio 6.55.
Date due serie di potenze
f (z) =
∞
X
n=0
n
an z ,
g(z) =
∞
X
bn z n ,
an , bn ∈ R,
n=0
con raggio di convergenza
rispettivamente R1 , R2 > 0 e valga g(0) = 0. Si mostri che la serie di
P
n , composta formale di f e g, ha raggio di convergenza positivo e vale
potenze h(z) = ∞
c
z
n
n=0
h(z) = (f ◦ g)(z).
11. ESERCIZI
170
Esercizio
6.56. FF
P
a
xn una serie
per x ∈ R, si mostri che se a0 = 0 e a1 6= 0 si puó trovare
Sia ∞
n
n=0
P di potenze
n tale che la loro serie composta formale sia la serie identicamente
una serie di potenze ∞
b
x
n=0 n
P
n
uguale a x. Si mostri che sePinoltre la serie f (x) = ∞
n=0 an x ha raggio di convergenza R > 0
∞
n
allora anche la serie g(x) = n=0 bn x ha raggio di convergenza positivo e in un intorno di 0 ∈ R
vale g(x) = f −1 (x).
Esercizio 6.57. FF
Sia f : R → R una funzione analitica in un intorno di 0 con raggio di convergenza R > 0 e tale
che f (0) = 0 e f 0 (0) 6= 0, dal problema precedente segue che allora f ha un’inversa f −1 anch’essa
analitica in un intorno di zero. Se la funzione f è bigettiva e ha raggio di convergenza R = +∞,
anche la funzione f −1 ha raggio di convergenza uguale a +∞?
Esercizio 6.58. F
P∞
Data una successione
an ∈ R tale che an → 0 e
n=0 |an − an+1 | sia convergente, si dimostri
P∞
n converge per |z| ≤ 1, eccetto al più z = 1 e la convergenza è uniforme in
a
z
che
f
(z)
=
n=0 n
z ∈ C : |z| ≤ 1, |z − 1| ≥ δ , per ogni δ > 0.
Si provi inoltre che limz→1− (1 − z)f (z) = 0.
Esercizio 6.59.
Sia f : [0, 1] → R una funzione C ∞ tale che f (n) (0) = 0 per ogni n ∈ N e
sup |f (n) (x)| ≤ n!C ,
x∈[0,1]
per una costante C ∈ R. Si mostri che f = 0 in [0, 1].
Esercizio 6.60.
P
n
Sia f (x) = ∞
n=0 an x una serie di potenze con raggio di convergenza positivo tale che f (0) =
n è estendibile
f 0 (0) = · · · = f (n) (0), per n ∈ N. Si mostri che la funzione definita da g(x)
P∞= f (x)/x
n
in x = 0 e tale estensione coincide con una serie di potenze g(x) = n=0 bn x . Che raggio di
convergenza ha tale serie?
Esercizio 6.61. F
Si dimostri che se f ∈ C ∞ (R) e per ogni n ∈ N e ogni x ∈ R si ha f (n) (x) ≥ 0, allora la funzione f
è analitica.
CAPITOLO 7
CALCOLO DIFFERENZIALE IN PIÙ VARIABILI
Si danno per note le nozioni fondamentali di algebra lineare, in particolare le nozioni di spazio
vettoriale, trasformazione lineare, base.
1. Derivate parziali e direzionali
Consideriamo una funzione f definita su un insieme A ⊆ Rn a valori reali.
Definizione 7.1 (Derivata parziale). Sia x = (x1 , . . . , xn ) un punto interno ad A. Si chiama
derivata parziale di f in x nella variabile xj la derivata in 0, se esiste, della funzione di una
variabile
g(t) = f (x1 , . . . , xj−1 , xj + t, xj+1 , . . . , xn ) ,
cioè si pone
f (x1 , . . . , xj−1 , xj + h, xj+1 , . . . , xn ) − f (x)
∂f
(x) = lim
,
h→0
∂xj
h
se questo limite esiste finito.
Non esiste un’unica notazione in letteratura per le derivate parziali, anzi ne coesistono molte: a
seconda della convenienza useremo anche la notazione ∂xj f (x), o anche ∂j f (x).
Il calcolo della derivata parziale nella variabile xj si effettua dunque “congelando” le variabili diverse
dalla j–esima e considerando variabile solo la variabile xj . Ad esempio
∂
sin(x2 y) = 2xy cos(x2 y) ,
∂x
∂
sin(x2 y) = x2 cos(x2 y) .
∂y
La definizione di derivata direzionale è più generale e ha il vantaggio di essere indipendente dal
sistema di coordinate.
Definizione 7.2 (Derivata direzionale). Siano f , A e x come sopra. Dato v ∈ Rn , si chiama
derivata direzionale di f rispetto a v in x la derivata in 0, se esiste, della funzione di una variabile
g(t) = f (x + tv), cioè si pone
∂v f (x) = lim
t→0
f (x + tv) − f (x)
,
t
se questo limite esiste finito.
La derivata ∂0 f (x) esiste e vale 0, qualunque sia f . È immediato verificare che
(1.1)
∂λv f (x) = λ∂v f (x)
∀λ ∈ R ,
nel senso che se esiste la derivata a destra, esiste quella a sinistra e sono legate da questa relazione
lineare.
171
2. DIFFERENZIALE
172
Ovviamente, se ej = (0, . . . , 1, . . . , 0) è il versore j–esimo della base canonica di Rn ,
∂ej f (x) =
∂f
(x) .
∂xj
Vediamo l’interpretazione grafica della derivata direzionale, per v ∈ Rn non nullo. Consideriamo il
piano affine 2–dimensionale “verticale” π ⊆ Rn ×R passante per P = (x, 0) e parallelo al sottospazio
generato dai due vettori w1 = (v, 0) e w2 = (0, 1), vale a dire
π = {P + tw1 + yw2 : t, y ∈ R} .
Intersecando π con il grafico di f
(1.2)
Gf =
x, f (x) : x ∈ A ⊆ A × R
si ottiene l’insieme di punti
{P + tw1 + f (x + tv)w2 : t ∈ R} ⊆ π
che corrisponde al grafico y = f (x + tv), nelle variabili (t, y) che parametrizzano il piano π. Se poi
v è un versore, cioè |v| = 1, le coordinate (t, y) sul piano π inducono proprio la distanza euclidea e
∂v f (x) rappresenta il coefficiente angolare della tangente al grafico.
Si osservi, che a differenza di quanto succede con funzioni di una variabile, l’esistenza di tutte le
derivate parziali o direzionali di una funzione in un punto non implica la continuità nel punto stesso.
La funzione (8.1) del Capitolo 5, che è discontinua nell’origine, ha tutte le derivate direzionali, uguali
a 0, in quel punto.
2. Differenziale
Per funzioni f : I ⊆ R → R di una variabile, le due seguenti proprietà sono equivalenti:
(i) f è derivabile in un punto x interno a I;
(ii) esiste una funzione lineare g(h) = ah che approssimi l’incremento di f da x a x + h a
meno di un infinitesimo superiore al primo, cioè tale che f (x + h) − f (x) = g(h) + o(h)
per h → 0.
Dividendo per h si verifica anche facilmente che, quando queste condizioni sono verificate, la costante
a è univocamente determinata ed è uguale a f 0 (x0 ).
Proviamo a riformulare le due proprietà per funzioni f : A ⊆ Rn → R di più variabili nel modo
seguente:
(i’) f ha tutte le derivate direzionali in un punto x interno a A;
(ii’) esiste una funzione lineare da Rn a R, g(h) = a1 h1 + · · · + an hn = a · h, che approssimi
l’incremento di f da x a x + h a meno di un infinitesimo superiore al primo, cioè tale che
(2.1)
f (x + h) − f (x) = g(h) + o |h|
(h → 0) .
Ponendo h = tv, con v fissato, dividendo per t e prendendo il limite per t → 0 si vede che che (ii’)
implica (i’) e che
∂v f (x) = g(v)
∀v ∈ Rn .
Infatti
f (x + tv) − f (x) = ta · v + o |tv| = tg(v) + o(t) ,
da cui
f (x + tv) − f (x)
lim
= g(v) .
t→0
t
2. DIFFERENZIALE
173
Quindi, se esiste una funzione lineare g che soddisfi (ii’), questa è univocamente determinata dalle
derivate direzionali di f lungo una base di Rn . D’altro canto, siccome g è continua in 0, la condizione
(ii’) implica anche che
lim f (x) = f (x) ,
x→x
cioè che f è continua in x. Tuttavia, come già osservato in precedenza, l’esempio (8.1) del Capitolo 5
(la funzione non nulla solo nella regione x2 < y < 3x2 ) mostra che la (i’) non implica la continuità
di f in x, e dunque le condizioni (i’) e (ii’) non sono equivalenti, si veda anche l’esempio (2.2).
Possiamo quindi formalizzare la (ii’) in una definizione.
Definizione 7.3 (Differenziabilità in un punto). Siano A ⊆ Rn e x interno ad A. Si dice
che f : A −→ R è differenziabile in x se esiste una funzione lineare g di Rn in R per cui valga la
formula (2.1).
Per quel che abbiamo detto in connessione a (i’) e (ii’), vale il seguente teorema.
Teorema 7.4 (Differenziabilità implica continuità, esistenza di ∂v f e linearità in v). Sia
f : A ⊆ Rn → R differenziabile in un punto interno x ∈ A. Allora
(i) f è continua in x;
(ii) f ammette derivate direzionali rispetto a ogni vettore v ∈ Rn e esiste a ∈ Rn tale che
∀v ∈ Rn .
∂v f (x) = a · v
In particolare, scegliendo v tra i vettori coordinati ej , vale
∂f
(a) per ogni j = 1, . . . , n,
(x) = aj ;
∂xj
(b) la funzione lineare g(h) = a · h per cui vale la (2.1) è unica.
Il seguente esempio mostra che la combinazione di (i’) e continuità non è ancora sufficiente per la
differenziabilità. Lo otteniamo con una piccola variante dell’esempio (8.1).
Esempio. Consideriamo la funzione


se y ≥ 3x2 o y ≤ x2 ;
0
p
(2.2)
f (x, y) =
y − x2
se x2 < y ≤ 2x2 ;
p


|x| − y − 2x2 se 2x2 < y < 3x2 .
p
Dato che |f (x, y)| ≤
|x|, f è continua in (0, 0). D’altro canto, tutte le derivate direzionali
in (0, 0) sono nulle, quindi se f fosse ivi differenziabile dovrebbe essere f (x, y) = o(|(x, y)|) per
(x, y) → (0, 0). Ma sul grafico y = 2x2 questo non succede.
La condizione di differenziabilità in un punto consente, note le derivate parziali nel punto (o, più
in generale, note le derivate direzionali rispetto ai vettori di una base di Rn ), di determinare tutte
le altre derivate direzionali. Infatti, se v = (v1 , . . . , vn ) = v1 e1 + · · · + vn en ,
∂v f (x) =
n
X
j=1
vj
∂f
(x) .
∂xj
In altri termini, i valori delle derivate direzionali sono “vincolati” ai valori delle derivate parziali.
Questo non succede in generale se la funzione, pur avendo tutte le derivate direzionali in un punto,
non è ivi differenziabile, come mostra l’esempio seguente.
2. DIFFERENZIALE
174
Esempio. Consideriamo la funzione f : R2 → R definita da

2
 x y
se (x, y) 6= (0, 0) ,
f (x, y) = x2 + y 2

0
se (x, y) = (0, 0) .
Dato che |f (x, y)| ≤ |y|, f è continua in (0, 0). Se la restringiamo a una retta y = λx otteniamo
f (x, λx) =
λx
1 + λ2
quindi la derivata nell’origine di f lungo la direzione v = (1, λ) vale λ/(1 + λ2 ). Nella direzione
verticale v = (0, 1), la derivata di f vale 0. Si noti, più in generale, che
v 7→ ∂v f (0, 0) =
v12 v2
v12 + v22
è 1–omogenea in R2 (proprietà sempre vera osservata nella relazione (1.1)), ma non lineare, quindi
f non può essere differenziabile in (0, 0).
Con il cambiamento di variabile x = x + h, si ottiene la formula seguente.
Corollario 7.5. Sia f : A ⊆ Rn → R dotata di derivate parziali in un punto x interno a A.
Allora f è differenziabile in x se e solo se ammette lo sviluppo al primo ordine per x → x
(2.3)
f (x) = f (x) +
n
X
∂f
(x)(xj − xj ) + o |x − x|
∂xj
(x → x) .
j=1
Definizione 7.6 (Gradiente, differenziale, iperpiano tangente).
• Il vettore
∂f
∂f
∇f (x) =
(x), . . . ,
(x) ∈ Rn
∂x1
∂xn
si chiama gradiente di f in x.
• L’applicazione lineare
(2.4)
dx f (h) = ∇f (x) · h
si chiama il differenziale di f in x.
• L’iperpiano di Rn+1 , con coordinate (x1 , . . . , xn , y), di equazione
y = f (x) + ∇f (x) · (x − x)
si chiama iperpiano tangente (spesso anche “piano tangente”) al grafico Gf di f definito
dalla (1.2) nel punto (x, f (x)).
Anche se grazie al teorema di Riesz le applicazioni lineari da Rn in R possono essere identificate con
vettori, è bene tenere concettualmente distinta la nozione di differenziale, che non dipende dalla
scelta delle coordinate, dal vettore che lo rappresenta come nella formula (2.4) in un dato sistema
di coordinate mediante il prodotto scalare, i.e. il gradiente.
Quando f è differenziabile in x, il piano tangente in x è l’unione delle rette tangenti ai grafici
ottenuti su ciascun piano (bidimensionale) verticale passante per (x, 0) intersecandolo con il grafico
di f .
Definizione 7.7 (Punti stazionari). Un punto x in cui una funzione f : A ⊆ Rn → R è
differenziabile si dice stazionario se ∇f (x) = 0.
3. IL TEOREMA DEL DIFFERENZIALE TOTALE
175
Questo equivale a dire che tutte le derivate direzionali in x sono nulle, o anche che il piano tangente
al grafico in x è orizzontale (cioè di equazione y =costante).
Proposizione 7.8. Sia f : A ⊆ Rn → R differenziabile in un punto interno x e supponiamo che x
non sia stazionario. Possiamo allora scrivere
∇f (x) = |∇f (x)|v0 ,
dove v0 è il versore di ∇f (x). Al variare di v tra i versori di Rn , la derivata direzionale ∂v f (x)
assume valore massimo per v = v0 , e ∂v0 f (x) = |∇f (x)|.
Dimostrazione. Per ogni versore v,
∂v f (x) = ∇f (x) · v = |∇f (x)|(v0 · v) .
Per la disuguaglianza di Cauchy–Schwarz (Teorema 5.2 del Capitolo 5), |v0 · v| ≤ 1 e vale l’uguaglianza se e solo se v = ±v0 . Ma allora v0 · v assume valore massimo, uguale a 1, se e solo se
v = v0 .
Possiamo dire che ∇f (x) indica la direzione di “massima pendenza” del grafico di f in x̄, e il suo
verso quello di “massima crescita”.
3. Il teorema del differenziale totale
Il teorema che presentiamo fornisce condizioni sufficienti per la differenziabilità di una funzione
in un punto. Esso è utile sia per gli sviluppi teorici che nel calcolo concreto con funzioni di più
variabili.
Teorema 7.9 (Teorema del differenziale totale). Sia f : A ⊆ Rn → R dotata di derivate parziali in un intorno di un punto x ∈ A. Se tali derivate sono continue in x, allora f è differenziabile
in x.
Dimostrazione. Per valutare l’incremento f (x)−f (x) seguiremo una spezzata, come in figura.
6
(x1 , x2 )
•
(t1 , x2 )
•
•
(x1 , x2 )
(x1 , t2•)
(x1 , x2•)
-
È quindi comodo supporre che l’intorno di x su cui esistono le derivate parziali di f sia un cubo
Qr (x) = x + (−r, r)n . Dimostriamo che vale la formula (2.3) partendo dall’uguaglianza, per x ∈
3. IL TEOREMA DEL DIFFERENZIALE TOTALE
176
Qr (x),
(3.1)
f (x) − f (x) = f (x1 , x2 , . . . , xn−1 , xn ) − f (x1 , x2 , . . . , xn−1 , xn )
+ f (x1 , x2 , . . . , xn−1 , xn ) − f (x1 , x2 , . . . , xn−1 , xn )
···
+ f (x1 , x2 , . . . , xn−1 , xn ) − f (x1 , x2 , . . . , xn−1 , xn )
= ∆1 (x) + ∆2 (x) + · · · + ∆n (x) .
Per ogni j = 1, . . . , n, la differenza ∆j (x) rappresenta l’incremento da xj a xj della funzione di una
variabile
hj (t) = f (x1 , . . . , xj−1 , t, xj+1 , . . . , xn ) .
Per ipotesi, hj è derivabile su un intervallo aperto contenente xj e xj e
h0j (t) =
∂f
(x1 , . . . , xj−1 , t, xj+1 , . . . , xn ) .
∂xj
Applicando il teorema di Lagrange, otteniamo che esiste tj = tj (x), strettamente compreso tra xj
e xj , tale che
∂f
∆j (x) =
(x1 , . . . , xj−1 , tj , xj+1 , . . . , xn ) (xj − xj ) .
∂xj
Essendo le derivate parziali continue in x, dato ε > 0, esiste δ ∈ (0, r] tale che
∂f
∂f
ε
y ∈ Qδ (x) =⇒ (y) −
(x) <
∀j = 1, . . . , n .
∂xj
∂xj
n
Dato che lavoriamo su un cubo, per x ∈ Qδ (x), anche i punti yj = (x1 , . . . , xj−1 , tj , xj+1 , . . . , xn )
sono in Qδ (x). Quindi
∂f
ε
ε
(3.2)
j = 1, . . . , n ,
(x)(xj − xj ) < |xj − xj | ≤ |x − x|
∆j (x) −
∂xj
n
n
per x ∈ Qδ (x). Sommando le n disuguaglianze in (3.2) e tenendo conto della (3.1) otteniamo
|f (x) − f (x) −
n
X
∂f
(x)(xj − xj )| ≤ ε|x − x|
∂xj
∀x ∈ Qδ (x) .
j=1
Definizione 7.10 (Funzioni di classe C 1 ). Una funzione f reale definita su un aperto A ⊆
Rn si dice di classe C 1 su A se ammette le derivate parziali in ogni punto di A e le funzioni
∂f /∂x1 , . . . , ∂f /∂xn sono continue su A.
Chiaramente una funzione di classe C 1 su un aperto A è continua in A e la funzione
∇f : A −→ Rn
è pure continua su A.
Definizione 7.11 (Campo vettoriale e potenziale). Sia A ⊆ Rn aperto. Una funzione F :
A −→ Rn si dice un campo vettoriale su A. Una funzione V : A −→ R è detta potenziale di F se
F = ∇V su A.1
1In Fisica, se F = −∇V .
4. CURVE REGOLARI IN Rn
177
4. Curve regolari in Rn
Sia I ⊆ R un intervallo chiuso e limitato, e γ = (γ1 , . . . , γn ) : I −→ Rn una curva.
Definizione 7.12 (Vettore tangente e curve regolari). Se ogni componente γ1 , . . . , γn di γ è
derivabile in t ∈ I, il vettore
γ 0 (t) = γ10 (t), . . . , γn0 (t)
si chiama vettore tangente a γ in t.
La curva γ si dice regolare su I se ciascuna componente di γ è di classe C 1 in I e il vettore tangente
non si annulla in I.
Si noti che non ha senso parlare di “vettore tangente a γ in un punto x del sostegno” quando la
curva non è semplice. È possibile che x = γ(t1 ) = γ(t2 ), ma γ 0 (t1 ) 6= γ 0 (t2 ). Anche per questo
motivo il riferimento alla parametrizzazione della curva è essenziale.
Applicando lo sviluppo espresso nella (2.1) a ogni componente γj di γ, si ottiene l’enunciato
seguente.
Lemma 7.13. Siano γ : I −→ Rn una curva regolare, t ∈ I, x = γ(t), v = γ 0 (t). La retta
parametrica r(h) = x + hv è l’unica che soddisfi la condizione
γ(t + h) = r(h) + o(h)
(h → 0) .
Sia ora f una funzione di classe C 1 su un aperto A e sia γ : I −→ A una curva regolare con sostegno
contenuto in A. Allora la composizione f ◦ γ : I −→ R è derivabile in I e la seguente formula per
il calcolo della derivata, la cosiddetta “chain rule”.
Proposizione 7.14 (Regola di derivazione della funzione composta). La funzione f ◦ γ è
derivabile in ˚
I e
(f ◦ γ)0 (t) =
n
X
∂f
γ(t) γj0 (t) = ∇f (γ(t)) · γ 0 (t)
∂xj
◦
∀t ∈ I .
j=1
Analogo enunciato vale agli estremi di I.
Dimostrazione. Siano t ∈ ˚
I, x = γ(t) ∈ A. Per il Corollario 7.5,
(x → x) .
f (x) = f (x) + ∇f (x) · (x − x) + o |x − x|
Sostituendo x = γ(t + h) e usando il Lemma 7.13, si ha, per h → 0,
f ◦ γ(t + h) = f x + hγ 0 (t) + o(h)
= f (x) + ∇f (x) · hγ 0 (t) + o(h) + o hγ 0 (t) + o(h) .
Essendo
0
hγ (t) + o(h) ≤ |h||γ 0 (t)| + o(h) = O(h)
(h → 0) ,
l’ultimo termine è o(h), e dunque
f ◦ γ(t + h) = f ◦ γ(t) + h∇f (x) · γ 0 (t) + o(h) .
4. CURVE REGOLARI IN Rn
178
Definizione 7.15 (Lunghezza e parametrizzazione per lunghezza d’arco). La lunghezza
`(γ) di una curva regolare γ : [a, b] → Rn è definita da2
Z b
|γ 0 (s)| ds .
`(γ) :=
a
Una curva regolare γ : [a, b] → Rn si dice parametrizzata per lunghezza d’arco se |γ 0 | ≡ 1 in [a, b].
La parametrizzazione per lunghezza d’arco garantisce questa importante proprietà: se la curva è
derivabile due volte possiamo differenziare l’identità |γ 0 |2 = 1 per ottenere
n
X
2
γi0 (t)γi00 (t) = 0 .
i=1
Quindi il vettore γ 00 , detto curvatura di γ, è ortogonale alla curva. La quantità κ = |γ 00 | è invece
chiamata curvatura scalare della curva. Si noti che il piano generato affine generato da γ 0 (t) e γ 00 (t)
passante per γ(t) è quello che meglio approssima la curva nell’intorno del punto t. Se siamo in R3
e γ 00 (t) 6= 0, il sistema di coordinate indotto dalla base ortonormale
γ 00 (t)
γ 00 (t)
, γ 0 (t) ∧
κ
κ
3
(ove ∧ indica il prodotto vettore in R ) “agganciato” alla curva è molto utile nelle applicazioni.
Tra curve regolari si può definite una relazione di equivalenza più fine di quella data nella Definizione 5.54 del Capitolo 5.
γ 0 (t),
Definizione 7.16. Siano γ : I −→ Rn e δ : J −→ Rn due curve regolari. Si pone γ ≈ δ se esiste
una funzione bigettiva ϕ : I −→ J di classe C 1 , con ϕ0 > 0 in I e tale che γ = δ ◦ ϕ.
Con le notazioni della definizione, δ è detta riparametrizzazione di γ. In sostanza, ≈ è più fine perché
si richiede alla funzione di riparametrizzazione ϕ di essere di classe C 1 e con derivata positiva. Alla
relazione ≈ si applica quanto detto per la relazione ∼ nel Capitolo 5. Vale inoltre la seguente
proprietà:
γ =δ◦ϕ≈δ
=⇒
γ 0 (t) = ϕ0 (t)δ 0 ϕ(t) .
In altri termini, i vettori tangenti di γ e δ in t̄ hanno stessa direzione e stesso verso. Le rette
tangenti parametriche sono quindi equivalenti, si passa dall’una all’altra con una trasformazione
lineare ϕ(t) = at con a > 0 (con a dato dal rapporto dei moduli di γ 0 (t̄) e δ 0 (t̄)). È proprio questa
invarianza rispetto a riparametrizzazioni che giustifica la terminologia “vettore tangente alla curva”.
Più in generale, valgono inoltre le seguenti proprietà di invarianza. Entrambe si mostrano facilmente
usando la formula di cambiamento di variabili nell’integrale.
Teorema 7.17. Curve equivalenti secondo la relazione ≈ hanno la stessa lunghezza. Se γ : [a, b] →
Rn è regolare, posto
Z t
ϕ(t) :=
|γ 0 (s)| ds
ϕ : [a, b] → [0, `(γ)]
a
la curva γ ◦ ϕ−1 : [0, `(γ)] → Rn è parametrizzata per lunghezza d’arco e equivalente a γ secondo la
relazione ≈.
2È interessante osservare che esiste una nozione di lunghezza anche per curve continue γ : [a, b] → Rn : si
Pn
prende l’estremo superiore della somma
1 |γ(ti+1 ) − γ(ti )| (lunghezza delle spezzate) al variare delle partizioni
a = t1 < t2 < · · · < tn+1 = b. La lunghezza può essere naturalmente infinita e non è troppo difficile mostrare che le
due definizioni coincidono sulla classe delle curve regolari.
6. GRAFICI E INSIEMI DI LIVELLO: IL TEOREMA DELLA FUNZIONE IMPLICITA
179
5. Curve regolari e grafici
Sia f una funzione di classe C 1 su un intervallo aperto I ⊆ R a valori reali. Allora la curva
(5.1)
γ(t) = t, f (t)
t∈I ,
è semplice, il suo sostegno è il grafico di f ed è orientata con percorrenza “da sinistra a destra”.
Inoltre γ è regolare, essendo
γ 0 (t) = 1, f 0 (t) 6= 0 .
Lemma 7.18. Sia γ = (γ1 , γ2 ) : I −→ R2 una curva di classe C 1 , e si supponga che γ10 > 0 in I.
Allora γ ≈ δ, con δ della forma (5.1), con f di classe C 1 . Valgono enunciati analoghi se γ10 < 0 in
I (in questo caso il verso di percorrenza è opposto) o se γ20 ha segno constante in I (in questo caso
il grafico è del tipo x = g(y)).
Dimostrazione. La funzione γ1 applica in modo bigettivo I su un intervallo J. Ponendo la
curva δ = γ ◦ γ1−1 : J −→ R2 ha la forma (5.1) con f = γ2 ◦ γ1−1 ed è equivalente a γ.
Dalla continuità del vettore tangente otteniamo che ogni curva regolare è localmente equivalente,
nel senso della relazione ≈, a un grafico, scegliendo in modo opportuno il verso di percorrenza e il
sistema di coordinate.
Teorema 7.19. Sia γ : I −→ R2 una curva di classe C 1 . Per ogni t ∈ I esiste un intorno It di t
tale che γ|It sia equivalente a δ(±s), con δ(s) del tipo s, f (s) , oppure a δ̃(±s), con δ̃(s) del tipo
g(s), s .
Dimostrazione. Per ogni t ∈ I, γ 0 (t) 6= 0. Supponiamo che γ10 (t) > 0. Essendo γ10 continua
su I, esiste un intorno It di t su cui γ10 > 0. Ricadiamo quindi nelle ipotesi del Lemma 7.18. Se
γ10 (t) < 0, basta sostituire γ con −γ per ricadere nel caso precedente.
In modo analogo si procede, a componenti scambiate, se γ20 (t) 6= 0.
6. Grafici e insiemi di livello: il teorema della funzione implicita
Sia f : A −→ R una funzione definita su A ⊆ Rn , con n ≥ 2. Dato a ∈ R, l’insieme
Ea = x ∈ A : f (x) = a = f −1 (a) ,
si chiama un insieme di livello della funzione f . Si vuole conoscere la natura di questo insieme, e
in particolare si vuol sapere se esso coincide con il grafico di una funzione di n − 1 variabili, cioè, a
meno di una rinumerazione delle variabili,
Ea = x0 , g(x0 ) : x0 = (x1 , . . . , xn−1 ) ∈ B} ,
con B ⊆ Rn−1 .
In altri termini, data l’equazione
f (x1 , . . . , xn ) = a ,
si vuole sapere se si può esplicitare una delle n variabili in funzione delle altre, cioè stabilire che,
per qualche j, l’equazione è equivalente a
xj = g(x1 , . . . , xj−1 , xj+1 , . . . , xn ) .
Quando questo succede, si dice che la funzione g è implicitamente definita dall’equazione f (x) = a.
È ben noto che la risposta generale a questo problema è negativa, anche con funzioni f molto
regolari, per esempio, come supporremo d’ora in poi, di classe C 1 su un aperto A. L’insieme Ea
può essere
6. GRAFICI E INSIEMI DI LIVELLO: IL TEOREMA DELLA FUNZIONE IMPLICITA
180
vuoto: x21 + x22 = −1,
discreto: x21 + x22 = 0,
non rappresentabile come grafico: x21 − x22 = 0,
rappresentabile come grafico, ma non di una funzione derivabile: x21 − x32 = 0,
non rappresentabile globalmente come un unico grafico, ma scomponibile nell’unione di più
grafici: x21 + x22 = 1,
• ecc.
•
•
•
•
•
Accontentiamoci dunque di porre il problema nella forma seguente: dare condizioni sulla funzione
f , di classe C 1 sull’aperto A, perché, dato un punto x ∈ Ea , si possa concludere che esiste un
intorno U di x tale che Ea ∩ U sia il grafico di una funzione C 1 di n − 1 variabili.
Per semplicità, discuteremo in dettaglio il problema per funzioni f di due variabili (che indicheremo
con x, y anziché x1 , x2 ), anche se le conclusioni che trarremo ammettono naturali estensioni a
funzioni di più variabili (si veda il Teorema 7.22).
Partiamo dalla seguente osservazione elementare.
Lemma 7.20 (Il gradiente è ortogonale agli insiemi di livello). Siano A aperto di R2 , f di
classe C 1 su A e γ : I −→ A una curva regolare con sostegno contenuto nell’insieme di livello Ea
di f . Allora, per ogni t ∈ I, i vettori γ 0 (t) e ∇f (γ(t)) sono ortogonali.
Dimostrazione. La funzione composta f ◦ γ è di classe C 1 su I e costantemente uguale ad a.
Per la Proposizione 7.14,
∇f (γ(t)) · γ 0 (t) = (f ◦ γ)0 (t) = 0
per ogni t ∈ I .
La relazione di ortogonalità è certamente verificata se il punto (x, y) = γ(t) è stazionario per f ,
indipendentemente dalla direzione di γ 0 (t). Ma si noti che negli esempi elencati sopra sono proprio
i punti stazionari quelli in cui si verificano “irregolarità” dell’insieme di livello. Per poter formulare
un risultato positivo, è dunque opportuno limitarsi a punti di Ea che non siano stazionari per f .
Supponiamo allora che y = g(x) sia implicitamente definita, nell’intorno di un punto non stazionario
1
(x, y) ∈
Ea , dall’equazione f (x, y) = a, con g di classe C sull’intervallo I, e poniamo γ(t) =
t, g(t) . Allora, se γ(x) = (x, y), differenziando al tempo x e sostituendo l’espressione per γ(x)
nella formula di derivazione della funzione composta otteniamo l’identità
∂f
∂f
(x, y) +
(x, y)g 0 (x) = 0 .
∂x
∂y
Deve necessariamente essere ∂y f (x, y) 6= 0, perché altrimenti si annullerebbe anche l’altra derivata
parziale.
Il teorema che segue mostra che un piccolo rafforzamento di questa condizione è anche sufficiente
per poter esplicitare y in funzione di x nell’intorno di (x, y).
Teorema 7.21 (Teorema delle funzioni implicite in R2 ). Sia f : A → R continua, con A
aperto di R2 , e sia (x, y) ∈ A tale che ∂y f esiste in un intorno di (x, y), è continua in (x, y) e
∂y f (x, y) 6= 0. Esiste allora un intorno U = (x − δ1 , x + δ1 ) × (y − δ2 , y + δ2 ) di (x, y) tale che,
posto a = f (x, y), l’insieme U ∩ f −1 ({a}) sia il grafico y = g(x), con g continua da (x − δ1 , x + δ1 )
a valori in (y − δ2 , y + δ2 ).
Inoltre, se f è di classe C 1 in (x−δ1 , x+δ1 )×(y −δ2 , y +δ2 ), allora g è di classe C 1 in (x−δ1 , x+δ1 )
6. GRAFICI E INSIEMI DI LIVELLO: IL TEOREMA DELLA FUNZIONE IMPLICITA
181
e vale
∂f
x, g(x))
g 0 (x) = − ∂x
∂f
x, g(x))
∂y
(6.1)
per ogni x ∈ (x − δ1 , x + δ1 ) .
Dimostrazione. Possiamo supporre che a = 0 e che ∂y f (x, y) > 0 e fissare un rettangolo
chiuso iniziale [x − α, x + α] × [y − β, y + β] su cui ∂y f > 0.
La funzione hx (y) = f (x, y) è dunque strettamente crescente su [y − β, y + β], per cui
f (x, y − β) < 0 ,
f (x, y + β) > 0 .
Esiste allora δ1 ∈ (0, α], tale che
f (x, y − β) < 0 ,
f (x, y + β) > 0
per ogni x ∈ [x − δ1 , x + δ1 ] .
Per il teorema di esistenza degli zeri, per ogni x ∈ [x − δ1 , x + δ1 ], la funzione hx (y) = f (x, y) si
annulla sull’intervallo [y − β, y + β]. Essendo h0x (y) = ∂y f (x, y) > 0, hx si annulla in un unico
punto, che chiamiamo g(x).
6
+
+
+
+
(x + α, y + β)
• (x, y)
(x − α, y − β)
−
−
−
−
-
La funzione g è dunque implicitamente definita dall’equazione f (x, y) = 0 in un intorno di (x, y).
Mostriamo ora che g è continua su [x − δ1 , x + δ1 ]. Supponiamo per assurdo che, per una data
successione (xn ) ⊂ [x − δ1 , x + δ1 ], si abbia xn → x ma g(xn ) non converge a g(x). Esiste allora
> 0 tale che |g(xn ) − g(x)| ≥ per infiniti indici n. Considerando solo questi indici, troviamo una
sottosuccessione n(k) tale che g(xn(k) ) converge a un certo z 6= g(x), con z ∈ [y − δ2 , y + δ2 ]. Ma,
passando al limite per k → ∞ nella relazione f (xn(k) , g(xn(k) )) = 0, otteniamo f (x, z) = 0, contro
l’unicità di g(x). Quindi l’assurdo mostra la continuità di g.
Vogliamo dimostrare, nell’ipotesi aggiuntiva che f sia di classe C 1 nel rettangolo, che g ammette
derivata continua su (x − δ1 , x + δ1 ). Prendiamo due punti xe x + h in tale intervallo
e poniamo k =
k(h) = g(x+h)−g(x). Congiungiamo quindi i punti x, g(x) e x+h, g(x+h) = x+h, g(x)+k(h)
per mezzo del segmento
γ(t) = x + th, g(x) + tk(h) ,
t ∈ [0, 1] .
6. GRAFICI E INSIEMI DI LIVELLO: IL TEOREMA DELLA FUNZIONE IMPLICITA
182
La funzione composta f ◦ γ è continua su [0, 1], derivabile all’interno e nulla agli estremi. Per il
teorema di Rolle, esiste θ = θ(h) ∈ (0, 1) tale che
∂f
∂f
x + θh, g(x) + θk(h) + k
x + θh, g(x) + θk(h) .
0 = (f ◦ γ)0 (θ) = h
∂x
∂y
Essendo ∂y f diversa da 0 sul rettangolo compatto U = [x − δ1 , x + δ1 ] × [y − β, y + β], la funzione
|∂x f /∂y f | è continua su U .
Allora, per la continuità di ∂x f e di g, la funzione u(h) definita da
∂f ∂f
u(h) =
x + θ(h)h, g(x) + θ(h)k(h) =
x + θ(h)h, g(x) + θ(h) g(x + h) − g(x)
∂x
∂x
è continua in h = 0, e dunque
∂f
∂f
x + θ(h)h, g(x) + θ(h)k(h) =
x, g(x) + o(1)
(h → 0) .
∂x
∂x
Analogamente per ∂f /∂y. Si ha quindi che
∂f
∂f
x + θ(h)h, g(x) + θ(h)k(h))
x, g(x))
k(h)
g(x + h) − g(x)
=
= − ∂x
−→ − ∂x
per h → 0 .
∂f
∂f
h
h
x + θ(h)h, g(x) + θ(h)k(h))
x, g(x))
∂y
∂y
Abbiamo quindo mostrato la derivabilità di g e la formula (6.1). Da tale formula ricaviamo la
continuità di g 0 .
La condizione ∇f (x) 6= 0 è dunque sufficiente per poter esplicitare una delle due variabili in
funzione dell’altra in un intorno del punto dato. Tuttavia questa condizione non è affatto necessaria.
Supponendo a = 0, si noti infatti che f e f 2 definiscono lo stesso insieme di livello E0 , ma
∇f 2 = 2f ∇f
è identicamente nullo su E0 .
Esempio. Il teorema delle funzioni implicite ci consente ad esempio di dire che il luogo di zeri
x5 y − cos(xy 3 ) + y + 1 = 0
coincide nell’intorno di (0, 0) con il grafico di una funzione g(x) (di classe C ∞ , come vedremo tra
un attimo), anche se è probabilmente impossibile esprimere g mediante le funzioni “elementari”.
Osserviamo che una maggiore regolarità di f implica una maggiore regolarità di g; ad esempio, se
tutte le derivate ∂xx f = ∂x (∂x f ), ∂xy f = ∂x (∂y f ), ∂yx f = ∂y (∂x f ), ∂yy f = ∂y (∂y f ) sono continue
(almeno in un intorno), allora la regola di derivazione della funzione composta dà che g è di classe
C2 e
1
1
g 00 (x) = −
(∂xx f + ∂yx f g 0 (x)) +
(∂x f ∂xy f + ∂x f ∂yy f g 0 (x))
∂y f
(∂y f )2
1
= −
∂xx f (∂y f )2 − ∂xy f ∂x f ∂y f − ∂yx f ∂x f ∂y f + ∂yy f (∂x f )2 ,
3
(∂y f )
ove si intende che tutte le derivate parziali sono valutate in (x, g(x)). Il discorso si può iterare,
mostrando che se f ha tutte le derivate parziali di ordine k continue, allora g è di classe C k .3
Il teorema delle funzioni implicite ha il seguente analogo per funzioni di n variabili, che ci limitiamo
a enunciare, anche se la dimostrazione è del tutto analoga a quella del caso bidimensionale.
3Si veda la Sezione 11 per maggiori informazioni sulle derivate parziali di ordine superiore.
7. *FUNZIONI DIFFERENZIABILI DA Rn A Rm
183
Per comodità, indichiamo i punti x ∈ Rn come coppie (x0 , xn ) con x0 = (x1 , . . . , xn−1 ) ∈ Rn−1 .
Teorema 7.22 (Teorema delle funzioni implicite in Rn ). Sia f : A ⊆ Rn → R continua,
con A aperto, e sia x = (x0 , xn ) ∈ A tale che ∂xn f esiste in un intorno di x, è continua in x e
∂xn f (x) 6= 0.
Esiste allora un intorno U = U 0 × (xn − δ, xn + δ) di x (dove U 0 è un intorno di x0 in Rn−1 ) tale
che, posto a = f (x), l’insieme U ∩ f −1 ({a}) sia il grafico xn = g(x0 ), con g continua da U 0 a valori
in (xn − δ, xn + δ). Inoltre, se f è di classe C k su A per qualche k ∈ N∗ , allora g è di classe C k su
U 0 e vale
∂f 0
x , g(x0 ))
∂g 0
∂xi
(x ) = −
per ogni x0 ∈ U 0 e 1 ≤ i ≤ n − 1 .
(6.2)
∂f 0
∂xi
x , g(x0 ))
∂xn
7. *Funzioni differenziabili da Rn a Rm
4
Consideriamo una funzione F : A → Rm , con A sottoinsieme di Rn . Siano (f1 , . . . , fm ) le componenti scalari di F , e sia x un punto interno a A. Supponiamo che ogni fj , j = 1, . . . , m, ammetta
derivate parziali ∂xk fj in x per ogni k = 1, . . . , n. I valori di queste derivate si raggruppano nella
matrice derivata, detta anche matrice Jacobiana


∂f1
∂f1
(x) · · ·
(x)
 ∂x1
 ∂xn


∂fj
.
.
.

.
.
.
DF (x) = 
=
(x)
,
.
.
.


∂xk
j=1,...,m , k=1,...,n
 ∂fm

∂fm
(x) · · ·
(x)
∂x1
∂xn
con m righe e n colonne. Si noti che
• le riga j–esima della matrice è il gradiente in x della componente fj ,
• la colonna k–esima è il vettore delle derivate parziali rispetto a xk , o equivalentemente il
vettore tangente in xk della curva
γk (xk ) = F (x1 , . . . , xk−1 , xk , xk+1 , . . . , xn ) .
Le nozioni introdotte per funzioni a valori reali si estendono come segue alle funzioni a valori in
Rm .
Definizione 7.23 (Differenziabilità e differenziale). La funzione F si dice differenziabile nel
punto x interno al suo dominio se esiste un’applicazione lineare G : Rn −→ Rm tale che
(7.1)
F (x + h) − F (x) = G(h) + o |h|
(h → 0) .
La funzione lineare G, univocamente determinata dall’equazione (7.1), è detta differenziale di F in
x ed è indicata con dx F .
Lo studio della differenziabilità di una funzione si riduce a quello della differenziabilità delle sue
componenti scalari, come mostra il seguente risultato.
Proposizione 7.24. La funzione F è differenziabile in x se e solo se ivi sono differenziabili tutte
le sue componenti scalari f1 , . . . , fm .
4Facoltativa
8. *COMPOSIZIONE DI FUNZIONI DIFFERENZIABILI
184
Dimostrazione. Nell’equazione (7.1) poniamo G(h) = Ah, con A = (ajk )j=1,...,m , k=1,...,n una
matrice m × n. Indichiamo con vj = (aj1 , . . . , ajn ) la riga j–esima di A. Allora la condizione (7.1)
equivale alle m condizioni
fj (x + h) − fj (x) = vj · h + o |h|
(h → 0) .
Quindi esiste un’applicazione G che soddisfi la formula (7.1) se e solo se ogni fj è differenziabile in
x.
Questa riduzione alle componenti scalari ha una serie di conseguenze sulla base dei risultati visti
finora.
Corollario 7.25 (Relazioni tra differenziale e derivate parziali e direzionali).
(i) Se F è differenziabile in x, nella formula (7.1) si ha G(h) = DF (x)h.
(ii) Se F è differenziabile in x, essa ammette derivate direzionali, date da
∂F
(x) = DF (x)v = dx F (v)
∀v ∈ Rn .
∂v
(iii) Se ogni fj ammette derivate parziali in un intorno di x e continue in x, F è differenziabile
in x.
8. *Composizione di funzioni differenziabili
5
Siano date due funzioni F : Rn → Rm e G : Rm → Rk . Più in generale,
F = (f1 , . . . , fm ) : A −→ Rm ,
G = (g1 , . . . , gk ) : B −→ Rk ,
con A ⊆ Rn , F (A) ⊆ B ⊆ Rm , in modo che la funzione composta G ◦ F : A → Rk sia definita.
Sotto opportune ipotesi sulla differenziabilità di F e G, vogliamo discutere la differenziabilità di
G ◦ F.
Teorema 7.26. Siano F e G come sopra. Si supponga che
(i) F sia differenziabile in un punto x interno ad A;
(ii) F (x) = y sia interno a B e G sia differenziabile in y.
Allora G ◦ F è definita in un intorno di x, differenziabile in x e valgono le identità
D(G ◦ F )(x) = DG(y)DF (x) ,
dx (G ◦ F ) = (dF (x) G) ◦ (dx F ) .
Si noti che le dimensioni delle due matrici derivate rendono possibile il prodotto nell’ordine indicato.
Dimostrazione. Essendo y interno a B, esiste una palla Br (y) ⊆ B. Per la continuità di G
in y, esiste una palla Br0 (x), che possiamo supporre contenuta in A, tale che F (Br0 (x)) ⊆ Br (y).
Quindi G ◦ F è definita su Br0 (x).
Si ha dunque, per x + h ∈ Br0 (x) e y + k ∈ Br (y)
F (x + h) − F (x) = DF (x)h + o |h|
(h → 0) ,
G(y + k) − G(y) = DG(y)k + o |k|
(k → 0) .
Ponendo
k = k(h) = F (x + h) − F (x) = F (x + h) − y = DF (x)h + o |h|
5Facoltativa
(h → 0) ,
9. *PUNTI STAZIONARI LIBERI E VINCOLATI
185
nella seconda formula e osservando che |k(h)| = O(|h|), si ottiene
G F (x + h) − G F (x) = DG(y) DF (x)h + o |h| + o |h|
= DG(y)DF (x)h + o |h| ,
e questo dà la tesi.
Corollario 7.27 (Formula di derivazione della funzione composta). Nelle ipotesi del
Teorema 7.26, ponendo G ◦ F = H = (h1 , . . . , hk ), vale la formula
m
X ∂gj
∂fp
∂hj
(x) =
(F (x))
(x) ,
∂xi
∂yp
∂xi
i = 1, . . . , n , j = 1, . . . , k .
p=1
9. *Punti stazionari liberi e vincolati
6
Per studiare i massimi e i minimi di una funzione continua su un intervallo [a, b] ⊆ R, derivabile all’interno dell’intervallo, sappiamo che basta esaminare i valori della funzione agli estremi
dell’intervallo e poi cercare gli eventuali punti di massimo e minimo tra i punti stazionari interni
all’intervallo. In più variabili, supponiamo che f sia continua sull’insieme {F ≤ 0}, con F : Rn → R
di classe C 1 e avente gradiente non nullo sull’insieme
Γ := x ∈ Rn : F (x) = 0 = ∂ x ∈ Rn : F (x) < 0 .
Allora come sempre possiamo cercare i punti di massimo e minimo della restrizione di f a {F ≤ 0}
(che certamente esistono se {F ≤ 0} è non solo chiuso ma anche compatto), tra i punti stazionari
nell’insieme aperto A = {F < 0}. Per cercare i punti di massimo e minimo di f sul bordo
dell’insieme A è utile trovare una condizione differenziale che caratterizza i massimi e minimi locali
(e quindi anche quelli globali) della restrizione di f a un insieme. Questo sarà possibile perchè
l’insieme Γ è, almeno localmente, descrivibile come grafico grazie al teorema delle funzioni implicite.
Diamo allora la seguente definizione.
Definizione 7.28 (Punti stazionari liberi). Sia f : A −→ R, con A ⊆ Rn . Un punto x interno
ad A si dice un punto stazionario libero di f se f è differenziabile in x e ∇f (x) = 0.
Vale allora il
Lemma 7.29 (I punti di massimo o minimo locale sono stazionari liberi). Sia f : A −→ R,
con A ⊆ Rn , differenziabile in un punto x interno ad A. Se x è un punto di massimo o di minimo
locale per f , allora ∇f (x) = 0.
Dimostrazione. Supponiamo che x sia un punto di massimo locale. Per ogni j = 1, . . . , n, la
funzione
gj (t) = f (x1 , . . . , xj−1 , t, xj+1 , . . . , xn ) ,
definita per t in un intorno di xj in R, ha un massimo locale in xj ed è derivabile in xj . Quindi
gj0 (xj ) =
∂f
(x) = 0 .
∂xj
6Facoltativa
9. *PUNTI STAZIONARI LIBERI E VINCOLATI
186
Se la funzione f è di classe C 1 su un aperto A, la ricerca dei punti di massimo o minimo locale
va dunque limitata ai punti in cui il gradiente è nullo. Come per le funzioni di una variabile,
l’annullarsi del gradiente in un punto non assicura che il punto sia di massimo o di minimo. Già
in una variabile le configurazioni possibili non sono facilmente catalogabili (punti di flesso, infinite
oscillazioni nell’intorno del punto, ecc.). Una situazione che si presenta solo con più variabili è il
cosiddetto punto di sella, esemplificato dalla funzione
f (x, y) = x2 − y 2
nell’origine di R2 : la restrizione a una retta y = ax passante per l’origine presenta un massimo
locale stretto se |a| > 1 e un minimo locale stretto se |a| < 1.
Siano ora A ⊆ Rn un aperto e f una funzione di classe C 1 su A. Dentro A si abbia poi l’insieme
di livello (che chiameremo vincolo e supporremo non vuoto)
(9.1)
Ea = x : F (x) = a ,
dove F : A −→ R è una funzione di classe C 1 con ∇F (x) 6= 0 per ogni x ∈ Ea .
Definizione 7.30 (Massimi e minimi vincolati). Chiamiamo punto di massimo di f vincolato
a Ea un punto di x ∈ Ea che sia di massimo per f |Ea . Diremo che x ∈ Ea è un massimo locale
vincolato se esiste r > 0 tale che x sia di massimo per f |Ea ∩Br (x) .
Un’analoga definizione può essere data per i punti di minimo (locale) vincolato.
Si osservi che se x ∈ A è un punto di massimo libero per f , allora è necessariamente di massimo
vincolato, qualunque sia il vincolo contenente x. Al contrario, un punto di massimo, o minimo,
vincolato non è necessariamente di massimo, o minimo, libero, e può anche non essere un punto
stazionario libero. Si prenda, ad esempio, la funzione f (x, y) = x2 + y 2 , e come vincolo la retta
y = 1. Il punto (0, 1) è di minimo vincolato, ma non è stazionario libero.
Teorema 7.31. Siano f, F di classe C 1 su A ⊆ Rn , siano a, Ea come nella formula (9.1), con
Ea 6= Ø, e si supponga che ∇F (x) 6= 0 su Ea . Sia poi x ∈ Ea un punto di massimo (o di minimo)
di f locale vincolato a Ea .
Allora ∇f (x) è un multiplo scalare di ∇F (x).
Dimostrazione. Supponiamo che x sia di massimo vincolato. Per ipotesi, ∇F (x) 6= 0. Supponiamo, a meno di riordinare le variabili, che ∂xn F (x) =
6 0. Per il Teorema 7.22, in un intorno
U = U 0 × (xn − δ, xn + δ) di x, Ea coincide con il grafico
xn = g(x0 ) ,
con g di classe C 1 su U 0 . Allora x0 è un punto di massimo locale libero della funzione
h(x0 ) = f x0 , g(x0 ) .
La funzione h è la composizione di f con la funzione
G(x0 ) = x0 , g(x0 ) ,
G : U 0 −→ A ,
dove U 0 ⊂ Rn−1 e A ⊂ Rn . Per il Teorema 7.26 e il Lemma 7.29,
(9.2)
∇h(x0 ) = (∇f (x))DG(x0 ) = 0 .
9. *PUNTI STAZIONARI LIBERI E VINCOLATI
187
Ma

1
0
..
.
···
···
..
.
0
1
..
.
0
0
..
.







0

 ,
DG(x ) = 

0
···
1
 0

 ∂g

∂g
∂g
(x0 )
(x0 ) · · ·
(x0 )
∂x1
∂x2
∂xn−1
dove le n − 1 colonne sono linearmente indipendenti e generano il sottospazio parallelo all’iperpiano
tangente al grafico di g (cioè a Ea ) in x. Quindi la condizione (9.2) indica che ∇f (x) è ortogonale
a tale iperpiano.
D’altra parte, la stessa conclusione vale per ∇F (x), in quanto la funzione
ψ(x0 ) = F x0 , g(x0 )
è costantemente uguale ad a. Siccome il sottospazio ortogonale a un iperpiano ha dimensione 1,
esiste λ ∈ R tale che ∇f (x) = λ∇F (x) (si noti che ∇F (x) 6= 0).
Definizione 7.32 (Punti stazionari vincolati). Siano f, F, A, a, Ea come nel Teorema 7.31.
Un punto x ∈ Ea si dice un punto stazionario di f vincolato a Ea se ∇f (x) è un multiplo scalare
di ∇F (x).
Si deduce che, nelle ipotesi del Teorema 7.31, i punti di massimo e minimo vincolati a Ea vanno
ricercati tra i punti stazionari vincolati a Ea . La ricerca dei punti stazionari vincolati consiste
dunque nella risoluzione del sistema
(
∇f (x) = λ∇F (x)
(9.3)
F (x) = a ,
nelle incognite x, λ. Il numero λ è detto moltiplicatore di Lagrange ed il metodo è noto come
metodo dei moltiplicatori di Lagrange (il plurale deriva dal fatto che, per vincoli di codimensione
più alta, ad esempio l’intersezione di due luoghi di zeri, serve più di un “moltiplicatore”).
È anche interessante osservare che i punti stazionari vincolati del sistema (9.3) possono essere visti
come punti stazionari “liberi” della funzione
H(x, λ) := f (x) − λ(F (x) − a) ,
ottenuta aggiungendo a f un multiplo della funzione F − a che definisce il vincolo.
Esempio. Dati a1 , . . . , an reali non tutti nulli, vogliamo trovare i punti di massimo e minimo della
restrizione della funzione continua
n
1X
f (x) :=
ai x3i
3
i=1
Rn ,
alla sfera unitaria P
di
che certamente esistono. Descriveremo il vincolo sferico mediante la
funzione F (x) = 12 i x2i , il cui livello 1/2 corrisponde alla sfera.
Cercheremo i massimi e i minimi studiando i punti stazionari, con il metodo dei moltiplicatori di
Lagrange. Abbiamo allora il sistema di (n + 1) equazioni in (n + 1) incognite
n
X
i=1
x2i = 1,
ai x2i = λxi , 1 ≤ i ≤ n .
10. *DIAGONALIZZAZIONE DI MATRICI SIMMETRICHE
188
Dato che almeno uno dei xi è non nullo, otteniamo che ai xi = λ per ogni i tale che xi 6= 0. Se
λ 6= 0 deve allora essere ai 6= 0 per tutti questi i e abbiamo quindi
X
X
a−2
x2i = λ2
.
1=
i
i: xi 6=0
i: xi 6=0
D’altro canto, se λ = 0 allora ai = 0 per tutti gli i tali che xi 6= 0, quindi f (x) = 0, ne segue che x
evidentemente non è un punto di massimo o di minimo.
Quindi un punto stazionario x con λ 6= 0 è caratterizzato dall’avere un certo numero di componenti
P
−2 −1/2
non nulle, mentre le altre sono date da λ/ai , con |λ| =
. Ora, calcolando il valore
i:xi 6=0 ai
di f su tali punti otteniamo
1 X
λ
f (x) =
λx2i = .
3
3
i: xi 6=0
Essendo f dispari e il vincolo pari, basta cercare tra questi i punti di massimo. È evidente dalla
formula sopra che il valore massimo di |λ| si ottiene quando tutti gli xi sono nulli tranne uno, scelto
in corrispondenza di un indice i per cui |ai | è massimo. Scegliendo xi = ±1 a seconda del segno
di ai si ottiene che il valore massimo di f sulla sfera vale maxj |aj |/3 (mentre il valore minimo è
l’opposto).
10. *Diagonalizzazione di matrici simmetriche
7
Una interessante applicazione del metodo dei moltiplicatori di Lagrange è il teorema di diagonalizzabilità sul campo dei numeri reali delle matrici reali simmetriche, cioè delle matrici quadrate
S con tS = S.8 Premettiamo alcune nozioni relative al prodotto scalare e alcune proprietà delle
matrici simmetriche.
Un insieme E ⊆ Rn si dice un sistema ortonormale se, per ogni v, w ∈ E,
(
1 se v = w
v·w =
0 se v 6= w .
Lemma 7.33 (Proprietà dei sistemi ortonormali).
(i) Un sistema ortonormale di vettori è linearmente indipendente.
(ii) Se V è un sottospazio vettoriale di Rn ed E è un sistema ortonormale di vettori di V ,
allora E può essere ampliato ad una base ortonormale di V .
(iii) Ogni sottospazio V di Rn ha una base ortonormale.
Dimostrazione. Sia E un sistema ortonormale, e si supponga che k elementi distinti v1 , . . . vk
di E soddisfino la relazione
λ 1 v1 + · · · + λ k vk = 0 ,
per opportuni λ1 , . . . , λk ∈ R. Allora, per ogni j = 1, . . . , k,
0 = vj · (λ1 v1 + · · · + λk vk ) = λj .
7Facoltativa
8La dimostrazione che presentiamo non fa uso del teorema fondamentale dell’algebra e del polinomio caratteristico
det (λI − S).
10. *DIAGONALIZZAZIONE DI MATRICI SIMMETRICHE
189
Questo dimostra il punto (i). Sappiamo ora che un sistema ortonormale E di un sottospazio V di
Rn è finito e che la sua cardinalità k non supera dim V . Se E = {v1 , . . . , vk } con k < dim V , si
prenda v ∈ V linearmente indipendente da E. Allora
k
X
v =v−
(v · vj )vj
0
j=1
è non nullo, in V , e ortogonale a ogni vj . Ponendo
vk+1 =
1 0
v ,
|v 0 |
il sistema E 0 = {v1 , . . . , vk , vk+1 } continua ad essere ortonormale. Iterando questo procedimento, si
ottiene la conclusione del punto (ii). Il punto (iii) è una diretta conseguenza del punto (ii), partendo
da E = Ø.
Sia V un sottospazio vettoriale di Rn . Il sottospazio ortogonale a V , si definisce come
V ⊥ = {w ∈ Rn : w · v = 0 ∀ v ∈ V } ,
(che è chiaramente uno spazio vettoriale).
Lemma 7.34. Rn è la somma diretta di V e V ⊥ .
Dimostrazione. Sia {v1 , . . . , vk } una base ortonormale di V , la si completi in una base
Pnorton
⊥
normale {v1 , . . . , vn } di R . Allora {vk+1 , . . . , vn } è un sistema ortonormale in V . Se v = 1 cj vj
è in V ⊥ , allora cj = v · vj = 0 per j ≤ k. Quindi v è combinazione lineare di vk+1 , . . . , vn . Quindi
{vk+1 , . . . , vn } è una base di V ⊥ e la conclusione segue facilmente.
Siano ora V un sottospazio vettoriale di Rn e sia T : V −→ V un’applicazione lineare. Si dice che
T è simmetrica se
(T v) · w = (T w) · v
∀v, w ∈ V .
Lemma 7.35. T : V −→ V lineare, e sia {v1 , . . . , vk } una base ortonormale di V . Allora T è
simmetrica se e solo se la matrice S = (sij ) che rappresenta T nella base data è simmetrica (cioè
sij = sji per ogni i, j).
Dimostrazione.
P Se la matrice S rappresenta una qualunque applicazione lineare T in una data
base, si ha T vj = i sij vi . Essendo la base ortonormale, si vede facilmente che sij = (T vj ) · vi .
Se T è simmetrica, segue che sij = sji per ogni i, j. Viceversa, se sij = sji per ogni i, j, vale
l’uguaglianza (T vj ) · vi = (T vi ) · vj per ogni i, j. Presi allora due vettori
v=
k
X
λ j vj ,
w=
j=1
k
X
µj v j ,
j=1
si ha
(T v) · w =
k
X
i, j=1
λj µi (T vj ) · vi =
k
X
λj µi (T vi ) · vj = (T w) · v .
i, j=1
Lemma 7.36. Sia T un’applicazione lineare simmetrica di Rn in sé, e sia V un sottospazio tale che
T V ⊆ V . Allora si ha anche T V ⊥ ⊆ V ⊥ .
11. DERIVATE DI ORDINE SUPERIORE
190
Dimostrazione. Sia w ∈ V ⊥ . Se v ∈ V , si ha (T w) · v = w · (T v) = 0, perché T v ∈ V . Quindi
T w ∈ V ⊥.
Nel seguito intendiamo i vettori di Rn come matrici colonna, x = t(x1 . . . xn ). Il prodotto scalare
x · y si esprime dunque come prodotto matriciale tyx (identificando R con le matrici reali 1 × 1).
Data una matrice simmetrica n × n, S = (sij ), indichiamo con T la corrispondente applicazione
simmetrica di Rn in sé, riferita alla base canonica (che è ortonormale).
Consideriamo la funzione
n
n
X
X
X
(10.1)
QS (x) = (T x) · x = txSx =
sij xi xj =
sjj x2j + 2
sij xi xj ,
i, j=1
j=1
i<j
detta la forma quadratica associata alla matrice S. Si consideri quindi il vincolo
Γ := x : x21 + · · · + x2n = 1 ,
cioè la sfera euclidea di raggio 1, centrata nell’origine di Rn .
La proprietà importante per noi è la seguente.
Lemma 7.37. I punti stazionari vincolati di QS su Γ sono gli autovettori di S di modulo 1.
Dimostrazione. Calcoliamo il gradiente di QS in un generico punto x. Fissato k, 1 ≤ k ≤ n,
la variabile xk compare nei termini dell’ultimo membro dell’equazione (10.1) skk x2k , 2sik xi xk con
i < k, e 2skj xk xj con j > k. Quindi,
n
X
∂QS
(x) = 2
skj xj = 2(Sx)k ,
∂xk
j=1
e in conclusione,
∇QS (x) = 2Sx .
Analogamente, essendo ϕ = QI , si ha ∇ϕ(x) = 2x. Il sistema (9.3) identifica dunque gli autovettori
di QS su Γ e i corrispondenti autovalori λ.
Teorema 7.38. Esiste una base ortonormale di Rn costituita da autovettori di T .
Dimostrazione. Procediamo per induzione sulla dimensione n. Per n = 1 l’enunciato è ovvio.
Supponiamo allora che la tesi sia vera per n − 1. Per la continuità di QS e la compattezza di Γ,
possiamo dire per il teorema di Weierstrass che QS assume valore massimo su Γ. Sia v1 ∈ Γ un
punto di massimo, che è stazionario, e quindi un autovettore di S. Il sottospazio V = Rv1 soddisfa
la condizione T V ⊆ V , e dunque lo stesso vale per V ⊥ , che ha dimensione n − 1. Per l’ipotesi
induttiva, V ha una base ortonormale {v2 , . . . , vn } di autovettori di T , che dà, con l’aggiunta di v1 ,
una base ortonormale di Rn .
11. Derivate di ordine superiore
Se una funzione reale f di n variabili ammette la derivata parziale ∂xj f su un aperto A, e questa
funzione derivata ammette la derivata parziale nella variabile xk in un punto x, il valore
∂ ∂f (x)
∂xk ∂xj
11. DERIVATE DI ORDINE SUPERIORE
191
è la derivata parziale seconda, indicata come
∂2f
(x) .
∂xk ∂xj
Più in generale, data una m–upla ordinata di indici (j1 , . . . , jm ), l’espressione
∂mf
(x) ,
∂xjm · · · ∂xj1
indica che f è stata prima derivata rispetto a xj1 , poi rispetto a xj2 , ecc. in un intorno di x, e
infine rispetto a xjm in x.
Le derivate di ordine superiore si chiamano pure se effettuate sempre rispetto alla stessa variabile
e miste altrimenti.
Limitandoci a considerare le derivate seconde, in linea di principio una funzione di n variabili può
avere fino a n2 derivate seconde in un punto. Tuttavia è naturale porsi il problema dell’uguaglianza,
per j 6= k, della derivata
(11.1)
∂2f
(x) = lim
h→0
∂xk ∂xj
∂f
∂xj (x
+ hek ) −
∂f
∂xj (x)
h
f (x + hek + h0 ej ) − f (x + hek ) − f (x + h0 ej ) + f (x)
= lim lim
,
h→0 h0 →0
hh0
con l’altra derivata
∂2f
(x) = lim
h0 →0
∂xk ∂xj
∂f
∂xk (x
+ h0 ej ) −
∂f
∂xk (x)
h0
f (x + hek + h0 ej ) − f (x + hek ) − f (x + h0 ej ) + f (x)
= lim
lim
.
h0 →0 h→0
hh0
Trattandosi di uno scambio d’ordine di due limiti in due variabili diverse, dobbiamo aspettarci che
l’uguaglianza non sia sempre vera. Infatti si può verificare facilmente che la funzione

3
 xy
per (x, y) 6= (0, 0)
f (x, y) = x2 + y 2

0
per (x, y) = (0, 0) ,
(11.2)
• è di classe C 1 su R2 ,
• è dotata di derivate seconde su R2 ,
• le due derivate miste sono continue su R2 \ {(0, 0)} ma non in (0, 0),
∂2f
∂2f
•
(0, 0) = 1 ,
(0, 0) = 0.
∂y∂x
∂x∂y
Teorema 7.39 (Teorema di Schwarz). Sia A ⊆ Rn aperto e supponiamo che f : A → R ammetta
le due derivate seconde ∂x2k xj f e ∂x2j xk f in A, e che almeno una delle derivate seconde sia continua
in x ∈ A. Allora
(11.3)
∂2f
∂2f
(x) =
(x) .
∂xk ∂xj
∂xj ∂xk
Dimostrazione. Possiamo supporre j 6= k. Siccome tutti gli incrementi sono presi nelle sole
variabili xj , xk , possiamo anche supporre che f dipenda da due sole variabili x1 , x2 . Si fissino
h, h0 6= 0 tali che il rettangolo di estremi (x + he1 + h0 e2 ), (x + he1 + h0 e2 ), (x + he1 + h0 e2 ),
11. DERIVATE DI ORDINE SUPERIORE
(x + he1 + h0 e2 ) sia contenuto in A. Per fissare le idee, supponiamo che
x̄ = (x̄1 , x̄2 ).
192
∂2f
∂x2 ∂x1
sia continua in
6
(x1 , x2 + h0 )
•
(x1 , x2 )
(x1 + h, x2 + h0 )
•
•
•
(x1 + h, x2 )
-
Si consideri quindi l’espressione
f (x + he1 + h0 e2 ) − f (x + he1 ) − f (x + h0 e2 ) + f (x)
hh0
0
f (x1 + h, x2 + h ) − f (x1 + h, x2 ) − f (x1 , x2 + h0 ) + f (x1 , x2 )
=
,
hh0
che compare sia nella formula (11.1) che nella formula (11.2). Secondo il modo in cui si raggruppano
a due a due gli addendi a numeratore, essa può essere espressa in due modi:
(i) ponendo
f (x1 , x2 + h0 ) − f (x1 , x2 )
,
ϕh0 (x1 ) =
h0
si ha
ϕh0 (x1 + h) − ϕh0 (x1 )
(11.4)
R(h, h0 ) =
;
h
(ii) ponendo
f (x1 + h, x2 ) − f (x1 , x2 )
ψh (x2 ) =
,
h
si ha
ψh (x2 + h0 ) − ψh (x2 )
R(h, h0 ) =
.
h0
Consideriamo la formula (i). La funzione ϕh0 è continua sull’intervallo chiuso di estremi x1 e x1 + h
e derivabile al suo interno. Per il teorema di Lagrange, esiste θ ∈ (0, 1) tale che
R(h, h0 ) =
∂x1 f (x1 + θh, x2 + h0 ) − ∂x1 f (x1 + θh, x2 )
.
h0
Siccome ∂x1 f ammette derivata rispetto a x2 su A, la funzione
R(h, h0 ) = ϕ0h0 (x1 + θh) =
u(x2 ) =
∂f
(x1 + θh, x2 ) ,
∂x1
12. CAMPI VETTORIALI, INTEGRALI CURVILINEI, POTENZIALI
193
è continua sull’intervallo chiuso di estremi x2 e x2 + h0 e derivabile al suo interno. Esiste quindi
θ0 ∈ (0, 1) tale che
∂2f
(x1 + θh, x2 + θ0 h0 ) .
R(h, h0 ) =
∂x2 ∂x1
Si noti che θ, θ0 dipendono dalla scelta di h e h0 , ma sono comunque compresi tra 0 e 1.
Per la continuità della derivata mista in x, si ha dunque la formula
R(h, h0 ) =
∂2f
(x1 , x2 ) + o(1)
∂x2 ∂x1
(h, h0 ) → (0, 0) .
Tenendo temporaneamente h fissato, possiamo passare al limite per h0 → 0 e usare l’espressione
(11.4) per R(h, h0 ), ottenendo
∂f
∂x2 (x̄1
+ h, x̄2 ) −
∂f
∂x2 (x̄1 , x̄2 )
h
=
∂2f
(x1 , x2 ) + o(1)
∂x2 ∂x1
h→0.
Infine con un secondo passaggio al limite, per h → 0, si ha la tesi.
12. Campi vettoriali, integrali curvilinei, potenziali
In questa sezione studiamo il problema dell’esistenza di un potenziale di un campo vettoriale F :
A → Rn , i.e. una funzione V il cui gradiente coincide con F in A. In tutta questa sezione
intenderemo sempre che A è un insieme aperto di Rn . Per studiare questo problema sarà utile
avere una classe di cammini stabile rispetto alle operazioni di concatenazione


γ(t) se t ∈ [a, b]
(γ + η)(t) :=
γ : [a, b] → Rn , η : [b, c] → Rn , γ(b) = η(b)


η(t) se t ∈ [b, c]
e di inversione
−γ(t) := γ(b + t(a − b))
γ : [a, b] → Rn .
Anche se potremmo solo lavorare con cammini lisci “regolarizzando” gli spigoli dovuti alla concatenazione, risulta molto più comodo lavorare con la classe dei cammini C 1 a tratti, che ora introduciamo. Ricordiamo che f ∈ C 1 ([a, b]) vuol dire f continua e derivabile, con derivata continua, in
[a, b] (intendendo agli estremi le derivate destre e sinistre).
Definizione 7.40 (Curve C 1 a tratti). Sia [a, b] ⊂ R un intervallo chiuso e limitato. Indichiamo
con P C 1 ([a, b]) la classe delle funzioni continue f : [a, b] → R tali che esistono t0 = a < t1 < · · · <
tk = b tali che f |[ti ,ti+1 ] è di classe C 1 in [ti , ti+1 ] per 0 ≤ i < k.
Per mappe vettoriali la definizione è analoga e scriveremo P C 1 ([a, b]; Rn ).
Definizione 7.41 (Integrale curvilineo).
Sia F : A → Rn un campo vettoriale continuo e
R
γ ∈ P C 1 ([a, b]; Rn ). L’integrale curvilineo γ F è definito da
Z
(12.1)
Z
0
hF (γ(t)), γ (t)i dt =
F :=
γ
b
a
Z bX
n
a i=1
Fi (γ(t))γi0 (t) dt .
12. CAMPI VETTORIALI, INTEGRALI CURVILINEI, POTENZIALI
194
La definizione (12.1) richiede qualche precisazione in più, perché γ 0 (t) potrebbe non essere definita
in tutti i punti di [a, b] (negli eventuali punti dove non lo è, in numero finito, ha discontinuità a
R tk
Rb
Rt
, ognuno degli addendi ha senso se sappiamo
salto). Tuttavia, spezzando a = t01 + · · · + tk−1
1
che γ|[ti ,ti+1 ] è di classe C . In alternativa, si può pensare di definire arbitrariamente la funzione
integranda in (12.1) nei punti di discontinuità, visto che modificare una funzione in un numero
finito di punti Rnon ne altera né l’integrabilità né l’integrale.
La notazione γ F , che non fa esplicito riferimento al dominio di γ, è naturalmente giustificata
dall’invarianza di F rispetto a riparametrizzazioni. Questa segue facilmente dalla formula di cambiamento di variabili, come già abbiamo osservato per la nozione di lunghezza di una curva, se
γ : [a, b] → Rn è di classe P C 1 e ϕ : [c, d] → [a, b] è bigettiva e di classe C 1 con ϕ0 > 0, vale
(spezzando gli insiemi di integrazione in [ti , ti+1 ] e [ϕ(ti ), ϕ(ti+1 )], 0 ≤ i ≤ k − 1)
Z bX
Z dX
Z dX
n
n
n
0
0
0
Fi (γ(t))γi (t) dt =
Fi (γ ◦ ϕ(s))γi (ϕ(s))ϕ (s) ds =
Fi (γ ◦ ϕ(s))(γi ◦ ϕ)0 (s) ds .
a i=1
c
c
i=1
i=1
Abbiamo inoltre
Z
Z
(12.2)
Z
F =
γ+η
Z
F+
Z
F =−
F ,
γ
−γ
η
F .
γ
La seguente proposizione ci dà una condizione necessaria e sufficiente per
R l’esistenza di un potenziale.
Chiameremo un campo continuo F : A → Rn conservativo in A se γ F = 0 per ogni cammino
chiuso γ di classe P C 1 con immagine contenuta in A.
Proposizione 7.42 (Campi conservativi e esistenza del potenziale). Condizione necessaria
per l’esistenza di un potenziale V : A → R di un campo continuo F è che sia conservativo in A. Se
A è connesso la condizione è sufficiente e il potenziale è univocamente determinato a meno di una
costante additiva.
Dimostrazione. Per la necessità basta osservare che
Z
Z
Z bX
Z b
n
∂V
d
0
F = ∇V =
V (γ(t)) dt = V (γ(b)) − V (γ(a)) .
(γ(t))γi (t) dt =
∂xi
γ
γ
a
a dt
i=1
Per la sufficienza, fissato x̄ ∈ A, indichiamo con Γ(x̄, x) la classe dei cammini C 1 a tratti che
congiungono x̄ a x (non vuota, perché gli aperti connessi sono, grazie al Teorema 5.63, connessi per
archi) e poniamo
Z
V (x) :=
η ∈ Γ(x̄, x) .
F
η
Dobbiamo verificare che la definizione è ben posta (i.e. che non dipende dal cammino scelto), che
V è differenziabile e che ∇V = F in A.
La definizione è ben posta perché, scelti η, η 0 ∈ Γ(x̄, x), il cammino γ = η − η 0 è chiuso e per la
(12.2) vale
Z
Z
Z
F−
η
F =
η0
F .
η−η 0
Per mostrare che ∇V (x) = F (x) per ogni x ∈ A possiamo usare l’indipendenza della definizione di
V dal cammino per scrivere
Z 1
V (x + hej ) − V (x) = h
Fj (x + thej ) dt
∀j ∈ {1, . . . , n}, h ∈ R .
0
12. CAMPI VETTORIALI, INTEGRALI CURVILINEI, POTENZIALI
195
Infatti basta concatenare un cammino tra x̄ e x al cammino lungo la direzione j-sima tra x e x+hej .
Abbiamo allora (qui si può usare il teorema del valor medio e la continuità di F per fare il passaggio
al limite)
Z 1
V (x + hej ) − V (x)
lim
Fj (x + thej ) dt = Fj (x) .
= lim
h→0
h→0 0
h
Il teorema del differenziale totale ci dà anche che V è differenziabile in A.
Per l’unicità del potenziale basta osservare che se V = V1 − V2 è differenza di potenziali, allora ha
gradiente identicamente nullo. In tal caso V è costante sui cubi contenuti in A (perché costante sui
segmenti), quindi gli insiemi di livello {x ∈ A : V (x) = c} sono tutti aperti al variare di c in R.
Per la connessione di A solo uno può essere non vuoto, quindi V è costante.
Alla luce della proposizione precedente vogliamo ora capire quali ipotesi su F e A garantiscono che
F sia conservativo in A. Consideriamo la condizione (che equivale a dire che il rotore del campo è
nullo in dimensione n = 3)
∂Fj
∂Fi
=
1 ≤ i, j ≤ n .
(12.3)
∂xi
∂xj
Diremo che un campo vettoriale F : A → Rn è chiuso se F è differenziabile e vale la (12.3) in tutti
i punti di A. Per il Teorema 7.39 di Schwarz, se le derivate parziali di F sono anche continue la
condizione (12.3) è necessaria per l’esistenza di un potenziale. Mostriamo che, anche senza questa
ipotesi, la (12.3) diventa sufficiente se aggiungiamo un’ipotesi sulla struttura del dominio A.
Per la dimostrazione ci sarà utile estendere alla classe delle funzioni P C 1 ([a, b]) alcune formule del
calcolo integrale. La prima è la formula di integrazione per parti
Z b
Z b
0
f (t)g (t) dt = (f (b)g(b) − f (a)g(a)) −
f 0 (t)g(t) dt ,
a
a
che si ottiene immediatamente dalla formula classica spezzando l’insieme di integrazione nell’unione
degli intervalli [ti , ti+1 ], avendo scelto i ti in modo che f e g appartengano a C 1 ([ti , ti+1 ]). La
seconda formula è il teorema di derivazione sotto il segno di integrale, che enunciamo e dimostriamo
esplicitamente.
Teorema 7.43 (Derivazione sotto il segno di integrale). Sia L : [a, b] × (c, d) → R continua
d
L(t, s) è continua in [a, b] × (c, d). Allora
e tale che ds
Z b
Z b
d
d
L(t, s) dt =
L(t, s) dt
∀s ∈ (c, d) .
ds a
a ds
Dimostrazione. Fissati s ∈ (c, d) e un intervallo [s − δ, s + δ] ⊂ (c, d), per h ∈ [−δ, δ] \ {0}
abbiamo
Rb
Rb
Z b
Z b
L(t, s + h) − L(t, s)
d
a L(t, s + h) dt − a L(t, s) dt
=
dt =
L(t, s + θ(s, t, h)) dt
h
h
a
a ds
d
con |θ(s, t, h)| < h. Grazie all’uniforme continuità di ds
L(s, t) in [a, b] × [s − δ, s + δ] garantita da
(ii) abbiamo
d
d
L(t, s + θ(s, t, h)) → L(t, s)
uniformemente in [a, b], per h → 0 .
ds
ds
Quindi il teorema di passaggio al limite sotto il segno di integrale9 ci consente di concludere.
9Se g sono funzioni integrabili secondo Riemann in [a, b], convergenti uniformemente in [a, b] a g, allora g è
h
Rb
h→∞ a
integrabile secondo Riemann in [a, b] e lim
gh (t) dt =
Rb
a
g(t) dt.
12. CAMPI VETTORIALI, INTEGRALI CURVILINEI, POTENZIALI
196
Teorema 7.44 (Esistenza di potenziali per campi chiusi). Sia A ⊂ Rn aperto convesso e
F : A → Rn un campo vettoriale chiuso e di classe C 1 . Allora F ha un potenziale V ∈ C 2 (A).
Dimostrazione.
Tenendo presente la Proposizione 7.42, basterà dimostrare che F è conservativo
R
in A, i.e. γ F = 0 per ogni cammino γ ∈ P C 1 ([a, b]; Rn ) chiuso contenuto in A. Sia γ un tale
cammino e poniamo
Z bX
Z
n
F =s
Fi (x̄ + s(γ(t) − x̄))γi0 (t) dt ,
I(s) :=
a i=1
γs
ove γs è il cammino deformato con un’omotetia di centro x̄, i.e. γs (t) := x̄ + s(γ(t) − x̄), 0 ≤ s ≤ 1.
È immediato verificare grazie al teorema di passaggio al limite sotto il segno di integrale che I è
una funzione continua in [0, 1]. Calcoliamo la derivata di I(s), usando il teorema di derivazione
sotto il segno di integrale nei domini [ti , ti+1 ] × (0, 1) e con la funzione
L(t, s) =
n
X
Fi (x̄ + s(γ(t) −
i=1
x̄))γi0 (t)
,
n
X
d
∂Fi
L(t, s) = s
(x̄ + s(γ(t) − x̄))γj (t)γi0 (t)
ds
∂xj
i, j=1
intendendo nei valori estremi t = ti ,t = ti+1 le derivate destre e sinistre rispettivamente. Usando
prima il fatto che F è chiuso, poi la formula di integrazione per parti e infine il fatto che γ è un
cammino chiuso otteniamo:
Z b X
Z bX
n
n
∂Fi
0
0
I (s) =
Fi (x̄ + s(γ(t) − x̄))γi (t) dt + s
(x̄ + s(γ(t) − x̄))(γj (t) − x̄)γi0 (t) dt
a i=1
a i, j=1 ∂xj
Z bX
Z b X
n
n
∂Fj
(x̄ + s(γ(t) − x̄))(γj (t) − x̄)γi0 (t) dt
=
Fi (x̄ + s(γ(t) − x̄))γi0 (t) dt + s
∂x
i
a i=1
a i, j=1
Z bX
Z bX
n
n
d
=
Fi (x̄ + s(γ(t) − x̄))γi0 (t) dt +
Fj (x̄ + s(γ(t) − x̄)) (γj (t) − x̄) dt
a i=1
a i=1 dt
Z bX
Z
n
n
bX
=
Fi (x̄ + s(γ(t) − x̄))γi0 (t) dt −
Fj (x̄ + s(γ(t) − x̄))γj0 (t) dt = 0 .
a i=1
a j=1
Abbiamo
R quindi che I ha derivata nulla in (0, 1), quindi è costante in [0, 1]. Dato che I(0) = 0 e
I(1) = γ F , questo mostra che F ha integrale nullo su ogni cammino chiuso.
Si noti che con la sola connessione (per archi) di A la definizione di V avrebbe avuto potenzialmente
senso, ma in genere la definizione non sarebbe stata ben posta. Si consideri ad esempio l’aperto
connesso A = R2 \ {(0, 0)} e il campo
x −y
F (x, y) = 2
, 2
.
2
x + y x + y2
È facile verificare che il campo F è chiuso, quindi in ogni aperto convesso contenuto in A il campo
ha un potenziale (ad esempio V (x, y) = arctg (y/x) nelle regioni in cui x 6= 0, V (x, y) = arcctg (x/y)
nelle regioni in cui y 6= 0). Tuttavia questi potenziali
locali non possono dar luogo a un potenziale
R
globale, dato che per γ(t) = (sin t, cos t) si ha γ F = −2π 6= 0.
Osservazione 7.45 (Approfondimenti). (1) Anche se abbiamo trattato l’argomento in un fissato sistema di coordinate, è bene tenere presente che tutto quello che abbiamo detto può essere
formulato nel linguaggio degli spazi vettoriali, dei vettori e dei co-vettori (si ricordi la distinzione
13. *LA MATRICE HESSIANA
197
tra gradiente e differenziale), senza far riferimento a un sistema privilegiato di coordinate. Da
questo punto di vista, un campo vettoriale F va inteso in realtà come campo di covettori, i.e. in
ogni punto di x ∈ A è definito un funzionale lineare Fx : Rn → R, mentre γ 0 (t) è inteso come vettore
tangente alla curva in x = γ(t), dimodoché Fγ(t) (γ 0 (t)) ha senso e l’integrale curvilineo diventa
Z b
Z
Fγ(t) (γ 0 (t)) dt
γ : [a, b] → Rn .
F =
γ
a
La definizione di potenziale allora è F = dV , i.e. Fx (v) = dx V (v) per ogni vettore v. Nel sistema di
coordinate canonico, usando il prodotto scalare per scrivere dx V (v) = h∇V (x), vi, questi concetti
si riducono a quelli usuali.
(2) Osserviamo infine che in tutta questa sezione sarebbe stato sufficiente lavorare nella sottoclasse
dei cammini affini a tratti (i.e. richiedendo a γ 0 di essere costante negli intervalli [ti , ti+1 ]), dato
che gli aperti connessi sono connessi per archi affini a tratti.
(2) L’esempio precedente mostra che qualche ipotesi sull’insieme A è necessaria per poter costruire
un potenziale a partire da un campo chiuso. Tuttavia, la convessità non è la condizione ottimale, ad
esempio in dimensione 3 il risultato sarebbe valido per A = R3 \ {0}, che non è convesso. L’ipotesi
ottimale richiede la possibilità di rappresentare ogni cammino semplice e chiuso contenuto in A
come frontiera orientata in senso orario o antiorario di una superficie U interamente contenuta in
A. La dimostrazione richiede la possibilità di decomporre ogni cammino chiuso γ come somma,
finita (se i cammini sono affini a tratti) o numerabile (nel caso generale) di cammini semplici e
chiusi γi che percorrono in senso orario o antiorario la frontiera di opportuni insiemi Ui , con Ui
poliedrale se γ è affine a tratti; a ognuno di questi cammini γi si applica poi in dimensione n = 2
la formula di Green che lega l’integrale curvilineo lungo γi a un integrale doppio esteso al dominio
Ui :
Z
Z
∂F2
∂F1
(x, y) −
(x, y) dxdy
(il segno dipende dal verso di percorrenza) .
F =±
∂x
γi
Ui ∂y
R
Tale teorema consente di concludere, se F è chiuso, che γi F = 0. In dimensione n = 3 o superiore
è necessario usare il cosiddetto teorema di Stokes, e in ogni caso le tecniche richieste per una
trattazione rigorosa non sono elementari, neanche in dimensione 2.
13. *La matrice Hessiana
Sia f : A → R una funzione dotata di derivate parziali seconde continue in un aperto A ⊆ Rn ,
continue in un punto x ∈ A. Per il Teorema 7.39, la matrice Hessiana di f in x, avente come righe
i gradienti delle derivate parziali di f ,
 2

∂ f
∂2f
∂2f
(x)
(x)
·
·
·
(x)
∂x2 ∂x1
∂xn ∂x1
1
 ∂x∂12∂x

f
∂2f
∂2f


(x)
(x)
·
·
·
∂x2 ∂x2
∂xn ∂x2 (x) 
 ∂x1 ∂x2


..
..
..
..
Hf (x) = D∇f (x) = 

.
.
.
.






2
2
2
∂ f
∂ f
∂ f
∂x1 ∂xn (x) ∂x2 ∂xn (x) · · ·
∂xn ∂xn (x)
è simmetrica. La matrice Hessiana Hf compare nello sviluppo di Taylor al secondo ordine di una
funzione di classe C 2 .
13. *LA MATRICE HESSIANA
198
Teorema 7.46. Sia f : A → R una funzione di classe C 2 in un aperto A ⊆ Rn , e sia x ∈ A. Si ha
allora lo sviluppo di Taylor del secondo ordine centrato in x,
1
f (x + h) = f (x) + ∇f (x) · h + th(Hf (x))h + o |h|2
(h → 0)
2
n
n
X
1 X ∂2f
∂f
= f (x) +
(x)hj +
(x)hi hj + o |h|2
(h → 0) .
∂xj
2
∂xi ∂xj
j=1
i,j=1
Dimostrazione. Sia Br (x) una palla con centro in x contenuta in A. Dato h con |h| < r, si
consideri la funzione
g(t) = f (x + th) = f (x1 + th1 , . . . , xn + thn ) .
Essa è definita (almeno) sull’intervallo (−1 − δ, 1 + δ), con δ = r − |h|. Applicando due volte la
regola di derivazione della funzione composta, si ha
n
X
∂f
g (t) =
(x + th)hj
∂xj
0
e
00
g (t) =
j=1
n
X
i,j=1
∂2f
(x + th)hi hj .
∂xi ∂xj
Applicando ora la formula di Taylor in una variabile con resto di Lagrange, esiste θ = θ(h) ∈ (0, 1)
tale che
g(1) = g(0) + g 0 (0) + g 00 (θ) ,
ossia
(13.1)
n
n
X
∂f
1 X ∂2f
f (x + h) = f (x) +
(x)hj +
(x + θh)hi hj .
∂xj
2
∂xi ∂xj
i,j=1
j=1
Allora la differenza
n
n
X
∂f
1 X ∂2f
(x)hj −
(x)hi hj
f (x + h) − f (x) −
∂xj
2
∂xi ∂xj
j=1
i,j=1
è uguale a
n
n
X
1 X ∂2f
∂2f
(x + θh)hi hj −
(x)hi hj .
2
∂xi ∂xj
∂xi ∂xj
i, j=1
i,j=1
|h0 |
Dato ε > 0, sia δ > 0 tale che, per
< δ e per ogni i, j,
∂2f
∂2f
(x + h0 ) −
(x) < ε .
∂xi ∂xj
∂xi ∂xj
Se |h| < δ si ha allora
n
n
n
ε X
X
∂f
1 X ∂2f
(x)hj −
(x)hi hj ≤
|hi ||hj |
f (x + h) − f (x) −
∂xj
2
∂xi ∂xj
2
j=1
i,j=1
i,j=1
≤
che dà la tesi.
n2
2
ε|h|2 ,
Si noti incidentalmente che la formula (13.1) fornisce lo sviluppo di Taylor al primo ordine con
resto di Lagrange.
14. *DISCUSSIONE DELLA NATURA DEI PUNTI STAZIONARI LIBERI
199
14. *Discussione della natura dei punti stazionari liberi
Sia f : A → R una funzione di classe C 2 su un aperto A ⊆ Rn , e sia x ∈ A un punto stazionario,
cioè con ∇f (x) = 0. Lo studio della matrice Hessiana può consentire di determinare se x è un
punto di massimo o minimo locale, o di sella, o altro.
Diamo la seguente definizione.
Definizione 7.47 (Segno di matrici simmetriche). Una matrice simmetrica S si dice:
• definita positiva, e scriveremo S > 0 (risp. definita negativa, S < 0), se i suoi autovalori
sono tutti strettamente positivi (risp. strettamente negativi);
• semidefinita positiva, e scriveremo S ≥ 0 (risp. semidefinita negativa, S ≤ 0) se i suoi
autovalori sono tutti maggiori o uguali a 0 (risp. minori o uguali a 0);
• indefinita se ha autovalori sia positivi sia negativi.
Vale la seguente proprietà.
Lemma 7.48. Sia S una matrice simmetrica, e siano λmin e λmax i suoi autovalori minimo e
massimo, rispettivamente. Allora la forma quadratica QS (x) = txSx soddisfa le disuguaglianze
(14.1)
λmin |x|2 ≤ QS (x) ≤ λmax |x|2
∀x ∈ Rn ,
e da ciascun lato vale l’uguaglianza per un certo x 6= 0 se e solo se x è autovettore del corrispondente
autovalore.
In particolare,
• S ≥ 0 se e solo se QS ≥ 0 in Rn ;
• S > 0 se e solo se QS > 0 in Rn \ {0};
• S è indefinita se e solo se QS assume sia valori positivi che negativi.
In dimensione n = 2, i tre casi sono esemplificati, nell’ordine, dalle tre forme quadratiche
x2 ,
x2 + y 2 ,
x2 − y 2 .
Dimostrazione. P
Sia {v1 , . . . , vn } una base ortonormale di Rn in cui ogni vj è autovettore di
autovalore λj . Se x = n1 yj vj , si ha
QS (x) =
n
X
yi yj tvi Svj =
In particolare, per S = I, vale
vale l’uguaglianza
yi yj λj tvi vj =
i, j=1
i, j=1
|x|2
n
X
=
Pn
2
1 yi .
n
X
i=1
n
X
λi yi2 .
i=1
Le disuguaglianze (14.1) sono dunque ovvie. Inoltre
λi yi2
= λmin
n
X
yi2
i=1
se e solo se vale la condizione λj 6= λmin ⇒ yj = 0, cioè se e solo se x è nell’autospazio
dell’autovalore λmin . Analogamente per la seconda disuguaglianza. Il resto dell’enunciato segue
facilmente.
Torniamo dunque ai punti stazionari. Come per funzioni di variabili reale il seguente criterio dà
condizioni solo sufficienti ma non necessarie per minimalità/massimalità locale, o necessarie ma
non sufficienti.
Teorema 7.49 (Condizioni per la massimalità/minimalità locale). Sia f : A → R di classe
C 2 su un aperto A ⊆ Rn , e sia x ∈ A un suo punto stazionario. Allora
15. ESERCIZI
200
(i) se la matrice Hessiana Hf (x) è definita positiva, allora x è un punto di minimo locale;
(ii) se la matrice Hessiana Hf (x) è definita negativa, allora x è un punto di massimo locale;
(iii) se la matrice Hessiana Hf (x) è indefinita, allora x non è né di massimo, né di minimo
locale.
Dimostrazione. Se Hf (x) = S è definita positiva, si consideri la differenza
1
f (x + h) − f (x) = QS (h) + o |h|2
h → (0, 0) ,
2
per il Teorema 7.46. Esiste δ > 0 tale che, per |h| < δ, il resto o |h|2 è minore, in valore assoluto
di (λmin /4)|h|2 . Per la formula (14.1), sempre per |h| < δ,
f (x + h) − f (x) >
λmin 2
|h| ,
4
e dunque x è di minimo locale.
Il punto (ii) è analogo. Per il punto (iii), sia vmax e vmin autovettori di autovalore λmax > 0 e
λmin < 0. Le due funzioni g+ (t) = f (x + tvmax ) e g− (t) = f (x + tvmin ) hanno in t = 0 un punto
rispettivamente di minimo e di massimo stretti. Quindi x non può essere né di massimo, né di
minimo locale.
Nel caso in cui la matrice Hessiana è solo semidefinita, ma con un autovalore nullo, non si può
concludere in modo analogo. Le tre funzioni
f1 (x, y) = x2 + y 4 ,
f2 (x, y) = x2 − y 4 ,
f3 (x, y) = x2 + y 3 ,
2 0
hanno tutte matrice Hessiana nell’origine uguale a
, ma nel primo caso (0, 0) è un punto di
0 0
minimo (stretto), nel secondo si ha una configurazione che somiglia al “punto di sella”, nel terzo
una configurazione ancora diversa.
La nozione di punto di sella non è facilmente formulabile in modo rigoroso in termini geometrici,
soprattutto per funzioni di più di 2 variabili. La definizione comunemente adottata è quella espressa
al punto (iii) (funzione C 2 con matrice Hessiana indefinita).
Togliendo l’ipotesi che x sia un punto stazionario, la condizione Hf (x) definita positiva implica10
che, per x = x + h in un intorno di x, vale la condizione di convessità stretta nel punto x:
(14.2)
f (x + h) > f (x) + ∇f (x) · h .
15. Esercizi
Esercizio 7.1.
Sia f : R2 → R una funzione tale che
p
f (x, y) = a + bx + cy + o( x2 + y 2 ) ,
con a, b, c ∈ R. Si provi che f è differenziabile nell’origine di R2 e si dica che differenziale ha.
Se f : R2 → R è una funzione tale che
|f (x, y)| ≤ C(x2 + y 2 ) ,
per una costante C ∈ R. Si provi che f è differenziabile nell’origine di R2 e si dica che differenziale
ha.
10con una piccola modifica alla dimostrazione precedente.
15. ESERCIZI
201
Esercizio 7.2.
Sia L : Rn → Rm una mappa lineare, si provi che dLx = L, per ogni x ∈ Rn .
Sia f : Rn → Rm una mappa affine, cioè f = L + v con L lineare e v ∈ Rm , allora dLx = L, per
ogni x ∈ Rn .
Sia B : Rn × Rm → Rk una mappa bilineare, cioè B(·, y) : Rn → Rk è lineare per ogni y ∈ Rm e
B(x, ·) : Rm → Rk è lineare per ogni x ∈ Rn . Si calcoli il suo differenziale in un punto (x, y) ∈
Rn × Rm .
Esercizio 7.3.
Sia L : Rn → Rn una mappa lineare e f : Rn → R differenziabile infinite volte, si calcoli il
differenziale n–esimo di f ◦ L.
Esercizio 7.4.
Sia γ : (a, b) → Rn una curva differenziabile a valori nella sfera unitaria Sn−1 di Rn . Si provi che
vale
hγ 0 (t) | γ(t)i = 0
per ogni t ∈ (a, b).
Sia f : Ω → Rn una mappa differenziabile in un aperto Ω ∈ Rn a valori nella sfera unitaria Sn−1 di
Rn . Si provi che vale
hdfx (v) | f (x)i = 0
per ogni x ∈ Ω e v ∈ Rn .
Esercizio 7.5.
Sia f : [a, b] → Rn una curva continua, differenziabile in (a, b), si mostri con un esempio che il
teorema di Lagrange non vale in generale, cioè potrebbe non esistere un punto ξ ∈ (a, b) tale che
f (b) − f (a) = f 0 (ξ)(b − a) .
Si mostri che vale la disuguaglianza di valor medio: esiste ξ ∈ (a, b) tale che
kf (b) − f (a)k ≤ kf 0 (ξ)k |b − a| .
Esercizio 7.6.
Sia f : [a, b] → R2 una curva continua, differenziabile in (a, b), esiste sempre un punto ξ ∈ (a, b)
tale che f 0 (ξ) = λ f (b) − f (a) , per qualche λ ∈ R? Lo stesso vale per una curva in R3 o Rn ? Si
può richiedere che la costante λ sia positiva (cioè che il vettore tangente in ξ alla curva abbia lo
stesso “verso” del vettore f (b) − f (a))?
Esercizio 7.7.
Si mostri una curva chiusa γ : [a, b] → Rn differenziabile tale che γ 0 (t) 6= 0, per ogni t ∈ [a, b].
Esercizio 7.8.
Sia f : Rn → R una funzione differenziabile e x, y ∈ Rn , si mostri che esiste ξ nell’interno del
segmento che unisce x a y tale che
f (x) − f (y) = h ∇f (ξ) | x − y i .
In particolare, se k∇f (x)k ≤ C per ogni x ∈ Rn , si ha
|f (x) − f (y)| ≤ Ckx − yk
e la funzione f è Lipschitziana di costante C.
15. ESERCIZI
202
Esercizio 7.9.
Sia f : Rn → Rm una mappa differenziabile e x, y ∈ Rn , si mostri che esiste ξ nell’interno del
segmento che unisce x a y tale che
kf (x) − f (y)k ≤ kdfξ k2 kx − yk ,
dove kdfξ k2 indica la norma quadratica della matrice Jacobiana in ξ . In particolare, se kdfx k2 ≤ C
per ogni x ∈ Rn , si ha
kf (x) − f (y)k ≤ Ckx − yk
e la mappa f è Lipschitziana di costante C.
Esercizio 7.10.
Si provi che i risultati dei due problemi precedenti valgono anche se le funzioni sono definite in un
convesso aperto di Rn .
Si dica inoltre se in tali problemi la condizione di differenziabilità della funzione f si può sostituire
con la sola esistenza delle derivate parziali in ogni punto.
Esercizio 7.11.
Sia f : Rn → R una mappa differenziabile e x, y ∈ Rn , sia γ : [a, b] → Rn una curva affine a tratti
(poligonale) con γ(a) = x e γ(b) = y. Se k∇f (x)k ≤ C per ogni x ∈ Rn , si mostri che vale
|f (x) − f (y)| ≤ C · L(γ) ,
dove L(γ) è la lunghezza della curva γ.
Esercizio 7.12.
Sia f : Ω → Rm una mappa differenziabile in un aperto Ω di Rn , si mostri che se kdfx k2 ≤ C per
ogni x ∈ Rn , la mappa f è localmente Lipschitziana di costante C.
Si mostri che se una mappa f : Ω → Rm è di classe C 1 in un aperto Ω di Rn , allora è localmente
Lipschitziana.
Esercizio 7.13.
Sia f : Ω → R una funzione tale che esistano le sue derivate parziali coordinate in ogni punto di
un aperto Ω di Rn e siano tutte limitate√in modulo da una costante C. Si mostri che la mappa f è
localmente Lipschitziana di costante C n.
Si estenda la conclusione alle mappe f : Ω → Rm .
Esercizio 7.14.
Sia f : Ω → R una funzione da un aperto connesso in R tale che esistano le sue derivate parziali
coordinate e siano tutte nulle in ogni punto di Ω. si mostri che la funzione f è costante.
Esercizio 7.15.
Si dia un esempio di un aperto limitato e connesso Ω ⊂ Rn e di una funzione differenziabile
f : Ω → R con k∇f (x)k ≤ C per ogni x ∈ Ω, tale che f non sia Lipschitziana.
Esercizio 7.16.
Se f : Ω → R è una funzione differenziabile da un sottoinsieme aperto e non connesso di Rn con
k∇f (x)k ≤ C per ogni x ∈ Ω, vale la disuguaglianza
|f (x) − f (y)| ≤ Ckx − yk ,
per ogni x, y ∈ Ω?
15. ESERCIZI
203
Esercizio 7.17. F
Sia Ω ⊂ Rn un aperto connesso che soddisfa la seguente condizione: esiste una costante D tale che
per ogni due punti x, y ∈ Ω, definendo δΩ (x, y) = inf L(γ), dove l’inf è preso su tutte le curve affini
a tratti γ che congiungono x a y e L(γ) è la lunghezza di γ, si ha
δΩ (x, y) ≤ Dkx − yk .
Si provi che allora se per una funzione differenziabile f : Ω → R si ha k∇f (x)k ≤ C per ogni x ∈ Ω,
tale funzione f è Lipschitziana.
Esercizio 7.18.
Sia f : Ω → R una funzione continua, differenziabile in Ω, con Ω ⊂ Rn aperto limitato. Se f |∂Ω = 0,
si provi che esiste x ∈ Ω tale che ∇f (x) = 0.
Esercizio 7.19.
Sia T un triangolo di vertici A, B, C nel piano e f : T → R una funzione differenziabile in un
aperto di R2 contenente T e tale che f (A) = f (B) = f (C) = 0. Esiste sempre un punto x ∈ T tale
che ∇f (x) = 0?
Esercizio 7.20.
Si studino le proprietà di continuità, Lipschitzianità, differenziabilità, esistenza di derivate parziali
in 0 ∈ R2 delle funzioni f, g, h : R2 → R definite da
xy
f (x, y) = p
, per (x, y) 6= (0, 0) e f (0, 0) = 0,
x2 + y 2
x2 y 2
, per (x, y) 6= (0, 0) e f (0, 0) = 0,
g(x, y) = p
x2 + y 2
x3 y 3
h(x, y) = p
, per (x, y) 6= (0, 0) e f (0, 0) = 0.
x2 + y 2
Esercizio 7.21.
Si dia un esempio di una funzione f : R2 → R differenziabile dappertutto ma con derivate parziali
coordinate non continue in 0 ∈ R2 .
Esercizio 7.22.
Si dia un esempio di una funzione f : R2 → R che sia C ∞ in R2 \ {0}, C ∞ su tutte le rette del
piano (quindi esistano tutte le derivate parziali anche nell’origine), ma non continua in 0 ∈ R2 .
Esercizio 7.23. F
Sia f : Rn → R Lipschitziana. Fissato x ∈ Rn , si consideri l’insieme
D = v ∈ Rn : esiste ∂v f (x) .
Si mostri che D è chiuso.
Se D = Rn e la mappa v 7→ ∂v f (x) è lineare, si mostri che f è differenziabile in x.
Esercizio 7.24.
Sia f : R2 → R la funzione definita da
p
x2 y x2 + y 2
,
f (x, y) =
x4 + y 2
per (x, y) 6= (0, 0) e f (0, 0) = 0. Si mostri che esiste ∂v f (0) ed è uguale a zero per ogni v ∈ Rn , che
la mappa v 7→ ∂v f (0) è lineare ma che f non è differenziabile in 0 ∈ R2 (f non è Lipschitziana, né
continua nell’origine).
15. ESERCIZI
204
Esercizio 7.25.
Sia f : R2 → R la funzione definita da
x3
,
x2 + y 2
per (x, y) 6= (0, 0) e f (0, 0) = 0. Si mostri che esiste ∂v f (0) con k∂v f (0)kR2 ≤ 1 per ogni v ∈ Rn , la
mappa f è Lipschitziana ma f non è differenziabile in 0 ∈ R2 (la mappa v 7→ ∂v f (0) non è lineare).
f (x, y) =
Esercizio 7.26.
Se una funzione f : Rn → R è continua, differenziabile in Rn \ {0} e dfx → L per x → 0, allora f è
differenziabile anche nell’origine con df0 = L?
Esercizio 7.27. F
Sia f : Rn → R una funzione tale che esistano le sue derivate parziali. Si mostri che se n − 1
derivate parziali sono continue nell’origine, la funzione f è differenziabile in 0 ∈ Rn .
Esercizio 7.28. FF
Sia f : Rn → R una funzione tale che per ogni curva differenziabile γ : (−ε, ε) → Rn con γ(0) = 0 si
ha che la funzione f ◦ γ : (−ε, ε) → R è derivabile in t = 0 con derivata nulla. Allora la funzione f
è differenziabile nell’origine di Rn con differenziale nullo? E se la condizione vale solo per le curve
C 1 , C 2 , . . . , C ∞ ? O solo per le curve parametrizzate in lunghezza d’arco?
Esercizio 7.29.
Si dia un esempio di una funzione f : R2 → R tale che la derivata seconda
∂2f
∂x∂y
esista ma non esista
∂f
∂x .
Esercizio 7.30.
Si provi che la funzione definita da
f (x, y) =
xy(x2 − y 2 )
,
x2 + y 2
per (x, y) 6= (0, 0) e f (0, 0) = 0, soddisfa
∂2f
(0, 0) = 1
∂x∂y
e
∂2f
(0, 0) = −1 .
∂y∂x
Esercizio 7.31. F
Sia f : Ω → R una funzione tale che esistano le sue derivate parziali prime e seconde in Ω aperto
2f
di Rn . Si provi che se la derivata seconda mista ∂x∂i ∂x
(x) è continua in x ∈ Ω, allora
j
∂2f
∂2f
(x) =
(x) .
∂xi ∂xj
∂xj ∂xi
Esercizio 7.32.
Sia f : Ω → R di classe C k nell’aperto Ω ⊆ Rn , si provi che allora
∂kf
∂kf
=
,
∂xi1 ∂xi2 . . . ∂ik
∂xj1 ∂xj2 . . . ∂jk
per ogni permutazione j1 , j2 , . . . , jk degli indici i1 , i2 , . . . , ik .
Quante sono le possibili derivate parziali di ordine k distinte della funzione f ?
Esercizio 7.33.
Si trovino tutte le funzioni differenziabili f : Rn → R tali che dfx sia costante, per x ∈ Rn .
15. ESERCIZI
205
Esercizio 7.34.
Si trovino tutte le funzioni differenziabili f : Rn → R tali che
Si trovino tutte le funzioni due volte differenziabili f :
R2
∂f
∂x1
= 0.
→ R tali che
Si trovino tutte le funzioni due volte differenziabili f : R2 → R tali che
∂2f
∂x∂y = 0.
∂2f
= 0.
∂x2
Esercizio 7.35.
Si caratterizzino le funzioni differenziabili f : R2 → R tali che
∂f
∂f
x (x, y) + y (x, y) = 0 ,
∂x
∂y
per ogni (x, y) ∈ R2 .
Si caratterizzino le funzioni differenziabili f : R2 → R tali che
∂f
∂f
x (x, y) − y (x, y) = 0 ,
∂y
∂x
per ogni (x, y) ∈ R2 .
Esercizio 7.36 (Teorema di Eulero).
Una funzione F : R2 → R tale che esista n ∈ N tale che valga F (tx, ty) = tn F (x, y) per ogni
(x, y) ∈ R2 e t > 0 si dice (positivamente) omogenea di grado n.
Si mostri che se la funzione differenziabile f : R2 → R è omogenea di grado n, si ha
∂F
∂F
x
(x, y) + y
(x, y) = nF (x, y) ,
∂x
∂y
per ogni (x, y) ∈ R2 .
Esercizio 7.37 (Laplaciano – Funzioni Armoniche).
Data una funzione u : Ω → R, con Ω aperto di Rn , si definisce il suo Laplaciano ∆u : Ω → R come
∆u(x) =
∂2u
∂2u
∂2u
(x) .
(x)
+
(x)
+
·
·
·
+
∂x2n
∂x21
∂x22
Una funzione che soddisfi ∆u = 0 (equazione di Laplace) in Ω si dice armonica.
Si trovi per quali α ∈ R la funzione
1
fα (x) =
,
kxkα
con n 6= 2, è armonica in Rn \ {0}.
Si mostri una funzione armonica dipendente solo da kxk su R2 \ {0}.
Esercizio 7.38.
Si trovino tutte le funzioni armoniche dipendenti solo da kxk su Rn \ {0}.
Esercizio 7.39.
Si calcoli il Laplaciano della funzione f (x, y) = arctan(x/y) in R2 \ {y = 0}.
Esercizio 7.40.
Data una funzione armonica in un aperto Ω ⊆ Rn , si trovino tutte le funzioni ϕ ∈ C 2 (R) tali che
ϕ ◦ u sia ancora armonica.
Esercizio 7.41.
Si calcoli il Laplaciano di una funzione u : R2 → R in coordinate polari.
Si mostri che se φ : Rn → Rn è un’isometria, si ha ∆(u ◦ φ) = ∆u ◦ φ.
15. ESERCIZI
206
Esercizio 7.42 (Equazione del Calore).
Una funzione u : Ω × (a, b) → R, con Ω aperto di Rn , soddisfa l’equazione del calore se
∂u
(x, t) = ∆u(x, t) ,
∂t
per ogni x ∈ Ω e t ∈ (a, b).
Si mostri che la funzione
kxk2
1
u(x, t) = n/2 e− 4t
t
soddisfa l’equazione del calore in R+ × Rn (questa funzione è detta nucleo del calore in 0 ∈ Rn ).
Esercizio 7.43 (Equazione della Corda Vibrante). F
Una funzione u : R × (a, b) → R, soddisfa l’equazione della corda vibrante se
2
∂2u
2 ∂
(x,
t)
=
c
(x, t) ,
∂t2
∂x2
per ogni x ∈ R e t ∈ (a, b), dove c è una costante reale diversa da zero.
Si mostri che date due funzioni f, g ∈ C 2 (R), la funzione
u(x, t) = f (x + ct) + g(x − ct)
soddisfa l’equazione della corda vibrante in R × R. Ci sono altre soluzioni?
Nota. La versione n–dimensionale di questa equazione è l’equazione delle onde (detta anche
equazione di d’Alembert). Una funzione u : Ω × (a, b) → R la soddisfa se
∂2u
(x, t) = c2 ∆u(x, t) ,
∂t2
per ogni x ∈ Ω e t ∈ (a, b), dove c è una costante reale diversa da zero.
Esercizio 7.44. F
Si provi che tutte le soluzioni u : R × (a, b) → R di classe C 2 dell’equazione
2
∂2u
∂u
2∂ u
(x,
t)
=
x
(x, t) + x (x, t)
∂t2
∂x2
∂x
hanno la forma
u(x, t) = f (xet ) + g(xe−t ) ,
dove f, g sono due funzioni in C 2 (R).
Esercizio 7.45. F
Una funzione f = (f1 , f2 ) : R2 → R2 soddisfa nel punto (x0 , y0 ) le equazioni di Cauchy–Riemann
se è differenziabile in (x0 , y0 ) e si ha
∂f1
∂f2
∂f1
∂f2
(x0 , y0 ) =
(x0 , y0 )
e
(x0 , y0 ) = −
(x0 , y0 ) .
∂x
∂y
∂y
∂x
Si provi che allora, vedendo f come una mappa da C in C, posto z0 = x0 + iy0 , esiste il limite
(derivata complessa di f in z0 )
f (z) − f (z0 )
lim
z→z0
z − z0
∂f1
∂f2
ed è uguale a ∂x (x0 , y0 ) + i ∂x (x0 , y0 ). Si mostri che vale anche il viceversa e si provi che soddisfare
le equazioni di Cauchy–Riemann è equivalente al fatto che il differenziale della funzione f in (x0 , y0 ),
visto come una funzione da C in C, è C–lineare.
Una funzione f : Ω → R2 di classe C 1 , con Ω ⊆ R2 , vista come una mappa da un aperto Ω di C in
15. ESERCIZI
207
C, che soddisfi le equazioni di Cauchy–Riemann in ogni punto di Ω, si dice olomorfa (o analitica)
in Ω.
Esercizio 7.46. F
Si mostri che la famiglia delle funzioni olomorfe in un aperto Ω ⊂ R2 ≈ C è uno spazio vettoriale,
chiuso per prodotto e che se f : Ω → C è olomorfa e mai nulla, anche 1/f lo è. Si mostri inoltre che
per ogni n ∈ N, la funzione f (z) = z n è olomorfa su tutto C, quindi anche ogni polinomio p ∈ C[z].
Esercizio 7.47. F
Si mostri che se una funzione olomorfa in un aperto Ω ⊂ R2 ≈ C ha derivata complessa in z0 ∈ Ω
diversa da zero, allora è localmente invertibile in un intorno di z0 e la sua inversa è olomorfa.
Esercizio 7.48.
Si mostri che se f = (f1 , f2 ) : Ω → R2 è una funzione C 2 ed olomorfa, le due componenti f1 e f2
sono funzioni armoniche.
Tali funzioni f1 e f2 si dicono armoniche coniugate.
Esercizio 7.49 (Principio del Massimo per Funzioni Armoniche).
Sia u : B → R una funzione continua da una palla chiusa B di Rn armonica nell’interno B.
• Supponendo che u prenda massimo in x0 ∈ B e che tale massimo sia maggiore del massimo
di u ristretta al bordo ∂B della palla, si mostri che per ε > 0 abbastanza piccolo, le funzioni
uε : B → R definite da uε (x) = u(x) + εkx − x0 k2 , per ogni x ∈ B, assumono massimo in
un punto xε0 all’interno della palla.
• Si mostri che ∆uε = ∆u + 2ε = 2ε > 0 in ogni punto di B.
• Si provi che ∆uε (xε0 ) ≤ 0 in contraddizione col punto precedente.
Si concluda che per una funzione armonica u : B → R vale
min u ≤ u(x) ≤ max u
∂B
∂B
e che se due funzioni armoniche coincidono sul bordo di una palla allora coincidono anche all’interno.
Esercizio 7.50.
Dati a1 , a2 , . . . ak ∈ Rn si trovi il minimo (si dica se esiste e se è unico) della funzione
f (x) =
k
X
kx − ai k2 .
i=1
Esercizio 7.51.
Si mostri che l’ipotesi di continuità del differenziale è necessaria nel teorema della funzione inversa,
anche nel caso unidimensionale.
Si consideri la funzione da R in R
f (x) = x + 2x2 sin (1/x) ,
per x 6= 0 e f (0) = 0, si ha f 0 (0) = 1, la derivata f 0 è limitata in (−1, 1) ma non è invertibile in
alcun intorno di 0 ∈ R.
Esercizio 7.52.
Si enunci/provi un analogo n–dimensionale della formula/teorema di Taylor per una funzione f :
Ω → R di classe C k nell’intorno di un punto x ∈ Ω ⊆ Rn .
Si usi tale formula per definire una procedura di analisi dei punti critici di una funzione nella
situazione in cui in un punto del dominio di definizione sia il gradiente che tutte le derivate seconde
di una funzione sono nulli.
15. ESERCIZI
208
Esercizio 7.53.
Si dimostri che se la matrice Hessiana Hf (x) è semidefinita positiva in ogni punto x di un aperto
convesso Ω ⊆ Rn , allora l’epigrafico della funzione f : Ω → R,
(x, t) ∈ Ω × R : t > f (x)
è un insieme convesso.
Esercizio 7.54.
Si mostri che se C è un convesso compatto di Rn e L : Rn → R è una mappa lineare, il massimo e
il minimo di L sono presi sul bordo di C (non necessariamente solo sul bordo).
Esercizio 7.55.
Si mostri che se Ω è un aperto limitato di Rn e f : Ω → R è una funzione continua e armonica in
Ω, il massimo e il minimo di f sono presi sul bordo di Ω (non necessariamente solo sul bordo).
Si mostri che se due funzioni armoniche in Ω e continue in Ω, coincidono su ∂Ω, allora sono uguali
in tutto Ω.
Nota. In realtà vale il principio del massimo forte che dice che se una funzione armonica f : Ω → R
assume massimo (anche locale) in un punto interno a Ω, allora è costante in tutta la componente
connessa di tale punto.
Esercizio 7.56.
Sia f : Rn → Rn e g : R → Rn due funzioni di classe C 1 . Sia h : Rn → Rn definita da
h(x1 , x2 , . . . , xn ) = f (g1 (x1 ), g2 (x2 ), . . . , gn (xn )) ,
si mostri che

g10 (x1 )
0
..

dh(x) = df (g1 (x1 ), g2 (x2 ), . . . , gn (xn )) ◦ 
.
0


.
0
gn (xn )
Esercizio 7.57.
Sia mostri che il teorema della funzione implicita implica il teorema della funzione inversa e
viceversa.
Esercizio 7.58. F
Sia A ⊂ Rn aperto e f : A → Rm , con m ≤ n, una funzione di classe C k . Sia x0 ∈ A con f (x0 ) = 0
e il rango di dfx0 uguale a m, si provi che esistono due intorni U e V di x0 e una mappa h : U → V
di classe C k con inversa h−1 di classe C k tale che f (h(x1 , x2 , . . . , xn )) = (xn−m+1 , xn−m+2 , . . . , xn )
per ogni x = (x1 , x2 , . . . , xn ) ∈ U .
Esercizio 7.59. F
Sia f : Rn → Rm , con m ≤ n, una funzione di classe C k tale che il rango di dfx0 uguale a m. Si
provi che un intorno di x0 è mandato dalla mappa f in un intorno di f (x0 ).
Esercizio 7.60. F
Sia GL(n, R) l’insieme delle matrici n × n invertibili, con la metrica indotta da Rn×n (si mostri che
GL(n, R) ẽ un aperto in Rn×n con tale metrica). Si dica se le seguenti mappe da GL(n, R) in sé o
in R sono differenziabili e, possibilmente, se ne calcoli il differenziale:
A 7→ A2 ,
A 7→ kAk22 ,
A 7→ A−1 ,
A 7→ det A ,
A 7→ kAk2 ,
A 7→ traccia A .
15. ESERCIZI
209
Esercizio 7.61.
Sia f : R2 → R di classe C 1 con ∇f 6= 0 in ogni punto dove f si annulla. Si mostri che allora {f = 0}
è l’unione disgiunta di una famiglia al più numerabile di sostegni di curve semplici γn : In → R2 di
classe C 1 , con In = (0, 1) oppure In = S1 .
Esercizio 7.62.
Sia Ω ⊆ R3 aperto e siano f, g : Ω → R di classe C 1 tali che in x0 ∈ Ω si abbia f (x0 ) = g(x0 ) = 0 e
∇f (x0 ) e ∇g(x0 ) siano linearmente indipendenti. Si mostri che l’insieme {x ∈ Ω : f (x) = 0} ∩ {x ∈
Ω : g(x) = 0} è una curva di classe C 1 in un intorno di x0 in Ω.
Esercizio 7.63.
Sia trovi, usando il teorema dei moltiplicatori di Lagrange, tra tutti i triangoli inscritti in un cerchio,
quello di area massima.
Esercizio 7.64. F
Sia f : B → R2 , dove B è la palla unitaria chiusa di R2 , una funzione C 1 fino al bordo tale che
kf (x)k = 1 per ogni x ∈ B, in altre parole f è una funzione da B in S1 ⊂ R2 , inoltre si abbia che
f (x) = x, se x ∈ ∂B = S1 .
Diciamo che x ∈ B è un punto regolare se dfx ha rango 1, singolare se dfx = 0. Diciamo che y ∈ S1
è un valore regolare se non è immagine per f di alcun punto singolare.
• Si mostri che se y ∈ S1 è un valore regolare allora f −1 (y) è l’unione disgiunta di una
famiglia finita di curve chiuse semplici di classe C 1 , contenute in B e di una famiglia di
archi semplici di classe C 1 con estremi in y ∈ S1 .
• Si provi che se un arco di curva C 1 ha estremi in y ∈ S1 , allora il punto y non può essere
un punto regolare, di conseguenza nemmeno un valore regolare in quanto f (y) = y.
• Si mostri che l’insieme dei valori regolari è denso in S1 .
• Si concluda che una siffatta funzione f non esiste.
Esercizio 7.65. F
Sia f : B → B una funzione C 1 fino al bordo.
Si mostri che se f non ha punti fissi, allora si può costruire una funzione g : B → S1 di classe C 1
tale che ristretta al bordo ∂B = S1 sia l’identità.
Si concluda che ogni funzione C 1 da una palla chiusa di R2 in sé ha almeno un punto fisso.
Esercizio 7.66.
Si mostri, (per approssimazione) usando il risultato del problema precedente, che ogni funzione continua da una palla chiusa di R2 in sé ha almeno un punto fisso (teorema di Brouwer in dimensione
2 – vale in realtà in ogni dimensione).
CAPITOLO 8
EQUAZIONI DIFFERENZIALI ORDINARIE
Si richiede la conoscenza di nozioni e risultati relativi all’integrale di Riemann (proprio e improprio)
e all’integrazione indefinita. In particolare useremo il teorema fondamentale del calcolo integrale
nella seguente formulazione: siano I ⊆ R un intervallo, x0 ∈ I e f : I → R continua; allora la
funzione integrale F : I → R definita da
Z x
F (x) :=
f (t) dt
x0
Ra
Rb
(qui adottiamo la convenzione, coerente con la teoria degli integrali curvilinei, a = − b , quindi
non importa che gli estremi dell’insieme di integrazione siano ordinati) è derivabile in I e la sua
derivata vale f .
1. Definizioni e primi esempi
Un’equazione differenziale ordinaria di ordine n ha come incognita una funzione y(x) definita su
intervallo aperto I ⊆ R (spesso non assegnato a priori) e ivi derivabile n volte. L’equazione consiste
nel richiedere che, per ogni x ∈ I, gli n + 2 numeri
x, y(x), y (1) (x), . . . , y (n) (x) ,
soddisfino una data relazione. Continuando a usare le notazioni tradizionali y 0 , y 00 , y 000 per derivate
di ordine fino a 3, esempi di equazioni differenziali sono:
y 0 = xy ,
2
y2 + y0 = 1 ,
y 000
= y 00 ,
y0 + x
ecc.
L’aggettivo “ordinaria” attribuito all’equazione differenziale si riferisce al fatto che le funzioni incognite dipendono da una sola variabile. Il termine serve quindi a distinguere le equazioni ordinarie dalle equazioni alle derivate parziali. Siccome di queste non parleremo (a parte il sistema
di equazioni alle derivate parziali ∇V = F trattato nel capitolo precedente), perchè argomento di
corsi (molto) più avanzati di Analisi, diremo brevemente “equazione differenziale” sottintendendo
il termine “ordinaria”.
In generale, un’equazione differenziale è definita in termini di una funzione g di n + 2 variabili,
definita su un insieme A ⊆ Rn+2 , ponendo
(1.1)
g x, y(x), y (1) (x), . . . , y (n) (x) = 0 .
Ovviamente, se y(x), definita su un intervallo I, è soluzione di un’equazione differenziale, la sua
restrizione a un qualunque sottointervallo I 0 ⊆ I è pure una soluzione. È dunque interessante conoscere l’insieme delle soluzioni massimali, cioè quelle non prolungabili (mantenendo la continuità
210
1. DEFINIZIONI E PRIMI ESEMPI
211
e la differenziabilità) a soluzioni definite su intervalli più ampi. L’insieme delle soluzioni massimali si chiama integrale generale dell’equazione differenziale. Una singola soluzione dell’equazione
differenziale si chiama anche integrale particolare dell’equazione.
L’equazione differenziale si dice in forma normale se A = B ×R con B ⊆ Rn+1 e nell’equazione (1.1)
è possibile isolare l’ultima variabile, i.e. la derivata di ordine massimo, a primo membro:
(1.2)
y (n) (x) = f x, y(x), y (1) (x), . . . , y (n−1) (x)
per una qualche funzione f : B → R. Per equazioni differenziali in forma normale il problema
di Cauchy consiste nel risolvere l’equazione (1.2) in un dato intervallo I ⊆ R con le n condizioni
iniziali
y(x0 ) = y0,1 , y (1) (x0 ) = y0,2 . . . y (n−1) (x0 ) = y0,n
per un certo x0 ∈ I e y0 = (y0,1 , . . . , y0,n ) ∈ Rn .
Esempi.
1. Data una funzione continua h(x) su un intervallo I, l’equazione
y 0 (x) = h(x)
∀x ∈ I
ha come soluzioni massimali le primitive di h su I. Quindi, se H(x) è una tale primitiva, l’integrale
generale dell’equazione coincide con l’integrale indefinito di h, ossia l’insieme delle funzioni
y(x) = H(x) + c
c∈R.
Già a livello di questa semplicissima equazione differenziale le questioni dell’esistenza e dell’unicità
delle soluzioni per il problema di Cauchy (i.e. avendo assegnato y(x0 ) = y0 ) diventano interessanti.
Applicando il teorema di Lagrange alla differenza di due soluzioni troviamo subito che l’unicità vale
sempre, mentre una condizione sufficiente per l’esistenza è, perRil teorema fondamentale del calcolo,
x
che h sia continua in I; in tal caso la soluzione è y(x) = y0 + x0 h(t) dt.
2. L’integrale generale di un’equazione differenziale può avere una struttura più complessa. Per
esempio, l’equazione
2
y2 + y0 = 1
ha come soluzioni le sinusoidi y(x) = sin(x + α) con α ∈ [0, 2π), le due funzioni costanti y(x) = ±1,
ma anche tutte le funzioni ottenute raccordando con continuità, su intervalli adiacenti, alternativamente sinusoidi e tratti con valore costante ±1.
3. Per un’equazione del primo ordine in forma normale,
y 0 (x) = f (x, y) ,
il grafico delle soluzioni deve essere ovviamente contenuto nel dominio della funzione f . La funzione
f assegna in ogni punto del dominio la “pendenza” che il graficop
di una soluzione deve avere se
passa per quel punto. La figura mostra il caso dell’equazione y 0 = 1 − x2 − y 2 .
2. METODI RISOLUTIVI PER ALCUNI TIPI DI EQUAZIONI DEL PRIMO ORDINE
212
4. Nei casi più comuni in cui serva studiare un’equazione in forma non normale, si cerca di ricondurla
a una, o più, equazioni in forma normale risolvendo l’equazione implicita g(t, u0 , u1 , . . . , un ) =
0 nella variabile un (cioè ricercando nell’equazione implicita g = 0 le eventuali funzioni un =
f (t, u0 , u1 , . . . , un−1 ) implicitamente definite in essa). L’equazione dell’Esempio 2 si riduce in forma
normale dando luogo alle due equazioni
p
p
y0 = − 1 − y2 .
(1.3)
y0 = 1 − y2 ,
Si noti tuttavia che le soluzioni della prima equazione sono crescenti e quelle della seconda decrescenti. Quindi non tutte le soluzioni massimali trovate nell’Esempio 2 rientrano in uno dei due
integrali generali delle equazioni in (1.3) (però rientrano “a tratti” in uno dei due alternativamente).
Nel seguito ci limiteremo a considerare solo equazioni differenziali in forma normale, anche senza
specificarlo esplicitamente.
2. Metodi risolutivi per alcuni tipi di equazioni del primo ordine
Poter risolvere esplicitamente un’equazione differenziale è un caso piuttosto raro. In questo paragrafo vediamo i casi più comuni in cui si possono dare metodi di calcolo esplicito.
1. Equazioni a variabili separabili. Si chiamano in tal modo le equazioni della forma
(2.1)
y 0 (x) = f (x)g(y) ,
con f, g continue sugli intervalli I, J rispettivamente.
Per prima cosa si osserva che, se α ∈ J è uno zero di g, cioè g(α) = 0, la funzione costante
(2.2)
y(x) = α
sull’intervallo I è soluzione. Si fissi quindi un intervallo J 0 ⊆ J che non contenga zeri di g e
massimale rispetto a questa proprietà.
2. METODI RISOLUTIVI PER ALCUNI TIPI DI EQUAZIONI DEL PRIMO ORDINE
213
Si supponga che y(x) sia una soluzione dell’equazione con grafico contenuto in I × J 0 , definita su
un intervallo I 0 ⊆ I da determinarsi. Vale allora l’identità
y 0 (x)
= f (x) ,
∀ x ∈ I0 .
g y(x)
Si prenda ora una primitiva G di 1/g su J 0 e si osservi che
y 0 (x)
= (G ◦ y)0 (x) ,
g y(x)
per cui
(G ◦ y)0 (x) = f (x) ,
∀ x ∈ I0 .
Si prenda ora una primitiva F di f su I. Esiste una costante c tale che
G y(x) = F (x) + c ,
∀ x ∈ I0 .
Avendo g segno costante su J 0 , G è strettamente monotona, e dunque invertibile. Quindi
(2.3)
y(x) = G−1 F (x) + c .
Il dominio di questa soluzione sarà dunque
Ic0 = x ∈ I : F (x) + c ∈ im G .
Queste funzioni, al variare degli intervalli J 0 scelti come sopra e insieme alle soluzioni costanti
dell’equazione (2.2), consentono di esprimere l’integrale generale1.
Un metodo pratico per trovare le soluzioni non costanti (ma che sottintende il ragionamento rigoroso
esposto sopra) è il seguente. Si scriva l’equazione (2.1) nella forma
dy
= f (x)g(y) ,
dx
e la si trasformi, in modo puramente formale in
dy
= f (x) dx .
g(y)
Inserendo in ambo i membri il segno di integrazione indefinita, si arriva all’espressione
Z
Z
dy
= f (x) dx .
g(y)
Fissate due primitive, F di f e G di 1/g, come sopra, si ottiene la relazione
G(y) = F (x) + c ,
dipendente dal parametro c, che va risolta in y. Questo vuol dire trovare le funzioni inverse dei
singoli rami monotoni di G, e dunque arrivare alla formula (2.3).
2. Equazioni lineari. Un’equazione differenziale lineare del primo ordine ha la forma
(2.4)
y 0 = a(x)y + b(x) ,
con a, b funzioni continue su un intervallo I. L’equazione si dice omogenea se b = 0.
Per risolvere l’equazione (2.4), si studia prima l’equazione omogenea associata
y 0 = a(x)y ,
1L’espressione esplicita dell’integrale generale completo può essere complicata, perché è possibile che due soluzioni
tra quelle trovate sopra si raccordino in punti particolari dando luogo a possibili ramificazioni. Si veda l’esempio di
non unicità (3.2) più avanti.
2. METODI RISOLUTIVI PER ALCUNI TIPI DI EQUAZIONI DEL PRIMO ORDINE
214
che è a variabili separabili. L’integrale generale (si veda la sezione precedente) è dato dalla formula
seguente, dove A(x) è una primitiva di a in I,
y(x) = ceA(x) ,
c∈R,
che comprende anche la soluzione costante y(x) = 0.
Risolta l’equazione omogenea applicata, si trova l’integrale generale dell’equazione (2.4) con il
cosiddetto metodo della variazione delle costanti. Si cerca cioè una soluzione della forma
y(x) = c(x)eA(x) .
Sostituendo questa espressione nell’equazione (2.4), si ha
c0 (x)eA(x) + c(x)a(x)eA(x) = a(x)c(x)eA(x) + b(x) .
Semplificando, si arriva a
c0 (x) = b(x)e−A(x) ,
che si risolve con una integrazione indefinita. Le soluzioni massimali dell’equazione (2.4) sono tutte
e sole le funzioni definite su I della forma
Z x
(2.5)
y(x) = eA(x)
b(t)e−A(t) dt + c ,
x0
dove c ∈ R e x0 è un punto di I fissato.
Tornando al problema di Cauchy,
può essere utile scegliere tra tutte le primitive di a quella che si
Rx
annulla in x0 , i.e. A(x) = x0 a(t) dt. In tal caso la costante c in (2.5) coincide proprio con y0 e
possiamo anche scrivere la soluzione trovata nella forma
Z x
Rx
y(x) =
b(t)e t a(s) ds dt + y0 .
x0
Svolgendo i passaggi a ritroso, si mostri che questa è effettivamente l’unica soluzione del problema
di Cauchy (fatto che poi ci verrà garantito, per equazioni più generali, dal teorema di Cauchy–
Lipschitz).
3. Equazioni di Bernoulli. Sono equazioni non lineari del tipo
u0 (t) = a(t)u(t) + b(t)uα (t)
α 6= 0, 1
u1−α (t)
con a e b continue. Col cambio di variabile v(t) =
si riducono a equazioni lineari del primo
ordine:
v 0 (t) = (1 − α)a(t)v(t) + (1 − α)b(t) .
4. Inversione delle variabili. Alcune equazioni non lineari si semplificano prendendo t come
variabile dipendente e u come variabile indipendente. Ad esempio l’equazione
u0 (t) =
t3
t4 + u(t)
diventa un’equazione del tipo di Bernoulli:
t0 (u) = t(u) + t−3 (u)u .
5. Equazioni omogenee. Sono del tipo u0 (t) = g(u(t)/t). Si riducono all’equazione a variabili
separabili
g(v(t)) − v(t)
v 0 (t) =
t
con il cambio di variabili u(t) = tv(t).
3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE
215
3. Problemi di Cauchy per equazioni del primo ordine
Si consideri un’equazione differenziale del primo ordine,
y 0 = f (x, y) ,
con f definita su un insieme aperto A ⊆ R2 , che tipicamente supporremo almeno continua.
Dato un punto (x0 , y0 ) ∈ A, si vogliono conoscere le soluzioni dell’equazione il cui grafico passi per
tale punto. Si vuole cioè studiare il sistema
(
y 0 (x) = f (x, y(x))
x∈I
(3.1)
y(x0 ) = y0 .
Questo problema prende il nome di problema di Cauchy. Le questioni fondamentali riguardano
l’esistenza e l’unicità di tali soluzioni. Si noti che, come abbiamo già detto, ha senso porsi il
problema solo per funzioni il cui grafico è contenuto in A, perchè f non è definita fuori di A e in
molti casi concreti non ha un’estensione continua a un insieme più grande di A. Cercheremo quindi
funzioni continue e derivabili definite su intervalli aperti I contenenti x0 , il cui grafico sia contenuto
in A; tali funzioni sono necessariamente di classe C 1 , dato che y 0 (x) = f (x, y(x)); se poi f avesse
una regolarità maggiore, di classe C k , dall’equazione stessa si dedurrebbe anche, per induzione su
k, che y è derivabile con continuità k + 1 volte in I.
Senza ipotesi ulteriori sulla funzione f , l’esistenza e l’unicità (o entrambe) non sono verificate in
generale, come mostrano i seguenti esempi.
• Non esistenza: posto sgn y = −1 per y < 0 e sgn y = 1 per y ≥ 0, il problema di Cauchy
(
y 0 = 1 + sgn y
y(0) = 0
non può avere soluzione. Infatti una sua ipotetica soluzione avrebbe derivata y 0 (0) = 2 e
sarebbe dunque strettamente negativa in un intorno sinistro di 0. Ma se y(x) < 0 allora
y 0 (x) = 0, quindi y(x) sarebbe costante (e strettamente negativa) in un intorno sinistro di
0, il che è incompatibile con il dato iniziale.
• Non unicità: il problema di Cauchy
(
p
y0 = 3 3 y2
(3.2)
y(0) = 0
ha almeno due soluzioni: y(x) = x3 e y(x) = 0.2
I due paragrafi successivi saranno dedicati alla dimostrazione di un fondamentale teorema che
garantisce l’esistenza e l’unicità locale della soluzione di un problema di Cauchy, noto anche come
teorema di Cauchy–Lipschitz.
Per introdurre le ipotesi del teorema, diamo una definizione.
Definizione 8.1 (Funzioni Lipschitz e localmente Lipschitz nella variabile y). Sia f una
funzione definita su un prodotto cartesiano R = I × J. Si dice che f è Lipschitziana3 nella variabile
y se esiste una costante L ≥ 0 tale che
f (x, y1 ) − f (x, y2 ) ≤ L|y1 − y2 |
∀x ∈ I, ∀y1 , y2 ∈ J .
2Se ne trovino infinite altre.
3Si sottointende: uniformemente rispetto alla variabile x ∈ I.
3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE
216
Se f : A → R è definita su un aperto A ⊆ R2 , diremo che f è localmente Lipschitziana nella variabile
y se per ogni (x0 , y0 ) esiste un rettangolo R ⊆ A contenente (x0 , y0 ) tale che f |R è Lipschitziana
rispetto alla variabile y.
Il teorema ha il seguente enunciato.
Teorema 8.2 (Teorema di esistenza e unicità locale). Sia A ⊆ R2 aperto e sia f : A →
R continua, localmente Lipschitziana nella variabile y. Dato un punto (x0 , y0 ) ∈ A, esiste un
rettangolo aperto R = I × J ⊂ A contenente (x0 , y0 ) ed esiste una funzione y : I → J di classe C 1
che risolve il problema di Cauchy (3.1), ed è l’unica soluzione tra quelle definite di classe C 1 in I
e a valori in J. È inoltre possibile scegliere `(x0 , y0 ) > 0 e b̄(x0 , y0 ) > 0 in modo che:
(a) per ogni rettangolo R = (x0 − `0 /2, x0 + `0 /2) × (y0 − b̄/2, y0 + b̄/2) con `0 ∈ (0, `(x0 , y0 )]
vale la tesi di esistenza e unicità;
(b) `−1 (x0 , y0 ) e b̄−1 (x0 , y0 ) sono localmente limitati in A.
Se inoltre y1 : I1 → R e y2 : I2 → R sono soluzioni del problema di Cauchy (3.1) (in particolare
x0 ∈ I1 ∩ I2 ), necessariamente y1 ≡ y2 in I1 ∩ I2 .
Abbiamo già osservato che se f stessa è di classe C 1 allora, per derivazione della funzione composta,
y è di classe C 2 (e, più un generale, y ha sempre un ordine di derivazione in più di f ). Si ottiene
allora che w = y 0 soddisfa la cosiddetta equazione linearizzata
(3.3)
w0 (x) = a(x) + b(x)w(x)
con
a(x) =
∂f
(x, y(x)),
∂x
b(x) =
∂f
(x, y(x)) ,
∂y
i cui coefficienti a, b dipendono dalla soluzione y stessa.
Nella classe delle soluzioni del problema di Cauchy (3.1), definite su intervalli aperti, esiste una
naturale relazione d’ordine y1 y2 se Dom(y1 ) ⊆ Dom(y2 ) e y2 ristretta a Dom(y1 ) coincide con y1 .
Rispetto a questa relazione d’ordine esistono elementi massimali y(x), come vedremo nel prossimo
teorema, e il loro comportamento al bordo del loro dominio massimale di definizione Imax può essere
sovente studiato usando il fatto che la distanza dal bordo di A di (x, y(x)) tende a 0 al tendere di
x ad uno degli estremi di Imax (se finito). Per trattare domini illimitati come ad esempio A = R2
(privo di bordo) si formula tuttavia la proprietà dicendo che (x, y(x)) “evade” da ogni compatto K
contenuto in A.
Teorema 8.3 (Soluzione massimale). Nelle ipotesi del teorema precedente, per ogni (x0 , y0 ) ∈ A
esiste ed è unica la soluzione massimale y : Imax → R con x0 ∈ Imax e y(x0 ) = y0 . Inoltre, se z ∈ R
è un estremo dell’intervallo Imax , deve valere la proprietà:
(3.4)
per ogni compatto K ⊂ A esiste r > 0 tale che |x − z| < r implica (x, y(x)) ∈
/ K.
In particolare, se A = I × R e z è interno a I, |y(x)| → +∞ per x ∈ Imax → z.
Dimostrazione. L’unicità della soluzione massimale è ovvia grazie al teorema precedente:
due soluzioni massimali y1 e y2 , rispettivamente definite su intervalli aperti I1 e I2 contenenti x0 e
coincidenti nel punto x0 , coincidono in I1 ∩ I2 ; se fosse I1 6= I2 , sarebbe possibile definire


y1 (x) se x ∈ I1 ;
y(x) :=


y2 (x) se x ∈ I2 ,
contraddicendo la massimalità di y1 o di y2 .
3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE
217
Mostriamo ora l’esistenza. Dato l’insieme delle coppie (I, yI ), con I intervallo aperto contenente x0
e yI : I → R soluzione del problema di Cauchy, possiamo definire Imax come l’unione degli intervalli
I e definiamo y : Imax → R ponendo
y = yI su I .
La definizione è ben posta grazie alla proprietà yI ≡ yI 0 su I ∩ I 0 e evidentemente definisce una
soluzione massimale.
Mostriamo infine la proprietà (3.4). Supponiamo che esista un compatto K ⊂ A per la quale non
vale e supponiamo per fissare le idee che z = sup Imax . Esiste allora (xn ) ⊆ Imax con xn → z e
(xn , y(xn )) ∈ K. Se (x∞ , y∞ ) ∈ K è un punto limite di questa successione, lungo una sottosuccessione n(k), deve essere x∞ = z. Dato che (xn(k) , y(xn(k) )) convergono a un punto interno ad
A, sappiamo che le soluzioni del problema di Cauchy con dato iniziale (xn(k) , y(xn(k) )) si possono definire in un intervallo aperto Ik centrato in xn(k) di lunghezza `k ≥ 2c > 0. Non appena
z − xn(k) < c abbiamo una contraddizione, in quanto possiamo prolungare, prendendo (xn(k) , yn(k) )
come condizione iniziale del problema di Cauchy, a un intervallo (xn(k) − `k /2, xn(k) + `k /2) che
contiene z al suo interno.
Come conseguenza del teorema precedente, abbiamo che i grafici delle soluzioni massimali, al variare di (x0 , y0 ), sono una partizione dell’insieme A: per ogni punto ne deve passare almeno uno
(Teorema 8.3) e se si intersecano in un solo punto coincidono (Teorema 8.2 applicato nel punto di
intersezione).
Vediamo ora altri due importanti strumenti nello studio delle equazioni differenziali, il teorema di
confronto e il criterio di esistenza globale. Premettiamo un lemma elementare, ma estremamente
utile nelle applicazioni.
Lemma 8.4 (Gronwall). Siano I ⊆ R un intervallo aperto, x0 ∈ I e L ∈ [0, +∞). Sia w : I → R
derivabile in I, con derivata continua. Allora:
(a) w(x0 ) ≤ 0 (risp. w(x0 ) < 0) per un certo x0 ∈ I e w0 (x) ≤ L|w(x)| per ogni x ∈ I tale
che x > x0 implicano w(x) ≤ 0 (risp. w(x) < 0) per ogni x ∈ I, x ≥ x0 ;
(b) w(x0 ) ≥ 0 (risp. w(x0 ) > 0) per un certo x0 ∈ I e w0 (x) ≥ −L|w(x)| per ogni x ∈ I tale
che x > x0 implicano w(x) ≥ 0 (risp. w(x) > 0) per ogni x ∈ I, x ≥ x0 ;
(c) w(x0 ) ≤ 0 per un certo x0 ∈ I e w0 (x) < L|w(x)| per ogni x ∈ I tale che x > x0 implicano
w(x) < 0 per ogni x ∈ I, x > x0 ;
(d) w(x0 ) ≥ 0 per un certo x0 ∈ I e w0 (x) > −L|w(x)| per ogni x ∈ I tale che x > x0
implicano w(x) > 0 per ogni x ∈ I, x > x0 .
Dimostrazione. Non è restrittivo supporre L > 0 e che I abbia lunghezza ` finita.
(a) Per evitare una potenziale divisione per 0, partiamo dalla disuguaglianza w0 ≤ L|w| + δ per
δ > 0. Per x ∈ I con x ≥ x0 si ha allora (essenzialmente stiamo separando le variabili in una
“disequazione differenziale”)
Z x
Z x
w0 (s)
ds ≤
ds = x − x0 .
x0
x0 δ + L|w(s)|
Cambiando variabili si ottiene4
Z
w(x)
w(x0 )
1
dz ≤ ` .
δ + L|z|
4Si noti che qui applichiamo la formula di cambiamento di variabili con una funzione w non necessariamente
monotona, o bigettiva; perché la formula vale? Basta derivare ambo i membri per convincersene.
3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE
218
Se w(x0 ) ≤ 0 e per assurdo fosse w(x) > 0 per un certo x ∈ I con x > x0 , tenendo conto della
disuguaglianza w(x0 ) ≤ 0 si avrebbe
Z w(x)
1
1
Lw(x)
=
log 1 +
dz ≤ ` .
L
δ
δ
+
Lz
0
Dato che log(1 + Lw(x)/δ) diverge per δ → 0+ si ha una contraddizione. Analogamente, se
w(x0 ) < 0 e fosse w(x) ≥ 0 per un certo x > x0 avremmo una contraddizione dalla disuguaglianza
Z 0
1
dz ≤ `
∀δ > 0 .
w(x0 ) δ − Lz
(b) Basta applicare (a) alla funzione −w.
(c) Per il punto (a), sappiamo già che w(x) ≤ 0 per ogni x ∈ I, x ≥ x0 . Se fosse w(x) = 0 per un
certo x ∈ I ∩ (x0 , +∞) avremmo w0 (x) = 0, essendo x di massimo relativo, contro la validità della
stretta disuguaglianza w0 (x) < L|w(x)|.
(d) Basta applicare (c) alla funzione −w.
È anche utile, a volte, applicare il lemma di Gronwall all’indietro nel tempo. Precisamente, invertendo il verso delle disuguaglianze differenziali in (a), (b), (c), (d) (il che corrisponde a invertire la
direzione del tempo), otteniamo le implicazioni:
(a’) w(x0 ) ≤ 0 (risp. w(x0 ) < 0) per un certo x0 ∈ I e w0 (x) ≥ −L|w(x)| per ogni x ∈ I tale
che x < x0 implicano w(x) ≤ 0 (risp. w(x) < 0) per ogni x ∈ I, x ≤ x0 ;
(b’) w(x0 ) ≥ 0 (risp. w(x0 ) > 0) per un certo x0 ∈ I e w0 (x) < −L|w(x)| per ogni x ∈ I tale
che x < x0 implicano w(x) ≥ 0 (risp. w(x) > 0) per ogni x ∈ I, x ≤ x0 ;
(c’) w(x0 ) ≤ 0 e per un certo x0 ∈ I e w0 (x) > −L|w(x)| per ogni x ∈ I tale che x < x0
implicano w(x) < 0 per ogni x ∈ I, x < x0 ;
(d’) w(x0 ) ≥ 0 per un certo x0 ∈ I e w0 (x) < −L|w(x)| per ogni x ∈ I tale che x < x0
implicano w(x) > 0 per ogni x ∈ I, x < x0 .
Proposizione 8.5 (Criterio di confronto). Sia I ⊆ R un intervallo aperto, x0 ∈ I e siano
f, g : I × R → R continue, con g Lipschitziana nella seconda variabile in ogni rettangolo compatto
R = I 0 × J contenuto in I × R. Siano u e v funzioni di classe C 1 in I, rispettivamente una
“sottosoluzione” e una “soprasoluzione” dei problemi di Cauchy relativi a f e g, vale a dire
(3.5)
u0 (x) ≤ f (x, u(x)) ,
v 0 (x) ≥ g(x, v(x))
∀x ∈ I, x > x0 .
Supponiamo inoltre che risulti
(3.6)
f (x, u(x)) ≤ g(x, u(x))
Allora valgono le implicazioni
(
u(x0 ) ≤ v(x0 )
(3.7)
u(x0 ) < v(x0 )
⇒
⇒
∀x ∈ I, x > x0 .
u(x) ≤ v(x) ∀x ∈ I, x ≥ x0 ,
u(x) < v(x) ∀x ∈ I, x ≥ x0 .
Se invece le condizioni (3.5) e (3.6) valgono per x ∈ I, x < x0 , allora
(
u(x0 ) ≥ v(x0 ) ⇒ u(x) ≥ v(x) ∀x ∈ I, x ≤ x0 ,
(3.8)
u(x0 ) > v(x0 ) ⇒ u(x) > v(x) ∀x ∈ I, x ≤ x0 .
3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE
219
Dimostrazione. Limitiamoci a mostrare la prima delle due implicazioni, la prova dell’altra è
simile. Fissato a ∈ I con a > x0 , poniamo I 0 = [x0 , a] e indichiamo con J un intervallo chiuso e
limitato che contiene u(I 0 ) ∪ v(I 0 ). Ora, posto w = u − v, per x ∈ I 0 vale
w0 (x) = u0 (x) − v 0 (x) ≤ f (x, u(x)) − g(x, v(x))
≤ g(x, u(x)) − g(x, v(x)) ≤ L|u(x) − v(x)|
= L|w(x)| ,
ove L è l’estremo superiore delle costanti di Lipschitz di g(x, ·) in J, al variare di x in I 0 . La tesi
segue allora dal lemma di Gronwall, parte (a).
Osservazione 8.6 (Forma stretta del principio di confronto). Usando la parte (c), (c’) del lemma
di Gronwall si ottengono delle disuguaglianze strette come conseguenza della disuguaglianza stretta
nella formula (3.6), vale a dire f (x, u(x)) < g(x, u(x)) per ogni x ∈ I, x > x0 , garantisce la validità
delle implicazioni:
(
u(x0 ) ≤ v(x0 ) ⇒ u(x) < v(x) ∀x ∈ I, x > x0 ,
(3.9)
u(x0 ) ≥ v(x0 ) ⇒ u(x) > v(x) ∀x ∈ I, x < x0 .
Spesso nella pratica, non potendo calcolare esplicitamente la soluzione u, la (3.6) si verifica usando
l’informazione che f ≤ g globalmente. Si noti anche che avremmo potuto sostituire la (3.6) con
f (x, v(x)) ≤ g(x, v(x)), supponendo invece che sia f e non g ad essere Lipschitziana nella variabile
y sui rettangoli compatti contenuti in I × R.
Vediamo ora un’applicazione, ottenendo un criterio di esistenza globale, e discutiamo poi alcuni
esempi tratti dalla raccolta di esercizi risolti: E.Acerbi, L.Modica, S.Spagnolo, Problemi scelti di
Analisi Matematica II, Liguori, 1986.
Proposizione 8.7 (Criterio di esistenza globale). Sia I ⊆ R un intervallo aperto, K ∈ [0, +∞)
e sia f : I × R → R continua e localmente Lipschitziana nella seconda variabile, tale che
(3.10)
|f (x, y)| ≤ K(1 + |y|)
∀(x, y) ∈ I × R .
Allora per ogni x0 ∈ I e y0 ∈ R, la soluzione massimale del problema di Cauchy (3.1) è definita su
tutto l’insieme I.
Dimostrazione. Sia y : Imax → R la soluzione
p massimale tale che y(x0 ) = y0 . Per studiare
la crescita di y consideriamo la funzione w(x) = 1 + y 2 (x) (come sostituto di |y(x)|, che non è a
priori derivabile). Abbiamo allora
y(x)y 0 (x)
p
≤ |f (x, y(x))|
1 + |y 2 (x)|
≤ K(1 + |y(x)|) ≤ 2Kw(x)
|w0 (x)| =
per ogni x ∈ I. La formula risolutiva (2.5) delle equazioni lineari e il criterio di confronto ci dicono
allora che
|y(x)| ≤ w(x) ≤ w(x0 )e2K|x−x0 |
∀x ∈ Imax .
Se fosse z = sup Imax < sup I, vicino a z la funzione y dovrebbe essere illimitata, per la proprietà (3.4). Discorso analogo se inf Imax > inf I.
3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE
Esempio 1. Consideriamo il problema di Cauchy
(
y 0 (x) = 1 − log(x + y(x)) ,
(3.11)
y(x0 ) = y0 > −x0 ,
220
x + y(x) > 0
e studiamo il comportamento delle soluzioni al variare della condizione iniziale.
Con il cambiamento di variabili x + y(x) = z(x) l’equazione diventa z 0 (x) = 2 − log z(x). Per
il teorema di Cauchy–Lipschitz esiste un’unica soluzione massimale z(x) passante per ogni punto
(x0 , z0 ) con z0 > 0. La soluzione costante z(x) = e2 e il teorema di confronto consentono di
concludere che z(x) > e2 o z(x) < e2 a seconda che z0 > e2 o z0 < e2 .
Se z0 > e2 la soluzione è globalmente definita a destra di x0 , per il criterio (3.4), inoltre z è
strettamente decrescente. Il limite per x → +∞, essendo finito, deve valere e2 ; infatti, grazie al
teorema di Lagrange applicato in intervalli di lunghezza 1 possiamo trovare xn → +∞ tale che
z 0 (xn ) → 0, da cui segue che il limite di z(xn ), e quindi di tutta la funzione z, deve valere e2 . Per
studiarne il comportamento a sinistra di x0 usiamo la disuguaglianza log t ≤ t − 1 per ottenere
z 0 (x) = 2 − log z(x) ≥ 3 − z(x) .
Il teorema di confronto ci dice allora che z(x) ≤ w(x) per ogni x ≤ x0 , dove w(x) è la soluzione del
problema di Cauchy w0 = 3 − w, w(x0 ) = z0 . Dato che w è limitata sui limitati, deduciamo per
la proprietà (3.4) che la z è definita globalmente anche alla sinistra di x0 . Il fatto che il limite per
x → −∞ di z(x) sia +∞ può essere dedotto dalla (stretta) convessità di z: vale infatti
z 00 (x) = −
z 0 (x)
>0.
z(x)
Analogamente, se z0 < e2 deduciamo che la soluzione massimale è strettamente crescente e concava,
definita globalmente a destra di x0 , con z(x) → e2 per x → +∞. Per studiarne il comportamento
a sinistra osserviamo che, per concavità,
z(x) ≤ z(0) + z 0 (0)(x − x0 )
per ogni x ∈ Imax e, dato che la funzione a destra ha uno zero alla sinistra di x0 (perchè z(0) > 0
e z 0 (0) > 0), deduciamo che Imax = (a, +∞) con a > −∞ e y 0 (a+ ) = +∞.
Per esercizio, si ridimostrino le proprietà qualitative della funzione z usando l’espressione
Z z(x)
1
du = x − x0 ,
2 − log u
z0
ottenuta per separazione delle variabili, che definisce implicitamente z(x). In particolare, quando
z0 < e2 , vale la formula
Z z0
a = x0 −
(2 − log u)−1 du .
0
Esempio 2. Consideriamo il problema di Cauchy
(
y 0 (x) = y 2 (x) − (arctg x)2 ,
(3.12)
y(1) = 0
x∈R
e dimostriamo che la soluzione massimale esiste ed è globale.
La funzione f (x, y) = y 2 − (arctg x)2 è di classe C ∞ in R2 , quindi localmente Lipschitziana. Il
teorema di Cauchy–Lipschitz ci assicura l’esistenza di una soluzione massimale y : Imax = (a, b) → R
con 1 ∈ Imax , di classe C ∞ . Per mostrare che Imax = R basta mostrare, tenendo conto del
criterio (3.4), che non può succedere che a un estremo z = a, b di Imax la funzione tenda all’infinito.
Mostreremo più precisamente che |y(x)| ≤ π/2.
3. PROBLEMI DI CAUCHY PER EQUAZIONI DEL PRIMO ORDINE
221
Osserviamo che la funzione z identicamente nulla risolve z 0 (x) > f (x, z(x)) per x 6= 0, quindi y < 0
in (1, b) e y > 0 in (a, 1) (qui abbiamo applicato la versione “stretta” del teorema di confronto, vedi
l’Osservazione 8.6). Posto ora g(x, y) = y 2 − (π/2)2 , abbiamo f > g, confrontando quindi con le
soluzioni costanti z(x) = ±π/2 dell’equazione z 0 (x) = g(x, z(x)) otteniamo che y(x) ≤ π/2 in (a, 1)
e y(x) ≥ −π/2 in (1, b). Si noti poi che, dato che
y 2 (0) > 0 = (arctg 0)2
y 2 (1) = 0 < (arctg 1)2 ,
deve esistere c ∈ (0, 1) tale che y 0 (c) = y 2 (c) − (arctg c)2 = 0. Si potrebbe poi mostrare, usando
la monotonia di f nella variabile x e studiando l’equazione differenziale (3.3) soddisfatta da y 0 ,
che y(x) è crescente in (0, c) e decrescente in (c, +∞). Analogamente, esiste d < 0 tale che y è
decrescente in (−∞, d) e crescente in (d, 0).
Per monotonia, devono allora esistere valori asintotici (finiti) `± per t → ±∞; applicando come
nell’esempio precedente il teorema di Lagrange in intervalli di lunghezza 1, troviamo successioni
(xn ) divergenti a ±∞ tali che y 0 (xn ) tende a 0. Deve allora essere y 2 (xn ) − (arctg xn )2 → 0, da cui
deduciamo `+ = −π/2, `− = π/2.
Esempio 3. Consideriamo il problema di Cauchy

1
 0
y (x) = arctg(y(x)) − ,
x>0
(3.13)
x
y( 4 ) = 1 .
π
La funzione f (x, y) = arctg(y) − 1/x è di classe C ∞ in A = (0, +∞) × R, quindi localmente
Lipschitziana. Il teorema di Cauchy–Lipschitz ci assicura l’esistenza di una soluzione massimale
y : Imax = (a, b) → R con 4/π ∈ Imax , di classe C ∞ . Dato che y 0 (x) ≤ π/2, otteniamo dalla proprietà (3.4) che y è globalmente definita alla destra di 4/π; per quel che riguarda il comportamento
alla sinistra, basta osservare che vale la disuguaglianza
π
1
y 0 (x) ≥ − − n
per x ∈ [ , +∞)
2
n
per ottenere, sempre dalla (3.4), che Imax = (0, +∞).
Osserviamo ora che y 0 (4/π) = 0, quindi studiando l’equazione differenziale linearizzata soddisfatta
da y 0 otteniamo che y è crescente in (4/π, +∞) e decrescente in (0, 4/π).
Integrando la disequazione differenziale y 0 (x) ≤ π/2 − 1/x otteniamo
4
π
y(x) ≥ x − 1 + log − log x ,
2
π
+
quindi y(x) → +∞ per x → 0 . Analogamente, integrando la disequazione differenziale y 0 (x) ≥
π/4 − 1/x, valida alla destra di 4/π, otteniamo
π
4
y(x) ≥ x + log − log x ,
4
π
da cui deduciamo che y(x) → +∞ per x → +∞. Mostriamo anche che y è convessa: usando
l’equazione linearizzata otteniamo
y 00 (x) =
y 0 (x)
1
arctg y(x)
1
1
+ 2 =
−
+ 2.
2
2
2
1 + y (x) x
1 + y (x)
x(1 + y (x)) x
Dalla prima uguaglianza ricaviamo subito la convessità per x ≥ 4/π; in (0, 4/π), nella seconda
uguaglianza si verifica facilmente che il termine 1/x2 domina il termine 1/(x(1 + y 2 (x)), grazie al
fatto che y(x) ≥ 1.
4. CONTRAZIONI IN SPAZI METRICI
222
4. Contrazioni in spazi metrici
La dimostrazione del Teorema 8.2 è basata su una proprietà generale di applicazioni contrattive su
spazi metrici completi.
Sia (X, d) uno spazio metrico. Una funzione T : X −→ X si dice una contrazione di X se è
Lipschitziana con costante di Lipschitz λ < 1.
Teorema 8.8 (Teorema delle contrazioni). Sia (X, d) uno spazio metrico completo, e sia T
una contrazione di X. Esiste allora un unico punto fisso x̄ di T in X, cioè tale che T (x̄) = x̄. Dato
un qualsiasi x ∈ X, vale inoltre la stima
d(x̄, x) ≤
(4.1)
d(x, T (x))
,
1−λ
con λ uguale alla costante di Lipschitz di T .
Dimostrazione. Preso un punto x = x0 ∈ X, si definisca ricorsivamente
xn+1 = T (xn ) .
Essendo d(xn , xn+1 ) = d(T (xn−1 ), T (xn )), si verifica per induzione che vale la disuguaglianza
d(xn , xn+1 ) ≤ λn d(x0 , x1 ) .
Dati allora due interi m < n, si ha
d(xm , xn ) ≤ d(xm , xm+1 ) + d(xm+1 , xm+2 ) + · · · + d(xn−1 , xn )
(4.2)
≤ (λm + · · · + λn−1 )d(x0 , x1 )
∞
X
λm
m
≤λ
λk d(x0 , x1 ) =
d(x0 , x1 ) .
1−λ
k=0
Essendo λ < 1, questo implica che la successione (xn ) è di Cauchy e dunque che converge a un
punto x̄ ∈ X. Essendo T continua, si ha
T (x̄) = lim T (xn ) = lim xn+1 = x̄ .
n→∞
n→∞
Quindi x̄ è un punto fisso di T , e questo dimostra l’esistenza di un punto fisso.
Per dimostrare l’unicità, si supponga che x̄, ȳ siano punti fissi. Allora
d(x̄, ȳ) = d T (x̄), T (ȳ) ≤ λd(x̄, ȳ) .
Essendo λ < 1, deve essere d(x̄, ȳ) = 0, cioè x̄ = ȳ. Infine la stima (4.1) si ottiene scegliendo m = 0
e passando al limite per n → ∞ nella disuguaglianza (4.2). Una dimostrazione alternativa usa le
disuguaglianze
d(x̄, x) ≤ d(x̄, T (x)) + d(T (x), x) = d(T (x̄), T (x)) + d(T (x), x) ≤ λd(x̄, x) + d(T (x), x).
5. DIMOSTRAZIONE DEL TEOREMA DI ESISTENZA E UNICITÀ LOCALE
223
5. Dimostrazione del teorema di esistenza e unicità locale
Per prima cosa, riconduciamo il problema di Cauchy (3.1) a un’equazione integrale.
Lemma 8.9. Siano I, J ⊆ R intervalli. Siano f continua sul rettangolo I ×J, y : I −→ J, e x0 ∈ I.
Le due condizioni seguenti sono equivalenti:
(i) y è di classe C 1 in I e soddisfa il sistema (3.1);
(ii) y è continua in I e soddisfa l’equazione integrale
Z x
y(x) = y0 +
f t, y(t) dt
∀x ∈ I .
x0
Dimostrazione. Supponiamo che valga la condizione (i). Per il teorema fondamentale del
calcolo integrale,
Z x
y(x) = y0 +
y 0 (t) dt
x0
Z x
= y0 +
f t, y(t) dt .
x0
Viceversa,
si supponga che valga la condizione (ii). Allora y(x0 ) = y0 . Inoltre, posto g(t) =
f t, y(t) , la funzione
del calcolo integrale
R x g è continua su I. Segue allora 0dal teorema fondamentale
che y(x) = y0 + x0 g(t) dt è derivabile in I e che y (x) = g(x) = f x, y(x) , quindi con derivata
continua.
Possiamo ora passare alla dimostrazione del teorema.
Dimostrazione del Teorema 8.2. Sia (x̄, ȳ) ∈ A e siano ā, b̄ > 0 due numeri tali che, posto
ā
ā
b̄
b̄
R2 = [x̄ − , x̄ + ] × [ȳ − , ȳ + ] ,
2
2
2
2
sia R1 ⊂ A. Fissiamo ora (x0 , y0 ) ∈ R2 , indichiamo con I un qualsiasi intervallo aperto contenente
x0 al suo interno e poniamo
R1 = [x̄ − ā, x̄ + ā] × [ȳ − b̄, ȳ + b̄] ,
b̄
b̄
J = (y0 − , y0 + ) .
2
2
Mostreremo che se ` è abbastanza piccolo allora esiste, tra tutte le funzioni continue da I in J,
un’unica soluzione del problema di Cauchy (in forma integrale) tale che y(x0 ) = y0 e inoltre tale
funzione è a valori in J. Si ha quindi la tesi con R = I ×J. Imponiamo per prima cosa la condizione
` ≤ ā/2, che garantisce che I ⊆ (x̄ − ā, x̄ + ā), quindi I × J ⊂ R1 .
Consideriamo ora lo spazio metrico
X = y ∈ C(I) : y(I) ⊆ J , y(x0 ) = y0 ,
` = lunghezza(I) ,
dotato della distanza del sup indotta da C(I), e definiamo una funzione T : X −→ C(I) ponendo,
per y ∈ X, T [y] uguale alla funzione
Z x
T [y](x) = y0 +
f t, y(t) dt .
x0
Imponiamo ora che T applichi X in sé. La condizione T [y](x0 ) = y0 è ovviamente verificata.
Rimane da imporre che, per ogni x ∈ I, si abbia
T [y](x) − y0 ≤ b̄ .
2
5. DIMOSTRAZIONE DEL TEOREMA DI ESISTENZA E UNICITÀ LOCALE
Ma
Z
T [y](x) − y0 = x
x0
Z
f t, y(t) dt ≤
224
x
f t, y(t) dt ≤ ` max f (x, y) .
x0
(x,y)∈R1
Posto M = maxR1 |f |, la condizione richiesta è soddisfatta, anche con la disuguaglianza stretta, se
(5.1)
2`M < b̄ .
Imponiamo ora l’ulteriore condizione che T sia una contrazione di X. Date due funzioni y, z ∈ X,
si consideri la distanza tra le loro immagini,
d T [y], T [z] = max T [y] (x) − T [z] (x) .
x∈I
Per x ∈ I, si ha
Z
Z x
x
T [y](x) − T [z](x) = f t, y(t) dt −
f t, z(t) dt
x0
x0
Z x
=
f t, y(t) dt − f t, z(t) dt
x
Z x 0
≤
f t, y(t) dt − f t, z(t) dt
x0
Z x
y(t) − z(t) dt
≤L
x0
≤ L` d(y, z) ,
dove L è la costante di Lipschitz di f nella seconda variabile, nel rettangolo R1 . Si ha quindi
d T (y), T (z) ≤ L` d(y, z) ,
e la condizione da imporre è dunque
(5.2)
L` < 1 .
Quindi, se ` > 0 soddisfa entrambe le condizioni (5.1) e (5.2), T è una contrazione di X in sé.
D’altra parte, X è chiuso in C(I), che è completo, e dunque è uno spazio metrico completo. Per
il Teorema 8.8, T ammette uno e un solo punto fisso in X. Per il Lemma 8.9, questa è dunque
l’unica soluzione del problema di Cauchy (3.1) sull’intervallo I a valori tra quelle a valori in J. Si
nota poi che y è a valori non solo in J ma in J, avendo scelto la disuguaglianza stretta in (5.1).
Abbiamo quindi mostrato la prima parte dell’enunciato. La seconda parte, ovvero il fatto che
`−1 può essere scelto in modo da essere limitato localmente in A, segue esaminando le condizioni
imposte ` ≤ ā/2 e le disuguaglianze (5.1), (5.2) su `, che consentono di scegliere ` > 0 in maniera
uniforme (dato che L e M dipendono da R1 e non da (x0 , y0 )) al variare di tutti i punti (x0 , y0 )
contenuti in R2 .
Per dimostrare la parte finale dell’enunciato, relativa all’unicità, basta considerare l’insieme
E := {t ∈ I1 ∩ I2 : y1 (t) 6= y2 (t)} .
Se fosse non vuoto, sarebbe certamente aperto ed avrebbe complementare non vuoto perché x0 ∈
/ E.
Se mostriamo che E è anche chiuso otteniamo una contraddizione. Se t ∈
/ E abbiamo y1 (t) = y2 (t)
e quindi possiamo applicare la proprietà di unicità locale appena dimostrata con x0 = t, y0 =
y1 (t) = y2 (t) per ottenere che y1 e y2 devono coincidere in un intorno di t: più precisamente,
siano `(x0 , y0 ) e b̄/2 come nella prima parte dell’enunciato e troviamo un piccolo intervallo I =
[x0 −δ, x0 +δ] contenuto in I1 ∩I2 tale che 0 < δ ≤ `(x0 , y0 ) e y1 (I) e y2 (I) sono entrambe contenute
6. SISTEMI DI EQUAZIONI DIFFERENZIALI ED EQUAZIONI DI ORDINE SUPERIORE
225
in [y0 − b̄/2, y0 + b̄/2]. Allora l’unicità per soluzioni il cui grafico è contenuto in I ×[y0 − b̄/2, y0 + b̄/2]
dà y1 ≡ y2 in I, quindi y1 e y2 coincidono in un intorno di x0 .
6. Sistemi di equazioni differenziali ed equazioni di ordine superiore
Un sistema di equazioni differenziali ordinarie del primo ordine in forma normale ha la forma
 0
y1 (x) = f1 (x, y1 (x), . . . , yn (x))



y 0 (x) = f (x, y (x), . . . , y (x))
2
1
n
2

·
·
·


 0
yn (x) = fn (x, y1 (x), . . . , yn (x))
dove le n funzioni f1 , . . . , fn sono definite su uno stesso insieme A ⊆ Rn+1 . In forma compatta,
ponendo
Y = (y1 , . . . , yn ) ,
F = (f1 , . . . , fn ) : A −→ Rn ,
il sistema si scrive nella forma
(6.1)
Y 0 (x) = F (x, Y (x)) ,
dove la funzione incognita Y (x) si intende definita su un intervallo I ⊆ R, a valori in Rn , con grafico
contenuto in A.
Un problema di Cauchy associato al sistema (6.1) è dato da
(
Y 0 (x) = F (x, Y (x))
(6.2)
Y (x0 ) = Y0 ,
con (x0 , Y0 ) ∈ A.
Enunciato e dimostrazione del Teorema 8.2 e il contenuto del Paragrafo 5 si estendono
ai sistemi
Rx
con le ovvie modifiche notazionali e intendendo, nel Lemma 8.9, l’integrale definito x0 F t, Y (t) dt
Rx
come l’n-upla degli integrali x0 fi t, Y (t) dt, i = 1, . . . , n.
Teorema 8.10 (Teorema di esistenza e unicità locale per sistemi). Sia A ⊆ Rn+1 aperto
e sia F : A → R continua, localmente Lipschitziana nella variabile Y ∈ Rn . Dato un punto
(x0 , Y0 ) ∈ A, esiste un plurirettangolo aperto R = I × Q ⊂ A contenente (x0 , Y0 ) ed esiste una
funzione Y : I → Q di classe C 1 che risolve il problema di Cauchy (6.2), ed è l’unica soluzione tra
quelle da I in Q. È inoltre possibile scegliere `(x0 , Y0 ) > 0 e b̄(x0 , Y0 ) > 0 in modo che:
(a) per ogni plurirettangolo R = (x0 − `0 /2, x0 + `0 /2) × Qb̄ (Y0 ) (ove Qb̄ (Y0 ) ⊆ Rn indica il
cubo aperto di lato b̄ centrato in Y0 ) con `0 ∈ (0, `] vale la tesi di esistenza e unicità;
(b) `−1 (x0 , y0 ) e b̄−1 (x0 , y0 ) sono localmente limitati in A.
Se inoltre Y1 : I1 → Rn e Y2 : I2 → Rn sono soluzioni del problema di Cauchy (6.2) (in particolare
x0 ∈ I1 ∩ I2 ), necessariamente Y1 ≡ Y2 in I1 ∩ I2 .
Si estendono a sistemi il teorema di esistenza della soluzione massimale (Teorema 8.3), il fatto
che i grafici delle soluzioni massimali sono una partizione di A e il comportamento delle soluzioni
massimali vicino a uno degli estremi dell’intervallo massimale (3.4). Non si estendono invece a
sistemi, o almeno non si estendono facilmente, i risultati che dipendono dalla struttura di R come
insieme ordinato, come il teorema di confronto. Tuttavia è a volte possibile associare quantità
scalari alle soluzioni di sistemi, per poter applicare tecniche di confronto. Vediamo come questa
idea funziona per l’estensione del criterio di esistenza globale (Proposizione 8.7) ai sistemi.
6. SISTEMI DI EQUAZIONI DIFFERENZIALI ED EQUAZIONI DI ORDINE SUPERIORE
226
Proposizione 8.11 (Criterio di esistenza globale per sistemi). Sia I ⊆ R un intervallo
aperto, K ∈ [0, +∞) e sia F : I × Rn → Rn continua e localmente Lipschitziana nella seconda
variabile, tale che
(6.3)
|F (x, Y )| ≤ K(1 + |Y |)
∀(x, Y ) ∈ I × Rn .
Allora per ogni x0 ∈ I e Y0 ∈ R, la soluzione massimale del problema di Cauchy (6.2) è definita su
tutto l’insieme I.
Dimostrazione. Sia Y : Imax → R la soluzione massimale tale che Y (x0 ) = Y0 e, come nella
dimostrazione dell’analogo
risultato per funzioni scalari, per studiare la crescita di Y consideriamo
p
la funzione w(x) = 1 + |Y (x)|2 . Abbiamo allora
hY (x), Y 0 (x)i
p
≤ |Y 0 (x)| = |f (x, Y (x))|
1 + |Y 2 (x)|
≤ K(1 + |Y (x)|) ≤ 2Kw(x)
|w0 (x)| =
per ogni x ∈ I. La formula risolutiva (2.5) delle equazioni lineari e il criterio di confronto ci dicono
allora che
|Y (x)| ≤ w(x) ≤ w(x0 )e2K|x−x0 |
∀x ∈ Imax .
Se fosse z = sup Imax < sup I, vicino a z la funzione |Y | dovrebbe essere illimitata, per la (3.4).
Discorso analogo se inf Imax > inf I.
Si consideri ora un’equazione di ordine n,
(6.4)
y (n) (x) = f x, y(x), y 0 (x), . . . , y (n−1) (x) ,
con f definita su un insieme A ⊆ Rn+1 e a valori reali.
Lemma 8.12. L’equazione (6.4) è equivalente al sistema
 0

y1 (x) = y2 (x)

· · ·
0

yn−1
(x) = yn (x)


 0
yn (x) = f (x, y1 (x), . . . , yn (x))
nel senso che
(i) se y(x) è soluzione dell’equazione (6.4), allora Y (x) = y(x), y 0 (x), . . . , y (n−1) (x) è soluzione del sistema (6.1);
(ii) se Y (x) = y1 (x), . . . , yn (x) è soluzione del sistema (6.1), allora y1 (x) è soluzione dell’equazione (6.4).
Tralasciamo la dimostrazione, del tutto ovvia.
Da questo segue in modo naturale che i problemi di Cauchy per l’equazione (6.4) vanno posti nella
forma seguente:


y (n) (x) = f (x, y(x), y 0 (x), . . . , y (n−1) (x))





y(x0 ) = y0
y 0 (x0 ) = y00
(6.5)


· · ·



y (n−1) (x ) = y (n−1) ,
0
0
6. SISTEMI DI EQUAZIONI DIFFERENZIALI ED EQUAZIONI DI ORDINE SUPERIORE
227
(n−1)
con (x0 , y0 , y00 , . . . , y0
) ∈ A, ossia assegnando, per x = x0 , i valori della funzione incognita e
delle sue derivate fino all’ordine n − 1.
Da quanto detto finora segue facilmente il seguente enunciato.
Teorema 8.13. Sia f (x, y1 , . . . , yn ) una funzione definita su un aperto A ⊆ Rn+1 a valori reali,
continua e localmente Lipschitziana nelle variabili y1 , . . . , yn .
(0)
(1)
(n−1)
(i) Dato un punto (x0 , y0 , y0 , . . . , y0
) ∈ A, esistono ` > 0 e b̄ > 0 tali che il problema
di Cauchy (6.5) ammette una soluzione y definita in [x0 − `/2, x0 + `/2], a valori in
(y0 − b̄, y0 + b̄), unica tra le funzioni z di classe C n ([x0 − `/2, x0 + `/2]) che soddisfano la
condizione
max
x∈[x0 −`/2,x0 +`/2]
(i)
|z (i) (x) − y0 | ≤ b̄
0 ≤ i ≤ (n − 1) .
(ii) A è l’unione disgiunta dei grafici delle funzioni
Y (x) = y(x), y 0 (x), . . . , y (n−1) (x) ,
al variare di y(x) tra le soluzioni massimali dell’equazione (6.4).
In modo analogo si impostano e si discutono i problemi di Cauchy relativi a sistemi di equazioni
differenziali di ordine superiore. In Fisica si incontrano frequentemente sistemi del tipo

00
0 0 0

mx = f1 (t, x, y, z, x , y , z )
my 00 = f2 (t, x, y, z, x0 , y 0 , z 0 )

 00
mz = f3 (t, x, y, z, x0 , y 0 , z 0 )
in cui la variabile indipendente t rappresenta il tempo, la funzione incognita x(t), y(t), z(t) la
posizione di un punto materiale di massa m all’istante t, e F = (f1 , f2 , f3 ) la risultante delle forze
agenti su un punto che all’istante t si trovi nella posizione (x, y, z) con velocità (x0 , y 0 , z 0 ). Tali forze
possono dipendere dalla posizione (campi di forze), dalla velocità (per es. attrito), e possono essere
variabili nel tempo. Il sistema rappresenta la legge ma = F, dove l’accelerazione è a = (x00 , y 00 , z 00 ).
Come visto sopra per una singola equazione, questo sistema è equivalente a un sistema del primo
ordine di 6 equazioni in 6 incognite,


x0 = px /m




y 0 = py /m



z 0 = p /m
z
0

px = f1 (t, x, y, z, mpx , mpy , mpz )




p0y = f2 (t, x, y, z, mpx , mpy , mpz )


 0
pz = f3 (t, x, y, z, mpx , mpy , mpz )
dove px , py , pz sono le tre componenti del momento del punto in movimento.
Un problema di Cauchy consiste dunque nell’assegnazione, a un dato istante t0 , della posizione
(x0 , y0 , z0 ) e del momento (px,0 , py,0 , pz,0 ).
Il punto (ii) del Teorema 8.13 si applica ai grafici (in R7 ) delle funzioni
t 7−→ x(t), y(t), z(t), px (t), py (t), pz (t) ,
dove x(t), y(t), z(t) è una soluzione massimale. Lo spazio 6-dimensionale con coordinate (x, y, z, px , py , pz )
è chiamato spazio delle fasi.
7. SISTEMI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI E MATRICE ESPONENZIALE
228
7. Sistemi differenziali lineari a coefficienti costanti e matrice esponenziale
Un sistema differenziale lineare omogeneo a coefficienti costanti (del primo ordine) ha la forma
 0 
 
y1
a11 · · · a1n
y1
 y 0   a21 · · · a2n   y2 
 2 
 
(7.1)
Y 0 =  ..  =  ..
..   ..  = AY ,
..
.  .
.
.  . 
yn0
an1 · · ·
ann
yn
dove A è una matrice n×n (che possiamo anche supporre complessa, ammettendo soluzioni a valori
complessi del sistema). Il caso n = 1, in cui il sistema si riduce all’equazione y 0 = ay, ha come
soluzioni le funzioni y(x) = ceax (si veda il Paragrafo 2).
Per n generico le soluzioni assumono una forma analoga introducendo un apposita nozione di
matrice esponenziale. Adotteremo nello spazio delle matrici la norma Euclidea5
n
X
1
2
.
kAk =
|aij |2
i, j=1
Premettiamo la seguente proprietà della norma euclidea.
Lemma 8.14. Siano A, B matrici n × n. Allora
kABk ≤ kAkkBk .
Dimostrazione. Indichiamo con Ai = (ai1 , . . . , ain ) la i–esima riga della matricePA e con
2
2
B j = t(b
1j , . . . , bnj ) la j–esima colonna della matrice B. Vale ovviamente kAk =
i |Ai | e
P
kBk2 = j |B j |2 . Allora se C = (cij ) = AB, si ha, per la disuguaglianza di Cauchy–Schwarz,
|cij | = |Ai B j | ≤ |Ai ||B j | .
Quindi
kCk2 =
≤
=
n
X
|cij |2
i, j=1
n
X
|Ai |2 |B j |2
i, j=1
n
X
|Ai |2
n
X
i=1
|B j |2
j=1
2
2
= kAk kBk .
Proposizione 8.15 (Serie esponenziale e esponenziale di matrici). Sia A una matrice n × n,
reale o complessa. La serie esponenziale nello spazio delle matrici n × n
(7.2)
∞
X
Ak
k=0
k!
5Per matrici si chiama anche norma di Hilbert–Schmidt.
7. SISTEMI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI E MATRICE ESPONENZIALE
229
(dove si è posto 0! = 1 e A0 = I, I matrice identità n × n) è convergente. Si pone
∞
X
Ak
eA =
k=0
k!
,
che viene detta matrice esponenziale di A. Vale inoltre e0 = I e keA k ≤ ekAk .
2
Si noti che, essendo lo spazio delle matrici n × n isomorfo a Rn , la convergenza si può intendere
componente per componente, o equivalentemente nella norma euclidea.
Dimostrazione della Proposizione 8.15. Applicando il Teorema 6.16 del Capitolo 6, studiamo la convergenza totale della serie (7.2). Per il Lemma 8.14 si ha
∞
∞
X
Ak X
kAkk
≤
= ekAk < +∞ .
k!
k!
k=0
k=0
Per ogni x ∈ R, la funzione
expA (x) = exA
è dunque ben definita da R nello spazio delle matrici n × n e k expA (x)k ≤ e|x|kAk .
Proposizione 8.16 (Proprietà della funzione esponenziale). Valgono le seguenti proprietà:
(i) la funzione expA è analitica su R (cioè ogni sua componente è analitica);
(ii) vale l’identità
d xA
e = AexA = exA A ;
dx
(iii) Per ogni x, x0 ∈ R vale l’identità
0
0
0
e(x+x )A = ex A exA = exA ex A .
In particolare (exA )−1 = e−xA , quindi exA è non singolare per ogni x ∈ R.
Dimostrazione. Indichiamo con (Ak )ij il termine di posto (i, j) nella matrice Ak . Allora la
componente (exA )ij di exA è
∞
X
(Ak )ij k
(exA )ij =
x .
k!
k=0
Essendo questa una serie di potenze convergente per ogni x ∈ R, il suo raggio di convergenza è
infinito e, per il Teorema 6.30 del Capitolo 6, è analitica su R. È dunque possibile derivare tale
serie termine a termine, ottenendo che
∞
∞
k=1
k=0
X (Ak )ij
X (Ak+1 )ij
d xA
(e )ij =
xk−1 =
xk .
dx
(k − 1)!
k!
Ricomponendo la matrice, si ha
∞
d xA X Ak+1 k
e =
x .
dx
k!
k=0
Da ogni termine si può raccogliere A a fattore, sia a destra che a sinistra, e il punto (ii) è dimostrato.
7. SISTEMI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI E MATRICE ESPONENZIALE
230
Il punto (iii) si può ottenere svolgendo il prodotto delle due serie esponenziali di xA e x0 A (possibile
per la loro convergenza assoluta) e ricomponendo la somma raggruppando i termini dello stesso
0
grado in A. In alternativa, si può osservare che, fissato x0 , la funzione di x e(x+x )A e−xA ha derivata6
d (x+x0 )A −xA
0
0
(e
e
) = e(x+x )A Ae−xA − e(x+x )A Ae−xA = 0 ,
dx
0
per il punto (ii). Quindi e(x+x )A e−xA è costante in x, e dunque uguale al suo valore in x = 0. Cioè
0
0
e(x+x )A e−xA = ex A .
(7.3)
Per x0 = 0 questo implica che e−xA = (exA )−1 , e da ciò segue la prima uguaglianza, moltiplicando
ambo i membri dell’identità (7.3) a destra per exA . Scambiando x con x0 si ha la seconda.
Osservazione 8.17. È anche possibile dimostrare la formula
det eA = etr A .
Una dimostrazione algebrica si può ottenere usando la forma canonica di Jordan (si veda la sezione
successiva). Una dimostrazione di tipo differenziale è la seguente. Per prima cosa osserviamo che
det(exA ) è sempre non nulla e positiva per x = 0, quindi sempre positiva, per continuità. Passando
ai logaritmi basta mostrare che la funzione scalare
φ(x) := log det exA
soddisfa le condizioni φ0 ≡ tr A, φ(0) = 0, visto che queste implicano che det exA = extr A . La seconda condizione è ovviemente soddisfatta; per la prima, basta notare che per ogni x ∈ R dall’identità
e(x+h)A = exA ehA e dallo sviluppo di Taylor det (I + B) = 1 + tr B + o(kBk)7 otteniamo
φ(x + h) = φ(x) + φ(h) = φ(x) + log det ehA = φ(x) + log det(I + hA + o(h))
= φ(x) + log(1 + htr A + o(h)) = φ(x) + htr A + o(h) .
Possiamo allora descrivere le soluzioni del sistema (7.1).
Teorema 8.18. Le soluzioni massimali del sistema (7.1) sono definite su tutto R e sono tutte e
sole le funzioni
Y (x) = exA v ,
al variare di v ∈ Rn . In particolare, tali soluzioni formano uno spazio vettoriale di dimensione n
nello spazio vettoriale reale C ∞ (R; Rn ) e le n colonne della matrice exA ne formano una base.
Il problema di Cauchy
(
Y 0 (x) = AY (x)
(7.4)
Y (x0 ) = v
ha come unica soluzione Y (x) = e(x−x0 )A v.
6Si dimostri per esercizio che anche la derivazione di funzioni a valori matrici rispetta la regola di Leibniz
(f g)0 = f 0 g + f g 0 .
7Per dimostrarlo, osserviamo che
det (I + B) =
X
(−1)σ (δ1σ(1) + b1σ(1) ) · · · (δnσ(n) + bnσ(n) ) .
σ
In questa somma, tutte le permutazioni σ tranne quella identica danno un contributo O(kBk2 ) = o(kBk); sviluppando
poi il prodotto corrispondente alla permutazione identica si ottiene che vale 1 + tr B + O(kBk2 ).
8. *CALCOLO DELLA MATRICE ESPONENZIALE
231
Dimostrazione. La funzione Y (x) = e(x−x0 )A v è soluzione del problema (7.4). D’altra parte
la funzione F (x, Y ) = AY è continua e Lipschitziana in Y su tutto Rn+1 . Quindi tale soluzione è
unica. Il resto segue facilmente grazie al fatto che la matrice exA è invertibile per ogni x ∈ R. In
effetti, al variare di v1 , . . . , vn in una base di Rn , i vettori exA v1 , . . . , exA vn sono indipendenti per
ciascun valore di x, quindi a maggior ragione lo sono le funzioni corrispondenti.8
Ripetendo quanto visto nel Paragrafo 7, il sistema differenziale lineare non omogeneo a coefficienti
costanti
Y 0 (x) = AY (x) + b(x) ,
dove b(x) è una funzione continua su un intervallo aperto I a valori in Rn è risolto da una formula
analoga alla (2.5). La soluzione massimale passante per il punto (x0 , Y0 ) è data da
Z x
Z x
Y (x) = exA
e−tA b(t) dt + v =
e(x−t)A b(t) dt + exA v con v = e−x0 A Y0 .
x0
x0
8. *Calcolo della matrice esponenziale
Il calcolo esplicito delle matrici esponenziali exA a partire da una data matrice A è possibile, in linea
di principio, a condizione di averne determinato la cosiddetta forma canonica di Jordan. Siccome
l’espressione della forma canonica di Jordan è più semplice in ambito complesso, considereremo il
caso più generale delle matrici a coefficienti complessi.
Sia dunque P una matrice complessa invertibile tale che A0 = P AP −1 sia nella forma a blocchi


B1 0 · · · 0
 0 B2 · · · 0 


0
(8.1)
A =  ..
..
.. 
..
 .
.
.
. 
0
0
···
Br
dove i blocchi Bj , 1 ≤ j ≤ r, sono sottomatrici quadrate di dimensione mj × mj con mj ≥ 1
(ovviamente con m1 + · · · + mr = n) della forma


λj 1 0 · · · 0
 0 λj 1 · · · 0 

.
..

. .. 
(8.2)
Bj =  0 0 λj
 .
.

.
.
.
 ..
..
.. .. 1 
0 0 0 · · · λj
I termini λj che appaiono sulle diagonali dei blocchi non sono necessariamente distinti tra loro e sono
gli autovalori di A. La molteplicità geometrica di un autovalore λ (cioè la dimensione del relativo
autospazio) coincide con il numero di blocchi in cui λj = λ. Invece la somma delle dimensioni mj
dei blocchi in cui λj = λ è uguale alla molteplicità algebrica di λ (cioè come radice del polinomio
caratteristico). Indichiamo nel seguito con Ik la matrice identità k × k.
Il calcolo delle matrici esponenziali è basato sulle seguenti proprietà, che si dimostrano subito per
passaggio al limite in analoghe identità che coinvolgono le ridotte parziali della serie che definisce
exA :
0
• dall’uguaglianza A = P −1 A0 P segue che exA = P −1 exA P ;
8In generale l’indipendenza “x per x” è ben più forte dell’indipendenza in C ∞ (R; Rn ); si mostri che, per soluzioni
di sistemi lineari, i due fatti sono equivalenti.
8. *CALCOLO DELLA MATRICE ESPONENZIALE
• con riferimento alla matrice (8.1),
 xB
e 1
 0
0

exA =  .
 ..
0
exB2
..
.
···
···
..
.
0
0
..
.
0
···
exBr
0
232





• se due matrici A1 , A2 commutano, allora
ex(A1 +A2 ) = exA1 exA2 = exA2 exA1 .
Il calcolo di exA si riduce quindi al calcolo di un singolo blocco di Jordan. Inoltre, se mj = 1 allora
Bj = λj I1 , se mj > 1
Bj = λj Imj + Nj ,
dove
0
0


Nj = 0
.
 ..
0

···
···
..
.
0 0
.. . . . .
.
.
.
0 0 ···
1
0
0
1

0
0
.. 

. .

1
0
Allora
exBj = exλj Imj exNj = eλj x exNj .
Il calcolo di exNj è molto semplice, perché le potenze Nj2 , Nj3 ecc. hanno una forma simile, con
m
un’unica diagonale di 1 spostata sempre più in alto. In particolare, Nj j = 0, per cui
x2 2
xmj −1
m −1
Nj + · · · +
Nj j
2
(mj − 1)!


xmj −1
x2
1 x 2 · · · (mj −1)!


0 1 x · · · xmj −2 

(mj −2)! 

.. 
= 0 0 1 . . .
.
. 


. . .

.. ...
 .. ..
x 
0 0 0 ···
1
exNj = I + xNj +
In definitiva, exBj = exλj I1 se mj = 1 e

2
eλj x xeλj x x2 eλj x · · ·

 0
eλj x xeλj x · · ·


..
(8.3)
exBj =  0
.
0
e λj x

 .
.
.
.
..
..
..
 ..
0
0
0
···
xmj −1 λj x
(mj −1)! e

xmj −2 λj x 
e

(mj −2)!

..
.
xeλj x
e λj x





se mj > 1 .
9. *EQUAZIONI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI DI ORDINE SUPERIORE
233
9. *Equazioni differenziali lineari a coefficienti costanti di ordine superiore
Consideriamo l’equazione differenziale lineare omogenea di ordine n
(9.1)
y (n) = a1 y (n−1) + a2 y (n−2) + · · · + an−1 y 0 + an y .
Essa può essere ricondotta, in base al Lemma 8.12, al sistema

0
1
0
··· 0
0
0
1
··· 0

 ..
.
.
.
..
..
..
(9.2)
A= .
. ..

0
0
0
··· 0
an an−1 an−2 · · · a2
del primo ordine Y 0 = AY , con

0
0

..  .
.

1
a1
Dal Teorema 7.4 segue il seguente enunciato.
Corollario 8.19. L’integrale generale dell’equazione (9.1) è uno spazio vettoriale di dimensione
n in C ∞ (R).
Per determinare una base di tale spazio, si può, sempre in base al Lemma 8.12 e al Teorema 7.4,
calcolare la matrice exA ed estrarne le n componenti della prima riga. Questo richiede tuttavia il
calcolo della matrice esponenziale, che si può evitare procedendo in modo diverso.
Sullo spazio vettoriale C ∞ (R) consideriamo l’operatore di derivazione D, che applica una funzione
f nella sua derivata f 0 .
L’operatore D può essere iterato un numero arbitrario di volte, di modo che
Dk f = f (k) ,
per ogni k ∈ N (si intende che D0 è l’applicazione identica). Possiamo anche considerare combinazioni lineari degli operatori Dk , ossia polinomi nell’operatore D. Con questo formalismo,
l’equazione (9.1) assume la forma
P (D)y = 0 ,
dove
(9.3)
P (λ) = λn − a1 λn−1 − a2 λn−2 − · · · − an−1 λ − an ,
si chiama il polinomio caratteristico dell’equazione (9.1).
La normale algebra dei polinomi si applica ai polinomi in D. Precisamente, vale l’identità
P (D) ◦ Q(D) = (P Q)D ,
e dunque vale la proprietà commutativa
P (D) ◦ Q(D) = Q(D) ◦ P (D) .
Indichiamo allora con λ1 , λ2 , . . . , λr le soluzioni complesse distinte del polinomio (9.3), e con
m1 , m2 , . . . , mr le rispettive molteplicità. Allora
P (λ) = (λ − λ1 )m1 (λ − λ2 )m2 · · · (λ − λr )mr ,
e dunque
(9.4)
P (D) = (D − λ1 )m1 (D − λ2 )m2 · · · (D − λr )mr .
Lemma 8.20. Per ogni j = 1, . . . , r, le soluzioni dell’equazione differenziale
(D − λj )mj y = 0
sono anche soluzioni dell’equazione (9.1).
9. *EQUAZIONI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI DI ORDINE SUPERIORE
234
Dimostrazione. Essendo possibile riordinare a piacere i fattori nella (9.4), possiamo supporre
che j = r. La conclusione è dunque ovvia.
Lemma 8.21. Per ogni λ ∈ R le soluzioni dell’equazione differenziale
(D − λ)m y = 0
sono tutte e sole le funzioni p(x)eλx , dove p è un polinomio di grado strettamente minore di m.
Dimostrazione. Si ponga y(x) = eλx z(x). Allora
(D − λ)y(x) = eλx z 0 (x) + λeλx z(x) − λeλx z(x) = eλx z 0 (x) .
Induttivamente si ottiene che
(D − λ)k y(x) = eλx z (k) (x)
per ogni intero k. Quindi l’equazione differenziale (D − λ)m y = 0 si riduce a z (m) = 0, le cui
soluzioni sono per l’appunto i polinomi di grado strettamente minore di m.
Si ottengono in questo modo le seguenti n soluzioni dell’equazione (9.1):
(9.5)
eλ1 x xeλ1 x
eλ2 x xeλ2 x
...
eλr x xeλr x
...
...
...
...
xm1 −1 eλ1 x
xm2 −1 eλ2 x
.
...
xmr −1 eλr x
Se dimostriamo che esse sono linearmente indipendenti, possiamo concludere che l’integrale generale
dell’equazione (9.1) è dato dalle loro combinazioni lineari. La dimostrazione che proponiamo si basa
sull’uso di derivazioni successive; un’altra dimostrazione, che fa uso del collegamento con i sistemi
del I ordine e la decomposizione di Jordan, è descritta nell’Osservazione 8.24.
Proposizione 8.22. Le n funzioni in (9.5) sono linearmente indipendenti in C ∞ (R).
Dimostrazione. Siano ci,j , 1 ≤ i ≤ r, 0 ≤ j ≤ mj − 1 coefficienti complessi tali che
r m
i −1
X
X
ci,j xj eλi x = 0
∀x ∈ R .
i=1 j=1
Dobbiamo mostrare che tutti i ci,j si annullano. Dimostrare questo equivale a verificare che eλi x
sono indipendenti se assumiamo come spazio dei coefficienti quello dei polinomi, i.e. se Fi sono
polinomi tali che
(9.6)
r
X
Fi (x)eµi x ≡ 0 ,
i=1
con i µi ∈ C tutti distinti, allora Fi (x) ≡ 0 per 1 ≤ i ≤ r (e quindi, per il principio di identità del
polinomi, i loro coefficienti sono tutti nulli). Basterà allora applicare questo risultato ai polinomi
Fi (x) =
m
i −1
X
ci,j xj eλi x
j=1
per ottenere l’annullamento di tutti i ci,j .
Premettiamo l’osservazione che, per un generico polinomio P , (P (x)eµx )0 = Q(x)eµx , con Q(x) =
µP (x)+P 0 (x), quindi se µ 6= 0 il polinomio Q ha grado uguale a quello di P . Useremo in particolare
il fatto che Q è nullo se e solo se P è nullo.
9. *EQUAZIONI DIFFERENZIALI LINEARI A COEFFICIENTI COSTANTI DI ORDINE SUPERIORE
235
Ragioniamo ora per induzione su r. Il caso r = 1 è banale. Per fare il passaggio induttivo scriviamo
l’ipotesi nella forma
r−1
X
Fi (x)e(λi −λr )x ≡ −Fr (x)
i=1
e deriviamo kr + 1 volte, con kr pari al grado del polinomio Fr , per ottenere
r−1
X
(9.7)
Qi (x)e(λi −λr )x ≡ 0
i=1
per opportuni polinomi Qi , 1 ≤ i ≤ r − 1, nulli se e solo se i polinomi Fi sono nulli (perché
µi = λi − λr 6= 0 per 1 ≤ i ≤ r − 1). Allora, essendo i µi , 1 ≤ i ≤ r − 1, tutti distinti, per ipotesi
induttiva dall’identità (9.7) ricaviamo che tutti i polinomi Qi , quindi anche tutti i Fi , sono nulli
per 1 ≤ i ≤ r − 1. Inserendo questa informazione nell’equazione (9.6) otteniamo che Fr ≡ 0.
È anche utile osservare l’esistenza di un legame stretto tra il polinomio caratteristico nella (9.3) e
il polinomio caratteristico della matrice corrispondente, quando scriviamo l’equazione di ordine n
come sistema del I ordine.
Lemma 8.23. Il polinomio caratteristico Q(λ) = det(A − λI) della matrice A definita nella (9.2) è
uguale a (−1)n P , dove P è il polinomio nella formula (9.3).
Dimostrazione. Si consideri

−λ
1
0
 0
−λ
1

 ..
.
..
..
A − λI =  .
.

 0
0
0
an an−1 an−2
···
···
..
.
···
···
0
0
..
.
0
0
..
.
−λ
1
a2 a1 − λ




 .


Se n = 2,
Q(λ) = −λ(a1 − λ) − a2 = λ2 − a1 λ − a2 = P (λ) .
Supponendo la tesi vera per n − 1, chiamiamo A11 la matrice (n − 1) × (n − 1) ottenuta eliminando
la prima riga e la prima colonna di A. Allora
Q(λ) = −λ det(A11 − λI) + (−1)n+1 an ,
(9.8)
e, per ipotesi induttiva,
(9.9)
det(A11 − λI) = (−1)n−1 (λn−1 − a1 λn−2 − · · · − an−2 λ − an−1 ) .
La conclusione è dunque immediata, inserendo l’espressione a destra della (9.9) nella (9.8).
Osservazione 8.24 (Dimostrazione alternativa della Proposizione 8.22). In base alla formula (8.3), la matrice exA = P −1 A0 P può contenere nella prima riga solo combinazioni lineari delle
funzioni (9.5)9, e dunque ogni soluzione è combinazione lineare di queste. Per il Corollario 8.19, le
funzioni (9.5) formano una base dell’integrale generale.
9Anzi, la presenza di xmj −1 eλj x tra le soluzioni (9.5) indica che, necessariamente, la forma canonica di Jordan
di A contiene un unico blocco, di dimensione mj × mj , con autovalore λj .
10. ESERCIZI
236
10. Esercizi
Esercizio 8.1.
Sia I un intervallo chiuso e limitato e sia f : I → I una funzione continua. Si dimostri che f ha
almeno un punto fisso. La conclusione vale anche per intervalli non limitati o non chiusi?
Esercizio 8.2.
Data f : R → R Lipschitziana di costante di Lipschitz minore di 1. Si provi che f ha un punto
fisso.
Esercizio 8.3.
Si costruisca una applicazione 1–Lipschitziana di uno spazio metrico compatto in sé che non ha
punti fissi.
Esercizio 8.4.
Si mostri che esiste una funzione continua f : R → R tale che per ogni x, y ∈ R, con x 6= y, si ha
|f (x) − f (y)| < |x − y|
ma f non ha punti fissi.
Esercizio 8.5. F
Sia (K, d) uno spazio metrico compatto e sia f : K → K una funzione tale che per ogni x, y ∈ K
si ha
d(f (x), f (y)) < d(x, y) .
Si mostri che f ammette un unico punto fisso x e che per ogni x ∈ K la successione per ricorrenza
delle iterate, xn+1 = f (xn ) con x0 = x, converge a x.
La mappa f è necessariamente una contrazione?
Esercizio 8.6. F
Si mostri che esiste una funzione f da uno spazio metrico completo (X, d) in sé tale che per ogni
x, y ∈ R si ha
1
d f (x), f (y) ≤ [d(x, y)]α ,
2
con α < 1, ma f non ha punti fissi.
Si provi però che tale controesempio non si può esibire se lo spazio metrico è R, cioè una tale
funzione f : R → R ha almeno un punto fisso (vale anche in Rn ma la dimostrazione richiede
strumenti più complessi).
Esercizio 8.7.
Sia f una funzione continua da una palla centrata nell’origine di R2 in R. Si mostri che l’equazione
f (x) = f (−x) ha infinite soluzioni.
Esercizio 8.8.
Si mostri che non esistono funzioni continue f : R → R tali che f (f (x)) = −x per ogni x ∈ R.
Esistono funzioni continue f : R → R tali che f (f (x)) = x diverse da f (x) = ±x? E dall’intervallo
[0, 1] in sé?
Esercizio 8.9. F
Sia f : [0, 1] → [0, 1] una funzione continua tale che per ogni x ∈ [0, 1] si ha f (f (. . . (x) . . . )) = x
(un numero dispari di volte), allora vale f (x) = x?
10. ESERCIZI
237
Esercizio 8.10. F
Siano f, g : [0, 1] → [0, 1] due funzioni continue tali che f (g(x)) = g(f (x)) per ogni x ∈ [0, 1]. Si
provi che allora esiste y ∈ [0, 1] tale che f (y) = g(y).
Esercizio 8.11.
Sia f : [a, b] → [a, b] una funzione crescente e sia A = {x ∈ [a, b] : f (x) ≥ x}. Si dimostri che
S = sup A è un punto fisso per f .
Esercizio 8.12.
Sia f continua da R in R tale che esista la funzione inversa f −1 e sia f = f −1 . Si mostri che esiste
almeno un punto fisso per f (cioè una soluzione dell’equazione f (x) = x). Se inoltre f è crescente,
allora tutti i punti sono fissi per f , cioè f è la funzione identità.
Esercizio 8.13.
Sia f ∈ C([a, b]), derivabile in (a, b) con f (a) = 0 ed esista C > 0 tale che
|f 0 (x)| ≤ C|f (x)| per ogni
x ∈ (a, b) .
Si mostri che f ≡ 0.
Esercizio 8.14 (Lemma di Gronwall “integrale”).
Siano f, u ∈ C([a, b]) con u ≥ 0, si provi che se vale
Z x
f (x) ≤ A +
f (t)u(t) dt ,
a
per una costante non negativa A ∈ R, allora si ha
f (x) ≤ Ae
Rx
a
u(t) dt
.
Si mostri che questo risultato implica il Lemma di Gronwall “differenziale”.
Cosa si può concludere se invece di essere costante, A è una funzione continua A(x)?
Esercizio 8.15.
Si dimostri con metodi elementari che ex è l’unica funzione u : R → R derivabile in ogni punto tale
che
u0 = u, u(0) = 1 .
Esercizio 8.16.
Supponendo di non conoscere le proprietà delle funzioni seno e coseno, si provi che l’unica funzione
u ∈ C 2 (R) che soddisfa
u00 + u = 0, u(0) = 0, u0 (0) = 1 ,
verifica la relazione u0 2 + u2 = 1, è periodica e che per u e u0 valgono le formule di addizione del
seno e coseno.
Esercizio 8.17.
Sia u : [0, 1] → R una funzione C ∞ tale che
00
u (t) = u7 (t) per ogni t ∈ (0, 1),
u(0) = u(1) = 0 .
Si provi che allora u = 0.
Esercizio 8.18.
00
Sia f : [0, 1] → R una funzione C 2 tale che f (0) = f (1) = 0 e f 0 (x) = f (x)f (x) per ogni x ∈ [0, 1].
Si provi che la funzione f è identicamente nulla.
10. ESERCIZI
238
Esercizio 8.19.
Si discutano le proprietà delle funzioni y = y(x) con y(0) = a, definite in un intorno dell’origine,
tali che y 0 ≥ y 2 , al variare di a ∈ R.
Si faccia lo stesso per le funzioni che soddisfano y 0 ≤ y 2 .
Esercizio 8.20.
Una equazione differenziale ordinaria in forma normale y (n) = f (x, y, y 0 , . . . , y n−1 ) si dice autonoma
se la funzione f non dipende dalla variabile x. Si mostri che se y = y(x) è una soluzione, anche
z = z(x) = y(x + c) è una soluzione, per ogni c ∈ R (invarianza per traslazione).
Nel caso speciale y 00 = f (y), se la funzione F è una primitiva della funzione f , si mostri che per
ogni soluzione, la quantità |y 0 |2 /2 − F (y) è costante.
Nel caso speciale y 0 = f (y) con f ∈ C 1 (R), se f (a) = 0 si diano condizioni su f tali che per ogni
soluzione y = y(x) definita su un intervallo illimitato a destra di R si abbia limx→+∞ y(x) = a.
Esercizio 8.21. F
Si provi che se la funzione continua f : I × R → R è limitata e localmente Lipschitziana nella
seconda variabile oppure non limitata ma uniformemente Lipschitziana nella seconda variabile, il
problema di Cauchy
0
y = f (x, y)
y(x0 ) = y0 ,
ha esistenza globale nell’intervallo I per ogni dato iniziale y0 .
Si discuta l’esistenza globale nel caso di f : R2 → R tale che valga, per ogni x, y, y 0 ,
|f (x, y) − f (x, y 0 )| ≤ h(x)|y − y 0 |
dove h : R → R è una funzione continua, non negativa.
Esercizio 8.22. F
Sullo spazio delle funzioni continue y : [x0 , a] → R definiamo la norma
kykC,L = sup e−CL(x−x0 ) |y(x)| .
x∈[x0 ,a]
Si mostri che C([x0 , a]) è uno spazio di Banach con questa norma.
Sia f : [x0 , a] × R → R continua e uniformemente Lipschitziana nella seconda variabile con costante
L. Si mostri che scegliendo una costante C abbastanza grande, l’operatore T da C([x0 , a]) in sé
definito da
Z x
T (y)(x) = y0 +
f (t, y(t)) dt ,
x0
per ogni y ∈ C([x0 , a]), è una contrazione se si considera su C([x0 , a]) la norma k · kC,L . Di
conseguenza, esiste una soluzione globale del problema di Cauchy
0
y = f (x, y)
y(x0 ) = y0 ,
in tutto l’intervallo [x0 , a].
Si provi ad estendere questo argomento al caso di intervalli illimitati.
Esercizio 8.23 (Dipendenza continua dai dati). F
Sia f : R2 → R una funzione globalmente Lipschitziana e limitata e siano x0 , y0 , x ∈ R, definiamo
F (f, x0 , y0 , x) ∈ R come segue: sia y : R → R la soluzione (globalmente definita) del problema di
Cauchy
0
y = f (x, y)
y(x0 ) = y0 ,
10. ESERCIZI
239
e poniamo F (f, x0 , y0 , x) = y(x).
È quindi definita una funzione F : Lip(R2 ) × R × R × R → R, dove Lip(R2 ) è lo spazio (di Banach)
delle funzioni Lipschitziane e limitate in R2 con la norma
|f (z) − f (w)|
kf kLip = kf k∞ + sup
.
kz − wk
2
z,w∈R
Si provi che la funzione F è continua.
Si enunci una versione “locale” di questo risultato.
Nel caso che la funzione f sia in C 1 (R2 ) con derivate parziali limitate e Lipschitziane, si provi ad
esprimere le derivate parziali della funzione F nelle tre variabili reali.
Esercizio 8.24. F
Sia f : [0, a) → R una funzione continua,
R a non negativa e nulla solo nell’origine (non Lipschitziana).
Si provi che se l’integrale improprio 0 fdx
(x) è divergente, allora l’unica soluzione del problema di
Cauchy
0
y = f (y)
y(0) = 0 ,
è la funzione nulla sull’intervallo [0, a).
Esercizio 8.25.
Si dica se esistono funzioni derivabili f : R → R tali che
1
,
f 0 (x) =
f (x)
per ogni x ∈ R ed eventualmente si determinino.
Esercizio 8.26.
Sia f : R → R derivabile e tale che f 0 (x) = arctan f (x) per ogni x ∈ R. Si mostri che:
• se f si annulla in un punto, allora si annulla in tutti i punti,
• se f (0) > 0 allora
lim f (x) = +∞,
x→+∞
lim f (x) = 0.
x→−∞
Esercizio 8.27.
Si studino le proprietà delle soluzioni (massimali) dei seguenti problemi di Cauchy, al variare del
parametro a ∈ R:
y0 = 1 + y2
y(0) = 0 ,
2
y 0 = xey sin y
y(0) = 1 ,
2(y − 1)
y0 =
y(1) = a ,
x(x2 + 2x + 2)
1
y a y
+
y0 =
1+
y(1) = 0 .
2
x
x
Esercizio 8.28.
Si studino le proprietà delle soluzioni delle seguenti equazioni differenziali:
y0 = y − x ,
1
y0 = x 1 +
per x 6= 0 ,
y
y 0 = 4y(1 − y) ,
10. ESERCIZI
240
xy 0 + y = x arctan x ,
y0 = 2 −
y2
.
x2
Esercizio 8.29.
Si determini il più esplicitamente possibile la soluzione massimale del seguente problema di Cauchy:
y 0 = 1 + 2yx
y(0) = 1 .
Esercizio 8.30.
Si dica se la seguente equazione differenziale ammette soluzioni periodiche per α ∈ R+ ,
α
y 0 + y = sin x
x
Esercizio 8.31 (Equazioni di Riccati).
Siano p, q, r ∈ C(I) con I ∈ R un intervallo, le seguenti equazioni differenziali ordinarie si dicono
di equazioni di Riccati,
y 0 (x) + p(x)y = q(x)y 2 (x) + r(x) .
Si mostri che se y è una soluzione, le altre soluzioni sono della forma z = y + u dove u è una
soluzione dell’equazione di Bernoulli
u0 (x) + [p(x) − 2y(x)q(x)]u(x) = q(x)u2 (x) .
Si studi inoltre l’equazione soddisfatta dalla funzione z supponendo che y+1/z sia un’altra soluzione.
Si cerchino le soluzioni dell’equazione
(1 + x2 )y 0 (x) − xy(x) + y 2 (x) = 1 + x2 ,
cercando inizialmente una soluzione affine.
Esercizio 8.32 (Equazioni di Clairaut).
Sia f ∈ C 1 (I) con I ∈ R un intervallo, le seguenti equazioni differenziali ordinarie si dicono di
equazioni di Clairaut,
y(x) = xy 0 (x) + f (y 0 (x)) .
Si derivi l’equazione e si discutano le possibili soluzioni.
Si cerchino le soluzioni delle equazioni
y(x) = xy 0 (x) + [y 0 (x)]2
e
y(x) = xy 0 (x) + [y 0 (x)]3 .
Esercizio 8.33 (Equazioni di D’Alembert–Lagrange). FF
Siano f, g ∈ C 1 (I) con I ∈ R un intervallo, le seguenti equazioni differenziali ordinarie si dicono di
equazioni di D’Alembert–Lagrange,
y(x) = xf (y 0 (x)) + g(y 0 (x)) .
Si derivi l’equazione e si manipoli il risultato per ottenere un’equazione più semplice, assumendo
che la funzione y 0 (x) sia invertibile, cioè si possa scrivere x = x(y 0 ).
Si cerchino le soluzioni delle equazioni
y(x) = x[y 0 (x)]2 + [y 0 (x)]2
e
y(x) = x[y 0 (x)]2 + [y 0 (x)]3 .
Esercizio 8.34 (Equazioni “esatte”).
Siano A, B ∈ C 1 (Ω) con Ω ∈ R2 aperto. Si consideri l’equazione differenziale ordinaria
A(x, y(x)) + B(x, y(x))y 0 (x) = 0 ,
10. ESERCIZI
241
supponendo che esista una funzione F ∈ C 2 (Ω) tale che
∂F
=A
∂x
e
∂F
=B,
∂y
si provi che il grafico (connesso) di ogni soluzione è contenuto in un insieme di livello della funzione
F.
Si osservi che una condizione necessaria per l’esistenza di una tale funzione F è
∂B
∂A
=
,
∂y
∂x
per il teorema di Schwarz. Tale condizione è anche sufficiente?
Esercizio 8.35.
Siano a, b ∈ C(I) con I ∈ R un intervallo, supponendo di conoscere una soluzione y1 della seguente
equazione differenziale lineare
a(x)y 00 (x) + b(x)y 0 (x) + c(x)y(x) = 0 ,
si mostri che si puó cercarne un’altra, linearmente indipendente da y1 , abbassando il grado dell’equazione, considerando le possibili soluzioni y2 = vy1 .
Si cerchino le soluzioni dell’equazione (equazione di Legendre)
(1 − x2 )y 00 (x) − 2xy 0 (x) + 2y(x) = 0 ,
osservando che y1 (x) = x è una soluzione.
Si cerchino le soluzioni dell’equazione (equazione di Bessel)
x2 y 00 (x) + xy 0 (x) + (x2 − 1/4)y(x) = 0 ,
osservando che
sin
√x
x
è una soluzione.
Esercizio 8.36.
Sia f ∈ C(I) con I ∈ R un intervallo, si mostri che il problema di Cauchy
00
y +y =f
y(0) = y 0 (0) = 0
ha soluzione data da
Z
x
f (t) sin(x − t) dt .
y(x) =
0
Esercizio 8.37. FF
Si discuta l’esistenza di una soluzione del problema di Cauchy
0
y = f (x, y)
y(x0 ) = y0
con f solo continua in un intorno del punto x0 , y0 ∈ R2 , secondo le seguenti possibili linee:
(1) approssimando la funzione f con funzioni Lipschitz o C 1 , risolvendo l’equazione corrispondente e cercando di passare al limite nelle soluzioni ottenute;
(2) costruendo una successione di funzioni affini a tratti che soddisfa l’equazione nei punti di
bordo dei sottointervalli dove ogni funzione è affine (considerando la derivata destra invece
che la derivata), eventualmente convergente ad una soluzione del sistema.
10. ESERCIZI
242
Esercizio 8.38.
Abbiamo definito l’esponenziale di una matrice A ∈ Mn (R) (o in Mn (C)) come la serie
∞
X
An
A
e =
.
n!
n=0
Si provi a definire le altre funzioni “elementari” sulle matrici usando le serie di potenze e si discuta
il loro dominio di definizione e le loro proprietà.
Esercizio 8.39.
Si mostri che vale
A n
,
eA = lim Id +
n→∞
n
per ogni matrice A ∈ Mn (R) (o in Mn (C)).
Esercizio 8.40.
−1
Si mostri che se A è invertibile si ha eABA = AeB A−1 .
Esercizio 8.41. F
Si provi che se due matrici A e B commutano, si ha AeB = eB A e vale la formula
eA+B = eA eB .
Si diano esempi in cui tale formula non vale se A e B non commutano.
Si concluda che la matrice eA è sempre invertibile e la sua inversa è e−A .
Esercizio 8.42. F
Si provi che det eA = etr A .
Esercizio 8.43.
Sia consideri il seguente sistema autonomo di equazioni differenziali (bidimensionale)
0
x = f (x, y)
y 0 = g(x, y)
dove f, g ∈ C 1 (R2 ). Una soluzione massimale t 7→ (x(t), y(t)) si dice anche orbita del sistema.
Un punto (x0 , y0 ) ∈ R2 si dice punto critico o stazionario se f (x0 , y0 ) = g(x0 , y0 ) = 0, isolato se
non ve ne sono altri in un suo intorno.
Un punto critico (x0 , y0 ) ∈ R2 si dice stabile se per ogni suo intorno U esiste un altro suo intorno
V ⊆ U tale che se una soluzione (x(t), y(t)) “entra” in V non può più uscire da U , precisamente,
se al tempo t0 ∈ R si ha (x(t0 ), y(t0 )) ∈ V , allora per ogni t ≥ t0 si ha (x(t), y(t)) ∈ U .
Un punto critico si dice instabile se non è stabile.
Un punto critico (x0 , y0 ) si dice asintoticamente stabile se è stabile e esiste un suo intorno U tale
che se una soluzione (x(t), y(t)) “entra” in U , allora tende a (x0 , y0 ) asintoticamente, precisamente
se al tempo t0 ∈ R si ha (x(t0 ), y(t0 )) ∈ U , allora si ha limt→+∞ (x(t), y(t)) = (x0 , y0 ).
Si provi che una soluzione non può “passare” per un punto critico, a meno che non sia la soluzione
costante “ferma” in tale punto.
Si discuta e si cerchi di disegnare la struttura delle orbite dei seguenti sistemi:
0
0
0
x = −y
x = −x
x = x2
,
,
,
0
0
y =x−y
y =y−x
y 0 = y(2x − y)
0
0
0
x =x
x = −xy
x = y2
,
,
,
y0 = y2
y0 = x
y 0 = x2 + y 2
attorno al loro punto critico isolato (0, 0) ∈ R2 .
10. ESERCIZI
243
Esercizio 8.44. FF
Sia consideri il seguente sistema autonomo di equazioni differenziali lineari
0
x = ax + by
y 0 = cx + dy
e si studino le orbite attorno al puntocriticonell’origine di R2 , mettendone la struttura in relazione
a b
con gli autovalori della matrice A =
.
c d
Si studi, ad esempio, il seguente sistema
0
x = −2x + y/2
.
y 0 = 2x − 2y
Esercizio 8.45. FF
Si studi (trasformandola in un sistema lineare del prim’ordine) la seguente equazione (oscillatore
smorzato):
mu00 + µu0 + ru = 0 ,
in dipendenza dei parametri m, µ, r.
Esercizio 8.46. FF
Sia consideri il seguente sistema autonomo di equazioni differenziali
0
x = f (x, y)
y 0 = g(x, y)
con f, g ∈ C 1 (R2 ) e f (0, 0) = g(0, 0) = 0, supponendo che l’origine sia un punto critico isolato del
sistema.
Si studino le orbite attorno al punto critico nell’origine di R2 , cercando di metterne la struttura in
relazione con la struttura delle orbite del sistema lineare (detto linearizzato)
0
x = ax + by
y 0 = cx + dy
dove
∂f
∂f
∂g
(0, 0), b =
(0, 0), c =
(0, 0),
∂x
∂y
∂x
Si considerino, ad esempio, i seguente sistemi:
0
x = −x − 1 + eαy
,
y 0 = ex−y − 1
a=
dove α ∈ R,
x0 = y
y 0 = −ky −
g
l
sin x
d=
∂g
(0, 0) .
∂y
,
dove k, g, l ∈ R+ (pendolo smorzato).
Esercizio 8.47. F
Si studi il seguente sistema autonomo di equazioni differenziali
0
x = −x − logy r
,
y 0 = −y + logx r
p
con r = x2 + y 2 . Si verifichi che il comportamento delle sue orbite nell’intorno dell’origine di R2
è diverso dal comportamento delle orbite del suo sistema linearizzato.
10. ESERCIZI
244
Esercizio 8.48.
Data l’equazione x00 + ϕ(x, x0 ) = 0 con ϕ ∈ C 1 (R2 ), si trasformi tale equazione in un sistema di due
equazioni differenziali del prim’ordine e si verifichi che i suoi punti critici sono i punti (x0 , 0) ∈ R2
tali che ϕ(x0 , 0) = 0.
Ovviamente, per ogni tale x0 ∈ R si ha che x(t) = x0 è una soluzione costante dell’equazione.
Si mostri che il linearizzato del sistema ottenuto in tali punti critici (x0 , 0) corrisponde alla trasformazione in sistema dell’equazione lineare
x00 + ∂y ϕ(x0 , 0)x0 + ∂x ϕ(x0 , 0)(x − x0 ) = 0 ,
detta linearizzazione dell’equazione originaria attorno alla soluzione costante x(t) = x0 .
Esercizio 8.49.
Dato un sistema autonomo di equazioni differenziali
0
x = f (x, y)
y 0 = g(x, y)
con f, g ∈ C 1 (R2 ), una funzione U differenziabile in un aperto Ω di R2 si dice un integrale primo
del sistema se, escludendo i punti critici del sistema, il suo gradiente non è mai nullo e per ogni
soluzione (x(t), y(t)) in Ω si ha che U (x(t), y(t)) costante.
Le curve di livello della funzione U (che se è almeno C 1 sappiamo essere localmente delle curve,
dal teorema della funzione implicita) si dicono allora curve integrali del sistema.
Si mostri che se un’orbita interseca una curva integrale, allora vi è interamente contenuta e che
ogni curva integrale è unione disgiunta di orbite.
Si provi che in ogni punto (x, y) ∈ Ω il gradiente di un integrale primo U è ortogonale al vettore
di R2 di componenti f (x, y) e g(x, y). Viceversa, si mostri che una funzione che soddisfi questa
proprietà e abbia gradiente non nullo fuori dai punti critici del sistema è un integrale primo.
Esercizio 8.50. F
Si determini un integrale primo del sistema
x0 = y
y 0 = x3 − x
e se ne descrivano le curve di livello.
Esercizio 8.51. F
Si provi che se U ∈ C 1 (Ω) è un integrale primo di un sistema e l’insieme di livello Γ = {(x, y) ∈
R2 : U (x, y) = c} è una curva chiusa che non contiene punti critici del sistema, allora Γ è un’orbita
periodica, cioè ogni soluzione (x(t), y(t)) con un punto in comune con Γ è periodica e “percorre”
tutto Γ.
Esercizio 8.52.
Si determinino integrali primi dei seguenti sistemi,
0
0
x = x(1 + y)
x = x(xey − cos y)
,
,
y 0 = −y(1 + x)
y 0 = sin y − 2xey
0
0
x = y − x2 y − y 3
x = 2x2 y
,
,
0
2
2
y =x +y −1
y 0 = x(1 + y 2 )
e si cerchi di disegnarne gli insiemi di livello.
10. ESERCIZI
245
Esercizio 8.53.
Si studino i seguenti sistemi di equazioni differenziali con particolare attenzione agli integrali primi:
0
0
x = 2y(y − 2x)
x = x − xy
,
.
y 0 = (1 − x)(y − 2x)
y 0 = xy − y
Esercizio 8.54. F
Si studi la seguente equazione di Van der Pol:
x00 − µ(1 − x2 )x0 + x = 0 ,
dove µ > 0.
Libri Utili o per Approfondire
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
E. Acerbi, L. Modica, S. Spagnolo, Problemi scelti di analisi matematica I, Liguori Editore, 1985.
A. Bruckner, Differentiation of real functions, CRM Monograph Series, vol. 5, AMS, 1994.
F. Conti, Calcolo. Teoria e applicazioni, McGraw–Hill, 1993.
J. Dugundji, Topology, Allyn and Bacon, 1966.
B. R. Gelbaum, J. M. H. Olmsted, Counterexamples in analysis, Holden–Day, 1964.
P. R. Halmos, Naive set theory, D. Van Nostrand Co., 1960.
J. L. Kelley, General topology, D. Van Nostrand Co., 1955.
A. B. Kharazishvili, Strange functions in real analysis, Pure and Applied Mathematics, vol. 272, Chapman &
Hall/CRC, 2006.
J. E. Marsden, Elementary classical analysis, W. H. Freeman and Co., 1974.
L. C. Piccinini, G. Stampacchia, G. Vidossich, Equazioni differenziali ordinarie in Rn (problemi e metodi), Liguori
Editore, 1978.
G. Prodi, Analisi matematica, Bollati Boringhieri, 1972.
W. Rudin, Principles of mathematical analysis, McGraw–Hill, 1976.
L. A. Steen, J. A. Seebach Jr., Counterexamples in topology, Holt, Rinehart and Winston, 1970.
246