Caso generale delle funzioni da IR n in IR m

Transcript

Caso generale delle funzioni da IR n in IR m
Richiami sulle funzioni da Rn in Rm
Salvo diversa indicazione, supporremo sempre n, m ≥ 1 (interi).
1.1
Brevi richiami sullo spazio Rn
L’insieme Rn è il prodotto cartesiano di n fattori uguali ad R, ossia l’insieme delle n-uple ordinate di
numeri reali:
Rn := R × ... × R = {(x1 , ..., xn ) : xi ∈ R per ogni i = 1, ..., n} .
I numeri reali x1 , ..., xn sono detti termini o entrate della n-upla (x1 , ..., xn ), la quale viene spesso indicata
anche con le scritture1


x1


oppure  ...  .
x1 · · · xn
xn
Se n = 2, 3, si usa spesso non indicizzare i termini e denotare invece gli elementi di R2 ed R3 con (x, y)
e (x, y, z). Se n = 1, si ha ovviamente R1 = R.
Due elementi di Rn sono uguali se sono uguali tutti i loro termini :
(x1 , ..., xn ) = (y1 , ..., yn ) ⇐⇒ x1 = y1 , ..., xn = yn .
1.1.1
Struttura vettoriale
L’insieme Rn è uno spazio vettoriale reale rispetto alle seguenti operazioni termine a termine:
(x1 , ..., xn ) + (y1 , ..., yn ) = (x1 + y1 , ..., xn + yn )
e λ (x1 , ..., xn ) = (λx1 , ..., λxn ) .
Il vettore nullo di Rn è 0Rn = (0, ..., 0) ed una sua base (detta base canonica) è data da
e1 = (1, 0, 0, ..., 0) ,
e2 = (0, 1, 0, ..., 0) ,
...,
en = (0, ..., 0, 0, 1) ,
per cui risulta dim Rn = n. Inoltre si ha che (x1 , ..., xn ) = x1 e1 + ... + xn en per ogni (x1 , ..., xn ) ∈ Rn .
1 anche se, a rigori, la prima scrittura rappresenta un elemento dell’insieme R1,n delle matrici ad 1 riga ed n colonne,
mentre la seconda rappresenta un elemento dell’insieme Rn,1 delle matrici ad n righe ed 1 colonna
1
2
M.Guida, S.Rolando, 2015
1.1.2
Ulteriori notazioni
Alcune identificazioni notevoli di Rn con altri insiemi forniscono altre notazioni, di uso molto frequente.
• Interpretandone le entrate come componenti, gli elementi di Rn si identificano con i vettori x di un
qualsiasi spazio vettoriale di dimensione n in cui si sia fissata una base (e1 , ..., en ); in quest’ottica,
si scrive
x = (x1 , ..., xn ) intendendo x = x1 e1 + ... + xn en
e la base (e1 , ..., en ) risulta allora identificata con la base canonica di Rn .
Se i vettori considerati sono i vettori freccia dello spazio ordinario di dimensione 2 o 3, si usa spesso
non indicizzare i vettori della base fissata e denotarli invece con i, j o i, j, k. Si avrà allora
(x, y) = xi + yj e
(x, y, z) = xi + yj + zk.
• Interpretandone le entrate come coordinate, gli elementi di Rn si identificano con i punti P dello
spazio “geometrico” ordinario n-dimensionale (tecnicamente si dovrebbe parlare di spazio affine)
in cui si sia fissato un riferimento (O; e1 , ..., en ); in quest’ottica, si scrive
P = (x1 , ..., xn )
intendendo P − O = x1 e1 + ... + xn en
e l’origine O risulta allora identificata con il vettore nullo di Rn .
Esempio 1 Identificando vettori e punti del piano cartesiano2 con le coppie di R2 , la retta P = P0 + tu
si scrive
x = x0 + tu1
cioè
,
(x, y) = (x0 , y0 ) + t (u1 , u2 ) ,
y = y0 + tu2
se P = (x, y), P0 = (x0 , y0 ) e u = (u1 , u2 ).
Nel seguito utilizzeremo indifferentemente le varie notazioni, passando dall’una all’altra senza ulteriori
specificazioni.
1.2
Elementi di topologia3 in Rn
Ricordiamo che si chiama distanza4 tra due punti P, Q ∈ Rn la norma (o modulo) del loro vettore
differenza, cioè
d (P, Q) = P − Q =
2
(x1 − y1 ) + ... + (xn − yn )
2
dove P = (x1 , ..., xn ) e Q = (y1 , ..., yn ).
Definizione 2 Chiamiamo intorno 5 di un punto P0 ∈ Rn un qualsiasi insieme del tipo
Br (P0 ) := {P ∈ Rn : P − P0 < r}
2 Ricordiamo
con r > 0
che per piano (o spazio) cartesiano si intende il piano (o spazio) ordinario in cui si è fissato un riferimento.
molto intuitivamente, per topologia (letteralmente studio dei luoghi ) si intende lo studio delle proprietà comuni
a tutti gli insiemi di punti che possono essere deformati l’uno nell’altro senza tagli o incollature.
4 Più precisamente dovremmo dire distanza euclidea, perché si possono definire distanze di altro tipo.
5 Più precisamente dovremmo dire intorno sferico aperto, perché si possono definire nozioni più generali di intorno
(ad esempio cambiando nozione di distanza, ma non solo).
3 Detto
3
M.Guida, S.Rolando, 2015
(in altri termini, Br (P0 ) è l’insieme dei punti P ∈ Rn che distano da P0 meno di r). P0 ed r sono
rispettivamente detti centro e raggio dell’intorno Br (P0 ).
Se n = 1, si ottiene Br (x0 ) = (x0 − r, x0 + r). Se n = 2 o n = 3, allora Br (P0 ) è, rispettivamente, il
cerchio (senza circonferenza) o la palla (senza sfera) di raggio r e centro P0 .
La seguente definizione classifica i punti di Rn in relazione ad un assegnato insieme A, descrivendo
tre possibilità che si escludono a vicenda.
Definizione 3 Dati un insieme A ⊆ Rn ed un punto P0 ∈ Rn (non necessariamente in A), si dice che:
• P0 è di frontiera per A se ogni intorno di P0 contiene almeno un punto di A e uno di Rn \ A (in
tal caso, P0 può stare in A o meno);
• P0 è interno ad A se esiste un intorno di P0 interamente contenuto in A (in tal caso, P0 deve
necessariamente stare in A);
• P0 è esterno ad A se esiste un intorno di P0 interamente contenuto in Rn \ A (in tal caso, P0 non
può stare in A).
L’insieme dei punti di frontiera per A è indicato con ∂A ed è detto frontiera di A. L’insieme dei punti
interni ad A è indicato con A◦ ed è detto interno di A. Si chiama chiusura di A l’insieme A := A∪∂A.
◦
Molti autori scrivono A invece di A◦ . Si dimostra che A◦ = A \ ∂A, ∂A = A \ A◦ e A = A◦ ∪ ∂A.
L’insieme Rn \ A coincide con l’insieme dei punti esterni ad A ed è spesso chiamato esterno di A.
Tramite la definizione precedente, la definizione seguente descrive due tipi di insiemi in base alla
natura dei loro punti.
Definizione 4 Un insieme A ⊆ Rn è detto:
• aperto se coincide col proprio interno (A = A◦ ), cioè se non contiene alcun punto della propria
frontiera (A ∩ ∂A = ∅);
• chiuso se coincide con la propria chiusura (A = A), cioè se contiene interamente la propria frontiera
(∂A ⊆ A).
È facile verificare che A è aperto (risp. chiuso) se e solo se il suo complementare Rn \ A è chiuso (risp.
aperto). L’interno e l’esterno di A sono sempre aperti, mentre la sua chiusura e la sua frontiera sono
sempre chiusi.
Se n = 1 ed A è un intervallo limitato qualsiasi di estremi a e b, allora A◦ = (a, b), ∂A = {a, b} e
A = [a, b], per cui A è aperto se e solo se A = (a, b) ed è chiuso se e solo se A = [a, b]. Se invece A è un
intervallo illimitato, ad esempio superiormente e con estremo sinistro a, allora A◦ = (a, +∞), ∂A = {a}
e A = [a, +∞), per cui A è aperto se e solo se A = (a, +∞) ed è chiuso se e solo se A = [a, +∞).
L’esempio precedente mostra come non si debba pensare che un insieme sia necessariamente o aperto
o chiuso: un intervallo di R del tipo [a, b) non è né aperto né chiuso e, più in generale, un qualsiasi
sottoinsieme di Rn che contenga solo parte della propria frontiera non è né aperto né chiuso. D’altra
parte, si assume per convenzione che l’insieme vuoto sia contemporanemente aperto e chiuso e si può
dimostrare che gli unici sottoinsiemi di Rn con tale caratteristica sono l’insieme vuoto ed Rn stesso.
La prossima definizione descrive un’altra proprietà che un punto di Rn può possedere in relazione ad
un assegnato insieme A.
M.Guida, S.Rolando, 2015
4
Definizione 5 Dati un insieme A ⊆ Rn ed un punto P0 ∈ Rn (non necessariamente in A), si dice che:
• P0 è un punto di accumulazione per A se ogni intorno di P0 contiene almeno un punto di A
che non sia P0 stesso (P0 può stare in A o meno);
• P0 è un punto isolato di A se P0 ∈ A ed esiste un intorno di P0 che non contenga punti di A
diversi da P0 .
L’insieme dei punti di accumulazione per A è indicato con D (A) ed è detto insieme derivato di A.
Alcuni autori scrivono Acc (A) invece di D (A). I punti isolati di A coincidono con i punti di A \ D (A),
cioè con i punti di A che non siano di accumulazione per A. Chiaramente A◦ ⊆ D (A) ⊆ A e si dimostra
facilmente che A = D (A) ∪ {punti isolati di A} e D (A) = A \ {punti isolati di A}.
La prossima definizione descrive altre caratteristiche che un sottoinsieme di Rn può presentare.
Definizione 6 Un insieme A ⊆ Rn è detto
• limitato se è contenuto in un intorno dell’origine, ossia se ∃r > 0 tale che A ⊆ Br (0) (più
esplicitamente: ∃r > 0 tale che ∀x ∈ A risulta x < r);
• compatto se è chiuso e limitato;
• convesso se per ogni coppia di punti P, Q ∈ A il segmento che li unisce è interamente contenuto
in A (in simboli: ∀P, Q ∈ A e ∀t ∈ [0, 1] risulta Q + t (P − Q) ∈ A);
• stellato rispetto ad un suo punto P0 se per ogni punto P ∈ A il segmento che unisce P0 e P
è interamente contenuto in A (in simboli: ∀P ∈ A e ∀t ∈ [0, 1] risulta P0 + t (P − P0 ) ∈ A).
Gli insiemi compatti giocano un ruolo assai rilevante in molte questioni, in special modo per le
proprietà che li legano alle funzioni continue (v. Teorema 12).
Poiché ogni insieme convesso è chiaramente stellato rispetto ad ogni suo punto, la nozione di stellazione è un primo indebolimento di quella di convessità. Nella prossima Definizione 7, vedremo un’altra
nozione molto importante, quella di connessione, che a sua volta indebolisce la nozione di stellazione.
Se n = 1, allora A è convesso o stellato se e solo se A è un intervallo. Inoltre, se A è un intervallo di
R, allora A è compatto se e solo se A = [a, b] per qualche a, b ∈ R.
La seguente definizione individua i sottoinsiemi di Rn che, approssimativamente parlando, sono costituiti da un solo pezzo.
Definizione 7 Un insieme A ⊆ Rn è detto connesso 6 se per ogni coppia di punti P, Q ∈ A esiste un
arco 7 interamente contenuto in A che li unisce (in simboli: ∀P, Q ∈ A, esiste γ : [a, b] → Rn continua e
tale che γ (a) = P , γ (b) = Q e γ (t) ∈ A per ogni t ∈ [a, b]).
Ovviamente gli insiemi stellati (e quindi quelli convessi) sono connessi, ma non è vero il viceversa. Se
n = 1, allora A è connesso se e solo se A è un intervallo.
6 Più precisamente dovremmo dire connesso per archi, perché si può definire una nozione di connessione più generale,
che però non tratteremo.
7 Come avremo modo di ribadire in seguito, l’immagine di una qualsiasi funzione vettoriale continua γ : [a, b] → Rn
definita su un intervallo compatto [a, b] si chiama arco e si dice che esso unisce i punti γ (a) e γ (b).
5
M.Guida, S.Rolando, 2015
La prossima definizione fornisce una delle tante possibili generalizzazioni multidimensionali della
nozione di intervallo reale.
Definizione 8 Si dice che un insieme A ⊆ Rn è una regione se A◦ è connesso non vuoto e A ⊆ A◦ .
In altri termini, A è una regione se e solo se il suo interno A◦ è connesso non vuoto ed A differisce dal
proprio interno A◦ al più per punti della frontiera di A◦ .
Concludiamo questa sezione con l’esercizio di esaminare gli intorni sferici dal punto di vista delle
nozioni topologiche introdotte:
• gli intorni sferici sono aperti, limitati e convessi (e quindi, in particolare, sono stellati, connessi e,
in quanto aperti connessi non vuoti, sono regioni);
• la frontiera di un intorno sferico Br (P0 ) è
∂Br (P0 ) = {P ∈ Rn : P − P0 = r} ;
• la chiusura di un intorno sferico Br (P0 ) è
Br (P0 ) = {P ∈ Rn : P − P0 ≤ r} ,
la quale, in quanto chiusa e limitata, è un insieme compatto;
• un intorno sferico Br (P0 ) privato del suo centro, che viene detto intorno bucato di P0 ed indicato
con
Br∗ (P0 ) := {P ∈ Rn : 0 < P − P0 < r} = Br (P0 ) \ {P0 } ,
è un aperto connesso (ma non più convesso, né stellato) e non vuoto (e quindi, in particolare, è
una regione).
1.3
Richiami sulle funzioni reali di n ≥ 1 variabili reali
Una funzione reale di n ≥ 1 variabili reali è una funzione
f : dom f ⊆ Rn → R
che ad ogni punto P = (x1 , ..., xn ) di un sottoinsieme dom f di Rn associa un numero reale f (P ) =
f (x1 , ..., xn ). Se n ≥ 2, la funzione f è detta anche campo scalare.
Ad ogni campo scalare si associano i seguenti insiemi notevoli, sottoinsiemi rispettivamente di Rn ×R,
R ed Rn .
• Si chiama grafico della funzione f l’insieme
Gf := {(P, f (P )) ∈ Rn × R : P ∈ dom f }
(sottoinsieme di dom f × R).
Se n = 2, allora Gf è il luogo dei punti (x, y, z) dello spazio R2 × R = R3 di equazione z = f (x, y).
Se n ≥ 3, invece, Gf non si visualizza geometricamente.
6
M.Guida, S.Rolando, 2015
Grafico z = f (x, y) della funzione
f (x, y) = 1 + 1 − 4 (x2 + y 2 )
sul suo dominio x2 + y 2 ≤ 1/4
(si tratta di un semiellissoide:
infatti Gf ha equazione z = f (x, y) ,
cioè z = 1 + 1 − 4 (x2 + y 2 ),
2
cioè (z − 1) = 1 − 4 x2 + y 2 , z ≥ 1,
2
cioè 4x2 + 4y 2 + (z − 1) = 1, z ≥ 1).
Osserviamo che dom f è la proiezione
di Gf sul piano xy.
• Si chiama immagine della funzione f l’insieme
im f := {f (P ) ∈ R : P ∈ dom f }
(sottoinsieme di R).
Geometricamente, se n = 2, l’immagine im f è la proiezione del grafico Gf sull’asse z.
• Per ogni c ∈ R, si chiama insieme di livello c della funzione f l’insieme
Lf,c := f −1 (c) = {P ∈ dom f : f (P ) = c}
(sottoinsieme di dom f ),
ossia l’insieme dei punti su cui f è costante e vale c. Ovviamente Lf,c = ∅ se e solo se c ∈ im f .
Geometricamente, se n = 2, l’insieme Lf,c è la proiezione sul piano xy dell’intersezione tra il grafico
z = f (x, y) ed il piano z = c.
Grafico della funzione f (x, y) =
x2 −1
x2 +y 2
e sue linee di livello.
7
M.Guida, S.Rolando, 2015
Se A è una regione di Rn ed f : A ⊆ Rn → R è continua su A (v. Definizione 9), allora l’insieme di
livello f −1 (c) (sottoinsieme di Rn ) è una curva cartesiana se n = 2, una superficie cartesiana se n = 3.
Definizione 9 Sia f : dom f ⊆ Rn → R. Si dice che:
• f è continua in un punto P0 ∈ dom f se ∀ε > 0 esiste δ > 0 tale che
P ∈ Bδ (P0 ) ∩ dom f =⇒ |f (P ) − f (P0 )| < ε ;
• f è continua ovunque (o brevemente continua) se è continua in tutti i punti del proprio dominio;
• f è continua su un insieme A ⊆ dom f se la restrizione f|A è continua ovunque.
Si noti che nessun requisito si è imposto all’insieme A, il quale può essere di natura qualsiasi (ad esempio
può essere un aperto, tanto quanto un insieme con interno vuoto, tipo una linea). L’insieme delle funzioni
reali continue su A si indica con C (A) o C 0 (A) .
Verificare la continuità di un campo scalare tramite la definizione appena data è spesso complicato,
ma i seguenti risultati rendono tale verifica immediata in molti casi:
• ogni funzione di una variabile continua ovunque è anche continua ovunque come funzione di più
variabili; ad esempio, la funzione ϕ (y) = log y è continua su dom ϕ = (0, +∞) e quindi la funzione
f (x, y) = log y è continua su dom f = {(x, y) : y > 0} = R × (0, +∞);
• combinazioni lineari, prodotti, rapporti e composizioni di funzioni continue ovunque sono funzioni
√
continue ovunque; ad esempio, f (x, y) = y − ex è continua su dom f = {(x, y) : y ≥ ex }, in
√
quanto ottenuta componendo le funzioni ovunque continue ϕ (t) = t e g (x, y) = y − ex (continua
su dom g = R2 perché combinazione lineare di funzioni continue).
Dalle proprietà precedenti, segue subito che le funzioni polinomiali (cioè i polinomi nelle variabili
x1 , ..., xn ) sono continue su Rn e le funzioni razionali (cioè i rapporti di polinomi nelle variabili x1 , ..., xn )
sono continue dove sono definite (cioè nei punti di Rn in cui il denominatore non si annulla).
1.3.1
Alcuni teoremi sulle funzioni continue
Sia f : dom f ⊆ Rn → R. Ricordiamo che im f := {f (P ) ∈ R : P ∈ dom f } ⊆ R.
Teorema 10 (della permanenza del segno) Se f è continua in P0 ed f (P0 ) = 0, allora esiste un
intorno Br (P0 ) in cui f ha lo stesso segno di f (P0 ).
Teorema 11 (dei valori intermedi) Se f è continua e dom f è connesso, allora im f è un intervallo.
Teorema 12 (di Weierstrass) Se f è continua e dom f è compatto, allora f ammette minimo e
massimo assoluti (cioè li ammette im f ):
∃P1 , P2 ∈ dom f
tali che f (P1 ) =
min f (P )
P ∈dom f
e f (P2 ) = max f (P ) .
P ∈dom f
In particolare, f è limitata (cioè lo è im f ): ∃a, b ∈ R tali che ∀P ∈ dom f si ha a ≤ f (P ) ≤ b.
8
M.Guida, S.Rolando, 2015
1.4
Richiami sulle funzioni vettoriali di n ≥ 1 variabili reali
Una funzione vettoriale di n ≥ 1 variabili reali è una funzione
f : dom f ⊆ Rn → Rm
con m ≥ 2
che ad ogni elemento P = (x1 , ..., xn ) di dom f ⊆ Rn associa un elemento f (P ) di Rm . Osserviamo che
entrambi gli elementi P ed f (P ) possono essere visti sia come punti che come vettori, ma, per ragioni
legate ai significati che spesso le funzioni vettoriali rivestono nei contesti applicativi in cui vengono
considerate, si preferisce di solito vedere la variabile indipendente P come punto ed il valore f (P ) come
vettore 8 . Se n = m, la funzione f è detta anche campo vettoriale.
Poiché m ≥ 2, il vettore f (P ) è una m-upla di numeri reali con più entrate, le quali dipendono tutte,
in generale, dalla variabile P = (x1 , ..., xn ):
f (P ) = (f1 (P ) , ..., fm (P )) = (f1 (x1 , ..., xn ) , ..., fm (x1 , ..., xn )) ,
∀P = (x1 , ..., xn ) ∈ dom f.
Poiché f1 (P ) , ..., fm (P ) sono numeri reali, le funzioni f1 , ..., fm sono campi scalari, detti funzioni
componenti di f , la quale si rappresenta allora anche scrivendo brevemente f = (f1 , ..., fm ).
Le nozioni di grafico ed insieme di livello non sono altrettanto rilevanti per le funzioni vettoriali
quanto lo sono per quelle scalari, quindi non le richiamiamo. Ricordiamo invece che un campo vettoriale
f è spesso interpretato come la corrispondenza che in ogni punto P ∈ dom f applica un vettore f (P ) e
dunque, in tale ottica, può essere efficacemente rappresentato sovrapponendo gli spazi Rn di partenza
e di arrivo e rappresentando il vettore f (P ) = f1 (P ) e1 + ... + fm (P ) em come applicato nel punto
P = (x1 , ..., xn ) ∈ dom f a cui è associato.
Rappresentazione del campo vettoriale
f (x, y) = (x + y, x),
che in ogni punto P = (x, y) del piano
applica il vettore (x + y) i + xj.
Si noti che la rappresentazione non
rispetta le norme di f (x, y), come spesso
accade quando si è interessati solo a
direzione e verso del campo.
Come al solito, si chiama immagine della funzione f l’insieme im f := {f (P ) ∈ Rm : P ∈ dom f }
(sottoinsieme di Rm ).
La definizione di continuità di f è la stessa data nella Definizione 9, con l’unica differenza che a
destra dell’implicazione appare ora la norma f (P ) − f (P0 ) al posto del valore assoluto, in quanto i
valori di f sono in dimensione almeno 2. In ogni caso, lo studio della continuità di f si riporta a quello
già discusso per i campi scalari, in quanto vale la seguente:
Proposizione 13 Sia f = (f1 , ..., fm ) una funzione vettoriale definita su dom f ⊆ Rn . Allora f è
8 tolto
il caso delle funzioni f : Rn → Rm lineari, per le quali sia P che f (P ) si interpretano più spesso come vettori
9
M.Guida, S.Rolando, 2015
continua in un punto P0 ∈ dom f se e solo se tutte le sue funzioni componenti f1 , ..., fm sono continue
in P0 .
L’insieme delle funzioni vettoriali continue su un insieme A si indica ancora con C (A) o C 0 (A) ,
essendo chiaro dal contesto se si parla di funzioni scalari o vettoriali.
Se A è una regione di Rn ed f : A ⊆ Rn → Rm è continua su A, allora l’immagine di f (sottoinsieme
di Rm ) è una curva parametrica se n = 1 ed m = 2, 3, una superficie parametrica se n = 2 ed m = 3.
1.5
Richiami sul calcolo differenziale per campi scalari
Sia f : dom f ⊆ Rn → R un campo scalare (quindi n ≥ 2) e sia P0 = x01 , ..., x0n è un punto interno a
dom f . Si dice che f è derivabile parzialmente nel punto P0 rispetto alla variabile xi se esiste
la derivata della funzione f x01 , ..., x0i−1 , xi , x0i+1 , ..., x0n della sola variabile xi calcolata in xi = x0i , cioè
d
f x01 , ..., x0i−1 , xi , x0i+1 , ..., x0n
dxi
f x01 , ..., x0i−1 , x0i + h, x0i+1 , ..., x0n − f x01 , ..., x0n
.
h→0
h
= lim
xi =x0i
In tal caso, tale derivata è indicata con
∂f
(P0 )
∂xi
oppure fxi (P0 )
oppure Dxi f (P0 )
ed è detta derivata parziale di f rispetto a xi nel punto P0 .
Se f è derivabile in P0 rispetto a tutte le sue variabili, si chiama gradiente di f in P0 il vettore
∇f (P0 ) :=
∂f
∂f
(P0 ) , ...,
(P0 )
∂x1
∂xn
Esempio 14 Sia
f (x, y) =
∈ Rn .
2
√
xy + exy .
Il campo f è definito se xy ≥ 0, cioè dom f è l’unione del I e III quadrante, assi inclusi. I punti degli
assi sono punti di frontiera per dom f e quindi (dom f ) ◦ = (x, y) ∈ R2 : xy > 0 (unione dei quadranti
I e III, assi esclusi). Le derivate parziali di f hanno senso solo nei punti di tale insieme. Prendendo ad
esempio P0 = (1, 3) ∈ (dom f ) ◦ e considerando le funzioni
f (x, 3) =
√
3x + e9x
e f (1, y) =
2
√
y + ey
ottenute da f (x, y) fissando y = 3 e x = 1, si ottiene
d
∂f
(1, 3) =
f (x, 3)
∂x
dx
e
d
∂f
(1, 3) =
f (1, y)
∂y
dy
cioè ∇f (1, 3) =
√
3
2
x=1
d √
=
3x + e9x
dx
=
y=3
2
d √
y + ey
dy
x=1
3
= √ + 9e9x
2 3x
=
y=3
2
1
√ + 2yey
2 y
x=1
y=3
√
3
=
+ 9e9
2
1
= √ + 6e9 ,
2 3
1
+ 9e9 , 2√
+ 6e9 .
3
Se f è derivabile rispetto a tutte le sue variabili in tutti i punti di un aperto Ω ⊆ dom f , allora le
10
M.Guida, S.Rolando, 2015
sue derivate parziali fx1 , ..., fxn sono a loro volta campi scalari definiti su Ω:
∂f
:
∂xi
Ω ⊆ Rn
→
P
→
R
∂f
(P ) .
∂xi
In tal caso, il gradiente di f esiste in tutti i punti di Ω e definisce un campo vettoriale ∇f = (fx1 , ..., fxn )
con dominio Ω e funzioni componenti date dalle derivate parziali di f :
∇f : Ω ⊆ Rn → Rn
P
→ ∇f (P )
Se
con ∇f (P ) =
∂f
∂f
(P ) , ...,
(P ) .
∂x1
∂xn
∂f
∈ C (Ω) per ogni i, diciamo che f è di classe C 1 su Ω e scriviamo f ∈ C 1 (Ω) .
∂xi
2
√
Esempio 15 Riprendiamo la funzione f (x, y) = xy + exy dell’esempio precedente. Immaginando y
2
√
fissata, la funzione x → xy + exy della sola variabile x (y va vista come una costante) è derivabile in
tutti i punti x tali che xy > 0, nei quali la sua derivata è data da
2
d √
xy + exy
dx
Tale derivata è per definizione
∂f
∂x
x
2
y
= √ + y 2 exy .
2 xy
(x, y) e quindi risulta
2
∂f
y
(x, y) = √ + y 2 exy
∂x
2 xy
per ogni (x, y) ∈ (dom f ) ◦ .
◦
Dunque ∂f
∂x è un campo scalare definito sull’aperto Ω = (dom f ) . Analogamente, immaginando x come
costante, si ottiene
2
d √
∂f
xy + exy
(x, y) =
∂y
dy
y
2
x
= √ + 2xyexy
2 xy
per ogni (x, y) ∈ Ω
e quindi
∇f (x, y) =
1.5.1
2
2
y
x
√ + y 2 exy , √ + 2xyexy
2 xy
2 xy
2
1
= √ (y, x) + yexy (y, 2x)
2 xy
per ogni (x, y) ∈ Ω.
Derivate direzionali
Sia f : dom f ⊆ Rn → R un campo scalare e siano P0 un punto interno a dom f ed u ∈ Rn un versore.
Consideriamo parametricamente la retta (di Rn ) passante per P0 e parallela ad u: P (t) = P0 + tu.
Consideriamo la funzione di t ottenuta calcolando f sui punti della retta: ϕ (t) = f (P (t)) = f (P0 + tu) .
Si chiama derivata direzionale di f secondo il versore u nel punto P0 la derivata
ϕ (0) =
d
f (P0 + tu)
dt
= lim
t=0
t→0
f (P0 + tu) − f (P0 )
.
t
11
M.Guida, S.Rolando, 2015
Tale derivata, se esiste, si indica con
1.5.2
∂f
∂f
∂f
=
.
(P0 ). Se (e1 , ..., en ) è la base canonica di Rn , risulta
∂u
∂ei
∂xi
Differenziabilità e formula di Taylor di ordine 1
Sia f : dom f ⊆ Rn → R un campo scalare e sia P0 ∈ (dom f ) ◦ . Si dice che f è differenziabile in P0 se:
(i) esiste ∇f (P0 ) (cioè esistono tutte le n derivate parziali di f in P0 );
(ii) si ha
f (P ) − f (P0 ) − ∇f (P0 ) · (P − P0 )
= 0,
lim
P →P0
P − P0
cioè
f (P ) = f (P0 ) + ∇f (P0 ) · (P − P0 ) + o ( P − P0 )P →P0 .
Tale formula è detta formula di Taylor di ordine 1 di f in P0 (MacLaurin se P0 = (0, ..., 0)).
Il polinomio T1 (P ) = f (P0 ) + ∇f (P0 ) · (P − P0 ) (nelle variabili x1 , ..., xn , coordinate di P ) è detto
polinomio di Taylor di ordine 1 di f in P0 (MacLaurin se P0 = (0, ..., 0)).
Valgono i seguenti risultati:
Teorema 16 (condizione sufficiente di differenziabilità) Se f è di classe C 1 in un aperto Ω ⊆
dom f , allora f è differenziabile in tutti i punti di Ω.
Teorema 17 Se f è differenziabile in P0 , allora f è continua in P0 .
Teorema 18 (differenziabilità e derivate direzionali) Se f è differenziabile in P0 , allora f è deriv∂f
abile in P0 secondo tutte le direzioni e per ogni versore u ∈ Rn risulta
(P0 ) = ∇f (P0 ) · u.
∂u
∂f
∇f (P0 )
∂f
Inoltre
(P0 ) = max
(P0 ) ⇔ v =
.
∂v
∇f (P0 )
u =1 ∂u
1.5.3
Derivate successive e formula di Taylor di ordine 2
Se f : dom f ⊆ Rn → R ammette derivata parziale rispetto a xi in tutti i punti di un aperto Ω ⊆ dom f ,
∂f
in un punto P0 ∈ Ω, se esiste, è indicata
allora la derivata parziale rispetto a xj del campo scalare ∂x
i
con
∂2f
∂ ∂f
fxi xj (P0 ) :=
(P0 ) :=
(P0 )
∂xj ∂xi
∂xj ∂xi
e viene detta derivata parziale seconda di f in P0 . Se i = j si parla di derivata seconda mista,
∂2f
mentre se i = j la derivata si dice pura e si indica più spesso con
(P0 ).
∂x2j
Le derivate parziali seconde sono in tutto n2 ed è spesso utile disporle in una matrice n × n, detta
matrice hessiana di f in P0 :






Hf (P0 ) := 






∂2f
∂2f
(P0 ) · · ·
(P0 ) 
∂x2 ∂x1
∂xn ∂x1


2
2

∂ f
∂ f
∂2f
(P0 )
(P0 ) · · ·
(P0 ) 
2
 = fxi xj (P0 )
∂x1 ∂x2
∂x2
∂xn ∂x2


..
..
..
..

.
.
.
.

2
2
2

∂ f
∂ f
∂ f
(P0 )
(P0 ) · · ·
(P
)
0
∂x1 ∂xn
∂x2 ∂xn
∂x2n
∂2f
(P0 )
∂x21
i,j=1,...,n
.
12
M.Guida, S.Rolando, 2015
Se le derivate parziali seconde esistono in tutti i punti di Ω, esse sono nuovamente campi scalari definiti
su Ω e, se derivabili ulteriormente, forniscono le n3 derivate parziali terze di f . E così via, fino a
definire le eventuali nk derivate parziali di ordine k di f .
Il seguente teorema (che qui diamo in una versione con ipotesi semplificate) vale nei casi di più comune
interesse e riduce il numero delle derivate successive che risultano diverse tra loro. Inoltre ha come
conseguenza immediata che (nelle ipotesi del teorema) la matrice hessiana è una matrice simmetrica.
Teorema 19 (di Schwarz, sull’indipendenza delle derivate miste dall’ordine di derivazione)
∂2f
esiste ed è continua su Ω. Allora
Sia Ω ⊆ Rn un aperto e sia f ∈ C 1 (Ω). Siano i = j tali che
∂xi ∂xj
∀P ∈ Ω :
∃
∂2f
∂2f
(P ) =
(P ) .
∂xj ∂xi
∂xi ∂xj
Definizione 20 (classi C k ) Sia f : dom f ⊆ Rn → R un campo scalare e sia Ω ⊆ dom f un aperto.
• Si dice che f è di classe C k su Ω (k ≥ 1 intero) se tutte le nk derivate parziali di ordine k di f
esistono e sono continue su Ω.
• Si dice che f è di classe C ∞ su Ω se f è di classe C k su Ω per ogni k ≥ 1.
L’insieme dei campi scalari di classe C k su un aperto Ω si indica con C k (Ω) (con 1 ≤ k ≤ ∞). Ogni
C k (Ω) è sottospazio vettoriale di RΩ (= insieme delle funzioni definite (almeno) su Ω a valori in R) e si
può dimostrare che
f ∈ C 1 (Ω) =⇒ f ∈ C 0 (Ω)
e
f ∈ C k+1 (Ω) =⇒ f ∈ C k (Ω) ,
per cui valgono le inclusioni C 0 (Ω) ⊃ C 1 (Ω) ⊃ C 2 (Ω) ⊃ ... ⊃ C ∞ (Ω) .
Facciamo notare che spesso risulta comodo disporre di un simbolo che esprima il fatto che le derivate
di un campo esistono in tutti i punti di un insieme qualsiasi, non necessariamente aperto. Siccome però
le derivate parziali hanno senso solo in punti interni al dominio, ciò significherà che il campo è in effetti
derivabile su un aperto che contiene tale insieme. In tal senso, si introduce la seguente notazione: se A
è un insieme qualsiasi, C k (A) (con 1 ≤ k ≤ ∞) denota l’insieme dei campi scalari che sono di classe
C k su un qualche aperto contenente A.
Teorema 21 Sia f : dom f ⊆ Rn → R un campo scalare di classe C 2 in un intorno di un punto P0 .
Allora vale la seguente formula
f (P ) = f (P0 ) + ∇f (P0 ) · (P − P0 ) +
1
T
(P − P0 ) Hf (P0 ) (P − P0 ) + o
2
P − P0
2
P →P0
T
(dove il vettore P − P0 è inteso scritto in riga e (P − P0 ) Hf (P0 ) (P − P0 ) è un prodotto tra matrici),
detta formula di Taylor di ordine 2 di f in P0 (MacLaurin se P0 = (0, ..., 0)).
1.5.4
Ottimizzazione
Sia f : dom f ⊆ Rn → R un campo scalare e sia P0 ∈ dom f .
Definizione 22 Diciamo che P0 è un punto di massimo (minimo) relativo per f se esiste Br (P0 )
tale che ∀P ∈ Br (P0 ) ∩ dom f risulta f (P ) ≤ f (P0 ) (rispettivamente f (P ) ≥ f (P0 )). In particolare, si
parla di massimo (minimo) stretto se f (P ) < f (P0 ) (rispettivamente f (P ) > f (P0 )) per P = P0 .
13
M.Guida, S.Rolando, 2015
Definizione 23 Diciamo che P0 è un punto critico o stazionario per f se ∇f (P0 ) = 0 (quindi P0 è
interno a dom f ).
Teorema 24 (di Fermat) Se P0 è un punto di massimo o minimo relativo per f e ∇f (P0 ) esiste
(quindi P0 è interno a dom f ), allora P0 è punto critico per f (cioè ∇f (P0 ) = 0).
Teorema 25 (della matrice hessiana) Supponiamo che P0 sia punto critico per f e che f sia di classe
C 2 in un intorno di P0 (ciò garantisce che Hf (P0 ) ∈ Rn,n è simmetrica, per il teorema di Schwarz).
Allora risulta che:
• se Hf (P0 ) ha autovalori tutti > 0 (definita positiva), allora P0 è punto di minimo stretto per f ;
• se Hf (P0 ) ha autovalori tutti < 0 (definita negativa), allora P0 è punto di massimo stretto per f ;
• se Hf (P0 ) ha due autovalori discordi (non definita), allora P0 non è punto di massimo nè di minimo
e viene detto punto di sella per f .
Attenzione! Se Hf (P0 ) ha l’autovalore 0 e gli altri suoi autovalori sono concordi, allora il teorema non
permette di concludere nulla (nel senso che il punto critico P0 potrebbe essere punto di massimo, di
minimo o di nessuno dei due tipi).
1.6
Richiami sul calcolo differenziale per funzioni vettoriali
Circa le funzioni vettoriali f = (f1 , ..., fm ) : dom f ⊆ Rn → Rm (con n ≥ 1 ed m ≥ 2), ricordiamo che la
derivazione si può definire componente per componente: f è derivabile in un punto P0 interno a dom f
(in senso ordinario se n = 1, parzialmente rispetto ad una qualche variabile se n ≥ 2) se tutte le funzioni
componenti f1 , ..., fm sono derivabili in P0 (nello stesso senso); in tal caso, si ha
Df (P0 ) = (Df1 (P0 ) , ..., Dfm (P0 ))
(1.1)
(quale che sia la derivata D, parziale o ordinaria, che si sta considerando). In estrema sintesi: la derivata
di un vettore è il vettore delle derivate.
Se n ≥ 2, allora P0 = x01 , ..., x0n ∈ Rn e la (1.1) significa
fxj (P0 ) =
∂f
(P0 ) =
∂xj
∂f1
∂fm
(P0 ) , ...,
(P0 ) ,
∂xj
∂xj
ossia fxj (P0 ) è il vettore delle derivate parziali rispetto a xj delle funzioni componenti di f in P0 . Se
tali derivate esistono rispetto a tutte le variabili di f , allora risulta definita la matrice (di tipo m × n)

 ∂f
∂f1
1
(P0 ) · · ·
(P0 )

 ∂x1
∂xn


.
.
.
=

.
.
.
Jf (P0 ) := 
.
.
.


 ∂f
∂fm
m
(P0 ) · · ·
(P0 )
∂x1
∂xn

∇f1 (P0 )


..


.

∇fm (P0 )
( m a t r i c e d e l l e r i g h e d i Jf (P0 ))
detta matrice jacobiana di f in P0 .
Se n = 1, allora P0 = t0 ∈ R e la (1.1) significa
f (t0 ) = (f1 (t0 ) , ..., fm (t0 )) ,
=
fx1 (P0 ) · · · fxn (P0 ) ,
( m a t r i c e d e l l e c o l o n n e d i Jf (P0 ))
14
M.Guida, S.Rolando, 2015
per cui f (t0 ) è ancora il vettore delle derivate (non più parziali) delle funzioni componenti di f in t0 .
Tale vettore può ovviamente essere scritto come vettore colonna ed in tal caso è denotato ancora con

f1 (t0 )


..
Jf (t0 ) := 
.
.

fm (t0 )
Osserviamo che, in questo caso unidimensionale, può essere dato un senso anche alle derivate unilaterali
f± (t0 ) := (f1 )± (t0 ) , ..., (fm )± (t0 ) .
Le definizioni delle classi C k si estendono in modo ovvio anche al caso delle funzioni vettoriali (e
si mantengono gli stessi simboli, essendo chiaro dal contesto se si parla di funzioni scalari o vettoriali):
per 1 ≤ k ≤ ∞, si indica con C k (A) l’insieme delle funzioni vettoriali le cui funzioni componenti sono
tutte di classe C k su un qualche aperto contenente l’insieme A ⊆ Rn (A stesso, qualora fosse aperto).
Facciamo presente che, nel caso unidimensionale n = 1, tale definizione di C k ([a, b]) coincide con
quella (più naturale) che richiede che tutte le funzioni componenti abbiano derivate k-esime continue su
[a, b], intendendo tali derivate in senso completo in (a, b) ed unilaterale in a e in b.
1.7
Regola della catena
Estendiamo innanzitutto la definizione di Jf anche ai campi scalari (n > m = 1) ed alle funzioni reali di
una variabile reale (n = m = 1):
• se f : dom f ⊆ Rn → R è un campo scalare, allora si pone
Jf (P ) := ∇f (P ) = fx1 (P ) · · · fxn (P )
dove P = (x1 , ..., xn ) ∈ Rn ;
• se f : dom f ⊆ R → R è una funzione reale di variabile reale, allora si pone
Jf (t) := f (t)
dove t ∈ R
(tutto, ovviamente, se le derivate scritte esistono).
Siano ora
g : dom g ⊆ Rk → Rn e f : dom f ⊆ Rn → Rm
(1.2)
due funzioni tali che la funzione composta f ◦ g abbia senso in punto P0 ∈ dom g. Circa la derivazione
di f ◦ g vale il seguente risultato, noto come regola della catena (che qui diamo in una versione con
ipotesi semplificate).
Teorema 26 Se g è di classe C 1 in un intorno di P0 ed f è di classe C 1 in un intorno di g (P0 ), allora
f ◦ g è di classe C 1 in un intorno Br (P0 ) di P0 e risulta
Jf ◦g (P ) = Jf (g (P )) Jg (P ) ,
∀P ∈ Br (P0 )
(dove il prodotto a secondo membro è ovviamente il prodotto tra matrici).
(1.3)
15
M.Guida, S.Rolando, 2015
Notiamo esplicitamente che nella (1.2) lo spazio di arrivo di g e quello di partenza di f hanno la stessa
dimensione, ma le dimensioni k, n, m possono essere qualsiasi, di modo che f e g possono essere funzioni
scalari o vettoriali, di una o più variabili reali.
Vediamo esplicitamente alcuni casi particolari della (1.3), supponendo che le ipotesi del teorema
precedente siano in ciascun caso verificate. Indichiamo con u · v il prodotto scalare standard di Rn :
(u1 , ..., un ) · (v1 , ..., vn ) = u1 v1 + ... + un vn .
g : dom g ⊆ R → Rn
f : dom f ⊆ Rn → R
Si ha g (t) = (g1 (t) , ..., gn (t)) ∈ Rn con t ∈ R ed f (x1 , ..., xn ) ∈ R.
La derivata di f (g (t)) = f (g1 (t) , ..., gn (t)) in un generico t è data da
d
f (g1 (t) , ..., gn (t)) = ∇f (g (t)) · g (t) .
dt
(1.4)
Infatti la regola della catena (1.3) fornisce

g1 (t)


(f ◦ g) (t) = Jf ◦g (t) = Jf (g (t)) Jg (t) = fx1 (g (t)) · · · fxn (g (t))  ... 

gn (t)
= fx1 (g (t)) g1 (t) + ... + fxn (g (t)) gn (t)
= ∇f (g (t)) · g (t) .
g : dom g ⊆ R2 → Rn
f : dom f ⊆ Rn → R
Si ha g (x, y) = (g1 (x, y) , ..., gn (x, y)) ∈ Rn ed f (x1 , ..., xn ) ∈ R.
Le derivate parziali di f (g (x, y)) = f (g1 (x, y) , ..., gn (x, y)) in un generico (x, y) sono date da
n ∂f
∂gi
∂g
∂
(g (x, y))
f (g1 (x, y) , ..., gn (x, y)) =
(x, y) = ∇f (g (x, y)) ·
(x, y) ,
∂x
∂x
∂x
i=1 ∂xi
n ∂f
∂gi
∂g
∂
(g (x, y))
f (g1 (x, y) , ..., gn (x, y)) =
(x, y) = ∇f (g (x, y)) ·
(x, y) .
∂y
∂x
∂y
∂y
i
i=1
Infatti la regola della catena (1.3) fornisce
∇ (f ◦ g) (x, y) = Jf ◦g (x, y) = Jf (g (x, y)) Jg (x, y)
 ∂g

∂g1
1
(x, y)
(x, y)
 ∂x

∂y
.

.


..
= fx1 (g (x, y)) · · · fxn (g (x, y))  ..

 ∂g

∂gn
n
(x, y)
(x, y)
∂x
∂y
n ∂f
n ∂f
∂gi
∂gi
(g (x, y))
(g (x, y))
(x, y) ,
(x, y) .
=
∂x
∂x
∂x
∂y
i
i
i=1
i=1
16
M.Guida, S.Rolando, 2015
g : dom g ⊆ R → R2
f : dom f ⊆ R2 → R3
Si ha g (t) = (g1 (t) , g2 (t)) con t ∈ R ed f (x, y) = (f1 (x, y) , f2 (x, y) , f3 (x, y)).
Il vettore derivata di f (g (t)) =
generico t è dato da
f1 g1 (t) , g2 (t) , f2 g1 (t) , g2 (t) , f3 g1 (t) , g2 (t)
in un
d
f (g (t)) = ∇f1 (g (t)) · g (t) , ∇f2 (g (t)) · g (t) , ∇f3 (g (t)) · g (t) .
dt
Infatti la regola della catena (1.3) fornisce

∂f1
∂f1
(g (t))
(g (t))

 ∂x
∂y



 ∂f2
∂f
2

(g (t))
(g (t)) 
(f ◦ g) (t) = Jf ◦g (t) = Jf (g (t)) Jg (t) = 

∂y

 ∂x

 ∂f3
∂f3
(g (t))
(g (t))
∂x
∂y


∂f1
∂f1
(g (t)) g1 (t) +
(g (t)) g2 (t)
 
 ∂x
∂y


∇f1 (g (t)) · g

 ∂f2
∂f2


(t)
+
(t)
(g
(t))
g
(g
(t))
g
=
=
∇f2 (g (t)) · g
1
2

 ∂x
∂y


∇f3 (g (t)) · g

 ∂f3
∂f3
(g (t)) g1 (t) +
(g (t)) g2 (t)
∂x
∂y

g1 (t)
g2 (t)

(t)
(t)  .
(t)
D’altra parte, osserviamo che risulta
d
f (g (t)) =
dt
d
d
d
f1 (g1 (t) , g2 (t)) ,
f2 (g1 (t) , g2 (t)) ,
f3 (g1 (t) , g2 (t))
dt
dt
dt
per definizione (1.1) di derivata di un vettore e quindi si sarebbe potuti arrivare più semplicemente
allo stesso risultato applicando la (1.4) alle tre funzioni scalari fi (g1 (t) , g2 (t)).