Caso generale delle funzioni da IR n in IR m
Transcript
Caso generale delle funzioni da IR n in IR m
Richiami sulle funzioni da Rn in Rm Salvo diversa indicazione, supporremo sempre n, m ≥ 1 (interi). 1.1 Brevi richiami sullo spazio Rn L’insieme Rn è il prodotto cartesiano di n fattori uguali ad R, ossia l’insieme delle n-uple ordinate di numeri reali: Rn := R × ... × R = {(x1 , ..., xn ) : xi ∈ R per ogni i = 1, ..., n} . I numeri reali x1 , ..., xn sono detti termini o entrate della n-upla (x1 , ..., xn ), la quale viene spesso indicata anche con le scritture1 x1 oppure ... . x1 · · · xn xn Se n = 2, 3, si usa spesso non indicizzare i termini e denotare invece gli elementi di R2 ed R3 con (x, y) e (x, y, z). Se n = 1, si ha ovviamente R1 = R. Due elementi di Rn sono uguali se sono uguali tutti i loro termini : (x1 , ..., xn ) = (y1 , ..., yn ) ⇐⇒ x1 = y1 , ..., xn = yn . 1.1.1 Struttura vettoriale L’insieme Rn è uno spazio vettoriale reale rispetto alle seguenti operazioni termine a termine: (x1 , ..., xn ) + (y1 , ..., yn ) = (x1 + y1 , ..., xn + yn ) e λ (x1 , ..., xn ) = (λx1 , ..., λxn ) . Il vettore nullo di Rn è 0Rn = (0, ..., 0) ed una sua base (detta base canonica) è data da e1 = (1, 0, 0, ..., 0) , e2 = (0, 1, 0, ..., 0) , ..., en = (0, ..., 0, 0, 1) , per cui risulta dim Rn = n. Inoltre si ha che (x1 , ..., xn ) = x1 e1 + ... + xn en per ogni (x1 , ..., xn ) ∈ Rn . 1 anche se, a rigori, la prima scrittura rappresenta un elemento dell’insieme R1,n delle matrici ad 1 riga ed n colonne, mentre la seconda rappresenta un elemento dell’insieme Rn,1 delle matrici ad n righe ed 1 colonna 1 2 M.Guida, S.Rolando, 2015 1.1.2 Ulteriori notazioni Alcune identificazioni notevoli di Rn con altri insiemi forniscono altre notazioni, di uso molto frequente. • Interpretandone le entrate come componenti, gli elementi di Rn si identificano con i vettori x di un qualsiasi spazio vettoriale di dimensione n in cui si sia fissata una base (e1 , ..., en ); in quest’ottica, si scrive x = (x1 , ..., xn ) intendendo x = x1 e1 + ... + xn en e la base (e1 , ..., en ) risulta allora identificata con la base canonica di Rn . Se i vettori considerati sono i vettori freccia dello spazio ordinario di dimensione 2 o 3, si usa spesso non indicizzare i vettori della base fissata e denotarli invece con i, j o i, j, k. Si avrà allora (x, y) = xi + yj e (x, y, z) = xi + yj + zk. • Interpretandone le entrate come coordinate, gli elementi di Rn si identificano con i punti P dello spazio “geometrico” ordinario n-dimensionale (tecnicamente si dovrebbe parlare di spazio affine) in cui si sia fissato un riferimento (O; e1 , ..., en ); in quest’ottica, si scrive P = (x1 , ..., xn ) intendendo P − O = x1 e1 + ... + xn en e l’origine O risulta allora identificata con il vettore nullo di Rn . Esempio 1 Identificando vettori e punti del piano cartesiano2 con le coppie di R2 , la retta P = P0 + tu si scrive x = x0 + tu1 cioè , (x, y) = (x0 , y0 ) + t (u1 , u2 ) , y = y0 + tu2 se P = (x, y), P0 = (x0 , y0 ) e u = (u1 , u2 ). Nel seguito utilizzeremo indifferentemente le varie notazioni, passando dall’una all’altra senza ulteriori specificazioni. 1.2 Elementi di topologia3 in Rn Ricordiamo che si chiama distanza4 tra due punti P, Q ∈ Rn la norma (o modulo) del loro vettore differenza, cioè d (P, Q) = P − Q = 2 (x1 − y1 ) + ... + (xn − yn ) 2 dove P = (x1 , ..., xn ) e Q = (y1 , ..., yn ). Definizione 2 Chiamiamo intorno 5 di un punto P0 ∈ Rn un qualsiasi insieme del tipo Br (P0 ) := {P ∈ Rn : P − P0 < r} 2 Ricordiamo con r > 0 che per piano (o spazio) cartesiano si intende il piano (o spazio) ordinario in cui si è fissato un riferimento. molto intuitivamente, per topologia (letteralmente studio dei luoghi ) si intende lo studio delle proprietà comuni a tutti gli insiemi di punti che possono essere deformati l’uno nell’altro senza tagli o incollature. 4 Più precisamente dovremmo dire distanza euclidea, perché si possono definire distanze di altro tipo. 5 Più precisamente dovremmo dire intorno sferico aperto, perché si possono definire nozioni più generali di intorno (ad esempio cambiando nozione di distanza, ma non solo). 3 Detto 3 M.Guida, S.Rolando, 2015 (in altri termini, Br (P0 ) è l’insieme dei punti P ∈ Rn che distano da P0 meno di r). P0 ed r sono rispettivamente detti centro e raggio dell’intorno Br (P0 ). Se n = 1, si ottiene Br (x0 ) = (x0 − r, x0 + r). Se n = 2 o n = 3, allora Br (P0 ) è, rispettivamente, il cerchio (senza circonferenza) o la palla (senza sfera) di raggio r e centro P0 . La seguente definizione classifica i punti di Rn in relazione ad un assegnato insieme A, descrivendo tre possibilità che si escludono a vicenda. Definizione 3 Dati un insieme A ⊆ Rn ed un punto P0 ∈ Rn (non necessariamente in A), si dice che: • P0 è di frontiera per A se ogni intorno di P0 contiene almeno un punto di A e uno di Rn \ A (in tal caso, P0 può stare in A o meno); • P0 è interno ad A se esiste un intorno di P0 interamente contenuto in A (in tal caso, P0 deve necessariamente stare in A); • P0 è esterno ad A se esiste un intorno di P0 interamente contenuto in Rn \ A (in tal caso, P0 non può stare in A). L’insieme dei punti di frontiera per A è indicato con ∂A ed è detto frontiera di A. L’insieme dei punti interni ad A è indicato con A◦ ed è detto interno di A. Si chiama chiusura di A l’insieme A := A∪∂A. ◦ Molti autori scrivono A invece di A◦ . Si dimostra che A◦ = A \ ∂A, ∂A = A \ A◦ e A = A◦ ∪ ∂A. L’insieme Rn \ A coincide con l’insieme dei punti esterni ad A ed è spesso chiamato esterno di A. Tramite la definizione precedente, la definizione seguente descrive due tipi di insiemi in base alla natura dei loro punti. Definizione 4 Un insieme A ⊆ Rn è detto: • aperto se coincide col proprio interno (A = A◦ ), cioè se non contiene alcun punto della propria frontiera (A ∩ ∂A = ∅); • chiuso se coincide con la propria chiusura (A = A), cioè se contiene interamente la propria frontiera (∂A ⊆ A). È facile verificare che A è aperto (risp. chiuso) se e solo se il suo complementare Rn \ A è chiuso (risp. aperto). L’interno e l’esterno di A sono sempre aperti, mentre la sua chiusura e la sua frontiera sono sempre chiusi. Se n = 1 ed A è un intervallo limitato qualsiasi di estremi a e b, allora A◦ = (a, b), ∂A = {a, b} e A = [a, b], per cui A è aperto se e solo se A = (a, b) ed è chiuso se e solo se A = [a, b]. Se invece A è un intervallo illimitato, ad esempio superiormente e con estremo sinistro a, allora A◦ = (a, +∞), ∂A = {a} e A = [a, +∞), per cui A è aperto se e solo se A = (a, +∞) ed è chiuso se e solo se A = [a, +∞). L’esempio precedente mostra come non si debba pensare che un insieme sia necessariamente o aperto o chiuso: un intervallo di R del tipo [a, b) non è né aperto né chiuso e, più in generale, un qualsiasi sottoinsieme di Rn che contenga solo parte della propria frontiera non è né aperto né chiuso. D’altra parte, si assume per convenzione che l’insieme vuoto sia contemporanemente aperto e chiuso e si può dimostrare che gli unici sottoinsiemi di Rn con tale caratteristica sono l’insieme vuoto ed Rn stesso. La prossima definizione descrive un’altra proprietà che un punto di Rn può possedere in relazione ad un assegnato insieme A. M.Guida, S.Rolando, 2015 4 Definizione 5 Dati un insieme A ⊆ Rn ed un punto P0 ∈ Rn (non necessariamente in A), si dice che: • P0 è un punto di accumulazione per A se ogni intorno di P0 contiene almeno un punto di A che non sia P0 stesso (P0 può stare in A o meno); • P0 è un punto isolato di A se P0 ∈ A ed esiste un intorno di P0 che non contenga punti di A diversi da P0 . L’insieme dei punti di accumulazione per A è indicato con D (A) ed è detto insieme derivato di A. Alcuni autori scrivono Acc (A) invece di D (A). I punti isolati di A coincidono con i punti di A \ D (A), cioè con i punti di A che non siano di accumulazione per A. Chiaramente A◦ ⊆ D (A) ⊆ A e si dimostra facilmente che A = D (A) ∪ {punti isolati di A} e D (A) = A \ {punti isolati di A}. La prossima definizione descrive altre caratteristiche che un sottoinsieme di Rn può presentare. Definizione 6 Un insieme A ⊆ Rn è detto • limitato se è contenuto in un intorno dell’origine, ossia se ∃r > 0 tale che A ⊆ Br (0) (più esplicitamente: ∃r > 0 tale che ∀x ∈ A risulta x < r); • compatto se è chiuso e limitato; • convesso se per ogni coppia di punti P, Q ∈ A il segmento che li unisce è interamente contenuto in A (in simboli: ∀P, Q ∈ A e ∀t ∈ [0, 1] risulta Q + t (P − Q) ∈ A); • stellato rispetto ad un suo punto P0 se per ogni punto P ∈ A il segmento che unisce P0 e P è interamente contenuto in A (in simboli: ∀P ∈ A e ∀t ∈ [0, 1] risulta P0 + t (P − P0 ) ∈ A). Gli insiemi compatti giocano un ruolo assai rilevante in molte questioni, in special modo per le proprietà che li legano alle funzioni continue (v. Teorema 12). Poiché ogni insieme convesso è chiaramente stellato rispetto ad ogni suo punto, la nozione di stellazione è un primo indebolimento di quella di convessità. Nella prossima Definizione 7, vedremo un’altra nozione molto importante, quella di connessione, che a sua volta indebolisce la nozione di stellazione. Se n = 1, allora A è convesso o stellato se e solo se A è un intervallo. Inoltre, se A è un intervallo di R, allora A è compatto se e solo se A = [a, b] per qualche a, b ∈ R. La seguente definizione individua i sottoinsiemi di Rn che, approssimativamente parlando, sono costituiti da un solo pezzo. Definizione 7 Un insieme A ⊆ Rn è detto connesso 6 se per ogni coppia di punti P, Q ∈ A esiste un arco 7 interamente contenuto in A che li unisce (in simboli: ∀P, Q ∈ A, esiste γ : [a, b] → Rn continua e tale che γ (a) = P , γ (b) = Q e γ (t) ∈ A per ogni t ∈ [a, b]). Ovviamente gli insiemi stellati (e quindi quelli convessi) sono connessi, ma non è vero il viceversa. Se n = 1, allora A è connesso se e solo se A è un intervallo. 6 Più precisamente dovremmo dire connesso per archi, perché si può definire una nozione di connessione più generale, che però non tratteremo. 7 Come avremo modo di ribadire in seguito, l’immagine di una qualsiasi funzione vettoriale continua γ : [a, b] → Rn definita su un intervallo compatto [a, b] si chiama arco e si dice che esso unisce i punti γ (a) e γ (b). 5 M.Guida, S.Rolando, 2015 La prossima definizione fornisce una delle tante possibili generalizzazioni multidimensionali della nozione di intervallo reale. Definizione 8 Si dice che un insieme A ⊆ Rn è una regione se A◦ è connesso non vuoto e A ⊆ A◦ . In altri termini, A è una regione se e solo se il suo interno A◦ è connesso non vuoto ed A differisce dal proprio interno A◦ al più per punti della frontiera di A◦ . Concludiamo questa sezione con l’esercizio di esaminare gli intorni sferici dal punto di vista delle nozioni topologiche introdotte: • gli intorni sferici sono aperti, limitati e convessi (e quindi, in particolare, sono stellati, connessi e, in quanto aperti connessi non vuoti, sono regioni); • la frontiera di un intorno sferico Br (P0 ) è ∂Br (P0 ) = {P ∈ Rn : P − P0 = r} ; • la chiusura di un intorno sferico Br (P0 ) è Br (P0 ) = {P ∈ Rn : P − P0 ≤ r} , la quale, in quanto chiusa e limitata, è un insieme compatto; • un intorno sferico Br (P0 ) privato del suo centro, che viene detto intorno bucato di P0 ed indicato con Br∗ (P0 ) := {P ∈ Rn : 0 < P − P0 < r} = Br (P0 ) \ {P0 } , è un aperto connesso (ma non più convesso, né stellato) e non vuoto (e quindi, in particolare, è una regione). 1.3 Richiami sulle funzioni reali di n ≥ 1 variabili reali Una funzione reale di n ≥ 1 variabili reali è una funzione f : dom f ⊆ Rn → R che ad ogni punto P = (x1 , ..., xn ) di un sottoinsieme dom f di Rn associa un numero reale f (P ) = f (x1 , ..., xn ). Se n ≥ 2, la funzione f è detta anche campo scalare. Ad ogni campo scalare si associano i seguenti insiemi notevoli, sottoinsiemi rispettivamente di Rn ×R, R ed Rn . • Si chiama grafico della funzione f l’insieme Gf := {(P, f (P )) ∈ Rn × R : P ∈ dom f } (sottoinsieme di dom f × R). Se n = 2, allora Gf è il luogo dei punti (x, y, z) dello spazio R2 × R = R3 di equazione z = f (x, y). Se n ≥ 3, invece, Gf non si visualizza geometricamente. 6 M.Guida, S.Rolando, 2015 Grafico z = f (x, y) della funzione f (x, y) = 1 + 1 − 4 (x2 + y 2 ) sul suo dominio x2 + y 2 ≤ 1/4 (si tratta di un semiellissoide: infatti Gf ha equazione z = f (x, y) , cioè z = 1 + 1 − 4 (x2 + y 2 ), 2 cioè (z − 1) = 1 − 4 x2 + y 2 , z ≥ 1, 2 cioè 4x2 + 4y 2 + (z − 1) = 1, z ≥ 1). Osserviamo che dom f è la proiezione di Gf sul piano xy. • Si chiama immagine della funzione f l’insieme im f := {f (P ) ∈ R : P ∈ dom f } (sottoinsieme di R). Geometricamente, se n = 2, l’immagine im f è la proiezione del grafico Gf sull’asse z. • Per ogni c ∈ R, si chiama insieme di livello c della funzione f l’insieme Lf,c := f −1 (c) = {P ∈ dom f : f (P ) = c} (sottoinsieme di dom f ), ossia l’insieme dei punti su cui f è costante e vale c. Ovviamente Lf,c = ∅ se e solo se c ∈ im f . Geometricamente, se n = 2, l’insieme Lf,c è la proiezione sul piano xy dell’intersezione tra il grafico z = f (x, y) ed il piano z = c. Grafico della funzione f (x, y) = x2 −1 x2 +y 2 e sue linee di livello. 7 M.Guida, S.Rolando, 2015 Se A è una regione di Rn ed f : A ⊆ Rn → R è continua su A (v. Definizione 9), allora l’insieme di livello f −1 (c) (sottoinsieme di Rn ) è una curva cartesiana se n = 2, una superficie cartesiana se n = 3. Definizione 9 Sia f : dom f ⊆ Rn → R. Si dice che: • f è continua in un punto P0 ∈ dom f se ∀ε > 0 esiste δ > 0 tale che P ∈ Bδ (P0 ) ∩ dom f =⇒ |f (P ) − f (P0 )| < ε ; • f è continua ovunque (o brevemente continua) se è continua in tutti i punti del proprio dominio; • f è continua su un insieme A ⊆ dom f se la restrizione f|A è continua ovunque. Si noti che nessun requisito si è imposto all’insieme A, il quale può essere di natura qualsiasi (ad esempio può essere un aperto, tanto quanto un insieme con interno vuoto, tipo una linea). L’insieme delle funzioni reali continue su A si indica con C (A) o C 0 (A) . Verificare la continuità di un campo scalare tramite la definizione appena data è spesso complicato, ma i seguenti risultati rendono tale verifica immediata in molti casi: • ogni funzione di una variabile continua ovunque è anche continua ovunque come funzione di più variabili; ad esempio, la funzione ϕ (y) = log y è continua su dom ϕ = (0, +∞) e quindi la funzione f (x, y) = log y è continua su dom f = {(x, y) : y > 0} = R × (0, +∞); • combinazioni lineari, prodotti, rapporti e composizioni di funzioni continue ovunque sono funzioni √ continue ovunque; ad esempio, f (x, y) = y − ex è continua su dom f = {(x, y) : y ≥ ex }, in √ quanto ottenuta componendo le funzioni ovunque continue ϕ (t) = t e g (x, y) = y − ex (continua su dom g = R2 perché combinazione lineare di funzioni continue). Dalle proprietà precedenti, segue subito che le funzioni polinomiali (cioè i polinomi nelle variabili x1 , ..., xn ) sono continue su Rn e le funzioni razionali (cioè i rapporti di polinomi nelle variabili x1 , ..., xn ) sono continue dove sono definite (cioè nei punti di Rn in cui il denominatore non si annulla). 1.3.1 Alcuni teoremi sulle funzioni continue Sia f : dom f ⊆ Rn → R. Ricordiamo che im f := {f (P ) ∈ R : P ∈ dom f } ⊆ R. Teorema 10 (della permanenza del segno) Se f è continua in P0 ed f (P0 ) = 0, allora esiste un intorno Br (P0 ) in cui f ha lo stesso segno di f (P0 ). Teorema 11 (dei valori intermedi) Se f è continua e dom f è connesso, allora im f è un intervallo. Teorema 12 (di Weierstrass) Se f è continua e dom f è compatto, allora f ammette minimo e massimo assoluti (cioè li ammette im f ): ∃P1 , P2 ∈ dom f tali che f (P1 ) = min f (P ) P ∈dom f e f (P2 ) = max f (P ) . P ∈dom f In particolare, f è limitata (cioè lo è im f ): ∃a, b ∈ R tali che ∀P ∈ dom f si ha a ≤ f (P ) ≤ b. 8 M.Guida, S.Rolando, 2015 1.4 Richiami sulle funzioni vettoriali di n ≥ 1 variabili reali Una funzione vettoriale di n ≥ 1 variabili reali è una funzione f : dom f ⊆ Rn → Rm con m ≥ 2 che ad ogni elemento P = (x1 , ..., xn ) di dom f ⊆ Rn associa un elemento f (P ) di Rm . Osserviamo che entrambi gli elementi P ed f (P ) possono essere visti sia come punti che come vettori, ma, per ragioni legate ai significati che spesso le funzioni vettoriali rivestono nei contesti applicativi in cui vengono considerate, si preferisce di solito vedere la variabile indipendente P come punto ed il valore f (P ) come vettore 8 . Se n = m, la funzione f è detta anche campo vettoriale. Poiché m ≥ 2, il vettore f (P ) è una m-upla di numeri reali con più entrate, le quali dipendono tutte, in generale, dalla variabile P = (x1 , ..., xn ): f (P ) = (f1 (P ) , ..., fm (P )) = (f1 (x1 , ..., xn ) , ..., fm (x1 , ..., xn )) , ∀P = (x1 , ..., xn ) ∈ dom f. Poiché f1 (P ) , ..., fm (P ) sono numeri reali, le funzioni f1 , ..., fm sono campi scalari, detti funzioni componenti di f , la quale si rappresenta allora anche scrivendo brevemente f = (f1 , ..., fm ). Le nozioni di grafico ed insieme di livello non sono altrettanto rilevanti per le funzioni vettoriali quanto lo sono per quelle scalari, quindi non le richiamiamo. Ricordiamo invece che un campo vettoriale f è spesso interpretato come la corrispondenza che in ogni punto P ∈ dom f applica un vettore f (P ) e dunque, in tale ottica, può essere efficacemente rappresentato sovrapponendo gli spazi Rn di partenza e di arrivo e rappresentando il vettore f (P ) = f1 (P ) e1 + ... + fm (P ) em come applicato nel punto P = (x1 , ..., xn ) ∈ dom f a cui è associato. Rappresentazione del campo vettoriale f (x, y) = (x + y, x), che in ogni punto P = (x, y) del piano applica il vettore (x + y) i + xj. Si noti che la rappresentazione non rispetta le norme di f (x, y), come spesso accade quando si è interessati solo a direzione e verso del campo. Come al solito, si chiama immagine della funzione f l’insieme im f := {f (P ) ∈ Rm : P ∈ dom f } (sottoinsieme di Rm ). La definizione di continuità di f è la stessa data nella Definizione 9, con l’unica differenza che a destra dell’implicazione appare ora la norma f (P ) − f (P0 ) al posto del valore assoluto, in quanto i valori di f sono in dimensione almeno 2. In ogni caso, lo studio della continuità di f si riporta a quello già discusso per i campi scalari, in quanto vale la seguente: Proposizione 13 Sia f = (f1 , ..., fm ) una funzione vettoriale definita su dom f ⊆ Rn . Allora f è 8 tolto il caso delle funzioni f : Rn → Rm lineari, per le quali sia P che f (P ) si interpretano più spesso come vettori 9 M.Guida, S.Rolando, 2015 continua in un punto P0 ∈ dom f se e solo se tutte le sue funzioni componenti f1 , ..., fm sono continue in P0 . L’insieme delle funzioni vettoriali continue su un insieme A si indica ancora con C (A) o C 0 (A) , essendo chiaro dal contesto se si parla di funzioni scalari o vettoriali. Se A è una regione di Rn ed f : A ⊆ Rn → Rm è continua su A, allora l’immagine di f (sottoinsieme di Rm ) è una curva parametrica se n = 1 ed m = 2, 3, una superficie parametrica se n = 2 ed m = 3. 1.5 Richiami sul calcolo differenziale per campi scalari Sia f : dom f ⊆ Rn → R un campo scalare (quindi n ≥ 2) e sia P0 = x01 , ..., x0n è un punto interno a dom f . Si dice che f è derivabile parzialmente nel punto P0 rispetto alla variabile xi se esiste la derivata della funzione f x01 , ..., x0i−1 , xi , x0i+1 , ..., x0n della sola variabile xi calcolata in xi = x0i , cioè d f x01 , ..., x0i−1 , xi , x0i+1 , ..., x0n dxi f x01 , ..., x0i−1 , x0i + h, x0i+1 , ..., x0n − f x01 , ..., x0n . h→0 h = lim xi =x0i In tal caso, tale derivata è indicata con ∂f (P0 ) ∂xi oppure fxi (P0 ) oppure Dxi f (P0 ) ed è detta derivata parziale di f rispetto a xi nel punto P0 . Se f è derivabile in P0 rispetto a tutte le sue variabili, si chiama gradiente di f in P0 il vettore ∇f (P0 ) := ∂f ∂f (P0 ) , ..., (P0 ) ∂x1 ∂xn Esempio 14 Sia f (x, y) = ∈ Rn . 2 √ xy + exy . Il campo f è definito se xy ≥ 0, cioè dom f è l’unione del I e III quadrante, assi inclusi. I punti degli assi sono punti di frontiera per dom f e quindi (dom f ) ◦ = (x, y) ∈ R2 : xy > 0 (unione dei quadranti I e III, assi esclusi). Le derivate parziali di f hanno senso solo nei punti di tale insieme. Prendendo ad esempio P0 = (1, 3) ∈ (dom f ) ◦ e considerando le funzioni f (x, 3) = √ 3x + e9x e f (1, y) = 2 √ y + ey ottenute da f (x, y) fissando y = 3 e x = 1, si ottiene d ∂f (1, 3) = f (x, 3) ∂x dx e d ∂f (1, 3) = f (1, y) ∂y dy cioè ∇f (1, 3) = √ 3 2 x=1 d √ = 3x + e9x dx = y=3 2 d √ y + ey dy x=1 3 = √ + 9e9x 2 3x = y=3 2 1 √ + 2yey 2 y x=1 y=3 √ 3 = + 9e9 2 1 = √ + 6e9 , 2 3 1 + 9e9 , 2√ + 6e9 . 3 Se f è derivabile rispetto a tutte le sue variabili in tutti i punti di un aperto Ω ⊆ dom f , allora le 10 M.Guida, S.Rolando, 2015 sue derivate parziali fx1 , ..., fxn sono a loro volta campi scalari definiti su Ω: ∂f : ∂xi Ω ⊆ Rn → P → R ∂f (P ) . ∂xi In tal caso, il gradiente di f esiste in tutti i punti di Ω e definisce un campo vettoriale ∇f = (fx1 , ..., fxn ) con dominio Ω e funzioni componenti date dalle derivate parziali di f : ∇f : Ω ⊆ Rn → Rn P → ∇f (P ) Se con ∇f (P ) = ∂f ∂f (P ) , ..., (P ) . ∂x1 ∂xn ∂f ∈ C (Ω) per ogni i, diciamo che f è di classe C 1 su Ω e scriviamo f ∈ C 1 (Ω) . ∂xi 2 √ Esempio 15 Riprendiamo la funzione f (x, y) = xy + exy dell’esempio precedente. Immaginando y 2 √ fissata, la funzione x → xy + exy della sola variabile x (y va vista come una costante) è derivabile in tutti i punti x tali che xy > 0, nei quali la sua derivata è data da 2 d √ xy + exy dx Tale derivata è per definizione ∂f ∂x x 2 y = √ + y 2 exy . 2 xy (x, y) e quindi risulta 2 ∂f y (x, y) = √ + y 2 exy ∂x 2 xy per ogni (x, y) ∈ (dom f ) ◦ . ◦ Dunque ∂f ∂x è un campo scalare definito sull’aperto Ω = (dom f ) . Analogamente, immaginando x come costante, si ottiene 2 d √ ∂f xy + exy (x, y) = ∂y dy y 2 x = √ + 2xyexy 2 xy per ogni (x, y) ∈ Ω e quindi ∇f (x, y) = 1.5.1 2 2 y x √ + y 2 exy , √ + 2xyexy 2 xy 2 xy 2 1 = √ (y, x) + yexy (y, 2x) 2 xy per ogni (x, y) ∈ Ω. Derivate direzionali Sia f : dom f ⊆ Rn → R un campo scalare e siano P0 un punto interno a dom f ed u ∈ Rn un versore. Consideriamo parametricamente la retta (di Rn ) passante per P0 e parallela ad u: P (t) = P0 + tu. Consideriamo la funzione di t ottenuta calcolando f sui punti della retta: ϕ (t) = f (P (t)) = f (P0 + tu) . Si chiama derivata direzionale di f secondo il versore u nel punto P0 la derivata ϕ (0) = d f (P0 + tu) dt = lim t=0 t→0 f (P0 + tu) − f (P0 ) . t 11 M.Guida, S.Rolando, 2015 Tale derivata, se esiste, si indica con 1.5.2 ∂f ∂f ∂f = . (P0 ). Se (e1 , ..., en ) è la base canonica di Rn , risulta ∂u ∂ei ∂xi Differenziabilità e formula di Taylor di ordine 1 Sia f : dom f ⊆ Rn → R un campo scalare e sia P0 ∈ (dom f ) ◦ . Si dice che f è differenziabile in P0 se: (i) esiste ∇f (P0 ) (cioè esistono tutte le n derivate parziali di f in P0 ); (ii) si ha f (P ) − f (P0 ) − ∇f (P0 ) · (P − P0 ) = 0, lim P →P0 P − P0 cioè f (P ) = f (P0 ) + ∇f (P0 ) · (P − P0 ) + o ( P − P0 )P →P0 . Tale formula è detta formula di Taylor di ordine 1 di f in P0 (MacLaurin se P0 = (0, ..., 0)). Il polinomio T1 (P ) = f (P0 ) + ∇f (P0 ) · (P − P0 ) (nelle variabili x1 , ..., xn , coordinate di P ) è detto polinomio di Taylor di ordine 1 di f in P0 (MacLaurin se P0 = (0, ..., 0)). Valgono i seguenti risultati: Teorema 16 (condizione sufficiente di differenziabilità) Se f è di classe C 1 in un aperto Ω ⊆ dom f , allora f è differenziabile in tutti i punti di Ω. Teorema 17 Se f è differenziabile in P0 , allora f è continua in P0 . Teorema 18 (differenziabilità e derivate direzionali) Se f è differenziabile in P0 , allora f è deriv∂f abile in P0 secondo tutte le direzioni e per ogni versore u ∈ Rn risulta (P0 ) = ∇f (P0 ) · u. ∂u ∂f ∇f (P0 ) ∂f Inoltre (P0 ) = max (P0 ) ⇔ v = . ∂v ∇f (P0 ) u =1 ∂u 1.5.3 Derivate successive e formula di Taylor di ordine 2 Se f : dom f ⊆ Rn → R ammette derivata parziale rispetto a xi in tutti i punti di un aperto Ω ⊆ dom f , ∂f in un punto P0 ∈ Ω, se esiste, è indicata allora la derivata parziale rispetto a xj del campo scalare ∂x i con ∂2f ∂ ∂f fxi xj (P0 ) := (P0 ) := (P0 ) ∂xj ∂xi ∂xj ∂xi e viene detta derivata parziale seconda di f in P0 . Se i = j si parla di derivata seconda mista, ∂2f mentre se i = j la derivata si dice pura e si indica più spesso con (P0 ). ∂x2j Le derivate parziali seconde sono in tutto n2 ed è spesso utile disporle in una matrice n × n, detta matrice hessiana di f in P0 : Hf (P0 ) := ∂2f ∂2f (P0 ) · · · (P0 ) ∂x2 ∂x1 ∂xn ∂x1 2 2 ∂ f ∂ f ∂2f (P0 ) (P0 ) · · · (P0 ) 2 = fxi xj (P0 ) ∂x1 ∂x2 ∂x2 ∂xn ∂x2 .. .. .. .. . . . . 2 2 2 ∂ f ∂ f ∂ f (P0 ) (P0 ) · · · (P ) 0 ∂x1 ∂xn ∂x2 ∂xn ∂x2n ∂2f (P0 ) ∂x21 i,j=1,...,n . 12 M.Guida, S.Rolando, 2015 Se le derivate parziali seconde esistono in tutti i punti di Ω, esse sono nuovamente campi scalari definiti su Ω e, se derivabili ulteriormente, forniscono le n3 derivate parziali terze di f . E così via, fino a definire le eventuali nk derivate parziali di ordine k di f . Il seguente teorema (che qui diamo in una versione con ipotesi semplificate) vale nei casi di più comune interesse e riduce il numero delle derivate successive che risultano diverse tra loro. Inoltre ha come conseguenza immediata che (nelle ipotesi del teorema) la matrice hessiana è una matrice simmetrica. Teorema 19 (di Schwarz, sull’indipendenza delle derivate miste dall’ordine di derivazione) ∂2f esiste ed è continua su Ω. Allora Sia Ω ⊆ Rn un aperto e sia f ∈ C 1 (Ω). Siano i = j tali che ∂xi ∂xj ∀P ∈ Ω : ∃ ∂2f ∂2f (P ) = (P ) . ∂xj ∂xi ∂xi ∂xj Definizione 20 (classi C k ) Sia f : dom f ⊆ Rn → R un campo scalare e sia Ω ⊆ dom f un aperto. • Si dice che f è di classe C k su Ω (k ≥ 1 intero) se tutte le nk derivate parziali di ordine k di f esistono e sono continue su Ω. • Si dice che f è di classe C ∞ su Ω se f è di classe C k su Ω per ogni k ≥ 1. L’insieme dei campi scalari di classe C k su un aperto Ω si indica con C k (Ω) (con 1 ≤ k ≤ ∞). Ogni C k (Ω) è sottospazio vettoriale di RΩ (= insieme delle funzioni definite (almeno) su Ω a valori in R) e si può dimostrare che f ∈ C 1 (Ω) =⇒ f ∈ C 0 (Ω) e f ∈ C k+1 (Ω) =⇒ f ∈ C k (Ω) , per cui valgono le inclusioni C 0 (Ω) ⊃ C 1 (Ω) ⊃ C 2 (Ω) ⊃ ... ⊃ C ∞ (Ω) . Facciamo notare che spesso risulta comodo disporre di un simbolo che esprima il fatto che le derivate di un campo esistono in tutti i punti di un insieme qualsiasi, non necessariamente aperto. Siccome però le derivate parziali hanno senso solo in punti interni al dominio, ciò significherà che il campo è in effetti derivabile su un aperto che contiene tale insieme. In tal senso, si introduce la seguente notazione: se A è un insieme qualsiasi, C k (A) (con 1 ≤ k ≤ ∞) denota l’insieme dei campi scalari che sono di classe C k su un qualche aperto contenente A. Teorema 21 Sia f : dom f ⊆ Rn → R un campo scalare di classe C 2 in un intorno di un punto P0 . Allora vale la seguente formula f (P ) = f (P0 ) + ∇f (P0 ) · (P − P0 ) + 1 T (P − P0 ) Hf (P0 ) (P − P0 ) + o 2 P − P0 2 P →P0 T (dove il vettore P − P0 è inteso scritto in riga e (P − P0 ) Hf (P0 ) (P − P0 ) è un prodotto tra matrici), detta formula di Taylor di ordine 2 di f in P0 (MacLaurin se P0 = (0, ..., 0)). 1.5.4 Ottimizzazione Sia f : dom f ⊆ Rn → R un campo scalare e sia P0 ∈ dom f . Definizione 22 Diciamo che P0 è un punto di massimo (minimo) relativo per f se esiste Br (P0 ) tale che ∀P ∈ Br (P0 ) ∩ dom f risulta f (P ) ≤ f (P0 ) (rispettivamente f (P ) ≥ f (P0 )). In particolare, si parla di massimo (minimo) stretto se f (P ) < f (P0 ) (rispettivamente f (P ) > f (P0 )) per P = P0 . 13 M.Guida, S.Rolando, 2015 Definizione 23 Diciamo che P0 è un punto critico o stazionario per f se ∇f (P0 ) = 0 (quindi P0 è interno a dom f ). Teorema 24 (di Fermat) Se P0 è un punto di massimo o minimo relativo per f e ∇f (P0 ) esiste (quindi P0 è interno a dom f ), allora P0 è punto critico per f (cioè ∇f (P0 ) = 0). Teorema 25 (della matrice hessiana) Supponiamo che P0 sia punto critico per f e che f sia di classe C 2 in un intorno di P0 (ciò garantisce che Hf (P0 ) ∈ Rn,n è simmetrica, per il teorema di Schwarz). Allora risulta che: • se Hf (P0 ) ha autovalori tutti > 0 (definita positiva), allora P0 è punto di minimo stretto per f ; • se Hf (P0 ) ha autovalori tutti < 0 (definita negativa), allora P0 è punto di massimo stretto per f ; • se Hf (P0 ) ha due autovalori discordi (non definita), allora P0 non è punto di massimo nè di minimo e viene detto punto di sella per f . Attenzione! Se Hf (P0 ) ha l’autovalore 0 e gli altri suoi autovalori sono concordi, allora il teorema non permette di concludere nulla (nel senso che il punto critico P0 potrebbe essere punto di massimo, di minimo o di nessuno dei due tipi). 1.6 Richiami sul calcolo differenziale per funzioni vettoriali Circa le funzioni vettoriali f = (f1 , ..., fm ) : dom f ⊆ Rn → Rm (con n ≥ 1 ed m ≥ 2), ricordiamo che la derivazione si può definire componente per componente: f è derivabile in un punto P0 interno a dom f (in senso ordinario se n = 1, parzialmente rispetto ad una qualche variabile se n ≥ 2) se tutte le funzioni componenti f1 , ..., fm sono derivabili in P0 (nello stesso senso); in tal caso, si ha Df (P0 ) = (Df1 (P0 ) , ..., Dfm (P0 )) (1.1) (quale che sia la derivata D, parziale o ordinaria, che si sta considerando). In estrema sintesi: la derivata di un vettore è il vettore delle derivate. Se n ≥ 2, allora P0 = x01 , ..., x0n ∈ Rn e la (1.1) significa fxj (P0 ) = ∂f (P0 ) = ∂xj ∂f1 ∂fm (P0 ) , ..., (P0 ) , ∂xj ∂xj ossia fxj (P0 ) è il vettore delle derivate parziali rispetto a xj delle funzioni componenti di f in P0 . Se tali derivate esistono rispetto a tutte le variabili di f , allora risulta definita la matrice (di tipo m × n) ∂f ∂f1 1 (P0 ) · · · (P0 ) ∂x1 ∂xn . . . = . . . Jf (P0 ) := . . . ∂f ∂fm m (P0 ) · · · (P0 ) ∂x1 ∂xn ∇f1 (P0 ) .. . ∇fm (P0 ) ( m a t r i c e d e l l e r i g h e d i Jf (P0 )) detta matrice jacobiana di f in P0 . Se n = 1, allora P0 = t0 ∈ R e la (1.1) significa f (t0 ) = (f1 (t0 ) , ..., fm (t0 )) , = fx1 (P0 ) · · · fxn (P0 ) , ( m a t r i c e d e l l e c o l o n n e d i Jf (P0 )) 14 M.Guida, S.Rolando, 2015 per cui f (t0 ) è ancora il vettore delle derivate (non più parziali) delle funzioni componenti di f in t0 . Tale vettore può ovviamente essere scritto come vettore colonna ed in tal caso è denotato ancora con f1 (t0 ) .. Jf (t0 ) := . . fm (t0 ) Osserviamo che, in questo caso unidimensionale, può essere dato un senso anche alle derivate unilaterali f± (t0 ) := (f1 )± (t0 ) , ..., (fm )± (t0 ) . Le definizioni delle classi C k si estendono in modo ovvio anche al caso delle funzioni vettoriali (e si mantengono gli stessi simboli, essendo chiaro dal contesto se si parla di funzioni scalari o vettoriali): per 1 ≤ k ≤ ∞, si indica con C k (A) l’insieme delle funzioni vettoriali le cui funzioni componenti sono tutte di classe C k su un qualche aperto contenente l’insieme A ⊆ Rn (A stesso, qualora fosse aperto). Facciamo presente che, nel caso unidimensionale n = 1, tale definizione di C k ([a, b]) coincide con quella (più naturale) che richiede che tutte le funzioni componenti abbiano derivate k-esime continue su [a, b], intendendo tali derivate in senso completo in (a, b) ed unilaterale in a e in b. 1.7 Regola della catena Estendiamo innanzitutto la definizione di Jf anche ai campi scalari (n > m = 1) ed alle funzioni reali di una variabile reale (n = m = 1): • se f : dom f ⊆ Rn → R è un campo scalare, allora si pone Jf (P ) := ∇f (P ) = fx1 (P ) · · · fxn (P ) dove P = (x1 , ..., xn ) ∈ Rn ; • se f : dom f ⊆ R → R è una funzione reale di variabile reale, allora si pone Jf (t) := f (t) dove t ∈ R (tutto, ovviamente, se le derivate scritte esistono). Siano ora g : dom g ⊆ Rk → Rn e f : dom f ⊆ Rn → Rm (1.2) due funzioni tali che la funzione composta f ◦ g abbia senso in punto P0 ∈ dom g. Circa la derivazione di f ◦ g vale il seguente risultato, noto come regola della catena (che qui diamo in una versione con ipotesi semplificate). Teorema 26 Se g è di classe C 1 in un intorno di P0 ed f è di classe C 1 in un intorno di g (P0 ), allora f ◦ g è di classe C 1 in un intorno Br (P0 ) di P0 e risulta Jf ◦g (P ) = Jf (g (P )) Jg (P ) , ∀P ∈ Br (P0 ) (dove il prodotto a secondo membro è ovviamente il prodotto tra matrici). (1.3) 15 M.Guida, S.Rolando, 2015 Notiamo esplicitamente che nella (1.2) lo spazio di arrivo di g e quello di partenza di f hanno la stessa dimensione, ma le dimensioni k, n, m possono essere qualsiasi, di modo che f e g possono essere funzioni scalari o vettoriali, di una o più variabili reali. Vediamo esplicitamente alcuni casi particolari della (1.3), supponendo che le ipotesi del teorema precedente siano in ciascun caso verificate. Indichiamo con u · v il prodotto scalare standard di Rn : (u1 , ..., un ) · (v1 , ..., vn ) = u1 v1 + ... + un vn . g : dom g ⊆ R → Rn f : dom f ⊆ Rn → R Si ha g (t) = (g1 (t) , ..., gn (t)) ∈ Rn con t ∈ R ed f (x1 , ..., xn ) ∈ R. La derivata di f (g (t)) = f (g1 (t) , ..., gn (t)) in un generico t è data da d f (g1 (t) , ..., gn (t)) = ∇f (g (t)) · g (t) . dt (1.4) Infatti la regola della catena (1.3) fornisce g1 (t) (f ◦ g) (t) = Jf ◦g (t) = Jf (g (t)) Jg (t) = fx1 (g (t)) · · · fxn (g (t)) ... gn (t) = fx1 (g (t)) g1 (t) + ... + fxn (g (t)) gn (t) = ∇f (g (t)) · g (t) . g : dom g ⊆ R2 → Rn f : dom f ⊆ Rn → R Si ha g (x, y) = (g1 (x, y) , ..., gn (x, y)) ∈ Rn ed f (x1 , ..., xn ) ∈ R. Le derivate parziali di f (g (x, y)) = f (g1 (x, y) , ..., gn (x, y)) in un generico (x, y) sono date da n ∂f ∂gi ∂g ∂ (g (x, y)) f (g1 (x, y) , ..., gn (x, y)) = (x, y) = ∇f (g (x, y)) · (x, y) , ∂x ∂x ∂x i=1 ∂xi n ∂f ∂gi ∂g ∂ (g (x, y)) f (g1 (x, y) , ..., gn (x, y)) = (x, y) = ∇f (g (x, y)) · (x, y) . ∂y ∂x ∂y ∂y i i=1 Infatti la regola della catena (1.3) fornisce ∇ (f ◦ g) (x, y) = Jf ◦g (x, y) = Jf (g (x, y)) Jg (x, y) ∂g ∂g1 1 (x, y) (x, y) ∂x ∂y . . .. = fx1 (g (x, y)) · · · fxn (g (x, y)) .. ∂g ∂gn n (x, y) (x, y) ∂x ∂y n ∂f n ∂f ∂gi ∂gi (g (x, y)) (g (x, y)) (x, y) , (x, y) . = ∂x ∂x ∂x ∂y i i i=1 i=1 16 M.Guida, S.Rolando, 2015 g : dom g ⊆ R → R2 f : dom f ⊆ R2 → R3 Si ha g (t) = (g1 (t) , g2 (t)) con t ∈ R ed f (x, y) = (f1 (x, y) , f2 (x, y) , f3 (x, y)). Il vettore derivata di f (g (t)) = generico t è dato da f1 g1 (t) , g2 (t) , f2 g1 (t) , g2 (t) , f3 g1 (t) , g2 (t) in un d f (g (t)) = ∇f1 (g (t)) · g (t) , ∇f2 (g (t)) · g (t) , ∇f3 (g (t)) · g (t) . dt Infatti la regola della catena (1.3) fornisce ∂f1 ∂f1 (g (t)) (g (t)) ∂x ∂y ∂f2 ∂f 2 (g (t)) (g (t)) (f ◦ g) (t) = Jf ◦g (t) = Jf (g (t)) Jg (t) = ∂y ∂x ∂f3 ∂f3 (g (t)) (g (t)) ∂x ∂y ∂f1 ∂f1 (g (t)) g1 (t) + (g (t)) g2 (t) ∂x ∂y ∇f1 (g (t)) · g ∂f2 ∂f2 (t) + (t) (g (t)) g (g (t)) g = = ∇f2 (g (t)) · g 1 2 ∂x ∂y ∇f3 (g (t)) · g ∂f3 ∂f3 (g (t)) g1 (t) + (g (t)) g2 (t) ∂x ∂y g1 (t) g2 (t) (t) (t) . (t) D’altra parte, osserviamo che risulta d f (g (t)) = dt d d d f1 (g1 (t) , g2 (t)) , f2 (g1 (t) , g2 (t)) , f3 (g1 (t) , g2 (t)) dt dt dt per definizione (1.1) di derivata di un vettore e quindi si sarebbe potuti arrivare più semplicemente allo stesso risultato applicando la (1.4) alle tre funzioni scalari fi (g1 (t) , g2 (t)).