Note di Analisi Matematica 2

Транскрипт

1 Annamaria Mazzia Note di Analisi Matematica 2 Università degli Studi di Padova corso di laurea in Ingegneria Edile-Architettura a.a Questo lavoro è pubblicato sotto una Creative Commons Attribution-Noncommercial-No Derivative Works 2.5 Italy License, (

2

3 Indice Indice iii 1 Brevi richiami di analisi Introduzione Identità trigonometriche Regole su funzione esponenziale e logaritmica Derivate e integrali Altri teoremi Funzioni reali di più variabili Lo spazio R n Definizioni preliminari Come determinare il dominio di una funzione di due variabili? Sui vettori Intorno di un punto, insieme aperto, chiuso, frontiera Limiti, continuità, differenziabilità di funzioni di più variabili Limite di una funzione di più variabili Continuità di una funzione di più variabili Derivate parziali Interpretazione delle derivate parziali Derivate parziali di ordine più elevato Differenziabilità di una funzione Differenziale Derivata direzionale Derivazione nelle funzioni composte Piano tangente ad una superficie Formula di Taylor Massimi e minimi Forme quadratiche Massimi e minimi Ricerca di massimi e minimi relativi Sui massimi e minimi assoluti Funzioni implicite Equazione di una retta e vettore normale alla retta Curve di livello Significato del vettore gradiente iii

4 INDICE 4.7 Estremi vincolati e moltiplicatori di Lagrange Le curve Equazioni parametriche di una curva Grafico di una curva parametrica Parametrizzare una curva Tangente ad una curva Lunghezza di un arco di funzione Lunghezza di una curva La curva cicloide Sistema di coordinate polari Curve in coordinate polari La curva cardioide Lunghezza di una curva polare Lunghezze di alcune curve Funzioni a valori vettoriali Le curve riviste come funzioni vettoriali Retta tangente ad una curva Curve orientate Di nuovo sulla lunghezza di una curva L ascissa curvilinea Superfici parametriche Superfici parametriche Sistema di coordinate sferiche Piano tangente a una superficie parametrica Equazione di un piano e vettore normale al piano Integrali Integrali dipendenti da parametri Integrali dipendenti da parametri per funzioni di una sola variabile Integrali dipendenti da parametri per funzioni di due variabili Richiamo sugli integrali semplici Integrali doppi su domini rettangolari Integrali iterati Integrali doppi su domini generali Proprietà degli integrali doppi Cambiamento di variabili Significato dello jacobiano Area di un dominio Cenni su integrali tripli Integrali curvilinei Integrali di superficie Area di una superficie Integrale di una superficie Solidi e superfici di rotazione Equazioni differenziali ordinarie Cosa è un equazione differenziale? Il problema di Cauchy in locale Teorema di Cauchy (esistenza e unicità globale) Definizioni Equazioni differenziali lineari del primo ordine iv

5 Indice 8.6 Metodo di separazione delle variabili Risoluzione di alcuni tipi di equazioni differenziali Le equazioni differenziali lineari Cosa è uno spazio vettoriale? L equazione omogenea L equazione non omogenea Equazioni lineari a coefficienti costanti Metodo dei coefficienti indeterminati Forme differenziali Introduzione alle forme differenziali Integrali delle forme differenziali Applicazione delle forme differenziali Teorema fondamentale per gli integrali curvilinei Forme differenziali lineari esatte Le forme differenziali lineari chiuse Bibliografia 151 v

6

7 CAPITOLO 1 Brevi richiami di analisi 1 La teoria attrae la pratica come il magnete attrae il ferro. Carl Friedrich Gauss 1.1 Introduzione Identità trigonometriche Regole su funzione esponenziale e logaritmica Derivate e integrali Altri teoremi Introduzione Quando si descrivono teoremi, si danno definizioni o, semplicemente, si discute di matematica, è abbastanza usuale prendere in prestito lettere dell alfabeto greco. È importante, quindi, saperle riconoscere e chiamarle in maniera corretta: A α Alfa N ν Nu B β Beta Ξ ξ Xi Γ γ Gamma O o Omicron δ Delta Π π Pi E ɛ Epsilon P ρ Rho Z ζ Zeta Σ σ Sigma H η Eta T τ Tau Θ θ Theta Υ υ Upsilon I ι Iota Φ φ Fi K κ Kappa X χ Chi Λ λ Lambda Ψ ψ Psi M µ Mu Ω ω Omega 1.2 Identità trigonometriche Nel seguito introduciamo alcune formule trigonometriche, con la notazione: G sin (x) seno(x), cos (x) coseno(x), sin (x) G tan (x) tangente(x) = cos (x), sec (x) secante(x) = 1 cos (x), 1

8 1. BREVI RICHIAMI DI ANALISI 1 cos ( θ) = cos (θ) cos ( π 2 θ) = sin (θ) sin cos ( π 2 + θ) = sin (θ) sin cos (π θ) = cos (θ) cos (π + θ) = cos (θ) cos (θ + φ) = cos (θ) cos (φ) sin (θ) sin (φ) sin (2θ) = 2 sin (θ) cos (θ) sin 2 (θ) + cos 2 (θ) = 1 sin ( θ) = sin (θ) ( π 2 θ) = cos (θ) ( π 2 + θ) = cos (θ) sin (π θ) = sin (θ) sin (π + θ) = sin (θ) sin (θ + φ) = sin (θ) cos (φ) + cos (θ) sin (φ) cos (2θ) = cos 2 (θ) sin 2 (θ) tan 2 (θ) + 1 = sec 2 (θ) 1.3 Regole su funzione esponenziale e logaritmica Assumiano a, b R, con a > 0 e b > 0. Si ha: 1 x = 1 a x+y = a x a y a xy = (a x ) y a log a (x) = x a 0 = 1 a x y = a x /a y a x b x = (ab) x log a (xy) = log a (x) + log a (y) log a (x/y) = log a (x) log a (y) log a (x y ) = y log a (x) log a (a x ) = x log b (x) = log a (x) log a (b) b x = a x log a (b) 1.4 Derivate e integrali Siano f e g due funzioni dipendenti dalla variabile reale x mentre c R sia una costante. Indichiamo la derivata di f con il simbolo df dx o mediante f. Si ha: d (cf) d x = cf regola della costante d (f + g) = d f d x + d g d x regola della somma d x d (f/g) = f g fg d x g 2 regola del quoziente d (fg) d x = fg + f g regola del prodotto d f r d x = rf r 1 f regola della potenza Tra le regole di integrazione, invece, ricordiamo quella di integrazione per parti: fg dx = fg f g dx Diamo ora una tabella delle derivate e degli integrali delle funzioni più note (per gli integrali lasciamo fuori la costante di integrazione), e con la simbologia arcsin(x) arcoseno(x), arccos(x) arcocoseno(x), cot(x) cotangente (x), arctan(x) arcotangente(x), arccot(x), arcocotangente(x). 2

9 1.5. Altri teoremi f f f f 1 ln(x) e x e x x sin (x) cos (x) cos (x) sin (x) 1 tan (x) cos 2 (x) (= sec2 (x)) cot (x) 1 sin 2 (x) tan (x) cot (x) cos (x) cos (x) sin (x) sin (x) 1 1 arcsin (x) arccos (x) 1 x 2 1 x 2 1 arctan (x) 1 + x 2 arccot(x) x 2 f x r x r+1 fd x f fd x r + 1 (r 1) x 1 ln x e x e x ln x x ln x x sin (x) cos (x) cos (x) sin (x) tan (x) 1 ln cos (x) cot (x) ln sin (x) 1 cos (x) 1 ln cos (x) + tan (x) 1 sin (x) 1 ln + cot (x) sin (x) 1 cos 2 (x) tan (x) 1 sin 2 (x) cot (x) tan (x) cos (x) 1 cos (x) cot (x) sin (x) 1 sin (x) arcsin (x) x arcsin (x) + 1 x 2 arccos (x) x arccos (x) 1 x 2 arctan (x) x arctan (x) 1 2 ln (1 + x2 ) arccot(x) xarccot(x) 1 2 ln (1 + x2 ) 1 1 arcsin (x) 1 x x 2 arctan (x) 1.5 Altri teoremi Richiamiamo, nel seguito, alcuni teoremi. Utilizzeremo, inoltre, le seguenti notazioni per funzioni di una sola variabile definite in un insieme X R. L insieme delle funzioni continue in X verrà denotato con il simbolo C(X). L insieme delle funzioni continue in X, che hanno le prime n derivate pure esse continue, sarà indicato con C n (X). 3

10 1. BREVI RICHIAMI DI ANALISI 1 Teorema (di Rolle) a Sia f C([a, b]) e differenziabile in ]a, b[. Se f(a) = f(b) = 0, allora esiste un punto ξ ]a, b[ tale che f (ξ) = 0 a Michel Rolle ( ) fu un matematico francese. È conosciuto per il teorema che porta il suo nome. Si deve a lui la notazione della radice n-sima per mezzo del simbolo n x. Teorema (del Valor Medio) Sia f C([a, b]) e differenziabile in ]a, b[, allora esiste un punto ξ ]a, b[ tale che f f(b) f(a) (ξ) = b a Teorema (del Valore Intermedio) Sia f C([a, b]) e sia K un valore compreso tra f(a) e f(b). Allora esiste almeno un punto ξ ]a, b[ tale che f(ξ) = K. Quindi per funzioni continue, un valore compreso tra i due estremi dell insieme di definizione, è un valore assunto dalla funzione stessa (in uno o più punti). Come conseguenza di questo teorema, se f(a)f(b) < 0 (la funzione assume segno opposto agli estremi dell intervallo [a, b]) allora esiste almeno un punto ξ tale che f(ξ) = 0, cioè esiste almeno una radice dell equazione f(x) = 0 nell intervallo [a, b]. Teorema (Esistenza del punto fisso) Data una funzione g definita in [a, b], continua e tale che a g(x) b per ogni x [a, b], allora g ammette almeno un punto fisso. Dimostrazione. Dire che una funzione g ammette almeno un punto fisso, vuol dire che esiste almeno un punto ξ nel suo insieme di definizione, tale che g(ξ) = ξ. Dalle ipotesi del teorema, i valori della funzione g sono contenuti nell intervallo [a, b] e, in particolare a g(a) b e a g(b) b. Definiamo, perciò, la funzione continua Φ(x) mediante la relazione Φ(x) = g(x) x Allora Φ(a) = g(a) a > 0 e Φ(b) = g(b) b < 0. Per il Teorema del Valore Intermedio esiste almeno un punto ξ ]a, b[ tale che Φ(ξ) = 0, vale a dire g(ξ) ξ = 0, cioè g(ξ) = ξ. Esiste almeno un punto fisso per la funzione g. 4

11 1.5. Altri teoremi Teorema (Esistenza e unicità del punto fisso) Data una funzione g di classe C 1 in [a, b], con a g(x) b per ogni x [a, b], e con g (x) m < 1 per ogni x [a, b] allora esiste ed è unico il punto fisso della g in tale intervallo. Dimostrazione. L esistenza di almeno un punto fisso è assicurata dal teorema precedente (le ipotesi del teorema precedente ci sono tutte). Supponiamo, allora, che esistano due punti fissi ξ e η, con ξ η, per la funzione g. Si ha ξ η = g(ξ) g(η) Applicando il teorema del Valor Medio, esiste un punto c compreso tra ξ e η per cui g(ξ) g(η) = g (c)(ξ η) g (c) ξ η Ma per ipotesi g (c) m < 1 da cui ξ η m ξ η < ξ η Si arriva ad una contraddizione. L assurdo deriva dall aver supposto ξ η. Quindi ξ = η e il punto fisso è unico. Teorema (del Valor Medio del Calcolo Integrale) Se f C([a, b]) e g è integrabile in [a, b] e g(x) non cambia segno in [a, b], allora esiste un punto ξ ]a, b[ tale che b a f(x)g(x) d x = f(ξ) b a g(x) d x Per g 1, questo teorema ci dà il valore medio della funzione f sull intervallo [a, b], dato da f(ξ) = 1 b b a a f(x) d x Teorema (di Rolle generalizzato) Sia f C([a, b]) n volte differenziabile in ]a, b[. Se f si annulla in n + 1 punti distinti x 0, x 1,..., x n in ]a, b[, allora esiste un punto ξ ]a, b[ in cui la derivata n-sima della f si annulla: f (n) (ξ) = 0. Teorema (Formula di Taylor) 1 Sia f C 2 ([a, b]) e sia x 0 un punto dell intervallo [a, b]. Allora, per qualunque x [a, b] si può scrivere: f(x) = f(x 0 ) + f (x 0 )(x x 0 ) + (x x 0) 2 f (ξ x ) 2 dove ξ x è un opportuno punto di [a, b] che si trova sul segmento individuato da x 0 e x. La formula appena scritta si dice formula di Taylor di centro x 0 nel punto x. La formula di Taylor appena scritta si può generalizzare se la funzione f è derivabile n + 1 volte. Si ha così la formula polinomiale di Taylor di centro x 0 : dove f(x) = f(x 0 ) + f (x 0 )(x x 0 ) + f (x 0 ) 2! R n (x) = f (n+1) (ξ x ) (x x 0 ) n+1 (n + 1)! (x x 0 ) f (n) (x 0 ) (x x 0 ) n + R n n! con ξ x un opportuno punto di [a, b] che si trova sul segmento individuato da x 0 e x. 1 Brook Taylor ( ) fu un matematico inglese che sviluppò quello che oggi è chiamato calcolo delle differenze finite. L importanza del suo lavoro e, soprattutto, della formula conosciuta oggi con il suo nome, venne riconosciuta solo nel 1772 da Lagrange. 5

12

13 CAPITOLO 2 Funzioni reali di più variabili La facoltà che mette in moto l invenzione matematica non è il ragionamento, bensì l immaginazione. Augustus De Morgan ( ) 2.1 Lo spazio R n Definizioni preliminari Come determinare il dominio di una funzione di due variabili? Sui vettori Intorno di un punto, insieme aperto, chiuso, frontiera Lo spazio R n Dallo studio di funzioni reali di variabili reali f : R R che alla variabile x R associa il valore f(x) R, passiamo a studiare funzioni reali di più variabili: non c è più una sola variabile x come variabile di input della nostra funzione, ma possiamo avere due o più variabili di input mentre il valore che assume la funzione rimane un valore reale (detto anche scalare). Se (x, y) è la coppia di variabili, ciascuna delle quali varia in R, possiamo definire una funzione f che alla coppia (x, y) associa il valore f(x, y). Analogamente, data la terna di variabili reali (x, y, z), si può definire una funzione f che, in corrispondenza di (x, y, z), assume il valore reale f(x, y, z), Il discorso si può generalizzare con una n nupla di valori (x 1, x 2,..., x n ) introducendo una funzione f che, per ogni n nupla (x 1, x 2,..., x n ) associa il valore reale f(x 1, x 2,..., x n ). Introduciamo, dunque, lo spazio R n, dove n è un intero naturale, per definire lo spazio a n dimensioni. Un punto P R n è definito da una n nupla ordinata di numeri reali (x 1, x 2,..., x n ). Ciascun valore x i, i = 1, 2,..., n, prende il nome di coordinata i sima del punto P. Data una funzione f definita in R n, possiamo scrivere f(x 1, x 2,..., x n ) o f(p ) per dire che stiamo valutando la funzione nel punto P. G Per n = 1 si ha lo spazio reale R. I punti che vi appartengono prendono anche il nome di scalari. G Per n = 2 si ha lo spazio R 2 e il generico punto è indicato mediante la coppia (x, y) (x prende il nome di ascissa del punto, mentre y è l ordinata del punto). 7

14 2. FUNZIONI REALI DI PIÙ VARIABILI Figura 2.1: Grafici delle tre funzioni f 1, f 2 e f 3. G Per n = 3 si ha lo spazio R 3 e il generico punto è indicato mediante la coppia (x, y, z), rispettivamente ascissa, ordinata e quota del punto. Esempi di funzioni di più variabili in R 2 sono: G f 1 (x, y) = x + y G f 2 (x, y) = x + y G f 3 (x, y) = (x + y) cos (x + y) Di queste funzioni è possibile fare il grafico: così come una funzione reale di una variabile reale genera una curva nello spazio R 2 una funzione reale di due variabili reali genera una superficie nello spazio R 3. Per il grafico di funzioni reali di tre o più variabili reali il discorso si complica perchè va fatto in uno spazio che ha una dimensione in più rispetto a quello di partenza (che non riusciamo quindi a visualizzare). In tal caso il grafico genera un ipersuperficie. Esempi di funzioni reali in R 3 sono: G f 1 (x, y, z) = x 3 + xyz + y 2 + z G f 2 (x, y, z) = sin (xyz) G f 3 (x, y, z) = e x+y+z 2.2 Definizioni preliminari Come per le funzioni di una sola variabile reale (funzioni scalari) sono stati definiti e analizzati i concetti di continuità, differenziabilità, limite, integrale e derivata, anche per le funzioni di più variabili possono essere fatti gli analoghi studi. A tale scopo, dobbiamo introdurre alcune definizioni (che valgono in generale per uno spazio R n ma che noi vedremo poi in particolare per gli spazi R 2 e R 3 ) Definizione Si definisce funzione di n variabili reali una legge che assegna un unico numero reale f(x 1, x 2,..., x n ) R a ciascun punto (x 1, x 2,..., x n ) contenuto in un sottoinsieme D(f) di R n. L insieme dei punti D(f) prende il nome di insieme di definizione o dominio della funzione f. L insieme di tutti i numeri reali f(x 1, x 2,..., x n ) al variare dei punti nel dominio prende il nome di insieme dei valori o codominio della f (o range, per usare il termine matematico inglese) e si denota con R(f) oppure con f(a) se il dominio della funzione è stato indicato con l insieme A. Per indicare una funzione f si possono usare le seguenti scritture: f : D(f) R(f) dove D(f) R n, R(f) R f : A B dove A R n, B R, f(a) B Per funzioni di una variabile reale, è usuale indicare la funzione con la notazione y = f(x), dal momento che il valore della funzione viene rappresentato sull asse delle y nel piano 8

15 2.2. Definizioni preliminari Figura 2.2: Rappresentazione grafica di una generica funzione di due variabili reali f(x, y). cartesiano xy. Alla stessa maniera, è usuale indicare funzioni reali di due variabili reali mediante la notazione z = f(x, y), visto che il valore di questa funzione viene rappresentato sull asse delle z. Per quanto riguarda il grafico di una funzione f in R 2, si può dare la seguente definizione: Definizione Data una funzione f : D(f) R(f) in R 2, il grafico ad essa associato è dato dall insieme { } G(f) = (x, y, z) R 3 : (x, y) D(f), z = f(x, y) In Figura 2.2 è rappresentato il grafico di una generica funzione di due variabili reali, nello spazio R 2. I valori della funzione sono rappresentati sull asse delle z, dove in rosso è rappresentato l insieme dei valori della funzione R(f), mentre sul piano xy, in blu, è rappresentato l insieme di definizione D(f). Generalmente, il dominio di una funzione di due variabili può essere o l intero spazio R 2 o un suo sottoinsieme (come nella Figura 2.2). A volte, il dominio di una funzione non è specificato. Come capire qual è l insieme dei punti per i quali la funzione f esiste? Ci soffermiamo sul caso di una funzione definita in R Come determinare il dominio di una funzione di due variabili? Come regola generale, se è data una funzione f(x, y) ma non vi è nessuna informazione sul dominio, allora il dominio sarà dato da tutti i punti del piano xy ad eccezione (o escludendo) quei punti (se ce ne sono) nei quali la funzione non può essere definita. Sono due le situazioni in cui una funzione f non può essere definita in un punto (x 0, y 0 ): se il valore f(x 0, y 0 ) non è un numero reale o se la funzione in (x 0, y 0 ) assumerebbe valori ±. Vediamo degli esempi. 9

16 2. FUNZIONI REALI DI PIÙ VARIABILI ( Figura 2.3: Grafico della funzione z = f(x, y) = 5 1 x 4 y ). 8 Esempio Es Sia data la funzione z = f(x, y) = x 3 + x 2 y. Questa funzione è ben definita per tutti i valori di x e y perchè qualunque sia la coppia (x, y), la funzione assume sempre valori reali. Quindi f è definita in tutto R 2. Esempio ( Es Sia ora z = f(x, y) = 5 1 x 4 y ) per 0 x 2 e per 0 y 8 4x. 8 In tal caso la funzione è assegnata su uno specifico dominio, quindi, anche se la funzione è ben definita per tutti i valori di x e di y, il dominio in cui va studiata, in questo esempio, è quello dato, vale a dire per x [0, 2], e per y che varia nell intervallo [0, 8] quando x = 0, mentre y = 0 quando x = 2. Ciò significa che l insieme di definizione è dato dal triangolo di estremi (0, 0), (0, 8) e (2, 0) (si veda Figura 2.3). Esempio Es Vediamo ora la funzione z = f(x, y) = 16 x 2 y 2. Questa funzione è ben definita solo quando l espressione sotto radice è non negativa. Perciò il suo dominio è dato dai punti (x,y) che soddisfano la condizione 16 x 2 y 2 0 x 2 + y 2 16 Questa condizione definisce il dominio: si tratta del cerchio di centro l origine e raggio 4 nel piano xy. Infatti x 2 + y 2 è la definizione di distanza di un punto (x, y) dall origine del piano, da cui la condizione x 2 + y 2 16 è equivalente a x 2 + y 2 4 ovvero l insieme dei punti la cui distanza dall origine è minore o uguale a 4, vale a dire il cerchio di centro l origine e raggio 4. Il grafico di questa funzione è una semisfera nel semipiano per z 0. 10

17 2.2. Definizioni preliminari Esempio Es Sia z = f(x, y) = 10. In tal caso, il dominio non è specificato ma ci accorgiamo subito che la funzione, per essere definita, deve avere il denominatore diverso da x y zero. Quindi la funzione non è definita per x = y. Il dominio della f è dunque tutto il piano xy privato della retta x = y. Per poter andare avanti nello studio delle funzioni, dobbiamo riprendere o generalizzare altri concetti di base. Incominciamo dai vettori Sui vettori Un punto P R n può essere visto anche come vettore di R n. Abbiamo infatti la seguente definizione Definizione Un vettore di R n è un n nupla ordinata di numeri reali. Un vettore lo si indica mediante il simbolo x. Quindi x è definito mediante (x 1, x 2,..., x n ). Una funzione che generalizza ai vettori il valore assoluto di un numero reale prende il nome di norma. Esistono diversi tipi di norme. Noi consideriamo la norma euclidea e la chiameremo brevemente norma o modulo. Abbiamo la seguente definizione. Definizione Dato un vettore x R n, si definisce modulo (o norma euclidea di x) la quantità scalare data da x = n (x i ) 2 i=1 (con il simbolo n i=1 (x i) 2 indichiamo la somma (x 1 ) 2 + (x 2 ) (x n ) 2 ). Definizione Dati due vettori x e y in R n si definisce distanza tra i due vettori la quantità x y. Geometricamente, la distanza tra due vettori non è altro che la distanza euclidea tra due punti. Esempio Es Siano dati i due vettori p = (7, 1) e q = (3, 4). La distanza tra i due vettori è data da p q = (7 3) 2 + (1 4) 2 = = 25 = 5 Se vediamo i due vettori come i punti del piano P e Q che hanno coordinate rispettivamente (7, 1) e (3, 4) e vogliamo calcolare la distanza tra i due punti, dobbiamo applicare esattamente la stessa formula (si veda Figura 2.4). Quindi due punti nello spazio R n possono essere visti come vettori e viceversa. Di conseguenza, in R 2 o R 3, quella che per noi è la distanza tra due punti P e Q, e che ricaviamo applicando il teorema di Pitagora, può essere vista come la distanza tra i due vettori. Presi due punti P e Q in R n possiamo fare P + Q o P Q considerandoli come vettori e quindi sommando o facendo la differenza delle componenti omonime dei punti-vettori. Tutte le operazioni che possiamo fare tra vettori si ripetono tra punti. 11

18 2. FUNZIONI REALI DI PIÙ VARIABILI Figura 2.4: Distanza tra due vettori p e q o distanza tra due punti P e Q. Figura 2.5: A sinistra: somma e differenza tra punti in R 2. A destra: prodotto di uno scalare per un punto. I vettori αq, βq, γq e δq sono messi sfalsati per ragioni pratiche di visibilità ma sono sulla stessa linea. Esempio Es Siano dati i due punti di R n, P (p 1, p 2,..., p n ) e Q(q 1, q 2,..., q n ) (usiamo questa notazione per rappresentare il punto P (o Q) di coordinate (p 1, p 2,..., p n ) (o (q 1, q 2,..., q n )). Allora il punto P + Q ha componenti (p 1 + q 1, p 2 + q 2,..., p n + q n ), mentre il punto P Q è dato da (p 1 q 1, p 2 q 2,..., p n q n ). Dato uno scalare α, il punto αp è dato da (αp 1, αp 2,..., αp n ). Si veda Figura 2.5 per vedere l interpretazione geometrica lavorando tra vettori. Definizione Dati due vettori x e y, si definisce prodotto scalare tra i due vettori il numero reale indicato con il simbolo x y dato da 12 x y = n x i y i i=1

19 2.2. Definizioni preliminari Figura 2.6: Intervallo aperto ]a 1, a 2 ] ]b 1, b 2 [ Figura 2.7: Esempio di insieme limitato in R Intorno di un punto, insieme aperto, chiuso, frontiera... Definizione Dati due punti di R n, A (a 1, a 2,..., a n ) e B (b 1, b 2,..., b n ), con a i < b i (per i = 1, 2,..., n), si definisce intervallo aperto di R n di vertici A e B l insieme dato da T = {P R n di coordinate (x 1, x 2,..., x n ) t. c. a i < x i < b i, i = 1, 2,..., n} In R 2 un intervallo aperto di vertici A e B è dato dal rettangolo i cui punti (x, y) sono presi, rispettivamente, negli intervalli aperti ]a 1, a 2 [ e ]b 1, b 2 [, che possiamo indicare come ]a 1, a 2 ] ]b 1, b 2 [ (si veda Figura 2.6) Definizione I R n si definisce insieme limitato di R n se esiste un intervallo aperto che lo contiene. Passiamo ora a considerare l intorno di un punto. In R sappiamo che vale la seguente definizione. Definizione Dato x 0 R e ɛ > 0, l insieme dei punti x sull asse reale che hanno distanza da x 0 minore di ɛ è un intervallo aperto di centro x 0 e raggio ɛ che prende il nome di intorno di 13

20 2. FUNZIONI REALI DI PIÙ VARIABILI x 0. Se indichiamo con A ɛ (x 0 ) questo insieme, possiamo dire che A ɛ (x 0 ) = {x R : x x 0 < ɛ} Generalizziamo questa definizione in R n. Definizione Dato P 0 R n e ɛ > 0, l insieme dei punti P di R n che hanno distanza da P 0 minore di ɛ prende il nome di intorno circolare di centro P 0 e raggio ɛ. Indichiamo con A ɛ (P 0 ) questo insieme, possiamo dire che A ɛ (P 0 ) = {P R n : P P 0 < ɛ} G In R 2, considerando P 0 (x 0, y 0 ), e il generico punto P (x, y) si ha { A ɛ (P 0 ) = P (x, y) R 2 : } (x x 0 ) 2 + (y y 0 ) 2 < ɛ Osserviamo che l equazione (x x 0 ) 2 + (y y 0 ) 2 = ɛ 2 rappresenta l equazione di una circonferenza di centro il punto (x 0, y 0 ) e raggio ɛ. Quindi l intorno di (x 0, y 0 ) è dato da tutti i punti contenuti all interno della circonferenza (nel cerchio), ma non i punti che si trovano sulla circonferenza. G In R 3, preso P 0 (x 0, y 0, z 0 ) e considerato P (x, y, z) il generico punto di R 3, si ha { A ɛ (P 0 ) = P (x, y, z) R 3 : } (x x 0 ) 2 + (y y 0 ) 2 + (z z 0 ) 2 < ɛ Dal momento che l equazione (x x 0 ) 2 + (y y 0 ) 2 + ( z 0 ) 2 = ɛ 2 rappresenta l equazione della sfera di centro P 0 e raggio ɛ, l intorno di P 0 è dato da tutti i punti che si trovano all interno della sfera ma non sulla superficie della sfera. Vediamo ora altre definizioni che saranno utili nel seguito. Definizione Dato I R n : G Diremo che un punto P 0 R n è un punto di frontiera di I se ogni intorno di P 0 contiene almeno un punto di I e un punto che non appartiene a I. G Diremo che un punto P 0 R n è un punto interno di I se esiste un intorno di P 0 tutto contenuto in I. G Diremo che I è un insieme chiuso se ciascun punto di frontiera di I appartiene a I. G Diremo che I è un insieme aperto se nessun punto di frontiera di I appartiene a I. G L insieme interno di I è l insieme dei punti interni di I che non sono di frontiera di I. G L insieme di frontiera di I è l insieme di tutti i punti di frontiera di I. G L insieme esterno di I è l insieme dei punti che non sono di I e che non sono di frontiera di I. Definizione Dato I R n : G Diremo che P 0 R n è punto di accumulazione di I se per ogni intorno di P 0 ci sono infiniti punti che appartengono a I. G Diremo che P 0 I è punto isolato di I se non è punto di accumulazione per I. 14 Esempi: G L intorno circolare di un punto P 0, A ɛ (P 0 ) è un insieme aperto perchè nessun punto della frontiera appartiene ad esso.

21 2.2. Definizioni preliminari Figura 2.8: Esempio in R 2 di punti interni, di frontiera, di intorno di un punto. G L insieme che denotiamo con il simbolo C ɛ (P 0 ), dato da C ɛ (P 0 ) = {P R n : P P 0 ɛ} è un insieme chiuso perchè ciascun punto della frontiera appartiene ad esso. G Gli insiemi R n e sono sia insiemi chiusi sia insiemi aperti per convenzione. Definizione Dato un insieme I R n dall unione di I e della sua frontiera. si definisce chiusura di I l insieme formato Ad esempio, l insieme C ɛ (P 0 ) rappresenta la chiusura di A ɛ (P 0 ). Definizione Se I R n è chiuso e limitato, esso si dice compatto. 15

22

23 CAPITOLO 3 Limiti, continuità, differenziabilità di funzioni di più variabili La mente che si apre ad una nuova idea non torna mai alla dimensione precedente. Albert Einstein ( ) 3.1 Limite di una funzione di più variabili Continuità di una funzione di più variabili Derivate parziali Interpretazione delle derivate parziali Derivate parziali di ordine più elevato Differenziabilità di una funzione Differenziale Derivata direzionale Derivazione nelle funzioni composte Piano tangente ad una superficie Formula di Taylor Limite di una funzione di più variabili Il concetto di limite di una funzione di più variabili è molto simile a quello per funzioni di una sola variabile. Consideriamo una funzione di due variabili, f(x, y). Diciamo che il limite della funzione f(x, y) è L per (x, y) che tende a (x 0, y 0 ) e scriviamo lim f(x, y) = L (x,y) (x 0,y 0) se tutti i punti di un qualunque intorno di (x 0, y 0 ) (senza considerare il punto (x 0, y 0 )) appartengono al dominio della funzione e se f(x, y) tende a L quando (x, y) tende a (x 0, y 0 ). Più vicino è il punto (x, y) a (x 0, y 0 ), più il valore della funzione tende al valore del limite. Formalmente, la definizione è la seguente. Definizione Siano dati una funzione f : I R, con I R 2, il punto P 0 (x 0, y 0 ), punto di accumulazione per I, e L R, allora diciamo che lim f(x, y) = L (x,y) (x 0,y 0) 17

24 3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI se: G ciascun intorno di P 0 contiene punti del dominio di definizione della f (unica eccezione può essere data dal punto P 0 ) G se e solo se, per ogni numero ɛ > 0, esiste un altro numero δ > 0 tale che se 0 < (x x 0 ) 2 + (y y 0 ) 2 < δ allora f(x, y) L < ɛ qualunque sia il punto P (x, y) I. Dalla definizione segue che, qualunque sia il valore di ɛ piccolo a piacere, è possibile trovare un intorno A δ (P 0 ) tale che per ogni punto in questo intorno diverso da P 0 (0 < (x x 0 ) 2 + (y y 0 ) 2 < δ), vale la relazione f(x, y) L < ɛ, cioè il valore f(x, y) si trova in un intorno di L di raggio ɛ. La definizione di limite per funzioni di due variabili si estende facilmente a funzioni di più variabili. Definizione Siano dati una funzione f : I R, con I R n, il punto P 0 (x 1, x 2,..., x n ), punto di accumulazione per I, e L R, allora diciamo che lim f(p ) = L P P 0 se: G ciascun intorno di P 0 contiene punti del dominio di definizione della f (unica eccezione può essere data dal punto P 0 ) G se e solo se, per ogni numero ɛ > 0, esiste un altro numero δ > 0 tale che se 0 < P P 0 < δ allora f(p ) L < ɛ qualunque sia il punto P I. Il limite di una funzione può valere anche ± e si può anche parlare di limite per P che tende a infinito. Definizione Data f : I R, con I R n e dato il punto P 0 di accumulazione per I si ha G lim P P0 f(p ) = + se per ogni valore M > 0, esiste δ > 0 tale che se 0 < P P 0 < δ allora f(p ) > M G lim P P0 f(p ) = se per ogni valore M > 0, esiste δ > 0 tale che se 0 < P P 0 < δ allora f(p ) < M G lim P f(p ) = L se per ogni valore ɛ > 0, esiste M > 0 tale che se P > M allora f(p ) L < ɛ Alcune regole sui limiti che già conosciamo dalle funzioni scalari si estendono facilmente ai limiti di funzioni di più variabili. Ad esempio, date due funzioni f e g, se lim P P0 f(p ) = L e lim P P0 g(p ) = M con L, M R, si ha G lim P P0 f(p ) ± lim P P0 g(p ) = L ± M G lim P P0 f(p )g(p ) = LM f(p ) G lim P P0 g(p ) = L (questo si ha se M 0). M Anche per funzioni di più variabili vale il teorema del confronto (noto anche come teorema dei carabinieri in italiano o squeeze theorem in inglese) 18

25 3.1. Limite di una funzione di più variabili Figura 3.1: Percorsi che possono essere fatti da (x, y) per tendere a (x 0, y 0 ). Teorema Se f(x, y) g(x, y) h(x, y) per (x, y) in un intorno di (x 0, y 0 ) e se vale lim f(x, y) = lim g(x, y) = L (x,y) (x 0,y 0) (x,y) (x 0,y 0) allora anche lim g(x, y) = L. (x,y) (x 0,y 0) Osserviamo adesso alcuni punti importanti: G Se esiste il limite di una funzione per P che tende a un punto P 0, questo limite è unico. G Per funzioni di una sola variabile f(x), l esistenza del limite lim x x0 f(x) implica che la funzione si avvicina allo stesso numero finito per x che si avvicina a x 0 sia da sinistra sia da destra. G Per funzioni di due variabili (e il discorso vale in maniera del tutto analogo anche per funzioni di tre e più variabili), il limite lim (x,y) (x0,y 0) f(x, y) = L esiste solo se f(x, y) tende allo stesso numero L qualunque sia il percorso che fa (x, y) per avvicinarsi a (x 0, y 0 ) nel piano cartesiano. Ciò significa che (x, y) può avvicinarsi a (x 0, y 0 ) lungo qualunque curva che possiamo individuare nel piano xy e il limite deve valere sempre L (si veda Figura 3.1). Abbiamo perciò la seguente proposizione Proposizione Data f : I R, I R 2, e dato P 0 punto di accumulazione per I, se esiste il limite lim (x,y) (x0,y 0) f(x, y) e tale limite vale L numero reale, allora lo stesso limite si deve avere per P che tende a P 0 su qualunque sottoinsieme di I che ha P 0 come punto di accumulazione. Al contrario, se esistono anche solo due sottoinsiemi di I in cui esiste il limite della f per P che tende a P 0, ma il valore del limite nei due sottoinsiemi non è lo stesso, allora non può esistere il limite della funzione sull insieme I di partenza (proprio in virtù della proposizione precedente). Vediamo degli esempi di calcolo del limite di funzioni di due variabili. 19

26 3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI Esempio Es Consideriamo i seguenti limiti: lim 3x (x,y) (2,2) y2 =? lim (x,y) (3,4) xy2 + x 2 y =? In tutti questi esempi il limite esiste e coincide con il valore della funzione nel punto di limite: lim 3x (x,y) (2,2) y2 = 6 4 = 2 lim (x,y) (3,4) xy2 + x 2 y = = 84 Per la prima funzione il risultato è banale perchè la funzione la possiamo vedere come somma di due funzioni scalari per le quali sappiamo calcolare facilmente il limite. La seconda funzione è data dalla somma di due funzioni, ciascuna delle quali può essere vista come il prodotto di una funzione nella sola variabile x e di una funzione nella sola variabile y. Quindi calcoliamo il limite di queste funzioni, applichiamo la regola sul limite di prodotto di funzioni e otteniamo il risultato. Esempio 3xy Es Consideriamo ora lim (x,y) (0,0) x 2 + y 2. Questo limite non esiste perchè si trovano facilmente due strade diverse per fare tendere il punto (x, y) a (0, 0) attraverso le quali otteniamo due valori diversi del limite. Prendiamo il punto (x, y) sulla retta y = kx con k numero reale arbritrario, diverso da zero. Facciamo tendere dunque (x, kx) al punto (0, 0). Il limite diventa lim (x,kx) (0,0) 3xkx x 2 + (kx) 2 = lim (x,kx) (0,0) 3kx 2 x 2 + k 2 x 2 = 2k 1 + k 2 Questo valore del limite, che abbiamo ottenuto facilmente in quanto la funzione si è ridotta a funzione della sola variabile x, dipende da k, e quindi cambia al cambiare di k. Ciò significa che la funzione non può avere limite per (x, y) 0. Osserviamo che la funzione data è un esempio di funzione che non è definita nel punto (0, 0) in quanto f(0, 0) = 0/0 è una forma indeterminata. Esempio Es Studiamo ora lim (x,y) (0,0) 8xy 2 x 2 + y 4. Anche questa funzione è indeterminata in (0, 0). Proviamo a calcolare il limite sulle rette y = kx con k R, k 0. Otteniamo lim (x,kx) (0,0) 8k 2 x 3 x 2 + k 4 x 4 = lim x 0 8k 2 x 1 + k 2 x 2 = 0 Questo limite non dipende dunque dalla retta, in quanto non dipende da k. 20

27 3.2. Continuità di una funzione di più variabili Ci verrebbe da concludere che allora il limite esiste e vale 0. Ma la risposta non sarebbe corretta perchè con le rette non abbiamo esaurito tutti i percorsi che può fare il punto per avvicinarsi a (0, 0). Proviamo ad avvicinarci a (0, 0) lungo la parabola x = ky 2 In tal caso abbiamo lim (ky 2,y) (0,0) 8ky 4 k 2 y 4 + y 4 = 8k k In questo caso, il limite dipende dalla curva x = ky 2 e il valore non è più 0 ma cambia al cambiare di k. Quindi il limite non esiste. Esempio Es Proviamo invece che lim (x,y) (0,0) 4x 2 y x 2 + y 2 = 0 In tal caso, non conviene scegliere particolari curve per mostrare che il limite vale 0 perchè dovremmo dimostrare che qualunque sia il cammino per avvicinarsi a (0, 0) il limite è sempre quello e, quindi, dovremmo lavorare su infiniti percorsi! In tal caso, dobbiamo applicare la definizione di limite. Ora, poichè x 2 x 2 +y 2 x 2 si ha x 2 + y 2 1, mentre da y2 x 2 +y 2, ricaviamo y x 2 + y 2. Possiamo dunque dire che 4x 2 y x 2 + y 2 0 = 4x 2 y x 2 + y 2 4y 4 x 2 + y 2 Dalla definizione di limite, preso ɛ > 0, dobbiamo provare che esiste δ > 0 tale che per 0 < x 2 + y 2 4x 2 y < δ, risulta x 2 0 < ɛ. + y2 Se scegliamo δ = ɛ/4, abbiamo: 4x 2 y x 2 + y x 2 + y 2 < 4 ɛ 4 = ɛ 4x 2 y Quindi abbiamo provato che x 2 0 < ɛ, cioè il limite della nostra funzione per + y2 (x, y) (0, 0) vale esattamente Continuità di una funzione di più variabili Definizione Una funzione f : I R, con I R n è continua in P 0 (P 0 I e punto di accumulazione per I), se lim f(p ) = f(p 0 ) P P 0 Nel caso di funzioni di due variabili, si ha: Definizione Una funzione f : I R, con I R 2 è continua in P 0 (x 0, y 0 ) (P 0 I e punto di accumulazione per I), se lim f(x, y) = f(x 0, y 0 ) (x,y) (x 0,y 0) 21

28 3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI Definizione Una funzione si dice continua se è continua in ogni punto del suo insieme di definizione. Proposizione Date due funzioni f e g continue in I R 2, allora f + g è continua; G fg è continua; G f è continua in tutti quei punti in g non si annulla; g G f g è continua (f g(x, y) = f(g(x, y)) funzione composta) Esempio Es lim (x,y) (x0,y 0) x sin (xy) = x 0 sin (x 0 y 0 ) La funzione f(x, y) = x sin (xy) è una funzione continua. Infatti la possiamo vedere come il prodotto della funzione x e della funzione sin (xy). La funzione sin (xy) la vediamo come la funzione composta della funzione seno applicata al prodotto delle funzioni x e y. Poichè x e y sono funzioni continue anche il loro prodotto è una funzione continua. La funzione composta di funzioni continue è continua (quindi sin (xy) è continua) e il prodotto di x per sin (xy) dà ancora una funzione continua. Osserviamo che il concetto di continuità non è ovvio! Ci sono funzioni che ammettono limite per (x, y) che tende a (x 0, y 0 ) ma il valore del limite non necessariamente è uguale al valore della funzione in (x 0, y 0 ). Esempio Es La funzione definita come { 0 se (x, y) (0, 0) f(x, y) = 1 se (x, y) = (0, 0) ammette limite per (x, y) (0, 0) ma il limite non è il valore della funzione in (0, 0). Questa funzione non è continua in (0, 0). Difatti lim (x,y) (0,0) f(x, y) = 0 f(0, 0) dal momento che la funzione è di costante valore 0 ad eccezione del punto (0, 0) in cui vale 1. Questa funzione è discontinua in (0, 0). 3.3 Derivate parziali Estendiamo ora il concetto di derivata che abbiamo visto per funzioni di una sola variabile, introducendo le derivate parziali. Data una funzione di una sola variabile, f(x), la derivata prima f (x) rappresenta la velocità di variazione della funzione al variare di x. Con le funzioni di più variabili, ci sono due casi da considerare: cosa fare se varia solo una variabile mentre le altre non variano? cosa fare se varia più di una variabile? Concentriamo ora la nostra attenzione facendo cambiare una variabile alla volta e lasciando le altre fisse. Partiamo con un esempio, lavorando con una funzione di due variabili. Esempio Es Sia data f(x, y) = 4x 3 y 5. Determiniamo la velocità con cui la funzione cambia in un punto fissato (x 0, y 0 ), se non facciamo variare la y mentre facciamo variare la x, e viceversa, determiniamo la velocità con cui cambia la funzione in (x 0, y 0 ) fissando x e variando y. 22

29 3.3. Derivate parziali Nel primo caso, in cui lasciamo y fissato mentre x varia, dal momento che siamo interessati alla velocità della funzione nel punto (x 0, y 0 ), per y fissato, vuol dire che dobbiamo considerare la funzione per y = y 0. Consideriamo quindi f(x, y 0 ) = 4x 3 (y 0 ) 5. Adesso abbiamo una funzione di una sola variabile, la x. Possiamo quindi considerare la funzione g(x) = f(x, y 0 ) = 4x 3 (y 0 ) 5. Di questa funzione in una sola variabile, sappiamo cosa dobbiamo fare se vogliamo determinare la velocità di cambiamento della funzione per x = x 0 : dobbiamo calcolare la derivata prima g (x 0 ). Nell esempio, abbiamo g (x 0 ) = 12(x 0 ) 2 (y 0 ) 5. Quello che abbiamo ottenuto prende il nome di derivata parziale di f(x, y) rispetto a x, nel punto (x 0, y 0 ). Denotiamo questa derivata parziale con uno dei seguenti simboli: f x (x 0, y 0 ) f x (x 0, y 0 ) D x f(x 0, y 0 ) Al posto di (x 0, y 0 ) si può scrivere anche P 0 intendendo per P 0 il punto di coordinate (x 0, y 0 ). Quindi, nel nostro esempio, f x (x 0, y 0 ) = 12(x 0 ) 2 (y 0 ) 5. Vediamo ora cosa succede se lasciamo fissa la variabile x e variamo y. In tal caso, dobbiamo considerare la funzione h(y) = f(x 0, y) = 4(x 0 ) 3 y 5 e calcolare la derivata prima di questa funzione che dipende dalla sola variabile y nel punto y 0. Abbiamo h (y 0 ) = 20(x 0 ) 3 (y 0 ) 4. Ciò che abbiamo ottenuto è la derivata parziale della f rispetto alla variabile y, nel punto (x 0, y 0 ). Indichiamo questa derivata parziale con uno dei seguenti simboli: f y (x 0, y 0 ) f y (x 0, y 0 ) D y f(x 0, y 0 ) Quindi, per l esempio considerato, f y (x 0, y 0 ) = 20(x 0 ) 3 (y 0 ) 4. Passiamo dunque alla definizione generale delle derivate parziali prime di una funzione di due variabili (considerando le derivate non più in (x 0, y 0 ) ma nel generico punto (x, y)). Definizione Data una funzione f(x, y), le derivate parziali prime rispetto alle variabili x e y sono date da: f(x + h, y) f(x, y) (x, y) = lim h 0 h f x f (x, y) = lim y h 0 f(x, y + h) f(x, y) h Derivate per funzioni scalari e derivate per funzioni di due variabili f(x) = f (x) = df dx f(x, y) = f x (x, y) = f x & f y (x, y) = f y Per calcolare le derivate parziali prime di una funzione bisogna fare questo ragionamento: se dobbiamo calcolare f x (x, y) dobbiamo trattare la variabile y come una costante e trattare la funzione come se dipendesse dalla sola x; se dobbiamo calcolare f y (x, y), dobbiamo trattare x come una costante e calcolare la derivata rispetto a y come se la funzione fosse dipendente dalla sola variabile y. 23

30 3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI Esempio Es Calcolare le derivate parziali prime della funzione f(x, y) = 3x y 10xy. Per calcolare la derivata f x (x, y) trattiamo la y come una costante, da cui f x (x, y) = 15x 4 10y. Notiamo che la derivata rispetto a x di 2 y vale zero perchè la y è una costante. Al contrario, per calcolare f y (x, y) dobbiamo ora trattare x come una costante, da cui f y (x, y) = 1 y 10x. 3.4 Interpretazione delle derivate parziali Sono possibili due interpretazioni sul significato delle derivate parziali prime. G Se consideriamo la derivata parziale come la velocità di cambiamento della funzione allora f x (x, y) rappresenta la velocità di cambiamento della funzione al variare di x per y fissato, mentre f y (x, y) rappresenta la velocità di cambiamento della funzione al variare di y per x fissato. Quindi se f x (x 0, y 0 ) > 0 vuol dire che la funzione è crescente in quel punto al variare di x, per y 0 fissato, mentre se f x (x 0, y 0 ) < 0 vuol dire che la funzione è decrescente in quel punto al variare di x, per y 0 fissato. Stesso discorso vale su f y (x 0, y 0 ): se f y (x 0, y 0 ) > 0 allora la funzione è crescente in quel punto al variare di y, per x 0 fissato, mentre se f y (x 0, y 0 ) < 0 la funzione è decrescente in quel punto al variare di y, per x 0 fissato. È possibile che una funzione sia crescente fissato y e decrescente fissato x o viceversa. G L altra interpretazione, geometrica, estende il concetto di pendenza della retta tangente che abbiamo per funzioni di una sola variabile, per cui f (x 0 ) rappresenta la pendenza della retta tangente alla funzione f(x) nel punto x 0. Nel caso di funzioni di due variabili, f x (x 0, y 0 ) rappresenta la pendenza della traccia della funzione f(x, y) nel piano y = y 0 nel punto (x 0, y 0 ) (in altre parole è la pendenza della retta tangente alla curva che si ottiene intersecando la superficie che rappresenta la funzione f(x, y), cioè il grafico della f, con il piano verticale y = y 0 ), mentre f y (x 0, y 0 ) rappresenta la pendenza della traccia della funzione f(x, y) con il piano x = x 0 nel punto (x 0, y 0 ). 3.5 Derivate parziali di ordine più elevato Così come per le funzioni di una sola variabile è possibile definire le derivate di ordine più elevato (derivata seconda, terza, quarta, n-sima), anche per le funzioni di più variabili è possibile definire le derivate di ordine più elevato. Ci soffermiamo al caso di funzioni di due variabili. Data una funzione f(x, y), dal momento che abbiamo due derivate parziali prime f x e f y, su ciascuna di queste funzioni possiamo pensare di applicare ancora la definizione di derivata parziale rispetto a x e rispetto a y, ottenendo, in tal modo, quattro possibili combinazioni. Abbiamo le seguenti scritture: (f x ) x = f xx = ( ) f x x (f x ) y = f xy = ( ) f y x = 2 f x 2 = 2 f y x 24

31 3.6. Differenziabilità di una funzione (f y ) x = f yx = ( ) f x y (f y ) y = f yy = ( ) f y y = 2 f x y = 2 f y 2 Le derivate f xy e f yx sono dette anche derivate parziali miste perchè le derivate sono fatte rispetto a più di una variabile. Osserviamo che, dal punto di vista della notazione usata, quando l indice della derivata parziale è posta in basso della funzione, per esempio f xy, dobbiamo derivare da sinistra verso destra: in questo caso prima facciamo la derivata rispetto a x e poi rispetto a y. Quando invece usiamo la notazione frazionale ( 2 f ) la notazione è opposta: si va da destra verso y x sinistra. Nell esempio, il risultato è lo stesso, prima si deriva rispetto a x e poi rispetto a y. Esempio Es Calcolare le derivate seconde di f(x, y) = sin (xy) x 3 e 4y + 4y 2. Prima di tutto calcoliamo le derivate parziali prime: f x (x, y) = y cos (xy) 3x 2 e 4y f y (x, y) = x cos (xy) 4x 3 e 4y + 8y Passiamo ora alle derivate seconde: f xx (x, y) = y 2 sin (xy) 6xe 4y f xy (x, y) = cos (xy) xy sin (xy) 12x 2 e 4y f yx (x, y) = cos (xy) xy sin (xy) 12x 2 e 4y f yy (x, y) = x 2 sin (xy) 16x 3 e 4y + 8 Nell esempio appena visto, le derivate parziali miste sono coincidenti. Si tratta di una coincidenza o no? In realtà la funzione data gode di una proprietà importante che ci permette di avere questo risultato. Teorema (di Clairaut-Schwarz) Data la funzione f definita in un insieme aperto A che contiene il punto (x 0, y 0 ), se le funzioni f xy e f yx sono continue in A, allora f xy (x 0, y 0 ) = f yx (x 0, y 0 ). 3.6 Differenziabilità di una funzione Prima di entrare a parlare di differenziabilità di una funzione, introduciamo una notazione per degli spazi di funzioni definite in un insieme aperto I R 2. G Si indica con C 0 (I) l insieme delle funzioni continue in I (si dice anche che la funzione è di classe C 0 ). G Si indica con C 1 (I) l insieme delle funzioni definite in I le cui derivate parziali prime sono continue in I (si dice anche che la funzione è di classe C 1 ). G Si indica con C 2 (I) l insieme delle funzioni definite in I le cui derivate parziali prime e seconde sono continue in I (si dice anche che la funzione è di classe C 2 ). 25

32 3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI Definizione Sia data una funzione f : A R con A R 2, A aperto, e un punto P 0 (x 0, y 0 ) A. Diremo che f è differenziabile in P 0 se esistono due numeri reali λ e µ tali che f(x, y) f(x 0, y 0 ) [λ(x x 0 ) + µ(y y 0 )] lim = 0 (x,y) (x 0,y 0) (x x0 ) 2 + (y y 0 ) 2 In maniera del tutto equivalente si può dire che f è differenziabile se f(x, y) f(x 0, y 0 ) [λ(x x 0 ) + µ(y y 0 )] è infinitesima di ordine superiore rispetto all infinitesimo (x x 0 ) 2 + (y y 0 ) 2. Applicando la definizione di limite, dire che f è differenziabile in P 0, vuol dire che, qualunque sia ɛ > 0 esiste δ > 0 tale che per ogni (x, y) A, con 0 < (x x 0 ) 2 + (y y 0 ) 2 < δ risulta f(x, y) f(x 0, y 0 ) [λ(x x 0 ) + µ(y y 0 )] < ɛ (x x 0 ) 2 + (y y 0 ) 2 In modo equivalente, possiamo anche dire che f è differenziabile in P 0 se esistono due numeri λ e µ e una funzione σ(x, y) definita in un intorno T di P 0 e infinitesima per (x, y) (x 0, y 0 ) tale che, per ogni (x, y) T, vale: f(x, y) f(x 0, y 0 ) = λ(x x 0 ) + µ(y y 0 ) + σ(x, y) (x x 0 ) 2 + (y y 0 ) 2. Vale la seguente proposizione. Proposizione Se f : A R, con A R 2, A aperto, è differenziabile in P 0 A, allora esistono le derivate parziali prime di f in P 0 e vale: f x (P 0 ) = λ e f y (P 0 ) = µ. Dimostrazione. Sappiamo che la f è differenziabile, dobbiamo provare che f x (P 0 ) = λ e f y (P 0 ) = µ. Fissiamo la variabile y, prendendo y = y 0. Dalla definizione di differenziabilità si ha: f(x, y 0 ) f(x 0, y 0 ) = λ(x x 0 ) + x x 0 σ(x, y 0 ) con σ la funzione infinitesima definita prima. Il termine che moltiplica µ si annulla (abbiamo y 0 y 0 ) come pure (x x 0 ) 2 + (y y 0 ) 2 si riduce a x x 0 per y = y 0. Dividiamo la relazione trovata per x x 0, ricavando f(x, y 0 ) f(x 0, y 0 ) x x 0 = λ + x x 0 x x 0 σ(x, y 0 ) Passando al limite per x x 0, poichè σ(x, y 0 ) è infinitesima e x x 0 x x 0 funzione x x 0 σ(x, y 0 ) è ancora infinitesima. Quindi si ha x x 0 f(x, y 0 ) f(x 0, y 0 ) lim = λ x x 0 x x 0 è limitata (vale ±1), la Il limite che abbiamo calcolato rappresenta la derivata prima della funzione f(x, y 0 ) che dipende dalla sola variabile x, nel punto x 0 : essa è, quindi, la derivata parziale prima della f rispetto a x. Abbiamo ottenuto che f x (x 0, y 0 ) = λ. Con lo stesso ragionamento, si prova che f y (x 0, y 0 ) = µ. Si deve far variare il punto (x, y) su una retta parallela all asse y, per x = x 0. In tal caso, la definizione di differenziabilità di dà: 26 f(x 0, y) f(x 0, y 0 ) = µ(y y 0 ) + y y 0 σ(x 0, y)

33 3.7. Differenziale Dividendo per y y 0 si ha f(x 0, y) f(x 0, y 0 ) y y 0 = µ + y y 0 y y 0 σ(x 0, y) Passando al limite per y y 0 si ha che y y 0 y y 0 σ(x 0, y) 0 e quindi f(x 0, y) f(x 0, y 0 ) lim = µ y y 0 y y 0 vale a dire f y (x 0, y 0 ) = µ. Quindi se f è differenziabile in P 0, la f ammette le derivate parziali prime in P 0 e vale f(x, y) f(x 0, y 0 ) = f x (x 0, y 0 )(x x 0 ) + f y (x 0, y 0 )(y y 0 ) + σ(x, y) (x x 0 ) 2 + (y y 0 ) 2. Come conseguenza, una funzione differenziabile in P 0 è continua in P 0. Proposizione Sia f : A R, con A aperto di R 2. Sia f differenziabile in P 0 A, allora f è continua in P 0. Dimostrazione. Poichè f è differenziabile in P 0, esiste una funzione infinitesima per (x, y) (x 0, y 0 ), σ(x, y), tale che cioè f(x, y) f(x 0, y 0 ) = f x (x 0, y 0 )(x x 0 ) + f y (x 0, y 0 )(y y 0 ) + σ(x, y) (x x 0 ) 2 + (y y 0 ) 2. Per (x, y) (x 0, y 0 ) il secondo membro della relazione appena scritta tende a zero, quindi lim f(x, y) f(x 0, y 0 ) = 0 (x,y) (x 0,y 0) lim f(x, y) = f(x 0, y 0 ) (x,y) (x 0,y 0) La f è continua in P 0. Teorema Se f C 1 (A), con A aperto di R 2, allora f è differenziabile in A. 3.7 Differenziale Ricordiamo ora il concetto di differenziale di una funzione di una sola variabile. Definizione Data una funzione f(x) e assumendo che la derivata f (x) = df dx un punto x, il differenziale totale df della funzione è dato da ( ) df df = dx = f (x)dx. dx esiste in La quantità df può essere interpretata come il cambiamento infinitesimale del valore della funzione f(x) quando x cambia di una quantità infinitesima dx. Per esprimere questo da un punto di vista formale, consideriamo l incremento f = f(x + x) f(x) che rappresenta l incremento sulla f quando x è incrementato di una quantità finita x. 27

34 3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI Applicando il teorema del valor medio, possiamo riscrivere f = f (x + θ x) x, dove θ (0, 1). Ora passando al limite per x dx, f df, essendo df un incremento infinitesimale. Dal momento che dx è molto piccolo, possiamo dire che dx x e quindi x + θdx x da cui df = f (x)dx. Ritroviamo la formula data per il differenziale df. Qualcosa di simile si ritrova nelle funzioni di due variabili. Definizione Data f(x, y) funzione di due variabili, con derivate parziali prime continue, si definisce differenziale totale della f ( ) ( ) f f df = dx + dy = f x dx + f y dy. x y Il differenziale df rappresenta la variazione della f quando le variabili x e y cambiano di una quantità infinitesima dx e dy. Per arrivare a questa formula, definiamo f la variazione che si ha variando x e y di una quantità x e y rispettivamente. f = f(x + x, y + y) f(x, y) aggiungiamo e sottraiamo f(x, y + y) f(x + x, y + y) f(x, y + y) + f(x, y + y) f(x, y) } {{ } } {{ } incremento con y+ y fissato incremento con x fissato Abbiamo suddiviso f in due pezzi, il primo contenente una variazione solo in x e l altro contenente una variazione solo in y. Applicando il teorema del valor medio come prima, otteniamo f = f x (x + θ 1 x, y + y) x + f y (x, y + θ 2 y) y con θ 1, θ 2 (0, 1). Per x dx e per y dy, con dx e dy incrementi infinitesimali (da cui dx x e dy y), risulta che f f, ricavando l espressione df = f x dx + f y dy. 3.8 Derivata direzionale La derivata direzionale di una funzione permette di calcolare la velocità di variazione della funzione in una assegnata direzione. Le derivate parziali rispetto a x e rispetto a y rappresentano la velocità di variazione lungo le direzioni x e y rispettivamente. Supponiamo ora di voler calcolare come cambia una funzione f(x, y) nel punto (x 0, y 0 ), lungo la direzione di un arbitrario vettore unitario v di componenti α 1 e α 2. Dire che v è unitario, significa che la norma euclidea del vettore vale uno, cioè (α 1 ) 2 + (α 2 ) 2 = 1. Geometricamente, se consideriamo la superficie di equazione z = f(x, y) (il grafico della f), il piano verticale che passa attraverso il punto (x 0, y 0, f(x 0, y 0 )), nella direzione data da v, interseca la superficie in una curva. La pendenza della tangente alla curva nel punto (x 0, y 0, f(x 0, y 0 )) rappresenta la velocità di variazione della f nella direzione v, cioè la derivata direzionale della f lungo v. Al fine di calcolare questa derivata direzionale, consideriamo un punto P (x, y) che si trova sul piano xy lungo la retta passante per P 0 (x 0, y 0 ) e avente direzione data da v. La retta si 28

35 3.8. Derivata direzionale può scrivere come P = P 0 + h v con h scalare. Ciò significa che le coordinate del punto P si possono scrivere come x = x 0 + hα 1 y = y 0 + hα 2 La variazione della f tra il punto P e il punto P 0 è data da f(x 0 + hα 1, y 0 + hα 2 ) f(x 0, y 0 ). Definizione Definiamo derivata direzionale della f lungo la direzione v il limite, se esiste ed è finito, f(x 0 + hα 1, y 0 + hα 2 ) f(x 0, y 0 ) lim h 0 h Questo limite si indica in modo equivalente tramite la scrittura f v (x 0, y 0 ) o D v f(p 0 ). Dalla definizione data, risulta evidente che se v = i indicando con i il versore unitario dell asse x, di componenti (1, 0), allora D v f(p 0 ) = f x (P 0 ), mentre se v = j il versore unitario dell asse y, di componenti (0, 1), allora D v f(p 0 ) = f y (P 0 ). Quindi le derivate parziali rispetto a x e rispetto a y sono un caso particolare di derivate direzionali. Vale il seguente teorema, detto formula del gradiente perchè la derivata direzionale, sotto determinate condizioni, è legata al gradiente della funzione assegnata. Definizione Data una funzione f che ammette derivate parziali in P 0, il vettore indicato con il simbolo f(p 0 ) o grad f(p 0 ) prende il nome di gradiente della funzione in P 0 e ha come componenti le derivate parziali prime della f in P 0 : f(p 0 ) = (f x (P 0 ), f y (P 0 )). Teorema (Formula del gradiente) Data f : A R con A R 2, se f è differenziabile in P 0 (x 0, y 0 ) allora f ammette derivata direzionale lungo una qualsiasi direzione unitaria v(α 1, α 2 ) e risulta f v (P 0) = f x (P 0 )α 1 + f y (P 0 )α 2 Quindi la derivata direzionale si può vedere come il prodotto scalare tra il gradiente della funzione in P 0 e il vettore v. f v (P 0) = f(p 0 ) v Dimostrazione. Poichè f è differenziabile, vale f(x, y) f(x 0, y 0 ) = f x (P 0 )(x x 0 ) + f y (P 0 )(y y 0 ) + σ(x, y) (x x 0 ) 2 + (y y 0 ) 2 dove σ è una funzione infinitesima per (x, y) (x 0, y 0 ). Poichè devo calcolare la derivata direzionale, considero come punto (x, y) il punto che si trova sulla retta passante per (x 0, y 0 ) e avente direzione data dal vettore v. Quindi, come prima, x = x 0 + hα 1 e y = y 0 + hα 2. Sostituendo nella formula della differenziabilità si ricava: f(x 0 +hα 1, y 0 +hα 2 ) f(x 0, y 0 ) = f x (P 0 )(hα 1 )+f y (P 0 )(hα 2 )+σ(x 0 +hα 1, y 0 +hα 2 ) h 2 (α 1 ) 2 + h 2 (α 2 ) 2 Dividiamo ambo i membri per h, ricordando anche che, poichè il vettore è unitario, si ha h2 (α 1 ) 2 + h 2 (α 2 ) 2 = h (α 1 ) 2 + (α 2 ) 2 = h. Quindi si ottiene: f(x 0 + hα 1, y 0 + hα 2 ) f(x 0, y 0 ) h = f x (P 0 )α 1 + f y (P 0 )α 2 + h h σ(x 0 + hα 1, y 0 + hα 2 ) 29

36 3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI Passando al limite per h 0, a primo membro si ha proprio il limite della definizione di derivata direzionale lungo v, mentre a secondo membro si ottiene f x (P 0 )α 1 + f y (P 0 )α 2 in quanto la quantità h h σ(x 0 + hα 1, y 0 + hα 2 ) tende a 0 poichè è prodotto di un infinitesimo (la funzione σ) per la costante h h = ±1). Si ricava quindi l asserto. 3.9 Derivazione nelle funzioni composte Per funzioni scalari, è frequente avere a che fare con funzioni del tipo y = f(x) dove però x è a sua volta funzione di un altra variabile t, x = g(t). Se scriviamo F (t) = f(g(t)), sappiamo che F (t) = f (g(t))g (t): applichiamo la regola di derivazione sulle funzioni composte. C è una notazione alternativa a questa: da y = f(x) con x = g(t), abbiamo dy dt = dy dx dx dt. Per funzioni di più variabili, abbiamo diversi casi da considerare. Ne consideriamo i principali. G Primo caso: Sia z = f(x, y) con x = g(t) e y = h(t). Supponiamo che la f sia una funzione differenziabile di (x, y) e che g e h siano funzioni differenziabili di t. Allora z è una funzione differenziabile di t e si ha 30 dz dt = f dx x dt + f dy y dt Osserviamo che la derivata di z rispetto a t è una derivata totale. Esempio Es Sia z = f(x, y) = x 3 y + 3xy 2 con x = sin (2t) e y = cos (t). Calcoliamo dz dt applicando la formula. Poichè f x = 3x2 y + 3y 2, f y = x3 + 6xy, dx = 2 cos (2t) e dt dy = sin (t), ricaviamo: dt dz dt = (3x2 y + 3y 2 )2 cos (2t) + (x 3 + 6xy)( sin (t)) A questo punto abbiamo calcolato la derivata. Per completare, dobbiamo scrivere x e y in funzione di t: dz dt = (3 sin2 (2t) cos (t) + 3 cos 2 (t))2 cos (2t) + (sin 3 (2t) + 6 sin (2t) cos (t)( sin (t)) e sistemando meglio i termini a destra ricaviamo dz dt = 6(sin2 (2t) cos (2t) cos (t)+cos 2 (t) cos (2t)) (sin 2 (2t) sin (t)+6 sin (2t) sin (t) cos (t)). G Secondo caso: : z = f(x, y) con x = g(s, t) e y = h(s, t). Le funzioni f, g e h siano differenziabili. In questo caso possiamo calcolare le derivate parziali della f rispetto a s e t. Otteniamo z s = f x x s + f y y s z t = f x x t + f y y t

37 3.10. Piano tangente ad una superficie Esempio Es Sia z = f(x, y) = e 2x sin (y) con x = st e y = s 2 t. In tal caso, applicando la formula abbiamo: z s = 2e2x sin (y)t + e 2x cos (y)(2s) = 2e 2st (t sin (s 2 t) + s cos (s 2 t)) z t = 2e2x sin (y)s + e 2x cos (y)s 2 = se 2st (2 sin (s 2 t) + s cos (s 2 t)) 3.10 Piano tangente ad una superficie Per funzioni di una variabile, se facciamo uno zoom intorno ad un punto del grafico di una funzione differenziabile, il grafico si discosta di poco dalla sua retta tangente in quel punto e possiamo approssimare la funzione, in un intorno del punto, tramite l equazione di una retta. Un discorso simile si può sviluppare per funzioni di due variabili. Qui lo zoom si deve fare intorno ad un punto della superficie che rappresenta il grafico di una funzione differenziabile. E il grafico si discosterà poco da un piano (il suo piano tangente in quel punto), così che potremo approssimare la funzione, in un intorno del punto, tramite l equazione del piano tangente. Sia S la superficie dell equazione z = f(x, y), con f differenziabile e di classe C 1. Sia P 0 (x 0, y 0, f(x 0, y 0 ) un punto di S. Consideriamo le curve che intersecano i piani verticali y = y 0 e x = x 0 sulla superficie S. Il punto di intersezione della due curve è proprio il punto P 0. Siano T 1 e T 2 le rette tangenti alle due curve nel punto P 0 (le pendenze di queste rette sono date dalle derivate parziali rispetto a x e y). Allora il piano tangente alla superficie S nel punto P 0 è definito come il piano che contiente entrambe le rette tangenti T 1 e T 2. Possiamo pensare a questo piano tangente come il piano in cui ci sono tutte le possibili rette tangenti per P 0 alle curve che giacciono su S e passano attraverso P 0 (considerando le derivate direzionali). Il piano tangente è quindi il piano che più approssima la superficie S intorno al punto P 0. Un piano passante per il punto P 0 ha equazione nella forma a(x x 0 ) + b(y y 0 ) + c(z f(x 0, y 0 )) = 0 Dividendo per c e ponendo A = a/c e B = b/c, possiamo scrivere z f(x 0, y 0 ) = A(x x 0 ) + B(y y 0 ) Se questa equazione deve rappresentare l equazione del piano tangente a P 0 sulla superficie, vuol dire che l intersezione con il piano y = y 0 deve essere la retta tangente T 1. Ponendo y = y 0, l equazione si riduce a z f(x 0, y 0 ) = A(x x 0 ), y = y 0 Ora questa è l equazione di una retta che ha pendenza A. Ma la pendenza della tangente T 1 è f x (x 0, y 0 ). Perciò A = f x (x 0, y 0 ). Allo stesso modo, considerando il piano x = x 0, il piano tangente si riduce a z f(x 0, y 0 ) = B(y y 0 ), x = x 0 che rappresenta la retta tangente T 2 con pendenza B = f y (x 0, y 0 ). Quindi l equazione del piano tangente è data da z f(x 0, y 0 ) = f x (x 0, y 0 )(x x 0 ) + f y (x 0, y 0 )(y y 0 ). 31

38 3. LIMITI, CONTINUITÀ, DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI 3.11 Formula di Taylor Quando si considerano funzioni scalari differenziabili e continue, la formula di Taylor è utile per approssimare la funzione in un intorno di un punto. Data la funzione f(x) e x 0 un punto che appartiene all insieme di definizione della f, possiamo scrivere: f(x) = f(x 0 ) + f (x 0 )(x x 0 ) + (x x 0) 2 f (ξ x ) 2 dove ξ x è un punto che si trova nell insieme di definizione della f ed è compreso tra x e x 0. La formula appena scritta prende il nome di formula di Taylor di centro x 0 e permette di approssimare la funzione f(x) in un intorno di x 0 utlizzando i valori della funzione in x 0. Il polinomio T 1 (x) = f(x 0 ) + f (x 0 )(x x 0 ) è il polinomio di Taylor di primo grado. In questo caso rappresenta la retta tangente alla funzione f nel punto x 0. Se noi approssiamo f(x) mediante il polinomio di Taylor di primo grado, commettiamo un errore dato da R 1 (x) = (x x 0) 2 f (ξ x ), 2 che possiamo maggiorare, in valore assoluto, considerando M = max f (x) per x che varia nell insieme di definizione della f, ottenendo (x x 0) 2 f (ξ x ) M (x x 0) 2, un errore del 2 2 secondo ordine. In generale, il polinomio di Taylor di grado n è dato da T n (x) = f(x 0 ) + f (x 0 )(x x 0 ) + f (x 0 ) 2! (x x 0 ) 2 + f (3) (x 0 ) 3! (x x 0 ) f (n) (x 0 ) (x x 0 ) n n! Se approssimiamo f(x) con il polinomio di Taylor T n (x), l errore che si commette è di ordine n + 1, poichè vale R n (x) = f (n+1) (ξ x ) (x x 0 ) n+1. (n + 1)! Nel caso di funzioni di più variabili, il polinomio di Taylor deve considerare le derivate parziali della funzioni. Teorema Consideriamo una funzione f(x, y) di classe C 2. Allora per ogni punto P 0 nell insieme di definizione della f, vale la formula di Taylor data da f(x, y) = f(x 0, y 0 ) + f x (x 0, y 0 )(x x 0 ) + f y (x 0, y 0 )(y y 0 ) f xx(ξ x, η y )(x x 0 ) 2 + f xy (ξ x, η y )(x x 0 )(y y 0 ) f yy(ξ x, η y )(y y 0 ) 2 dove Q(ξ x, η y ) è un opportuno punto che si trova sul segmento di estremi P e P 0. Se approssimiamo la funzione f(x, y) con il polinomio di Taylor di primo grado dato da T 1 (x, y) = f(x 0, y 0 ) + f x (x 0, y 0 )(x x 0 ) + f y (x 0, y 0 )(y y 0 ) commettiamo un errore dato da R 1 (x) = 1 2 f xx(ξ x, η y )(x x 0 ) 2 + xy (ξ x, η y )(x x 0 )(y y 0 ) f yy(ξ x, η y )(y y 0 ) 2 che è un errore del secondo ordine (abbiamo infatti le potenze (x x 0 ) 2, (x x 0 )(y y 0 ), (y y 0 ) 2 ). Osserviamo che il polinomio di Taylor T 1 (x, y) altro non è che l equazione del piano tangente alla superficie della funzione f(x, y) nel punto (x 0, y 0, f(x 0, y 0 )). Se consideriamo il polinomio di Taylor di ordine zero per approssimare la funzione f(x, y), abbiamo il cosidetto teorema di Lagrange. 32

39 3.11. Formula di Taylor Teorema (di Lagrange) Data f : A R con A R 2, f di classe C 1, e dato P 0 (x 0, y 0 ) A, si ha f(x, y) = f(x 0, y 0 ) + f x (ξ x, η y )(x x 0 ) + f y (ξ x, η y )(y y 0 ) dove Q(ξ x, η y ) è un opportuno punto che si trova sul segmento di estremi P e P 0. 33

40

41 CAPITOLO 4 Massimi e minimi La maggior parte delle idee fondamentali della scienza sono essenzialmente semplici, e possono, come una regola, essere espresse in un linguaggio comprensibile a tutti. Albert Einstein ( ) 4.1 Forme quadratiche Massimi e minimi Ricerca di massimi e minimi relativi Sui massimi e minimi assoluti Funzioni implicite Equazione di una retta e vettore normale alla retta Curve di livello Significato del vettore gradiente Estremi vincolati e moltiplicatori di Lagrange Forme quadratiche Prima di passare a definire i massimi e minimi di una funzione di più variabili, ci conviene introdurre il concetto di forma quadratica perchè ci servirà per poter calcolare i massimi e i minimi. Nello spazio R 2, una forma quadratica è un polinomio omogeneo di secondo grado nelle variabili x e y. Ad esempio, F (x, y) = 3x 2 + 5xy + 2y 2 o F (x, y) = x xy 7y 2 sono forme quadratiche. Una forma quadratica si può scrivere utilizzando prodotti di matrici e vettori come F (x, y) = ( x y ) ( ) ( ) a 11 a 12 x a 21 a 22 y dove il vettore di componenti ( (x, y) ) è scritto prima come vettore riga e poi come vettore a11 a colonna. La matrice A = 12 è la matrice dei coefficienti della forma quadratica. a 21 a 22 Eseguendo il prodotto di A con il vettore colonna (x, y) otteniamo: ( ) ( ) ( ) a11 a 12 x a11 x + a = 12 y a 22 y a 21 x + a 22 y a 21 35

42 4. MASSIMI E MINIMI Dobbiamo poi moltiplicare il vettore riga (x, y) per il vettore colonna appena ottenuto (facendo un prodotto scalare tra vettori) ricavando: ( ) ( ) a x y 11 x + a 12 y = x(a a 21 x + a 22 y 11 x + a 12 y) + y(a 21 x + a 22 y) = a 11 x 2 + a 12 xy + a 21 xy + a 22 y 2 In definitiva, abbiamo F (x, y) = a 11 x 2 + (a 12 + a 21 )xy + a 22 y 2. La matrice dei coefficienti della forma quadratica si può scrivere come una matrice simmetrica (con a 12 = a 21 ). Se così non fosse, la si può rendere simmetrica prendendo come coefficiente di riga 1 e colonna 2 (e di riga 2 e colonna( 1) la semisomma ) dei valori a 12 e a 21 a12 + a 21 della matrice non simmetrica: vale infatti a 12 + a 21 = 2. 2 Esempio Es Sia F (x, y) = x xy 7y 2. Possiamo scrivere questa forma quadratica in forma matriciale ponendo A in forma non simmetrica: F (x, y) = ( x y ) ( ( ) 1 2 x 8 7) y oppure possiamo scrivere A in forma simmetrica prendendo come valore per gli elementi extra diagonali la semisomma dei corrispondenti elementi della matrice non simmetrica F (x, y) = ( x y ) ( ) ( ) 1 5 x 5 7 y In entrambi i casi, il risultato è sempre lo stesso, la forma quadratica F (x, y) = x 2 +10xy 7y 2. In generale, una forma quadratica in R 2 viene rappresentata utilizzando una matrice simmetrica nella forma F (x, y) = ( x y ) ( ( ) a b x b c) y da cui F (x, y) = ax 2 + 2bxy + cy 2. Nel caso dello spazio R n seguente. si generalizza la definizione di forma quadratica nel modo Definizione Una forma quadratica in R n è un polinomio omogeneo di secondo grado nelle n variabili x 1, x 2,..., x n, a coefficienti reali. Una forma quadratica si può scrivere come F (x 1, x 2,..., x n ) = n a ij x i x j i,j=1 In forma matriciale si può scrivere come a 11 a a 1n F (x 1, x 2,..., x n ) = ( x 1 ) a 21 a a 2n x 1 x 2... x n x a n1 a n2... a nn x n 36

43 4.1. Forme quadratiche Se la matrice della forma quadratica non è simmetrica la si può rendere simmetrica come abbiamo visto in R 2. Torniamo ora a considerare forme quadratiche in R 2 visto che lavoreremo soprattutto in questo spazio. Definizione Una forma quadratica F (x, y) si dice G definita positiva se, per ogni (x, y) (0, 0), F (x, y) > 0; G semidefinita positiva se, per ogni (x, y) (0, 0), F (x, y) 0; G definita negativa se, per ogni (x, y) (0, 0), F (x, y) < 0; G semidefinita negativa se, per ogni (x, y) (0, 0), F (x, y) 0; G indefinita se esistono almeno due punti (x 1, y 1 ) e (x 2, y 2 ) tali che F (x 1, y 1 ) > 0 e F (x 2, y 2 ) < 0. Come fare a capire se una forma quadratica è definita positiva, negativa o indefinita? Abbiamo il seguente teorema. Teorema Data la forma quadrata F (x, y) = ax 2 + 2bxy + cy 2 : G se det(a) = ac b 2 > 0 e a > 0 allora F (x, y) è definita positiva; G se det(a) = ac b 2 > 0 e a < 0 allora F (x, y) è definita negativa; G se det(a) = ac b 2 < 0 allora F (x, y) è indefinita. Vale anche il viceversa: G se F (x, y) è definita positiva allora det(a) = ac b 2 > 0 e a > 0; G se F (x, y) è definita negativa allora det(a) = ac b 2 > 0 e a < 0; G se F (x, y) è indefinita allora det(a) = ac b 2 < 0. Dimostrazione. Ricordiamo innanzitutto che det(a) rappresenta il determinante della matrice A che caratterizza la forma quadratica e che vale det(a) = ac b 2. Scriviamo ora la forma quadratica mettendo in evidenza il coefficiente a e aggiungendo e sottraendo b2 a 2 y2, otteniamo: F (x, y) = ax 2 + 2bxy + cy 2 = a (x ba xy + ca ) y2 = a (x 2 ba b2 + 2 xy + a 2 y2 b2 a 2 y2 + c ) a y2 Osserviamo che x b b2 xy + a a 2 y2 = (x + b a y)2. Inoltre b2 a 2 y2 + c a y2 = Abbiamo dunque F (x, y) = a ((x + ba ) ac y)2 b2 + a 2 y 2 ac b2 a 2 y 2. La forma quadratica è dunque data dal prodotto di a per la somma di due termini: il termine (x + b ac a y)2 b2 è il quadrato di un binomio ed è sempre positivo; il termine a 2 y 2 può essere positivo o negativo a seconda del segno di ac b 2. Se a > 0 e ac b 2 > 0 allora la forma quadratica è sempre maggiore di zero e quindi è definita positiva. Se a < 0 e ac b 2 > 0, la forma quadratica è definita negativa. Se invece ac b 2 < 0 possiamo avere valori di (x, y) per cui la forma quadratica è positiva e altri valori per cui la forma quadratica è negativa. 37

44 4. MASSIMI E MINIMI Viceversa, supponiamo che la F sia definita positiva, negativa o indefinita. Mettiamo in evidenza il termine y 2 nella forma quadratica. Si ha ( ) F (x, y) = y 2 a x2 y 2 + 2bx y + c Poniamo t = x y in modo da poter scrivere F (x, y) = y 2 (at 2 + 2bt + c) Supponiamo che la forma quadratica sia definita positiva: vuol dire che y 2 (at 2 + 2bt + c) > 0 per ogni coppia (x, y) (0, 0), quindi deve essere at 2 + 2bt + c > 0 per ogni t: questo si ha con a > 0 e con il discriminante dell equazione di secondo grado in t negativo, cioè 4b 2 4ac < 0, vale a dire ac b 2 > 0. Se invece la forma quadratica è definita negativa, vuol dire che at 2 + 2bt + c < 0 per ogni valore di t, quindi deve essere a < 0 e il discriminante negativo, quindi ancora ac b 2 > 0. Se invece la forma quadratica è indefinita, possiamo avere sia valori positivi che valori negativi, perciò il discriminante dell equazione di secondo grado in t deve essere positivo, cioè ac b 2 < 0. 1 Nel caso di forme quadratiche in R n, l analogo teorema per vedere se una forma quadratica è definita positiva, negativa o indefinita è dato dal teorema di Sylvester, che considera i determinanti di tutti i minori principali delle matrice A che definisce la forma quadratica. Definizione Data A matrice di n righe e n colonne, si definisce minore principale di ordine k e si indica con A k la matrice che si forma dalla matrice A prendendo le prime k righe e k colonne della matrice stessa. Quindi A 1 = (a 11 ), A 2 = ( ) a11 a 12, A a 21 a k = 22 a 11 a a 1k a 21 a a 2k a k1 a k2... a kk Teorema (di Sylvester) Data una forma quadratica in R n, F (x 1, x 2,..., x n ) = n i,j=1 a ijx i x j, allora G F è definita positiva se e solo se det(a k ) > 0 per ogni k = 1, 2,..., n; G F è definita negativa se e solo se ( 1) k det(a k ) > 0 per ogni k = 1, 2,..., n. 1 Per la seconda parte di questo teorema ci siamo rifatti alle note proprietà: G ax 2 + bx + c = 0 se = b 2 4ac < 0 non esistono radici reali all equazione; se = 0 le radici sono coincidenti x 1 = x 2 = b 2a ; se > 0 esistono due radici reali e distinte date da b ±. 2a G ax 2 + bx + c > 0, a > 0 se = b 2 4ac < 0 l insieme delle soluzioni che soddisfano la disequazione data è tutto R se = 0 l insieme delle soluzioni è tutto R privato della radice dell equazione ax 2 + bx + c = 0 se > 0 l insieme delle soluzioni è dato dai valori esterni all intervallo delle due radici dell equazione di secondo grado. G ax 2 + bx + c < 0, a > 0 se 0 non ci sono soluzioni per questa disequazione; se > 0 l insieme delle soluzioni è dato dai valori interni all intervallo delle due radici dell equazione. 38

45 4.2. Massimi e minimi 4.2 Massimi e minimi Per funzioni scalari, le derivate della funzione aiutano a capire e a trovare i suoi valori massimi e minimi e i punti in cui la funzione assume tali valori. Per funzioni di due variabili, sono di aiuto le derivate parziali. Definizione Sia data una funzione di due variabili f(x, y) definita in un sottoinsieme I R 2. G Se esiste un punto P 0 (x 0, y 0 ) tale che per ogni P (x, y) I, risulta f(x, y) f(x 0, y 0 ) allora P 0 si dice punto di massimo assoluto per la funzione f e il valore f(x 0, y 0 ) si dice massimo assoluto della funzione. G Se esiste un punto P 0 (x 0, y 0 ) tale che per ogni P (x, y) I, P P 0 risulta f(x, y) < f(x 0, y 0 ) allora P 0 si dice punto di massimo assoluto proprio per la funzione f e il valore f(x 0, y 0 ) si dice massimo assoluto proprio della funzione. Cambiando il segno alle diseguaglianze abbiamo la definizione di minimo assoluto e minimo assoluto proprio. G Se esiste un punto P 0 (x 0, y 0 ) tale che per ogni P (x, y) I, risulta f(x, y) f(x 0, y 0 ) allora P 0 si dice punto di minimo assoluto per la funzione f e il valore f(x 0, y 0 ) si dice minimo assoluto della funzione. G Se esiste un punto P 0 (x 0, y 0 ) tale che per ogni P (x, y) I, P P 0 risulta f(x, y) > f(x 0, y 0 ) allora P 0 si dice punto di minimo assoluto proprio per la funzione f e il valore f(x 0, y 0 ) si dice minimo assoluto proprio della funzione. Se queste definizioni valgono non in tutto l insieme di definizione della funzione f ma localmente, in un intorno di P 0, allora si ottengono le definizioni di punto di massimo (o minimo) relativo (o relativo proprio). Definizione Sia data una funzione di due variabili f(x, y) definita in un sottoinsieme I R 2. G Se esiste un punto P 0 (x 0, y 0 ) e un intorno di centro P 0 e opportuno raggio r tale che per ogni P (x, y) A r (P 0 ), risulta f(x, y) f(x 0, y 0 ) allora P 0 si dice punto di massimo relativo per la funzione f e il valore f(x 0, y 0 ) si dice massimo relativo della funzione. G Se esiste un punto P 0 (x 0, y 0 ) e un intorno di centro P 0 e opportuno raggio r tale che per ogni P (x, y) A r (P 0 ), P P 0, risulta f(x, y) < f(x 0, y 0 ) allora P 0 si dice punto di massimo relativo proprio per la funzione f e il valore f(x 0, y 0 ) si dice massimo relativo della funzione. 39

46 4. MASSIMI E MINIMI Cambiando il segno alle diseguaglianze abbiamo la definizione di minimo relativo e minimo relativo proprio. Definizione I valori massimo e minimo (assoluti o relativi) assunti dalla funzione si chiamano anche estremi (assoluti e relativi) della funzione. Un punto di estremo relativo interno all insieme di definizione della funzione f si chiama punto di estremo relativo interno. Teorema Se una funzione f : I R, con I R 2, I aperto, f C 1 (I), ammette un punto di massimo o minimo relativo interno nel punto P 0 (x 0, y 0 ) allora esistono le derivate parziali della f in P 0 e vale f x (P 0 ) = f y (P 0 ) = 0 Dimostrazione. Sia P 0 (x 0, y 0 ) un punto di massimo (o minimo) relativo interno. Poniamo g(x) = f(x, y 0 ). Come conseguenza la funzione g ammette in x = x 0 un punto di massimo (o minimo) relativo interno e, quindi, g (x 0 ) = 0. Ma g (x 0 ) = f x (x 0, y 0 ). Perciò vale f x (x 0, y 0 ) = 0. Allo stesso modo, posto h(y) = f(x 0, y), si ha che y 0 è punto di massimo (o minimo) relativo interno per la funzione h, da cui h (y 0 ) = 0. Ma h (y 0 ) = f y (x 0, y 0 ) e quindi f y (x 0, y 0 ) = 0. Perciò, se P 0 è un punto di estremo relativo interno per la funzione f, necessariamente il gradiente della f in P 0 è il vettore nullo: (f)(p 0 ) = (00). Non vale il viceversa, tuttavia se dobbiamo cercare i punti di massimo e minimo relativo interni all insieme di definizione di una funzione, dobbiamo analizzare quei punti che hanno il gradiente nullo perchè tra questi ci saranno i punti di massimo e minimo relativi. Se l insieme di definizione della funzione è un insieme aperto, i punti di massimo e minimo relativo sono tutti punti interni all insieme di definizione. Vale la seguente definizione. Definizione Un punto P 0 (x 0, y 0 ) tale che (f)(p 0 ) = (00) si dice punto critico (o stazionario) della funzione f. 4.3 Ricerca di massimi e minimi relativi Per capire se una funzione ha un punto di massimo o minimo relativo in un suo punto critico, viene in aiuto il cosiddetto test sulle derivate seconde. A tale scopo introduciamo la seguente definizione. Definizione Data una funzione f C 2 (I), con I R 2, I aperto, e dato un punto P 0 I, si definisce hessiano della f in P 0 il determinante H f (P 0 ) della matrice ( ) fxx (P 0 ) f xy (P 0 ) f xy (P 0 ) f yy (P 0 ) Poichè la funzione è di classe C 2, vale f xy = f yx. Quindi H f (P 0 ) = f xx(p 0 ) f xy (P 0 ) f xy (P 0 ) f yy (P 0 ) = f xx(p 0 )f yy (P 0 ) (f xy (P 0 )) 2 Teorema (Test sulle derivate seconde) Data una funzione f C 2 (I), con I R 2, I aperto, e dato P 0 punto critico per f, avente come hessiano H f (P 0 ) = f xx (P 0 )f yy (P 0 ) (f xy (P 0 )) 2, si ha: 40

47 4.3. Ricerca di massimi e minimi relativi G se H f (P 0 ) > 0 e f xx (P 0 ) > 0, allora P 0 è un punto di minimo relativo interno proprio e f(p 0 ) è un valore di minimo relativo; G se H f (P 0 ) > 0 e f xx (P 0 ) < 0, allora P 0 è un punto di massimo relativo interno proprio e f(p 0 ) è un valore di massimo relativo; G se H f (P 0 ) < 0 allora P 0 non è nè punto di massimo nè punto di minimo relativo e si chiama punto di sella. Osserviamo che se vale H f (P 0 ) = 0, P 0 può essere punto di minimo, massimo o di sella: bisogna indagare caso per caso. Dimostrazione. Per dimostrare questo teorema, applichiamo la formula di Taylor di centro P 0 alla funzione f: f(x, y) = f(x 0, y 0 ) + f x (x 0, y 0 )(x x 0 ) + f y (x 0, y 0 )(y y 0 ) f xx(ξ x, η y )(x x 0 ) 2 + f xy (ξ x, η y )(x x 0 )(y y 0 ) f yy(ξ x, η y )(y y 0 ) 2 Considerando x = x 0 + h e y = y 0 + k, poichè P 0 è un punto critico, la formula si riduce a f(x 0 + h, y 0 + k) = f(x 0, y 0 ) f xx(ξ x, η y )h 2 + f xy (ξ x, η y )hk f yy(ξ x, η y )k 2 = f(x 0, y 0 ) ( fxx (ξ x, η y )h 2 + 2f xy (ξ x, η y )hk + f yy (ξ x, η y )k 2) dove (ξ x, η y ) è un punto che non conosciamo, sul segmento di estremi P e P 0. In un opportuno intorno di P 0, per il teorema della permanenza del segno, se vale f xx (x 0, y 0 ) > 0 vale anche f xx (x, y) > 0 nell intorno di P 0. Alla stessa maniera, sempre per lo stesso teorema sulla permanenza del segno, se H f (P 0 ) > 0 anche H f (P ) > 0 nell intorno di P 0. Supponiamo, allora di trovarci nelle ipotesi in cui H f (P 0 ) > 0 e f xx (P 0 ) > 0. Allora la forma quadratica data da F 0 (h, k) = f xx (P 0 )h 2 + 2f xy (P 0 )hk + f yy (P 0 )k 2 ha il determinante della matrice ad essa associata che vale det(a) = f xx (P 0 )f yy (P 0 ) (f xy (P 0 )) 2 cioè det(a) = H f (P 0 ). Poichè per ipotesi, H f (P 0 ) > 0 e f xx (P 0 ) > 0, allora la forma quadratica è definita positiva. La stessa cosa vale per la forma quadratica definita in un opportuno intorno di P 0, considerando il punto (ξ x, η x ) della formula di Taylor: la forma quadratica data da F ξ,η (h, k) = f xx (ξ x, η y )h 2 +2f xy (ξ x, η y )hk +f yy (ξ x, η y )k 2 è una forma quadratica positiva, cioè F ξ,η (h, k) > 0. Riprendendo la formula di Taylor, in un intorno di P 0 risulta quindi da cui cioè f(x, y) = f(x 0, y 0 ) F ξ,η(h, k) f(x, y) f(x 0, y 0 ) = 1 2 F ξ,η(h, k) > 0 f(x, y) > f(x 0, y 0 ). Il punto P 0 è perciò un punto di minimo relativo proprio. Analogamente si provano gli altri due casi: se l hessiano in P 0 è positivo e f xx (P 0 ) < 0 allora la forma quadratica associata è definita negativa e, dalla formula di Taylor, risulta che P 0 è un punto di massimo relativo. Se invece l hessiano è negativo, la forma quadratica 41

48 4. MASSIMI E MINIMI Figura 4.1: Grafico della funzione f(x, y) = x 4 + y 4 4xy + 2. associata è indefinita e quindi P 0 non può essere nè di massimo nè di minimo, ma è un punto di sella. Esempio Es Calcolare i punti di massimo e minimo relativo e i corrispondenti valori di massimo e minimo della funzione f(x, y) = x 4 + y 4 4xy + 2. Calcoliamo i punti critici della funzione calcolando le derivate parziali prime e ponendole uguali a zero: { f x (x, y) = 4x 3 4y = 0 f y (x, y) = 4y 3 4x = 0 Dalla prima equazione abbiamo y = x 3 e sostituendo nella seconda equazione ricaviamo 0 = 4(x 9 x) = 4x(x 8 1) = 4x(x 4 1)(x 4 +1) = 4x(x 2 1)(x 2 +1)(x 4 +1) = 4x(x 1)(x+1)(x 2 +1)(x 4 +1) Le radici reali sono tre x = 0, x = 1, x = 1, che, insieme alla relazione y = x 3, ci danno i tre punti critici P 0 (0, 0), P 1 (1, 1) e P 2 ( 1, 1). Per ciascuno di questi punti critici applichiamo il teorema del test sulle derivate seconde. In questo caso le derivate parziali seconde sono: f xx = 12x 2, f xy = 4, f yy = 12y 2 Per il punto P 0 abbiamo H f (P 0 ) = 16 < 0, quindi possiamo dire subito che P 0 è un punto di sella. Per P 1 si ha H f (P 1 ) = 128 > 0, f xx (P 1 ) = 12 > 0, quindi P 1 è un punto di minimo relativo interno proprio con valore minimo f(p 1 ) = 0. Per P 2 vale H f (P 2 ) = 128 > 0, f xx (P 2 ) = 12 > 0, quindi P 2 è un altro punto di minimo relativo interno proprio con valore minimo f(p 2 ) = 0. In Figura 4.1 possiamo osservare come P 1 e P 2 siano punti di minimo mentre P 0 è un punto di sella. 42

49 4.4. Sui massimi e minimi assoluti Figura 4.2: Grafico della funzione f(x, y) = 2y 2. Esempio Es Consideriamo ora la funzione f(x, y) = 2y 2 e cerchiamo i punti di massimo e minimo relativo. Per i punti critici, imponiamo che il gradiente della funzione sia uguale a zero, quindi { f x = 0 f y = 4y = 0 La f x vale sempre zero perchè la f non dipende da x, Dalla seconda equazione ricaviamo y = 0, da cui i punti critici della funzione sono tutti i punti di coordinate (x, 0), cioè tutti i punti dell asse delle x. Andiamo a calcolare l Hessiano in questi punti. Poichè f xx = 0, f xy = 0, e f yy = 4, segue che H f (x, 0) = 0. Quindi il teorema sul test delle derivate seconde non ci può dire nulla. In tal caso, dobbiamo vedere come è fatta la funzione e cercare di capire cosa succede in un intorno di questi punti critici. Fissato x = x 0, per il punto (x 0, 0), in un suo qualunque intorno vale f(x, y) = 2y 2 0 = f(x 0, 0) (posso prendere anche un punto che ha y = 0 ma x x 0 ). Si conclude quindi che (x 0, 0) è un punto di minimo relativo. Questo vale per tutti i punti (x, 0), che sono, dunque, tutti punti di minimo relativo (non proprio). Si veda la Figura 4.2 per confrontare i risultati. 4.4 Sui massimi e minimi assoluti Per funzioni scalari, il teorema di Weierstrass assicura che se una funzione è continua in un intervallo chiuso e limitato allora essa ammette massimo e minimo (assoluti). Lo stesso teorema vale anche per funzioni di più variabili. Teorema (di Weierstrass) Data una funzione continua f : I R, con I R 2, I insieme chiuso e limitato (quindi compatto), la f ammette massimo e minimo (assoluti) in I. 43

50 4. MASSIMI E MINIMI Questo teorema è utile per trovare massimi e minimi assoluti di una funzione continua in un insieme compatto I. Si può applicare questo metodo: 1. si calcola il valore della f nei punti critici della f che si trovano all interno di I; 2. si studia la funzione sulla frontiera di I e si cercano i valori estremi della f sulla frontiera; 3. il più grande dei valori trovati ai passi 1 e 2 rappresenta il valore assoluto massimo della funzione; il più piccolo dei valori trovati rappresenta il valore minimo assoluto della funzione. I corrispondenti punti sono rispettivamente i punti di massimo e minimo assoluti della funzione. Osserviamo, quindi, che la procedura per trovare i valori estremi assoluti di una funzione, in un insieme compatto, è diversa dalla procedura per trovare gli estremi relativi di una funzione mediante il test delle derivate seconde. A volte, si cercano sia gli estremi assoluti sia gli estremi relativi di una funzione e, in questo caso, vanno seguite entrambe le strade. Esempio Es Si devono trovare gli estremi assoluti della funzione f(x, y) = x 2 4xy + 4y sul rettangolo D = {(x, y) : 0 x 2, 0 y 4}. L insieme D è un insieme chiuso e limitato (il rettangolo di vertici A(0, 0), B(2, 0), C(2, 4), D(0, 4)), la funzione è polinomiale, perciò continua. Ci troviamo nelle ipotesi del teorema di Weierstrass, quindi esistono il massimo e il minimo assoluti della funzione in D. Cerchiamo i punti critici interni: da f x = 2x 4y e f y = 4x + 4, ponendo queste derivate uguali a zero abbiamo il sistema di equazioni { 2x 4y = 0 4 4x = 0 Dalla seconda equazione ricaviamo x = 1, da cui, nella prima, 4y = 2, cioè y = 1 2. Otteniamo il punto critico P 0 (1, 1 2 ). Il punto P 0 si trova all interno dell insieme D (se così non fosse non lo dovremmo prendere in considerazione). Calcoliamo f(p 0 ) = 1. Non dobbiamo vedere se questo è un punto di massimo o minimo relativo (non è richiesto), quindi passiamo a vedere cosa succede alla funzione sulla frontiera (se invece dovessimo calcolare anche gli estremi relativi, a questo punto dovremmo applicare il test della derivata seconda). La frontiera dell insieme I è dato dall unione dei segmenti AB, BC, CD e DA. Il segmento AB ha equazione y = 0 con 0 x 2. Su questo segmento la funzione f si riduce ad una funzione della sola variabile x, g(x) = f(x, 0) = x 2, con 0 x 2. Si vede facilmente (poichè g (x) = 2x 0 nell intervallo dato) che la g è una funzione crescente in [0, 2]: il suo valore minimo si ha per x = 0 (g(0) = 0) e il suo valore massimo per x = 2 (g(2) = 4). Quindi dal segmento AB dobbiamo ricordare i punti A e B dove la funzione vale 0 e 4 rispettivamente. Il segmento BC ha equazione x = 2 con 0 y 4. Qui la funzione si riduce a h(y) = f(2, y) = 4 8y +4y = 4 4y nell intervallo [0, 4]. La funzione è decrescente (h (y) = 4 < 0), quindi assume valore massimo in 0 (h(0) = 4) e minimo in 4 (h(4) = 12). Per y = 0 ritroviamo il punto B, per y = 4 troviamo il vertice C. Sul segmento CD, di equazione y = 4, con 0 x 2, la funzione diventa g(x) = f(x, 4) = x 2 16x + 16 per x [0, 2]. La derivata g (x) = 2x 16 si annulla per x = 8 che è un punto all esterno dell intervallo in cui deve variare la x (se fosse all interno avremmo trovato un punto critico da considerare ai fini del calcolo degli estremi della f). Si ha g (x) < 0 per 2x 16 < 0 cioè x < 8: quindi nell intervallo [0, 2] la g è decrescente e assume valore massimo in 0 (g(0) = 16) e valore minimo in 2 (g(2) = 12). Per x = 0 abbiamo il vertice D, per x = 2 ritroviamo C. 44

51 4.5. Funzioni implicite Figura 4.3: Grafico della funzione f(x, y) = x 2 4xy + 4y nell insieme compatto [0, 2] [0, 4]. Arriviamo infine al segmento AD dato dall equazione x = 0, per 0 y 4. La funzione diventa h(y) = f(0, y) = 4y. La funzione è crescente e assume valore minimo e massimo rispettivamente agli estremi 0 e 4. Ritroviamo i punti A e D. Quindi i valori da confrontare sono: P 1 (1, 1 2 ) dove f(p 1) = 1, A dove f(a) = 0, B con f(b) = 4, C dove f(c) = 12, e D con f(d) = 16. Dal confronto segue che il massimo assoluto vale 16 e punto di massimo assoluto è D, mentre il minimo assoluto è 12 con punto di minimo assoluto C. 4.5 Funzioni implicite Nello studiare funzioni scalari, abbiamo visto funzioni del tipo y = f(x): la variabile y è funzione esplicita della variabile y: y = sin (x), y = x 3 + 2, y = ln x + 4, Ma ci sono anche funzioni che sono definite implicitamente da una relazione tra x e y come, ad esempio, x 2 + y 2 = 9 o x 3 + y 3 = 12xy o xye xy2 + 3ye x = 0 o... In alcuni casi è possibile risolvere questo tipo di equazioni scrivendo y come una funzione esplicita (o più funzioni esplicite) di x. Nel caso di x 2 + y 2 = 9, si ottiene y = ± 9 x 2, quindi due troviamo due funzioni f(x) = 9 x2 e g(x) = 9 x 2. I grafici della f e della g sono rispettivamente il semicerchio superiore e inferiore della circonferenza x 2 + y 2 = 9 e, insieme, ci danno il grafico di tutta la circonferenza. Non è altrettanto facile trovare un espressione esplicita di y come funzione di x nel caso di x 3 + y 3 = 12xy: potremmo usare la formula per trovare le radici di un polinomio di terzo 45

52 4. MASSIMI E MINIMI grado (supponendo x costante). Ma le formule sono talmente complicate che non le scriviamo neanche! Ci accontentiamo di sapere che è possibile risolvere il problema. Per la funzione xye xy2 + 3ye x = 0 non riusciamo a trovare una formula esplicita che ci permetta di scrivere y in funzione di x o viceversa x come funzione di y. Si ha quindi questo problema: data un equazione f(x, y) = 0 è possibile scrivere y = g(x) tale che f(x, g(x)) = 0? In tal caso diremo che la y = g(x) è definita implicitamente dalla f. Si ha la seguente definizione. Definizione Data una funzione f(x, y) definita in un sottoinsieme di R 2, diciamo che la funzione y = g(x) definita in un intervallo di R è definita implicitamente dall equazione f(x, y) = 0 se, per ogni x che appartiene all intervallo di definizione della g, si ha che G il punto (x, g(x)) appartiene all insieme di definizione della f; G f(x, g(x)) = 0. Dire f(x, y) = 0 vuol dire intersecare il grafico della superficie della funzione f con il piano z = 0, cioè con il piano xy, ricavandone quindi una curva. Per tutti quei punti per cui (x, g(x)) I e f(x, g(x)) = 0 il grafico della g coincide con il grafico della curva f(x, y) = 0. Per capire se esiste una funzione g definita implicitamente dalla f e se è unica, si ha il seguente teorema. Teorema (delle funzioni implicite o teorema di Dini) Sia data una funzione f : I R con I R 2, I aperto, f C 1 (I). Sia P 0 (x 0, y 0 ) I tale che f(x 0, y 0 ) = 0 e f y (x 0, y 0 ) 0. Allora esiste un unica funzione y = g(x) definita in un opportuno intorno di x 0 (]x 0 ɛ, x 0 + ɛ[), di classe C 1, tale che, per ogni x ]x 0 ɛ, x 0 + ɛ[ risulta G y 0 = g(x 0 ) G (x, g(x)) I G f(x, g(x)) = 0 G g (x) = f x(x, g(x)) f y (x, g(x)). La formula della derivata prima di g si ottiene applicando le regole di derivazione per le funzioni composte. Poichè f y (x 0, y 0 ) 0, per il teorema della permanenza del segno si ha f y (x, g(x)) 0 in un intorno di (x 0, y 0 ). Deriviamo ambo i membri dell equazione f(x, g(x)) = 0 rispetto alla variabile x (è come se avessimo x = t, y = g(x) = g(t) ma continuiamo a chiamare la variabile t con x). Abbiamo df dx = 0 Ma (considerando che dx dx = 1) Dunque df dx = f x(x, g(x)) + f y (x, g(x))g (x). f x (x, g(x)) + f y (x, g(x))g (x) = 0 Poichè, per l ipotesi f y (x 0, y 0 ) 0 (quindi anche f y (x, g(x)) 0) possiamo dividere tutto per f y ricavando g (x) = f x(x, g(x)) f y (x, g(x)) Osserviamo che il teorema di Dini dà una condizione sufficiente ma non necessaria per l esistenza e unicità delle funzioni implicite. 46

53 4.5. Funzioni implicite Come conseguenza del teorema, possiamo ricavare l equazione della retta tangente alla funzione y = g(x) definita implicitamente dalla f nel punto x 0. Infatti l equazione della retta tangente in x 0 per la funzione g è data da y g(x 0 ) = g (x 0 )(x x 0 ) cioè y y 0 = f x(x 0, y 0 ) f y (x 0, y 0 ) (x x 0) Moltiplicando ambo i membri per f y (x 0, y 0 ) troviamo f y (x 0, y 0 )(y y 0 ) = f x (x 0, y 0 )(x x 0 ) da cui f x (x 0, y 0 )(x x 0 ) + f y (x 0, y 0 )(y y 0 ) = 0 Quest ultima relazione dice che il gradiente della f in (x 0, y 0 ) è ortogonale alla retta tangente alla curva f(x, y) = 0 in P Equazione di una retta e vettore normale alla retta Facciamo un breve richiamo di geometria analitica per comprendere meglio che la relazione f x (x 0, y 0 )(x x 0 ) + f y (x 0, y 0 )(y y 0 ) = 0 scritta prima significa dire che il gradiente della f in (x 0, y 0 ) è ortogonale alla retta tangente a f(x, y) = 0 in P 0. Sia assegnata una retta nello spazio R 2 e sia P 0 = (x 0, y 0 ) un punto che giace sulla retta. Sia n = (a, b) (n sta per normale) un vettore ortogonale (normale, perpendicolare) alla retta: il vettore è detto vettore normale. Sia dato un altro generico punto P = (x, y) sulla retta. Indichiamo con r e r 0 i vettori che ci indicano i due punti P e P 0 rispettivamente (si veda figura 4.4). Il segmento P P 0 è dato dal vettore r r 0. Figura 4.4: retta nel piano Ora, poichè n è ortogonale alla retta, esso è ortogonale al vettore r r 0, cioè il prodotto scalare tra i due vettori è nullo: n ( r r 0 ) = 0 Poichè r r 0 = (x x 0, y y 0 ), il prodotto scalare diventa a(x x 0 ) + b(y y 0 ) = 0 47

54 4. MASSIMI E MINIMI Questa che abbiamo scritto rappresenta l equazione della retta passante 2 per P e P 0. Quindi, data l equazione di una retta nella forma a(x x 0 ) + b(y y 0 ) = 0 il vettore che ha come componenti i due coefficienti a e b, rappresenta il vettore normale alla retta: n = (a, b). 3 Riprendendo la retta f x (x 0, y 0 )(x x 0 ) + f y (x 0, y 0 )(y y 0 ) = 0, questa retta rappresenta la retta tangente a y = g(x) nel punto x 0. Poichè il grafico della g coincide con il grafico della curva f(x, y) = 0 nell intorno di x 0, vuole dire che la retta è tangente alla curva f(x, g(x)) = 0 in (x 0, y 0 ). Il gradiente della f in (x 0, y 0 ) è dunque ortogonale alla tangente a questa curva. Dallo studio di g e, eventualmente di g (che si ottiene applicando nuovamente la formula di derivazione delle funzioni composte) possiamo ottenere informazioni sulla funzione g e, quindi, anche su f(x, y) = 0 nell intorno di un punto (x 0, y 0 ). Lo vediamo con un esempio. Esempio Es Sia data la funzione f(x, y) = xe 4y + 3y 1. Si vuol vedere se nel punto P 0 (x 0, y 0 ) = (0, 1 ) sono verificate le ipotesi del teorema di Dini e, in caso affermativo, 3 se la funzione y = g(x) definita implicitamente da f(x, y) = 0 è una funzione crescente o decrescente, concava o convessa in un intorno di x 0. Calcoliamo f(0, 1 3 ) = = 0. Inoltre f y(x, y) = 4xe 4y + 3 e f y (0, 1 3 ) = 3 0. L altra derivata parziale è f x = e 4y. Le derivate parziali sono continue, quindi f C 1. Siamo nelle ipotesi del teorema di Dini, quindi esiste un unica funzione y = g(x) definita in un intorno di x 0 = 0 tale che (x, g(x)) appartiente all insieme di definizione della f, f(x, g(x)) = 0 e g (x) = f x(x, g(x)) f y (x, g(x)). Per vedere se la funzione è crescente o decrescente, calcoliamo g (0). Poichè f x (0, 1 3 ) = e4/3 e f y (0, 1 3 ) = 3, risulta g (0) = e4/3 < 0. Quindi la g è decrescente in un intorno di 0. 3 Per calcolare g (0) (e capire quindi se la g è convessa o concava) torniamo all equazione f x (x, g(x)) + f y (x, g(x))g (x) = 0 e deriviamo ancora rispetto a x, ottenendo f xx (x, g(x))+f xy (x, g(x))g (x)+f yx (x, g(x))g (x)+f yy (x, g(x))(g (x)) 2 +f y (x, g(x))g (x) = 0 Nelle ipotesi (verificate in questo esempio) di derivate parziali seconde continue, vale f xy = f yx. Inoltre, f y (x, g(x)) 0 quindi g (x) = f xx(x, g(x)) + 2f xy (x, g(x))g (x) + f yy (x, g(x))(g (x)) 2 f y (x, g(x)) 2 Spesso troviamo l equazione scritta nella forma o ancora ax + by = d dove d = ax 0 + by 0 y = mx + d dove m = a b, d = a b x 0 + y 0 3 n = ( m, 1), se usiamo la rappresentazione della retta mediante y = mx + d. 48

55 4.6. Curve di livello Adesso possiamo calcolare g (0). Abbiamo f xx = 0, f xy = 4e 4y, f yy = 16xe 4y, da cui f xx (P 0 ) = 0, f xy (P 0 ) = 4e 4/3, f yy = 0, quindi 8e 4/3 ( e4/3 g (0) = 3 ) > 0 3 La funzione è convessa in un intorno di 0. Osserviamo che, se f(x 0, y 0 ) = 0 e f y (x 0, y 0 ) = 0, non possiamo applicare il teorema di Dini. Tuttavia, se, oltre a f(x 0, y 0 ) = 0, si ha f x (x 0, y 0 ) 0, si può applicare il teorema di Dini, scambiando il ruolo di x e y. Si ha la seguente formulazione Teorema (di Dini, scambiando il ruolo di x e y) Sia data una funzione f : I R con I R 2, I aperto, f C 1 (I). Sia P 0 (x 0, y 0 ) I tale che f(x 0, y 0 ) = 0 e f x (x 0, y 0 ) 0. Allora esiste un unica funzione x = h(y) definita in un opportuno intorno di y 0 (]y 0 ɛ, y 0 + ɛ[), di classe C 1, tale che, per ogni y ]y 0 ɛ, y 0 + ɛ[ risulta G x 0 = h(y 0 ) G (h(y), y) I G f(h(y), y) = 0 G h (y) = f y(h(y), y) f x (h(y), y). Possiamo lavorare sulla funzione h così come abbiamo fatto per la funzione g per calcolare l equazione della retta tangente o la sua derivata seconda. 4.6 Curve di livello Un metodo per visualizzare una funzione di due variabili è quello usato per disegnare le mappe geografiche, dove i punti che hanno la stessa altezza sono uniti insieme in modo da formare le cosiddette curve di livello o linee isometriche (contour lines). Definizione Si definiscono curve di livello di una funzione f di due variabili, tutte le curve di equazioni f(x, y) = c con c costante che appartiene all insieme dei valori della f. La curva di livello f(x, y) = c è quindi l insieme di tutti i punti del dominio della f in cui la funzione assume il valore assegnato c. Mostra, quindi, dove il grafico della f ha altezza c. In Figura 4.5 troviamo un esempio di applicazione delle curve di livello per rappresentare la temperatura in Europa. Ciascuna curva rappresenta un valore diverso di temperatura. Per funzioni matematiche, un esempio di curve di livello si vede in Figura 4.6 dove, a sinistra, vi è la superficie data da z = x 2 + y 2 mentre, a destra, sono rappresentate le sue curve di livello. Proposizione Dato un valore c e P 0 = (x 0, y 0 ) tale che f(x 0, y 0 ) = c nell ipotesi che P 0 non sia critico per la f, allora il gradiente (f)(p 0 ) è ortogonale alla curva di livello f(x, y) = c in P 0. Dimostrazione. Per la dimostrazione, ci riconduciamo al teorema di Dini delle funzioni implicite, considerando F (x, y) = f(x, y) c. Per ipotesi P 0 non è punto critico, quindi almeno una delle due derivate parziali è non nulla in P 0. Consideriamo il caso in cui f y (x 0, y 0 ) 0. Allora F (x 0, y 0 ) = 0, mentre F y (x, y) = f y (x, y) da cui F y (x 0, y 0 ) = f y (x 0, y 0 ) 49

56 4. MASSIMI E MINIMI Figura 4.5: Curve di livello nelle mappe di meteorologia. Figura 4.6: Superficie f(x, y) = x 2 + y 2 (a sinistra) e le sue curve di livello (a destra). Essendo soddisfatte le ipotesi del teorema di Dini, esiste un unica funzione definita implicitamente dalla F, y = g(x). Allora l equazione della retta tangente alla F in P 0 ha equazione F x (x 0, y 0 )(x x 0 ) + F y (x 0, y 0 )(y y 0 ) = 0 Con lo stesso ragionamento fatto prima F x (x, y) = f x (x, y) da cui ricaviamo f x (x 0, y 0 )(x x 0 ) + f y (x 0, y 0 )(y y 0 ) = 0 Quindi il vettore f(p 0 ) è un vettore perpendicolare (normale) alla retta tangente alla curva f(x, y) = c nel punto P Significato del vettore gradiente Consideriamo una funzione f differenziabile. Da quanto abbiamo appena visto, il vettore gradiente nel punto P 0 (x 0, y 0 ), f(p 0 ), è perpendicolare alla retta tangente alla curva f(x, y) = 50

57 4.6. Curve di livello Figura 4.7: Sul prodotto scalare. c che passa per P 0. Più brevemente, possiamo dire che è perpendicolare alla curva di livello. Il vettore gradiente fornisce anche informazioni sulla direzione di massima crescita della funzione f. Infatti, dal momento che la derivata direzionale dice la velocità di cambiamento della f in quella direzione, noi possiamo calcolare la derivata direzionale della f in P 0 lungo tutte le possibili direzioni e vedere qual è il valore massimo e per quale direzione si ottiene. Per la formula del gradiente, si ha (considerando v vettore unitario) f(p 0 ) v = f(p 0 ) v = f(p 0 ) v cos θ = f(p 0 ) cos θ dove θ è l angolo individuato dai vettori f(p 0 ) e v. Osserviamo che il prodotto scalare scritto in questa maniera è del tutto equivalente alla formula che abbiamo dato utilizzando le componenti dei vettori. 4 Poichè il massimo valore di cos θ è 1 e questo si ha quando θ = 0, vuol dire che il valore massimo della derivata direzionale f(p 0) vale f(p v 0 ) e si ha quando θ = 0 cioè quando v ha la stessa direzione di f(p 0 ). 4 Proviamo che, dati due vettori a = (a 1, a 2 ) e b = (b 1, b 2 ), il prodotto scalare a b = a 1 b 1 + a 2 b 2 si può scrivere, in modo del tutto equivalente come a b = a b cos θ con θ l angolo individuato dai due vettori a e b. A tal proposito ricordiamo il teorema di Carnot (o del coseno) per cui dato un triangolo qualsiasi e dati due lati (che scriviamo come vettori) a e b che formano un angolo θ, per il terzo lato c vale c 2 = a 2 + b 2 2 a b cos θ dove a, b, c sono i moduli dei tre vettori (cioè le lunghezze dei lati del triangolo). Se consideriamo il vettore a + b, applicando sia la regola del parallelogramma sia il teorema di Carnot, tenendo conto che adesso l angolo compreso tra i due lati è π θ (si veda Figura 4.7) e che cos (π θ) = cos θ, si ha a + b 2 = a 2 + b 2 2 a b cos (π θ) = a 2 + b a b cos θ Da questa relazione ricaviamo a b cos θ = 1 a + b 2 a 2 b 2 2 Scrivendo in modo esplicito i moduli dei vettori, a+ b 2 = (a 1 +b 1 ) 2 +(a 2 +b 2 ) 2, a 2 = (a 1 ) 2 +(a 2 ) 2 e b 2 = (b 1 ) 2 +(b 2 ) 2, e sostituendo, si ha proprio a b cos θ = a 1 b 1 + a 2 b 2 Quindi il prodotto scalare può essere scritto sia in un modo che nell altro. 51

58 4. MASSIMI E MINIMI 4.7 Estremi vincolati e moltiplicatori di Lagrange In molti problemi che discendono da applicazioni pratiche, si cerca il massimo o il minimo di una funzione soggetta ad una particolare condizione che viene chiamata vincolo. Si dice, allora, che si cercano gli estremi vincolati. Esempio Es Si deve costruire una scatola di cartone, priva di coperchio, utilizzando 12m 2 (metri quadrati) di cartone. Si vuole costruire una scatola con il massimo volume possibile. Il volume della scatola è dato da V = xyz (dove x, y, e z rappresentano lunghezza, larghezza e altezza della scatola). La superficie della scatola (che non ha coperchio) è data da 2xz + 2yz + xy = 12 (12 dai 12m 2 di cartone a disposizione). La superficie rappresenta il vincolo per la funzione volume di cui vogliamo calcolare il massimo. Questo esempio può essere risolto in modo semplice andando a scrivere z in funzione di x e y dalla relazione 2xz + 2yz + xy = 12: z = 12 xy 2(x + y) La funzione V diventa una funzione di due variabili 12 xy V = xyz = xy 2(x + y) = 12xy x2 y 2 2(x + y) Cerchiamo, di questa funzione, gli estremi relativi e tra questi vediamo se c è una soluzione fisicamente accettabile (x e y rappresentano delle lunghezze e devono essere positive). Troveremo (lo si faccia per esercizio) che V ha il suo valore massimo per x = y = 2, da cui z = 1. Tuttavia, questa strada non è sempre percorribile. Perciò vediamo cosa si deve fare, in generale, quando si cercano punti di massimo o minimo di una funzione soggetta a un vincolo. Vediamo il caso in cui dobbiamo cercare i valori estremi di una funzione f(x, y) soggetta al vincolo espresso dall equazione g(x, y) = c. In maniera del tutto equivalente, possiamo dire che dobbiamo cercare i valori estremi della f(x, y) quando il punto (x, y) deve appartenere alla curva di livello g(x, y) = c. In Figura 4.8 vediamo la curva g(x, y) = c e delle curve di livello della funzione f(x, y). Queste curve di livello hanno equazione f(x, y) = k con k = 7, 8, 9, 10, 11. Se vogliamo cercare il massimo della f(x, y) soggetta al vincolo g(x, y) = c, dobbiamo cercare il più grande valore di k tale che la curva di livello f(x, y) = k interseca g(x, y) = c. Dalla Figura, si può vedere che questo accade quando le due curve si toccano appena l una con l altra, cioè quando hanno in comune una retta tangente. Ciò significa che le normali alle rette tangenti sia a g(x, y) = c sia a f(x, y) = k, nel punto (x 0, y 0 ), che è il punto in cui g(x, y) = c e f(x, y) = k si incontrano, sono identiche. Ricordando che il vettore normale alla retta tangente ad una funzione f(x, y) è il gradiente della f, vuol dire che f(x 0, y 0 ) e g(x 0, y 0 ) sono vettori paralleli, cioè le loro componenti differiscono di una costante. Seguiremo questo approccio per il metodo dei moltiplicatori di Lagrange. Teorema Data una funzione f C 1 (I), con I R 2 aperto, condizione necessaria affinchè P 0 (x 0, y 0 ) I sia un punto di massimo o minimo relativo della f soggetta al vincolo g(x, y) = c è che G g(x 0, y 0 ) = c 52

59 4.7. Estremi vincolati e moltiplicatori di Lagrange Figura 4.8: Sul prodotto scalare. G la matrice ( fx (P 0 ) ) f y (P 0 ) g x (P 0 ) g y (P 0 ) abbia determinante nullo: f x (P 0 )g y (P 0 ) g x (P 0 )f y (P 0 ) = 0 Proposizione Se P 0 (x 0, y 0 ) è un estremo vincolato della funzione f soggetta al vincolo g(x, y) = c e se P 0 è punto interno all insieme di definizione della f e non è punto critico nè per la f nè per la g, allora g(x, y) = c e f(x, y) = f(x 0, y 0 ) hanno in P 0 la stessa retta tangente. Dimostrazione. Se scriviamo le equazioni delle rette tangenti a f(x, y) = f(x 0, y 0 ) e alla curva g(x, y) = c nel punto P 0, abbiamo f x (P 0 )(x x 0 ) + f y (P 0 )(y y 0 ) = 0 e g x (P 0 )(x x 0 ) + g y (P 0 )(y y 0 ) = 0. Poichè P 0 è un estemo vincolato, vale la condizione f x (P 0 )g y (P 0 ) g x (P 0 )f y (P 0 ) = 0, ma questa relazione rappresenta una condizione di parallelismo tra le due rette tangenti. 5 Il vincolo si può anche rappresentare come una funzione Φ(x, y) = 0 (caso particolare: Φ(x, y) = g(x, y) c). Il teorema si riscrive in maniera del tutto analoga. La matrice ( ) fx (P 0 ) f y (P 0 ) g x (P 0 ) g y (P 0 ) prende il nome di matrice jacobiana della f e della g. Vale infatti la seguente definizione. Definizione Date le due funzioni f 1 (x, y) e f 2 (x, y) si definisce matrice jacobiana, la matrice f 1 f 1 (f 1, f 2 ) = x y (x, y) f 2 x f 2 y Si definisce jacobiano, il determinante della matrice jacobiana. Osserviamo che il teorema che abbiamo enunciato prima è un teorema che ci dà una condizione necessaria ma non sufficiente. 5 Ricordiamo che, date due rette ax + by + c = 0 e a x + b y + c = 0 la condizione di parallelismo è a a = b b ovvero ab a b = 0. 53

60 4. MASSIMI E MINIMI Figura 4.9: Curve di livello della funzione f(x, y) = x 2 + 4y 2 e il vincolo x 2 + y 2 = 1. Il metodo dei moltiplicatori di Lagrange ci permette di trovare gli estremi di una funzione f(x, y) soggetta al vincolo Φ(x, y) = 0 (sempre che il problema ammetta soluzione). Per applicare questo metodo deve essere Φ(x, y) 0. Abbiamo detto che, se P 0 è un punto di estremo vincolato, il gradiente della f e della funzione di vincolo sono tra loro paralleli, cioè le componenti dei due vettori gradiente differiscono per una costante. Introduciamo questa costante mediante la variabile λ detta moltiplicatore di Lagrange: vuol dire che f x (x 0, y 0 ) = λφ x (x 0, y 0 ) e f y (x 0, y 0 ) = λφ y (x 0, y 0 ). Ora, per capire chi possa essere (x 0, y 0 ), definiamo la funzione H(x, y, λ) = f(x, y)+λφ(x, y), che dipende dalle variabili x, y e λ. Il metodo dei moltiplicatori di Lagrange consiste dei seguenti passi: 1. risolviamo il sistema di equazioni dato da H(x, y, λ) = 0 vale a dire: f x (x, y) + λφ x (x, y) = 0 f y (x, y) + λφ y (x, y) = 0 Φ(x, y) = 0 (a meno del segno ritroviamo la condizione di parallelismo detta prima); 2. valutiamo la funzione f nella/e soluzione/i trovate e identifichiamo i valori di massimo e minimo, (se esistono). Esempio Es Si devono cercare i valori estremi della funzione f(x, y) = x 2 + 4y 2 sul cerchio x 2 + y 2 = 1. In questo caso il vincolo è dato dall equazione della circonferenza. Applichiamo il metodo dei moltiplicatori di Lagrange, introducendo la funzione H(x, y, λ) = x 2 +4y 2 +λ(x 2 +y 2 1) 54

61 4.7. Estremi vincolati e moltiplicatori di Lagrange Il sistema da risolvere è 2x + 2λx = 0 8y + 2λy = 0 x 2 + y 2 = 1 Dalla prima equazione ricaviamo x = 0 e λ = 1 mentre dalla seconda otteniano y = 0 e λ = 4. Sostituendo x = 0 nella terza equazione (il vincolo) abbiamo y 2 = 1 da cui y = ±1. Sostituendo y = 0 nel vincolo ricaviamo x = ±1. Il valore di λ non ci interessa perchè abbiamo trovato tutti i punti (x, y) che verificano il sistema di equazioni. Abbiamo P 0 (0, 1), P 1 (0, 1), P 2 (1, 0) e P 3 ( 1, 0). Calcoliamo la f in questi punti: f(p 0 ) = f(p 1 ) = 4, f(p 2 ) = f(p 3 ) = 1. Il valore massimo sul vincolo è dato da 4, nei punti P 0 e P 1. Il valore minimo sul vincolo è dato da 1 nei punti P 2 e P 3. Controllando la Figura 4.9 dove ci sono le curve di livello della f e la circonferenza, si può vedere come i valori trovati applicando il metodo dei moltiplicatori di Lagrange siano effettivamente quelli che corrispondono a punti di massimo e minimo della f sul vincolo, in quanto le rette tangenti alla curva di livello e alla circonferenza, nei punti trovati, coincidono. 55

62

63 CAPITOLO 5 Le curve A quelli che non conoscono la matematica è difficile percepire, come una sensazione reale, la bellezza, la profonda bellezza della Natura. Se volete conoscere la Natura, apprezzarla, è necessario comprendere il linguaggio che essa parla. Richard Phillips Feynman ( ) 5.1 Equazioni parametriche di una curva Grafico di una curva parametrica Parametrizzare una curva Tangente ad una curva Lunghezza di un arco di funzione Lunghezza di una curva La curva cicloide Sistema di coordinate polari Curve in coordinate polari La curva cardioide Lunghezza di una curva polare Lunghezze di alcune curve Funzioni a valori vettoriali Le curve riviste come funzioni vettoriali Retta tangente ad una curva Curve orientate Di nuovo sulla lunghezza di una curva L ascissa curvilinea Equazioni parametriche di una curva Supponiamo che una particella si muova lungo una curva γ come quella mostrata in Figura 5.1. Non riusciamo a descrivere la curva mediante un equazione della forma y = f(x) (cioè attraverso il grafico di una funzione) perchè ci sono diverse rette verticali che intersecano la curva più di una volta (mentre per una funzione del tipo y = f(x), ad ogni valore di 57

64 5. LE CURVE Figura 5.1: Una particella che si muove su una curva γ. x deve corrispondere un solo valore f(x)). Tuttavia, possiamo pensare alle coordinate (x, y) della particella che si muove lungo la curva come funzioni del tempo t in modo da poter scrivere x = f(t) e y = g(t). Questa coppia di funzioni ci permette di descrivere la curva e di dare la definizione di curva sotto forma di equazioni parametriche. Definizione Se x e y sono entrambe funzioni di una terza variabile t (t è detto parametro), le equazioni x = f(t), y = g(t) sono dette equazioni parametriche. Ogni valore di t determina un punto (x, y): al variare di t varia il punto (x, y) che, sul piano cartesiano, descrive una curva γ, che chiamiamo curva parametrica. Il parametro t non rappresenta necessariamente il tempo e quindi si può anche utilizzare un altra lettera per rappresentare il parametro. Poichè, in molte applicazioni, t denota il tempo, ci è più facile vedere (x, y) = (f(t), g(t)) come la posizione della particella al tempo t. Esempio Es Proviamo a fare il grafico per capire quale curva è rappresentata mediante le equazioni parametriche { x = t 2 + t y = 2t 1 Ciascun valore di t dà un punto della curva. Perciò consideriamo diversi valori di t e i corrispondenti punti che si ottengono: t x y /2-1/ In Figura 5.2 abbiamo messo su un piano cartesiano i punti (x, y) che si ottengono per molti valori del parametro t e li abbiamo uniti in modo da ottenere il grafico di una curva. 58

65 5.1. Equazioni parametriche di una curva Figura 5.2: Curva data da x = t 2 + t, y = 2t 1 Osserviamo che una particella, la cui posizione è data dalle equazioni parametriche x = f(t), y = g(t), si muove lungo la curva nella direzione di t crescente. Ciò significa che una curva parametrica ha una direzione, un orientamento dato da valori crescenti di t. Sul grafico la direzione del movimento della curva è indicata mediante freccette. Inoltre, osserviamo che a valori di t equidistanti non corrispondono, sulla curva, punti equidistanti: ciò è dovuto al fatto che la particella rallenta o aumenta la sua velocità al variare di t. Dalla Figura 5.2, appare evidente che la curva tracciata dalla particella è una parabola. In effetti, se eliminiamo il parametro t dalle due equazioni parametriche, ricaviamo proprio l equazione di una parabola. Per far ciò, dalla seconda equazione y = 2t 1 ricaviamo t = 1 (y + 1) e sostituiamo il valore trovato per t nell equazione in x. Troviamo 2 x = ( ) 2 1 (y + 1) (y + 1) = 1 4 y2 + y Riconosciamo l equazione di una parabola. Nell esempio, t può variare in tutto R. Se invece t deve variare in un intervallo finito, allora anche la curva risente degli effetti del parametro. Esempio Es Consideriamo le equazioni parametriche della curva precedente, ma con t [ 1, 1]: x = t 2 + t y = 2t 1 1 t 1 Abbiamo solo una porzione della curva che abbiamo disegnata prima (si veda Figura 5.3). 59

66 5. LE CURVE Figura 5.3: Curva data da x = t 2 + t, y = 2t 1, con 1 Definizione La curva di equazioni parametriche x = f(t), y = g(t), t 0 t t f ha punto iniziale (f(t 0, g(t 0 )) e punto finale (f(t f ), g(t f )). Esempio Es Cerchiamo di capire qual è la curva rappresentata dalle equazioni parametriche x = cos t, y = sin t, con 0 t 2π. Se facciamo un grafico con le coppie di punti (x, y) al variare di t, otteniamo il grafico di una circonferenza. Ne abbiamo conferma eliminando il parametro t. Questa volta sfruttiamo le relazioni trigonometriche osservando che x 2 + y 2 = cos 2 t + sin 2 t = 1 Quindi la circonferenza ha centro nell origine e raggio 1. In questo esempio il parametro t può essere interpretato come l angolo in radianti. Al variare di t in [0, 2π], il punto (x, y) = (cos t, sin t) si muove sulla circonferenza in direzione antioraria partendo dal punto (1, 0) e ritornando allo stesso punto. Esempio Es Vediamo ora la curva rappresentata dalle equazioni parametriche x = sin 4t, y = cos 4t, con 0 t 2π. Di nuovo, da x 2 + y 2 = sin 2 4t + cos 2 4t = 1 ritroviamo l equazione della circonferenza di centro l origine e raggio 1. Questa volta, però, il punto iniziale della curva si ha in (sin 0, cos 0) = (0, 1). Per valori di t crescenti, la particella si muove in direzione oraria lungo la circonferenza e la percorre 4 volte (il punto (0, 1) si ha per t = 0, π/2, π, 3π/2, 2π. 60

67 5.2. Grafico di una curva parametrica Quindi la stessa curva può essere rappresentata in modi diversi. Conviene perciò fare la distinzione tra curva, come insieme di punti, da curva parametrica, come insieme di punti tracciati in modo particolare. 5.2 Grafico di una curva parametrica Per fare il grafico di un equazione della forma x = g(y) possiamo usare le equazioni parametriche x = g(t), y = t. Alla stessa maniera le curve di equazioni y = f(x) (le familiari funzioni di una variabile reale), possono essere viste come curve di equazioni parametriche x = t, y = f(t). In generale, data una curva parametrica di equazioni x = f(t), y = g(t), con t 0 t t f, per farne il grafico possiamo far variare t nell intervallo assegnato (o per valori crescenti in R) e vedere dove giacciono, sul piano cartesiano, i corrispondenti punti (x, y), in modo da avere l orientamento della curva. A volte conviene eliminare il parametro t per capire di che curva si tratta. Altre volte la curva è talmente complicata che conviene affidarsi a programmi di grafica al calcolatore per poterla visualizzare. Esempio Es Consideriamo il caso di una curva data da x = a cos (αt) y = b cos (αt) 0 t 2π dove a, b, α sono delle costanti. Visto che le funzioni sono trigonometriche, conviene sfruttare relazioni della trigonometria per capire di che curva si tratta. Facciamo un cambio di variabile ponendo u = αt. Allora le equazioni diventano x = a cos u y = b sin u 0 u 2απ Possiamo scrivere 1 = cos 2 u + sin 2 u = x2 a 2 + y2 b 2 trovando l equazione di un ellisse avente come centro l origine (se a > b l ellisse è orizzontale con l asse maggiore sull asse delle x, viceversa se a < b l ellisse è verticale con l asse maggiore sull asse delle y, se invece a = b l ellisse si riduce ad una circonferenza di raggio a). L ellisse, per u [0, 2π] viene percorsa tutta. Ma adesso u varia fino a 2απ, il che vuol dire che la curva viene percorsa α volte dal parametro u: è come un circuito di formula 1 da ripetere per un numero α di giri. 61

68 5. LE CURVE Figura 5.4: curva x = 4 cos (3t) y = 1 + cos 2 (3t) Esempio Es Il cammino di una particella è dato da x = 4 cos (3t) y = 1 + cos 2 (3t) Proviamo a descrivere questo cammino cercando di capire dove variano x e y e individuando l intervallo in cui varia t per percorrere la curva solo una volta (nel caso in cui possa percorrerla più di una volta). Per eliminare il parametro t, sfruttiamo il fatto che le due equazioni parametriche hanno solo coseni, ricavando cos (3t) dalla prima equazione e sostituendo nella seconda: cos (3t) = x 4 ( x ) 2 x 2 y = 1 + = Ricaviamo una parabola. Inoltre 1 cos (3t) 1 = 4 4 cos (3t) 4 = 4 x 4 0 cos 2 (3t) 1 = cos 2 (3t) 2 = 1 y 2 Proviamo ora per alcuni valori di t cosa si ricava per x e y: t x y π/2 0 1 π π/ π 4 2 L arco di parabola viene ripetuto più volte come un pendolo. Dagli esempi visti possiamo osservare che ci sono curve i cui punti (x, y) sono dati da un 62

69 5.3. Parametrizzare una curva solo valore del parametro t, in altri casi lo stesso punto viene ripetuto per diversi valori di t. Abbiamo le seguenti definizioni Definizione Data una curva di equazioni parametriche x = f(t), y = g(t), G se un punto (x, y) si ottiene mediante un solo valore del parametro t, allora il punto è detto semplice; G se un punto (x, y) si ottiene mediante più valori del parametro t, allora il punto è detto multiplo. Definizione Una curva è chiusa se è definita per t [t 0, t f ] e (x(t 0 ), y(t 0 )) = (x(t f ), y(t f )): il punto sulla curva che si ha per il valore iniziale del parametro t coincide con il punto sulla curva che si ha per il valore finale di t. 5.3 Parametrizzare una curva A volte, data una curva come equazione in x e y, vogliamo parametrizzarla. Il caso più interessante è quello di un ellisse (e quindi, come caso particolare, un cerchio): x 2 a 2 + y2 b 2 = 1 Come equazioni parametriche, possiamo considerare x = a cos (t) y = b sin (t) 0 t 2π In tal caso l ellisse parte dal punto (a, 0) e vi termina dopo aver percorso l ellisse in senso antiorario. Una curva può essere parametrizzata in vari modi, comunque. L ellisse precedente, ad esempio, può essere parametrizzata come x = a cos (αt) x = a sin (αt) x = a cos (αt) y = b sin (αt) y = b cos (αt) y = b sin (αt) La presenza della costante α ci dice quante volte viene percorsa l ellisse. Le ultime due equazioni parametriche ci danno la curva percorsa in senso orario (sempre partendo da t = 0). 5.4 Tangente ad una curva Assegnate le equazioni parametriche di una curva x = x(t) y = y(t) t 0 t t f vogliamo ricavare una formula per la pendenza delle rette tangenti alla curva in ciascun suo punto. Nel caso di una funzione y = F (x), la retta tangente a F per x = a è data dall equazione p(x) = m(x a) + F (a), dove m = F (a) = dy dx x=a Per la curva parametrica, se riusciamo a calcolare la derivata della y in funzione di x, possiamo utilizzare la formula appena scritta per ricavare l equazione della tangente alla 63

70 5. LE CURVE curva in un generico punto (x, y) della curva. Noi però abbiamo y in funzione del parametro t e non di x. Supponiamo di avere (ma non abbiamo) una funzione y = F (x) che ci permetta di scrivere la curva non più in forma parametrica, eliminando cioè il parametro t. In realtà noi sappiamo che y = y(t) e x = x(t), quindi sostituendo abbiamo y(t) = y = F (x) = F (x(t)) = y(t) = F (x(t)) Deriviamo rispetto a t: dy dt df (x(t)) dx = dx dt A noi serve una formula per dy df (x) ovvero per per avere la retta tangente. Dalla relazione dx dx precedente, nell ipotesi in cui dx dt 0 ricaviamo dy df (x(t)) = = dx dx dy dt dx dt Abbiamo trovato, in questo modo, la pendenza della retta tangente alla curva scritta come y = F (x). Se vogliamo avere la tangente alla curva scritta invece come x = H(y), basta scambiare il ruolo della x con la y. L equazione della retta tangente nel punto f(a) è del tipo p(y) = m(y f(a)) + H (f(a)) con m = H (f(a)) = dx dy y=f(a). In maniera del tutto analoga a quanto visto prima, si ricava dx dy = dx dt dy dt per dy dt 0 Esempio Es Troviamo la tangente alla curva parametrica data dalle equazioni x = t 5 4t 3 y = t 2 nel punto (0, 4). Vedremo, in questo caso, che troveremo più di una retta tangente al punto assegnato (e ne capiremo presto il motivo). Per prima cosa applichiamo la formula data prima: dy dx = dy dt dx dt = 2t 5t 4 12t 2 = 2 5t 3 12t 64

71 5.4. Tangente ad una curva Figura 5.5: rette tangenti al punto (0.4) della curva x = t 5 4t 3 y = t 2 Attenzione, adesso, perchè la derivata è in termini di t ma noi dobbiamo calcolare la tangente in un punto assegnato individuato dalle coordinate (x, y) = (0, 4). Dobbiamo quindi determinare per quale/i valore/i di t si ottiene questo punto. Per la curva e il punto dati, deve quindi valere { x = t 5 4t 3 = 0 y = t 2 = 4 = { t 3 (t 2 4) = 0 t = 0, t = ±2 t 2 = 4 t = ±2 Le soluzioni accettabili per le due equazioni sono t = ±2. Per t = 2 la pendenza della retta tangente risulta m = dy dx t= 2 = 1 8 e quindi la retta tangente è y = x Per t = 2 invece si ha m = dy dx t=2 = 1 8 e la retta tangente è y = x Perchè due rette tangenti nel punto (0, 4)? Perchè la curva gira attorno al punto (0, 4) e quindi abbiamo due rette tangenti (si veda Figura 5.5). 65

72 5. LE CURVE Possiamo avere anche tangenti orizzontali o verticali, in un determinato punto di una curva, a seconda che la derivata di y o x rispetto a t sia nulla: G si ha una tangente orizzontale quando dy dt = 0 e dx dt 0 G si ha una tangente verticale quando dx dt = 0 e dy dt 0. Possiamo anche scrivere le equazioni della retta tangente ad una curva parametrica in forma parametrica. Dato il punto P 0 = (x 0, y 0 ) = (x(t 0 ), y(t 0 ), i valori delle derivate dx(t 0), dt dy(t 0 ) rappresentano i valori delle tangenti alla curva, componente per componente. L equazione della retta tangente a P 0, scritta in forma parametrica, deve passare per P 0 e dt avere come direzione quella data dal vettore v che ha come componenti le due derivate v = ( dx(t 0), dy(t 0) ). Scritta in forma vettoriale, la retta tangente deve essere della forma dt dt r t = P 0 + t v dove P 0 è inteso come un vettore, t è il parametro al variare del quale abbiamo i punti della retta, v è il vettore che dà la direzione della retta. In forma parametrica abbiamo r t = (x 0 + t dx(t 0) dt, y 0 + t dy(t 0) ) dt Osserviamo che, dalle equazioni della tangente x = x 0 + t dx(t 0), y = y 0 t dy(t 0), se dalla dt dt prima equazione ricaviamo t in funzione di x e sostituiamo nella seconda equazione, troviamo l equazione della retta tangente che abbiamo ricavato prima. 5.5 Lunghezza di un arco di funzione Prima di capire come si calcola la lunghezza di una curva parametrica, partiamo dal voler calcolare la lunghezza di un arco di funzione: data una funzione continua y = f(x) vogliamo determinare la lunghezza dell arco della curva data dalla funzione nell intervallo [a, b]. Per prima cosa, diamo una stima approssimata della lunghezza di questa curva: dividiamo l intervallo [a, b] in n parti uguali di ampiezza x ottenendo sulla curva n + 1 punti P i, i = 0, 1, 2,..., n. Possiamo quindi approssimare la curva mediante una serie di segmenti congiungenti questi punti. Vediamo in figura 5.6 un esempio con n = 9. Poichè la lunghezza di ciascuno dei segmenti congiungenti P i 1 e P i altro non è che la distanza euclidea tra i due punti P i P i 1, la curva sarà dunque approssimata da L n P i 1 P i i=1 Prendendo valori di n sempre più grandi noi avremo valori via via più accurati. Passando al limite per n avremo la lunghezza dell arco di curva: L = lim n i=1 n P i 1 P i Ora, ciascuno punto P i ha coordinate del tipo (x i, f(x i )), da cui P i 1 P i = (x i x i 1 ) 2 + (f(x i ) f(x i 1 )) 2 Dal teorema del valor medio sappiamo che f(x i ) f(x i 1 ) = f (ξ i )(x i x i 1 ) dove ξ i è un punto che non conosciamo all interno dell intervallo [x i 1, x i ]. Ricordando che abbiamo diviso 66

73 5.6. Lunghezza di una curva Figura 5.6: Approssimazione della lunghezza di un arco di funzione mediante segmenti di retta l intervallo [a, b] di partenza in n parti uguali, si ha x i x i 1 = x da cui, f(x i ) f(x i 1 ) = f (ξ i ) x da cui la lunghezza del segmento si può anche scrivere come P i 1 P i = x 2 + (f (ξ i ) x) 2 = (1 + f (ξ i ) 2 ) x 2 = (1 + f (ξ i ) 2 ) x Inserendo questa formula nel limite che fornisce la lunghezza dell arco di curva si ha L = lim n i=1 n 1 + f (ξ i ) 2 x Usando la definizione dell integrale definito, questo limite non è nient altro che un integrale e, precisamente, L = b a 1 + f (x) 2 dx In maniera equivalente, poichè y = f(x) possiamo riscrivere b ( ) 2 dy L = 1 + dx dx a Se, invece, abbiamo una funzione scritta in funzione di y, vale a dire x = h(y) con c y d, la stessa formula diventa: d ( ) 2 dx L = 1 + dy dy c 5.6 Lunghezza di una curva Così come abbiamo trovato una formula per calcolare la lunghezza di un arco di una funzione y = f(x) o x = h(y), in maniera del tutto analoga, possiamo misurare la lunghezza di una curva. Sia data una curva in forma parametrica come x = x(t) y = y(t) t 0 t t f 67

74 5. LE CURVE Assumiamo che dx 0: ciò significa che la curva è attraversata solo una volta, da sinistra dt verso destra, per t che aumenta nell intervallo [t 0, t f ]. La curva, quindi, è semplice. Supponiamo, come per la tangente, di poter scrivere y = F (x) o x = H(y) anche se, in realtà, x = x(t) e y = y(t). Applicando le formule viste per l arco di una funzione alla curva scritta non in forma parametrica noi dobbiamo applicare una delle due formule: L = L = b a d c ( ) 2 dy dx se y = f(x), a x b dx ( ) 2 dx dy se x = h(y), c y d dy Se lavoriamo considerando y = F (x), poichè x = x(t), operiamo un cambio di variabile per calcolare l integrale: si ha dx = dx(t) dt (o equivalentemente, se consideriamo x = H(y), dt dy = dy dy dx dt), mentre per le derivate (o ) ci riconduciamo alle formule viste per la tangente. dt dx dy Quindi la formula per trovare la lunghezza dell arco di una curva o, più semplicemente, la lunghezza di una curva, diventa: ( ) 2 dy 2 tf L = 1 + dt dx tf dy t 0 dx dt dt = t dt dx ( ) 2 dx dt dt dt dt Semplificando l espressione sotto radice otteniamo tf (dx ) 2 ( ) 2 1 dy dx L = t 0 dx + dt dt dt dt dt Nell ipotesi fatta per cui dx è positiva possiamo semplificare ancora ottenendo dt tf (dx ) 2 ( ) 2 dy L = + dt dt dt t 0 Osserviamo che, nel caso in cui è dy 0, usando la formula per x in funzione di y, si dt ottiene 2 dx tf L = 1 + dt dy t 0 dy dt dt dt da cui si arriva alla stessa formula. Se invece non rappresentiamo la curva mediante la forma y = F (x) o x = H(y), arriviamo allo stesso risultato utilizzando un approssimazione poligonale. Dividiamo l intervall [t 0, t f ] in n sottointervalli di stessa ampiezza t. Chiamiamo t 0, t 1, t 2,..., t n = t f i punti finali di questi 68

75 5.6. Lunghezza di una curva sottointervalli e indichiamo con (x i, y i ) i punti che si ottengono sulla curva con il parametro t i. Quindi x i = x(t i ) e y i = y(t i ). Indichiamo con P i i punti sul piano cartesiano che hanno coordinate date da (x i, y i ). I punti P i si trovano sulla curva γ e possiamo tracciare una poligonale con vertici dati da P i, che approssima la curva γ. Con lo stesso discorso fatto per trovare la lunghezza di un arco di funzione, la lunghezza della curva γ è data dal limite delle lunghezze dei segmenti P i 1 P i = P i 1 P i Ora L n P i 1 P i i=1 P i 1 P i = (x i x i 1 ) 2 + (y i y i 1 ) 2 = (x(t i ) x(t i 1 )) 2 + (yt i ) y(t i 1 )) 2 Applichiamo il teorema del Valor Medio alla funzione x(t) nell intervallo [t i 1, t i ]: x(t i ) x(t i 1 ) = x (t i ) t dove t i è un punto opportuno che si trova all interno dell intervallo [t i 1, t i ]. Analogamente, applicando lo stesso teorema alla funzione y(t) si ha y(t i ) y(t i 1 ) = y (t i ) t con t i punto opportuno che si trova all interno dell intervallo [t i 1, t i ]. Di conseguenza P i 1 P i = [x (t i ) t]2 + [y (t i ) t] 2 = [x (t i )]2 + [y (t i )] 2 t Sostituendo nell espressione data per L e passando al limite per n + si ha L = lim n + i=1 n P i 1 P i = lim n n + i=1 [x (t i )]2 + [y (t i )] 2 t Questo limite ci ricorda un integrale (così come abbiamo fatto per la lunghezza dell arco di una funzione) anche se non è esattamente lo stesso in quanto abbiamo due punti t i e t i che sono diversi. Si può provare, tuttavia, che se x(t) e y(t) sono funzioni continue, il limite scritto prima è lo stesso che si avrebbe con i due punti t i e t i coincidenti. Quindi si può passare all integrale L = tf t 0 [x (t)] 2 + [y (t)] 2 dt Se, al posto di x (t) scriviamo dx dt e, al posto di y (t) scriviamo dy dt prima per la lunghezza di una curva. Riassumiamo questo risultato nel teorema. otteniamo la formula vista Teorema Se una curva γ è descritta tramite equazioni parametriche x = x(t) e y = y(t), con t 0 t t f, e x (t) e y (t) sono funzioni continue e γ è una curva semplice (percorsa solo una volta per t crescente da t 0 a t f ), allora la lunghezza della curva è data da: L = tf t 0 (dx ) 2 + dt ( ) 2 dy dt dt 69

76 5. LE CURVE Figura 5.7: cicloide Esempio Es Vogliamo determinare la lunghezza della curva x = 3 sin (t) y = 3 cos (t) 0 t 2π Riconosciamo un cerchio di centro l origine e raggio 3. Per applicare la formula ci serve calcolare dx dt e dy dt : dx dt = 3 cos (t) dy dt = 3 sin (t) Dobbiamo quindi calcolare l integrale L = = 3 2π 0 2π 0 9 cos 2 (t) + 9 sin 2 (t)dt = 2π 2π 1dt = 3 dt = 3 2π = 6π cos 2 (t) + sin 2 (t)dt = La lunghezza della curva è esattamente la lunghezza della circonferenza! In questo caso abbiamo una verifica immediata del risultato che abbiamo ottenuto. 5.7 La curva cicloide La curva tracciata da un punto P sulla circonferenza di un cerchio quando il cerchio rotola su una linea retta è detta cicloide (si veda Figura 5.7). Per rappresentare questa curva scegliamo come parametro l angolo di rotazione θ con cui si muove il cerchio. Per θ = 0 il punto P si trova all origine degli assi cartesiani. Se il cerchio rotola di un angolo θ, poichè la circonferenza rimane sempre in contatto con la linea retta data dall asse delle x, la distanza del punto di contatto tra circonferenza e asse delle x (punto che chiamiamo T ) dall origine coincide con la lunghezza dell arco P T dove P è il punto che osserviamo quando il cerchio rotola (si veda la Figura 5.8): OT = arc(p T ) L angolo di rotazione θ è sotteso all arco di estremi P e T. Poichè la lunghezza di un arco è proporzionale all ampiezza dell angolo, considerando che all angolo centrale 2π corrispondenza la lunghezza della circonferenza 2πr, possiamo scrivere θ 2π = arc(p T ) 2πr Da questa relazione otteniamo arc(p T ) = rθ, da cui OT = rθ. 70

77 5.8. Sistema di coordinate polari Figura 5.8: Considerazioni geometriche sul punto P della circonferenza quando il cerchio rotola lungo l asse x. Figura 5.9: Rappresentazione grafica della curva cicloide per r = 2 e 0 θ 2π (a sinistra) e 0 θ 8π (a destra). Questo risultato ci serve per trovare le coordinate del punto P. Si ha infatti (aiutandoci con la Figura 5.8): x = OT P Q y = CT CQ Considerando il triangolo rettangolo di vertici P, Q e il centro della circonferenza C, il lato CP = r mentre i lati P Q e CQ sono dati dalle formule trigonometriche P Q = CP sin θ = r sin θ, CQ = CP cos θ = r cos θ. Il lato CT vale r. Inserendo queste relazioni nelle espressioni precedenti troviamo x = OT P Q = rθ r sin θ = r(θ sin θ) y = CT CQ = r r cos θ = r(1 cos θ) Abbiamo trovato, dunque, che le equazioni parametriche della curva cicloide sono date da x = r(θ sin θ), y = r(1 cos θ) Osserviamo che, sebbene queste equazioni le abbiamo ricavate considerando 0 < θ < π/2, esse sono valide anche per altri valori di θ. Un arco completo della curva cicloide è dato dalla rotazione completa della circonferenza e si ha, quindi, per θ [0, 2π]. 5.8 Sistema di coordinate polari Siamo abituati a rappresentare un punto nel piano utilizzando le coordinate cartesiane. Vi è tuttavia un altro sistema di coordinate (introdotto da Newton) che può essere conve- 71

78 5. LE CURVE Figura 5.10: Coordinate polari. Figura 5.11: Passaggio da coordinate polari a coordinate cartesiane. niente per molti scopi, tra cui quello di rappresentare alcune curve parametriche. Questo sistema prende il nome di sistema di coordinate polari. Scegliamo un punto nel piano che chiamiamo polo o origine (lo indichiamo con O). Dall origine tracciamo una semiretta chiamata asse polare (in genere questo asse è tracciato orizzontalmente, a destra del punto O e corrisponde al semiasse positivo dell asse delle x del sistema cartesiano). Se P è un qualunque altro punto in questo piano, tracciamo il segmento, di lunghezza r, che unisce P all origine e consideriamo l angolo θ (di solito espresso in radianti) tra l asse polare e il segmento OP. Il punto P viene rappresentato dalla coppia ordinata (r, θ) e r, θ sono le coordinate polari del punto P (si veda Figura 5.10). Si usa la convenzione che un angolo è positivo se misurato in senso antiorario rispetto all asse polare. Inoltre il punto (0, θ) rappresenta l origine, qualunque sia θ. Si estende il sistema di coordinate polari a valori di r negativi, con la convenzione che il punto del tipo ( r, θ) giace sulla stessa linea del punto (r, θ) e alla stessa distanza r da O, ma sul lato opposto rispetto a (r, θ). Dire ( r, θ) è la stessa cosa di (r, θ + π). Come conseguenza, un punto nel sistema di coordinate polari può avere più di una rappresentazione. Dal momento che una completa rotazione antioraria è data dall angolo 2π, si ha che il punto (r, θ) può essere rappresentato anche come (r, θ + 2nπ), e ( r, θ + (2n + 1)π) con n intero. Per passare dalla rappresentazione in coordinate polari al sistema di coordinate cartesiane, basta osservare che l origine del sistema polare corrisponde all origine del sistema cartesiano, l asse polare corrisponde all asse delle x e, di conseguenza, il punto P di coordinate polari (r, θ), ha coordinate cartesiane x e y date da x = r cos θ, y = r sin θ (si veda Figura 5.11: abbiamo applicato le relazioni trigonometriche che legano i lati di un triangolo rettangolo all angolo compreso tra ipotenusa e uno dei due cateti). Viceversa, dato un punto P in coordinate cartesiane, per trovare i valori di r e θ delle corrispondenti 72

79 5.9. Curve in coordinate polari Figura 5.12: Punto (1, 1) in coordinate polari e cartesiane. coordinate polari, possiamo sfruttare le relazioni r 2 = x 2 + y 2, e tan θ = y x che ricaviamo dalle relazioni precedenti. Poichè tan θ = tan (θ + π), dobbiamo prestare attenzione a scegliere il valore di θ che permette di avere, nel piano polare, lo stesso punto del piano cartesiano. Esempio Es Convertiamo il punto (2, π/4) da coordinate polari a coordinate cartesiane. Da x = r cos θ e y = r sin θ, sostituendo i valori di r e θ otteniamo x = 2 cos (π/4) = 2 2 = 2 e y = 2 sin (π/4) = 2 2 = 2. In coordinate cartesiane abbiamo il punto ( 2, 2). Esempio Es Rappresentiamo in coordinate polari il punto dato in coordinate cartesiane (1, 1). Scegliamo la rappresentazione con r > 0 andando a considerare la radice positiva di x 2 + y 2. Quindi r = = 2. Abbiamo da risolvere l equazione tan θ = y x = 1. Sia θ = 3π 4 + 2nπ sia θ = π + 2nπ con n intero (n = 0, 1,...) hanno come tangente il 4 valore 1. Scegliamo il valore di θ che ci permette (insieme a r = 2) di avere il punto P posizionato nel corretto quadrante: dobbiamo scegliere θ = π 4 + 2nπ. Prendiamo θ = π 4. Il punto in coordinate polari dato da ( 2, π ) corrisponde a (1, 1) in coordinate 4 cartesiane. Se considerassimo il punto ( 2, 3π 4 (si veda Figura 5.12 per un confronto). ) avremmo, in coordinate cartesiane ( 1, 1) 5.9 Curve in coordinate polari Un equazione polare del tipo r = f(θ) o, più in generale, F (r, θ) = 0 ha come grafico l insieme di tutti i punti P di coordinate polari (r, θ), che soddisfano l equazione. Possiamo dunque avere delle curve rappresentate mediante coordinate polari. 73

80 5. LE CURVE Esempio Es La curva di equazione polare r = 4 è data da tutti i punti (r, θ) con r = 4. Dal momento che r rappresenta la distanza dei punti dal polo (l origine del piano polare), la curva data rappresenta il cerchio di centro il polo O e raggio 4. Esempio Es La curva polare θ = π/5 consiste di tutti i punti (r, θ) con θ = π/5 radianti. Abbiamo quindi una retta che passa per O e che forma un angolo di π/5 radianti con l asse polare. Esempio Es Troviamo le equazioni cartesiane della curva polare r = 2 cos θ. Se proviamo a fare il grafico della curva sul piano polare, al variare di θ, ci accorgiamo che il grafico rappresenta una circonferenza. Per passare a coordinate cartesiane, da x = r cos θ abbiamo cos θ = x/r quindi r = 2 cos θ = 2x/r, cioè r 2 = 2x ma r 2 = x 2 +y 2, da cui x 2 +y 2 = 2x o ancora x 2 +y 2 2x = 0. Aggiungendo e sottraendo 1 abbiamo x 2 + y 2 2x = 0 cioè (x 1) 2 + y 2 = 1 Abbiamo l equazione della circonferenza di centro (1, 0) e raggio La curva cardioide Studiamo ora la curva cardioide, chiamata in questo modo perchè a forma di cuore, data dall equazione r = 1 + sin θ. Per farne il grafico, facciamo prima di tutto il grafico, in coordinate cartesiane, della funzione r = 1 + sin θ (si veda Figura 5.13, a sinistra), che altro non è che la funzione sin a cui è aggiunta un unità. Per θ che varia da 0 a π/2, r cresce da 1 a 2. Ma r rappresenta la distanza dal polo in coordinate polari, perció nel grafico in coordinate polari dobbiamo far variare r da 1 a 2 (indichiamo con ➀ questa porzione di curva). Per θ che varia da π/2 a π, r decresce da 2 a 1 perciò nella corrispondente curva polare dobbiamo rappresentare questa decrescita (indicata nella regione ➁). Per θ [π, 3π/2] r decresce da 1 a 0 e si ha la corrispondente portione ➂ della curva polare. Infine, per θ [3π/2, 2π] r aumenta da 0 a 1, come mostrato nella porzione ➃. Se θ dovesse andare oltre 2π, la curva ripercorrebbe lo stesso percorso Lunghezza di una curva polare Se vogliamo calcolare la lunghezza di una curva in coordinate polari, la formula che abbiamo dato per la lunghezza di una curva parametrica si semplifica. Infatti, se passiamo a coordinate cartesiane, le equazioni che caratterizzano la curva polare r = f(θ) con θ 0 θ θ f sono date da x = r cos θ = f(θ) cos θ, y = r sin θ = f(θ) sin θ Quindi x e y sono funzioni di θ. Assumendo che f sia una funzione continua, la lunghezza della curva è data dalla formula θf (dx ) 2 ( ) 2 dy L = + dθ dθ dθ 74 θ 0

81 5.10. Lunghezza di una curva polare Figura 5.13: Cardioide. Si ha (considerando che x e y sono date dal prodotto di due funzioni): dx dθ = f (θ) cos θ f(θ) sin θ = dr cos θ r sin θ dθ dy dθ = f (θ) sin θ + f(θ) cos θ = dr sin θ + r cos θ dθ Sfruttando il fatto che cos 2 θ + sin 2 θ = 1 si ha ( ) 2 ( ) 2 ( ) 2 dx dy dr + = cos 2 θ + r 2 sin 2 θ 2r dr cos θ sin θ+ dθ dθ dθ dθ ( ) 2 dr + sin 2 θ + r 2 cos 2 θ + 2r dr cos θ sin θ dθ dθ ( ) 2 dr = (cos 2 θ + sin 2 θ) + r 2 (cos 2 θ + sin 2 θ)+ dθ 2r dr dr cos θ sin θ + 2r cos θ sin θ dθ dθ ( ) 2 dr = + r 2 dθ Andando a sostituire nell integrale che dà la lunghezza della curva si ha θf ( ) 2 dr L = r 2 + dθ dθ θ 0 Abbiamo trovato una formula semplificata per la lunghezza della curva polare Lunghezze di alcune curve La curva cardioide Calcoliamo la lunghezza della curva cardioide r = 1 + sin θ con θ [0, 2π]. Poichè dr = cos θ la lunghezza della curva è data dall integrale dθ 2π 2π L = (1 + sin θ)2 + cos 2 θdθ = 1 + sin 2 θ + 2 sin θ + cos 2 θdθ = 0 2π 0 2π sin θdθ = sin θdθ

82 5. LE CURVE Per calcolare questo integrale moltiplichiamo e dividiamo per 1 sin θ ricavando L = 2 = 2 2π 0 2π 0 1 sin θ 1 + sin θ dθ = 2π 2 1 sin θ 0 cos2 θ dθ = 2π cos θ 2 dθ 1 sin θ 0 1 sin θ 1 sin 2 θ 1 sin θ dθ Abbiamo un integrale che dipende dal valore assoluto di cos θ: poichè cos θ è positivo per 0 θ π/2 e per 3π/2 θ 2π, mentre è negativo per π/2 θ 3π/2, l integrale si spezza nei tre integrali L = 2π cos θ 2 dθ = 1 sin θ = 2 0 π/2 Osserviamo che cos θ dθ 1 sin θ 0 cos θ dθ 3π/2 2 1 sin θ π/2 cos θ dθ + 2π 2 1 sin θ 3π/2 cos θ 1 sin θ dθ si può risolvere facendo il cambiamento di variabile u = sin θ da cui du = cos θdθ ricavando 1 1 D(1 u) du = du = du = 2 1 u + costante 1 u 1 u 1 u Abbiamo considerato che la derivata di 1 u vale 1 (l abbiamo indicata con D(1 u) e che x n dx = xn+1 n costante. Ritornando a L e sostituendo quanto abbiamo trovato nei tre integrali, abbiamo L = [ 2 θ=π/2 2 1 sin θ 2 1 sin θ θ=3π/2 + 2 ] 1 sin θ θ=2π θ=0 θ=π/2 θ=3π/2 = 2 [( ) ( ) + ( )] = ( ) 2 = ( 2 4 ) 2 = 8 La lunghezza della curva cardioide vale 8. La spirale di Archimede La spirale di Archimede è una curva la cui equazione polare è ρ(θ) = kθ con k parametro assegnato, positivo e θ che varia nell intervallo [0, θ f ] (si veda figura 5.14 per vedere cosa succede aumentando θ f ). Per calcolare la lunghezza di questa curva, poichè dρ = k si ha dθ L = θf 0 θf k2 + (kθ) 2 dθ = k 1 + θ2 dθ L integrale da risolvere non è immediato nè semplice. 0 76

83 5.10. Lunghezza di una curva polare Figura 5.14: Spirale di Archimede con k = 2 e θ f = 2π (a sinistra) e θ f = 10π (a destra) Per capire come si arriva al risultato, vediamo nei dettagli la sua risoluzione (specie perchè si tratta di un integrale che può capitare di incontrare anche in altre occasioni). 1 Calcoliamo quindi l integrale 1 + x 2 dx (per semplicità consideriamo l integrale indefinito e usiamo x al posto di θ). Facciamo un cambiamento di variabile ponendo x = tan u. Sappiamo che D(tan u) = 1 cos 2 u. La funzione 1 viene chiamiata anche secante (trigonometrica) e indicata con il cos u simbolo sec u (sec u = 1 ). Per semplicità useremo anche noi questa terminologia. cos u Consideriamo, inoltre, queste relazioni che useremo nel seguito: G 1 + tan 2 u = 1 + sin2 u cos 2 u = cos2 u + sin 2 u cos 2 = 1 u cos 2 u = sec2 u 1 G D(sec u) = D( cos u ) = sin u cos 2 u = tan u = tan u sec u cos u 1 Tornando all integrale, da x = tan u si ha dx = D(tan u)du = cos 2 u du = sec2 udu. Sostituendo si ha I = 1 + x2 dx = 1 + tan 2 u sec 2 udu Per la relazione 1 + tan 2 u = sec 2 u si ha I = sec2 u sec 2 udu Poichè u = arctan x, si ha π/2 u π/2 e in questo intervallo cos u 0 da cui sec u 0, quindi sec u = sec u. Allora sec2 I = u sec 2 udu = sec 3 udu L integrale in sec 3 u si risolve riconducendosi all integrale di sec u. Risolviamo prima quest ultimo integrale (usando degli accorgimenti: come vedete, la strada per risolvere l integrale di partenza è molto lunga). sec udu = = sec u + tan u sec u sec u + tan u du sec 2 u + sec u tan u du sec u + tan u 1 Se ci dovesse capitare di risolvere un esercizio arrivando ad un integrale del genere, dovremo ricordarci che esiste tutta questa lunga procedura che ci apprestiamo a descrivere per giungere alla formula finale (e quindi torneremo su questi appunti per ricordarci quale sia il risultato dell integrale). 77

84 5. LE CURVE A questo punto si fa un cambiamento di variabile (ancora!), ponendo w = sec u + tan u (l espressione al denominatore della funzione integranda), da cui dw = D(sec u + tan u)du = (sec u tan u + sec 2 u)du (ritroviamo l espressione al numeratore della funzione integranda), da cui sec 2 u + sec u tan u du = sec u + tan u 1 dw = ln w + costante w = ln sec u + tan u + costante Torniamo ora all integrale di sec 3 u riscrivendo diversamente la funzione integranda: sec 3 u = sec3 u 2 = sec3 u 2 = sec3 u 2 = sec3 u 2 + sec3 u 2 + sec2 u sec u 2 + (tan2 u + 1) sec u 2 + tan2 u sec u + sec u 2 2 = sec3 + tan 2 u sec u 2 + sec u 2 Per calcolare l integrale di sec 3 u dobbiamo integrare i due termini della somma in cui abbiamo scomposto sec 3 u. Del secondo termine sappiamo già quanto vale l integrale. Per il primo, basta osservare che D(sec u tan u) = D(sec u) tan u + sec ud(tan u) = sec u tan u tan u + sec u sec 2 u = sec u tan 2 u + sec 3 u Ma allora sec u tan 2 u + sec 3 u du = D(sec u tan u)du = 1 sec u tan u + costante 2 Ritornando all integrale di prima e mettendo insieme i vari pezzi si ha sec 3 udu = 1 (sec u tan u + ln sec u + tan u ) + costante 2 Quindi (finalmente siamo arrivati alla conclusione!!!!): 1 + x2 dx = sec 3 udu = 1 (sec u tan u + ln sec u + tan u ) + costante 2 Per tornare alla variabile originale x, da x = tan u si ha u = arctan x, da cui (sfruttando le proprietà viste prima di sec u e tan u) sec u = 1 + tan 2 u = 1 + x 2. Perciò, sostituendo 1 + x2 dx = 1 ( x 1 + x ln ) 1 + x 2 + x + costante Sappiamo ora calcolare la lunghezza della spirale di Archimede. Tornando alla formula θf L = k 1 + θ2 dθ abbiamo 78 L = k 0 [ 1 ( θ 1 + θ ln ) ] θ f 1 + θ 2 + θ = k ) (θ f 1 + (θ f ) ln 1 + (θ f ) 2 + θ f

85 5.11. Funzioni a valori vettoriali 5.11 Funzioni a valori vettoriali Abbiamo visto che una curva può essere rappresentata mediante due equazioni parametriche che individuano l ascissa e l ordinata di ogni suo punto (se avessimo una curva nello spazio 3D avremmo tre equazioni, una per x, una per y, una per z). Queste equazioni sono un esempio di funzione a valori vettoriali. Nel caso della curva in 2D possiamo definire una funzione f definita nell insieme [t 0, t f ] e a valori in R 2 : f : [t 0, t f ] R 2 tale che f = (x(t), y(t)) Al parametro t è associato il punto (x(t), y(t)), che possiamo vedere anche come un vettore di R 2. Più in generale Definizione f : I R n con I R k, (k, n interi) è una funzione vettoriale. Se la funzione vettoriale è data da f(t) = (f 1 (t), f 2 (t),..., f n (t)), possiamo calcolare la sua derivata, che è il vettore che ha come componenti le derivate delle componenti della funzione: f (t) = (f 1(t), f 2(t),..., f n(t)). Di questo vettore possiamo calcolare il modulo (che è una funzione di t): f (t) = n i=1 (f i (t))2. Nel caso 2D, se f(t) = (x(t), y(t)), si ha f (t) = ( dx dt, dy dt ) e f (t) = 5.12 Le curve riviste come funzioni vettoriali Definizione f : [a, b] R n G Si dice curva di R n ogni applicazione (dx ) 2 + dt ( ) 2 dy dt G Si dice sostegno (oppure traccia o traiettoria) della curva l insieme f([a, b]) (il codominio della funzione). G Un curva f si dice di classe C k se f è di classe C k ([a, b]) (cioè se ogni sua componente è di classe C k ). La curva rappresentata dalla f viene detta anche curva γ. Definizione Una curva γ si dice regolare se 1. la f è di classe C 1 ([a, b]) 2. t ]a, b[: f (t) > 0 3. Se la f è una corrispondenza biunivoca tra [a, b] e f([a, b]) (si può avere una sola eccezione se la curva è chiusa, per cui f(a) = f(b)) Definizione Due funzioni vettoriali f : [a, b] R n e g : [α, β] R n rappresentanto la stessa curva γ se esiste una funzione Φ : [α, β] [a, b], di classe C 1 e Φ (u) > 0 u [α, β], tale che Φ(α) = a Φ(β) = b G u [α, β] : g(u) = (f Φ)(u) = f(φ(u)) Definizione Una curva si dice generalmente regolare o regolare a tratti se 1. f è continua 2. esiste un numero finito di punti a = t 0 < t 1 <... < t r = b tali che la f ristretta a ciascun sottointervallo [t i 1, t i ], i = 1, 2,..., r rappresenti una curva regolare 79

86 5. LE CURVE Esempio Es La curva data da x = t y = t 1 t 1 non è regolare perchè non è derivabile per t = 0, ma la curva è generalmente regolare perchè ristretta a [ 1, 0] e [0, 1] è regolare Retta tangente ad una curva Definizione Data una curva γ di classe C 1, data dalla funzione vettoriale f : [a, b] R n sia t p ]a, b[, con f (t p ) 0. Si definisce retta tangente alla curva γ nel punto f(t p ) la retta passante per f(t p ) e avente come direzione quella del vettore f (t p ): r t = f(t p ) + tf (t p ) t R Nel caso 2D ritroviamo la retta che avevamo introdotto a pag. 66: r t = (x(t p ) + dx(t p) dt t, y(t p ) + dy(t p) t) dt Definizione Il vettore f (t p ) si dice vettore tangente alla curva γ in f(t p ). In R 2 il vettore tangente si indica anche come f (t p ) = x (t) i + y (t) j 5.14 Curve orientate L orientamento naturale di una curva è quello dato da valori crescenti di t. Per dire che la curva ha l orientamento naturale la si indica come +γ. L orientamento di una curva può essere data dal versore τ(t) = f (t) f (t) Definizione Data una curva γ di classe C 1, data da f : [a, b] R n si chiama curva opposta la curva Γ data da F : [ b, a] R n per la quale F(u) = f( u) La curva orientata +Γ ha orientamento naturale opposto a quello della curva +γ. Proprio per questo motivo, si può indicare con γ la curva opposta +Γ Di nuovo sulla lunghezza di una curva Diamo qualche cenno su come si arriva alla lunghezza di una curva. Data una curva γ di classe C 0, sia data una suddivisione dell intervallo [a, b] mediante i punti a = t 0 < t 1 <... < t r = b. Si consideri la poligonale che congiunge i punti f(t i ). Si dice lunghezza della curva γ l estremo superiore dell insieme costituito dalle lunghezze delle 80

87 5.16. L ascissa curvilinea poligonali così create, considerando tutte le possibili suddivisioni dell intervallo [a, b] fatte con un numero finito di punti. Una curva che ha lunghezza finita si dice rettificabile. Una curva regolare è rettificabile e la sua lunghezza è data da L = b a f (t) dt Osserviamo che questa formula è esattamente quella che abbiamo ricavato in precedenza. Per una curva regolare a tratti si ha un analoga definizione, considerando la somma delle lunghezze delle curve regolari di cui è composta. Proposizione L integrale che fornisce la lunghezza di una curva non cambia se si considera la curva opposta a quella data o se si considera la curva mediante rappresentazioni equivalenti L ascissa curvilinea Data una curva regolare orientata +γ data da f : [a, b] R n si definisca la funzione reale s(t) data da { t a f (u) du per t a s(t) = 0 per t = a Questa funzione rappresenta la lunghezza dell arco di curva tra f(a) e f(t) ed è detta ascissa curvilinea. È una funzione crescente poichè s (t) = f (t) > 0 (essendo la curva regolare). La sua inversa è una funzione Φ(s) tale che Φ(s) = t e tale che s [0, L] (dove L è la lunghezza della curva γ) si ha Φ(0) = a, Φ(L) = b e Φ (s) > 0. Ma, allora, f è equivalente alla funzione g = f Φ. La funzione g dipende dall ascissa curvilinea s. La rappresentazione di una curva mediante l ascissa curvilinea non dipende dalla rappresentazione parametrica da cui si è partiti. Proposizione La derivata di g ha modulo unitario (o norma unitaria). Dimostrazione. g (s) = (f Φ) (s) = f (Φ(s))Φ (s) = f (Φ(s)) Φ (s) Non abbiamo considerato il modulo di Φ (s) essendo questa funzione positiva e scalare. Poichè Φ è la funzione inversa di s, per la derivata vale Φ 1 (s) = s (la derivata della (Φ(s)) inversa di una funzione è uguale al reciproco della derivata della funzione stessa), andando a sostituire, si trova: g (s) = 1 Considerando il differenziale dell ascissa curvilinea si ha la cosiddetta lunghezza dell arco elementare: ds = f (t) dt 81

88

89 CAPITOLO 6 Superfici parametriche Secondo alcuni autorevoli testi di tecnica aeronautica, il calabrone non può volare, a causa della forma e del peso del proprio corpo in rapporto alla superficie alare. Ma il calabrone non lo sa e perciò continua a volare. Igor Ivanovich Sikorsky ( ) 6.1 Superfici parametriche Sistema di coordinate sferiche Piano tangente a una superficie parametrica Equazione di un piano e vettore normale al piano Superfici parametriche Così come una curva è stata rappresentata in forma parametrica, anche una superficie può essere rappresentata in forma parametrica mediante tre funzioni (una per x, una per y, una per z) dipendenti da due parametri, dette equazioni parametriche della superficie x = x(u, v) y = y(u, v) z = z(u, v). Alla stessa maniera con cui abbiamo visto le equazioni di una curva parametrica come una funzione vettoriale, anche una superficie parametrica può essere vista come una funzione vettoriale che dipende da due variabili r : R 2 R 3, tale che r(u, v) = (x(u, v), y(u, v), z(u, v)) La funzione vettoriale è definita su una regione D del piano uv e l insieme dei punti (x, y, z) R 3, che sono i valori della funzione vettoriale, prende il nome di superficie parametrica S. 83

90 6. SUPERFICI PARAMETRICHE Figura 6.1: Cilindro di equazioni x = 4 cos u, y = v, z = 4 sin u. Figura 6.2: Cilindro di equazioni x = 4 cos u, y = v, z = 4 sin u con 0 u π/4, 0 v 1. Esempio Es Sia data la superficie di equazioni parametriche x = 4 cos u, y = v, z = 4 sin u Cerchiamo di capire di quale superficie si tratta. Da x 2 + z 2 = 16 cos 2 u + 16 sin 2 u = 16 deduciamo che sezioni verticali parallele al piano xz, vale a dire per y costante, sono tutte circonferenze di raggio 4. Dal momento che l equazione parametrica per y è proprio y = v, e v R, la superficie è un cilindro circolare di raggio 4 il cui asse è l asse delle y (si veda Figura 6.1). Esempio Es Nell esempio di prima, non c erano limitazioni ai parametri u e v. Se invece poniamo delle limitazioni avremo una porzione di cilindro. Facciamo variare u in [0, π/4] e v in [0, 1]. In Figura 6.2 possiamo osservare la superficie che otteniamo. 84

91 6.1. Superfici parametriche Figura 6.3: Rappresentazione delle coordinate sferiche. Se una superficie parametrica S è data dalla funzione vettoriale r(u, v), è utile definire due famiglie di curve che si trovano sulla superficie: una famiglia di curve che si ha considerando u costante e l altra che si ha considerando v costante. Queste due famiglie corrispondono a linee verticali e orizzontali nel piano uv. Prendendo u = u 0, la funzione vettoriale r(u 0, v) diventa una funzione vettoriale dipendente dal solo parametro v e definisce una curva γ 1 che giace sulla superficie S. Analogamente, per v = v 0, si ha la curva γ 2 data da r(u, v 0 ) sulla superficie S. Le due curve prendono il nome di curve coordinate o curve di griglia. I grafici che abbiamo fatto per visualizzare le superfici degli esempi precedenti mostrano queste curve coordinate Sistema di coordinate sferiche Per visualizzare il grafico delle superfici, a volte è utile rappresentare le superfici in un sistema di coordinate che non è quello cartesiano. Vediamo nel dettaglio il sistema di coordinate sferiche, dove un punto P che ha coordinate (x, y, z) nello spazio cartesiano viene rappresentato in coordinate sferiche mediante (ρ, θ, φ) (si veda Figura 6.3): ρ rappresenta la distanza del punto P dall origine dello spazio cartesiano (ρ = x 2 + y 2 + z 2 ), θ rappresenta l angolo che si ha tra la proiezione del punto P sul piano xy e l asse positivo dell asse x (in altri termini, è la coordinata polare θ della proiezione di P sul piano xy), mentre φ è l angolo tra l asse positivo dell asse z e il segmento OP. Quindi ρ 0 e 0 φ π. Questo sistema di coordinate è utile in presenza di simmetrie intorno all origine. La relazione tra coordinate cartesiane e coordinate sferiche, tiene conto delle relazioni trigonometriche. In Figura 6.4 vediamo i due triangoli rettangoli OP Q e OP P. Il triangolo OP Q ha i lati OQ e OP di lunghezza z e ρ rispettivamente, e, per le relazioni sui lati e angoli di un triangolo rettangolo vale z = ρ cos φ. Il triangolo OP P ha uno dei suoi cateti, indicato con r, che è dato dalla proiezione di OP sul piano xy. Vale r = ρ sin φ. Le coordinate x e y sono cateti del triangolo che si forma sul piano xy e che ha come ipotenusa proprio r, da cui x = r cos θ e y = r sin θ, vale a dire x = ρ sin φcosθ e y = ρ sin φ sin θ. Riassumendo, le coordinate sferiche di P sono date da x = ρ sin φ cos θ, y = ρ sin φ sin θ, z = ρ cos φ Viceversa, considerando la formula della distanza di un punto P dall origine e sosituendo i 85

92 6. SUPERFICI PARAMETRICHE Figura 6.4: Relazione tra coordinate cartesiane e sferiche. Figura 6.5: Superficie sferica. Il grafico è fatto usando coordinate cartesiane (a sinistra) e coordinate sferiche (a destra). valori appena trovati si ricava: x2 + y 2 + z 2 = ρ 2 sin 2 φ cos 2 θ + ρ 2 sin 2 φ sin 2 θ + ρ 2 cos 2 φ = ρ Esempio Es L equazione di una sfera di centro l origine e raggio r è data da x 2 +y 2 +z 2 = r 2. Possiamo descrivere la sfera usando equazioni parametriche del tipo x = x, y = y, z = ± r 2 x 2 y 2 Osserviamo che abbiamo due funzioni per z. Usando queste equazioni e unendo i grafici, otteniamo la sfera che si vede in Figura 6.5 a sinistra: parti della sfera non sono rappresentate ma ci sono dei buchi, perchè x e y sono fatti variare in un dominio rettangolare e, in corrispondenza dei buchi abbiamo delle radici quadrate di valori negativi! Se usiamo invece coordinate sferiche, i punti hanno coordinate con ρ = r, da cui, x = r sin φ cos θ, y = r sin φ sin θ, z = r cos φ, 0 φ π, 0 θ 2π 86

93 6.2. Piano tangente a una superficie parametrica Il grafico della sfera usando le coordinate sferiche è in Figura 6.5 a destra. Osserviamo come la superficie sia ben rappresentata. In questo caso le curve coordinate per φ costante sono delle circonferenze di valore costante (che corrispondono ai noti paralleli che si studiano in geografia). Per θ costante abbiamo invece i meridiani (semicirconferenze perchè 0 φ π) che collegano polo nord e polo sud. 6.2 Piano tangente a una superficie parametrica Data una superficie parametrica S di equazione r(u, v) = (x(u, v), y(u, v), z(u, v)), vogliamo calcolare l equazione del piano tangente alla superficie in un punto P 0 (x 0, y 0, z 0 ) che vi appartiene. Esiste quindi una coppia di valori (u 0, v 0 ) tale che P 0 = r(u 0, v 0 ). Per calcolare il piano tangente, facciamo questo tipo di ragionamento. Fissando u = u 0, le equazioni parametriche della superficie diventano r(u 0, v) = (x(u 0, v), y(u 0, v), z(u 0, v)): abbiamo una funzione vettoriale che dipende dalla sola variabile v e che definisce una curva parametrica γ 1 nello spazio R 3. Questa curva giace sulla superficie S. Scriviamo le equazioni parametriche della retta tangente a questa curva (si veda pag. 80), considerando che quella che è la derivata della funzione x(u 0, v) rispetto a v nel punto v = v 0 altro non è che la derivata parziale della funzione x(u, v) rispetto a v nel punto (u 0, v 0 ) (stesso discorso vale per y e per z). Otteniamo retta tv = (x 0 + t x(u 0, v 0 ) v, y 0 + t y(u 0, v 0 ) v, z 0 + t z(u 0, v 0 ) ) v Abbiamo chiamato questa retta con retta tv perchè è la retta tangente alla curva che dipende dalla variabile v poichè u = u 0 costante. Di conseguenza, la pendenza di questa retta, vale a dire, la tangente alla curva γ 1 nel punto x(u 0, v 0 ), y(u 0, v 0 ) è data dal vettore r tv = ( x(u 0, v 0 ) v, y(u 0, v 0 ) v, z(u 0, v 0 ) ) v Allo stesso modo, possiamo fissare v = v 0 e considerare che le equazioni parametriche della superficie, in questo caso, si riducono alle equazioni parametriche di una curva nello spazio R 3 che dipendono dalla variabile u. Analogamente, possiamo scrivere le equazioni parametriche della retta tangente a questa curva nel punto P 0, ottenendo retta tu = (x 0 + t x(u 0, v 0 ) u, y 0 + t y(u 0, v 0 ) u La pendenza di questa retta è data dal vettore r tu = ( x(u 0, v 0 ) u, y(u 0, v 0 ) u, z(u 0, v 0 ) ) u, z 0 + t z(u 0, v 0 ) ) u Una volta ottenute queste due rette, il piano tangente alla superficie è il piano individuato dalle direzioni di queste due rette, cioè dai due vettori r tu e r tv. Consideriamo dei brevi richiami sulle equazioni di un piano in R Equazione di un piano e vettore normale al piano Supponiamo di avere un punto P 0 = (x 0, y 0, z 0 ) su un piano nello spazio R 3. Supponiamo di avere anche un vettore n che è normale a questo piano: Assumiamo di conoscere un altro generico punto P = (x, y, z) che giace sul piano. Indichiamo con r e r 0 i vettori che ci indicano i due punti P e P 0 rispettivamente (si veda figura 6.6). Possiamo costruire il vettore r r 0 che giace interamente nel piano. Per 87

94 6. SUPERFICI PARAMETRICHE Figura 6.6: piano nello spazio semplicità, nella figura 6.6 abbiamo messo sul piano il vettore n (anche se esso potrebbe stare da tutt altra parte). Ora, poichè n è ortogonale al piano, esso è ortogonale ad ogni vettore che giace nel piano. In particolare esso è ortogonale al vettore r r 0. Vale dunque: n ( r r 0 ) = 0 Se n è un vettore di componenti (a, b, c), poichè r r 0 = (x x 0, y y 0, z z 0 ), il prodotto scalare diventa a(x x 0 ) + b(y y 0 ) + c(z z 0 ) = 0 Questa è l equazione scalare del piano. Spesso troviamo l equazione scritta nella forma ax + by + cz = d dove d = ax 0 + by 0 + cz 0 Osserviamo quindi che, data l equazione di un piano possiamo ricavare facilmente un vettore normale al piano: esso è dato da n = (a, b, c). Ora, dati due vettori a e b in R 3, il prodotto vettoriale a b è un vettore che punta nella direzione perpendicolare al piano individuato dai due vettori a e b, mentre la sua lunghezza è data da a b = a b sin θ dove θ è l angolo compreso dai due vettori (0 θ π). Da questa formula deduciamo che se i due vettori sono paralleli allora il loro prodotto vettoriale è nullo e viceversa. Come interpretazione geometrica si ha che la lunghezza del prodotto vettoriale rappresenta l area del parallelogramma individuato dai vettori a e b. Per trovare le componenti del prodotto vettoriale si ha la formula legata al determinante della matrice che ha sulla prima riga i versori dell asse delle x, delle y e delle z rispettivamente, sulla seconda riga le componenti del vettore a e sulla terza riga le componenti del vettore b. Si calcola il determinante della matrice rispetto alla prima riga in modo da avere come risultato un vettore. Sia a = (a 1, a 2, a 3 ) e b = (b 1, b 2, b 3 ). I versori unitari dei tre assi siano dati da i, j, k. Il prodotto vettoriale a b è dato da a i j k b = a 1 a 2 a 3 b 1 b 2 b 3 = i a 2 a 3 b 2 b 3 j a 1 a 3 b 1 b 3 + k a 1 a 2 b 1 b 2 88 = i(a 2 b 3 b 2 a 3 ) j(a 1 b 3 b 1 a 3 ) + k(a 1 b 2 b 1 a 2 ) = (a 2 b 3 b 2 a 3, b 1 a 3 a 1 b 3, a 1 b 2 b 1 a 2 )

95 6.2. Piano tangente a una superficie parametrica Quindi se abbiamo due vettori a e b che si trovano sul piano di cui vogliamo scrivere l equazione, il loro prodotto vettoriale è il vettore normale al piano e può essere utilizzato per scrivere l equazione del piano tangente. Tornando al piano tangente ad una superficie parametrica in un punto P 0, poichè abbiamo trovato i due vettori tangenti r tu e r tv che si trovano sul piano tangente alla superficie, allora il piano tangente è individuato dal vettore n = r tu r tv (i due vettori non devono essere tangenti tra loro). Esempio Es Sia data la superficie di equazioni parametriche x = 2u 2, y = 3v 2, z = 3u + 5v Vogliamo trovare l equazione del piano tangente alla superficie nel punto P 0 (2, 3, 8). Notiamo che questo punto si ha per u = v = 1. Calcoliamo i due vettori tangenti r tu e r tv. Poichè x u = 4u, y u = 0, z u = 3 valutando queste derivate in (1, 1) abbiamo r tu = (4, 0, 3) Analogamente, poichè x v = 0, y v = 6v, z v = 5 valutando queste derivate in (1, 1) abbiamo r tv = (0, 6, 5) Il prodotto vettoriale è i j k r tu r tv = = ( 18) i (12) j + (24) k = ( 18, 12, 24) Quindi il piano tangente è dato da a(x x 0 ) + b(y y 0 ) + c(z z 0 ) = 0 dove (a, b, c) = ( 18, 12, 24) e (x 0, y 0, z 0 ) = (2, 3, 8) = P 0, da cui o ancora 18(x 2) 12(y 3) + 24(z 8) = 0 18x y z 192 = 0 = 24z 12y 18x 120 = 0 = 2z y 1.5x 10 = 0 89

96

97 CAPITOLO 7 Integrali Compito della scienza non è aprire una porta all infinito sapere, ma porre una barriera all infinita ignoranza. Galileo Galilei ( ) 7.1 Integrali dipendenti da parametri Integrali dipendenti da parametri per funzioni di una sola variabile Integrali dipendenti da parametri per funzioni di due variabili Richiamo sugli integrali semplici Integrali doppi su domini rettangolari Integrali iterati Integrali doppi su domini generali Proprietà degli integrali doppi Cambiamento di variabili Significato dello jacobiano Area di un dominio Cenni su integrali tripli Integrali curvilinei Integrali di superficie Area di una superficie Integrale di una superficie Solidi e superfici di rotazione Integrali dipendenti da parametri Analizziamo brevemente gli integrali dipendenti da parametri, vedendo il caso in cui la funzione integranda dipende da una sola variabile e il caso in cui dipende da due variabili Integrali dipendenti da parametri per funzioni di una sola variabile Se f : I R con I R è una funzione continua, fissato x 0 I si può definire la funzione F (x) = x x 0 f(t)dt Questa funzione prende il nome di funzione integrale della f di punto iniziale x 0. 91

98 7. INTEGRALI Proposizione Se G è una primitiva della f (quindi G = f) si ha F (x) = x x 0 f(t)dt = G(x) G(x 0 ) La funzione F è a sua volta una primitiva di f. Dimostrazione. Infatti F (x) = d ( ) x dx x 0 f(t)dt = d(g(x) g(x 0)) = f(x). dx Integrali dipendenti da parametri per funzioni di due variabili Se f : I R con I R 2 è una funzione continua, si può definire la funzione F (y 0, y 1, x) = y1 y 0 f(x, y)dy Quindi, fissato un certo valore di x, calcoliamo l integrale della funzione f(x, y), come funzione che dipende solo da y, per y 0 y y 1. Al variare di x varia l integrale. E l integrale varia anche al variare di y 0 e y 1, perciò è una funzione che dipende da tre variabili, y 0, y 1 e x. La F è una funzione continua. Proposizione Se f è continua, la F è derivabile rispetto a y 0 e y 1 e vale F y 1 = f(x, y 1 ) F y 0 = f(x, y 0 ) Dimostrazione. La prima relazione segue dal fatto che, poichè stiamo facendo la derivata rispetto a y 1 (che è il secondo estremo dell intervallo di integrazione), posso considerare la F come funzione integrale di una funzione dipendente da una sola variabile. In particolare, fissati x e y 0, considero la funzione g(y) = f(x, y) e F 1 (y 1 ) = F (y 0, y 1, x) = y1 y 0 g(y)dy Mi riconduco dunque al caso visto prima, da cui F 1(y 1 ) = g(y 1 ). Ma g(y 1 ) = f(x, y 1 ) e F 1(y 1 ) altro non è che la derivata della funzione F per y 0 e x fissati, quindi F 1(y 1 ) = F (y 0, y 1, x) y 1 Ricaviamo dunque F (y 0, y 1, x) y 1 = f(x, y 1 ) Per trovare la seconda formula che abbiamo scritto nella proposizione, basta ricordare che b a g(x)dx = a g(x)dx da cui b y1 y0 f(x, y)dy = f(x, y)dy y 0 y 1 92

99 7.2. Richiamo sugli integrali semplici Utilizzando questa formula e il risultato precendente, e scambiando il ruolo di y 0 e y 1 troviamo che vale 1 F (y 0, y 1, x) y 0 = f(x, y 0 ) Si può pensare, della F di voler calcolare anche la derivata parziale rispetto alla x. In tal caso vale la relazione F x = y1 f(x, y) y 0 x dy Valgono inoltre le seguenti proposizioni Proposizione Se f è di classe C 1 anche F è di classe C 1. Se si fa variare y in un certo intervallo definito da due funzioni dipendenti da x: α(x) y β(x), con α e β funzioni di classe C 0, possiamo definire la funzione F (x) = β(x) α(x) f(x, y)dy Proposizione Se le funzioni f, α e β sono di classe C 1 allora anche la funzione F (x) = β(x) α(x) f(x, y)dy è di classe C1 e vale β(x) F (x) = f(x, β(x))β (x) f(x, α(x))α (x) + α(x) Dimostrazione. Vediamo F (x) = F (α(x), β(x), x). Allora, per la derivazione delle funzioni composte: F (x) = F α(x) α (x) + F β(x) β (x) + F x f(x, y) dy x Applicando i risultati già visti per ciascuna di queste derivate parziali, ritroviamo l asserto. 7.2 Richiamo sugli integrali semplici Prima di vedere cosa sono gli integrali multipli (doppi o tripli), rivediamo brevemente cosa è un integrale definito di una funzione che dipende da una sola variabile: b a f(x)dx 1 Possiamo pensare di riscrivere la F come F (y 0, y 1, x) = R y 1 y f(x, y)dy = R y 0 0 y f(x, y)dy = G(y 1 1, y 0, x) dove G(y 1, y 0, x) = R y 0 y f(x, y)dy 1 Di G (avendo scambiato il ruolo di y 0 e y 1 ) sappiamo qual è la derivata rispetto a y 0 (secondo estremo di integrazione): Allora G y 0 = f(x, y 0 ) F (y 0, y 1, x) y 0 Ritroviamo dunque l asserto. = G y 0 = f(x, y 0 ) 93

100 7. INTEGRALI Figura 7.1: Come si arriva alla definizione di b a f(x)dx. dove a x b. Per integrali di questo tipo, diciamo che stiamo integrando la funzione f(x) nell intervallo [a, b]. I punti a e b si dicono estremi dell intervallo di integrazione. Il concetto di integrale di una funzione si deriva considerando l area che si trova sotto la curva definita da y = f(x) nell intervallo [a, b] (supponiamo per semplicità che la funzione f sia positiva, ma il concetto si generalizza a funzioni negative o che hanno valori sia positivi che negativi... il valore di un integrale può essere sia positivo che negativo, a seconda della funzione da integrare). Per calcolare l area sottesa dalla funzione y = f(x) possiamo pensare di dividere l intervallo [a, b] in n parti uguali, in modo da avere n sottointervalli di ampiezza x. In ciascuno di questi sottointervalli scegliamo un punto x i (ad esempio il punto medio di ciascuno dei sottointervalli) e consideriamo il rettangolo di ampiezza x e altezza f(x i ) (si veda Figura 7.1). Ciascuno di questi rettangoli ha area pari a f(x i ) x, quindi l integrale può essere approssimato mediante la somma delle aree di ciascun rettangolo: b a f(x)dx f(x 1) x + f(x 2) x f(x n) x) Per ottenere l area esatta della nostra funzione, facciamo il limite per n che tende all infinito. b a f(x)dx = lim n i=1 n f(x i ) x 7.3 Integrali doppi su domini rettangolari Vediamo ora cosa accade se abbiamo una funzione di due variabili f(x, y). Se per funzioni di una sola variabile integriamo su un intervallo (un sottoinsieme di R), per funzioni di due variabili ha senso integrare su una regione di R 2. Assumiamo di avere una regione di R 2 data dal rettangolo D = [a, b] [c, d]. Ciò vuol dire che a x b mentre c y d. Sia, inoltre, f(x, y) 0 per ogni coppia di punti (x, y) D, anche se quanto diremo ora si può estendere al caso più generale di funzioni che assumono valori sia positivi che negativi. La domanda che ci poniamo è la seguente: qual è il volume della regione che si trova sotto il grafico della funzione f(x, y) e sopra il piano xy? (si veda Figura 7.2) Per prima cosa cerchiamo di approssimare il volume (in maniera analoga a quanto abbiamo fatto per l area nel caso di funzioni di una sola variabile). Per far ciò dividiamo l intervallo [a, b] in n parti uguali e l intervallo [c, d] in m parti uguali, in modo da dividere D in tanti 94

101 7.3. Integrali doppi su domini rettangolari Figura 7.2: Grafico di una funzione f(x, y) sul rettangolo D. Figura 7.3: Suddivisione del rettangolo D in tanti rettangolini. rettangolini (ne abbiamo n m) e, in ciascuno di questi, scegliamo un punto di coordinate (x i, y j ) (si veda Figura 7.3). Su ciascuno di questi rettangolini, costruiamo una colonnina (un parallelogramma) di altezza data da f(x i, y j ). Ciascuno dei parallelogrammi ha un volume dato da f(x i, y j ) x y. Approssiamo il volume V che si trova sotto il grafico della funzione f(x, y) sommando i volumi di ciascun parallelogramma V n i=1 j=1 m f(x i, yj ) x y Prendendo suddivisioni lungo l asse x e y via via più raffinate, facendo cioè tendere all infinito n e m noi avremo una stima via via più accurata del volume V, vale a dire V = lim n n,m i=1 j=1 m f(x i, yj ) x y A questo punto abbiamo la definizione di integrale doppio (si noti la somiglianza con la definizione data per integrale definito per funzioni di una singola variabile). 95

102 7. INTEGRALI Indichiamo, infatti come integrale doppio della funzione f sul dominio dato dal rettangolo D proprio il volume V : D f(x, y)da = lim 7.4 Integrali iterati n n,m i=1 j=1 m f(x i, yj ) x y. Supponiamo che f sia una funzione continua nel rettangolo D = [a, b] [c, d]. Utilizziamo la notazione d f(x, y)dy per dire che x è costante e si integra la funzione rispetto alla variabile y c per y che varia da c a d. Una volta che abbiamo calcolato questo integrale, avremo un valore che dipende dal valore di x, quindi questo integrale definisce una funzione di x: A(x) = d c f(x, y)dy Adesso integriamo A rispetto a x, per x che varia in [a, b], ottenendo b [ b ] d A(x)dx = f(x, y)dy dx a a c L integrale scritto a destra dell equazione precedente prende il nome di integrale iterato. Di solito non si mettono le parentesi ma si scrive direttamente b d f(x, y)dydx: quindi prima a c integriamo rispetto a y da c a d e poi integriamo rispetto a x da a a b. Alla stessa maniera si può definire l integrale iterato dato da d b [ d ] b f(x, y)dxdy = f(x, y)dx dy c a c a In questo caso, prima integriamo rispetto alla variabile x da a a b e poi integriamo rispetto a y da c a d. Esempio Es Valutiamo xy2 dydx. Dobbiamo prima integrare rispetto alla variabile y, considerando x costante, ottenendo 3 2 xy 2 dy = ] 3 [x y3 3 2 = x 33 3 x23 3 = 19 3 x Il valore che abbiamo ottenuto corrisponde alla funzione A(x) introdotta prima. Integriamo questa funzione per x che varia da 0 a 4. Otteniamo xy 2 dydx = = [ xdx = ] xy 2 dy dx [ 19 3 x 2 ] 4 = =

103 7.5. Integrali doppi su domini generali Esempio Es Proviamo ora a calcolare xy2 dxdy. Questa volta dobbiamo integrare prima rispetto a x e poi rispetto a y. Abbiamo xy 2 dxdy = = = [ 4 0 [ x 2 2 y2 ] xy 2 dx dy ] 4 8y 2 dy = dy 0 ] 3 [8 y3 3 2 = 8( ) = Osserviamo come abbiamo ottenuto lo stesso risultato scambiando l ordine di integrazione. Si ha infatti il seguente teorema. Teorema (di Fubini) Se f(x, y) è una funzione continua su D = [a, b] [c, d] allora: o, f(x, y)da = b d f(x, y)dydx = d b D a c c a f(x, y)da = b ( ) d f(x, y)dy dx = d D a c c a f(x, y)dxdy ( ) b f(x, y)dx dy Quindi abbiamo due strade equivalenti per calcolare un integrale doppio di una funzione continua su un dominio rettangolare, riconducendoci a integrali di una sola variabile che sappiamo calcolare. Riassumendo: G nel primo caso b d ( b ) d f(x, y)da = f(x, y)dydx = f(x, y)dy dx D a c a noi prima calcoliamo l integrale che sta all interno (tra parentesi tonde), vale a dire, d f(x, y)dy considerando x come una costante e integrando rispetto alla variabile y. Come risultato avremo una funzione che dipende solo da x e sarà questa che poi andremo c a integrare tra a e b rispetto alla variabile x; G nel secondo caso d b ( d ) b f(x, y)da = f(x, y)dxdy = f(x, y)dx dy D c a c andiamo prima a calcolare l integrale b f(x, y)dx rispetto a x, considerando y come una a costante e poi andremo a integrare il risultato ottenuto rispetto a y nell intervallo [c, d]. 7.5 Integrali doppi su domini generali A differenza degli integrali di funzioni di una sola variabile, in cui il dominio di integrazione è sempre un intervallo, per integrali di funzioni di due variabili, il dominio di integrazione c a 97

104 7. INTEGRALI Figura 7.4: Dominio normale rispetto all asse x (sinistra) e rispetto all asse y (destra). non si riduce ad un rettangolo ma può avere una forma più generale. Consideriamo il caso in cui il dominio di integrazione sia un insieme limitato D (perciò esiste un rettangolo R che lo contiene). In tal caso l integrale di una funzione f(x, y) sul dominio R si può ricondurre all integrale di una funzione F (x, y) sul rettangolo R così definita: { f(x, y) se (x, y) appartiene a D F (x, y) = 0 se (x, y) appartiene a R ma non a D Allora D f(x, y)da = R F (x, y)da Da un punto di vista pratico, come calcolare questo integrale? La frontiera dell insieme D deve potersi esprimere mediante funzioni continue di x o di y. Ci sono due casi da considerare (si vedano Figure 7.4 e 7.5 per degli esempi) 1. Caso 1: l insieme D è dato da { } D = (x, y) R 2 t. c. a x b, g 1 (x) y g 2 (x) Si dice che il dominio è normale rispetto all asse x. 2. Caso 2: l insieme D è dato da { } D = (x, y) R 2 t. c. h 1 (y) x h 2 (y), c y d Si dice che il dominio è normale rispetto all asse y. Se il dominio è normale rispetto all asse x, vuol dire che prendendo una retta x = x 0 con a x 0 b, (normale dunque all asse x), i valori di y che sono compresi tra g 1 (x 0 ) e g 2 (x 0 ) giacciono tutti all interno del dominio di integrazione. Analogamente, nel caso in cui il dominio sia normale rispetto all asse y, prendendo la retta y = y 0 normale all asse y, con c y 0 d, si ha che tutti i punti di ordinata y 0 e di ascissa compresa tra h 1 (y 0 ) e h 2 (y 0 ) sono all interno del dominio di integrazione. In questi casi, il teorema di Fubini applicato al rettangolo R in cui uno dei due lati corrisponde con l intervallo [a, b] o [c, d] a seconda che il dominio sia normale rispetto all asse x o y, si riduce ad un integrale iterato in cui gli estremi dell integrale interno (da calcolare per primo) sono dati proprio dalle due funzioni g 1, g 2, o h 1, h 2 che delimitano la frontiera di D, in quanto all esterno la funzione F è nulla. Si ha il seguente teorema. Teorema (di Fubini) Data una funzione f(x, y) da integrare su un dominio D, 98

105 7.5. Integrali doppi su domini generali } Figura 7.5: A sinitra: D = {(x, y) R 2 : 1 y 2, y x y 3. Il dominio è normale rispetto { all asse y. A destra: D = (x, y) R 2 : 0 x 1, x 3 y } x. Il dominio è normale rispetto all asse x. Figura 7.6: Dominio dato dal triangolo di vertici (0, 3), (1, 1) e (5, 3) G nel caso in cui il dominio di integrazione è normale rispetto all asse x (Caso 1) si ha: b g2(x) f(x, y)da = f(x, y)dydx D a g 1(x) G nel caso in cui il dominio di integrazione è normale rispetto all asse y (Caso 2) si ha: d h2(y) f(x, y)da = f(x, y)dxdy D c h 1(y) Esaminiamo il Caso 1 (il discorso si ripete analogo per il Caso 2). Noi calcoliamo prima l integrale interno g 2(x) g 1(x) f(x, y)dy considerando x come costante, rispetto alla variabile y. Il risultato ora dipende da x in quanto gli estremi di integrazione sono funzioni di x. Una volta ottenuto questo integrale, integriamo il risultato rispetto alla variabile x con estremi a e b. A volte, un dominio può essere considerato normale sia rispetto all asse x sia rispetto all asse y. Altre volte può essere visto come unione di due domini. A seconda dell integrale che si deve fare, conviene scegliere di vederlo in un modo piuttosto che in un altro. 99

106 7. INTEGRALI Esempio Es Nel caso del triangolo mostrato in Figura 7.6, il dominio può essere visto come l unione di due domini normali rispetto all asse x, oppure come un dominio normale rispetto all asse y. Nel primo caso, D = D 1 D 2, in quanto la funzione g 1 (x) varia a seconda di dove si trovi x: D 1 = {(x, y) t.c. 0 x 1, 2x + 3 y 3} { 1 D 2 = (x, y) t.c. 1 x 5, 2 x + 1 } 2 y 3 Se riscriviamo le equazioni delle due rette y = 2x + 3 e y = 1 2 x in funzione di x otteniamo, dalla prima, x = 1 2 y + 3, e dalla seconda x = 2y 1, e possiamo scrivere 2 l insieme D come D = {(x, y) t.c. 12 y + 32 } x 2y 1, 1 y 3 Esempio Es Calcoliamo D x2 da dove D è l insieme delimitato dalle parabole y = 3x 2 e y = x Prima di tutta facciamo un grafico dell insieme D (si veda Figura 7.7). I punti di intersezione delle due parabole si hanno per 3x 2 = x cioè 2x 2 2 = vale a dire per x = ±1. Si vede facilmente che il dominio è normale rispetto all asse x: basta considerare 1 x 1 e 3x 2 y x Infatti la curva che delimita la porzione inferiore della frontiera dell insieme è data da y = 3x 2 mentre la porzione superiore della frontiera è y = x L integrale diventa D x 2 yda = = = = 1 x x 2 x 2 dydx [ x 2 y ] y=x 2 +2 y=3x 2 x 2 (x x 2 )dx 2x 2 2x 4 dx = ] 1 [2 x3 3 2x5 = = 8 15 Esempio Es Sia da calcolare l integrale y sin x2 dxdy. Se cerchiamo di valutare l integrale così come ci è stato presentato, abbiamo la difficoltà di dover valutare sin x 2 dx. Si tratta, infatti, di uno di quegli integrali impossibili da valutare mediante funzioni elementari! Ci conviene allora cambiare l ordine di integrazione. Cerchiamo allora di capire come { è fatto il dominio di integrazione } D. Da come è scritto l integrale, risulta D = (x, y) R 2 : 0 y 1, y x 1. Facciamo il grafico (si veda Figura 7.8). Questo dominio lo possiamo vedere come normale rispetto all asse x prendendo 0 x 1 e 0 y x. 100

107 7.6. Proprietà degli integrali doppi Figura 7.7: Dominio di integrazione delimitato dalle parabole y = 3x 2 e y = x Figura 7.8: Dominio di integrazione dell integrale y sin x2 dxdy. Quindi y sin x 2 dxdy = = = = 1 2 D 1 x 0 1 sin x 2 da sin x 2 dydx = x sin x 2 dx = d(x 2 ) dx sin x2 dx = [ y sin x 2 ] y=x y=0 dx 2x sin x 2 dx [ cos x 2 ] 1 0 = 1 (1 cos 1) Proprietà degli integrali doppi Assumendo che i seguenti integrali esistano, vediamone brevemente alcune proprietà: G D (f(x, y) + g(x, y)) da = D f(x, y)da + g(x, y)da D 101

108 7. INTEGRALI Figura 7.9: Esempio di trasformazione globalmente invertibile dall insieme S del piano uv all insieme R del piano xy. G D cf(x, y)da = c f(x, y)da, essendo c una costante. D G Se f(x, y) g(x, y) per tutti i punti (x, y) in D, allora D f(x, y)da g(x, y)da. D G Se D = D 1 D 2, dove D 1 e D 2 sono domini che non si sovrappongono ma possono avere al più solo punti della frontiera in comune, allora f(x, y)da = D f(x, y)da + D 1 f(x, y)da D 2 G Considerando la funzione di valore costante 1 si ha 1dA = area(d) D dove area(d) è l area dell insieme D (torneremo su questo punto più avanti). G Se m f(x, y) M per tutti i punti (x, y) in D, allora m area(d) f(x, y)da M area(d) 7.7 Cambiamento di variabili D A volte, il calcolo di un integrale si può semplificare operando un cambiamento di variabili. A tale scopo, per il calcolo di integrali doppi, consideriamo un cambiamento di variabili dato da una trasformazione T che permette di passare dal piano uv al piano xy: T (u, v) = (x, y) dove x e y sono legate a u e v mediante equazioni del tipo x = x(u, v), y = y(u, v) Questa trasformazione può essere vista come una funzione vettoriale r = (x(u, v), y(u, v)). L ipotesi fondamentale, allo scopo di calcolare un integrale doppio, è che la trasformazione ci permetta di ottenere tutti i punti del dominio di integrazione. Una trasformazione T è dunque una funzione in cui sia il dominio che il codominio sono sottoinsiemi di R 2. Se T (u 1, v 1 ) = (x 1, y 1 ) allora il punto (x 1, y 1 ) è l immagine del punto (u 1, v 1 ) mediante la trasformazione. Se la trasformazione è una corrispondenza biunivoca tra l insieme di definizione e il codominio della trasformazione, allora si può definire la trasformazione inversa T 1 e si dice che la trasformazione è globalmente invertibile (si veda Figura 7.9). Definizione Una trasformazione x = x(u, v) y = y(u, v) definita in un insieme aperto di R 2 si dice regolare se 1. è di classe C 1 2. è globalmente invertibile 102

109 7.7. Cambiamento di variabili Figura 7.10: Trasformazione dell elemento S nel piano uv nell elemento R nel piano xy. 3. in ogni punto (u, v) lo jacobiano risulta diverso da zero 2 x x (x, y) (u, v) = u v = x y y y u v y x u v 0 u v Un esempio di trasformazione regolare è dato dalle coordinate polari x = x(ρ, θ) = ρ cos (θ) y = y(ρ, θ) = ρ sin (θ) con ρ > 0 e 0 θ 2π. Cerchiamo di capire, ora, come un cambiamento di variabili agisca sul calcolo di un integrale doppio. Ricordiamo che, nel caso di un integrale di una funzione scalare il cambiamento di variabile porta alla tecnica della sostituzione: data una funzione f(x) da integrare in [a, b] si ha b a f(x)dx = d c f(g(u))g (u)du dove x = g(u), a = g(c), b = g(d). Nel caso di funzioni di due variabili, cosa si fa e per quale motivo? Significato dello jacobiano Consideriamo un rettangolino S nel piano uv il cui angolo in basso a sinistra è dato dal punto (u 0, v 0 ), e di dimensioni u e v. L immagine della regione S attraverso la trasformazione regolare T sia la regione R del piano xy. Uno dei punti della frontiera sia proprio l immagine del punto (u 0, v 0 ), cioè (x 0, y 0 ) = T (u 0, v 0 ). Si veda la Figura La trasformazione T sia data mediante due equazioni parametriche del tipo x = x(u, v) e y = y(u, v) che possiamo vedere come una funzione vettoriale r(u, v) = (x(u, v), y(u, v)). Il lato del rettangolino di S che si ha per v = v 0 viene trasformato in R mediante la curva r(u, v 0 ) (che dipende ora solo dal parametro u). Di questa curva il vettore tangente in u = u 0 (quindi al punto (x 0, y 0 )) è dato da r tu = ( x(u 0, v 0 ), y(u 0, v 0 ) ). u u Alla stessa maniera, troviamo che il vettore tangente alla curva r(u 0, v) nel punto v = v 0 è dato da r tv = ( x(u 0, v 0 ), y(u 0, v 0 ) ). v v 2 Si rimanda alla definizione per ricordare cosa è lo jacobiano. 103

110 7. INTEGRALI Figura 7.11: Approssimazione di R mediante i vettori secanti. La regione R = T (S) può essere approssimata dal parallelogramma dato dai vettori secanti (si veda Figura 7.11) dati da a = r(u 0 + u, v 0 ) r(u 0, v 0 ) b = r(u0, v 0 + v) r(u 0, v 0 ) Ricordando che r(u 0, v 0 ) r(u 0 + u, v 0 ) r(u 0, v 0 ) = lim u 0, e ricordando che la derivata u u parziale di una funzione vettoriale è data dalle derivate parziali delle singole componenti della funzione vettoriale, ricaviamo l approssimazione a = r(u 0 + u, v 0 ) r(u 0, v 0 ) u r u ma, per quanto detto prima, r u = r tu, da cui a = r(u 0 + u, v 0 ) r(u 0, v 0 ) u r tu. Con analogo ragionamento arriviamo all approssimazione b = r(u0, v 0 + v) r(u 0, v 0 ) v r tv. Quindi l area della regione R può essere approssimata attraverso dall area del parallelogramma di lati a e b cioè u r tu e v r tv. L area del parallelogramma determinato da due vettori è dato dal modulo del prodotto vettoriale dei due vettori stessi. Quindi l area di R si può approssimare tramite ( u r tu ) ( v r tv ). Si ha, quindi, area(r) a b = ( u r tu ) ( v r tv ) = r tu r tv u v Calcoliamo il prodotto vettoriale i j k x y r tu r tv = u u 0 x y 0 v v I sottodeterminanti delle componenti rispetto a x e a y sono nulli, da cui x y r tu r tv = u u k = x y k( x y u v x y v u ) v v 104

111 7.7. Cambiamento di variabili Figura 7.12: Cambio di variabili per il calcolo di integrali doppi: trasformazione della regione S nella regione R mediante la trasformazione regolare T. Ritroviamo lo jacobiano delle due funzioni x e y rispetto a u e v: (x, y) (u, v). Perciò, area(r) (x, y) (u, v) u v. Supponiamo, ora, di dover calcolare l integrale di una funzione f(x, y) su un dominio R f(x, y)da. Sia data una trasformazione regolare che trasforma un insieme S del piano uv R nella regione R. Suddividiamo il dominio R in elementini R ij, ciascuno dei quali è immagine di un rettangolino S ij di S. Su ciascuno di questi elementini R ij consideriamo un punto di coordinate (x i, y j ) che è immagine, mediante la trasformazione T, del punto (u i, v j ) che si trova sull angolo in basso a sinistra del rettangolino S ij (si veda la Figura 7.12). Allora l area R ij può essere approssimata mediante la relazione R ij (x, y) (u, v) u v dove u e v sono i lati del rettangolino S ij, mentre lo jacobiano è valutato in (u i, v j ). Allora m n f(x, y)da f(x i, y j ) R ij R i=1 j=1 m i=1 j=1 n f(x(u i, v j ), y(u i, v j )) (x, y) (u, v) u v A questo punto osserviamo che m n f(x(u i, v j ), y(u i, v j )) (x, y) (u, v) u v i=1 j=1 S f(x(u, v), y(u, v) (x, y) (u, v) dudv Si arriva perciò al seguente teorema (che non dimostriamo, però tutti i discorsi appena fatti ci portano a intuire che il risultato non può che essere così!). Teorema Sia data una trasformazione regolare T della regione S del piano uv alla regione R del piano xy. Inoltre sia assegnata una funzione f continua in R. Supponiamo che le regioni R e S siano domini normali rispetto all asse x o y. Allora f(x, y)da = f(x(u, v), y(u, v) (x, y) (u, v) dudv R S 105

112 7. INTEGRALI Figura 7.13: Aree corrispondenti nel piano θρ e nel piano xy. Figura 7.14: Insiemi S e R per il calcolo dell integrale 4x + 8ydA. R Esempio Es Consideriamo il caso della trasformazione data dalle coordinate polari, per cui x(ρ, θ) = ρ cos (θ) e y(ρ, θ) = ρ sin (θ). Il rettangolino θ ρ viene trasformato in una specie di rettangolino con i lati curvi. Il disegno mostrato in figura 7.13 è stato realizzato facendo variare θ nell intervallino [ 2π 3, 2π + 0.5] e ρ in [0.5, 0.75]. 3 Lo jacobiano di questa trasformazione è dato da (x, y) (ρ, θ) = cos (θ) ρ sin (θ) sin (θ) ρ cos (θ) = ρ cos2 (θ) + ρ sin 2 (θ) = ρ Perciò, se facciamo un cambiamento di variabili utilizzando coordinate polari si ha: f(x, y)da = f(ρ cos (θ), ρ sin (θ))ρ dρdθ R S 106

113 7.8. Area di un dominio Esempio Es Sia da calcolare 4x + 8ydA dove R è il parallelogramma di vertici A( 1, 3), R B(1, 3), C(3, 1) e D(1, 5). Si applichi la trasformazione x = 1 4 (u + v), y = 1 (v 4u). 4 Il parallelogramma R è rappresentato in Figura Se scriviamo le equazioni dei lati del parallelogramma si trova facilmente che la retta per AB è data dall equazione y + 3x = 0, la retta per CD è data da y + 3x = 8, la retta per BC è x y = 4 e infine quella per AD è x y = 4. Da queste relazioni, si vede che ponendo u = x y e v = y +3x, si ricava la trasformazione assegnata x = 1 4 (u + v), y = 1 (v 4u). Inoltre si vede che R è l immagine del rettangolo S 4 delimitato dalle linee u = 4, u = 4, v = 0 e v = 8. Se calcoliamo lo jacobiano delle funzioni x e y rispetto a u e v otteniamo Allora 1 (x, y) (u, v) = R x + 8ydA = = 1 4 = 1 4 = 1 4 (4 14 (u + v) (v 3u) ) 14 dudv = S (3v 5u)dvdu = 1 4 4(96 40u)du = [ 3 2 v2 5uv (u + v + 2v 6u) 1 4 dudv S ] v=8 [ 96u 20u 2 ] u=4 u= 4 = 192 du v=0 7.8 Area di un dominio Dagli integrali doppi si può ricavare un altra considerazione geometrica, sull area del dominio di integrazione. Come abbiamo già visto tra le proprietà degli integrali doppi, si ha area(d) = da D Proviamo a dimostrare questo risultato, supponendo che D sia un dominio normale rispetto all asse x, da cui a x b e g 1 (x) y g 2 (y). L area compresa tra le curve g 2 (x) e g 1 (x), vale a dire l area di D, può essere calcolata proprio come la differenze degli integrali delle due funzioni, tramite l integrale area(d) = b a (g 2 (x) g 1 (x))dx D altra parte, dalla definizione di integrale doppio, considerando la funzione f(x, y) = 1, 107

114 7. INTEGRALI Figura 7.15: Area di D come integrale doppio abbiamo D dxdy = = b g2(x) a b a ( g 1(x) dy)dx (g 2 (x) g 1 (x))dx e, per quanto abbiamo appena visto = area(d) 7.9 Cenni su integrali tripli L estensione del concetto di integrale di una funzione dipendente da due variabili ad una funzione dipendente da tre variabili porta al cosiddetto integrale triplo: f(x, y, z)dv. E Il caso più semplice si ha quando il dominio di integrazione E è rappresentato da un parallelepipedo [a, b] [c, d] [r, s]. Allora si ha: s d b f(x, y, z)dv = f(x, y, z)dxdydz E = = =. r c a b d s a c r d s b c r a f(x, y, z)dzdydx f(x, y, z)dxdzdy Abbiamo 6 diverse possibilità di integrazione, prima rispetto a x, poi rispetto a y, poi rispetto a z, oppure lungo y, x, z, o ancora... (tutte le possibili combinazioni che si hanno scambiando l ordine delle tre variabili). Il risultato che si ottiene non cambia (consideriamo l integrale di funzioni continue, in modo da estendere il teorema di Fubini). 108

115 7.10. Integrali curvilinei Si ha, inoltre, che il volume di una regione tridimensionale E è dato da un integrale triplo e, precisamente volume(e) = dv E Se la regione di integrazione E è più generale, le tecniche di integrazione sono estese su tre possibili tipi di dominio: 1. Primo caso: E = {(x, y, z) t.c. (x, y) D, u 1 (x, y) z u 2 (x, y)}, dove D è un regione nel piano xy (che a sua volta può essere visto come un dominio normale rispetto all asse x o rispetto all asse y). La regione E viene detta normale rispetto al piano xy e l integrazione per fili. [ ] u2(x,y) f(x, y, z)dv = f(x, y, z)dz da E D u 1(x,y) 2. Secondo caso: E = {(x, y, z) t.c. (y, z) D, u 1 (y, z) x u 2 (y, z)}, dove D è un regione nel piano yz (che a sua volta può essere visto come un dominio normale rispetto all asse y o rispetto all asse z). La regione E viene detta normale rispetto al piano yz. Se si riesce a vedere l insieme D come normale rispetto all asse z allora si parla di integrazione per strati o per sezione. [ ] u2(y,z) f(x, y, z)dv = f(x, y, z)dx da E D u 1(y,z) 3. Secondo caso: E = {(x, y, z) t.c. (x, z) D, u 1 (x, z) y u 2 (x, z)}, dove D è un regione nel piano xz (che a sua volta può essere visto come un dominio normale rispetto all asse x o rispetto all asse z). La regione E viene detta normale rispetto al piano xz. Se l insieme D lo si può vedere come normale rispetto all asse z allora si parla di integrazione per strati o per sezione. [ ] u2(x,z) f(x, y, z)dv = f(x, y, z)dy da E 7.10 Integrali curvilinei D u 1(x,z) Un integrale curvilineo (o di linea) ha lo scopo di integrare una funzione di due (o tre) variabili su un insieme di integrazione dato da una curva γ. Ci soffermiamo al caso bidimensionale (quindi funzioni di due variabili e curve nel piano xy). Consideriamo una curva γ regolare (la funzione vettoriale f che la rappresenta è continua e la sua derivata è diversa da zero per ogni valore del parametro t.) Quindi f(t) = (x(t), y(t)) con a t b. L integrale curvilineo di una funzione g(x, y) lungo la curva γ si denota con il simbolo g(x, y)ds dove ds rappresenta il differenziale dell ascissa curvilinea, dovuto al fatto che ci γ stiamo muovendo lungo la curva e non su l asse delle x o delle y. (dx ) 2 ( ) 2 dy Ricordiamo che ds = f (t) dt = + dt dt dt Allora, andando a sostituire nell integrale curvilineo e considerando la curva scritta in forma parametrica si ha: b (dx ) 2 ( ) 2 dy g(x, y)ds = g(x(t), y(t)) + dt dt dt γ a 109

116 7. INTEGRALI Per g(x, y) = 1 si ottiene la lunghezza della curva. Esempio Es Vogliamo calcolare γ (4+xy2 )ds dove γ è la porzione di circonferenza di centro nell origine e raggio unitario che si ha 1 x 0. Scriviamo le equazioni parametriche della curva γ: x = cos t, y = sin t, L integrale da calcolare diventa γ (4 + xy 3 )ds = = 3π/2 π/2 3π/2 π/2 π 2 t 3 2 π (4 + cos t sin 2 t) sin 2 t + cos 2 tdt (4 + D(sin t) sin 2 t)dt = [ ] 3π/2 4t + sin3 t = 4π 2 3 π/2 3 Se la curva è regolare a tratti, l integrale curvilineo si scrive come somma degli integrali curvilinei su ciascun tratto di curva regolare di cui è composta. In pratica se γ = γ 1 γ 2... γ n con n numero intero, allora g(x, y)ds = γ g(x, y)ds + γ 1 g(x, y)ds γ 2 g(x, y)ds. γ n Ogni curva ha un suo orientamento. cambia l integrale curvilineo? Se cambiamo la direzione di moto della curva, Proposizione Se si cambia l orientamento di una curva, passando dalla curva +γ alla curva γ l integrale curvilineo non cambia: g(x, y)ds = g(x, y)ds γ γ Se +γ è data dalle equazioni parametriche (x(t), y(t)) con a t b, (primo punto A = (x(a), y(a)), ultimo punto B = (x(b), y(b))), la curva γ ha equazioni (x( t), y( t)) con t che varia in [ b, a], (primo punto (x(b), y(b)) = B, ultimo punto (x(a), y(a)) = A). Le curve sono le stesse a parte l orientamento, ma questo non influisce sul risultato dell integrale curvilineo Integrali di superficie Cerchiamo ora di integrare una funzione su una superficie S nello spazio tridimensionale Area di una superficie Per capire le formule che scriveremo nel seguito, deriviamo la formula che permette di calcolare l area di una superficie data da equazioni parametriche x = x(u, v), y = y(u, v), z = z(u, v), equazioni che possiamo scrivere tramite la funzione vettoriale r(u, v) = (x(u, v), y(u, v), z(u, v)). Con un discorso del tutto simile a quanto abbiamo visto nella sezione 7.7 sul cambiamento di variabile, chiamando però adesso D come l insieme in cui varia (u, v) e S la superficie parametrica, suddividendo D in rettangolini D ij, in S si hanno i corrispondenti elementini S ij. Inoltre, se (u i, v j ) è il vertice in basso a sinistra di D ij, il punto P ij (x(u i, v j ), y(u i, v j ), z(u i, v j )) è il corrispondente punto su S ij. L area dell elementino S ij può essere approssimata mediante il parallelogramma di lati u r u (u i, v j ) e v r v (u i, v j ) dove r u e r v rappresentano la 110

117 7.11. Integrali di superficie derivata di r rispetto alle variabili u e v, rispettivamente. Il discorso da fare è del tutto analogo a quanto abbiamo visto nella sezione 7.7. L area del parallelogramma, che approssima l area dell elementino, è dunque uguale al modulo del prodotto vettoriale di u r u (u i, v j ) e v r v (u i, v j ). L area della superficie sarà dunque data dalla somma di tutte queste aree, facendo tendere a infinito il numero degli elementini in cui suddividiamo la superficie. Si ha infatti la definizione Definizione Data una superficie S di equazione r(u, v) = (x(u, v), y(u, v), z(u, v)), con (u, v) D, allora l area della superficie è data da area(s) = r u r v da D dove r u = ( x u, y u, z u ) e r v = ( x v, y v, z v ). Nel caso in cui la superficie è data da una funzione z = f(x, y), possiamo ricondurci al caso precedente considerando r(u, v) = r(x, y) = (x, y, f(x, y)). In tal caso i j k 1 0 r u r v = 0 1 f x f y ( f ) 2 Perciò r u r v = + x A(S) = D ( f ) 2 + x = ( f x, f y, 1) ( ) 2 f + 1 e l area della superficie è y ( ) 2 f + 1dA y Integrale di una superficie Siamo ora in grado di capire la formula da applicare nel caso in cui bisogna calcolare l integrale di una funzione g su una superficie S. L area dell elementino ds si riconduce alla formula dell area di una superficie che abbiamo appena visto. Perciò, se la superficie S è data mediante una funzione z = f(x, y), con (x, y) D R 2, l integrale di superficie di una funzione g(x, y, z) sulla superficie S è dato da S g(x, y, z)ds = D ( f ) 2 g(x, y, f(x, y)) + x ( ) 2 f + 1dA y Dobbiamo prestare molta attenzione a questo tipo di integrali perchè l integrale a destra è un integrale doppio mentre l integrale a sinistra è un integrale di superficie. Quindi il calcolo di un integrale di superficie si riconduce ad un integrale doppio. La superficie potrebbe essere scritta come y = f(x, z) o x = f(y, z). La definizione di integrale di superficie è analoga (con le dovute sostituzioni) a quella appena scritta. Se la superficie, invece, è scritta in forma parametrica : x = x(u, v) y = y(u, v) z = z(u, v) (u, v) I 111

118 7. INTEGRALI allora si ha g(x, y, z)ds = g(x(u, v), y(u, v), z(u, v)) r u r v da S I dove r u r v rappresenta il modulo del prodotto vettoriale dei vettori che si hanno derivando parzialmente rispetto a u e rispetto a v le equazioni parametriche della superficie, in modo da poter avere l area dell elementino di superficie ds. Quindi i j k y z x z x y x y z u u u u n = r u r v = u u u = i j + y z x z u u k x y x y z v v v v v v v v v scambiamo le colonne del sottodeterminante relativo a j y z z x x y u u u u = i + j + y z z x u u k x y v v v v v v osserviamo che i sottodeterminanti sono degli jacobiani = i (y, z) (u, v) + j (z, x) (u, v) + k (x, y) (u, v) Chiamando con n 1, n 2 e n 3 le componenti del vettore normale appena ottenuto, n 1 = (y, z) (u, v), n 2 = (z, x) (u, v) e n 3 = (x, y) (u, v), il modulo di n è dato da n = (n 1 ) 2 + (n 2 ) 2 + (n 3 ) 2. Quindi g(x, y, z)ds = g(x(u, v), y(u, v), z(u, v)) r u r v da S D = g(x(u, v), y(u, v), z(u, v)) (n 1 ) 2 + (n 2 ) 2 + (n 3 ) 2 da D Se g(x, y, z) = 1 l integrale di superficie ci fa ritrovare l area della superficie. Esempio Es Calcoliamo l integrale di superficie I = yzds dove S è la superficie di S equazioni parametriche x = u 2, y = u sin (v), z = u cos (v), con 0 u 1 e 0 v π/2. L integrale da calcolare diventa l integrale doppio I = D u sin (v)u cos (v) r u r v dudv = 1 π/2 0 0 u 2 sin (v) cos (v) r u r v dvdu Calcoliamo il modulo del prodotto vettoriale. Abbiamo i j k r u r v = 2u sin (v) cos (v) 0 u cos (v) u sin (v) =... = i( u) + j(2u 2 sin (v)) + k(2u 2 cos (v)) 112

119 7.12. Solidi e superfici di rotazione Perciò, quando calcoliamo il modulo, abbiamo (consideriamo anche 0 u 1): r u r v = u 2 + 4u 4 sin 2 (v) + 4u 4 cos 2 (v) = u 1 + 4u 2 L integrale è I = 1 π/2 0 0 u 2 sin (v) cos (v)u 1 + 4u 2 dvdu = 1 π/2 0 0 u u 2 sin (v) cos (v)dvdu Osserviamo che abbiamo funzioni che dipendono solo da v e funzioni che dipendono solo da u, perciò le funzioni che dipendono solo da u, le possiamo portare fuori dall integrale in v, ricavando Ora I = π/ u 3 π/ u 2 sin (v) cos (v)dvdu 0 sin (v) cos (v)dv = π/2 0 sin (v)d(sin (v))dv = sin2 (v) 2 Andando a sostituire nell integrale doppio abbiamo I = u u 2 du Facciamo un cambiamento di variabili ponendo t = 1+4u 2 da cui u 2 = t 1 e 2udu = dt 4 4, ovvero udu = dt. Inoltre, per u = 0 si ha t = 1 e per u = 1 si ha t = 5. Quindi 8 I = 1 2 = 1 64 = u u 2 udu = 1 2 (t t t)dt = t5/ t3/ t 1 dt t 4 8 (t 3/2 t 1/2 )dt =... = π/2 0 = Solidi e superfici di rotazione Vediamo da un punto di vista matematico i concetti di massa e baricentro (usualmente visti in fisica). Ci serviranno successivamente per calcolare il volume di un solido o l area di una superficie ottenuti, rispettivamente, mediante rotazione di una superficie o di una curva attorno ad uno degli assi. Ci limitiamo a vedere le definizioni di massa, momenti e baricentro, per il caso bidimensionale. Definizione Si definisce massa di un oggetto piano che riempe una regione C, con densità data da µ(x, y) (funzione continua), la quantià m data da m = µ(x, y)dxdy C 113

120 7. INTEGRALI Se un oggetto piano riempe una regione C con densità µ(x, y) (continua), i suoi momenti sono dati da M x = yµ(x, y)dxdy C M y = xµ(x, y)dxdy C Il baricentro (o centro di massa) dell oggetto è il punto (x, y) dato da (m essendo la massa) x = M y m = xµ(x, y)dxdy C µ(x, y)dxdy C y = M x m = yµ(x, y)dxdy C µ(x, y)dxdy C Nel caso di una curva piana γ, omogenea e con densità µ 1, si ha: G la massa m è data da m = ds = m = L (la lunghezza della curva) γ G i momenti sono M x = yds M y = G il baricentro ha coordinate x = M y L = 1 xds L γ γ γ xds y = M x L = 1 L γ Definiamo, a questo punto, il solido di rotazione. Sia D un insieme del piano (x, y), chiuso e limitato (e integrabile). Per semplicità i valori di y siano positivi. Una rotazione del piano (x, y) intorno all asse x (o y) fa sì che l insieme D generi un solido I nello spazio (x, y, z), che chiamiamo solido di rotazione. Per calcolare il volume di un solido di rotazione si ha il Teorema (Primo teorema di Guldino) Il volume dell insieme I, solido di rotazione ottenuto dall insieme D è uguale all area di D per la lunghezza della circonferenza descritta nella rotazione dal baricentro di D. Supponendo che la rotazione sia fatta attorno all asse x, il raggio della circonferenza descritta dal baricentro è data dall ordinata del baricentro (si considera µ 1). Quindi yds volume(i) = area(d) lunghezza della circonferenza volume(i) = area(d) 2π raggio della circonferenza volume(i) = area(d)2π y D volume(i) = area(d)2π ydxdy D dxdy D volume(i) = area(d)2π ydxdy area(d) = 2π ydxdy D 114

121 7.12. Solidi e superfici di rotazione Figura 7.16: Insieme D da cui calcolare il volume del solido di rotazione attorno all asse x. Se la rotazione di D avviene attorno all asse y, il volume del solido di rotazione è data da volume(i) = 2π xdxdy D perchè la circonferenza descritta dal baricentro ha raggio dato da x. Definiamo, ora, la superficie di rotazione. Sia γ una curva generalmente regolare del piano (x, y). Sia y > 0. Consideriamo l asse z ortogonale in (0, 0) al piano (x, y). Una rotazione del piano (x, y) intorno all asse x (o y) fa sì che la curva γ generi una superficie S nello spazio (x, y, z), che chiamiamo superficie di rotazione. Per misurare l area di una superficie di rotazione si ha il Teorema (Secondo teorema di Guldino) L area della superficie di rotazione S generata dalla curva γ è uguale alla lunghezza della curva per la lunghezza della circonferenza descritta nella rotazione dal baricentro di γ. Sia γ data da equazioni parametriche x = x(t), y = y(t) con t [a, b] e di lunghezza L. La superficie sia ottenuta mediante rotazione attorno all asse x. Allora la circonferenza ha raggio y con y = 1 L γ yds = 1 b L a y(t) (x (t)) 2 + (y (t)) 2 dt. Allora area(s) = lunghezza della curva lunghezza della circonferenza area(s) = L2π y area(s) = L2π 1 L area(s) = 2π b a b a y(t) (x (t)) 2 + (y (t)) 2 dt y(t) (x (t)) 2 + (y (t)) 2 dt Se la rotazione avviene attorno all asse y invece si ha area(s) = 2π b a x(t) (x (t)) 2 + (y (t)) 2 dt 115

122 7. INTEGRALI Esempio Es Calcoliamo il volume del solido di rotazione ottenuto dalla rotazione completa attorno all asse x dell insieme { D = (x, y) R 2 : x 2 + y 2 3 } 4, x2 y, y 0, x 0 Per calcolare questo integrale dobbiamo applicare il primo teorema di Guldino. Il volume richiesto sarà dato da V = 2π ydxdy D L insieme D è dato dalla regione compresa al di sotto della parabola y = x 2 e all interno della circonferenza con centro nell origine e raggio r = 3/2, che si trova nel primo quadrante (si veda Figura 7.16). Cerchiamo i punti di intersezione tra la parabola e la circonferenza risolvendo il sistema y = x 2 x 2 + y 2 = 3 4 Sostituendo y = x 2 nella seconda equazione si ha x 2 + x 4 = 3. Con la sostituzione 4 t = x 2 l equazione diventa t 2 + t 3 4 = 0 da cui t = 1 ± = 1 ± 2 : quindi 2 2 le due radici sono t = 1 2 e t = 3 2. Ritornando a x2 = t, si ha come soluzione del primo quadrante il punto x = 1 e y = 1. Per calcolare l integrale, possiamo vedere il 2 2 dominio di integrazione come normale rispetto all asse x, considerando l unione di due insiemi, il primo dato da 0 x 1, e 0 y x 2, e il secondo dato da 1 x e 3 0 y 4 x2. Quindi l integrale da calcolare va spezzato in due integrali su questi domini. Oppure, si può vedere il dominio di integrazione normale rispetto all asse y, con 0 y 1 2 e y x 3 4 y2. In tal caso l integrale diventa Si ha V = V = 1/2 0 1/2 0 = y2 y ydxdy 3 y( 4 y2 y)dy = 3 ( 2y) 4 y2 dy 1/2 0 1/2 0 1/2 0 3 y 4 y2 dy y 3/2 dy = 1 2 1/2 0 1/2 0 y ydy D( y2 ) 4 y2 dy 2 5 y5/2 1/

123 7.12. Solidi e superfici di rotazione = 1 2 Esempio = (3 4 y2 ) 3/2 1/ = 1 3 (1 2 )3/ (3 4 )3/ = = Es L arco di parabola y = x 2 per 1 x 2 è ruotato attorno all asse y. Vogliamo trovare l area della superficie di rotazione. In questo caso dobbiamo applicare il secondo teorema di Guldino, vedendo la parabola come la curva di coordinate parametriche x = x, y = x 2, per cui Quindi area(s) = 2π area(s) = 2π 1 x 1 + 4x 2 dx. 8x 8 = 1 4 π 2(1 + 4x2 ) 3/ x2 dx = π D(1 + 4x 2 ) 1 + 4x 2 dx = 1 6 π( ) 2 1 = 1 6 π(173/2 5 3/2 ) 1 117

124

125 CAPITOLO 8 Equazioni differenziali ordinarie L ignoranza per la matematica viene considerato un fatto positivo, a un certo livello della classe sociale. Eppure la matematica ha determinato la direzione e il contenuto di buona parte del pensiero filosofico, ha distrutto e ricostruito dottrine religiose, ha costituito il nerbo di teorie economiche e sociali, ha plasmato i principali stili pittorici, musicali, architettonici e letterari. Morris Kline ( ) 8.1 Cosa è un equazione differenziale? Il problema di Cauchy in locale Teorema di Cauchy (esistenza e unicità globale) Definizioni Equazioni differenziali lineari del primo ordine Metodo di separazione delle variabili Risoluzione di alcuni tipi di equazioni differenziali Le equazioni differenziali lineari Cosa è uno spazio vettoriale? L equazione omogenea L equazione non omogenea Equazioni lineari a coefficienti costanti Metodo dei coefficienti indeterminati Cosa è un equazione differenziale? Un equazione differenziale è un equazione che coinvolge una funzione incognita y = y(x) (che dipende dalla sola variabile x) e le sue derivate. Usualmente si parla di equazione differenziale ordinaria 1 in quanto la funzione incognita, essendo funzione di una sola variabile, ammette derivate ordinarie e non derivate parziali. 1 In inglese si dice: Ordinary Differential Equation, da cui la sigla ODE. 119

126 8. EQUAZIONI DIFFERENZIALI ORDINARIE Un esempio di equazione differenziale lineare è dato da y (n) + a n 1 (x)y (n 1) a 1 (x)y + a 0 (x)y = b(x) dove i coefficienti a 0 (x), a 1 (x),..., a n 1 (x) e b(x) sono assegnate funzioni continue che dipendono dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate fino a quella di ordine n. Usiamo infatti la notazione y (n) per indicare dn y dx n. Se nell equazione differenziale compaiono le derivate di y fino all ordine n, allora si dice che l equazione differenziale ha ordine (o grado) n. Bisogna quindi vedere l ordine più elevato della derivata che appare nell equazione per capire l ordine dell equazione differenziale. Per n = 1, l equazione differenziale di prima diventa y + a(x)y = b(x) Per n = 2 si ha, invece, y + a 1 (x)y + a 0 (x)y = b(x) Il caso più generale di un equazione differenziale di ordine n è dato da un equazione che ha come variabili x, la funzione incognita y e le sue derivate fino all ordine n, mediante una funzione continua F (in genere non lineare): F (x, y, y,..., y (n) ) = 0 L esempio di prima, di equazione differenziale lineare, ha come F la funzione F (x, y, y,..., y (n) ) = y (n) + a n 1 (x)y (n 1) a 1 (x)y + a 0 (x)y b(x) Risolvere un equazione differenziale (si dice anche integrare un equazione differenziale) vuol dire cercare le possibili (ve ne possono essere più di una) funzioni del tipo y = y(x) definite per x che varia in un opportuno intervallo [a, b], continue e derivabili n volte in [a, b] in modo che sia soddisfatta l equazione differenziale data. Le funzioni y = y(x) che soddisfano l equazione differenziale si dicono soluzioni o integrali dell equazione differenziale. Se un equazione differenziale può essere scritta nella forma y (n) = f(x, y, y,..., y (n 1) ) con f funzione continua allora si dice che l equazione differenziale è in forma normale. Esempio Es Data f, funzione continua in [a, b], si vuole risolvere y (x) = f(x) x [a, b] Questo problema equivale a quello di trovare una primitiva della funzione f, una funzione, cioè, la cui derivata coincide con f. Ogni funzione della forma y(x) = F (x) + y 0 con y 0 costante e F una primitiva di f è soluzione del problema assegnato, ovvero dell equazione differenziale. Come primitiva di f, dal teorema fondamentale del calcolo integrale, sappiamo che possiamo scrivere F (x) = x x 0 f(t)dt dove x 0 è un numero reale fissato in [a, b]. Quindi y(x) = x x 0 f(t)dt + y 0 è soluzione del problema dato. 120

127 8.2. Il problema di Cauchy in locale L esempio che abbiamo descritto ora è molto particolare. Infatti si ha che la soluzione y(x) per x = x 0 vale proprio la costante y 0 : y(x 0 ) = x0 x 0 f(t)dt + y 0 = y 0 In questo caso, si dice che y(x) è soluzione del problema di Cauchy dato da { y (x) = f(x) y(x 0 ) = y 0 dove y(x 0 ) = y 0 rappresenta la condizione iniziale e x 0 il punto iniziale da cui far partire la soluzione al problema. Vediamo dunque cosa è un problema di Cauchy. 8.2 Il problema di Cauchy in locale Partiamo dal considerare l equazione differenziale y = f(x, y) Se la f è non lineare, è ragionevole aspettarsi che le soluzioni dell equazioni differenziale siano definite non in un intervallo assegnato a priori ma solo in un intorno di un punto iniziale assegnato. Fissati, dunque, x 0 e y 0, supponiamo che: 1. la f sia definita in un intorno rettangolare I J del punto (x 0, y 0 ) del tipo (siano a e b assegnati) { } I J = (x, y) R 2 t.c x 0 a x x 0 + a, y 0 b y y 0 + b 2. la f sia continua in I J 3. la derivata parziale della f rispetto a y, f, sia continua in I J. y Sotto queste ipotesi esiste un intorno di x 0, [x 0 δ, x 0 + δ] ed un unica funzione y = y(x) derivabile in [x 0 δ, x 0 + δ] che è soluzione del problema di Cauchy dato da { y (x) = f(x, y) y(x 0 ) = y 0 Abbiamo appena stabilito una formulazione del teorema di Cauchy di esistenza e unicità locale (in piccolo). Teorema (Teorema di Cauchy (in piccolo) per equazioni differenziali del primo ordine) Sia f = f(x, y) una funzione reale definita nell intervallo I J (definito in precedenza). Se f e la sua derivata f sono funzioni continue in I J, allora esiste un numero δ > 0 ed esiste y una ed una sola funzione y = y(x) derivabile in [x 0 δ, x 0 + δ], soluzione in tale intervallo del problema di Cauchy { y (x) = f(x, y) y(x 0 ) = y 0 121

128 8. EQUAZIONI DIFFERENZIALI ORDINARIE Per equazioni differenziali di ordine n, il problema di Cauchy prevede condizioni iniziali non solo sulla funzione incognita y ma anche sulle sue derivate fino a quella di ordine n 1. Consideriamo, infatti, un punto (x 0, y 0, y 0, y 0,..., y (n 1) 0 ) R R n. Sia I l intervallo [x 0 a, x 0 + a] (con a R), e J sia un intorno di R n del punto Y 0 = (y 0, y 0, y 0,..., y (n 1) 0 ), quindi J = {Y R n t.c. Y Y 0 b} dove b R e Y Y 0 è il modulo del vettore Y Y 0 (quindi se Y = (y 1, y 2, y 3,..., y n ) si ha Y Y 0 = (y 0 y 1 ) 2 + (y 0 y 2) (y (n 1) 0 y n ) 2 ). Vale il seguente teorema. Teorema (Teorema di Cauchy in piccolo per eq. differenziali di ordine n) Sia f = f(x, y 1, y 2, y 3,..., y n ) una funzione definita per x I e (y 1, y 2,..., y n ) J (I e J definiti prima). Sia f continua insieme alle derivate parziali fatte rispetto a y 1, y 2,..., y n. Allora esiste un numero reale δ > 0 ed una ed una sola funzione y(x), derivabile n volte in [x 0 δ, x 0 + δ], che è soluzione del seguente problema di Cauchy: y (n) = f(x, y, y, y,..., y (n 1) ) y(x 0 ) = y 0 y (x 0 ) = y 0 y (x 0 ) = y 0. y (n 1) (x 0 ) = y (n 1) 0 Con il teorema di Cauchy di esistenza e unicità locale, sono date delle condizioni sufficienti per risolvere localmente, in piccolo, il problema di Cauchy, determinando una soluzione in un intorno del punto iniziale x Teorema di Cauchy (esistenza e unicità globale) A volte è importante stabilire l esistenza della soluzione del problema di Cauchy per un equazione differenziale ordinaria in un intervallo prefissato (quindi non in un intorno di x 0 ), cioè assegnato a priori, in cui l equazione differenziale è definita. Per stabilire delle condizioni sufficienti per risolvere globalmente, o in grande, il problema di Cauchy, occorre avere condizioni più restrittive sulla funzione f. Nel caso di un equazione differenziale del primo ordine, si hanno queste condizioni: 1. f(x, y) è definita in una striscia verticale di R 2 data da { } [a, b] R = (x, y) R 2 t.c. x [a, b], y R 2. f è continua 3. la derivata parziale di f rispetto a y è continua e limitata, quindi f(x, y) y L per ogni (x, y) [a, b] R, con L numero reale positivo. In queste ipotesi, esiste una ed una sola funzione y(x) che risolve il problema di Cauchy { y (x) = f(x, y) y(x 0 ) = y 0 Possiamo enunciare il teorema: 122

129 8.4. Definizioni Teorema (Teorema di esistenza e unicità globale (caso di eq. diff. del primo ordine)) f(x, y) Se f = f(x, y) è continua in [a, b] R e la sua derivata è continua e limitata in [a, b] R, y allora per ogni x 0 ]a, b[ e per ogni y 0 R esiste una ed una sola funzione y = y(x), derivabile in [a, b] che risolve su tutto l intervallo [a, b] il problema di Cauchy { y (x) = f(x, y) y(x 0 ) = y 0 Per equazioni differenziali di ordine n il teorema precedente si generalizza considerando funzioni f = f(x, y 1, y 2, y 3,..., y n ) = f(x, Y ) definite nella striscia [a, b] R n con { } [a, b] R n = (x, Y ) = (x, y 1, y 2, y 3,..., y n ) R n+1, con x [a, b], y 1 R,..., y n R Teorema (Teorema di esistenza e unicità globale (caso di eq. diff. di ordine n)) Se f = f(x, y 1, y 2, y 3,..., y n ) è continua in [a, b] R n e le derivate parziali fatte rispetto a y 1, y 2,..., y n sono continue e limitate in [a, b] R n, allora per ogni x 0 ]a, b[ e per ogni punto di R n dato da (y 0, y 0,..., y (n 1) 0 ) esiste una ed una sola funzione y(x), derivabile n volte in [a, b], che è soluzione del seguente problema di Cauchy: y (n) = f(x, y, y, y,..., y (n 1) ) y(x 0 ) = y 0 y (x 0 ) = y 0 y (x 0 ) = y 0. y (n 1) (x 0 ) = y (n 1) Definizioni Consideriamo ora un equazione differenziale del primo ordine e introduciamo le seguenti definizioni. G Per integrale generale si intende l insieme delle soluzioni dell equazione differenziale che varia al variare di una costante c: qualunque sia la coppia (x 0, y 0 ) si può stabilire il valore della costante c tale che y(c, x 0 ) = y 0. G Per integrale particolare si intende invece una soluzione particolare dell equazione differenziale: fissata una coppia (x 0, y 0 ) esiste una costante c tale che y(c, x 0 ) = y 0. G Si ha invece un integrale singolare se, data una coppia (x 0, y 0 ), non esiste una costante c tale che y(c, x 0 ) = y 0, vale a dire che per quella coppia di dati, la soluzione dell equazione differenziale non rientra in un integrale particolare. 8.5 Equazioni differenziali lineari del primo ordine Sia y = f(x, y) con f funzione lineare in y, del tipo f(x, y) = b(x) a(x)y. Si ha, quindi, per l equazione differenziale: y = f(x, y) = y = b(x) a(x)y = y + a(x)y = b(x) Vediamo ora tutti i passaggi per trovare l integrale generale di questa equazione differenziale. 1. Sia A(x) = a(x)dx una primitiva di a(x). Poniamo m(x) = e A(x). 123

130 8. EQUAZIONI DIFFERENZIALI ORDINARIE 2. Moltiplichiamo l equazione differenziale per m(x), ottenendo: m(x)y (x) + m(x)a(x)y(x) = m(x)b(x) (8.1) 3. Consideriamo ora la derivata di m(x). Si ha dm(x) dx = dea(x) dx A(x) da(x) = e = m(x) da(x) dx dx ma essendo A(x) una primitiva di a(x) vuole dire che da(x) dx dm(x) dx = m(x)a(x) = a(x), da cui si ricava 4. Facciamo ora la derivata di y(x)m(x). Abbiamo da fare la derivata di un prodotto di funzioni, da cui d(y(x)m(x)) dx = dy(x) dx m(x) + y(x)dm(x) dx La derivata di m(x) l abbiamo appena ricavata, la derivata di y(x) è y (x), da cui d(y(x)m(x)) dx = m(x)y (x) + m(x)a(x)y(x) Abbiamo trovato il primo membro dell equazione Possiamo quindi riscrivere l equazione 8.1 come d(y(x)m(x)) dx = m(x)b(x) 6. Integrando ambo i membri dell equazione e dividendo poi per m(x) (diversa da zero perche è e A(x) ) si ha dy(x)m(x) dx = m(x)b(x)dx + costante dx y(x)m(x) = m(x)b(x)dx + costante y(x) = 1 ( ) m(x)b(x)dx + costante m(x) 7. Riscrivendo la funzione m(x) come e A(x) si ha ( ) y(x) = e A(x) e A(x) b(x)dx + costante L integrale è generale perchè dipende da una costante. Osserviamo, inoltre, che se a(x) e b(x) sono continue in un certo intervallo [a, b], allora il problema di Cauchy che possiamo associare a questa equazione differenziale si può risolvere globalmente in [a, b] R poichè valgono le ipotesi del teorema di esistenza e unicità globale (la funzione f = b(x) a(x)y è continua e la derivata f = a(x) è continua e limitata (poichè a(x) y dipende solo da x ed è continua in un intervallo chiuso allora ammette minimo e massimo, cioè è limitata). 124

131 8.6. Metodo di separazione delle variabili Esempio Es Risolviamo l equazione differenziale y + 4xy = x. In questo esempio a(x) = 4x e b(x) = x. Applichiamo il procedimento appena descritto. G A(x) = a(x)dx = 4xdx = 2x 2 da cui m(x) = e 2x2. G Moltiplichiamo l equazione differenziale per m(x) ricavando: e 2x2 y (x) + e 2x2 4xy(x) = e 2x2 x G Abbiamo allora dy(x)e 2x2 dx = e 2x2 x G Integrando ambo i membri e dividendo poi per e 2x2 si ha y(x) = e 2x2 e 2x2 xdx Dobbiamo quindi calcolare e 2x2 xdx: considerando che la derivata dell esponente è 4x, basta moltiplicare e dividere per 4 ottenendo: e 2x2 xdx = 1 4xe 2x2 dx = 1 D(2x 2 )e 2x2 dx = 1 + costante e2x2 Quindi y(x) = e 2x2 ( 1 4 e2x2 + costante) = Ce 2x2 dove C rappresenta la costante. 8.6 Metodo di separazione delle variabili Se un equazione differenziale del primo ordine può essere scritta nella forma y (x) = p(x)q(y) con p(x) e q(y) continue, allora l equazione si dice a variabili separabili. Vediamo come si risolve questa equazione nel caso in cui q(y) 0 per ogni y. In tal caso, possiamo dividere ambo i membri per q(y), ottenendo y (x) q(y) = p(x) Integriamo ambo i membri dell equazione rispetto a x, ricavando: y (x) q(y(x)) dx = p(x)dx (8.2) In modo equivalente possiamo scrivere anche 1 q(y) dy = p(x)dx 125

132 8. EQUAZIONI DIFFERENZIALI ORDINARIE Sia Q(y) una primitiva di dq(y(x)) dx = dq(y(x)) dy 1 e P una primitiva di p. Vuol dire che q(y) dy dx = 1 q(y(x)) y (x), dp (x) mentre = p(x). Tornando alla relazione 8.2, poichè abbiamo trovato le primitive di dx ciascuno dei due integrali, si ha Q(y(x)) = P (x) + costante Se è possibile esplicitare la y allora abbiamo una forma esplicita della soluzione (e questo lo si ha se la Q è invertibile), altrimenti abbiamo una forma implicita della soluzione mediante la relazione Q(y(x)) P (x) = costante. Esempio Es Sia da risolvere il problema di Cauchy, y = x2 con la condizione iniziale y(0) = y2 4. Risolviamo prima l equazione differenziale, applicando il metodo di separazione delle variabili (p(x) = x 2, q(y) = 1 ). Separando le variabili infatti, abbiamo da risolvere: y2 ovvero y 2 dy = x 2 dx y 3 3 = x3 3 + costante Risolvendo ora per y (che è funzione di x) otteniamo: y(x) = (x 3 + 3costante) 1/3 Poichè la costante è arbitraria possiamo scrivere C = 3costante ricavando y(x) = (x 3 + C) 1/3 Imponiamo ora la condizione iniziale y(0) = 4. Deve essere 4 = (C) 1/3 da cui C = 4 3 = 64. Quindi la soluzione del problema è data da y(x) = (x + 64) 1/ Risoluzione di alcuni tipi di equazioni differenziali G Sia data un equazione differenziale del secondo ordine, in cui manca il termine in y: F (x, y, y ) = 0 In tal caso, si pone z(x) = y (x), da cui z (x) = y (x). trasformata diventa: F (x, z, z ) = 0 L equazione differenziale Abbiamo un equazione differenziale del primo ordine nella incognita z. Una volta trovata z soluzione dell equazione differenziale, quindi z = z(x, cost 1 ), si ricava y cercando una primitiva di z: y(x) = z(x, cost 1 )dx + cost 2 126

133 8.8. Le equazioni differenziali lineari G Se l equazione differenziale del secondo ordine non dipende esplicitamente da x F (y, y, y ) = 0 allora si pensa y come variabile indipendente e si si pone z(y) = y. Allora (considerando che y è funzione di x e z è funzione di y): y = dy dx = dz(y) dx = dz dy dy dx = z z Quindi l equazione differenziale diventa F (y, z, z z) = 0 Se si trova un integrale generale di questa equazione, z = z(y, cost), allora, per trovare y, dalla relazione y = z(y, cost) si ricava la soluzione y osservando che questa che abbiamo appena scritto è un equazione differenziale a variabili separabili. G Ci sono molti altri casi di equazioni differenziali non lineari che presentano una forma particolare e che possono essere risolte mediante tecniche ad hoc. Non stiamo però a studiarle in questa sede. 8.8 Le equazioni differenziali lineari Riprendiamo l esempio visto quando abbiamo introdotto le equazioni differenziali: y (n) + a n 1 (x)y (n 1) a 1 (x)y + a 0 (x)y = b(x) dove i coefficienti a 0 (x), a 1 (x),..., a n 1 (x) e b(x) sono assegnate funzioni continue, che dipendono dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate fino a quella di ordine n. Un equazione differenziale scritta in questa forma, prende il nome di equazione differenziale lineare, perchè è lineare rispetto a y e alle sue derivate. G Se ciascuna funzione a i (x), per i = 0, 2,..., n 1 è costante rispetto alla variabile x, allora l equazione differenziale prende il nome di equazione differenziale lineare a coefficienti costanti. G Se b(x) = 0 per ogni valore di x, allora l equazione si dice equazione differenziale omogenea. G Se b(x) 0 allora l equazione si dice equazione differenziale non omogenea. L equazione che si ha ponendo b(x) 0 si dice equazione omogenea associata all equazione di partenza in cui b(x) 0. Per quanto riguarda il problema di Cauchy associato ad un equazione differenziale lineare di ordine n, vale il seguente teorema. Teorema Se le funzioni a 0 (x), a 1 (x),..., a n 1 (x) sono continue in un intervallo [a, b], allora il problema di Cauchy y (n) + a n 1 (x)y (n 1) a 1 (x)y + a 0 (x)y = b(x)y(x 0 ) = y 0 y (x 0 ) = y 0 y (x 0 ) = y 0. y (n 1) (x 0 ) = y (n 1) 0 ammette sempre un unica soluzione y(x) qualunque sia il punto (x 0, y 0, y 0,..., y (n 1) 0 ) associato alle condizioni iniziali. 127

134 8. EQUAZIONI DIFFERENZIALI ORDINARIE Dimostrazione. Infatti, l equazione differenziale si può scrivere come y (n) = f(x, y, y,..., y (n 1) ) con f(x, y, y,..., y (n 1) ) = b(x) a n 1 (x)y (n 1)... a 1 (x)y a 0 (x)y. Riscrivendo la f come una funzione dipendente da x e da un punto Y = (y 1, y 2,..., y n ), (quindi f(x, Y ) = b(x) a n 1 (x)y n... a 1 (x)y 2 a 0 (x)y 1 ) si ha che f y i = a i 1 (x) Quindi ciascuna derivata è una funzione continua e limitata in [a, b] per cui sono soddisfatte le ipotesi del teorema di Cauchy in grande, qualcunque sia il punto iniziale assegnato. Per provare alcune proprietà generali delle equazioni differenziali lineari, conviene introdurre alcune notazioni. La prima consiste nel vedere l equazione differenziale come il risultato di un operatore L applicato alla funzione y(x). Introduciamo dunque l operatore L che agisce su una funzione f(x) nel modo seguente: L(f) = f (n) + a n 1 (x)f (n 1) + a n 2 (x)f (n 2) a 0 (x)f Introducendo i simboli D e D n per indicare la derivata prima e la derivata n-sima rispetto a x, D = d dx, Dn = dn, l operatore L si può scrivere come dxn L = D n + a n 1 (x)d n 1 + a n 2 (x)d n a 0 (x) Allora l equazione differenziale lineare y (n) + a n 1 (x)y (n 1) a 1 (x)y + a 0 (x)y = b(x) può essere scritta come L(y) = b(x) Difatti: L(y) = (D n + a n 1 (x)d n 1 + a n 2 (x)d n a 0 (x))y = D n (y) + a n 1 (x)d n 1 (y) a 0 (x)y = y (n) + a n 1 (x)y (n 1) a 1 (x)y + a 0 (x)y Usando l operatore L, è facile dedurre, facendo uso delle proprietà delle derivate, che vale: 1. L(y 1 + y 2 ) = L(y 1 ) + L(y 2 ) 2. L(αy) = αl(y), dove α è una costante. Queste due proprietà dicono che L è un operatore lineare. Quindi, dato l operatore L appena definito: G L(y) = b(x) è un equazione differenziale lineare non omogenea. La funzione b(x) prende il nome di termine noto dell equazione differenziale. G L(y) = 0 è l equazione differenziale omogenea (il termine noto vale zero) associata all equazione differenziale precedente, in quanto l operatore L è lo stesso. Possiamo stabilire questo risultato. Teorema Se y 1, y 2,..., y m sono un numero finito m di soluzioni dell equazione differenziale lineare omogenea L(y) = 0, allora anche ogni funzione data da c 1 y 1 + c 2 y c m y m, con c 1, c 2,..., c m costanti di R, è soluzione di L(y) = 0, 128

135 8.8. Le equazioni differenziali lineari Dimostrazione. La dimostrazione segue dal fatto che L è un operatore lineare. Da L(y 1 ) = 0, L(y 2 ) = 0,... L(y m ) = 0, e applicando la linearità di L, si ha L(c 1 y 1 + c 2 y c m y m ) = L(c 1 y 1 ) + L(c 2 y 2 ) +... L(c m y m ) = c 1 L(y 1 ) + c 2 L(y 2 ) c m L(y m ) = 0 Teorema Data l equazione differenziale L(y) = 0 con le funzioni a 0 (x), a 1 (x),..., a n 1 (x) continue in un intervallo [a, b], allora per ogni x 0 ]a, b[, la funzione identicamente nulla è l unica soluzione del problema di Cauchy L(y) = 0 con condizioni iniziali date da y(x 0 ) = 0, y (x 0 ) = 0,..., y (n 1) (x 0 ) = 0 Dimostrazione. La dimostrazione segue dal teorema di esistenza ed unicità del problema di Cauchy, considerando che la funzione nulla risolve l equazione differenziale con le condizioni iniziali tutte nulle. Chiamiamo con il simbolo N l insieme delle soluzioni di un equazione differenziale lineare omogenea data mediante l operatore L. Questo insieme prende il nome di spazio nullo dell operatore L. L insieme N è uno spazio vettoriale sul campo dei reali Cosa è uno spazio vettoriale? Consideriamo un insieme N (non necessariamente quello di prima), costituito da funzioni reali definite in R. Sia 0 lo zero di N, vale a dire la funzione identicamente nulla. N è uno spazio vettoriale (sui reali), se: G è possibile definire un operazione interna + sugli elementi dell insieme N, chiamata somma, che gode della proprietà associativa e commutativa, per la quale esiste l elemento neutro (lo zero), e ogni elemento ha l opposto. G è possibile definire un operazione esterna degli elementi di N sui reali, chiamata prodotto per la quale per ogni c 1 e c 2 in R e per ogni f in N, si ha (c 1 c 2 ) f = c 1 (c 2 f) per ogni c 1 e c 2 in R e per ogni f in N, si ha (c 1 + c 2 ) f = (c 1 f) + (c 2 f) per ogni c in R e per ogni f e g in N, si ha c (f + g) = c f + c g per ogni f in N, si ha 1 f = f Un elemento dello spazio vettoriale prende il nome di vettore. Siano ora y 1, y 2,..., y n n elementi dello spazio vettoriale N. Si dice combinazione lineare dei vettori y 1, y 2,..., y n mediante i coefficienti c 1, c 2,..., c n di R, il vettore dato da c 1 y 1 + c 2 y c n y n. Gli n vettori y 1, y 2,..., y n si dicono linearmente indipendenti se l unica combinazione lineare dei vettori y 1, y 2,..., y n che produce il vettore nullo è data da coefficienti tutti nulli: c 1 y 1 + c 2 y c n y n = 0 c 1 = c 2 =... = c n = 0 Se uno spazio vettoriale ha n vettori linearmente indipendenti allora si dice che lo spazio ha dimensione n. I vettori linearmente indipendenti costituiscono una base dello spazio. Ogni funzione dello spazio può essere ottenuta mediante una combinazione lineare della base, cioè dei suoi vettori linearmente indipendenti. 129

136 8. EQUAZIONI DIFFERENZIALI ORDINARIE 8.9 L equazione omogenea Torniamo all equazione differenziale omogenea L(y) = 0 e cerchiamo di caratterizzare le sue soluzioni. Sia L(y) = y (n) + a n 1 (x)y (n 1) a 1 (x)y + a 0 (x)y e sia data l equazione differenziale L(y) = 0. Siano y 1, y 2,..., y n n integrali particolari, per x [a, b], dell equazione differenziale omogenea. Per capire se questi integrali sono linearmente indipendenti, abbiamo bisogno di introdurre il cosiddetto determinante wronskiano o, semplicemente, il wronskiano delle funzioni y 1, y 2,..., y n, che è dato dalla funzione w(x) definita per x [a, b] mediante il determinante y 1 (x) y 2 (x)... y n (x) y 1(x) y 2(x)... y n(x) w(x) = y 1 (x) y 2 (x)... y n(x) y (n 1) 1 (x) y (n 1) 2 (x)... y n (n 1) (x) Teorema Sia dato l operatore L definito tramite le n funzioni a 0 (x), a 1 (x),..., a n 1 (x), continue in un intervallo aperto ]a, b[ R. Siano y 1 (x), y 2 (x),..., y n (x) n funzioni diverse da zero che soddisfano l equazione differenziale: L(y 1 ) = L(y 2 ) = = L(y n ) = 0 Condizione necessaria e sufficiente affinchè le n soluzioni siano linearmente indipendenti è che sia diverso da zero per ogni valore di x ]a, b[, il wronskiano w(x). Teorema Lo spazio delle funzioni che sono soluzione dell equazione omogenea L(y) = 0 (lo spazio nullo N) ha dimensione n, ovvero, l equazione omogenea L(y) = 0 ammette sempre un sistema di n integrali linearmente indipendenti. Dimostrazione. Si fissi x 0 R e si considerino gli n problemi di Cauchy (1)L(y) = 0, y(x 0 ) = 1, y (x 0 ) = 0, y (x 0 ) = 0,... y (n 1) (x 0 ) = 0 (2)L(y) = 0, y(x 0 ) = 0, y (x 0 ) = 1, y (x 0 ) = 0,... y (n 1) (x 0 ) = 0 (3)L(y) = 0, y(x 0 ) = 0, y (x 0 ) = 0, y (x 0 ) = 1,... y (n 1) (x 0 ) = 0. (n)l(y) = 0, y(x 0 ) = 0, y (x 0 ) = 0, y (x 0 ) = 0,... y (n 1) (x 0 ) = 1 Quindi l i-mo problema di Cauchy ha condizioni iniziali tutte nulle, eccetto la derivata y (i 1) che in x 0 vale 1. Per ciascuno di questi problemi di Cauchy, la soluzione esiste ed è unica (per il teorema di esistenza e unicità visto prima). Consideriamo ora il wronskiano delle n funzioni y i (per i = 1, 2,..., n) che sono soluzioni di questi problemi di Cauchy: 130 w(x) = y 1 (x) y 2 (x)... y n (x) y 1(x) y 2(x)... y n(x) y 1 (x) y 2 (x)... y n(x) (x) y (n 1) 2 (x)... y n (n 1) (x) y (n 1)

137 8.10. L equazione non omogenea Valutiamo w(x) per x = x 0. Si ha w(x 0 ) = Risulta che w(x 0 ) è il determinante della matrice identità, che ha uno sugli elementi della diagonale principale e zero altrove. Il determinante di questa matrice vale 1, quindi è diverso da zero. Poichè x 0 è stato scelto in modo arbitrario in R, vuole dire che le n soluzioni dell equazioni differenziali sono linearmente indipendenti (in base al teorema 8.9.1). Abbiamo trovato dunque n funzioni linearmente indipendenti che risolvono l equazione omogenea L(y) = 0. Queste n funzioni costituiscono una base per lo spazio delle soluzioni dell equazione L(y) = 0. Definizione Una n-pla di funzioni y 1, y 2,..., y n che sono soluzioni linearmente indipendenti di L(y) = 0 prende il nome di sistema fondamentale di integrali di L(y) = 0. Se conosciamo n soluzioni linearmente indipendenti di L(y) = 0, la generica soluzione di L(y) = 0 è data da una combinazione lineare delle soluzioni linearmente indipendenti. Questa generica soluzione prende il nome di integrale generale. Si ha il seguente teorema Teorema (Sull integrale generale di un equazione omogenea) Dato un sistema fondamentale di integrali y 1, y 2,..., y n dell equazione differenziale omogenea L(y) = 0, l integrale generale è dato dalle combinazioni lineari y = c 1 y 1 + c 2 y c n y n con c 1, c 2,..., c n costanti di R L equazione non omogenea Sia data ora un equazione differenziale non omogenea L(y) = b(x). Sappiamo che ad essa possiamo associare l equazione differenziale omogenea L(y) = 0 Se conosciamo un integrale particolare dell equazione non omogenea, y, e conosciamo l integrale generale dell equazione omogenea associata, y, allora l integrale generale dell equazione non omogenea, che indichiamo con η, è dato dalla somma di y e di y. Vale infatti il seguente teorema. Teorema Dato y integrale particolare di L(y) = b(x), e dato l integrale generale y di L(y) = 0, allora l integrale generale di L(y) = b(x) è dato da η = y + y 131

138 8. EQUAZIONI DIFFERENZIALI ORDINARIE Dimostrazione. Consideriamo η = y + y. Si ha L(η) = L(y + y) applicando la linearità di L = L(y) + L(y) ma L(y) = 0 e L(y) = b(x) = b(x) Quindi η è soluzione dell equazione differenziale L(y) = b(x). Supponiamo che y sia un altro integrale particolare diverso da y, per l equazione non omogenea, L(y ) = b(x), allora y = y y risulta un integrale dell omogenea associata, in quanto L(y ) = L(y y) = L(y ) L(y) = b(x) b(x) = 0 Quindi y si può scrivere come combinazione lineare di un sistema fondamentale di integrali dell equazione omogenea, tramite dei coefficienti c 1, c 2,..., c n. Perciò y = y + y rientra come caso particolare (perchè y è caratterizzato da specifici coefficienti) dell integrale generale η = y + y, cioè η = y + y è l unico modo per rappresentare l integrale generale dell equazione non omogenea. Quindi l integrale generale dell equazione differenziale L(y) = b(x), conoscendo n integrali linearmente indipendenti dell equazione omogenea associata, e un integrale particolare y della non omogenea, è dato da dato da y = c 1 y 1 + c 2 y , c n y n + y 8.11 Equazioni lineari a coefficienti costanti Data l equazione differenziale y (n) + a n 1 (x)y (n 1) a 1 (x)y + a 0 (x)y = b(x) se a 0 (x) a 0, a 1 (x) a 1,..., a n 1 (x) = a n 1, tutte le funzioni sono costanti in x, allora l equazione differenziale prende il nome di equazione differenziale a coefficienti costanti: y (n) + a n 1 y (n 1) a 1 y + a 0 y = b(x) Per trovare l integrale generale dell equazione lineare a coefficienti costanti, si considera la cosiddetta equazione caratteristica, che si ricava dall equazione differenziale omogenea associata, sostituendo alle derivate della funzione incognita le potenze della variabile z: P (z) = z n + a n 1 z n a 1 z + a 0 = 0 Quindi a y (n) sostituiamo z n, a y (n 1) sostituiamo z n 1 m fino ad arrivare a y che sostituiamo con z 0 = 1. Il polinomio P (z) prende il nome di polimonio caratteristico. Si cercano le radici del polinomio caratteristico, cioè i valori di z per cui P (z) = 0 e da queste radici è possibile risalire (vedremo ora in che modo) all integrale generale dell equazione differenziale lineare omogenea. Occorre poi trovare un integrale particolare per l equazione non omogenea. Ricordiamo che un polinomio di grado n ammette n radici: queste radici possono essere reali o complesse, e possono essere con molteplicità semplice o di un certo grado, ma tali che la somma dei gradi di ciascuna radice dia il grado del polinomio. Vediamo dei semplici esempi. 132

139 8.11. Equazioni lineari a coefficienti costanti Esempio Es Consideriamo un polinomio di secondo grado. Sappiamo che, dato un polinomio di secondo grado P (z) = az 2 + bz + c, per trovare le radici del polinomio, cioè quei valori di z per cui P (z) = 0 si ha la formula z = b ± b 2 4ac, dove la quantità sotto 2a radice, b 2 4ac prende il nome di discrimante e viene indicato con il simbolo. GSe = b 2 4ac > 0 si hanno due radici reali distinte. Esempio: P (z) = z 2 5z 6. In questo caso = = 49, da cui z = 5 ± 7 2. Si hanno due radici distinte: z 1 = 6 e z 2 = 1. GSe = b 2 4ac = 0 si hanno due radici reali coincidenti (una radice da contarsi due volte, o con molteplicità due). Esempio: P (z) = z 2 2z + 1. Qui = 4 4 = 0. Si ricava facilmente, o applicando la formula, o riconoscendo che P (z) = (z 1) 2, che la radice è z = 1 da contarsi due volte, cioè z = 1 è una radice con molteplicità doppia. GSe = b 2 4ac < 0, non si hanno radici reali ma nel campo complesso, introducendo l unità immaginaria i = 1, per cui b 2 4ac = ( 1)(4ac b 2 ) = i 4ac b 2, essendo ora 4ac b 2 > 0. Esempio: P (z) = z 2 + 2z + 3. In questo caso = 4 12 = 8 Sotto radice ho 8, quindi le radici sono complesse. z = 2 ± i2 2 2 = 1 ± i 2 Trovo due radici z 1 = 1 + i 2 e z 2 = 1 i 2. Queste due radici sono complesse e coniugate, perchè la parte immaginaria delle due radici è una l opposta dell altra. Un numero complesso, infatti, si può vedere come z = a + ib, con a e b numeri reali e i l unità immaginaria. Il coniugato di z = a + ib è dato da z = a ib. Per determinare l integrale generale di un equazione differenziale omogenea si vanno a cercare le radici del polinomio caratteristico. Supponiamo che il polimonio caratteristico abbia n radici reali tutte distinte tra di loro, γ 1, γ 2,..., γ n, allora le funzioni y(x) = e γix sono soluzioni particolari dell equazione differenziale. Infatti da y(x) = e γx si ha y = γe γx, y = γ 2 e γx,..., y (n) = γ n e γx. Se andiamo a sostituire nell equazione differenziale, ricaviamo L(y) = L(e γx ) = γ n e γx + a n 1 γ n 1 e γx a 1 γe γx + a 0 e γx metto in evidenza e γx = (γ n + a n 1 γ n a 1 γ + a 0 )e γx = P (γ)e γx ma γ è radice dell equazione caratteristica = 0 Quindi y = e γx è soluzione dell equazione differenziale lineare omogenea. In genere, però, un polinomio di grado n può avere radici reali che si ripetono (che hanno una certa molteplicità), o radici reali insieme a radici complesse e coniugate (e anche queste radici possono avere una certa molteplicità). Per ricavare l integrale generale di un equazione lineare omogenea, viene in aiuto il seguente teorema. 133

140 8. EQUAZIONI DIFFERENZIALI ORDINARIE Teorema Siano γ 1, γ 2,..., γ h h radici reali del polinomio caratteristico, ciascuna delle quali ha rispettivamente molteplicità r 1,..., r h mentre siano α 1 ± iβ 1, α 2 ± iβ 2,..., α l ± iβ k 2k radici complesse e coniugate con molteplicità, rispettivamente, s 1, s 2,..., s k. La molteplicità delle radici è tale che r 1 + r r h + 2(s 1 + s s k ) = n. Allora le n funzioni e γpx, xe γpx,... x rp 1 e γpx, per p = 1, 2,..., h e αqx cos (β q x), e αqx sin (β q x), xe αqx cos (β q x), xe αqx sin (β q x),..., x sq 1 e αqx cos (β q x), x sq 1 e αqx sin (β q x), per q = 1, 2,..., k sono n soluzioni reali dell equazione differenziale omogenea linearmente indipendenti. Scritto in forma meno compatta, vuol dire che se l equazione caratteristica ha n radici, in parte reale e in parte complesse coniugate, così come sono state descritte nel teorema, si hanno le seguenti soluzioni per l equazione lineare: G dalle radici reali del polinomio caratteristico si hanno i seguenti integrali: e γ1x xe γ1x x 2 e γ1x... x r1 1 e γ1x e γ2x xe γ2x x 2 e γ2x... x r2 1 e γ2x e γ3x xe γ3x x 2 e γ3x... x r3 1 e γ3x e γ hx xe γ hx x 2 e γ hx... x rh 1 e γ hx G dalle radici complesse e coniugate del polinomio caratteristico si hanno i seguenti integrali: e α1x cos (β 1 x) e α1x sin (β 1 x) xe α1x cos (β 1 x) xe α1x sin (β 1 x) x 2 e α1x cos (β 1 x) x 2 e α1x sin (β 1 x) x s1 1 e α1x cos (β 1 x) x s1 1 e α1x sin (β 1 x) e α2x cos (β 2 x) e α2x sin (β 2 x) xe α2x cos (β 2 x) xe α2x sin (β 2 x) x 2 e α2x cos (β 2 x) x 2 e α2x sin (β 2 x) x s2 1 e α2x cos (β 2 x) x s2 1 e α2x sin (β 2 x) e α3x cos (β 3 x) e α3x sin (β 3 x) xe α3x cos (β 3 x) xe α3x sin (β 3 x) x 2 e α3x cos (β 3 x) x 2 e α3x sin (β 3 x) x s3 1 e α3x cos (β 3 x) x s3 1 e α3x sin (β 3 x).... e αkx cos (β k x) e αkx sin (β k x) xe αkx cos (β k x) xe αkx sin (β k x) x 2 e αkx cos (β k x) x 2 e αkx sin (β k x) x sk 1 e αkx cos (β k x) x sk 1 e αkx sin (β k x) L integrale generale è dato da una combinazione lineare di tutte queste soluzioni particolari. Quindi l integrale generale dell equazione differenziale omogenea è dato dalle combinazioni lineari delle soluzioni linearmente indipendenti trovate. Esempio Es Sia data l equazione lineare omogenea y 4y = 0. L equazione caratteristica è data da P (z) = z 2 4 = 0 Le radici di questa equazione sono date da z 1 = 2, z 2 = 2. Sono due radici reali, con molteplicità uno. L integrale generale dell equazione differenziale è dunque dato da y(x) = c 1 e 2x + c 2 e 2x 134

141 8.12. Metodo dei coefficienti indeterminati Esempio Es Sia ora y + 2y + y = 0. Ora l equazione caratteristica è data da P (z) = z 2 + 2z + 1 = 0, che ha come radici z = 1 con molteplicità doppia. In tal caso l integrale generale è dato da Esempio y(x) = c 1 e x + c 2 xe x Es Sia data l equazione differenziale y + 2y + 3 = 0. Adesso si ha, per l equazione caratteristica, P (z) = z 2 + 2z + 3 = 0 che ha due radici complesse e coniugate z 1 = 1 + i 2 e z 2 = 1 i 2. La parte reale è a = 1 la parte complessa è b = 2, quindi l integrale generale è y(x) = c 1 e x cos ( 2x) + c 2 e x sin ( 2x) Se, invece, interessa la soluzione generale dell equazione differenziale non omogenea, dobbiamo trovare, oltre all integrale generale dell omogenea associata, anche un integrale particolare dell equazione non omogenea visto che l integrale generale è dato dalla somma dell integrale generale dell omogenea associata e dell integrale particolare della non omogenea (in base al teorema ). Il problema di trovare l integrale generale di un equazione differenziale non omogenea L(y) = b(x) si riconduce alla soluzione di due problemi: 1. trovare l integrale generale dell equazione omogenea associata L(y) = 0 2. trovare un integrale particolare dell equazione non omogenea L(y) = b(x) 8.12 Metodo dei coefficienti indeterminati Per alcune funzioni b(x) è possibile trovare l integrale particolare in modo abbastanza semplice, applicando il cosiddetto metodo dei coefficienti indeterminati. Ecco un elenco di possibili casi per b(x). G Sia b(x) = P (x), un polinomio di grado p. Se nell equazione differenziale, a 0 0, allora come soluzione particolare si ha y = Q(x), dove Q(x) è un polinomio di grado al più p (si va a cercare un polinomio dello stesso grado del termine noto che sia soluzione particolare dell equazione non omogenea). G Se b(x) = P (x) polinomio di grado p, ma a 0 = a 1 =... = a r 1 = 0 con r 1 n 1 (ciò equivale a dire che nell equazione caratteristica associata si ha la radice z = 0 con molteplicità r) allora si ha come soluzione particolare y = x r Q(x) polinomio di grado al più p. G Sia b(x) = e αx P (x) con α R e P (x) polinomio di grado p, Se α non è radice dell eq. caratteristica, allora y = e αx Q(x), con Q(x) polinomio di grado al più p. Se α è radice dell eq. caratteristica, con molteplicità r, allora y = x r e αx Q(x) con Q(x) polinomio di grado al più p. G Sia b(x) = e αx cos(βx)p (x) oppure b(x) = e αx sin(βx)p (x) oppure b(x) = e αx (cos(βx) + sin(βx))p (x), con α, β R e P (x) polinomio di grado p Se α ± iβ non è radice dell eq. caratteristica, allora y = e αx (cos(βx)q 1 (x) + sin(βx)q 2 (x)) con Q 1 e Q 2 polinomi di grado al più p. Se α ± iβ è radice dell eq. caratteristica con molteplicità r, allora y = x r e αx (cos(βx)q 1 (x) + sin(βx)q 2 (x)) con Q 1 e Q 2 polinomi di grado al più p. Se il termine noto b(x) è dato dalla somma di funzioni, ciascuna delle quali si può ricondurre ad uno dei casi descritti sopra, allora l integrale particolare è dato dalla somma degli integrali particolari delle equazioni differenziali non omogenee legate a ciascun addendo 135

142 8. EQUAZIONI DIFFERENZIALI ORDINARIE della funzione di partenza. Infatti, se il termine noto è dato dalla somma di m funzioni, b(x) = b 1 (x)+b 2 (x)+...+b m (x), possiamo considerare sia l equazione differenziale L(y) = b(x), sia le m equazioni differenziali L(y) = b 1 (x), L(y) = b 2 (x),... L(y) = b m (x). Siano y 1, y 2,..., y m m soluzioni particolari di queste m equazioni differenziali, allora vale L(y 1 + y y m ) = L(y 1 ) + L(y 2 ) L(y m ) b 1 (x) + b 2 (x) b m (x) = b(x) Quindi y = y 1 + y y m è soluzione dell equazione differenziale L(y) = b(x). Vediamo degli esempi sulla risoluzioni di equazioni differenziali non omogenee. Esempio Es Si voglia risolvere l equazione differenziale y + y = 3x 2 Per prima cosa risolviamo l omogenea associata y + y = 0. L equazione caratteristica è : z = 0, da cui z = ±i: abbiamo due radici complesse e coniugate. L integrale generale è, dunque: y = c 1 cos (x) + c 2 sin (x). Cerchiamo ora un integrale particolare. Vediamo che b(x) = 3x 2, è un polinomio di secondo grado, e il coefficiente a 0 dell equazione differenziale è diverso da zero. Quindi l integrale particolare deve essere un polinomio di secondo grado, del tipo y = ax 2 +bx+c, con a, b, c da determinare andando a sostituire y nell equazione differenziale. Infatti deve essere y + y = 3x 2 Da y = ax 2 + bx + c, si ha y = 2ax + b e y = 2a. Andando a sostituire nell equazione differenziale si ricava: 2a + ax 2 + bx + c = 3x 2 Ora i termini che hanno le stesse potenze di x a primo e a secondo membro vanno eguagliati: ax 2 = 3x 2 bx = 0 2a + c = 0 Risolviamo questo sistema di 3 equazioni in 3 incognite, ottenendo a = 3, b = 0, c = 2a = 6. Perciò l integrale particolare è dato da y = 3x 2 6. L integrale generale dell equazione differenziale non omogenea vale dunque: y = c 1 cos (x) + c 2 sin (x) + 3x 2 6. Esempio Es Sia da risolvere l equazione differenziale y + 3y + 2y = x + x 3 e x sin (2x) Per prima cosa cerchiamo le soluzioni dell equazione omogenea associata. L equazione caratteristica è : z 2 + 3z + 2 = 0, da cui le radici reali z 1 = 1 e z 2 = 2. L integrale generale dell omogenea è dunque y = c 1 e x + c 2 e 2x. 136

143 8.12. Metodo dei coefficienti indeterminati Consideriamo ora il termine noto b(x) = x+x 3 e x sin (2x). Osserviamo come il termine noto possa essere visto come somma del polinomio P (x) = x + x 3 e della funzione e x sin (2x). Cerchiamo dunque un integrale particolare per l equazione differenziale y + 3y + 2y = x + x 3 e un integrale particolare per l equazione differenziale y + 3y + 2y = e x sin (2x) Per il primo integrale, vediamo che il termine noto è un polinomio di terzo grado e che il coefficiente a 0 0, quindi l integrale particolare è un polinomio di terzo grado y = ax 3 + bx 2 + cx + d. Derivando, si ha y = 3ax 2 + 2bx + c e y = 6ax + 2b. Andando a sostituire nell equazione differenziale si ha 6ax + 2b + 3(3ax 2 + 2bx + c) + 2(ax 3 + bx 2 + cx + d) = x + x 3 Raccogliendo i termini con le stesse potenze di x a primo membro, abbiamo 2ax 3 + (9a + 2b)x 2 + (6a + 6b + 2c)x + 2b + 3c + 2d = x + x 3 Uguagliando i termini con le stesse potenze a primo e a secondo membro si ha: 2a = 1 9a + 2b = 0 6a + 6b + 2c = 1 2b + 3c + 2d = 0 Otteniamo a = 1/2, b = 9 2 a = 9 1 6a 6b, c = 4 2 y = x x x = 23 4, d = 2b 3c 2 = 51, da cui 8 Passiamo ora a trovare un integrale particolare per la seconda equazione differenziale che abbiamo ricavato che ha come termine noto la funzione e x sin (2x). Riconducendoci allo schema che abbiamo fatto per i vari casi di termini noto, questo si riconduce alla funzione del tipo e αx sin (βx)p (x), dove α = 1, β = 2, P (x) = 1 (polinomio di grado 0). Poichè 1 ± i2 non è radice dell equazione caratteristica (che ha nel nostro caso solo radici reali), dobbiamo cercare un integrale particolare del tipo y = e x (cos (2x)a + sin (2x)b) (devono essere Q 1 eq 2 costanti). Allora, y = e x (a cos (2x) + b sin (2x)) + e x ( 2a sin (2x) + 2b cos (2x)) = e x ((2b a) cos (2x) (b + 2a) sin (2x)) polinomi di grado zero, cioè delle y = e x ((2b a) cos (2x) (b + 2a) sin (2x))+ e x ( 2(2b a) sin (2x) 2(b + 2a) cos (2x)) = e x (( 4b 3a) cos (2x) + (4a 3b) sin (2x)) 137

144 8. EQUAZIONI DIFFERENZIALI ORDINARIE Andando a sostituire nell equazione differenziale, si ottiene: e x (( 4b 3a) cos (2x) + (4a 3b) sin (2x))+ 3(e x ((2b a) cos (2x) (b + 2a) sin (2x))+ 2(e x (a cos (2x) + b sin (2x)) = e x sin (2x) Si può semplificare l equazione dividendo ambo i membri per e x. termini in sin (2x) e cos (2x) si ha: Raccogliendo i (2b 4a) cos (2x) + ( 4b 2a) sin (2x) = sin (2x) Quindi: { 2b 4a = 0 4b 2a = 1 Risolvendo il sistema si trova a = 1 10 e b = 1 5 da cui y = e x ( 1 10 cos (2x) + 1 sin (2x)). 5 Concludendo, l integrale generale dell equazione differenziale non omogenea da cui siamo partiti è dato da: y = c 1 exp x + c 2 exp 2x + x x x e x ( 1 10 cos (2x) + 1 sin (2x)) 5 Se si ha un problema di Cauchy, si risolve prima l equazione differenziale cercando un integrale generale. Successivamente, le costanti vengono determinate in base alle condizioni iniziali date dal problema. 138

145 CAPITOLO 9 Forme differenziali Nel campo della matematica, se trovo un nuovo approccio a un problema, ci può essere sempre un altro matematico che sostiene di aver trovato una soluzione migliore, o semplicemente più elegante. Negli scacchi se qualcuno sostiene di essere più bravo di me, io gli posso sempre dare scaccomatto. Emanuel Lasker ( ) 9.1 Introduzione alle forme differenziali Integrali delle forme differenziali Applicazione delle forme differenziali Teorema fondamentale per gli integrali curvilinei Forme differenziali lineari esatte Le forme differenziali lineari chiuse Introduzione alle forme differenziali Consideriamo una curva regolare γ nel piano data da equazioni parametriche x = x(t), y = y(t), a t b Sia data una funzione f(x, y) dipendente da due variabili. Possiamo pensare di integrare la funzione f sulla curva γ rispetto a x o rispetto a y (quindi non sull arco di curva, ds, ma in dx o dy). Si ha l integrale curvilineo di f rispetto a x dato da γ f(x, y)dx = b a f(x(t), y(t))x (t)dt Si ha l integrale curvilineo di f rispetto a y dato da γ f(x, y)dy = b a f(x(t), y(t))y (t)dt 139

146 9. FORME DIFFERENZIALI Infatti poichè x = x(t), allora dx = x (t)dt. Analogo è il ragionamento per la y. Spesso questi due integrali appaiono insieme: se X e Y sono due funzioni nelle variabili x e y e se γ è una curva (data da equazioni parametriche come in precedenza), allora b Xdx + Y dy = X(x, y)dx + Y (x, y)dy γ = = a b a b a X(x(t), y(t))x (t)dt + Y (x(t), y(t))y (t)dt (X(x(t), y(t))x (t) + Y (x(t), y(t))y (t)) dt L espressione che abbiamo scritto come funzione integranda Xdx + Y dy prende il nome di forma differenziale. Possiamo dare allora la seguente definizione Definizione Date X e Y due funzioni definite in I R 2, si chiama forma differenziale lineare ω (o forma lineare) l espressione ω = Xdx + Y dy = X(x, y)dx + Y (x, y)dy Le funzioni X e Y si chiamano coefficienti della forma differenziale. Se i coefficienti sono di classe C p, la forma differenziale si dice di classe C p. Per una forma differenziale, si possono definire le seguenti operazioni: G dato un vettore r = (r 1, r 2 ) e (x, y) I, il prodotto scalare tra ω e r è: ω r = X(x, y)r 1 + Y (x, y)r 2 G dato uno scalare c R e una funzione f definita in I e a valori in R si definisce la moltiplicazione della forma differenziale per c e per f nel modo seguente: cω = cxdx + cy dy fω = (fx)dx + (fy )dy G Date due forme differenziali ω 1 e ω 2, si definisce addizione di ω 1 e di ω 2 la seguente forma: ω 1 + ω 2 = (X 1 dx + Y 1 dy) + (X 2 dx + Y 2 dy) = (X 1 + X 2 )dx + (Y 1 + Y 2 )dy Con queste operazione, l insieme delle forme differenziali lineari, definite in un insieme I R, è uno spazio vettoriale. Consideriamo, ora, il differenziale di una funzione f(x, y). Si ha df = f x dx+f y dy. Quindi il differenziale di una funzione f si può vedere come una forma differenziale lineare. Non vale, ovviamente, il viceversa: data una forma lineare, non è detto che ci sia una funzione f il cui differenziale coincida con la forma lineare stessa. 9.2 Integrali delle forme differenziali Abbiamo introdotto le forme differenziali introducendo degli integrali curvilinei fatti rispetto a x e rispetto a y. Le forme differenziali, infatti, vengono utilizzate in integrali curvilinei. Data una curva regolare γ con il suo orientamento naturale, quindi una curva +γ, che puó essere scritta in forma parametrica tramite le equazioni 140 x = x(t), y = y(t), a t b

147 9.2. Integrali delle forme differenziali si definisce integrale curvilineo (o di linea) della forma differenziale ω sulla curva +γ, l integrale b ω = Xdx + Y dy = (X(x(t), y(t)x (t) + Y (x(t), y(t))y (t)) dt +γ +γ a Se scriviamo le equazioni parametriche della curva usando una funzione vettoriale f = (x(t), y(t)), l integrale di prima può essere scritto come b ω = ω(f(t)) f (t)dt +γ a Difatti il prodotto scalare ω(f(t)) f (t) altro non è che la funzione integranda che abbiamo scritto prima X(x(t), y(t)x (t) + Y (x(t), y(t))y (t). Ora cerchiamo di vedere cosa succede se facciamo l integrale di una forma differenziale su una curva +γ o sulla curva opposta γ. Vediamolo con un esempio. Esempio Es Sia ω = yx 2 dx + sin (πy)dy. Quindi X(x, y) = yx 2, e Y (x, y) = sin (πy). La curva +γ sia il segmento che va dal punto (0, 2) al punto (1, 4). La curva +γ in forma parametrica può essere scritta come x = t, y = 2t + 2, 0 t 1 Per t = 0 si ha (0, 2), per t = 1 si ha (1, 4). Calcoliamo +γω. Si ha +γ ω = = ( y(t)x(t) 2 x (t) + sin (πy(t))y (t) ) 1 ( dt = (2t + 2)t 2 + sin (π(2t + 2))2 ) dt ( 2t 3 + 2t sin (π(2t + 2)) ) dt = 2 t t3 3 1 π = π + 1 π = cos (π(2t + 2)) t=1 t=0 Vediamo ora cosa succede se integriamo lungo la curva opposta γ (ricordiamo che quando abbiamo definito l integrale curvilineo di una funzione lungo una curva γ, integrando lungo la curva, cioè rispetto all ascissa curvilinea ds, abbiamo detto che l integrale non dipende dall orientamento della curva. In questo caso invece, le cose cambiano): La curva opposta γ ha equazioni parametriche x = t, y = 2t + 2, 1 t 0 Per t = 1 si ha (1, 4), per t = 0 si ha (0, 2). Si ha dunque γ ω = = yx 2 dx + sin (πy)dy = 0 1 ( ( 2t + 2)( t) 2 ( 1) + sin (π( 2t + 2))( 2) ) dt ( 2t 3 2t 2 2 sin (π( 2t + 2)) ) dt = 2 t4 4 2t3 3 1 π = 1 π π = 7 6 cos (π( 2t + 2)) t=0 t= 1 Osserviamo dunque che il valore dell integrale che abbiamo ottenuto sulla curva opposta γ è l opposto dell integrale che avevamo ottenuto sulla curva +γ. 141

148 9. FORME DIFFERENZIALI Vale infatti il seguente teorema Teorema Data una forma differenziale ω e una curva regolare +γ si ha ω = ω γ +γ Dimostrazione. Dimostriamo questo teorema considerando che se una curva +γ è data da f = (x(t), y(t)) con a t b, la curva opposta si può scrivere come γ con F = ( x(t), ỹ(t)) = (x( t), y( t)) con b t a Quindi x (t) è uguale alla derivata della funzione x( t) che va vista come la funzione composta x(h(t)) con h(t) = t. Derivando, quindi, si ha la derivata di x valutata in h(t) = t per la derivata di h(t) che vale 1, da cui: x (t) = x ( t)( 1) = x ( t). Analogamente, vale ỹ( t) = y ( t). Allora a ω = (X( x(t), ỹ(t)) x (t) + Y ( x(t), ỹ(t)), ỹ (t)) dt γ = = b a b a b (X(x( t), y( t))( x ( t)) + Y (x( t), y( t)), ( y ( t))) dt (X(x( t), y( t))x ( t) + Y (x( t), y( t))y ( t)) dt facendo il cambiamento di variabili u = t, du = dt e considerando che per t = b, u = b, e per t = a, u = a = a b b = = (X(x(u), y(u))x (u) + Y (x(u), y(u))y (u)) du a +γ (X(x(u), y(u))x (u) + Y (x(u), y(u))y (u)) du ω Quindi nel fare gli integrali curvilinei delle forme differenziali occorre prestare molta attenzione all orientamento della curva. Per questo motivo, gli integrali curvilinei delle forme differenziali sono detti integrali orientati. Invece, anche per le forme differenziali, l integrale curvilineo non dipende dal tipo di rappresentazione utilizzata per la curva, cioè non dipende dalla scelta della rappresentazione parametrica. Si ha infatti la seguente proposizione Proposizione L integrale curvilineo ω non dipende dalla particolare rappresentazione della curva regolare +γ +γ. Dimostrazione. Sia data la curva +γ tramite la funzione f = (x(t), y(t)), con a t b o, in maniera equivalente, tramite la funzione F = (x F (u), y F (u)), con α u β. Sappiamo che, dovendo rappresentare la medesima curva, le due funzioni f e F sono legate tra loro mediante una funzione φ : [α, β] [a, b] con φ (u) > 0, tale che φ(α) = a, φ(β) = b e F(u) = f(φ(u)) Torniamo all integrale curvilineo. Da una parte +γ ω = b a (X(x(t), y(t))x (t) + Y (x(t), y(t))y (t)) dt 142

149 9.3. Applicazione delle forme differenziali Dall altra si ha: β ω = (X(x F (u), y F (u))x F (u) + Y (x F (u), y F (u))y F (u)) du +γ α Ma per la relazione che lega F a f si ha: F(u) = f(φ(u)) (x F (u), y F (u)) = (x(φ(u), y(φ(u)) +γ x F (u) = x (φ(u))φ (u) y F (u) = y (φ(u))φ (u) Quindi si ha β ω = (X(x F (u), y F (u))x F (u) + Y (x F (u), y F (u))y F (u)) du = α β α (X(x(φ(u)), y(φ(u)))x (φ(u))φ (u) + Y (x(φ(u)), y(φ(u)))y (φ(u))φ (u)) du mettendo in evidenza φ (u) = β α (X(x(φ(u)), y(φ(u)))x (φ(u)) + Y (x(φ(u)), y(φ(u)))y (φ(u))) φ (u)du operando il cambiamento di variabili t = φ(u) e considerando dt = φ (u)du e il cambiamento agli estremi u = α t = a, u = β t = b = b a (X(x(t), y(t))x (t) + Y (x(t), y(t))y (t)) dt Abbiamo provato che la rappresentazione parametrica della curva non influisce sul risultato finale perchè gli integrali coincidono qualunque sia la rappresentazione parametrica per descrivere la stessa curva. Per gli integrali curvilinei sulle forme differenziali valgono anche le seguenti proprietà: G se c R, +γ cω = c +γ ω G +γ ω 1 + ω 2 = +γ ω 1 + +γ ω 2 G se la curva +γ viene suddivisa in un certo numero k di curve regolari, tali che +γ = +γ 1 +γ γ k o se la curva è regolare a tratti, allora +γ ω = +γ 1 ω+ +γ 2 ω γ k ω 9.3 Applicazione delle forme differenziali In molte applicazioni soprattutto nella fisica, ci si trova a lavorare con funzioni vettoriali da integrare su curve. Sia F = X(x, y) i + Y (x, y) j una funzione vettoriale (scritta in funzione dei versori degli assi x e y rispettivamente). Sia data una curva regolare +γ data da r = x(t) i + y(t) j (è la stessa cosa di scrivere f = (x(t), y(t)))) con a t b. Si definisce integrale curvilineo del vettore F lungo la curva +γ l integrale b F d r = F ( r) r (t)dt +γ a Poichè F ( r) = F (x(t), y(t)) = X(x(t), y(t)) i + Y (x(t), y(t)) j e r (t) = x (t) i + y (t) j, risulta b F d r = (X(x(t), y(t)) i + Y (x(t), y(t)) j) (x (t) i + y (t) j)dt +γ = a b a (X(x(t), y(t))x (t) + Y (x(t), y(t))y (t)) dt 143

150 9. FORME DIFFERENZIALI Abbiamo ritrovato la definizione di integrale curvilineo di una forma differenziale, dove i coefficienti della forma differenziale sono le componenti del vettore F. Un esempio in cui vediamo applicata una forma differenziale in fisica è il lavoro compiuto da un campo di forze. Se consideriamo una particella che si muove lungo una curva, indicando con s la distanza percorsa dalla particella lungo la curva +γ, e con F = (X, Y ) una forza che agisce sulla particella mentre essa si sposta di d s, si definisce lavoro elementare eseguito da F il prodotto scalare: dl = F d s In coordinate cartesiane, e limitandoci al caso bidimensionale, si può scrivere dl = Xdx + Y dy Il lavoro elementare è dunque una forma differenziale. Il lavoro totale lungo tutta la curva +γ è invece definito tramite l integrale della forma differenziale dl: b L = dl = X(x(t), y(t))dx + Y (x(t), y(t))dy +γ a 9.4 Teorema fondamentale per gli integrali curvilinei Teorema Assegnata una funzione f(x, y), si consideri la forma differenziale data dal suo differenziale: ω = df = f x dx + f y dy. Data una curva regolare +γ espressa mediante rappresentazione parametrica da (x(t), y(t)) (o mediante la funzione vettoriale r), si ha df = f(x(b), y(b)) f(x(a), y(a)) +γ Questo risultato equivale anche a dire che f d r = f(x(b), y(b)) f(x(a), y(a)) +γ Dimostrazione. Si ha b df = (f x (x(t), y(t))x (t) + f y (x(t), y(t))y (t)) dt +γ a per le regole di derivazione delle funzioni composte = b a df(x(t), y(t)) dt dt = f(x(t), y(t)) t=b t=a = f(x(b), y(b)) f(x(a), y(a)) 9.5 Forme differenziali lineari esatte Definizione Una forma differenziale ω = Xdx + Y dy (definita in un insieme aperto e di classe C 0 ) si dice esatta se esiste almeno una funzione F (di classe C 1 ) tale che df = ω vale a dire se F x = X e F y = Y. 144

151 9.5. Forme differenziali lineari esatte Figura 9.1: A, B e C sono esempi di insiemi connessi. Figura 9.2: L insieme A costituito dall unione dei tre insiemi non è un insieme connesso. Si dice anche che F è una primitiva di ω. Vediamo ora un particolare tipo di insieme che ci permette di stabilire alcune importanti proprietà per le forme differenziali, se definite su questi insiemi. Si tratta degli insiemi connessi. Definizione Un insieme aperto A R 2 si dice connesso se, qualunque siano i punti P e Q presi in A, esiste una linea poligonale che è contenuta tutta in A e che ha P e Q come estremi. Per funzioni definite su insiemi connessi vale questo Lemma. Lemma Sia f una funzione di classe C 1 definita in un insieme aperto e connesso A di R 2. Se, per ogni (x, y) A risulta f x (x, y) = f y (x, y) = 0, allora f è una funzione costante in A. 145

152 9. FORME DIFFERENZIALI Dimostrazione. Consideriamo due punti, P = (x, y) e P 0 = (x 0, y 0 ) in A. Dalla definizione di insieme connesso, sappiamo che esiste una linea poligonale che congiunge P e P 0 e che si trova all interno di A. Per semplicità supponiamo che la linea poligonale sia il segmento congiungente i due punti. Allora, per il teorema di Lagrange, si ha f(p ) = f(p 0 ) + f x (Q)(x x 0 ) + f y (Q)(y y 0 ) con Q punto che non conosciamo, che si trova sul segmento congiungente P e P 0. Poichè f x (Q) = f y (Q) = 0 (e questo qualunque sia il punto Q), si ha f(p ) = f(p 0 ) Possiamo variare il punto P, lasciando fisso P 0 ma avremo sempre lo stesso risultato, quindi la funzione assume valore costante. Se, al posto di un segmento congiungente P e P 0, abbiamo una linea spezzata, si ripete il ragionamento su ciascun segmento arrivando alla stessa conclusione. Per le forme differenziali, vale il seguente lemma. Lemma Se F e G sono primitive, di classe C 1, definite in un insieme aperto e connesso, della stessa forma differenziale lineare ω, allora differiscono per una costante. Dimostrazione. Poichè, per ipotesi, F e G sono primitive di ω = Xdx + Y dy, vuol dire che F x = G x = X, F y = G y = Y. Consideriamo la funzione f = F G. Questa funzione è definita in un insieme aperto e connesso (come la forma lineare) ed è di classe C 1 (essendolo F e G). Si ha f x = F x G x = X X = 0 e f y = F y G y = Y Y = 0, e questo qualunque sia (x, y) preso nell insieme di definizione. Ma, allora, sono soddisfatte le ipotesi del lemma precedente e quindi f è una funzione costante: f(x, y) = cost. Di conseguenza, F (x, y) G(x, y) = cost, cioè F e G differiscono per una costante: F (x, y) = G(x, y) + cost. Consideriamo ora i seguenti teoremi sulle forme differenziali lineari esatte. Teorema Data ω = Xdx + Y dy una forma differenziale lineare, di classe C 0 e definita in un insieme aperto e connesso, se F è una sua primitiva, allora ogni primitiva di ω è del tipo F + cost con cost una costante. Dimostrazione. Se F è una primitiva di ω, la funzione G = F +cost è anch essa primitiva, in quanto G x = F x = X e G y = F y = Y (poichè la derivata di una costante rispetto a x e a y vale zero). Supponendo di conoscere un altra primitiva di ω, G, poichè si ha sempre G x = X e G y = Y, per il lemma precedente, si ha ancora che G e F differiscono per una costante, quindi G = F + cost. L insieme delle primitive di una forma differenziale lineare ω in un insieme aperto e connesso prende il nome di integrale indefinito, propriò perchè, nota una primitiva, tutte le altre differiscono per una costante. Teorema Dato A R 2 aperto e connesso e data una forma differenziale lineare ω di classe C 0 in A, le seguenti proposizioni sono equivalenti: 1. ω è esatta. 2. Se P 0 e P sono due punti qualunque in A e +γ 1 e +γ 2 sono due curve generalmente regolari orientate contenute in A, che hanno entrambe come primo estremo P 0 e come secondo estremo P, allora ω = ω +γ 1 +γ vale a dire l integrale curvilineo dipende solo dagli estremi P 0 e P e non dal cammino percorso.

153 9.5. Forme differenziali lineari esatte Figura 9.3: Le curve +γ 1 e +γ 2 hanno gli stessi estremi P 0 e P. La curva γ 2 opposta a +γ 2 ha come estremi P e P Se γ è una qualunque curva generalmente regolare, chiusa e contenuta in A, allora ω = 0 +γ Dimostrazione. Di questo teorema, dimostriamo che (1) (2), (2) (3) e (3) (2). (1) (2) Sia per ipotesi ω = Xdx + Y dy esatta. Siano dati due punti P 0 e P in A e sia +γ una curva generalmente regolare che ha P 0 come primo estremo e P come secondo estremo. In forma parametrica, le equazioni della curva +γ siano x = x(t) y = y(t) a t b Quindi (x(a), y(a)) = (x 0, y 0 ) = P 0, e (x(b), y(b)) = (x, y) = P. Sia F una primitiva di ω (esiste perchè ω è esatta: vuol dire che df = ω, poichè F x = X e F y = Y. Ma allora per il teorema fondamentale del calcolo degli integrali (si veda teorema 9.4.1) ω = df = F (P ) F (P 0 ) +γ +γ L integrale non dipende dalla particolare curva +γ ma solo dagli estremi della curva e dalla primitiva F. Perciò, date due curve +γ 1 e +γ 2 il risultato dell integrale non cambia (si veda Figura 9.3). La (2) è provata. (2) (3) Sia +γ una curva generalmente regolare chiusa data da equazioni parametriche x = x(t) y = y(t) a t b Si fissi un punto t interno all intervallo [a, b] e si considerino le due curve che si ottengono da +γ facendo variare il parametro t in [a, t ] e in [t, b] in modo che +γ sia dato dall unione di queste due curve, che chiamiamo, rispettivamente +γ 1 e +γ 2. La curva +γ 1 ha come primo estremo P 0 e come secondo estremo il punto T = (x(t ), y(t ). La curva +γ 2 ha come primo estremo T e come secondo estremo P 0 (essendo la curva chiusa e quindi (x(a), y(a)) = (x(b), y(b))). La curva opposta a +γ 2 è la curva γ 2 e ha, quindi, come primo estremo P 0 e come secondo estremo T. Dunque, le curve +γ 1 e γ 2 hanno gli stessi estremi P 0 e T. Ora, per l ipotesi (2) sappiamo che ω = +γ 1 ω γ 2 147

154 9. FORME DIFFERENZIALI Ma sappiamo anche che ω = γ 2 Quindi ω = +γ 1 +γ 2 ω +γ 2 ω da cui ω + +γ 1 ω = 0 +γ 2 Torniamo all integrale su tutta la curva +γ: poichè +γ = +γ 1 +γ 2 si ha ω = +γ ω + +γ 1 ω +γ 2 Ma la somma di questi due integrali vale zero, quindi ω = 0 +γ L asserto è dunque provato. (3) (2) Siano date due curve +γ 1 e +γ 2 due curve generalmente regolari che hanno gli stessi estremi P 0 e P. Allora la curva +γ 1 γ 2 è una curva chiusa generalmente regolare. Per la (3) vale +γ 1 γ 2 ω = 0 Ma ω = +γ 1 γ 2 ω + +γ 1 Quindi ω + ω = 0 +γ 1 γ 2 γ 2 ω da cui ω = +γ 1 ω γ 2 ω = +γ 1 +γ 2 ω Abbiamo verificato il punto (2). Per completare la dimostrazione del teorema, andrebbe dimostrato che (2) (1). Poichè la dimostrazione è abbastanza complicata, la tralasciamo. Come corollario si ha Proposizione Siano A R 2 un insieme aperto e connesso e ω una forma differenziale lineare di classe C 0 in A, con F primitiva. Allora, se +γ è una curva generalmente regolare e orientata contenuta in A, che ha come primo estremo P 0 e come secondo estremo P, si ha ω = F (P ) F (P 0 ) +γ Dimostrazione. precedente. 148 Questo risultato lo abbiamo dimostrato al punto (1) (2) del teorema

155 9.6. Le forme differenziali lineari chiuse 9.6 Le forme differenziali lineari chiuse Definizione Una forma differenziale lineare ω = Xdx + Y dy di classe C 1 in A, insieme aperto di R 2, si dice chiusa se per ogni punto P di A risulta X y = Y x Teorema Data ω = Xdx+Y dy una forma differenziale lineare di classe C 1 in un insieme aperto A R 2, ω esatta = ω chiusa. Dimostrazione. Se ω è esatta, vuol dire che esiste una primitiva, F, tale che F x = X e F y = Y. Per ipotesi ω è di classe C 1, cioè le derivate parziali di X e Y sono continue. Di conseguenza F è di classe C 2 (poichè le sue derivate parziali del secondo ordine coincidono con le derivate parziali prime di X e Y ). Inoltre si ha F 2 x y = X y e F 2 y x = Y x Per il teorema di Schwartz, le derivate parziali miste di F coincidono, risulta X y = Y x F 2 x y = F 2 y x, quindi L asserto è provato. Osserviamo che il viceversa non vale sempre. Si possono avere forme differenziali chiuse che non sono esatte. Per poter avere l implicazione ω chiusa ω esatta, la forma differenziale lineare deve essere definita in un insieme particolare. Introduciamo, perciò, la definizione di insieme semplicemente connesso. Definizione Un sottoinsieme di R 2, A aperto, si dice semplicemente connesso se G è connesso G ogni curva generalmente regolare, chiusa e semplice contenuta in A è la frontiera di un insieme limitato contenuto in A. Dire che A è un insieme semplicemente connesso vuol dire che l insieme è senza buchi, in quanto ogni curva chiusa e semplice, generalmente regolare, può essere deformata con continuità fino a ridursi ad un singolo punto. Una corona circolare ha buchi e, infatti, non è semplicemente connesso. Il piano privato di un punto non è semplicemente connesso. L interno di un cerchio è semplicemente connesso. La circonferenza non è semplicemente connesso. Teorema Sia ω una forma differenziale lineare di classe C 1 in A aperto e semplicemente connesso. Allora se ω è chiusa, ω è esatta. 149

156

157 Bibliografia [1] DAWKINS, P. (2007), Calculus I, Class Notes, terms.aspx. [2] DAWKINS, P. (2007), Calculus II, Class Notes, terms.aspx. [3] DAWKINS, P. (2007), Calculus III, Class Notes, terms.aspx. [4] GUICHARD, D. (2012), Calculus, Late Trascendentals, Creative Commons Attribution Non-Commercial-ShareAlike License, multivariable_late/. [5] KEISLER, H. J. (2009), Elementary Calculus, An Infinitesimal Approach, Creative Commons Attribution Non-Commercial-ShareAlike License, ~Keisler/calc.html. [6] STEWAR T, J. (2003), Calculus, Thomson-Brooks/Cole. [7] STEWAR T, J. (2007), Calculus, Early Transcendentals, Thomson,Brooks/Cole. [8] STRANG, G. (1991), Calculus, Wellesley-Cambridge Press. [9] TRENCH, W. F. (2012), Introduction to Real Analysis, Free Hyperlinked Edition 2.00, February