Analisi Matematica 2 [2]
 9788808637086

Citation preview

Indice

Prefazione

ix

1 Curve e integrali curvilinei 1. Curve in R3 1.1 Elementi di calcolo vettoriale 1.2 Curve in R3 : definizioni principali 1.3 Curve regolari 1.4 Curve equivalenti 1.5 Curve rettificabili. Lunghezza di una curva 1.6 Ascissa curvilinea. I vettori normale e binormale 1.7 Curvatura e torsione 2. Integrali curvilinei 2.1 Integrali curvilinei rispetto alla lunghezza d’arco o di 1a specie 2.2 Forme di↵erenziali lineari. Integrali curvilinei di 2a specie 2.3 Riconoscimento delle forme di↵erenziali esatte. Costruzione della funzione potenziale 2.4 Insiemi semplicemente connessi

1 1 1 6 10 13 15 20 23 33 33 36

2 Ottimizzazione delle funzioni di pi` u variabili 1. Generalit` a sull’ottimizzazione. Estremi liberi 1.1 Esempi preliminari 1.2 Generalit` a sull’ottimizzazione 1.3 Estremi liberi. Condizioni necessarie 1.4 Forme quadratiche 1.5 Condizioni sufficienti per estremi liberi 2. Estremi vincolati. Vincoli di uguaglianza 2.1 Funzioni di due variabili 2.2 Il caso generale: funzioni di n variabili con m vincoli (m < n) 2.3 Condizioni sufficienti 3. Vincoli di disuguaglianza 3.1 Generalit` a sui problemi di programmazione 3.2 Direzioni ammissibili e qualificazione dei vincoli 3.3 Il teorema di Karush-Kuhn-Tucker 3.4 Condizioni sufficienti 3.5 Vincoli di uguaglianza e disuguaglianza

55 56 56 57 60 63 69 76 76 81 86 91 91 94 97 99 101

43 49

vi

Indice

c 978-88-08-63708-6

3 Spazi funzionali e approssimazione di funzioni 103 1. Spazi funzionali 103 1.1 Metrica e topologia 103 1.2 Successioni di funzioni. Convergenza puntuale e convergenza uniforme 109 1.3 Scambio di limiti; di limite e derivata, di limite e integrale. Gli spazi di Lagrange 112 1.4 Completezza, chiusura, limitatezza, compattezza 117 1.5 Densit` a 120 1.6 Applicazioni tra spazi metrici. Teorema delle contrazioni 121 1.7 Spazi normati e spazi dotati di prodotto scalare 126 2. Serie di funzioni 135 2.1 Generalit` a 135 2.2 Serie di potenze 140 2.3 Funzioni analitiche 146 2.4 Serie trigonometriche 152 2.5 Convergenza delle serie di Fourier 160 4 Equazioni di↵erenziali ordinarie 1. Concetti e teoremi fondamentali 1.1 Esempi preliminari 1.2 Definizioni e terminologia 1.3 Esistenza e unicit` a locale 1.4 Prolungamento delle soluzioni. Esistenza e unicit` a globale 1.5 Dipendenza delle soluzioni dai dati iniziali e da eventuali parametri 1.6 Integrazione di alcune equazioni del primo ordine 2. Equazioni lineari 2.1 Definizione e prime propriet` a 2.2 Richiami di algebra delle matrici 2.3 Sistemi omogenei. Wronskiano. Matrice di transizione 2.4 Sistemi omogenei a coefficienti costanti 2.5 Sistemi non autonomi 2.6 Sistemi non omogenei 2.7 Problemi ai limiti per equazioni lineari del secondo ordine 3. Sistemi autonomi. Stabilit` a 3.1 Generalit` a sui sistemi autonomi 3.2 Sistemi bidimensionali. Alcuni esempi 3.3 Il concetto di stabilit` a 3.4 Stabilit` a dell’origine per sistemi lineari autonomi. Il caso bidimensionale 3.5 Il metodo di Liapunov 3.6 Metodo di linearizzazione 3.7 Cicli limite. Oscillazioni autosostenute 3.8 Il punto di vista dei sistemi dinamici

175 175 175 180 185 192 199 202 213 214 217 226 230 238 243 247 258 258 262 267 268 274 280 283 287

c 978-88-08-63708-6

Indice

vii

5 Misura e integrazione 1. Integrale multiplo secondo Riemann 1.1 Integrale doppio per funzioni definite su un rettangolo 1.2 Calcolo di un integrale doppio mediante due integrazioni semplici 1.3 Integrale su regioni pi` u generali. Misura di Peano-Jordan 1.4 Funzioni generalmente continue 1.5 Propriet` a dell’integrale 1.6 Cambiamento delle variabili di integrazione 1.7 Integrali multipli 1.8 Alcune applicazioni 1.9 Cenno agli integrali multipli generalizzati 1.10 La funzione Gamma di Eulero. Volume della sfera in Rn 2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili 2.1 Misura degli insiemi limitati 2.2 Propriet` a della misura 2.3 Dimostrazione delle propriet` a della misura 2.4 Insiemi non limitati 2.5 Misura e dimensione. Insiemi frattali 2.6 Funzioni misurabili 3. Integrale secondo Lebesgue 3.1 Integrale di funzioni misurabili e limitate 3.2 Funzioni integrabili 3.3 Prime propriet` a dell’integrale di Lebesgue 3.4 Limite, serie e derivata di integrali 3.5 Scambio nell’ordine delle integrazioni 3.6 Misure con peso. Probabilit` a 3.7 Gli spazi L1 (E) e L2 (E). Ancora sulle serie di Fourier

295 295 295

6 Superfici e integrali di superficie 1. Superfici in R3 1.1 Definizioni principali. Superfici regolari 1.2 Bordo di una superficie. Superfici regolari a pezzi 1.3 Linee coordinate. Coordinate locali. Cambiamento di parametri 1.4 Vettore normale. Piano tangente. Orientazione 1.5 Metrica sulla superficie. Prima forma fondamentale 1.6 Area di una superficie. Integrali superficiali 1.7 Alcune applicazioni fisiche e geometriche 1.8 Generalizzazione a dimensioni superiori 2. Curvature 2.1 Seconda forma fondamentale 2.2 Curvature delle linee su una superficie 2.3 Curvature principali. Curvatura gaussiana e curvatura media 2.4 Mappa di Gauss. Theorema Egregium 3. I teoremi di Green, Gauss e Stokes 3.1 La formula di Gauss-Green nel piano

399 399 399 403

300 303 306 309 311 321 332 336 339 343 343 349 352 355 357 361 368 368 372 374 376 382 386 392

405 411 414 418 421 427 428 428 432 435 438 446 446

viii

Indice

3.2 3.3 3.4 3.5 3.6

c 978-88-08-63708-6

Applicazioni Il teorema di Stokes nello spazio Potenziale vettore Il teorema della divergenza Applicazioni

449 454 459 462 466

7 Equazioni alle derivate parziali e Calcolo delle variazioni 475 1. Equazioni alle derivate parziali 475 1.1 Generalit` a 475 478 1.2 Equazioni lineari del 2 ordine. Classificazione 1.3 Equazioni tipo e problemi associati 480 1.4 Il problema di Cauchy. Caratteristiche 484 1.5 Generalit` a sui problemi al contorno. Nozione di problema ben posto 489 1.6 Problemi di unicit` a 491 1.7 Problema di Dirichlet per l’equazione di Laplace nel cerchio. Propriet` a delle funzioni armoniche 497 1.8 Problema di Cauchy-Dirichlet per l’equazione del calore 501 1.9 Problema della corda vibrante con estremi fissi 503 2. Elementi di calcolo delle variazioni 511 2.1 Alcuni problemi tipici del Calcolo delle Variazioni 512 2.2 Funzionali del calcolo delle variazioni 514 2.3 Variazione prima e seconda di un funzionale 515 2.4 L’equazione di Eulero 518 2.5 Casi particolari dell’equazione di Eulero 521 2.6 Estremi variabili. Condizioni naturali 524 2.7 Funzionali dipendenti da pi` u funzioni 525 2.8 Funzionali dipendenti da funzioni di pi` u variabili 526 2.9 Problemi isoperimetrici 530 2.10 Il principio di Hamilton 533 Indice analitico

539

Prefazione

Dopo numerose ristampe esce ora una nuova edizione di quest’opera che aveva ricevuto, al tempo della prima edizione nel 1990, un’accoglienza assai lusinghiera presso un vasto pubblico di studenti dei corsi di laurea scientifici, oltre a un significativo apprezzamento da parte di numerosi colleghi. Da allora il nuovo ordinamento degli studi universitari, basato sul modello di una laurea triennale seguita da un biennio specialistico, ha pi` u volte mutato le caratteristiche dell’insegnamento della matematica “di base”, dapprima con una drastica riduzione dei contenuti, alla quale ha fatto seguito una pi` u ponderata risistemazione dei programmi didattici. Durante i passati 25 anni il primo testo, pur risentendo della riorganizzazione didattica in atto, ha continuato a godere del favore dei suoi utenti. Per questo motivo oggi si ripresenta, con una veste tipografica nuova e alcuni aggiornamenti: sono stati inseriti nuovi esercizi, qualche dimostrazione `e stata resa pi` u scorrevole. L’impostazione generale `e per` o stata confermata: mostrare, con i numerosi esempi, la forte interazione tra la matematica e le scienze applicate, e sottolineare sempre il punto di vista strutturale, essenziale nella modellistica moderna. Questo libro di testo continua perci` o a risultare adatto per corsi che mantengono un elevato livello di completezza degli argomenti trattati e una speciale attenzione per gli aspetti funzionali dell’Analisi classica. Nello stesso tempo costituisce un solido riferimento per eventuali approfondimenti anche per coloro che scelgono di accostarsi all’Analisi matematica per le strade pi` u frequentate e pi` u scorrevoli del nuovo ordinamento.

CAPITOLO 1

Curve e integrali curvilinei

La prima parte di questo capitolo (Sez. 1.) `e dedicata agli aspetti elementari della geometria di↵erenziale delle curve nel piano e nello spazio. Si `e cercato, nell’esporre la teoria, di metterne in evidenza la duplice natura geometrico-cinematica. Si sviluppa successivamente (Sez. 2.) la nozione di integrale di linea, di fondamentale importanza non solo in Analisi ma anche nelle scienze applicate, soprattutto in Fisica, dove `e collegata, per esempio, alle nozioni di lavoro, flusso ed energia. La connessione avviene attraverso i concetti di forma di↵erenziale esatta, campi vettoriali conservativi e invarianza dell’integrale rispetto a deformazioni della traiettoria, argomenti che sono pure trattati nella Sezione 2. CURVE IN R3

1. 1.1

Elementi di calcolo vettoriale

In questo paragrafo preparatorio abbiamo raccolto alcuni risultati di calcolo vettoriale che si riveleranno utili in seguito. In particolare esamineremo le propriet` a principali dell’operazione di prodotto vettoriale in R3 che induce in tale spazio un’ulteriore struttura (di Algebra di Lie) in aggiunta alle numerose altre possedute da ogni spazio euclideo. Il prodotto vettoriale tra due vettori in R3 `e definito come segue: DEFINIZIONE 1.1 Siano ⇠ = ⇠1 i + ⇠2 j + ⇠3 k e ⌘ = ⌘1 i + ⌘2 j + ⌘3 k due vettori di R3 . Si dice prodotto vettoriale di ⇠ per ⌘ il vettore di R3 , indicato con1 ⇠ ⇥ ⌘ (si legge ⇠ vettore ⌘), cos`ı definito: (1.1)

⇠ ⇥ ⌘ := (⇠2 ⌘3

⇠3 ⌘2 )i + (⇠3 ⌘1

⇠1 ⌘3 )j + (⇠1 ⌘2

⇠2 ⌘1 )k.

Si pu` o ricordare facilmente la (1.1) osservando che il secondo membro coincide formalmente con il determinante della matrice simbolica seguente, ottenuto per sviluppo

1 Altra

notazione in uso ` e: ⇠ ^ ⌘.

2

CAPITOLO 1. Curve e integrali curvilinei

secondo la prima riga:

c 978-88-08-63708-6

0

1 i j k @⇠1 ⇠2 ⇠3 A . ⌘1 ⌘2 ⌘3

Esempio 1.1 Si ha: i ⇥ j = k, j ⇥ k = i, k ⇥ i = j. L’applicazione da R3 ⇥ R3 ! R3 definita dalla (1.1) possiede le seguenti propriet` a, di verifica immediata: 8 ⇠, ⌘, ⇣ 2 R3 e 8 ↵, 2 R abbiamo: 1. ⇠ ⇥ ⌘ = ⌘ ⇥ ⇠ 2. (↵⇠ + ⌘) ⇥ ⇣ = ↵(⇠ ⇥ ⇣) + (⌘ ⇥ ⇣) ⇠ ⇥ (↵⌘ + ⇣) = ↵(⇠ ⇥ ⌘) + (⇠ ⇥ ⇣) 3. (⇠ ⇥ ⌘) ⇥ ⇣ + (⇣ ⇥ ⇠) ⇥ ⌘ + (⌘ ⇥ ⇣) ⇥ ⇠ = 0

(antisimmetria) (bilinearit` a) (identit` a di Jacobi)

Come abbiamo gi` a accennato in precedenza, lo spazio R3 , dotato del prodotto vettoriale (1.1), `e un esempio di algebra di Lie, una struttura che gioca un ruolo rilevante nella teoria dei campi vettoriali e della meccanica hamiltoniana. Pi` u esattamente, diamo la seguente DEFINIZIONE 1.2 Si chiama algebra di Lie2 uno spazio lineare V dotato di un’applicazione da V ⇥ V ! V che sia antisimmetrica, bilineare e che soddisfi l’identit` a di Jacobi. Di solito l’applicazione di cui si parla nella Definizione (1.2) si indica con il simbolo [·, ·] e si chiama commutatore. Esempio 1.2 Un altro esempio di algebra di Lie `e lo spazio lineare Mn di tutte le matrici quadrate di ordine n rispetto al commutatore [A, B] := AB

BA

A, B 2 Mn .

Esaminiamo ora alcune propriet` a che legano il prodotto vettoriale con quello scalare. 3 Dati tre vettori ⇠, ⌘, ⇣ 2 R , il numero reale h⇠, ⌘ ⇥ ⇣i si chiama prodotto misto di ⇠, ⌘, ⇣. Si verifica immediatamente che 1 0 ⇠1 ⇠2 ⇠3 (1.2) h⇠, ⌘ ⇥ ⇣i = det @⌘1 ⌘2 ⌘3 A . ⇣1 ⇣2 ⇣3 2 Sophus

Lie (1842-1899).

1. Curve in R3

c 978-88-08-63708-6

3

Valgono le seguenti propriet` a: PROPOSIZIONE 1.1 8 ⇠, ⌘, ⇣ 2 R3 : a) h⇠, ⌘ ⇥ ⇣i = h⌘, ⇣ ⇥ ⇠i (ciclicit` a del prodotto misto); b) h⇠ ⇥ ⌘, ⇠i = h⇠ ⇥ ⌘, ⌘i = 0 (⇠ ⇥ ⌘ `e perpendicolare al piano di ⇠ ed ⌘); (identit` a di Lagrange). c) |⇠ ⇥ ⌘|2 = |⇠|2 · |⌘|2 h⇠, ⌘i2 Dimostrazione. Le propriet` a a) e b) si ricavano subito dalla (1.2) ricordando le propriet` a dei determinanti. Per la c) osserviamo preliminarmente che, dividendo entrambi i membri per a dei prodotti scalare e vettoriale, ci si riduce a dimostrare |⇠|2 · |⌘|2 e usando l’omogeneit` l’identit` a per ⇠ ed ⌘ versori, ovvero: |⇠ ⇥ ⌘|2 = 1

h⇠, ⌘i2 ,

|⇠| = |⌘| = 1.

L’ultima identit` a `e un facile esercizio di algebra elementare.



Dall’identit` a di Lagrange si ricava che (1.3)

|⇠ ⇥ ⌘| = |⇠| · |⌘| sin '

(0  '  ⇡)

dove ' `e l’angolo compreso tra ⇠ e ⌘, ovvero: il modulo di ⇠ ⇥ ⌘ uguaglia l’area del parallelogramma formato dai vettori ⇠ e ⌘ (si veda la Fig. 1.1).

x j h Figura 1.1. Interpretazione geometrica del prodotto vettoriale.

La (1.3) segue subito ricordando che h⇠, ⌘i = |⇠| · |⌘| cos ' e quindi, da c): |⇠ ⇥ ⌘|2 = |⇠|2 · |⌘|2 (1

(cos ')2 ) = |⇠|2 · |⌘|2 (sin ')2

da cui (1.3). Passiamo ora ad alcuni aspetti della derivazione e dell’integrazione di funzioni vettoriali di variabile reale. a conto che tutto `e Anche se continueremo a lavorare in R3 , il lettore si render` facilmente estendibile a Rn , tranne la di↵erenziazione di un prodotto vettoriale. LEMMA 1.2 Siano ⇠, ⌘ : [a, b] ! R3 funzioni vettoriali derivabili; allora valgono le formule (di Leibniz): d h⇠(t), ⌘(t)i = h⇠0 (t), ⌘(t)i + h⇠(t), ⌘ 0 (t)i; dt d (⇠(t) ⇥ ⌘(t)) = ⇠0 (t) ⇥ ⌘(t) + ⇠(t) ⇥ ⌘ 0 (t). b) dt a)

Lasciamo la semplice dimostrazione per esercizio.

4

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Nel caso in cui |⇠(t)| = c (costante) per ogni t 2 [a, b] si ha h⇠(t), ⇠(t)i = |⇠(t)|2 = c2 da cui, per la a) del lemma precedente, d h⇠(t), ⇠(t)i = 2h⇠0 (t), ⇠(t)i dt

0= cio`e ⇠0 e ⇠ sono ortogonali. In conclusione abbiamo:

LEMMA 1.3 Sia ⇠ : [a, b] ! R3 tale che |⇠(t)| = c 2 R per ogni t 2 [a, b]. Se ⇠ `e derivabile, allora ⇠0 (t)?⇠(t) per ogni t 2 [a, b]. L’integrale di una funzione vettoriale si definisce senza difficolt` a. Se ⇠(t) = ⇠1 (t)i + ⇠2 (t)j + ⇠3 (t)k, t 2 [a, b], ⇠ si dice integrabile se le componenti ⇠j (j = 1, 2, 3) sono integrabili; si pone Z b Z b Z b Z b ⇠(t)dt := i ⇠1 (t)dt + j ⇠2 (t)dt + k ⇠3 (t)dt. a

a

a

a

Per l’integrale cos`ı definito valgono le propriet` a di linearit` a e di additivit` a rispetto all’intervallo di integrazione (Teor. 1.8, pag. 400, Vol. 1). Inoltre vale il seguente LEMMA 1.4 Sia ⇠ : [a, b] ! R3 , ⇠ integrabile. Rb a) Se ⇠ 2 C 1 ([a, b]) allora a ⇠0 (t)dt = ⇠(b) ⇠(a) (teorema fondamentale del calcolo integrale) b) Se c 2 R3 `e costante, allora + Z * Z b b ⇠(t)dt = hc, ⇠(t)idt c, a

c) |⇠| `e integrabile e

Z

a

a

b

⇠(t)dt 

Z

a

b

|⇠(t)|dt.

Dimostrazione. La a) `e conseguenza immediata del Teorema 1.10, pag. 404, del Volume 1. Dimostriamo b). Sia c = (c1 , c2 , c3 ). Allora ⌧ Z b Z b Z c, ⇠ dt = c1 ⇠1 dt + c2 a

a

b

⇠2 dt + c3 a

Per dimostrare c) usiamo la b) con c = (1.4)

Z

2

b

⇠(t)dt a

=

⌧Z

b

⇠(s)ds, a

Rb

b

⇠3 dt = a

Z

b a

Z b (c1 ⇠1 + c2 ⇠2 + c3 ⇠3 )dt = hc, ⇠idt. a

⇠(t)dt. Si ottiene:

a

Z

Z

b

⇠(t)dt

=

a

Z

b a

⌧Z

b

⇠(s)ds, ⇠(t) dt. a

Per la disuguaglianza di Cauchy-Schwarz si ha: ⌧Z

b

⇠(s)ds, ⇠(t) a



Z

b a

⇠(s)ds · |⇠(t)|

1. Curve in R3

c 978-88-08-63708-6

5

che, inserita nella (1.4), d` a: Z

2

b

⇠(t)dt a



Z

b a

Z

Z

b a

⇠(s)ds · |⇠(t)|dt =

b a

⇠(t)dt ·

Z

b a

|⇠(t)|dt

da cui c).



Terminiamo il paragrafo con alcune utili formule di analisi vettoriale; esse legano tra loro gli operatori di↵erenziali di gradiente, divergenza, rotore che abbiamo gi` a avuto occasione di incontrare nel Capitolo 7, Volume 1. Ricordiamo le definizioni. Sia f : A ! R, dove A `e un aperto di R3 , una funzione derivabile (campo scalare). Il gradiente di f (in coordinate cartesiane) `e definito da grad f (o rf ) := fx i + fy j + fz k. Sia ora v : A ! R3 un campo vettoriale derivabile, v = v1 i + v2 j + v3 k. La divergenza di v (div v o r · v) e il rotore di v (rot v o curl v o r ⇥ v) sono definiti (in coordinate cartesiane) rispettivamente dalle espressioni seguenti: @ v1 + @x ✓ @v3 rot v := @y

div v :=

@ @ v2 + v3 @y @z ◆ ✓ @v2 @v1 i+ @z @z

@v3 @x



j+



@v2 @x

@v1 @y



k.

La formula che definisce rot v si pu` o ricordare facilmente osservando che essa coincide formalmente con il determinante della seguente matrice simbolica, ottenuto per sviluppo secondo la prima riga: 1 0 i j k @@x @y @z A v1 v2 v3

Avremo modo in seguito di tornare sulle definizioni e sugli importanti significati di divergenza e rotore.

LEMMA 1.5 Se tutte le funzioni coinvolte sono di classe C 2 , valgono le formule seguenti: a) rot grad f = 0; b) div rot v = 0; c) div grad f = f := fxx + fyy + fzz . (L’operatore Inoltre: d) e) f) g)

, gi` a introdotto nel Capitolo 7, Volume 1, `e detto operatore di Laplace.)

rot rot v = grad div v v (dove v = i v1 + j v2 + k v3 ); div(f v) = f div v + hgrad f, vi; rot(f v) = grad f ⇥ v + f rot v; div(u ⇥ v) = hu, rot vi hv, rot ui.

6

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Omettiamo la dimostrazione del Lemma 1.5, che, del resto, si riduce a una verifica diretta, utilizzando il teorema di Schwarz sull’inversione dell’ordine di derivazione. 1.2

Curve in R3 : definizioni principali

L’idea intuitiva di curva `e quella di un insieme di punti nello spazio in cui una particella `e libera di muoversi con un grado di libert` a. Un duplice aspetto, cinematico-geometrico, appare dunque in modo naturale nel concetto di curva e costituisce la motivazione per la definizione che segue. Sia un sottoinsieme di R3 ed esista una funzione continua r : I ! R3 , dove I ✓ R `e un intervallo, di cui `e l’immagine: = im(r). Diremo che r `e una parametrizzazione ` evidente che uno stesso insieme pu` di . E o avere diverse parametrizzazioni. DEFINIZIONE 1.3 Si dice curva in R3 un insieme r(t), t 2 I ✓ R.

✓ R3 con una sua parametrizzazione

Dunque, pensiamo a una curva non solo come a un sottoinsieme dello spazio, immagine di una funzione continua3 , bens`ı alla coppia -parametrizzazione (di ). Incidentalmente si pu` o osservare che questo punto di vista `e molto vicino a quello adottato nella moderna geometria di↵erenziale. La parametrizzazione r : I ! R3 corrisponde a quello che fisici e ingegneri chiamano moto o cammino continuo. Essa, come si vedr` a, contiene le informazioni cinematiche (cio`e velocit` a, accelerazione, ecc.) di una curva. Pi` u esplicitamente, una parametrizzazione `e assegnata mediante l’equazione r(t) = (x(t), y(t), z(t)) o in forma vettoriale, (1.5)

r(t) = x(t)i + y(t)j + z(t)k

con t 2 I. Interpretando t come “tempo”, si pu` o pensare a r(t) come al vettore posizione di una particella al tempo t, rispetto al sistema di riferimento fissato in R3 . Al variare di t, r(t) descrive , detto sostegno della curva, che `e interpretabile come traiettoria descritta dalla particella e che racchiude gli aspetti geometrici della curva. Ora, una stessa traiettoria pu` o corrispondere a moti diversi; si pensi per esempio a una circonferenza percorsa una oppure pi` u volte. Dal punto di vista geometrico sar` a importante isolare le propriet` a di una curva che dipendono solo da , che sono cio`e indipendenti dalla parametrizzazione. Prima di esaminare esempi concreti occorre un po’ di terminologia. Abbiamo visto che si intende per curva una coppia ( , r), dove ✓ R3 ed r : I ! R3 `e una funzione continua. Con leggero abuso, useremo spesso la locuzione “. . . la curva di equazione r = r(t). . . ”. A volte si potr` a assegnare l’equazione (1.5) per individuare la curva. Trattando propriet` a indipendenti dalla parametrizzazione sar` a poi sufficiente assegnare . Se I = [a, b] e r(a) = r(b) si dice che la curva `e chiusa, o che `e un ciclo. 3 La

definizione di curva come immagine di una funzione continua ` e adottata da numerosi Autori.

1. Curve in R3

c 978-88-08-63708-6

7

Una curva si dice semplice se r `e iniettiva in I e r(a), r(b) non appartengono a r(I ); ci` o significa che una curva semplice non chiusa non ha autointersezioni. Pu` o capitare che, data una curva ( , r), sia contenuto in un piano. In tal caso si dice che la curva `e piana. In particolare, si pu` o assegnare una curva piana mediante una funzione continua r : I ! R2 . Le curve piane, semplici e chiuse si chiamano curve di Jordan4 . Un importante teorema di topologia asserisce che (il sostegno di) una curva di Jordan `e frontiera di due insiemi aperti nel piano, uno dei quali `e limitato e si chiama interno della curva, l’altro illimitato, detto esterno. Nelle figure sottostanti sono illustrati i concetti sopra esposti. r(a)

r

r(b) r(t)

a

I

g

b

Figura 1.2. Una curva semplice in R3 .

p

g

Figura 1.3. Curva non semplice; il punto p 2 corrisponde a due valori di t.

4 Camille

r(t)

g

Figura 1.4. Curva semplice piana.

Jordan, matematico francese (1838-1922).

8

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Consideriamo una curva di equazione r = r(t). Il parametro t appartiene a un intervallo I ✓ R. Essendo R orientato, anche I sar` a tale cosicch´e `e automaticamente assegnato su un verso di percorrenza ovvero un’orientazione della curva.

r(b)

r

g r(a)

t a

b

Figura 1.5. Curva orientata.

Potremo allora dire che una coppia ( , r) definisce una curva orientata. Esempi 1.3 r(t) = (x0 + ↵1 t, y0 + ↵2 t, z0 + ↵3 t), t 2 R, ↵12 + ↵22 + ↵32 = 1. La curva `e semplice; il suo sostegno coincide con la retta passante per (x0 , y0 , z0 ) di ` evidentemente una curva piana. coseni direttori ↵1 , ↵2 , ↵3 . E 1.4 r(t) = (a cos t, b sin t, ct), t 2 R, a, b, c, 2 R+ . La curva `e semplice e ha come sostegno un’elica cilindrica infinita, a sezione ellittica. Non `e evidentemente una curva piana. L’innalzamento di quota dopo un periodo di 2⇡ `e detto passo dell’elica. In questo caso il passo `e 2⇡c.

z

2pc

a x

Figura 1.6. Elica cilindrica, a sezione ellittica.

b

y

1. Curve in R3

c 978-88-08-63708-6

9

1.5 r(t) = (cos t, sin t), t 2 [0, 6⇡]. ` una curva in R2 , non semplice e chiusa. Il suo sostegno `e la circonferenza unitaria E con centro nell’origine. Si noti che r(t) percorre la circonferenza 3 volte in senso antiorario. 1.6 r(t) = (cos !t, sin !t), t 2 [0, 2⇡/!], ! 2 R+ . ` una curva in R2 , semplice e chiusa. Ancora, il sostegno `e la circonferenza unitaria E con centro nell’origine. Il punto r(t) percorre la circonferenza una sola volta in senso antiorario. 1.7 Sia f : I ! R una funzione reale di variabile reale, continua. Il suo grafico definisce una curva piana semplice di equazione r(t) = (t, f (t)), che chiameremo curva cartesiana. 1.8 L’equazione g(x, y) = 0, dove g `e di classe C 1 , definisce in un intorno di ogni punto (x0 , y0 ) non singolare per g (in cui cio`e rg 6= 0) una curva piana. Infatti, per il teorema di Dini (Teor. 3.1, pag. 361, Vol. 1) se gx (x0 , y0 ) 6= 0 (risp. gy (x0 , y0 ) 6= 0), l’equazione g(x, y) = 0 definisce implicitamente una funzione x = f (y) (risp. y = f (x)) in un intorno di y0 (risp. x0 ). 1.9 L’equazione ⇢ = f (✓), ✓ 2 [✓0 , ✓1 ], dove ⇢ e ✓ sono coordinate polari nel piano ed f `e continua, definisce una curva piana, in generale non semplice, mediante le equazioni parametriche x(✓) = f (✓) cos ✓,

y(✓) = f (✓) sin ✓.

Per esempio, se f (✓) = ✓, l’equazione ⇢ = ✓, ✓ 2 R+ , definisce una curva, detta spirale di Archimede. 8 6 4 π

2 0

2

–π



–2 –4 –6

g 3π 2

–8 Figura 1.7. Spirale di Archimede.

In tutti gli esempi sopra illustrati il lettore ha osservato curve abbastanza “familiari”; tuttavia, se si richiede alla parametrizzazione la sola continuit` a, ci si pu` o ritrovare con oggetti geometrici che sono ben lontani dalla nozione intuitiva di curva. Uno di questi “oggetti strani” `e la famosa curva di Peano, definita da una parametrizzazione r : [0, 1] ! R2 , il cui sostegno `e l’intero quadrato [0, 1] ⇥ [0, 1].

10

1.3

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Curve regolari

Restringeremo le nostre considerazioni alle curve regolari o regolari a tratti. DEFINIZIONE 1.4 Una curva di equazione r = r(t) si dice regolare se r 2 C 1 (I) e se r0 (t) 6= 0 per ogni t 2 I. Si dice regolare a tratti (o anche generalmente regolare) se I si pu` o suddividere nell’unione di un numero finito di intervalli su ciascuno dei quali `e regolare. Per una curva regolare `e ben definito e diverso da 0 il vettore r0 (t) = x0 (t)i + y 0 (t)j + z 0 (t)k. Abbiamo gi` a visto (Cap. 7, Vol. 1) che r0 (t) si chiama vettore tangente alla curva nel punto r(t). Rigorosamente r0 (t) va pensato spiccato dall’origine in R3 ma `e intuitivamente pi` u efficace pensarlo spiccato da r(t). z

r(t)

g y

! r(t)

x Figura 1.8. Vettore tangente alla curva

nel punto r(t).

La retta di equazioni parametriche ⇠ = x(t0 ) + ⌧ x0 (t0 ) ⌘ = y(t0 ) + ⌧ y 0 (t0 ) ⇣ = z(t0 ) + ⌧ z 0 (t0 )

⌧ 2R

o di equazione vettoriale ⇠(⌧ ) = r(t0 ) + ⌧ r0 (t0 ) prende il nome di retta tangente alla curva nel punto r(t0 ). Per una curva piana cartesiana definita dalla funzione y = f (x) le equazioni parametriche della retta tangente in un punto (x0 , f (x0 )) si riducono alle seguenti: x = x0 + ⌧ y = f (x0 ) + ⌧ f 0 (x0 ), equivalenti alla ben nota equazione y = f (x0 ) + (x

x0 )f 0 (x0 ).

1. Curve in R3

c 978-88-08-63708-6

11

Dal punto di vista cinematico r0 (t) rappresenta il vettore velocit` a, che indicheremo anche con v(t). Un ruolo importante sar` a svolto dal modulo (o norma euclidea) di a scalare e indicheremo con v(t): r0 (t), che chiameremo velocit` p v(t) := |r0 (t)| = x0 (t)2 + y 0 (t)2 + z 0 (t)2 .

Osserviamo che, se la curva `e regolare, v(t) 6= 0 per ogni t 2 I. Risulta cos`ı ben definito il versore v(t) r0 (t) = , T (t) := 0 |r (t)| v(t)

che prende il nome di versore tangente. Le sue componenti sono i coseni direttori della retta tangente. Se due curve regolari si intersecano in un punto, possiamo definire l’angolo che esse formano in quel punto nel modo seguente. Siano 1 , 2 due curve di equazione r1 = r1 (t), t 2 I1 e r2 = r2 (⌧ ), ⌧ 2 I2 rispettia di vamente, tali che r1 (t0 ) = r2 (⌧0 ), t0 2 I1 e ⌧0 2 I2 . Siano v e w i vettori velocit` 1 per t = t0 e di 2 per ⌧ = ⌧0 . Si chiama angolo formato da 1 e 2 nel punto r1 (t0 ) = r2 (⌧0 ), l’angolo ', 0  ' < ⇡, tale che hv, wi . cos ' = vw Si osservi che la definizione `e ben posta grazie alla disuguaglianza di Cauchy-Schwarz: |hv, wi|  vw. Una curva regolare si dice di classe C k (k 1) se r 2 C k (I), di classe C 1 se `e di classe C k per ogni k 1. Per una curva regolare di classe C 2 , oltre ai vettori r(t) e r0 (t) `e definito il vettore 00 r (t), detto vettore accelerazione e indicato anche con a(t). Il suo modulo a(t) = |a(t)| prende il nome di accelerazione scalare. Naturalmente per le curve regolari a tratti i vettori r0 (t), T (t) ed eventualmente r00 (t) sono definiti tranne che in un numero finito di valori di t. Esempi 1.10 Le curve degli Esempi 1.3-1.6 sono di classe C 1 nel loro intervallo di definizione. Per esse si ha: 1.3

1.4

r0 (t) = v(t) = ↵1 i + ↵2 j + ↵3 k, q v(t) = ↵12 + ↵22 + ↵32 = 1, r00 (t) = a(t) = 0 (moto rettilineo uniforme). r0 (t) = v(t) = a sin t i + b cos t j + c k p v(t) = a2 (sin t)2 + b2 (cos t)2 + c2 , r00 (t) = a(t) =

a cos t i

(l’accelerazione giace nel piano x, y per ogni t). 1.5

r0 (t) = v(t) = sin t i + cos t j, v(t) = 1, r00 (t) = a(t) = cos t i

sin t j,

a(t) = 1.

b sin t j

12

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

(moto circolare uniforme: si noti che: r00 (t) = ovvero che l’accelerazione `e centripeta). 1.6

r(t) e che hv(t), a(t)i = 0 per ogni t,

` un moto circolare uniforme con velocit` E a scalare !: 0 v(t) = ! r (t) = v(t) = ! sin !t i + ! cos !t j, r00 (t) = a(t) =

! 2 cos !t i

! 2 sin !t j,

a(t) = ! 2 .

1.11 Se f : I ! R `e di classe C 1 , la curva di equazione r(t) = t i + f (t) j `e piana e regolare. Si ha: p r0 (t) = i + f 0 (t) j, v(t) = 1 + f 0 (t)2 . Se f 2 C 2 (I) esiste r00 (t) = f 00 (t) j.

1.12 Sono regolari a tratti in ogni intervallo limitato le curve di equazione r1 (t) = (t, |t|, t2 ),

r2 (t) = (| cos t|, t, t3 ),

t 2 R.

1.13 La curva di equazione polare ⇢ = f (✓), ✓ 2 [✓0 , ✓1 ] `e regolare se f `e di classe C 1 e f 0 (✓)2 + f (✓)2 6= 0 per ogni ✓. In tal caso si ha: r(✓) = f (✓) cos ✓ i + f (✓) sin ✓ j r0 (✓) = v(✓) = [f 0 (✓) cos ✓ f (✓) sin ✓] i + [f 0 (✓) sin ✓ + f (✓) cos ✓] j p v(✓) = |v(✓)| = f 0 (✓)2 + f (✓)2 .

Se introduciamo i versori

u1 (✓) = cos ✓ i + sin ✓ j u2 (✓) =

versore radiale: r(✓) = |f (✓)|u1 (✓) versore trasversale: hu1 , u2 i = 0,

sin ✓ i + cos ✓ j

la formula trovata sopra per v(✓) si pu` o scrivere nella maniera seguente: (1.6)

v(✓) = f 0 (✓)u1 (✓) + f (✓)u2 (✓).

La formula (1.6) esprime il vettore velocit` a come somma delle sue componenti radiale e trasversale.

u1 v u2

Figura 1.9. Decomposizione del vettore velocit` a in componente radiale e trasversale.

1. Curve in R3

c 978-88-08-63708-6

13

Se f `e di classe C 2 esiste il vettore accelerazione; il lettore verifichi che vale la formula a(✓) = r00 (✓) = [f 00 (✓)

(1.7)

f (✓)]u1 (✓) + 2f 0 (✓)u2 (✓)

che esprime a come somma delle sue componenti radiale e trasversale. 1.4 Curve equivalenti Consideriamo la curva di equazione r(t) = (cos t, sin t), t 2 [0, 2⇡]. Si tratta di una curva semplice e chiusa il cui sostegno `e la circonferenza unitaria con centro in 0. Il cambio di parametro t = !⌧ (! 2 R+ , fissato) non muta e trasforma r(t) in e r(⌧ ) = r(!⌧ ) = (cos !⌧, sin !⌧ ); quando t varia in [0, 2⇡], ⌧ varia in [0, 2⇡ ! ]. Le due curve ( , r), ( , e r) hanno in comune, oltre al sostegno: il verso di percorrenza (antiorario), il versore tangente nello stesso punto del sostegno (T (t) = sin t i+cos t j e (⌧ ) = sin !⌧ i + cos !⌧ j). eT Cambiano invece i moduli dei vettori velocit` a e accelerazione (ma non il loro verso e (⌧ ); r00 (t) = r(t), e r0 (⌧ ) = ! T r00 (⌧ ) = ! 2e r(⌧ ). e la loro direzione): r0 (t) = T (t), e Ci` o non deve stupire in quanto il cambio di variabile t = !⌧ corrisponde a un cambio di scala sull’asse dei tempi. Le due curve ( , r) e ( , e r) costituiscono un esempio di curve equivalenti dal punto di vista geometrico. Esaminiamo questo concetto in generale. Siano ( , r), r : I ! R3 , una curva regolare e ' : Ie ! I, dove Ie `e un intervallo di e tale che '0 (⌧ ) 6= 0, per ogni ⌧ 2 Ie e che realizzi una R, una funzione di classe C 1 (I) corrispondenza biunivoca tra Ie e I. La funzione composta e r(⌧ ) = r '(⌧ ) : Ie ! R3

`e una nuova parametrizzazione di . r), ovvero con la nuova parametrizzaPoich´e e r0 (⌧ ) = r0 ('(⌧ ))'0 (⌧ ), la coppia ( , e zione, `e ancora una curva regolare. Diremo che ( , e r) si ottiene da ( , r) con un cambio di parametrizzazione (o di parametro). Evidentemente si ha anche r(t) = e r ' 1 (t). Esempio 1.14 Sia '(⌧ ) =

una curva regolare di equazione r = r(t), t 2 [a, b], e

⌧ ⌧ b+ ↵

↵ a= ↵

b

a b ⌧+ ↵

↵a ↵

(a < b, ↵ < ).

b a con la parametrizzazione e r(⌧ ) = r '(⌧ ), Si ha '0 (⌧ ) = ↵ < 0; la curva ⌧ 2 [↵, ], `e regolare. Si noti che ' trasforma [↵, ] in [a, b] cambiandone l’orientazione: '(↵) = b e '( ) = a. Come conseguenza, `e ora percorsa da r(b) verso r(a). In particolare se ↵ = a, = b e '(⌧ ) = ⌧ + b + a, la curva ( , e r), e r = r '(⌧ ) = r(b + a ⌧ ) si chiama l’opposta di ( , r).

La situazione descritta nell’Esempio 1.14 si pu` o generalizzare. Passando da r a e r= e r ', il verso di percorrenza sul sostegno non muta se '0 (⌧ ) > 0 per ogni ⌧ 2 I; 0 viceversa se ' (⌧ ) < 0 il verso di percorrenza `e l’opposto. Si vedano le Figure 1.10.

14

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

r(b) = ˜r(b)

b r j

˜ r(a) = r(a) a

a

b

a)

r(a) = ˜r(b)

b r j

˜ r(b) = r(a) a

a

b

b) Figura 1.10. Cambio di parametrizzazione; a) orientazione invariata; b) orientazione opposta.

Diremo che due curve ( , r) e ( , e r) sono equivalenti se possono essere ottenute una dall’altra con un cambio di parametro che non muti l’orientazione. Lasciamo al lettore la verifica che la relazione cos`ı introdotta nell’insieme di tutte le curve regolari `e e↵ettivamente una relazione di equivalenza che, pertanto, le ripartisce in classi disgiunte, individuate ciascuna da una coppia ( , r). Si possono allora identificare le curve in una stessa classe di equivalenza e definire curva orientata una delle classi stesse. Quando ci si limita a curve semplici, questo procedimento identifica sostanzialmente una curva orientata col sostegno munito di un verso di percorrenza. In questo caso, data una curva orientata , la sua opposta si indicher` a con . Curve equivalenti hanno versori tangenti coincidenti nello stesso punto del sostegno (dunque la retta tangente `e la stessa) mentre abbiamo gi` a osservato che i vettori velocit` a e accelerazione subiscono modificazioni nel modulo e, per la accelerazione, in generale, anche in direzione.

1. Curve in R3

c 978-88-08-63708-6

15

1.5 Curve rettificabili. Lunghezza di una curva In questo paragrafo stabiliamo che cosa si debba intendere per lunghezza di una curva e per quali curve questo concetto `e ben posto. Sia data una curva di equazione r : [a, b] ! R3 . Fissiamo una suddivisione D = {t0 = a, t1 , . . . , tn 1 , tn = b} dell’intervallo [a, b] e poniamo, per j = 0, . . . , n, r(tj ) = pj . I punti pj individuano una poligonale inscritta nella curva, ovvero con vertici su , che chiamiamo D . p1 p5 p4

p2

p0

p8

p6 p7 p3 Figura 1.11. Curva

e poligonale inscritta.

La lunghezza della poligonale `e l(

D) =

n X1 j=0

|pj+1

pj | =

n X1 j=0

|r(tj+1 )

r(tj )|.

Sia ora L := sup l( D ) dove l’estremo superiore `e cercato al variare di tutte le possibili suddivisioni di [a, b]. DEFINIZIONE 1.5 Se L < +1 si dice che la curva ( , r) `e rettificabile e che L `e la sua lunghezza, indicata con l( , r). Se L = +1 la curva ( , r) si dice non rettificabile. Esempio 1.15 Sia r : [0, 1] ! R2 definita da ( ⇡ t sin 2t x(t) = t, y(t) = 0

t 6= 0

t = 0.

Consideriamo la suddivisione Dn =

⇢ 0,

1 1 1 1 , ,..., , ,1 2n + 1 2n 1 5 3

dell’intervallo [0, 1]. Poich´e sin((j 12 )⇡) = ( 1)j+1 , (j = 1, . . . , n), oltre all’origine (0, 0) i punti della poligonale corrispondente sono pj = (( 2j1 1 , ( 1)j+1 2j1 1 ) (Fig. 1.12).

16

CAPITOLO 1. Curve e integrali curvilinei

Si ha, per j

c 978-88-08-63708-6

1, |pj+1

pj | =

s✓

2 4j 2

1

quindi l(

Dn )

◆2

+

n X 1 j=1

j



4j 4j 2

1

◆2

1 , j

.

Poich´e la serie armonica `e divergente, ne segue che l( Dn ) ! +1 per n ! +1 ed essendo, per ogni n, l( , r) > l( Dn ), si conclude che ( , r) non `e rettificabile. 1 P0

0.8 0.6 0.4 0.2

P2

0 –0.2

P3 P1

–0.4 0

0.2

0.4

0.6

0.8

1

Figura 1.12. La curva non rettificabile dell’Esempio 1.15.

Il prossimo teorema mostra che tutte le curve regolari, definite in un intervallo [a, b], sono rettificabili e la loro lunghezza si calcola con una comoda formula. TEOREMA 1.6 Se `e una curva regolare di equazione r : [a, b] ! R3 , allora `e rettificabile e vale la formula Z b |r0 (t)|dt. (1.8) L = l( , r) = a

Si noti come la formula (1.8) sia in accordo con l’intuizione: una lunghezza si ottiene integrando la velocit` a di percorrenza nel tempo impiegato a percorrerla. Inoltre, usando la (1.8), si verifica facilmente che la nozione di lunghezza introdotta con la Definizione 1.5 `e in accordo con quella usuale di lunghezza di un segmento e di una circonferenza. Dimostrazione del Teorema 1.6. Sia D = {t0 , t1 , . . . , tn } una suddivisione di [a, b]. Dal teorema fondamentale del calcolo integrale, essendo r0 (t) continuo, si ha, utilizzando a) e b) del

1. Curve in R3

c 978-88-08-63708-6

Lemma 1.4: |r(tj+1 )

Z

r(tj )| =

tj+1 tj

r0 (t)dt 

Z

tj+1 tj

17

|r0 (t)|dt.

Dunque l(

D)

=

n X1 j=0

cosicch´e

|r(tj+1 )

n X1 Z tj+1

r(tj )| 

j=0

l( , r) = sup l(

tj

D) 

D

Z

b a

|r0 (t)|dt =

Z

b a

|r0 (t)|dt,

|r0 (t)|dt

e ( , r) risulta rettificabile. Per dimostrare la (1.8) occorre la disuguaglianza opposta: Z

l( , r)

b

|r0 (t)|dt.

a

Fissiamo " > 0. Essendo r0 (t) continua in [a, b], essa `e anche uniformemente continua, per il teorema di Cantor-Heine (Vol. 1, pag. 209). Si pu` o scegliere allora = (") in modo che, se t, s 2 [a, b] e |t s| < risulti |r0 (t) r0 (s)| < ". Sia ora D una suddivisione di [a, b] di ampiezza < , cio`e max |tj+1 tj | < . j=0,...,n 1

Avremo allora, se t 2 [tj , tj+1 ], che |r0 (t) Quindi: Z

tj+1 tj

=

Z

r0 (tj )| < ", che implica |r0 (t)| < |r0 (tj )| + ".

|r0 (t)|dt  |r0 (tj )|(tj+1

tj+1

[r0 (t)

tj ) + "(tj+1

r0 (t) + r0 (tj )]dt + "(tj+1

tj

tj ) = tj ) 

(per la disuguaglianza triangolare) 

Z

tj+1

r0 (t)dt +

tj

Z

tj+1

[r0 (t)

r0 (tj )]dt + "(tj+1

|r0 (t)

r0 (tj )|dt + "(tj+1

tj

tj ) 

( a) e c) del Lemma 1.4) Z

t+j

 |r(tj+1 )

r(tj )| +

 |r(tj+1 )

r(tj )| + 2"(tj+1

tj

tj ) 

tj ).

Ne segue che Z

b a

|r0 (t)|dt =

n X1 Z tj j=0

= l(

tj+1

D)

|r0 (t)|dt 

+ 2"(b

n X1 j=0

{|r(tj+1 )

a)  l( , r) + 2"(b

r(tj )| + 2"(tj+1

tj )} =

a).

Passando al limite per " ! 0+ si ottiene la disuguaglianza voluta.



18

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Esempi 1.16 Calcoliamo la lunghezza dell’elica cilindrica di equazione vettoriale r(t) = R cos t i + R sin t j + ct k t 2 [0, 2⇡]. Si ha v(t) = |r0 (t)| =

p p R2 (sin t)2 + R2 (cos t)2 + c2 = R2 + c2 e quindi Z 2⇡ p v(t)dt = 2⇡ R2 + c2 . L= 0

1.17 Calcoliamo la lunghezza dell’ellisse di equazione vettoriale r(t) = a cos t i + b sin t j. Si ha, se a > b: L=

Z

0

p 1

2⇡

Z p a2 (sin t)2 + b2 (cos t)2 dt = a

0

2⇡

p 1

e2 (cos t)2 dt

b2 /a2 si chiama eccentricit` a dell’ellisse. R 2⇡ p 1 k2 (cos t)2 dt si chiamano integrali ellittici (di seconda Gli integrali del tipo 0 specie) e si integrano numericamente. Naturalmente, se a = b si trova L = 2⇡a. dove e =

1.18 Per le curve piane che sono grafico di una funzione y = f (x), x 2 [a, b] la formula (1.8) diventa Z bp 1 + f 0 (t)2 dt. (1.9) L= a

Per esempio la lunghezza dell’arco di parabola di equazione y = x2 , x 2 [0, 1] `e Z

0

1

p p Z p 1 Sett Sh 2 5 log(2 + 8) 2 2 1 + 4t dt = (Ch x) dx = + 2 0 2 4

1.19 Per una curva piana regolare di equazione polare ⇢ = f (✓), ✓ 2 [✓1 , ✓2 ] la formula della lunghezza `e (Esempio 1.14):

(1.10)

L=

Z

✓2

✓1

p f 0 (✓)2 + f (✓)2 d✓.

Per esempio, per la lunghezza della cardioide di equazione ⇢ = 1 + cos ✓, ✓ 2 [0, 2⇡], si ha Z 2⇡ p L= 2 + 2 cos ✓d✓ = 8. 0

1. Curve in R3

c 978-88-08-63708-6

1.20 Sia (1.11)

19

la curva di equazione r : [0, 1] ! R2 definita da 8 0: Z Z b |r0 (t)|dt = [posto t = '(⌧ )] = |r0 ('(⌧ ))|'0 (⌧ )d⌧ = l( , r) = =

Z

a





0

Se ' < 0: l( , r) = =

Z

Z

de r d⌧ = l( , e r). d⌧ ↵



|r0 ('(⌧ ))|'0 (⌧ )d⌧ = de r d⌧ = l( , e r). d⌧

Z



|r0 ('(⌧ ))|( '0 (⌧ ))d⌧ = ⇤

La Proposizione 1.7 permette in pratica di scegliere il “parametro pi` u comodo” per il calcolo della lunghezza. In tal caso dunque l( , r) = l( ). Un’altra propriet` a della lunghezza `e l’additivit` a. Precisamente, siano 1 di equazione r1 = r1 (t), r1 : [a, b] ! R3 e 2 di equazione o r2 = r2 (t), r2 : [b, c] ! R3 , tali che r1 (b) = r2 (b) (condizione di raccordo). Si pu` allora definire unione di 1 e 2 la curva = 1 [ 2 di equazione r : [a, c] ! R3 definita da ( r1 (t) t 2 [a, b] r(t) = r2 (t) t 2 [b, c].

20

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Se 1 e 2 sono regolari allora `e, in generale, solo regolare a tratti; `e regolare se e solo se r01 (b) = r02 (b). Nello stesso modo si pu` o definire l’unione di un numero finito di curve j di equazione rj : [aj , aj+1 ] ! R3 , tali che rj (aj+1 ) = rj+1 (aj+1 ), j = 1, . . . , N . La curva = 1 [ 2 [ . . . [ N `e, in generale, regolare a tratti; `e regolare se e solo se r0j (aj+1 ) = r0j+1 (aj+1 ) per ogni j = 1, . . . , N . Vale la seguente proposizione. PROPOSIZIONE 1.8 Se le curve j per ogni j = 1, . . . , N , sono rettificabili, anche e rettificabile e inoltre, se r `e la parametrizzazione di : 1 [ 2 [ ... [ N ` (1.12)

N X

l( , r) =

=

l( j , rj ).

j=1

Dimostrazione. Dalla dimostrazione per N = 2 segue quella per N generico in base al principio di induzione. Sia dunque N = 2 e siano r1 : [a, b] ! R3 , r2 : [b, c] ! R3 , r1 (b) = r2 (b). Sia D = {t0 = a, t1 , . . . , tn 1 , tn = c} una suddivisione di [a, c]. Per un certo j avremo, tj  b < tj+1 ; da D costruiamo ora una suddivisione di [a, b], D0 = {t0 , t1 , . . . , tj , b} e una di [b, c], D00 = {b, tj+1 , . . . , c}. Poich´e |r(tj )

r(tj+1 )| = |r(tj )

r(b) + r(b)

 l(

 l( 1 , r1 ) + l( 2 , r2 )

 |r(tj )

r(b)| + |r(b)

r(tj+1 )|  r(tj+1 )|

si ha l(

D)

D0 )

+ l(

D00 )

e quindi anche supD l( D )  l( 1 , r1 ) + l( 2 , r2 ). Dunque `e rettificabile e l( , r)  l( 1 , r1 ) + l( 2 , r2 ). Abbiamo bisogno della disuguaglianza opposta. Siano D0 e D00 due suddivisioni di [a, b] e di [b, c] rispettivamente. Allora D = D0 [ D00 `e una suddivisione di [a, c] e si ha: l( , r)

l(

D)

= l(

D0 )

+ l(

D00 )

che implica l( , r)

sup l( D0

D0 )

+ sup l( D00

D00 )

= l( 1 , r1 ) + l( 2 , r2 ).



Come immediato corollario otteniamo che le curve regolari a tratti sono rettificabili, in quanto esse si possono pensare come unioni di un numero finito di curve regolari. La (1.12) indica che la formula (1.8) continua a valere per le curve regolari a tratti. 1.6 Ascissa curvilinea. I vettori normale e binormale Sia r : [a, b] ! R3 la parametrizzazione di una curva regolare con lunghezza L. Per ogni t 2 [a, b] risulta definita la funzione Z t v(u)du s(t) = a

che rappresenta cinematicamente lo spazio percorso al tempo t, partendo da r(a).

1. Curve in R3

c 978-88-08-63708-6

21

Per il teorema fondamentale del calcolo integrale, essendo v continua in [a, b], s `e derivabile e s0 (t) = v(t). Poich´e v(t) 6= 0 per ogni t 2 [a, b], s risulta una funzione strettamente crescente e perci` o realizza una corrispondenza biunivoca tra [a, b] e [0, L]. La funzione inversa t = t(s) `e pure strettamente crescente e derivabile con derivata 1 dt = , ds v(t) continua in [0, L]. Dalle precedenti considerazioni segue che le curve di equazione r = r(t) e e r = r(t(s)) sono equivalenti. Il parametro s si chiama ascissa curvilinea, lunghezza d’arco o anche parametro naturale di una curva. Infatti mediante s si pu` o introdurre, almeno per le curve semplici, un sistema di coordinate “intrinseco” sul loro sostegno. Scelto un punto p0 come “origine”, per esempio p0 = r(a), un punto p 2 ha coordinata s se s `e la lunghezza dell’arco di curva da p0 a p. Viceversa, dato s 2 [0, L] risulta individuato un unico punto p 2 , quello tale che la lunghezza dell’arco da p0 a p sia uguale a s. L’estensione dei concetti sopraesposti alle curve generalmente regolari non presenta difficolt` a; la funzione s `e sempre strettamente crescente, derivabile, tranne che in un numero finito di punti, con derivata s0 (t) = v(t). Esempio 1.21 Per l’elica cilindrica di equazione vettoriale r(t) = R cos t i + R sin t j + ct k, abbiamo s(t) =

t 2 [0, 2⇡]

Z tp p R2 + c2 du = R2 + c2 t; 0

s dunque t = p e l’equazione dell’elica riferita al parametro naturale sar` a 2 R + c2 ✓ ◆ ✓ ◆ s s cs r(s) = R cos p k. i + R sin p j+ p 2 2 2 2 2 R +c R +c R + c2 D’ora in avanti, data una curva di equazione r = r(t), indicheremo con r0 la derivata rispetto al parametro “temporale” t (r0 = dr dt ) e, pensando tacitamente t = t(s), con dr la derivata rispetto al parametro ascissa curvilinea. ds dr coincide con il versore Un’importante osservazione `e la seguente: il vettore ds tangente T nel punto r(t(s)) ed `e diretto nel verso delle s crescenti. Infatti dr dt r0 (t) dr = · = ds dt ds v(t) dy dz dr e quindi | ds | = 1. Dunque, se r(t) = x(t) i + y(t) j + z(t) k, i numeri dx ds , ds , ds rappresentano i coseni direttori della retta tangente alla curva nel punto r(t(s)). Oltre al versore tangente T vi sono altri due vettori intrinsecamente associati a una curva: il vettore normale principale N e il vettore binormale B. Supponiamo d’ora in poi che le curve siano regolari e di classe C 2 ([a, b]).

22

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Poich´e |T (t)| = 1 per ogni t 2 [a, b], in base al Lemma 1.3 si deduce che il vettore T 0 (t) `e ortogonale a T (t) per ogni t 2 [a, b]. Se T 0 (t) 6= 0 `e ben definito il versore T 0 (t) N (t) = |T 0 (t)| che si chiama normale principale. dr , il vettore Essendo, come abbiamo gi` a osservato, T = ds perci` o la normale principale si pu` o definire con la formula

N (s) =

d2 r ds2

d2 r ds2

`e diretto come T 0

5

e

d2 r . ds2

Sottolineiamo che, anche se r0 (t) `e diretto come T , il vettore accelerazione non `e in generale diretto come N ; ritorneremo sull’argomento nel Teorema 1.9. Se N 6= 0 la relazione B := T ⇥ N definisce un terzo vettore, che si chiama binormale. I tre vettori T , N , B costituiscono una terna mobile ortonormale, legata alla curva e avente la stessa orientazione della terna6 i, j, k; a volte essa si chiama terna intrinseca (alla curva). Il piano individuato dai versori T (t) ed N (t) si chiama piano osculatore alla curva nel punto r(t): tra tutti i piani contenenti la tangente alla curva in un suo punto `e quello che si “adatta” meglio ad essa (Esercizio 17). L’equazione del piano osculatore in un punto r(t) `e la seguente: (1.13)

h⇠

r(t), B(t)i = 0

dove ⇠ `e il punto corrente sul piano.

N T

Figura 1.13. Piano osculatore.

Nel caso delle curve piane il vettore normale principale `e diretto verso la convessit` a della curva7 come mostrato in Figura 1.14 5 Infatti d2 r = dT · 1 . dt s0 (t) ds2 6 Le terne come i, j, k si chiamano

destrorse: se i ` e diretto come l’indice della mano destra, j come il medio, allora il pollice ` e diretto come k. 7 Pi` u precisamente nel sistema di riferimento T (t), N(t) con origine in r(t), il sostegno della curva ` e localmente grafico di una funzione convessa (Esercizio 19).

1. Curve in R3

c 978-88-08-63708-6

23

y

N T

x Figura 1.14. Vettore tangente e normale principale per una curva piana.

Se una curva `e piana (e non `e una retta), il suo sostegno giace nel piano osculatore di un suo punto qualunque. Anche i piani passanti per r(t) e paralleli ai piani dei versori N , B e T , B, rispettivamente, hanno un nome: il primo si chiama piano normale e il secondo piano rettificante. *1.7 Curvatura e torsione Elementi caratteristici di una curva in un punto sono la curvatura e la torsione. Essi non variano per cambiamenti di sistema di riferimento e neppure per cambi di parametrizzazione, se si eccettua il segno della torsione che cambia con l’orientazione; sono perci` o chiamati gli invarianti geometrici di una curva e descrivono propriet` a del sostegno. Per una retta, il versore tangente T si mantiene costante in direzione e verso; viceversa, per una traiettoria non rettilinea, T muta direzione. a di variazione di DEFINIZIONE 1.6 Si chiama vettore curvatura il vettore dT ds , velocit` T rispetto alla lunghezza d’arco. Il suo modulo si chiama curvatura. In formule abbiamo, ricordando che, se T 0 6= 0, esiste il vettore normale principale N (t) = T 0 (t)/|T 0 (t)|: (1.14)

dT dT dt T 0 (t) |T 0 (t)| = = = N (t). ds dt ds v(t) v(t)

Dunque, il vettore curvatura `e diretto come la normale principale e per la curvatura, che indichiamo con k(t), si ha: (1.15)

k(t) :=

|T 0 (t)| dT = . ds v(t)

La (1.14) si pu` o allora scrivere nella forma dT ds = k(t)N (t). dr Ricordando che T = ds possiamo equivalentemente definire vettore curvatura il vetd2 r d2 r tore ds 2 e curvatura la sua norma | ds2 |. 1 Il reciproco di k(t), ⇢(t) = k(t) (⇢ = +1 se k = 0) prende il nome di raggio di curvatura; il punto c(t) a distanza ⇢(t) nella direzione N (t) si chiama centro di curvatura.

24

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

T

r(t )

N

c(t)

Figura 1.15. Raggio e centro di curvatura.

La curvatura k (o il suo reciproco ⇢) misura il grado di scostamento di una curva dall’andamento rettilineo. Si chiama cerchio osculatore il cerchio giacente nel piano osculatore di centro c(t) e raggio ⇢(t). Esempi 1.22 Una retta ha curvatura nulla e raggio di curvatura 1 in ogni suo punto. 1.23 Consideriamo la circonferenza r(t) = R cos !t i + R sin !t j. Si ha: r0 (t) = !R sin !t i + !R cos !t j T (t) = sin !t i + cos !t j T 0 (t) = ! cos !t i ! sin !t j v(t) = R!, |T 0 (t)| = !. Dunque k(t) = R1 , ⇢(t) = R, ovvero la curvatura di una circonferenza `e costante e pari al reciproco del raggio. Si pu` o mostrare (Esercizio 10) che le sole curve piane a curvatura costante sono le circonferenze. 1.24 Sia data l’elica circolare di equazione r(t) = R cos t i + R sin t j + ct k. Si ha: p r0 (t) = R sin t i + R cos t j + c k, v(t) = R2 + c2 , c R (sin t i cos t j) + p k, T (t) = p 2 2 2 R +c R + c2 R R (cos t i + sin t j), |T 0 (t)| = p . T 0 (t) = p 2 2 2 R +c R + c2 Ne segue che k(t) =

R R2 + c2 , ⇢(t) = . R2 + c2 R

Supponiamo che una particella si muova con velocit` a scalare costante. Se la traiettoria `e rettilinea, il moto `e rettilineo uniforme e nessuna forza agisce sulla particella ovvero essa non subisce alcuna accelerazione. Se la traiettoria devia dall’andamento rettilineo, la particella `e sottoposta a una accelerazione centripeta, cio`e rivolta verso il centro di curvatura. Tale accelerazione `e tanto pi` u intensa quanto pi` u la traiettoria “si incurva”

1. Curve in R3

c 978-88-08-63708-6

25

o, pi` u precisamente, quanto pi` u la curvatura `e elevata. Queste considerazioni sono presentate rigorosamente nel prossimo teorema. TEOREMA 1.9 Sia r = r(t) l’equazione vettoriale di una curva regolare di classe C 2 ([a, b]). Allora valgono le seguenti formule: (1.16)

a)

a(t) = r00 (t) = v 0 (t)T (t) + k(t)v(t)2 N (t)

(1.17)

b)

k(t) =

|r0 (t) ⇥ r00 (t)| |v(t) ⇥ a(t)| = . 3 v(t) v(t)3

(T 0 6= 0)

La (1.16) `e una formula di decomposizione dell’accelerazione nelle sue componenti tangenziale e normale; si pu` o notare come la componente normale sia direttamente proporzionale alla curvatura. La (1.17) `e una formula per la curvatura, in generale pi` u utile della definizione. Dimostrazione. Si ha r0 (t) = v(t)T (t) e quindi r00 (t) = v 0 (t)T (t) + v(t)T 0 (t). D’altra parte, o la (1.16) segue immediatamente. per la (1.15), T 0 (t) = |T 0 (t)|N (t) = k(t)v(t)N (t) e perci` Per ottenere la formula (1.17), moltiplichiamo a destra vettorialmente per r0 (t) = v(t) entrambi i membri della (1.16); si ottiene, per la linearit` a del prodotto vettoriale: r00 (t) ⇥ r0 (t) = v 0 (t)T (t) ⇥ r0 (t) + k(t)v(t)2 N (t) ⇥ r0 (t) = k(t)v(t)2 N (t) ⇥ r0 (t). (essendo T ⇥ r0 = 0). Dunque |r00 (t) ⇥ r0 (t)| = k(t)v(t)2 |N (t) ⇥ r0 (t)| = k(t)v(t)2 |r0 (t)| = k(t)v(t)3 che `e la (1.17). Abbiamo usato il fatto che |N (t) ⇥ r0 (t)| = |N (t)| · |r0 (t)| sin ' = |r0 (t)|, essendo N ?r0 .



La (1.17), oltre che essere pi` u comoda per il calcolo della curvatura, indica che, quando r0 ⇥ r00 6= 0, il piano osculatore `e individuato da questi due vettori. Come conseguenza si ha: r0 ⇥ r00 B= 0 |r ⇥ r00 | e l’equazione del piano osculatore nel punto r(t0 ) prende la forma seguente: h⇠

r(t0 ), r0 (t0 ) ⇥ r00 (t0 )i = 0

ovvero se ⇠ = (x, y, z): 0 1 x x(t0 ) y y(t0 ) z z(t0 ) y 0 (t0 ) z 0 (t0 ) A = 0. det @ x0 (t0 ) 00 00 y (t0 ) z 00 (t0 ) x (t0 ) Esempio 1.25 Nel moto circolare uniforme r(t) = R cos !t i + R sin !t j si ha (Esempio 1.23) k(t) = R1 , v(T ) = !R.

26

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Ne segue che la componente tangenziale dell’accelerazione `e nulla mentre quella centripeta ha norma ! 2 R. Vale la pena di mettere in luce alcuni casi particolari. Nel caso di una curva piana di equazione r(t) = x(t)i + y(t)j la formula (1.17) diventa (1.18)

k(t) =

|x0 (t)y 00 (t) x00 (t)y 0 (t)| . (x0 (t)2 + y 0 (t)2 )3/2

Si noti che il numeratore della (1.18) `e il modulo del determinante della matrice ✓ 0 0◆ x y x00 y 00 Se, pi` u in particolare, la curva piana `e definita dall’equazione y = f (x), la (1.18) prende la forma seguente: (1.19)

k(x) =

|f 00 (x)| . (1 + f 0 (x)2 )3/2

Esempi 1.26 La curvatura di una parabola `e massima nel vertice. Infatti, se l’equazione della parabola `e y = ax2 + bx + c, si ha y 0 = 2ax + b, y 00 = 2a. Dunque 2|a| k(x) = (1 + (2ax + b)2 )3/2 b 2a ,

che `e massima quando 2ax + b = 0 ovvero per x =

ascissa del vertice.

1.27 Significato geometrico della curvatura di una curva piana. Sia T il versore tangente di una curva piana di equazione r(t) = x(t) i + y(t) j. Ricordiamo che dy dy dx e l’angolo che T = dx ds i + ds j, ovvero che ds = cos '(s) e ds = sin '(s) dove ' = '(s) ` T forma con l’asse delle ascisse nel punto t = t(s) (si veda la Fig. 1.16). Si ha dunque: T (s) = cos '(s) i + sin '(s) j. y N

T j

s

x Figura 1.16. La curvatura di una curva piana uguaglia il modulo della velocit` a di variazione dell’angolo ' rispetto all’ascissa curvilinea.

1. Curve in R3

c 978-88-08-63708-6

Allora

dT ds

=

d' ds

sin '(s) i +

d' ds

27

cos '(s) j e perci` o

(1.20)

k(s) =

d' . ds

La (1.20) indica che k `e il modulo della velocit` a di variazione dell’angolo ' rispetto all’ascissa curvilinea. In altri termini k `e il modulo della velocit` a di rotazione del sistema di riferimento mobile (T , N ) rispetto alla lunghezza d’arco. Per una curva piana ha senso definire anche d' ˆ k(s) = ds

(1.21)

che prende il nome di curvatura con segno e che descrive in modo pi` u preciso la variazione della direzione di T rispetto all’asse x. Se la curvatura misura la tendenza a deviare da una traiettoria rettilinea, la torsione misura il grado di scostamento di una curva rispetto alla forma piana. Il vettore B, la binormale, si presta particolarmente a misurare tale deformazione. Infatti se una curva (o meglio il suo sostegno) `e contenuta in un piano, questo coincide con il piano osculatore e perci` o il versore B `e costante. Viceversa, se B `e costante si pu` o mostrare che la curva `e piana (si veda sotto). Cominciamo col definire vettore di torsione il vettore dB ds . Vale il seguente teorema. TEOREMA 1.10 Per ogni curva regolare di classe C 3 valgono le seguenti formule, dette formule di Fr´ enet: dT = kN ds dN = ⌧ B + kT ds dB = ⌧N. ds La prima delle formule non `e altro che la definizione di k; la terza definisce il numero ⌧ che prende il nome di torsione della curva. Una notevole interpretazione cinematica delle formule di Fr´enet `e indicata nei Complementi (Esercizio 22). Dimostrazione. La prima formula `e la (1.14). Dimostriamo la terza. Essendo B = T ⇥ N si ha, ricordando la b) del Lemma 1.2: dB dT dN dN = ⇥N +T ⇥ =T ⇥ ds ds ds ds

(1.22)

essendo dT parallelo a N . La (1.22) indica che dB `e ortogonale a T , mentre per il Lemma 1.3, ds ds dB dB risulta ortogonale a B. Ne segue che ` e parallelo a N , ovvero esiste ⌧ tale che dB = ds ds ds ⌧N. Veniamo alla seconda formula. Essendo N = T ⇥ B, si ha: dN = ds

dT ⇥B ds

T ⇥

dB = ds

kN ⇥ B + ⌧ T ⇥ N = kT

⌧ B.



28

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Si pu` o dimostrare (Esercizio 13) che una curva `e piana se e solo se ⌧ = 0 in ogni suo punto. Si noti che, diversamente da k, sempre positiva o nulla, ⌧ pu` o essere anche negativa. Assegnate le funzioni k = k(s) > 0 di classe C 1 e ⌧ = ⌧ (s) continua, esiste un’unica curva, definita a meno di rototraslazioni nello spazio e riferita a s come parametro naturale, di classe C 3 , avente curvatura k(s) e torsione ⌧ (s). Le equazioni k = k(s) e ⌧ = ⌧ (s) si chiamano equazioni intrinseche della curva. Non potendo so↵ermarci a dimostrare le a↵ermazioni precedenti (si veda comunque l’Esercizio 9) ci limitiamo a osservare che curve equivalenti hanno medesima curvatura e torsione, essendo queste espresse mediante derivazione rispetto al parametro naturale dei tre versori fondamentali; cambiando l’orientazione di una curva cambia di segno la torsione. Dal punto di vista pratico ci` o significa che per il calcolo di k e ⌧ possiamo “parametrizzare” la curva nel modo che riteniamo pi` u conveniente. Sempre dal punto di vista del calcolo, la torsione si pu` o calcolare mediante una formula pi` u comoda della terza formula di Fr´enet. Infatti si ha: PROPOSIZIONE 1.11 Se r0 ⇥ r00 6= 0 valgono le formule ⌧ hr0 ⇥ r00 , r000 i 1 dr d2 r d3 r (1.23) ⌧= = , ⇥ |r0 ⇥ r00 |2 k(s)2 ds ds2 ds3

.

Per la dimostrazione si veda l’Esercizio 18.

Complementi con esercizi 1. Dimostrare le formule del Lemma 1.2. 2. Calcolare le lunghezze delle seguenti curve:

a) r(t) = t i + 2t2 j + (t 1)k t 2 [0, 1]; b) r(t) = e2t i + 2et j + t k t 2 [0, 1]; calcolare poi T , N e B e l’angolo che esse formano nel punto (1, 2, 0). 3. Calcolare le lunghezze delle seguenti curve:

a) y = log x

x 2 [1, 2];

b) y = Ch x c) x2

y2 = 1

x 2 [0, 1]; x 2 [1, 2].

4. Generalizzazione della formula (1.7), Esempio 1.13.

Siano ⇢ = ⇢(t) e ✓ = ✓(t) le coordinate polari nel piano di una particella in moto. L’equazione vettoriale della sua traiettoria `e r(t) = ⇢(t) cos ✓(t) i + ⇢(t) sin ✓(t) j. Introduciamo i versori ur (t) = cos ✓(t) i + sin ✓(t) j u✓ (t) =

sin ✓(t) i + cos ✓(t) j

(versore radiale: r(t) = ⇢(t)ur (t)) (versore trasversale: hrr , u✓ i = 0).

1. Curve in R3

c 978-88-08-63708-6

29

Dimostrare le seguenti formule di decomposizione: v = ⇢0 ur + ⇢✓0 u✓ ,

a = s[⇢00

⇢(✓0 )2 ]ur + [2⇢0 ✓0 + ⇢✓00 ]u✓ .

5. Scrivere le equazioni del piano normale e del piano rettificante. 6. Sia r(t) = (2 + cos t) sin t i + (2 + cos t) cos t j + sin t k,

t 2 [0, 2⇡].

a) Descrivere il sostegno della curva. ⇡ . 2 ⇡ c) Calcolare l’equazione del piano osculatore e del cerchio osculatore nel punto t = . 2 ⇣⇡⌘ d) Calcolare le componenti normale e tangenziale di r00 . 2 b) Calcolare la curvatura nel punto t =

7. Moto centrale. Supponiamo che una particella si muova nello spazio soggetta a un’accele-

razione radiale, ovvero tale che, se r = r(t) `e l’equazione della traiettoria, si abbia r parallelo a r00 = a. Dimostrare che r ⇥ r0 `e un vettore costante c. Dedurre che la traiettoria `e piana e giace in un piano perpendicolare a c. 8. Sia r = r(t), t 2 I, l’equazione vettoriale di una curva regolare . Sia poi f : R3 ! R una

funzione di↵erenziabile. Definiamo derivata di f lungo

l’espressione

Dr f (r(t)) := hrf (r(t)), T (t)i dove T `e il versore tangente alla curva. Dimostrare che: se f| = costante, se cio`e f `e costante su , allora Dr f (r(t)) = 0

8 t 2 I.

9.*

Equazione naturale di una curva piana. ˆ = k(s), ˆ Sia k una funzione continua in [0, L]. Mostrare che, a meno di rototraslazioni, esiste un’unica curva piana regolare ( , r), per la ˆ `e la curvatura con segno ed s `e l’ascissa curvilinea. quale k [Suggerimento: dimostrare i seguenti passi: ˆ dove ' = '(s) `e l’angolo che il vettore T forma i) Dalla (1.21) deve essere k(s) = d' ds con l’asse x. Con una traslazione seguita da una rotazione, si pu` o supporre che la curva “parta” dall’origine e che '(0) = 0 ovvero che la curva, per s = 0, sia tangente all’asse x (Fig. 1.17). Dedurre che '(s) =

Z

s

ˆ k(u)du,

0

ii) Dal punto i) calcolare r(s), s `e l’ascissa curvilinea.]

d2 r ds2

dr = cos ds

Z

s 0

ˆ k(u)du e1 + sin

Z

s

ˆ k(u)du e2 .

0

e controllare che r `e regolare e di classe C 2 ([0, L]), e che

30

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

y g

T j

x Figura 1.17. 10. Dimostrare che le curve piane a curvatura nulla sono segmenti di retta e quelle a curvatura costante sono archi di circonferenze. 11. Determinare le equazioni parametriche (riferite all’ascissa curvilinea) della curva (detta

clotoide) la cui equazione naturale `e k(s) = 2as (s

0).

12. Determinare curvatura e torsione delle seguenti curve:

a) r(t) = t2 i + (2 t) j + t3 k, t 2 R; b) r(t) = et sin t i + et cos t j + 2k, t 2 R. Dimostrare che una curva regolare di classe C 3 `e piana se e solo se ⌧ = 0 in ogni suo punto. [Suggerimento: Sia r = r(s), s 2 [0, L], la parametrizzazione di rispetto all’ascissa curvilinea s. Se ⌧ = 0 segue che B(s) = w, costante. Considerare f (s) = hr(s) r(0), wi e mostrare df = 0.] che ds 13.*

14. Sia r = r(t), t 2 [a, b] una curva di↵erenziabile e chiusa.

Dimostrare che

Z

b

[k0 (t)r(t)

⌧ (t)s0 (t)B(t)]dt = 0.

a

(usare le formule di Fr´enet). 15. Sia y = f (x) di classe C 2 (R) tale che f (0) = f 0 (0) = 0 e f 00 (0) > 0. Sia S(h) l’area

racchiusa dal grafico di y = f (x) e dalla retta y = h (h > 0) come indicato in Figura 1.18.

y = f(x) S(h) y=h

x Figura 1.18.

1. Curve in R3

c 978-88-08-63708-6

31

9 S(h)2 . 32 h3 1 , cio`e il raggio di curvatura in x = 0.] [Risposta: k(0) Calcolare lim

h!0

16. Sia ⇢ = f (✓) l’equazione polare di una curva piana. Dimostrare che vale la formula

seguente per la curvatura: k(✓) =

|2(⇢0 )2 + ⇢2 ⇢⇢00 | . [(⇢0 )2 + ⇢2 ]3/2

Sia r = r(t) l’equazione di una curva regolare di classe C 2 , con r0 ⇥ r00 6= 0. Fissato r(t0 ), indichiamo con ⇧(t0 ) il piano passante per r(t), r(t0 ) e contenente la retta tangente alla curva in r(t0 ). Dimostrare che lim ⇧(t) coincide con il piano osculatore, ovvero che il versore normale a 17.*

t!t0

⇧(t) tende a B(t0 ) per t ! t0 .

[Suggerimento: un vettore normale a ⇧(t) `e (r(t) r(t0 )) ⇥ r0 (t0 ); usare il teorema del valore r00 = x00 (t1 )i + y 00 (t2 )j + r00 dove e medio per scrivere r(t) r(t0 ) = (t t0 )r0 (t0 ) + 12 (t t0 )2e 00 z (t3 )k e t1 , t2 , t3 sono opportuni punti tra t e t0 .] 18.*

Dimostrare le formule (1.23) mediante i passi seguenti:

(1.24)

a) ⌧ =



dB ,N ds

b) N (t) = c)

=



B,

1 (r00 (t) k(t)v(t)2

dN ds

.

v 0 (t)T (t)).

r000 dN = 0 + w, dove w?B. ds |r ⇥ r00 |

d) Da a) e c) dedurre la prima delle (1.23). e) Dalla prima delle (1.23) ricavare la seconda ricordando che k(s) =

d2 r . ds2

19. Calcolare curvatura e torsione dell’elica ellittica di equazione

r(t) = a cos t i + b sin t j + ct k. Dimostrare che nel caso a = b (elica cilindrica) la torsione `e massima quando il passo `e lungo quanto la circonferenza di base. Sia ( , r), r : [a, b] ! R2 , una curva regolare di classe C 2 ([a, b]) con T 0 6= 0. Dimostrare che nell’intorno di un punto r(t), t 2 (a, b), coincide, nel sistema di riferimento T (t), N (t) e origine r(t), con il grafico di una funzione convessa v = f (u) tale che f (0) = f 0 (0) = 0. 20.**

[Suggerimento: nel sistema di riferimento indicato, l’asse u `e orientato come T , l’asse v come N . Se r(t) = (x(t), y(t)) usare il teorema del Dini per concludere che, in un intorno di r(t), `e il grafico di una funzione y = g(x) o x = h(y). Passando al riferimento T , N con origine r(t) tale grafico ha la forma y = f (u) con f (0) = f 0 (0) = 0. a; indi Basta ora far vedere che f 00 (0) > 0. Usare il fatto che (1, f 0 (u)) `e il vettore velocit` calcolare N (u) in u = 0.]

32

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

21. Connessione per archi. Un insieme E ✓ R3 si dice connesso per archi se, per ogni coppia

di punti x, y 2 E, esiste una curva regolare di equazione r : [0, 1] ! E tale che r(0) = x e r(1) = y. a) Dimostrare che se E `e connesso per archi allora `e connesso (Def. 2.7, pag. 130, Vol. 1).

[Suggerimento: per assurdo, siano A, B tali che A [ B = E, A \ B = A \ B = ?; considerare poi x 2 A, y 2 B e una curva di equazione r : [0, 1] ! E tale che r(0) = x, r(1) = y. Ricordare che `e connesso e definire G1 = \ A, G2 = \ B . . ..] b) Mostrare che il grafico della funzione f (x) = sin x1 per x 6= 0, f (0) = 0 non `e connesso per archi in R2 , ma `e connesso. c) Mostrare che se E `e aperto, E `e connesso se e solo se `e connesso per archi [ricordare che un aperto `e connesso se e solo se `e connesso per segmenti (Par. 3.2.5, Vol. 1)]. 22. Interpretazione cinematica delle formule di Fr´ enet

Sia r = r(s) una curva riferita al parametro naturale s. Consideriamo un corpo tridimensionale solidale con la terna intrinseca della curva T ,N ,B (si veda la Fig. 1.19).

z p

x

T

N B

g

r y x Figura 1.19.

Per la posizione p = p(s) del generico punto del corpo avremo p(s) = r(s) + ⇠(s) dove (1.25)

⇠(s) = ⇠1 T (s) + ⇠2 N (s) + ⇠3 B(s)

rappresenta il vettore posizione del punto rispetto al sistema di riferimento T , N , B con origine in r(s); si osservi che ⇠1 , ⇠2 , ⇠3 non variano con s. Per la velocit` a del punto p = p(s) abbiamo dunque p0 (s) = r0 (s) + ⇠ 0 (s); in altre parole p0 `e somma di una componente tangenziale alla curva, di modulo unitario, e della velocit` a del punto rispetto all’origine r(s) della terna intrinseca. a) Dimostrare che, posto ! = ⌧ T + kB, le formule di Fr´enet sono equivalenti alle seguenti: (1.26)

dT = ! ⇥T, ds

dN = ! ⇥ N, ds

Il vettore ! si chiama vettore di Darboux.

dB = ! ⇥ B. ds

2. Integrali curvilinei

c 978-88-08-63708-6

33

b) Dalle (1.25) e (1.26) dedurre che ⇠ 0 (s) = !(s) ⇥ ⇠(s).

(1.27)

Interpretare cinematicamente la (1.27) in termini di rotazione del corpo attorno a un asse indipendente da p. c) Dimostrare che la (1.27) determina univocamente il vettore !.

2.

INTEGRALI CURVILINEI

2.1 Integrali curvilinei rispetto alla lunghezza d’arco o di 1a specie Siano f : R3 ◆ E ! R, con E aperto connesso, una funzione scalare e curva regolare a tratti di equazione r = r(t) con t 2 [a, b]. DEFINIZIONE R 2.1 L’integrale di f rispetto alla lunghezza d’arco lungo f ds ed `e definito dalla formula seguente simbolo Z

(2.1) quando f

f ds :=

Z

b

f

⇢ E una

si indica con il

r(t)s0 (t)dt

a

r(t) · s0 (t) `e integrabile in [a, b]8 .

Pi` u esplicitamente, se r(t) = (x(t), y(t), z(t)): Z Z b p f ds = f (x(t), y(t), z(t)) x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt. a

L’integrale (2.1) viene detto anche integrale di linea di 1a specie.

p Esempio 2.1 Siano r(t) = (t2 , et cos t, et sin t), t 2 [0, 1] e f (x, y, z) = 2 x + y 2 + z 2 . Si ha: Z 1 Z p f ds = (2t + e2t ) 4t2 + 2e2t dt = 0

1 1 = [(4t2 + 2e2t )3/2 ]10 = [(4 + 2e2 )3/2 6 6

23/2 ].

Se la curva `e chiusa e lo si vuole sottolineare, si pu` o usare il simbolo

H

ds.

Per curve piane e funzioni f : R2 ◆ E ! R la definizione `e analoga. Se poi f 0, all’integrale (2.1) si pu` o dare una importante interpretazione geometrica (Fig. 1.20). Sia una curva piana, regolare a tratti, di equazione r = r(t) = (x(t), y(t)), t 2 [a, b]. La curva di equazione R(t) = (x(t), y(t), f (x(t), y(t))), t 2 [a, b] `e contenuta nel grafico di f . Al variare di t da a a b, il segmento di retta parallelo all’asse z di estremi r(t) ed R(t) descrive una superficie che chiamiamo S. Il prodotto f (r(t))ds `e interpretabile come area di un rettangolo, di base ds e altezza f (r(t)). 8 L’integrale

R

f ds si pu` o definire anche quando ` e solo rettificabile, come integrale di RiemannStieltjes, quando quest’ultimo integrale esiste (Par. 8.3.4, Vol. 1).

34

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

R ` ragionevole dunque interpretare f ds come area della superficie S. Ritorneremo E sul concetto di area di una superficie nel Capitolo 6.

R f ds dove `e la semicirconferenza di equaEsempio 2.2 Calcoliamo l’integrale zione r(t) = (cos t, sin t), t 2 [⇡, 2⇡] ed f (x, y) = y. Tale integrale rappresenta geometricamente l’area del pezzo di superficie cilindrica S, indicata in Figura 1.20. Si ha: Z 2⇡ Z f ds = sin t dt = 2. area (S) = ⇡

z=–y

z

G

S R(t)

ds

y

r(t)

Figura 1.20. Interpretazione geometrica di

x R

f ds, f (x, y) =

y (Esempio 2.2).

Le principali propriet` a dell’integrale di linea (2.1) sono contenute nella seguente proR dove non compare la posizione che giustifica, tra l’altro, l’uso della notazione parametrizzazione. PROPOSIZIONE 2.1 Siano f, g funzioni scalari definite in E ✓ R3 e regolari contenute in E; ↵, 2 R. Allora: R R R g ds a) (↵f + g)ds = ↵ f ds +

,

1, 2

curve

(linearit` a rispetto all’integranda); R R R b) 1 [ 2 f ds = 1 f ds + 2 f ds

(additivit` a rispetto al cammino di integrazione); c) Se 1 `e equivalente o opposta a 2 : Z Z f ds = f ds 1

2

(indipendenza dalla parametrizzazione della curva, in particolare dalla sua orientazione). La dimostrazione delle propriet` a a), b), c) `e lasciata per esercizio. Piuttosto osserviamo che l’integrale (2.1) `e utile nel calcolo di baricentri e momenti di inerzia (rispetto a

2. Integrali curvilinei

c 978-88-08-63708-6

35

un asse) di fili composti da materiali di cui si conosca la densit` a lineare di massa = (x, y, z). 3 R Se il filo coincide con una curva regolare a tratti di equazione r: [a, b] ! R , allora ds uguaglia la massa totale del filo che indichiamo con m. Le coordinate del baricentro sono date dalle formule seguenti Z Z Z 1 1 1 x ds, yb = y ds, zb = z ds. (2.2) xb = m m m

Il momento di inerzia del filo rispetto a un asse `e dato dalla formula seguente Z d2 ds (2.3) I=

dove d = d(x, y, z) indica la distanza del punto di coordinate (x, y, z) dall’asse. Esempio 2.3 Si dimostra in Meccanica che una fune pesante omogenea, sospesa nel vuoto per gli estremi, assume la forma della curva piana di equazione y = a Ch(x/a + b) + c

(tale curva `e perci` o detta catenaria). Supponendo che gli estremi della fune siano alla stessa quota e scelto un opportuno sistema di riferimento in modo che l’equazione della fune risulti: y = ↵ Ch(x/↵), x 2 [ r, r], si voglia calcolare il momento di inerzia di questa fune che supponiamo di densit` a costante = 1, rispetto all’asse che congiunge i due capi. Si ha: r Z r ⇣ Z ⇣ x ⌘2 r x ⌘2 2 2 d ds = ↵ 1 + Sh dx = Ch Ch I= ↵ ↵ ↵ r Z r ⇢⇣ r r ⌘2 x x ⇣ x ⌘2 2 =↵ 2 Ch Ch + Ch Ch Ch dx = ↵ ↵ ↵ ↵ ↵ r  ⇣ ⌘ r r 1 r 3 2r↵2 Ch . Sh = · · · = 2↵3 Sh + ↵ 3 ↵ ↵

y

y peso

a

x Figura 1.21. Catenarie.

–r

r

x

36

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

2.2 Forme di↵erenziali lineari. Integrali curvilinei di 2a specie Sia F(x, y, z) = F1 (x, y, z)i + F2 (x, y, z)j + F3 (x, y, z)k un campo vettoriale di classe C 1 (E), con E aperto connesso di R3 . A F associamo l’espressione formale ! = F1 dx + F2 dy + F3 dz

(2.4)

che chiameremo forma di↵erenziale lineare con coefficienti F1 , F2 , F3 . Se, intuitivamente, pensiamo al vettore dr = dxi+dyj+dzk come a un vettore “spostamento infinitesimo”, ! = hF, dri rappresenta il lavoro e↵ettuato da F in relazione a tale spostamento. Notiamo subito che l’insieme delle forme lineari costituisce uno spazio lineare su R rispetto a somma e moltiplicazione per un numero reale cos`ı definite: siano !1 = F1 dx + F2 dy + F3 dz, !2 = G1 dx + G2 dy + G3 dz forme lineari di classe C 1 (E) e c 2 R: !1 + !2 := (F1 + G1 )dx + (F2 + G2 )dy + (F3 + G3 )dz c! := cF1 dx + cF2 dy + cF3 dz. Sia ora r(t) = (x(t), y(t), z(t)), t 2 [a, b], l’equazione di una curva regolare a tratti contenuta in E. a DEFINIZIONE 2.2 R L’integrale curvilineo di ! lungo (o integrale curvilineo di 2 specie) ! ed `e definito dalla formula seguente: si indica con

(2.5)

Z

! :=

Z

a

b

{F1 (x(t), y(t), z(t))x0 (t) + F2 (x(t), y(t), z(t))y 0 (t)+

+ F3 (x(t), y(t), z(t))z 0 (t)}dt. R Con l’interpretazione precedente, ! rappresenta il lavoro che il campo F compie per spostare il suo punto di applicazione da r(a) a r(t) lungo . Altre interpretazioni sono naturalmente possibili in relazione alla natura del campo F, come vedremo tra breve. Altre forme dell’integrale a destra nella (2.5) sono ugualmente significative. Introducendo il vettore posizione r(t) = x(t)i + y(t)j + z(t)k si ha Z b Z != hF, r0 idt a

e anche, moltiplicando e dividendo per s0 (t) = |r0 (t)|: Z Z ! = hF, T ids (2.6) 0

dove T = |rr0 | . La (2.6) riduce l’integrale curvilineo di seconda specie a uno di prima specie. Si noti tuttavia che la presenza del vettore tangente T indica dipendenza dall’orientazione della curva. Raggruppiamo come al solito in una proposizione le propriet` a dell’integrale (2.5).

2. Integrali curvilinei

c 978-88-08-63708-6

PROPOSIZIONE 2.2 Siano: !1 , !2 forme lineari di classe C 1 (E), , a tratti contenute in E, ↵, 2 R. R R R !2 a) (↵!1 + !2 ) = ↵ !1 +

1, 2

37

curve regolari

(linearit` a rispetto all’integranda); R R R b) 1 [ 2 ! = 1 ! + 2 !

(additivit` a rispetto al cammino di integrazione); c) Se 1 `e equivalente a 2 Z Z != !, 1

2

mentre se l’orientazione `e opposta si ha: Z != 1

Z

!. 2

Ancora lasciamo la facile dimostrazione per H esercizio. Nel caso di curve chiuse si usa il simbolo !. Se poi la curva `e anche piana possiamo ulteriormente distinguere tra orientazione positiva (verso antiorario dell’orientazione) e negativa (verso orario) mediante i simboli

ω

e

ω

γ

γ

rispettivamente. Nel caso delle curve di Jordan regolari l’orientazione positiva si pu` o fissare rigorosamente scegliendo per ogni punto su il versore normale N i che punta verso l’interno della curva. Se T `e il versore tangente e la coppia T , N i ha la stessa orientazione di i, j allora la curva si dice orientata positivamente, negativamente in caso contrario. Se x = x(s), y = y(s) sono le equazioni di una curva orientata positivamente allora `e facile verificare che (2.7)

T =

dy dx i+ j ds ds

Ni =

dy dx i+ j. ds ds T Ni

j i Figura 1.22. Curva di Jordan orientata positivamente.

Vediamo subito alcuni esempi che mettono in luce l’importanza delle nozioni introdotte.

38

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Esempio 2.4 Sia F = F1 i + F2 j + F3 k il campo di forza gravitazionale newtoniana generato da un corpo puntiforme di massa m, che poniamo nell’origine del riferimento cartesiano, agente su un corpo puntiforme di massa unitaria, posto nel punto (x, y, z). Se G indica la costante di gravitazione universale si ha: F1 (x, y, z) = dove r =

Gm x , r2 r

p x2 + y 2 + z 2 .

F2 (x, y, z) =

Gm y , r2 r

F3 (x, y, z) =

Gm z r2 r

Siano p1 , p2 due punti in R3 e una curva regolare a tratti, di equazione r : [a, b] ! R3 , che li congiunga, e cio`e r(a) = p1 , r(b) = p2 . L’integrale curvilineo Z xdx + ydy + zdz (2.8) L = Gm r3 rappresenta il lavoro che il campo di forze compie per spostare la particella di massa unitaria da p1 a p2 lungo . Osserviamo che 1 (xdx + ydy + zdz); dr = p x2 + y 2 + z 2 quindi, essendo xdx + ydy + zdz = rdr, abbiamo Z Z ✓ ◆ 1 dr L = Gm = Gm d = r2 r ✓ ◆ Z b 1 1 d 1 p dt = Gm . = Gm r2 r1 x(t)2 + y(t)2 + z(t)2 a dt

dove r1 ed r2 sono le distanze di p1 e p2 dall’origine, rispettivamente. Osserviamo che, scegliendo un’altra traiettoria congiungente p1 e p2 , il risultato non cambia.

Esempio 2.5 Il moto piano stazionario di un fluido incompressibile a densit` a costante = 1 (per esempio, l’acqua) `e caratterizzato da un campo di velocit` a u(x, y) = u1 (x, y)i + u2 (x, y)j; u(x, y) assegna la velocit` a della particella di fluido che si trova nel punto di coordinate (x, y). Sia (il sostegno di) una curva chiusa, semplice, regolare a tratti, orientata positivamente, cio`e in senso antiorario. Indichiamo con R la regione di piano che ha come frontiera . L’integrale curvilineo I u2 dx + u1 dy (2.9) rappresenta la di↵erenza tra la quantit` a di fluido uscita ed entrata in R nell’unit` a di tempo. Infatti tale di↵erenza `e il flusso di fluido attraverso la frontiera di R, dato

2. Integrali curvilinei

c 978-88-08-63708-6

39

y

R

T Ne

g x Figura 1.23. Versore tangente T =

dx i ds

dy j ds

+

dalla formula

I

e versore normale esterno N e =

dy i ds

dx j. ds

hu, N e ids

dove N e `e il versore normale esterno, diretto cio`e verso l’esterno della regione R. Infatti, se dy dx i+ j, T = ds ds ricordando la (2.7), si ha dy dx i j Ne = ds ds e perci` o ◆ I I ✓ dx dy hu, N e ids = u1 u2 ds ds ds che coincide con l’integrale (2.9). Si noti infine che l’integrale (2.9) `e nullo allorch´e in R non si trovino sorgenti o pozzi di fluido. Esempio 2.6 Teorema dell’energia cinetica. Sia F un campo di forze definito in un aperto E ✓ R3 . Sotto l’azione di F, una particella di massa m compie un cammino , regolare e di classe C 2 , di equazione vettoriale r = r(t), t 2 [a, b]. Sia L il lavoro compiuto da F per trasportare la particella da r(a) a r(b). o: Dalla seconda legge della dinamica si ha F = mr00 e perci` L=

Z

Z

hF, dri = b

Z

a

b

hmr00 (t), r0 (t)idt =

1 d 0 1 hr (t), r0 (t)idt = m 2 dt 2 a 1 1 = mv(b)2 mv(a)2 . 2 2

=

m

Z

a

b

d v(t)2 dt = dt

40

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Essendo 12 mv(t)2 l’energia cinetica della particella, si vede come L sia uguale alla variazione di energia cinetica dal punto iniziale a quello finale. Un’analisi degli Esempi 2.4 e 2.5 porta in modo naturale ad alcune questioni. R ! Prima questione: Data ! = F1 dx + F2 dy + F3 dz, sotto quali condizioni dipende solo dai punti iniziale e finale di e non dalla traiettoria seguita? Il campo gravitazionale ha questa propriet` a, come abbiamo visto nell’Esempio 2.4. H Seconda questione: sotto quali condizioni ! = 0?

Abbiamo visto che questo `e vero, nel caso dell’Esempio 2.5, quando all’interno di sono assenti sorgenti e pozzi di fluido. Ritornando all’Esempio 2.4, si verifica facilmente che la forma p di↵erenziale nell’integrale (2.8) `e il di↵erenziale della funzione U (x, y, z) = Gm/ x2 + y 2 + z 2 , che prende il nome di potenziale gravitazionale. Quando ci` o accade la forma di↵erenziale si dice esatta. Pi` u precisamente diamo la seguente definizione. DEFINIZIONE 2.3 Se, data una forma di↵erenziale ! di classe C 1 (E), esiste una funzione U : E ! R, di classe C 2 (E), tale che dU = ! in E, allora ! si dice esatta e U si chiama funzione potenziale. Pi` u esplicitamente, dU = ! significa che @U = F1 , @x

(2.10)

@U = F2 , @y

@U = F3 @z

in E

o, pi` u sinteticamente, rU = F in E. Se U `e una funzione potenziale per ! in E lo `e anche U + c, c 2 R. Essendo E connesso, tutte le possibili funzioni potenziale per ! hanno questa forma (Esercizio 11). Per le forme di↵erenziali esatte l’integrale curvilineo `e indipendente dal cammino di integrazione. Pi` u precisamente, vale il seguente LEMMA 2.3 Sia ! esatta in E con funzione potenziale U . Sia contenuta in E, di equazione r = r(t), t 2 [a, b]. Allora Z ! = U (r(b)) U (r(a)). (2.11)

una curva regolare,

Dimostrazione. Usando il teorema di di↵erenziazione delle funzioni composte si ha, se r(t) = (x(t), y(t), z(t)): d @U @U @U U (x(t), y(t), z(t)) = (. . .)x0 (t) + (. . .)y 0 (t) + (. . .)z 0 (t) = dt @x @y @z = (per la 2.10) = F1 (. . .)x0 (t) + F2 (. . .)y 0 (t) + F3 (. . .)z 0 (t). Di conseguenza, per il teorema fondamentale del calcolo integrale: Z b Z d U (x(t), y(t), z(t))dt = U (x(b), y(b), z(b)) U (x(a), y(a), z(a)) != dt a che `e la (2.11).



2. Integrali curvilinei

c 978-88-08-63708-6

41

OSSERVAZIONE 2.1 La (2.11) si estende anche alle traiettorie regolari a tratti, utilizzando la propriet` a di additivit` a rispetto al cammino di integrazione. Se ! `e esatta il campo associato `e uguale, per la (2.10), al gradiente di un potenziale. In tal caso il campo vettoriale si dice conservativo. La scelta del nome `e dovuta al seguente motivo. Se p e p0 sono punti qualunque di E e `e una curva regolare a tratti di equazione r = r(t), t 2 [a, b], tale che r(b) = p e r(a) = p0 , sulla quale si muove una particella di massa m sotto l’azione del campo, dall’Esempio 2.6 (teorema dell’energia cinetica) e dalla (2.11) si ottiene 1 mv(b)2 2

1 mv(a)2 = U (p) 2

U (p0 )

1 mv(b)2 2

U (p) =

1 mv(a)2 2

U (p0 ).

ovvero (2.12)

La quantit` a U (p) si chiama energia potenziale in p; la (2.12) indica che la somma delle energie cinetica e potenziale `e costante in E (legge di conservazione dell’energia meccanica). La terza questione che poniamo `e la seguente: data una forma di↵erenziale !, quali condizioni su F implicano che ! sia esatta? Le tre questioni sono strettamente collegate tra loro come mostra il seguente teorema. TEOREMA 2.4 Sia ! = F1 dx + F2 dy + F3 dz una forma di↵erenziale lineare di classe C 1 (E), E aperto connesso di R3 . Le seguenti tre a↵ermazioni sono equivalenti: a) per ogni coppia di curve regolari a tratti 1 , 2 contenute in E e aventi stesso punto iniziale e stesso punto finale, Z Z != !; 1

b) per ogni curva chiusa

2

regolare a tratti contenuta in E, I ! = 0;

c) ! `e esatta in E. Dimostrazione. L’implicazione c) ) b) `e contenuta nel Lemma 2.3 e nella Osservazione 2.1. Facciamo vedere che a) ) c) e b) ) a). Ra) ) c). Siano p0 = (x0 , y0 , z0 ) e p = (x, y, z) punti di E. Se pensiamo p0 fissato, l’integrale !, dove `e una curva avente p0 come punto iniziale e p come punto finale, non dipende da , a causa di a), ma solo da p. Possiamo perci` o scrivere Z ! = '(x, y, z). Dimostriamo che @'/@x = F1 in E; analogamente si dimostra che @'/@y = F2 e che @'/@z = F3 da cui si conclude che ' `e una funzione potenziale per !, ovvero che ! `e esatta.

42

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Passiamo dal punto (x, y, z) al punto (x + x, y, z). Usando la propriet` a di additivit` a degli integrali curvilinei e usando ancora il fatto che l’integrale curvilineo di ! dipende solo dai punti iniziale e finale e non dal tipo di percorso che li congiunge, si pu` o scrivere: Z ! '(x + x, y, z) = '(x, y, z) + dove `e una qualunque curva regolare con punto iniziale (x, y, z) e punto finale (x+ x, y, z), con sostegno contenuto in E. Essendo E aperto, se x `e abbastanza piccolo, si pu` o scegliere come il segmento di retta di equazioni parametriche: x(t) = x + t x,

y(t) = y,

z(t) = z

t 2 [0, 1],

(Fig. 1.24). Con questa scelta si ha, essendo y 0 (t) = z 0 (t) = 0, x0 (t) = x: Z Z 1 != F1 (x + t x, y, z) x dt. 0

Quindi

Z 1 x, y, z) '(x, y, z) = F1 (x + t x, y, z) dt. x 0 Essendo F1 continua, passando al limite sotto il segno di integrale per x ! 0 si ottiene @'/@x = F1 . '(x +

b) ) a). Siano 1 di equazione r1 = r1 (t), r1 : [a, b] ! R3 e 2 di equazione r2 = r2 (t), r2 : [↵, ] ! R3 , due curve regolari Ra tratti Rcontenute in E, tali che r1 (a) = r2 (↵) e r1 (b) = r2 ( ). Dobbiamo mostrare che 1 ! = 2 !. Mediante 1 e 2 costruiamo una curva chiusa nel seguente modo, “riparametrizzando” 2 . Definiamo (Esempio 1.14): t(⌧ ) =

c

c ↵ ⌧+ b c

b↵ , b

⌧ 2 [b, c].

0 Si osservi che t(b) = e t(c) r2 (⌧ ) = R = ↵ e Rche t (⌧ ) < 0. Sia e2 la curva di equazione e 3 !. r2 (t(⌧ )) : [b, c] ! R ; allora 2 ! = e2

z

G

(x, y, z)

(x+Dx, y, z)

y x Figura 1.24.

(x0, y0, z0)

2. Integrali curvilinei

c 978-88-08-63708-6

Inoltre la curva

=

1

43

[ e2 risulta chiusa e regolare a tratti, dunque Z Z Z Z I != !+ != ! !. 0= 1

e2

1



2

OSSERVAZIONE 2.2 Il Teorema 2.4 continua a valere se ci si limita a curve regolari, anzich´e regolari a tratti. Questa a↵ermazione pu` o essere dimostrata facilmente con l’uso dei teoremi del Capitolo 6, Sezione 3. 2.3

Riconoscimento delle forme di↵erenziali esatte. Costruzione della funzione potenziale Sia data la forma di↵erenziale ! = F1 dx + F2 dy + F3 dz con coefficienti di classe C 1 (E), dove E `e un aperto connesso di R3 . ` molto semplice trovare condizioni necessarie per l’esattezza di ! in E. Infatti, se E ! `e esatta e U `e funzione potenziale, si ha rU = F. Ora, dalla a) del Lemma 1.5 si ha rot rU = 0, perci` o ricaviamo immediatamente che deve essere rot F = 0. Dunque: PROPOSIZIONE 2.5 Se ! `e esatta in E ed F `e il campo vettoriale associato, allora rot F = 0 in E, ovvero F `e irrotazionale in E. Pi` u esplicitamente devono essere verificate in ogni punto di E le seguenti relazioni: (2.13)

@F3 @F2 = , @y @z

@F1 @F3 = , @z @x

@F2 @F1 = . @x @y

Per una forma di↵erenziale in R2 , ! = F1 (x, y)dx + F2 (x, y)dy, le (2.13) si riducono alla seguente: @F2 @F1 = . @x @y

(2.14)

o Esempio 2.7 La forma di↵erenziale ! = xydx + (z 2 + 1)dy (xz + y)dz non pu` essere esatta in R3 essendo @F1 /@y = x e @F2 /@x = 0, diverse fuori dal piano x = 0. Il prossimo esempio indica che la condizione di irrotazionalit` a di F `e solo necessaria e non sufficiente, in generale, per l’esattezza di una forma di↵erenziale. Esempio 2.8 Sia !=

x y dx + 2 dy; x2 + y 2 x + y2

! `e di classe C 1 nell’aperto connesso R2 \{0}; si ha: y 2 x2 @F1 x2 + y 2 2y 2 = 2 = 2 2 2 @y (x + y ) (x + y 2 )2 y 2 x2 @F2 x2 + y 2 2x2 = 2 = 2 2 2 @x (x + y ) (x + y 2 )2 e quindi la (2.14) `e verificata in tutto R2 \{0}.

44

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

Tuttavia ! non `e esatta; per vederlo `e sufficiente, in base al R Teorema 2.4, esibire ! 6= 0. Scegliamo la una curva regolare chiusa contenuta in R2 \{0}, tale che circonferenza di equazione r(t) = (cos t, sin t), t 2 [0, 2⇡]. Allora Z Z 2⇡

!=

[(sin t)2 + (cos t)2 ]dt = 2⇡.

0

Vi sono opportune condizioni topologiche su E sotto le quali le (2.13) diventano anche sufficienti. Ritorneremo pi` u avanti su di esse. Per ora ci limitiamo a indicare la seguente, di natura algebrica oltre che topologica. DEFINIZIONE 2.4 Si dice che E ✓ R3 (oppure E ✓ R2 ) `e stellato se esiste un punto p0 2 E tale che, per ogni punto p 2 E, il segmento di retta [p0 , p] `e tutto contenuto in E. y

y

p

p0

x

a)

x

b)

Figura 1.25. a) Insieme stellato nel piano. b) Insiemi non stellati.

Diremo anche che E `e stellato rispetto al punto p0 . Ogni insieme convesso `e stellato: come p0 si pu` o scegliere uno qualsiasi dei suoi punti. Il piano (o lo spazio) privato di un punto non `e stellato. Inoltre un insieme stellato `e ovviamente connesso per segmenti e perci` o connesso. Il teorema seguente implica che se rot F = 0 in un aperto qualunque, allora ! `e localmente esatta, ovvero esatta in un intorno di ogni suo punto. TEOREMA 2.6 Siano ! = F1 dx + F2 dy + F3 dz, F = F1 i + F2 j + F3 k con F 2 C 1 (E), dove E `e un aperto stellato in R3 . Allora ! `e esatta se e solo se rot F = 0 in E. Dimostrazione. Dobbiamo mostrare la sufficienza della condizione rot F = 0 poich´e la sua necessit` a `e contenuta nella Proposizione 2.5. Sia dunque rot F = 0. Per ipotesi, E `e stellato e, a meno di una traslazione degli assi, possiamo supporre che sia stellato rispetto all’origine

2. Integrali curvilinei

c 978-88-08-63708-6

45

0 = (0, 0, 0). Dato un punto p = (x, y, z) 2 E, indichiamo con la curva di equazioni parametriche x(t) = tx, y(t) = ty, z(t) = tz t 2 [0, 1] il cui sostegno `e il segmento di retta [0, p], che risulta pertanto contenuto in E. Poniamo: Z 1 Z != {F1 (tx, ty, tz)x + F2 (tx, ty, tz)y + F3 (tx, ty, tz)z} dt. (2.15) U (x, y, z) := 0

Facciamo vedere che U `e una funzione potenziale, cio`e che @U = F2 , @y

@U = F1 , @x

@U = F3 . @z

Le tre formule si dimostrano in maniera identica; diamo perci` o i dettagli solo della prima. Poich´e F `e di classe C 1 , vale il teorema di derivazione sotto il segno di integrale e quindi: Z 1⇢ @U @F1 @F3 @F2 = (. . .)tx + F1 (. . .) + (. . .)ty + (. . .)tz dt. @x @x @x @x 0 Dalle (2.13) abbiamo @F2 @F1 = @x @y

e

@F3 @F1 = @x @z

in

E

e perci` o: @U = @x

Z

1

F1 (. . .)dt + 0

Z

1 0



@F1 @F1 @F1 (. . .)tx + (. . .)ty + (. . .)tz dt. @x @y @z

d L’espressione tra parentesi nel secondo integrale non `e altro che t dt F1 (tx, ty, tz); dunque: Z 1 Z 1 d @U = F1 (tx, ty, tz)dt + t F1 (tx, ty, tz)dt = (integrando per parti) @x dt 0 0 Z 1 Z 1 = F1 (tx, ty, tz)dt + [tF1 (tx, ty, tz)]10 F1 (tx, ty, tz)dt = 0

0

= F1 (x, y, z).



La dimostrazione del Teorema 2.6 indica (si veda la Formula 2.15) come costruire una funzione potenziale quando E `e stellato. Naturalmente, una volta accertatisi che ! `e esatta, controllando che rot F = 0, e che quindi l’integrale di linea di ! `e indipendente dalla traiettoria, si pu` o costruire U come integrale di ! lungo una qualunque curva regolare a tratti con sostegno in E. Per esempio, nel piano, si pu` o procedere fissando un punto qualunque (x0 , y0 ) 2 E e costruire U nel punto (x, y) 2 E mediante l’integrale lungo le spezzate indicate in figura (se contenute in E). Se `e possibile scegliere la spezzata in Figura 1.26a, una formula esplicita per U `e la seguente, Z y Z x F1 (t, y0 )dt + F2 (x, t)dt (2.16) U (x, y) = x0

y0

essendo nel tratto orizzontale dy = 0 e in quello verticale dx = 0. Invitiamo il lettore a trovare una formula analoga alla (2.16) scegliendo la spezzata di Figura 1.26b.

46

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

y

y

y0

y0 x0

x

x0

a)

x

b)

Figura 1.26. Cammini di integrazione diversi per la costruzione della funzione potenziale U .

In R3 , potendo scegliere la spezzata indicata in Figura 1.27 si troverebbe Z x Z y Z z (2.17) U (x, y, z) = F1 (t, y, z0 )dt + F2 (x0 , t, z0 )dt + F3 (x, y, t)dt. x0

y0

z0

z

z0

y0

y

x

x0 Figura 1.27. Cammino di integrazione nella formula (2.17).

Esempi 2.9 La forma di↵erenziale dell’Esempio 2.8 `e esatta, per esempio, nel piano privato del quadrante x > 0, y < 0. Tale insieme `e infatti stellato. Per trovare una funzione potenziale, scegliamo (x0 , y0 ) = (1, 0) e usiamo una spezzata come quella di Figura 1.26b). Si ottiene,  ✓ ◆ x Z y Z x t 1 y dt = arctg y arctg = U (x, y) = dt 2+1 2 + y2 t t y 0 1 1 ✓ ◆ ✓ ◆ x 1 = arctg y arctg + arctg . y y

2. Integrali curvilinei

c 978-88-08-63708-6

47

Osserviamo ora che

Dunque:

8⇡ ✓ ◆ > arctg z < 1 2 arctg = > z : ⇡ arctg z 2 ⇣y⌘ 8 > arctg > > x < ⇡ U (x, y) = 2 > ⇣ ⌘ > > :arctg y + ⇡ x

se z > 0 se z < 0.

se x > 0, y

0

se x = 0, y > 0 se x < 0, y > 0.

Si noti che U si raccorda bene sul semiasse positivo delle y. Ponendo ulteriormente U (0, y) = 3⇡/2 per y < 0 e U (x, y) = arctg(y/x) + 2⇡ per x > 0, y < 0 avremmo un buon raccordo sul semiasse negativo delle y ma non sul semiasse positivo delle ascisse; infatti U (x, 0) = 0 mentre h ⇣y⌘ i + 2⇡ = 2⇡. lim U (x, y) = lim arctg y!0 y!0 x x>0

x>0

Ci` o non deve stupire in quanto la U (x, y) cos`ı definita coincide con l’anomalia ✓ di un punto (x, y) del piano: partendo da un punto sul semiasse positivo delle ascisse, l’anomalia ✓ cresce fino a diventare 2⇡ dopo un giro attorno all’origine. 2.10 La forma di↵erenziale !=

y

1 2x dx + dy + dz x2 y x2

`e di classe C 1 in R3 con esclusione della superficie di equazione y = x2 . Si ha: @F1 2x , = @y (y x2 )2

@F1 =0 @z

2x @F2 , = @x (y x2 )2

@F2 =0 @z

@F3 @F3 =0= . @x @y Pertanto rot F = 0 ed ! `e localmente esatta. In base al Teorema 2.6 `e esatta in tutto l’insieme {(x, y, z) 2 R3 , y > x2 } che `e stelo usare la formula (2.17) con (x0 , y0 , z0 ) = lato9 . Una funzione potenziale `e (qui si pu`

9 I risultati contenuti nel Paragrafo 2.4 indicano che ! ` e esatta anche nell’insieme {(x, y, z) 2 R3 , y < x2 }.

48

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

(0, 1, 0)): U (x, y, z) =

Z

0

x

2t dt + y t2

= [log |y

Z

1

y

1 dt + t

Z

z

dt =

0

t2 |]x0 + [log |t|]y1 + z = log(y

x2 ) + z.

2.11 Ritorniamo alla forma di↵erenziale (2.18)

!=

u2 (x, y)dx + u1 (x, y)dy

a per il moto dell’Esempio 2.5 dove u(x, y) = u1 (x, y)i + u2 (x, y)j `e il campo di velocit` stazionario di un fluido. Se la forma (2.18) `e esatta, allora @u1 @u2 = @y @x

(2.19) ovvero

@u1 @u2 + = div u = 0. @x @y

La condizione div u = 0 significa che il fluido `e incomprimibile. La funzione potenziale = (x, y) tale che d = ! si chiama pi` u propriamente funzione di corrente. Le sue linee di livello, di equazione (x, y) = c, si chiamano linee di flusso o di corrente: in ogni punto, u `e tangente alla linea di corrente passante per quel punto; infatti il vettore r = u2 i + u1 j `e ortogonale sia a (x, y) = c sia a u = u1 i + u2 j. Accanto alla forma di↵erenziale (2.18) si pu` o altres`ı considerare la forma ⌫ = u1 dx + u2 dy H

il cui integrale ⌫ rappresenta la circuitazione di u lungo . Se anche ⌫ `e esatta si ha rot u = 0, cio`e:

(2.20)

@u2 @u1 = . @y @x

Le (2.19) e (2.20) sono le condizioni di Cauchy-Riemann (Par. 7.2.3, Vol. 1) per la o significa che u1 e u2 sono armoniche coniugate e che coppia di funzioni u1 e u2 . Ci` la funzione u1 (x, y) + iu2 (x, y) `e olomorfa. La funzione potenziale di ⌫, ' = '(x, y) si chiama potenziale di velocit` a e risulta una funzione armonica. Le sue linee di livello, dette linee equipotenziali, sono ortogonali alle linee di flusso in ogni punto di intersezione. La doppia famiglia di curve (x, y) = c e '(x, y) = k costituisce pertanto una rete ortogonale nel piano (Fig. 1.28). Osserviamo inoltre che, dalla (2.20) si ottiene, essendo @ /@x = u2 , @ /@y = u1 : = div r =

@u2 @u1 + = 0. @x @y

2. Integrali curvilinei

c 978-88-08-63708-6

49

Figura 1.28. Linee di flusso e di corrente per il potenziale complesso f (z) = z 2 .

Perci` o anche `e armonica. Invitiamo il lettore a verificare che la funzione f (z) = f (x + iy) = '(x, y) + i (x, y) (detta potenziale complesso) `e olomorfa se valgono le (2.19) e (2.20). Dunque, anche ' e sono armoniche coniugate. ` poi facile mostrare che ogni potenziale complesso f = ' + i , olomorfo in un E aperto ⌦ del piano complesso, definisce univocamente un moto piano stazionario di un fluido incomprimibile e irrotazionale nella regione ⌦ in cui ' e sono rispettivamente potenziale di velocit` a e funzione di corrente. In Figura 1.28 `e illustrata la rete ortogonale delle linee equipotenziali e di flusso corrispondenti al potenziale f (z) = z 2 = (x2 y 2 ) + i2xy. Concludiamo il paragrafo ricordando che in termodinamica il primo e il secondo principio si possono formulare in termini di forme di↵erenziali. Infatti il primo principio a↵erma che esiste una funzione U detta energia interna tale che dU = dQ pdV dove Q, p, V indicano rispettivamente quantit` a di calore, pressione e volume. Dunque la forma ! = dQ pdV `e esatta. Il secondo principio a↵erma che esiste una funzione S, detta entropia tale che dS =

dQ T

(T temperatura assoluta).

Dunque l’espressione (1/T )dQ `e un di↵erenziale esatto. Il fattore 1/T che rende esatta l’espressione si chiama fattore integrante. Gli Esercizi 13, 14, 15, 18 sono dedicati ad alcune questioni riguardanti i fattori integranti. 2.4

Insiemi semplicemente connessi

Abbiamo visto che in un dominio E stellato le (2.13) sono necessarie e sufficienti per l’esattezza di una forma di↵erenziale. Una condizione pi` u generale di natura topologica `e quella di semplice connessione. Dire che E ✓ R2 `e semplicemente connesso significa che E `e connesso e che ogni curva semplice e chiusa contenuta in E `e frontiera di un insieme limitato interamente contenuto in E. In generale significa che due

50

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

curve qualunque, contenute in E, aventi gli stessi punti estremi sono “deformabili con continuit` a” l’una nell’altra senza uscire da E. Il concetto rigoroso `e quello di omotopia tra curve che illustriamo qui di seguito.

E g1

g2

Figura 1.29. Curve omotope.

Siano 1 e 2 curve contenute in un aperto connesso E ✓ R2 o E ✓ R3 di equazione rispettivamente r1 = r1 (t), r2 = r2 (t), t 2 [a, b] e tali che r1 (a) = r2 (a) = pa , r1 (b) = r2 (b) = pb . DEFINIZIONE 2.5 Le due curve 1 e 2 si dicono omotope in E se esiste una funzione continua ' = '(t, ), (t, ) 2 [a, b] ⇥ [0, 1] tale che i) ii)

'(t, 1) = r2 (t) ' (b, ) = pb

'(t, 0) = r1 (t), ' (a, ) = pa ,

8 t 2 [a, b] 8 2 [0, 1].

di equazione ' = ' (t, ) sia contenuta e infine che per ogni 2 [0, 1], la curva in E. Se 1 e 2 sono chiuse la ii) `e sostituita dalla condizione ii) ' (a, ) = ' (b, )

8

2 [0, 1].

DEFINIZIONE 2.6 Un aperto connesso E ✓ R2 o E ✓ R3 si dice semplicemente connesso se due curve qualsiasi contenute in E aventi gli stessi estremi sono omotope. La definizione si pu` o dare in termini di curve chiuse: un aperto connesso E `e semplicemente connesso se ogni curva chiusa contenuta in E `e omotopa a una curva costante (cio`e, che si riduce a un solo punto). Esempi 2.12 Sono semplicemente connessi i seguenti sottoinsiemi di R2 o R3 . I convessi. Infatti se 1 e 2 sono due curve in E, convesso, aventi gli stessi estremi, di equazione rispettivamente r1 = r1 (t) e r2 = r2 (t), t 2 [a, b], la famiglia di curve ' (t, ) = r1 (t) + (1 soddisfa la Definizione 2.5.

)r2 (t),

2. Integrali curvilinei

c 978-88-08-63708-6

51

Gli insiemi stellati: sia infatti p0 2 E tale che per ogni p 2 E, il segmento di retta [p0 , p] `e tutto contenuto in E. Se r = r(t) `e una curva chiusa ⇢ E, posto ' (t, ) = p0 + (1

)r(t)

si vede che ' (t, ) ⇢ E per ogni (t, ) 2 [a, b] ⇥ [0, 1], che ' (t, 0) = r(t), ' (t, 1) = p0 e che ' (a, ) = p0 + (1 )r(a) = p0 + (1 )r(b) = ' (b, ). Dunque r `e omotopa alla curva costante r0 (t) = p0 . 2.13 Non sono semplicemente connessi in R2 una corona circolare oppure il piano privato di un punto10 . In R3 non lo sono una sfera privata di un diametro oppure l’interno di un toro. Il lettore cerchi di convincersi di queste a↵ermazioni.

a)

b)

Figura 1.30. a) Insieme non semplicemente connesso in R2 . b) Insieme non semplicemente connesso in R3 . Nella figura ` e evidenziato un ciclo non contraibile a un punto.

Il teorema seguente implica che se rot F = 0 in un aperto semplicemente connesso E, allora ! `e esatta in E. TEOREMA 2.7 Siano ! = F1 dx + F2 dy + F3 dz, F = F1 i + F2 j + F3 k con F 2 C 1 (E), dove E `e un aperto semplicemente connesso in R3 . Allora ! `e esatta in E se e solo se rot F = 0 in E. Dimostrazione. Dobbiamo mostrare la sufficienza della condizione rot F = 0 poich´e la sua necessit` a `e contenuta nella Proposizione 2.5. Sia dunque rot F = 0 in E. In base al Teorema 2.4 e all’Osservazione che lo segue, occorre mostrare che R R date due curve regolari 1 e 2 aventi estremi in comune e contenute in E, si ha 1 ! = 2 !. Essendo E semplicemente connesso, esister` a una famiglia di curve di equazione ' (t, ) = (x(t, ), y(t, ), z(t, )), (t, ) 2 [a, b] ⇥ [0, 1] soddisfacente la Definizione 2.5. Conduciamo la derivate dimostrazione nell’ipotesi ulteriore che ' sia di classe C 1 ([a, b] ⇥ [0, 1]) e che abbia R R !. Osserviamo che I(0) = 1 !, I(1) = seconde miste continue. Poniamo allora I( ) = 10 Ma

una corona sferica ` e semplicemente connessa in R3 !

52

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

R

!. Facciamo vedere che dI/d = 0 per ogni 2 particolare I(0) = I(1) che `e la tesi. Derivando sotto il segno di integrale abbiamo: dI = d =

Z

Z

b a

2 [0, 1]; ci` o implica I( ) = costante e in

d {F1 xt + F2 yt + F3 zt }dt = d

b a

{F1x x xt + F1y y xt + F1z z xt + F1 x t +

+ F2x x yt + F2y y yt + F2z z yt + F2 y t + + F3x x zt + F3y y zt + F3z z zt + F3 z t }dt. Usando le (2.13), F3y = F2z , F1z = F3x , F2x = F1y , si verifica facilmente che dI = d

Z

b a

d {F1 x + F2 y + F3 z }dt = F1 x + F2 y + F3 z dt

t=b

=0 t=a

poich´e, per le ii) della Definizione 2.5 si ha ' (a, ) = costante e ' (b, ) = costante. Le ipotesi ulteriori poste su ' possono essere rimosse approssimando opportunamente le . Omettiamo i dettagli. ⇤

Esercizi 1. Calcolare l’area della superficie cilindrica S parallela all’asse z, che interseca il piano

z = 0 lungo l’arco di parabola r(t) = (t, t2 ), t 2 [0, 1], compresa tra il piano z = 0 e il grafico della funzione z = 1+x21+y2 . 2. L’elica di equazione r(t) = (h cos t, h sin t, t), t 2 [0, 4⇡] ha densit` a lineare di massa d =

costante. Calcolare il momento di inerzia dell’elica rispetto all’asse z.

3. Calcolare il baricentro di un filo omogeneo a forma di cicloide di equazione

x(t) = r(t

sin t), y(t) = r(1

4. Dimostrare che se f : R3 ! R ` e limitata e

Z

5. Calcolare l’integrale curvilineo

a) ! = b) ! =

R

6. Verificare la formula (2.7).

`e rettificabile e regolare a tratti, allora

f ds  sup |f | · l( ). ! dove

1 y x 1 dx + dy, 2⇡ x2 + y 2 2⇡ x2 + y 2 p zdx + xdy + ydz,

cos t), t 2 [0, 2⇡].

r(t) = (t

e ! sono definite come segue:

r(t) = (cos t, sin t), t 2 [0, 2⇡] dove h 2 N+ ; sin t, 1

cos t, t2 ), t 2 [0, ⇡/2].

2. Integrali curvilinei

c 978-88-08-63708-6

53

7. Determinare f : R+ ! R tale che la forma di↵erenziale

!=

p

x

x2 +y 2

p y f ( x2 +y 2 )dx + p dy x2 + y 2

sia localmente esatta in R2 \{0}. Calcolare un potenziale locale. [Risposta: f (t) = t

1.]

8.*

Sia { k } (k > 0, k 6= 1) la famiglia di circonferenze di equazione (x Calcolare al variare del parametro k l’integrale I x y x+y ! dove ! = 2 dx + 2 dy. 2 x y x + y2 k

1)2 + y 2 = k2 .

9. Determinare f : R3 ! R in modo che

! = f (x, y, z)dx + zdy + ydz sia esatta in R3 . Calcolare una funzione potenziale. 10. Quale/i dei seguenti insiemi ` e stellato in R2 o R3 ?

E = {(x, y) 2 R2 : y > x3 }

E = {(x, y) 2 R2 : |y| < 1 3

2

3|x|} 2

E = {(x, y, z) 2 R : x + y + z 2 < 1 e z 2

x2 + y 2 }.

11. Dimostrare che se E ` e aperto connesso in R3 e ! `e esatta in E, due funzioni potenziali

per ! di↵eriscono di una costante. 12. Sia R! = xydx+ydy; verificare che se ` e una qualunque circonferenza con centro sull’asse ! = 0. Si pu` o concludere che ! `e esatta in R2 ? y si ha

13. Se la forma di↵erenziale ! = P dx + Qdy non ` e esatta si pu` o pensare di determinare

µ = µ(x, y) tale che µ! = µP dx + µQdy sia esatta. Una funzione di questo tipo si chiama fattore integrante. a) Dimostrare che se µ `e un fattore integrante deve soddisfare la seguente equazione ✓ ◆ @Q dµ @P dµ Q =µ P ; dy dx @x @y ⇣ @P @Q ⌘ 1 `e una funzione h(x) della sola x, esiste un fattore integrante b) Dedurre che, se @y @x Q R µ(x) = exp h(x)dx. ⇣ @P @Q ⌘ 1 `e una funzione g(y) della sola y, esiste un fattore integrante Viceversa, se @y @x P R µ(y) = exp g(y)dy. 14. Determinare un fattore integrante per le seguenti forme di↵erenziali:

a) ! = xy 2 dx + 2x2 ydy; 2x2 xy dx + dy. b) ! = 2 4 1+x y 1 + x2 y 4

54

CAPITOLO 1. Curve e integrali curvilinei

c 978-88-08-63708-6

15. Dimostrare che, se esiste un fattore µ = µ(x, y, z) integrante per la forma di↵erenziale

! = F1 dx + F2 dy + F3 dz allora, se F = (F1 , F2 , F3 ), si ha hrot F, Fi = 0. [Suggerimento: usare la f) del Lemma 1.5.]

16. Sia F il campo p di forze centrali dato dalla formula F(x, y, z) = xg(r)i + yg(r)j + zg(r)k dove r(x, y, z) = x2 + y 2 + z 2 , e g : R+ ! R `e una funzione di classe C 1 . Dimostrare che rot F = 0 in R3 \{0} e che quindi la forma ! = g(r)(xdx + ydy + zdz) `e esatta localmente. 17. Determinare se le forme di↵erenziali seguenti sono esatte nel dominio indicato a lato

x2 dy ! = xydx + 2◆ ✓ 1 1 != + 2 (ydx x2 y

E = R2 xdy)

E = {(x, y) 2 R2 : xy 6= 0}.

18. Sia ! = f (x)ydx + dy ed E = (a, b) ⇥ R con f continua in E. Dimostrare che se F ` e una

primitiva di f in (a, b) e g = exp(F ), allora g `e un fattore integrante per !.

19. Sia f (z) = f (x + iy) = '(x, y) + i (x, y), z 2 C oppure (x, y) 2 R2 , il potenziale complesso per un fluido in moto piano stazionario. Verificare che, se valgono le (2.19) e (2.20), f `e olomorfa in C. 20. Studiare linee di flusso ed equipotenziali per il moto di un fluido corrispondente ai due

potenziali complessi indicati: 1 z 1 b) f (z) = 2 z a) f (z) =

(doppia famiglia di cerchi) (doppia famiglia di lemniscate).

CAPITOLO 2

Ottimizzazione delle funzioni di pi`u variabili

` superfluo so↵ermarsi sull’importanza che la teoria dell’ottimizzazione ha acquisito E nelle scienze applicate. Il termine ottimizzazione si riferisce a un’ampia categoria di problemi. In economia `e, per esempio, legato ai meccanismi decisionali finalizzati a ottenere il massimo (di utilit` a o di profitto) da una data quantit` a di beni o risorse; in meccanica, minimizzare l’energia potenziale di un sistema conservativo conduce a individuarne le posizioni di equilibrio stabile. In generale si tratta di massimizzare o minimizzare un obiettivo la cui modellizzazione matematica dipende dalla natura del problema. In questo capitolo l’obiettivo da ottimizzare sar` a sempre una funzione reale di n variabili reali. Pi` u precisamente a↵ronteremo la questione della ricerca dei punti di a massimo e/o di minimo di una funzione f : Rn ◆ X ! R, n 2. Il caso n = 1 `e gi` stato esaminato nel Capitolo 6, Volume 1. La Sezione 1 `e dedicata all’esame dei vari aspetti dell’ottimizzazione in generale e a un primo tipo di problema che consiste nella ricerca degli estremi interni al dominio X. Parleremo in questo caso di estremi liberi. La ricerca di estremi di f ristretta a @X o a un sottoinsieme (non aperto) U di X rientra nei problemi di ottimizzazione vincolata. In casi frequenti f `e ristretta a un sottoinsieme di X che pu` o essere descritto da un sistema di equazioni del tipo gj (x1 , . . . , xn ) = 0

j = 1, . . . , m

con

m < n.

Parleremo allora di ottimizzazione vincolata con vincoli di uguaglianza, argomento della seconda sezione. I due aspetti illustrati sopra possono essere considerati simultaneamente usando la teoria della programmazione matematica. Un tipico problema di programmazione consiste nell’ottimizzare una funzione su un insieme definito da un sistema di disequazioni del tipo 'j (x1 , . . . , xn )  0

j = 1, . . . , m,

56

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

(vincoli di disuguaglianza). Nella Sezione 3 `e presentata una breve introduzione ai principali risultati in questo importante settore della matematica moderna. 1. 1.1

` SULL’OTTIMIZZAZIONE. ESTREMI LIBERI GENERALITA Esempi preliminari

Nell’introduzione abbiamo parlato di estremi liberi o vincolati. Prima di chiarire la distinzione attraverso definizioni precise, esaminiamo alcuni esempi. Esempio 1.1 Tre punti p1 , p2 , p3 , disposti ai vertici di un triangolo acutangolo, devono essere collegati con un quarto punto, mediante un cavo, in modo da utilizzare meno materiale possibile. Dove deve essere collocato il punto p? Introdotto un sistema di riferimento ortogonale nel piano dei tre punti, siano (x1 , y1 ), (x2 , y2 ), (x3 , y3 ) le loro coordinate e (x, y) quelle di p. (Fig. 2.1). y

p3

d3 p

p1

d1

?

d2

p2 x Figura 2.1. Dove deve essere collocato p in modo da minimizzare d1 + d2 + d3 ?

p Posto dj (x, y) = |p pj | = (x xj )2 + (y zare la funzione f : R2 ! R definita da f (x, y) =

3 X

yj )2 , (j = 1, 2, 3), si tratta di minimiz-

dj (x, y),

j=1

somma delle distanze di p dai tre punti dati. In altri termini occorre determinare (x0 , y0 ) in modo che f (x0 , y0 ) = min f (x, y), al variare di (x, y) nell’aperto R2 . ` questo un problema di ricerca di estremi liberi, nel quale x e y variano in un aperto E e sono pertanto libere di muoversi, almeno localmente, in ogni direzione. Esempio 1.2 Un problema isoperimetrico. Fra tutti i parallelepipedi aventi superficie totale assegnata, 2A, determinare quello di volume massimo. Se si indicano con x, y, z le lunghezze degli spigoli del parallelepipedo, che possiamo supporre non degenere, il problema `e equivalente a massimizzare la funzione

1. Generalit` a sull’ottimizzazione. Estremi liberi

c 978-88-08-63708-6

57

V (x, y, z) = xyz sull’ottante positivo di R3 definito da {(x, y, z) 2 R3 : x > 0, y > 0, z > 0} sotto la condizione xy + yz + zx = A. Si tratta di un problema di massimizzazione con vincoli di uguaglianza. Esempio 1.3 Problema della dieta. Si supponga di avere a disposizione n tipi di cibo, A1 , . . . , An , ciascuno dei quali contenga m sostanze nutritive N1 , . . . , Nm . Siano, per unit` a di peso: aij = contenuto calorico della sostanza nutritiva Nj nell’alimento Ai ; ci = costo dell’alimento Ai ; bj = fabbisogno nell’organismo della sostanza Nj (per esempio, giornaliero) per i = 1, . . . , n e j = 1, . . . , m. Il problema della dieta consiste nello scegliere la quantit` a xi di cibo Ai , i = 1, . . . , n, in modo da minimizzare il costo totale sotto la condizione che la dieta sia sufficiente al fabbisogno di ogni sostanza. Si tratta di minimizzare la funzione C(x1 , . . . , xn ) =

n X

ci xi

i=1

dove le variabili x1 , . . . , xn sono non negative e soggette alle m ulteriori condizioni seguenti: n X xi aij bj (j = 1, . . . , m). i=1

` un tipico problema di programmazione, ovvero di ottimizzazione in presenza di E vincoli di disuguaglianza. In questo caso, essendo affini sia la funzione obiettivo sia i vincoli, il problema `e di programmazione lineare. 1.2

Generalit` a sull’ottimizzazione

Formuliamo ora con precisione i concetti di estremo illustrati negli esempi precedenti. Sia f : Rn ◆ X ! R. Ricordiamo le definizioni di estremo locale (o relativo) e globale (o assoluto). DEFINIZIONE 1.1 Un punto x0 2 X si dice di massimo (minimo) locale per f se esiste un intorno Br (x0 ) tale che (1.1)

f (x)  f (x0 )

(f (x)

f (x0 ))

per ogni x 2 X \ Br (x0 ). Si dice di massimo (minimo) globale per f se (1.1) vale per ogni x 2 X.

58

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Se, per x 6= x0 , nella (1.1) la disuguaglianza vale in senso stretto (< anzich´e  o > anzich´e ) il punto x0 `e di massimo, (minimo) locale o globale, forte. Corrispondena massimo (o minimo) locale o globale, eventualmente temente il valore f (x0 ) si dir` forte. Se X `e un aperto, gli eventuali estremi di f si dicono liberi. Pi` u in generale la ricerca di estremi liberi consiste nell’individuare punti di estremo che siano interni al dominio X. Supponiamo ora di essere interessati ai valori che f assume non in tutto X, bens`ı in un sottoinsieme U ⇢ X; in altri termini alla restrizione di f in U , f|U . Per esempio, se X `e chiuso, potrebbe essere U = @X. Le definizioni precedenti si estendono subito a f|U pur di sostituire X con U . Per esempio: x0 si dice punto di massimo locale per f|U se esiste Br (x0 ) tale che f (x)  f (x0 )

8 x 2 Br (x0 ) \ U.

Si dice di massimo globale se f (x)  f (x0 )

8 x 2 U.

` ovvio che un estremo, di qualunque natura, per f `e automaticamente un estremo E della stessa natura per f|U mentre non `e vero il viceversa. Ci occuperemo dei casi in cui U `e l’intersezione di X con un insieme definito da un sistema di uguaglianze del tipo gj (x) = 0

j = 1, . . . , m,

con m < n,

oppure da un sistema di disuguaglianze del tipo hi (x)  0

i = 1, . . . , k.

Si parler` a allora di ricerca di estremi condizionati o vincolati con vincoli di uguaglianza o di disuguaglianza. Esaminiamo ora brevemente quali questioni occorre in generale a↵rontare in un problema di ottimizzazione. 1) Esistenza Le questioni di esistenza si presentano prevalentemente nella ricerca degli estremi globali. Negli Esempi 1.1-1.3 si cercano appunto minimo e massimo globali. Per garantire l’esistenza di estremi globali pu` o essere utile il teorema di Weierstrass: se X `e compatto ed f `e continua in X allora f ha massimo e minimo (globali) in X. 2) Unicit` a Anche le questioni di unicit` a si presentano prevalentemente nell’ottimizzazione globale. o essere utile sapere se Supponiamo che f (x0 ) sia il minimo globale1 di f in X. Pu` il punto di minimo `e unico o, in altre parole, che non vi siano altri punti x tali che f (x) = f (x0 ). 1 Chiaramente

il minimo globale (= min f (X)) ` e unico.

1. Generalit` a sull’ottimizzazione. Estremi liberi

c 978-88-08-63708-6

59

Un ruolo importante a questo proposito `e rivestito da eventuali propriet` a di convessit` a del dominio X e/o della funzione stessa. Il seguente esempio `e significativo, anche se geometricamente intuitivo. Esempio 1.4 Sia X un compatto convesso in R2 e p un punto non appartenente a X (Fig. 2.2). Per x 2 X definiamo f (x) = |x p|. Cerchiamo il minimo di f in X, che equivale a determinare un punto di X (se esiste) a distanza minima da p. x2

X

x0 p

x

x1 Figura 2.2. Ricerca del punto x0 2 X di distanza minima da p.

Osserviamo anzitutto che f `e continua in X. Infatti, usando la propriet` a 4. della norma (pag. 112, Vol. 1), si ricava, per ogni coppia di punti x, y 2 X: (1.2)

|f (x)

f (y)| = | |x

p|

|y

p| |  |x

y|.

La (1.2) mostra che |x y| < " implica |f (x) f (y)| < ", da cui segue la continuit` a di f . La funzione f `e inoltre convessa; infatti, usando la disuguaglianza triangolare, per ogni coppia di punti x, y 2 X e ogni ↵ 2 (0, 1), si ha: (1.3)

f (↵x + (1

↵)y) = |↵x + (1 ↵)y p| = |↵(x  ↵|x p| + (1 ↵)|y p|

p) + (1

↵)(y

p)| 

con uguaglianza solo nel caso in cui x p e y p siano linearmente dipendenti. Dal teorema di Weierstrass si deduce che il minimo di f esiste, cio`e esiste x0 2 X tale che |x0 p| = min |x p|. x2X

o essere interno a X; se infatti lo fosse, muovendosi Il punto di minimo x0 non pu` di poco da x0 verso p lungo il segmento [x0 , p], si rimarrebbe in X e la distanza da p decrescerebbe. Dunque x0 2 @X. Facciamo ora vedere che il punto di minimo `e unico. Ragioniamo per assurdo e supponiamo che esista un altro punto di minimo x1 2 @X. Poniamo |x0 p| = µ; essendo anche |x1 p| = µ i punti x0 , x1 e p non possono o essere allineati e perci` o i vettori x0 p e x1 p sono linearmente indipendenti. Ci`

60

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

implica che se si pone x = x0 e y = x1 nella (1.3), la disuguaglianza vale in senso stretto; in conclusione si avrebbe: f (↵x0 + (1

↵)x1 ) < ↵µ + (1

↵)µ = µ

contro l’ipotesi che µ sia il minimo di f . Il punto x0 si chiama proiezione di p su X. ` interessante osservare che se X non `e chiuso il minimo di f pu` E o non esistere mentre se X non `e convesso potrebbero esservi pi` u punti di minimo (Esercizio 1). 3) Caratterizzazione dei punti di estremo La caratterizzazione dei punti di estremo avviene, come gi` a nel caso unidimensionale, attraverso condizioni analitiche necessarie e/o sufficienti che tali punti devono soddisfare. Lo strumento principale `e il calcolo di↵erenziale, sviluppato nel Volume 1, Capito` cos`ı possibile, nella ricerca di estremi liberi, estendere al caso n-dimensionale lo 6. E teoremi come quello di Fermat o come il Teorema 3.5, pagina 293, sul riconoscimento della natura dei punti stazionari mediante la formula di Taylor. Per quanto riguarda gli estremi vincolati svilupperemo il metodo dei moltiplicatori di Lagrange per il caso dei vincoli di uguaglianza e di Kuhn-Tucker per quelli di disuguaglianza 4) Algoritmi di calcolo Qui si entra propriamente nel campo dell’Analisi Numerica. Quando le variabili in gioco sono molte, la caratterizzazione di cui al punto 3 diventa quasi sempre inefficace dal punto di vista del calcolo e↵ettivo. Si presenta dunque la necessit` a di costruire algoritmi efficienti che permettano di determinare con la voluta precisione i punti che interessano. 1.3

Estremi liberi. Condizioni necessarie

Nella ricerca degli estremi liberi possiamo supporre che X sia aperto. Sia dunque f : X ! R, con X aperto di Rn e x0 un estremo locale per f . Una condizione che x0 deve soddisfare si trova facilmente considerando il comportamento di f lungo le direzioni uscenti da x0 . Fissato v, versore in Rn , poniamo g(t) = f (x0 + tv). La funzione g, reale di variabile reale, `e definita in un intorno di t = 0, essendo x0 punto interno, e ha in t = 0 un punto di estremo. Se supponiamo che Dv f (x0 ) esista, ricordando la definizione di derivata direzionale e il teorema di Fermat, si conclude che Dv f (x0 ) = g 0 (0) = 0. Dunque: TEOREMA 1.1 Dv f (x0 ) = 0.

Se x0 `e punto di estremo locale per f e Dv f (x0 ) esiste, allora

Immediato corollario `e il seguente: COROLLARIO 1.2 Se f `e di↵erenziabile in x0 , punto di estremo locale per f , allora ogni derivata direzionale in x0 `e nulla; in particolare rf (x0 ) = 0.

1. Generalit` a sull’ottimizzazione. Estremi liberi

c 978-88-08-63708-6

61

Ricordiamo che se f `e di↵erenziabile, un punto in cui il gradiente, o equivalentemente il di↵erenziale, si annulla si dice stazionario o critico. Il corollario esprime il fatto che un punto di estremo locale deve essere critico. Gi` a sappiamo dallo studio delle funzioni reali di una variabile reale che la condizione espressa nel Teorema 1.1 o nel Corollario 1.2, non `e in generale sufficiente per decidere se un punto x0 sia di estremo n´e tantomeno di quale tipo di estremo si tratti. Si potrebbe pensare che se un punto x0 `e critico per f ed `e un punto di massimo (minimo) lungo ogni direzione uscente da x0 , ovvero punto di massimo (minimo) per g(t) = f (x0 + tv) per ogni versore v, allora `e punto di massimo (minimo) locale per f . Il seguente esempio mostra che ci` o `e falso. Esempio 1.5 Sia f (x, y) = y 2

3x2 y + 2x4 = (y

x2 )(y

2x2 ).

La funzione ha un punto critico in (0, 0) dove si annulla; infatti fx =

6xy + 8x3 ,

fy = 2y

2

3x ,

fx (0, 0) = 0 fy (0, 0) = 0.

Lungo ogni retta uscente da (0, 0)f ha un minimo nell’origine. Infatti, lungo l’asse y si ha f (0, y) = y 2 che `e minima in y = 0. Lungo le rette y = mx si ha f (x, mx) = m2 x2 3mx3 + 2x4 che, come si verifica subito, ha un minimo in x = 0 per ogni m. D’altra parte (0, 0) non `e punto di minimo locale per f , in quanto la funzione cambia segno in ogni intorno circolare dell’origine o, in altri termini, in ogni intorno di (0, 0), esistono punti in cui f `e positiva, altri in cui `e negativa. La discussione precedente `e visualizzata in Figura 2.3. y y = 2x2 y = x2

– + + +

– + x

+ +

Figura 2.3. Nell’intorno circolare dell’origine i segni + o indicano le zone di positivit` a o negativit` a di f . Si noti come lungo ogni retta y = mx, f sia definitivamente positiva per x ! 0, mentre f (0, 0) = 0.

I punti critici come l’origine nell’Esempio 1.5 si chiamano punti di sella o di colle. Pi` u precisamente un punto critico x0 si dice di sella o di colle se in ogni intorno di x0 esistono punti in cui f `e maggiore di f (x0 ) e punti in cui `e minore di f (x0 ).

62

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Va osservato che a volte, per esempio nei testi di programmazione, il termine sella si riferisce a punti critici nei quali f `e minima lungo alcune direzioni e massima lungo altre. In questo senso l’origine nell’Esempio 1.5 non `e punto di sella. Un tipico punto di sella `e l’origine per la funzione f (x, y) = x2 y 2 , il cui grafico (diagramma n. 44, Vol. 1) mostra anche quanto sia appropriata la terminologia. Nella ricerca degli estremi liberi di f , il Teorema 1.1 opera dunque un primo filtro: gli estremi liberi in cui esiste il gradiente si trovano tra le soluzioni del sistema 8 @f > > (x1 , . . . , xn ) = 0 > > @x > 1 > > > > < @f (x , . . . , x ) = 0 1 n @x2 > .. > > > . > > > > @f > : (x1 , . . . , xn ) = 0. @xn

Una volta determinati gli eventuali punti critici occorrono altre indagini per deciderne la natura. Vale la pena di mettere subito in evidenza che per funzioni convesse o concave possono essere tratte conclusioni immediate: PROPOSIZIONE 1.3 Se x0 `e un punto critico per una funzione f , convessa (concava) e di↵erenziabile, allora x0 `e punto di minimo (massimo) globale. Inoltre se f `e strettamente convessa (concava) il punto di minimo (massimo) `e unico e forte. Dimostrazione. Se f `e convessa e di↵erenziabile in x0 , per ogni x 2 X, si ha (Teor. 1.11, pag. 333, Vol. 1): (1.4)

f (x)

f (x0 ) + df (x0 );

essendo x0 critico, df (x0 ) = 0 e perci` o f (x) f (x0 ) per ogni x 2 X, da cui segue che x0 `e punto di minimo globale. Se f `e strettamente convessa, la (1.4) vale in senso stretto per ⇤ ogni x 6= x0 , per cui x0 `e di minimo globale forte e x0 `e unico.

I pochi elementi sviluppati finora permettono gi` a di risolvere il problema dell’Esempio 1.1. Esempio 1.6 (Continuazione dell’Esempio 1.1). Ricordiamo che la funzione da minimizzare `e f (x, y) =

3 P

dj (x, y) dove dj (x, y) =

j=1

|p pj |, distanza del punto p dal punto pj . Nell’Esempio 1.4 abbiamo visto che la funzione distanza `e convessa e perci` o f , come somma di funzioni convesse, `e pure o essere assunto nei vertici convessa. Osserviamo poi che il minimo, se esiste, non pu` del triangolo, in particolare nel vertice comune ai due lati pi` u corti. Infatti, sia, per esempio, p1 tale vertice e sia q il piede della perpendicolare condotta dal vertice p2 al lato opposto. Allora `e facile verificare che: |q

p2 | + |q

p1 | + |q

p3 | = |q p2 | + |p1 p3 | < < |p1 p2 | + |p1 p3 |

o essere punto di minimo globale. e quindi p1 non pu`

1. Generalit` a sull’ottimizzazione. Estremi liberi

c 978-88-08-63708-6

63

I vertici del triangolo sono gli unici punti dove f non `e di↵erenziabile; per quanto appena osservato possiamo limitarci a considerare gli altri. Cerchiamo i punti critici annullando il gradiente di f . Si trova il sistema 8 x x2 x x3 x x1 @f > > + + =0 < @x = d d d3 1 2 (1.5) > y y2 y y3 y y1 @f > : + + = 0. = @y d1 d2 d3

Per risolverlo notiamo che le coppie ( x d1x1 , y d1y1 ), ( x d2x2 , y d2y2 ), ( x d3x3 , y d3y3 ) sono rispettivamente le componenti dei vettori p p1 p p2 p p3 , w2 = , w3 = w1 = d1 d2 d3

che hanno modulo unitario, poich´e |wj | = equivalente all’equazione vettoriale

|p pj | dj

=

dj dj

= 1. Il sistema (1.5) `e allora

w1 + w2 + w3 = 0.

(1.6)

Ora, 3 versori in R2 possono avere per somma il vettore nullo solo se i punti corrispondenti sono disposti ai vertici di un triangolo equilatero, ovvero se l’angolo che ciascuno di essi forma con ciascuno degli altri `e di 2⇡/3, (Fig. 2.4a). Esiste un solo punto p, che risulta interno al triangolo, tale che i segmenti [p, pj ] formino tra loro angoli di 2⇡/3. Dunque esiste un solo punto critico per f . Essendo f convessa, in base alla Proposizione 1.3, esso `e (l’unico) punto di minimo. y

p3

2 3

w3 w2

p1

w1

p

pmin 2 3

p p2

a)

b)

x

Figura 2.4. a) L’unica disposizione (a meno di rotazioni del piano) di tre versori in R2 , affinch´ e la loro somma sia 0. b) La soluzione del problema di minimo nell’Esempio 1.6 per il triangolo di Figura 2.1.

1.4 Forme quadratiche Un modo per determinare la natura di un punto critico x0 `e quello di usare la formula di Taylor per analizzare il segno di f (x0 +h) f (x0 ). Su questa idea era infatti basato il Teorema 3.5, pagina 293, Volume 1. Nel caso unidimensionale, arrestandosi al secondo ordine, si trova, essendo f 0 (x0 ) = 0: f (x0 + h)

f (x0 ) =

1 2 1 d f (x0 ) + o(h2 ) = f 00 (x0 )h2 + o(h2 ) per h ! 0. 2 2

64

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Ora, se f 00 (x0 ) 6= 0, il segno di f (x0 + h) f (x0 ) `e, definitivamente per h ! 0, quello u profonda. di f 00 (x0 ); se f 00 (x0 ) = 0 occorre un’analisi pi` Nel caso multidimensionale, procedendo nello stesso modo, si troverebbe f (x0 + h) (1.7)

1 2 d f (x0 ) + o(|h|2 ) = 2 n 1 X = fx x (x0 )hi hj + o(|h|2 ). 2 i,j=1 i j

f (x0 ) =

La determinazione del segno di f (x0 + h) f (x0 ) conduce ancora all’analisi del di↵erenziale secondo di f in x0 ovvero all’analisi della forma quadratica n X

fxi xj (x0 )hi hj .

i,j=1

Apriamo dunque una parentesi in cui ci occupiamo delle forme quadratiche. Essendo questo argomento tradizionalmente inserito nei corsi di Algebra ci limitiamo a evidenziare i risultati pi` u strettamente legati all’ottimizzazione. Ricordiamo che una forma quadratica (in breve, f.q.) in Rn `e un polinomio omogeneo di secondo grado del tipo (1.8)

q(h) = q(h1 , . . . , hn ) =

n X

aij hi hj

i,j=1

dove gli aij sono numeri reali, coefficienti della f.q. Se tutti gli aij sono uguali a zero, la (1.8) si chiama f.q. nulla. Si pu` o sempre supporre che nella (1.8) sia aji = aij ; se cos`ı non fosse basterebbe soa +a stituire ciascuno dei due coefficienti aij e aji con la loro semisomma ij 2 ji , lasciando in tal modo inalterata la (1.8). A ogni q(h) risulta cos`ı associata una matrice simmetrica A = (aij )i,j=1,...,n , con una corrispondenza evidentemente biunivoca. Esempio 1.7 Le forme quadratiche seguenti corrispondono alle matrici indicate. ✓ ◆ 1 3 A= q(h1 , h2 ) = h21 + 2h22 6h1 h2 3 2 0 1 1 3 0 q(h1 , h2 , h3 ) = h21 + 2h22 6h1 h2 A = @ 3 2 0A 0 0 0 0 1 1 0 1 0 B 0 3 0 5C C A=B q(h1 , h2 , h3 , h4 ) = h21 3h22 + h24 2h1 h3 + 10h2 h4 @ 1 0 0 0A . 0 5 0 1 A volte `e pi` u significativo scrivere una f.q. come prodotto scalare: q(h) = hAh, hi, oppure in notazione matriciale: hT Ah; scrivendo Ah si intende che h sia vettore colonna; hT indica il trasposto di h.

1. Generalit` a sull’ottimizzazione. Estremi liberi

c 978-88-08-63708-6

65

Siamo interessati al segno che una f.q. assume al variare di h. Una prima osservazione `e che, essendo omogenea di secondo grado, q(h) assume segno costante su ogni retta passante per l’origine, origine esclusa. Infatti q(th) = t2 q(h). a di comportamento: I seguenti semplici esempi in R2 illustrano tutte le possibilit` a) h21 + h22 `e positiva per ogni (h1 , h2 ) 6= (0, 0); b) h21 + h22 `e positiva per (h1 , h2 ) = (0, 1) e negativa per (h1 , h2 ) = (1, 0); c) h21 h22 `e negativa per ogni (h1 , h2 ) 6= (0, 0); d) h21 `e sempre positiva tranne che nei vettori del tipo (0, h2 ); e) h21 `e sempre negativa tranne che nei vettori del tipo (0, h2 ). Tali esempi suggeriscono la seguente classificazione che si applica sia alla f.q., sia alla matrice simmetrica ad essa associata. DEFINIZIONE 1.2 Una forma quadratica (o la matrice simmetrica corrispondente), q(h), h 2 Rn , si dice: i) definita positiva (negativa) se 8 h 6= 0, q(h) > 0 (q(h) < 0); ii) semi-definita positiva (negativa) se 8 h 2 Rn , q(h) 0 (q(h)  0) ed esiste h 6= 0 tale che q(h) = 0; iii) indefinita (o non definita) se esistono h1 e h2 tali che q(h1 ) < 0 e q(h2 ) > 0. Sottolineiamo che le condizioni i), ii), iii) sono mutuamente esclusive. ` sempre bene specificare lo spazio vettoriale in cui si opera quando si vuole classificare E una f.q. Infatti la f.q. in a) `e definita positiva in R2 ma `e semidefinita in Rn con n 3. Per le altre, considerate come forme quadratiche in R2 , si ha: b) indefinita, c) definita negativa, d) semidefinita positiva, e) semidefinita negativa. Occorrono ora dei criteri per classificare una f.q. senza ricorrere alla definizione. Lasciamoci guidare dal caso bidimensionale. Sia dunque (1.9)

q(h1 , h2 ) = ah21 + 2bh1 h2 + ch22

con a, b, c non tutti nulli. Se a = c = 0, q `e certamente indefinita. Se a 6= 0 (nel caso a = 0, c 6= 0 si procede analogamente), q si pu` o scrivere nel modo seguente: ✓ ◆2 b ac b2 2 2 2 (a 6= 0). h2 q(h1 , h2 ) = ah1 + 2bh1 h2 + ch2 = a h1 + h2 + a a ✓ ◆ ab Osserviamo che la matrice associata a q `e A = e che i coefficienti dei quadrati b c sono a e |A| e il determinante di A. Si deduce allora il seguente risultato: a , dove |A| ` PROPOSIZIONE 1.4 La (1.9) `e: i) definita positiva (negativa) se e solo se |A| > 0 e a > 0 (a < 0);

ii) indefinita se e solo se |A| < 0;

iii) semidefinita positiva (negativa) e se solo se: |A| = 0 e a > 0 (a < 0), oppure se: |A| = 0 e c > 0 (c < 0).

66

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Il punto importante nella Proposizione 1.4 `e che il test fa intervenire non solo la matrice A, bens`ı anche una matrice 1 ⇥ 1, per esempio quella in alto a sinistra: A1 = (a11 ). La naturale generalizzazione fa intervenire tutte le n sottomatrici Ak composte mediante le prime k righe e k colonne di A, chiamate a volte sottomatrici principali di nord-ovest: 0 1 ✓ ◆ a11 a12 a13 a11 a12 , A3 = @a21 a22 a23 A , . . . , An = A. A1 = (a11 ), A2 = a21 a22 a31 a32 a33 I determinanti di queste matrici si chiamano minori principali di nord-ovest. Vale il seguente teorema, che ci limitiamo a enunciare: n P TEOREMA 1.5 Sia q(h) = aij hi hj , h 2 Rn . Allora i,j=1

i) q `e definita positiva se e solo se |Ak | > 0 per ogni k = 1, . . . , n; ii) q `e definita negativa se e solo se ( 1)k |Ak | > 0 per ogni k = 1, . . . , n;

(ovvero se e solo se a11 < 0, |A2 | > 0, |A3 | < 0, . . .). Sarebbe erroneo pensare che le matrici Ak siano speciali. Il Teorema 1.5 vale anche con le sottomatrici principali di sud-est, costruite partendo in basso a destra con l’elemento ann , aggiungendo ogni volta una riga e una colonna fino ad arrivare ad A. Oppure si potrebbe usare una qualunque catena di sottomatrici principali2 , partendo da un elemento ajj della diagonale e aggiungendo ogni volta una riga e una colonna. Esempio 1.8 Sia q1 (h1 , h2 , h3 ) = 5h21

8h1 h3 + 3h22 + 4h23 .

La matrice corrispondente `e 0

5 0 A=@ 0 3 4 0

1 4 0A . 4

✓ ◆ 50 Essendo: a11 = 5 > 0, |A2 | = det = 15 > 0, |A3 | = |A| = 12 > 0, la f.q. `e 03 definita positiva. Per ottenere un test simile al Teorema 1.5 per le f.q. semidefinite occorre considerare tutte le sottomatrici principali di A e non solo una particolare sequenza tipo la a in dimensione 2: le matrici A1 , . . . , An , come del resto si vede gi` ✓ ◆ ✓ ◆ 00 0 0 A= e B= 01 0 1 2 Una sottomatrice di A si dice principale se ` e simmetrica rispetto alla diagonale principale di A. Un minore principale ` e il determinante di una sottomatrice principale.

1. Generalit` a sull’ottimizzazione. Estremi liberi

c 978-88-08-63708-6

67

corrispondono rispettivamente a una f.q. semidefinita positiva e a una semidefinita negativa. La sola considerazione di a11 = 0, |A| = 0 e di b11 = 0, |B| = 0 non permette di distinguere il segno. Vale il seguente risultato: n P TEOREMA 1.6 Sia q(h) = aij hi hj , h 2 Rn . Allora: i,j=1

i) q `e semidefinita positiva se e solo se ogni sottomatrice principale ha determinante non negativo; ii) q `e semidefinita negativa se e solo se ogni sottomatrice principale di ordine k ha determinante non negativo se k `e pari e non positivo se k `e dispari.

Poich´e le condizioni espresse nei Teoremi 1.5 e 1.6 sono necessarie e sufficienti si deduce che in ogni altro caso q(h) risulta indefinita. Esempio 1.9 Sia q(h1 , h2 , h3 ) = caso `e

2h21 +2h1 h2 0

2 A=@ 1 1 Si ha: a11 =

1 5 4

2 < 0, |A2 | = 9 > 0, |A ✓ 3| = 2 Le altre sottomatrici principali sono 1 con determinante 9 > 0. Si conclude che q `e semidefinita negativa.

2h1 h3

5h22

8h2 h3

5h23 . In questo

1 1 4A . 5

|A| ◆ = 0. La f.q. non `e definita✓negativa. ◆ 1 5 4 con determinante 9 > 0 e 5 4 5

Un altro importante test `e basato sul segno degli autovalori di A. Ricordiamo che un numero complesso e un vettore non nullo x 2 Cn sono detti, rispettivamente, autovalore e autovettore (corrispondente a ) di una matrice quadrata A di ordine n, se soddisfano la relazione: Ax = x o, equivalentemente, (1.10)

(A

In )x = 0.

La (1.10) ha soluzioni non nulle se e solo se la matrice dei coefficienti `e singolare, ovvero se e solo se `e soluzione dell’equazione, detta equazione caratteristica: (1.11)

det(A

In ) = 0.

Il primo membro della (1.11) `e un polinomio di grado n in e pertanto, in base al teorema fondamentale dell’Algebra, esistono esattamente n autovalori di A, ciascuno contato secondo la propria molteplicit` a.

68

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Le matrici A simmetriche hanno importanti propriet` a, che elenchiamo qui di seguito: P1 ) gli autovalori e gli autovettori di A sono reali ; P2 ) esistono n autovettori linearmente indipendenti w1 , w2 , . . . , wn , che costituiscono un sistema ortonormale (cio`e hwi , wj i = ij ); P3 ) la matrice Q = (w1 , w2 , . . . , wn ), le colonne della quale sono gli autovettori di cui al punto P2 ), `e ortogonale (cio`e Q 1 = QT ) e diagonalizza A. Pi` u precisamente 1 0 1 0 ... 0 B 0 2 ... 0 C C B QT AQ = diag( 1 , . . . , n ) = B . . . . C, @ .. .. . . .. A 0 0 ...

dove

j

n

`e l’autovettore corrispondente a wj .

Sia ora una f.q. in Rn , che scriviamo in notazione matriciale: q(h) = hT Ah.

(1.12)

Operiamo la trasformazione h = Q k, biunivoca da Rn in s´e, dove Q `e la matrice ortogonale di cui al punto P3 ). Sostituendo nella (1.12) si trova, ponendo ⇤ = diag( 1 , . . . , n ): (1.13)

T

T

T

q(h) = q(Qk) = k Q AQk = k ⇤k =

n X

2 j kj .

j=1

Questo procedimento si chiama riduzione a forma canonica di q. Poich´e la trasformazione h = Q k `e biunivoca, il segno di q(h) si pu` o leggere su quello della f.q. n X 2 qe(k) = j kj . j=1

Esaminando il segno dei

j

si conclude immediatamente che:

TEOREMA 1.7 Sia q(h) = hT Ah, h 2 Rn . Allora: i) q `e definita positiva (negativa) se e solo se tutti gli autovalori sono positivi (negativi); ii) q `e semidefinita positiva (negativa) se e solo se tutti gli autovalori sono non negativi (non positivi) e almeno uno di essi `e zero; iii) q `e indefinita se e solo se esistono 2 autovalori di segno opposto. Esempio 1.10 Sia q(h1 , h2 , h3 ) =

3h21 + 2h1 h3

3h22 + 2h2 h3

h23 ,

1. Generalit` a sull’ottimizzazione. Estremi liberi

c 978-88-08-63708-6

69

che corrisponde alla matrice 0

Si ha:

per

0

=

3,

det @ =

3 A=@ 0 1 3

0 0 1



1

1

1 1

3

0 3 1

A=

1

1 1 1A . 1 ( + 3)(

2

+ 4 + 1) = 0

p 3. Pertanto q `e definita negativa.

Una propriet` a delle forme quadratiche definite, positive o negative, che risulter` a utile in seguito `e la seguente. PROPOSIZIONE 1.8 Se q(h) = hT Ah `e definita positiva, allora, 8 h 2 Rn : (1.14) dove

min

`e il minimo autovalore di A. Se q(h) `e definita negativa, allora, 8 h 2 Rn :

(1.15) dove

2 min |h|

q(h)

q(h)  max

2 max |h|

`e il massimo autovalore di A.

Dimostrazione. Dalla (1.13), se q `e definita positiva si ha q(h)

min

n X

j=1

kj2 =

min |k|

2

.

Poich´e k = Q 1 h = QT h e Q `e ortogonale, si ha |k| = |h| da cui la tesi. Analogamente si ⇤ procede nel caso q definita negativa.

Concludiamo con un’osservazione. Se q = q(h) `e una forma quadratica in Rn allora q(0) = 0 e rq(0) = 0. La natura del punto critico h = 0 dipende dal segno di q. Se q `e definita positiva (negativa), h = 0 `e punto di minimo (massimo) globale forte. Se q `e indefinita, 0 `e di colle. Se q (non nulla) `e semidefinita positiva (negativa), 0 `e punto di minimo (massimo) globale debole. 1.5 Condizioni sufficienti per estremi liberi Ritorniamo all’ottimizzazione e alla formula (1.7) che indica come il segno di f (x0 + h) f (x0 ) dipenda da quello della forma quadratica d2 f (x0 ), nel caso in cui x0 sia un punto critico per f . La matrice corrispondente a d2 f (x0 ) `e l’hessiana di f in x0 , cio`e Hf (x0 ) = (fxi xj (x0 ))i,j=1,...,n , o accade, che risulta simmetrica se fxi xj (x0 ) = fxj xi (x0 ) per ogni i, j = 1, . . . , n; ci` per esempio, se f `e di classe C 2 .

70

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Usando la teoria delle f.q. si ricava il seguente: TEOREMA 1.9 Siano f 2 C 2 (X) e x0 punto critico per f . Se d2 f (x0 ) `e:

i) definita positiva (negativa), x0 `e punto di minimo (massimo) locale forte; ii) indefinita, x0 `e punto di colle. Dimostrazione. Sia d2 f (x0 ) definita positiva. Dalla (1.14) abbiamo d2 f (x0 ) e il minimo autovalore di Hf (x0 ). Dalla (1.7) otteniamo allora, m ` f (x0 + h)

1 2 d f (x0 ) + o(|h|2 ) 2 1 2 = m |h| {1 + o(1)} 2

f (x0 ) =

1 2

2 m |h|

2 m |h| ,

dove

+ o(|h|2 ) =

(per h ! 0).

Poich´e m > 0, |h|2 > 0 per |h| 6= 0 e {1 + o(1)} > 0 definitivamente per h ! 0, si deduce o x0 `e di minimo locale che anche f (x0 + h) f (x0 ) > 0 definitivamente per h ! 0 e perci` 2 0 forte. La dimostrazione `e analoga nel caso d f (x ) definita negativa: usando la (1.15) si trova f (x0 + h)

f (x0 ) 

1 2

2 M |h| {1

+ o(1)}

dove M (negativo) `e il massimo autovalore di Hf (x0 ). Dunque f (x0 + h) f (x0 ) < 0 definitivamente per h ! 0 e perci` o x0 `e punto di massimo locale forte. 2 0 Se d f (x ) `e indefinita esistono due vettori incremento h e k in corrispondenza ai quali d2 f (x0 ) `e rispettivamente positiva e negativa; cio`e: n X

fxi xj (x0 )hi hj > 0

i,j=1

e

n X

fxi xj (x0 )ki kj < 0.

i,j=1

Valutiamo l’incremento di f lungo la retta x = x0 + th, t 2 R, t 6= 0; si ha, dalla (1.7): n 1 2 X t fx x (x0 )hi hj + o(t2 ) = 2 i,j=1 i j ( n ) 1 2 X 0 = t fxi xj (x )hi hj + o(1) 2 i,j=1

f (x0 + th) = f (x0 ) =

(per t ! 0)

e perci` o, essendo definitivamente positivo il termine tra parentesi, si ottiene che, per |t| piccolo, sar` a f (x0 + th) f (x0 ) > 0. Con lo stesso ragionamento si trova che, per |t| piccolo, f (x0 + tk) f (x0 ) < 0. Dunque, in ogni intorno di x0 si trovano punti in cui f `e maggiore di f (x0 ) e punti in cui ⇤ f `e minore: x0 `e punto di colle.

OSSERVAZIONE 1.1 Se d2 (f )x `e definita, positiva o negativa, per ogni x 2 X (e non solo in x0 ), in base al Teorema 1.12, pagina 334, Volume 1, f risulta strettamente convessa o concava, rispettivamente, e perci` o, per la Proposizione 1.3, x0 risulta (l’unico) punto di estremo globale forte, minimo o massimo rispettivamente. Nel caso in cui d2 f (x0 ) sia semidefinita, in generale la considerazione del solo differenziale secondo non `e pi` u sufficiente a stabilire la natura del punto critico. Vale comunque la seguente proposizione.

1. Generalit` a sull’ottimizzazione. Estremi liberi

c 978-88-08-63708-6

71

PROPOSIZIONE 1.10 Sia f 2 C 2 (X). Se x0 `e punto di massimo (minimo), allora d2 f (x0 ) `e definita oppure semidefinita negativa (positiva). In particolare fxj xi (x0 )  0 ( 0) per ogni j = 1 . . . , n. Lasciamo la dimostrazione per esercizio. La condizione espressa dalla Proposizione 1.10 `e solo necessaria affinch´e x0 sia punto di estremo. Ci` o risulta particolarmente evidente se d2 f (x0 ) `e nullo (cio`e tutte le derivate seconde di f in x0 sono nulle), come nel seguente caso: f (x, y) = x2 y + y 5 ha di↵erenziale secondo nullo in (0, 0) e (0, 0) `e punto di colle. o ugualmente decidere; per esempio, per la Anche se d2 f (x0 ) non `e nulla, non si pu` funzione f (x, y) = x2 y 4 , d2 f (0, 0) = 2h21 `e semidefinita positiva, e l’origine `e punto di sella (di minimo sull’asse x, di massimo sull’asse y). La Proposizione 1.10 si pu` o raffinare in questo senso: o essere se d2 f (x0 ) non `e nulla ed `e semidefinita positiva (negativa), allora x0 non pu` punto di massimo (minimo) (Esercizio 10b). La situazione cambia se d2 f (x) `e (non nulla) semidefinita, positiva o negativa, non solo in x0 ma per ogni x in un intorno Br (x0 ). In tal caso infatti f `e convessa o concava rispettivamente, in Br (x0 ) (Esercizio 24, pag. 338, Vol. 1) e la conclusione `e immediata in base alla Proposizione 1.3. Se poi `e semidefinita in tutto X, f (x0 ) `e estremo globale. OSSERVAZIONE 1.2 Ricordando la Proposizione 1.4, le considerazioni precedenti conducono alla seguente regola nel caso bidimensionale: Siano f 2 C 2 (X), X aperto in R2 , e (x0 , y0 ) un punto critico per f . L’hessiana di f in (x0 , y0 ) `e

Hf (x0 , y0 ) =

◆ ✓ fxx (x0 , y0 ) fyx (x0 , y0 ) fxy (x0 , y0 ) fyy (x0 , y0 )

a) se det Hf (x0 , y0 ) > 0 e fxx (x0 , y0 ) > 0, allora (x0 , y0 ) `e punto di minimo locale forte fxx (x0 , y0 ) < 0, allora (x0 , y0 ) `e punto di massimo locale forte (si noti che in questo caso fxx (x0 , y0 ) e fyy (x0 , y0 ) hanno lo stesso segno); b) se det Hf (x0 , y0 ) < 0, allora (x0 , y0 ) `e punto di colle; c) se det Hf (x0 , y0 ) = 0 occorre un’analisi ulteriore. Si ritrovano cos`ı le tre situazioni gi` a incontrate nello studio degli insiemi di livello nel Paragrafo 7.3.3, Volume 1; in quel contesto, ricordiamo la classificazione dei punti critici in ellittici, iperbolici e parabolici secondo che si verifichi a), b) o c) rispettivamente. Se poi det Hf (x, y) > 0 per ogni (x, y) 2 X, l’estremo `e globale. Se infine det Hf (x, y) = 0 e fxx (x, y) > 0 (risp. < 0) oppure fyy (x, y) > 0 (risp. < 0) in tutto X, allora (x0 , y0 ) `e punto di minimo globale (risp. massimo globale).

72

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Esempio 1.11 Si vogliano determinare gli estremi della funzione f (x, y, z) = x2 + y 2 + z 2

2x

2z

5.

Poich´e f 2 C 1 (R3 ) i suoi eventuali estremi si trovano tra i punti critici, soluzioni del 8 seguente sistema: >

: fz = 2z 2 = 0.

L’unica soluzione `e (1, 0, 1). Risulta inoltre: fxx = fyy = fzz = 2 mentre le altre derivate seconde sono nulle. Perci` o: d2 f (x, y, z) = 2h21 + 2h22 + 2h23

che `e una f.q. definita positiva per ogni (x, y, z) 2 R3 . Si deduce che il punto (1, 0, 1) `e di minimo globale, in base all’Osservazione 1.1. Esempio 1.12 Minimi quadrati. Dati k punti nel piano (x1 , y1 ), (x2 , y2 ), . . . , (xk , yk ) con ascisse tutte distinte, se k > 2 `e evidente che, in generale, non esister` a una retta passante per ognuno di essi. Si vuole trovare la retta y = ax + b che minimizza l’errore quadratico totale, definito dalla seguente espressione: (1.16)

E(a, b) =

k X (axj + b

yj )2

(k

3).

j=1

I punti critici di E sono 8 le soluzioni del seguente sistema: k P @E > > > 2xj (axj + b yi ) = 0 = < @a j=1 (1.17) k P > @E > > 2(axj + b yi ) = 0. : @b = j=1

Poniamo, per comodit` a k X P = x2j ,

Q=

j=1

k X j=1

xj ,

R=

k X j=1

yj ,

S=

k X

xj yj .

j=1

Il sistema (1.17) si pu` o scrivere ora nella forma ( P a + Qb = S (1.170 ) Qa + kb = R. Il determinante kP Q2 `e sempre positivo se k > 2 e i numeri x1 , . . . , xk sono distinti. Infatti kP Q2 > 0 equivale alla disuguaglianza 0 12 k k X X @ xj A < k x2j , (1.18) j=1

vera nel caso indicato3 . 3 Si

veda comunque l’Esercizio 12.

j=1

1. Generalit` a sull’ottimizzazione. Estremi liberi

c 978-88-08-63708-6

73

Si trova quindi che l’unico punto critico di E `e il punto a=

(1.19)

kS kP

RQ , Q2

b=

PR kP

SQ . Q2

Per vedere che si tratta di un minimo calcoliamo la matrice hessiana di E. Si trova ✓ ◆ P Q HE (a, b) = 2 Q k che coincide con la matrice dei coefficienti del sistema (1.170 ). Poich´e P > 0 e det HE = kP Q2 > 0 in tutto R2 , in base all’Osservazione 1.2 si deduce che (a, b) `e il punto di minimo globale cercato. Applichiamo il procedimento alle coppie altezza/peso della seguente tabella: altezza in cm peso in kg

160 60

163 61

168 70

170 72

175 73

178 74

185 81

190 83

193 87

Si ha: P = 279176, Q = 1582, R = 661, S = 117036. Dalle (1.18), accontentandoci di 3 cifre dopo il punto, si ricava: a = 0.772, b = 62.435, e la retta `e y = 0.773x 62.435. Quest’ultima equazione pu` o essere interpretata nel presente caso come una relazione “ottimale” tra peso e altezza dove il criterio di ottimalit` a `e quello di rendere minimo lo scarto quadratico totale dei dati della tabella. Per esempio, secondo questo legame, un’altezza di cm 180 dovrebbe essere corrispondente a un peso “ideale” di 76.705 kg. Concludiamo il paragrafo esaminando il caso in cui d2 f (x0 ) sia semidefinita. Abbiamo gi` a osservato che eventuali propriet` a di convessit` a o concavit` a di f permettono o procedere nei due modi seguenti: di riconoscere la natura di x0 . Altrimenti si pu` 1) esaminare direttamente il segno di f (x0 + h) f (x0 ) quando h varia in un intorno di 0. Tale metodo `e realistico se l’espressione analitica non `e troppo complicata; 2) se f `e sufficientemente regolare, esaminare il segno dei di↵erenziali di ordine superiore al secondo, nell’intorno delle rette sulle quali il di↵erenziale secondo si annulla. Illustriamo i due metodi con un esempio. Esempio 1.13 Sia f (x, y) = 3 + (y x)2 y 2 (sin x)2 . f 2 C 1 (R2 ), f (0, 0) = 3 e df (0, 0) = 0. Inoltre d2 f (0, 0) = 2(h2 h1 )2 `e una f.q. semidefinita positiva che si annulla sulla retta h2 = h1 ; (0, 0) `e di minimo o di colle. Procedendo col primo metodo si avrebbe: f (h1 , h2 )

f (0, 0) = (h2

h1 )2

h22 (sin h1 )2

che si annulla sulle due curve del piano h1 , h2 definite dalle equazioni h2 =

h1 . 1 ± sin h1

74

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

h2

_ _

+ h2 = h1/(1– sinh1)

h2 = h 1 h2 = h1/(1+ sinh1) h1

+

_ _

Figura 2.5. Segno di f (h1 , h2 )

f (0, 0) (Esempio 1.13).

Dalla Figura 2.5 si vede che in ogni intorno circolare di (0, 0), f (h1 , h2 ) f (0, 0) cambia segno, per cui (0, 0) `e di colle. Con il secondo metodo si calcolano i di↵erenziali di ordine superiore. Il primo non nullo `e il quarto; si ha d4 f (0, 0) = 4!h22 h21 . Il suo segno sulla retta h2 = h1 (dove d2 f (0, 0) `e nullo) `e negativo e quindi f (h1 , h1 ) o essere punto di minimo e perci` o `e di f (0, 0) < 0 se |h1 | `e piccolo: l’origine non pu` colle.

Esercizi 1. In riferimento all’Esempio 1.4:

a) dare un esempio in cui X non `e chiuso e il minimo non esiste; b) dare un esempio in cui X `e un compatto non convesso ed esiste pi` u di un punto di minimo; c)* siano X, p, x0 come nell’Esempio 1.4. Mostrare che il punto di minimo x0 (proiezione di p su X) `e caratterizzato dalla seguente propriet` a: (H)

8 x 2 X : hx

x0 , p

x0 i  0.

In altri termini: x0 soddisfa (H) e, viceversa, se y soddisfa (H), allora x0 = y. Interpretare geometricamente la condizione (H). [Suggerimento: considerare la funzione reale di variabile reale g(t) = |x0 + t(x x0 ) p|2 , t 0. Calcolare g 0 e g 00 e mostrare che (H) equivale a g 0 (0) 0. Se x0 `e punto di minimo allora g 0 (0) . . .]; d) si pu` o generalizzare tutto a n dimensioni?

1. Generalit` a sull’ottimizzazione. Estremi liberi

c 978-88-08-63708-6

75

2. Sia X convesso, chiuso, illimitato. Sia f : X ! R strettamente convessa in X e f (x) ! +1 se |x| ! +1. Mostrare che esiste uno e un solo punto di minimo per f in X. 3. Determinare gli estremi liberi delle seguenti funzioni:

a) x2 (x

y); 2

2

b) c) d) e)

(x2 + y 2 )e (x +y ) ; cos x Sh y; sin(x + y) cos(x y); 3xey x3 e3y (il lettore osservi che la funzione presenta un solo punto critico che `e un massimo locale, ma non c’`e un massimo globale; perch´e?).

4.

Determinare estremi liberi, estremo superiore e inferiore della funzione f (x, y) = 1|(2 y x2 ) nell’insieme X = {(x, y) 2 R2 : 0 < y < 2 x2 y 2 }.

|y

5. Determinare la natura dell’origine per la funzione f (x, y) = log(1+x2 )

x2 +xy 2 +y 3 +2.

6. Determinare gli estremi di f (x, y) = x2 log(1 + y) + x2 y 2 nel suo dominio. 7. Verificare che (0, 0, 0) ` e punto critico per la funzione z = z(x, y, u) definita implicitamente dall’equazione x2 + xu2 + y 2 + exu z + y 2 ez = 0. Determinarne la natura. 8. Senza fare calcoli: considerare le funzioni

z)]2 + y 2

f1 (x, y, z) = [sin(x

xyz,

f2 (x, y, z) = [sin(x

z)]2 + y 2 + x2 z.

Verificare che (0, 0, 0) `e punto stazionario, determinare d2 fj (0, 0, 0) e d3 fj (0, 0, 0) e dedurne la natura di (0, 0, 0). 9. Determinare gli estremi di f (x, y, z) = x2 (y

1)3 (z + 2)2 e di

1 1 1 + + + xyz. x y z 10. Determinare la minima distanza intercorrente tra le due rette in R3 di equazione f (x, y, z) =

x

1=

y

2 3

=

z

2 2

e

x z =y= . 4 2

11.

a) Dimostrare la Proposizione 1.10. b) Dimostrare che se d2 f (x0 ) non `e nulla ed `e semidefinita positiva (negativa), allora x0 `e di colle o di minimo (massimo). [Suggerimento: esaminare la dimostrazione del Teorema 1.9.] 12. Siano k > 2 e x1 , . . . , xk reali positivi tutti distinti tra loro.

Dimostrare che (⇤)

k X

j=1

xj

!2

gx = 0

: L = g = 0.

Le prime due equazioni coincidono con la (2.2) mentre la terza esprime la condizione di vincolo. Ritorniamo al problema di ottimizzazione posto all’inizio del paragrafo. La teoria sviluppata indica il seguente modo di procedere, noto come metodo dei moltiplicatori di Lagrange: a) si isolano gli eventuali punti non regolari di E0 che vanno esaminati a parte; b) si cercano i punti critici condizionati di f o equivalentemente quelli liberi della lagrangiana, e cio`e le soluzioni del sistema (2.3); c) si determina la natura dei punti critici. A questo proposito, un criterio generale, basato sullo studio del segno di una forma quadratica vincolata, `e presentato nel Paragrafo 2.3. Esempio 2.2 Si vogliano determinare gli estremi della funzione f (x, y) = xy, soggetti al vincolo g(x, y) = x2 xy + y 2 1 = 0.6 Le funzioni f e g sono di classe C 1 (R2 ) ed E0 non ha punti singolari. La lagrangiana `e L(x, y, ) = xy (x2 xy + y 2 1). I punti critici sono soluzioni del seguente sistema: 8 > gx = y 2 x + y = 0

: g(x, y) = x2 xy + y 2 1 = 0

che ha come soluzioni: (1, 1, 1)( 1, 1, 1),

p1 (1, 3

p 1, 1/ 3),

p1 ( 3

p 1, 1, 1/ 3).

Dunque vi sono quattro punti critici vincolati: p0 = (1, 1), p1 = ( 1, 1), p2 = 1), p3 = p13 ( 1, 1).

p1 (1, 3

Ora, essendo E0 = {(x, y) 2 R2 : g(x, y) = 0} un compatto e f continua, il teorema di Weierstrass assicura l’esistenza massimope uno di minimo. Poich´e p punto di p p di un f (1, 1) = f ( 1, 1) = 1 e f ( 1/ 3, 1/ 3) = f (1/ 3, 1/ 3) = 1/3 si deduce che p0 e p1 sono punti di massimo globali e p2 , p3 di minimo globali.

6 Anche se in questo caso il vincolo si presta a una rappresentazione parametrica globale ` e forse pi` u semplice ricorrere al metodo dei moltiplicatori di Lagrange.

80

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Il Teorema 2.1 ha interessanti interpretazioni. Ne illustriamo due. Per la prima, di carattere geometrico, introduciamo la famiglia degli insiemi di livello di f , definiti dall’equazione f (x, y) = c, (c 2 R). Osserviamo che il vincolo E0 corrisponde all’insieme di livello zero di g. Sia ora (x0 , y0 ) punto critico condizionato e f (x0 , y0 ) = c0 il livello critico corrispondente. Essendo per ipotesi rg(x0 , y0 ) 6= 0 dalla (2.2) si deduce che: • •

se 0 = 0, allora rf (x0 , y0 ) = 0 e il punto (x0 , y0 ) `e singolare per la linea di livello critica; se invece 0 6= 0, allora la linea di livello critica `e tangente al vincolo nel punto (x0 , y0 ).

La seconda alternativa `e illustrata in Figura 2.7, in riferimento al problema dell’Esempio 2.2. Il vincolo E0 `e un’ellisse centrata nell’origine, p con assi nelle direzioni y = x e p y = x e diametri lunghi rispettivamente 2 2 e 2 2/3. Le linee di livello di f sono iperboli equilatere di equazione xy = c (due rami per ogni valore di c). I livelli c = 1 e c = 1/3, corrispondenti agli estremi condizionati, sono tangenti all’ellisse nei punti critici. y

xy = –1/3

xy = 1

–1

1 –

1

1

xy = 1 x

xy = –1/3

Figura 2.7. Illustrazione della soluzione del problema dell’Esempio 2.2.

La seconda `e un’interpretazione meccanica. Sia f il potenziale di una forza piana meccanica F = rf il cui punto di applicazione sia vincolato senza attrito a una linea di equazione g(x, y) = 0. Dalla statica sappiamo che si pu` o eliminare il vincolo pur di introdurre la reazione vincolare, rappresentata da una forza diretta normalmente al vincolo stesso e perci` o del tipo rg. L’equilibrio si raggiunge allorch´e la risultante delle forze in gioco `e nulla, ovvero quando rf rg = 0. In conclusione, le posizioni di equilibrio sono i punti critici condizionati di f su . I moltiplicatori di Lagrange non esauriscono il loro ruolo nella determinazione dei punti critici, bens`ı hanno un interessante significato, che viene illustrato nell’Esercizio 11.

c 978-88-08-63708-6

2. Estremi vincolati. Vincoli di uguaglianza

81

2.2 Il caso generale: funzioni di n variabili con m vincoli (m < n) Il problema di ottimizzazione vincolata con vincoli di uguaglianza, nel caso generale, si presenta cos`ı: dato un aperto X di Rn e date due funzioni f : X ! R e g : X ! Rm , m < n, entrambe di classe C 1 , determinare gli estremi di f , ristretta all’insieme (vincolo) E0 = {x 2 Rn : g(x) = 0}. Se g = (g1 , g2 , . . . , gm ), E0 `e l’insieme dei punti di Rn che soddisfano le m equazioni 8 g1 (x1 , x2 , . . . , xn ) = 0 > > < g2 (x1 , x2 , . . . , xn ) = 0 (2.4) .. > > :. gm (x1 , x2 , . . . , xn ) = 0.

Il caso n = 2, m = 1 `e quello trattato nel paragrafo precedente. Come gi` a nel caso pi` u semplice, la situazione pi` u favorevole `e quella in cui dal sistema (2.4) si riescono a ricavare esplicitamente m variabili in termini delle altre n m, riducendo cos`ı il problema di ottimizzazione vincolata a un problema di ottimizzazione, che pu` o ancora essere vincolata, ma in dimensione inferiore. Generalmente, si ricorre al metodo dei moltiplicatori di Lagrange, estensione di quello presentato nel paragrafo precedente. Sviluppiamo la teoria introducendo anche qui il concetto di punto critico o stazionario vincolato. o che la Sia x0 = (x01 , x02 , . . . , x0n ) 2 X un punto regolare di E0 intendendo con ci` matrice Jacobiana di g: 1 0 Dx1 g1 Dx2 g1 . . . Dxn g1 B Dx1 g2 Dx2 g2 . . . Dxn g2 C C B Dg = B . C .. .. A @ .. . . Dx1 gm Dx2 gm . . . Dxn gm

abbia caratteristica m in x0 . In altri termini i vettori rgj (x0 ), per j = 1, . . . , m, siano linearmente indipendenti. Esiste dunque un minore di ordine m, estratto da Dg(x0 ), diverso da zero; possiamo @(g1 , g2 , . . . , gm ) senz’altro supporre che tale minore sia , cio`e quello individuato dalle @(x1 , x2 , . . . , xm ) prime m colonne di Dg. In questo caso, grazie al teorema di Dini (Teorema 3.8, pag. 361, Vol. 1), il sistema (2.4) definisce x1 , . . . , xm , in funzione di xm+1 , . . . , xn in un intorno di x0 :

(2.5)

x1 = h1 (xm+1 , . . . , xn ) x2 = h2 (xm+1 , . . . , xn ) .. . xm = hm (xm+1 , . . . , xn )

in modo tale che (2.6)

x0j = hj (x0m+1 , . . . , x0n ) per ogni j = 1, . . . , m.

Si dice allora che, in un intorno di x0 , E0 `e una variet` a di dimensione n

m.

82

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Intuitivamente ci` o significa che una ipotetica particella che si muova su E0 `e dotata di n m gradi di libert` a; da un altro punto di vista, ci` o vuol dire che per individuare un punto su E0 (in un intorno di x0 ) occorre specificare n m parametri che, in questo contesto, fungono da coordinate locali. Le variet` a di dimensione n 1 si chiamano ipersuperfici in Rn ; se n = 3 esse coincidono con le ordinarie superfici (trattate nel Cap. 6). Le variet` a di dimensione 1 si chiamano curve in Rn . I casi n = 2 ed n = 3 sono stati ampiamente trattati nel Capitolo 1 del presente volume. In generale una curva in Rn `e assegnata da un vettore r(t) = (x1 (t), x2 (t) . . . , xn (t)) con t 2 I, intervallo contenuto in R. La curva si dice regolare se r 2 C 1 (I) e se il vettore r0 (t) = (x01 (t), x02 (t), . . . , x0n (t)) che chiameremo vettore tangente o vettore velocit` a, in analogia con i casi n = 2 e 3, `e diverso da 0 per ogni t 2 I. an m Il nostro scopo `e definire quando x0 `e punto critico per f ristretta alla variet` dimensionale, individuata in un intorno di x0 dal sistema (2.4), o equivalentemente dalle (2.5). Ricordiamo che sia f sia g si intendono sempre di classe C 1 (X), X aperto di Rn . Consideriamo una curva regolare in Rn di equazione r(t) = (x1 (t), . . . , xn (t)), che abbia le seguenti propriet` a: H1 ) r `e definita in un intorno I0 di t = 0 e r(0) = x0 ; H2 ) la curva `e contenuta in E0 e cio`e (2.60 )

gj (r(t)) = gj (x1 (t), . . . , xn (t)) = 0

8 j = 1, . . . , m e 8 t 2 I0 .

DEFINIZIONE 2.2 Il punto regolare x0 2 X si dice critico o stazionario per f , vincolato alla variet` a E0 , se per ogni curva regolare r = r(t) soddisfacente le condizioni H1 ) e H2 ), posto (t) = f (r(t)), si ha 0 (0) = 0. L’interpretazione geometrica della definizione di punto critico si trova nell’Osservazione 2.2. Il seguente teorema `e immediato. TEOREMA 2.3 Se x0 2 X `e punto di estremo per f , vincolato alla variet` a E0 , ed `e punto regolare per E0 , allora x0 `e punto critico vincolato (a E0 ). Dimostrazione. Se x0 `e di massimo (minimo) vincolato e r = r(t) `e una curva soddisfacente le condizioni H1 ) e H2 ), allora (t) = f (r(t)) ha un massimo (minimo) libero in t = 0 e ⇤ perci` o 0 (0) = 0.

Il metodo dei moltiplicatori di Lagrange `e basato sulla seguente caratterizzazione dei punti critici (generalizzazione del Teorema 2.1), di cui omettiamo la dimostrazione.

2. Estremi vincolati. Vincoli di uguaglianza

c 978-88-08-63708-6

83

TEOREMA 2.4 Sia x0 2 X un punto regolare per E0 . Allora x0 `e punto critico vincolato (a E0 ) per f se e solo se esistono m numeri reali 01 , 02 , . . . , 0m , detti moltiplicatori di Lagrange, tali che: (2.7)

rf (x0 ) =

m X j=1

0 0 j rgj (x ).

Si noti che la (2.7) equivale a n equazioni scalari. OSSERVAZIONE 2.2 Le direzioni corrispondenti ai vettori v 2 Rn tali che hrgj (x0 ), vi = 0

8 j = 1, . . . , m

si dicono direzioni tangenziali ai vincoli. Si dimostra che, nelle ipotesi del teorema, per ogni vettore v tangenziale esiste una curva regolare r(t) soddisfacente le condizioni H1 ) e H2 ) e tali che r0 (0) = v. Si vede allora che un punto regolare x0 2 X `e stazionario se e solo se la derivata di f lungo ogni direzione tangenziale ai vincoli `e nulla. OSSERVAZIONE 2.3 Introducendo la funzione lagrangiana, definita dalla formula L(x, ) = L(x1 , . . . , xn ,

1, . . . ,

m)

:= f (x)

m X

j gj (x),

j=1

il Teorema 2.4 a↵erma che, se x0 `e regolare, allora `e critico condizionato se e solo se esiste 0 = ( 01 , . . . , 0m ) tale che (x0 , 0 ) 2 Rn ⇥ Rm sia punto critico libero per L. Infatti i punti critici liberi per L sono soluzioni del seguente sistema di n + m equazioni in n + m incognite: 8 m P > > Dx1 L = Dx1 f > j Dx1 gj = 0 > > j=1 > > m > P > > Dx2 L = Dx2 f > j Dx2 gj = 0 > > j=1 > > > > >... > > < m P (2.8) Dxn L = Dxn f j Dxn gj = 0 > > j=1 > > > > D 1 L = g1 = 0 > > > > > g2 = 0 D > 2L = > > > . > .. > > > > :D L = g = 0. m m Le prime n equazioni equivalgono alla (2.7); le ultime sono le condizioni di vincolo.

Per risolvere un problema di ottimizzazione vincolata con il metodo dei moltiplicatori di Lagrange, dopo aver isolato i punti singolari, si determinano i punti critici, risolvendo il sistema (2.8). In generale si cerca poi di stabilire la natura di detti punti mediante considerazioni legate al problema specifico, oppure ricorrendo al criterio sufficiente presentato nel paragrafo successivo.

84

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Esempio 2.3 Applichiamo il metodo dei moltiplicatori di Lagrange al problema dell’Esempio 1.2. L’obiettivo da massimizzare `e V (x, y, z) = xyz, nell’ottante positivo di R3 , sotto la condizione (2.9)

g(x, y, z) = xy + xz + yz

A=0

(A > 0).

Poich´e rg = (y + z, x + z, z + y) si annulla solo in (0, 0, 0), sulla superficie (2.9) non vi sono punti singolari. Cerchiamo i punti critici. Il sistema (2.8) `e assegnato dalle equazioni Vx Vy Vz

gx = yz gy = xz gz = xy

(y + z) = 0 (x + z) = 0 (x + y) = 0

p alle qualipva aggiunta la (2.9). Facilmente si trova l’unico punto x = y = z = A/2 con = A/8. p p p Si tratta ora di stabilire la natura del punto critico ( A/2, A/2, A/2). Consideriamo V definita per x 0, y 0, z 0; ci` o non influisce sulla conclusione in quanto V = 0 sui piani coordinati. Si noti che l’esistenza del massimo non si pu` o inferire direttamente dal teorema di Weierstrass, essendo la superficie (2.9) illimitata. Facciamo vedere che, tuttavia, ci si pu` o restringere all’interno di una sfera di raggio opportunamente grande. Osserviamo infatti che, se un punto (x, y, z) appartiene alla superficie (2.9) e x2 +y 2 +z 2 > 3R2 , allora almeno una delle variabili x, y, z `e maggiore di R. Sia per esempio x > R. Dalla (2.9) stessa si deduce poi che xy  A e xz  A A 2 2 2 2 e sulla e perci` oy A x e z  x . Dunque, se x + y + z > 3R e il punto (x, y, z) ` superficie, per il volume V abbiamo: A2 A2 AA = < . x x x R p p p Ne segue che, per R abbastanza grande, V (x, y, z) < V ( A/2, A/2, A/2) = (A/2)3/2 . D’altra parte, nell’intersezione della sfera x2 + y 2 + z 2  3R2 con l’ottante e il vincolo (2.9), V deve ammettere massimo (per il teorema di Weierstrass). Per quanto abbiamo visto, i punti di massimo, se R `e grande, devono essere interni alla sfera ed essere critici condizionati. Essendoci uno solo di tali punti, si deduce che esso `e il punto cercato. In conclusione, tra tutti i parallelepipedi di assegnata superficie totale il cubo `e quello che ha volume massimo. V (x, y, z) = xyz  x

Esempio 2.4 Sia A = (aij ) una matrice simmetrica di ordine 3 definita positiva. L’equazione (2.10)

hAx, xi =

3 X

i,j=1

aij xi xj = 1

(x = (x1 , x2 , x3 ))

2. Estremi vincolati. Vincoli di uguaglianza

c 978-88-08-63708-6

85

definisce un ellissoide con centro nell’origine. Vogliamo determinare gli estremi di f (x) = |x|2 = x21 + x22 + x23 sull’ellissoide. Osserviamo che non vi sono punti singolari; infatti: Dxj hAx, xi = 2

3 X

aij xi

e perci` o rhAx, xi = 2Ax,

i=1

che, essendo det A > 0, si annulla solo per x = 0, punto non appartenente all’ellissoide. Essendo poi f continua e la superficie compatta, esistono massimo e minimo globali, che devono essere punti critici condizionati. La lagrangiana del problema `e L(x, ) = |x|2

(hAx, xi

1)

e il sistema (2.8) consiste delle 3 equazioni (2.11)

Dxj L = 2xj

2

3 X

aij xi = 0

j = 1, 2, 3

i=1

pi` u il vincolo D L = hAx, xi

1 = 0.

Le (2.11) si possono scrivere nella forma compatta (2.110 )

Ax = x.

Se ora = 0, la (2.110 ) implica x = 0 che non verifica il vincolo. Se scritta nella forma 1 Ax = x,

6= 0 la (2.110 ),

indica che i punti critici sono gli autovettori di A che soddisfano la condizione hAx, xi = 1 e i moltiplicatori sono i reciproci degli autovalori corrispondenti. Studiamo la natura dei punti critici. Siano 0 < µ1  µ2  µ3 i reciproci degli autovalori di A e w1 , w2 , w3 tre rispettivi autovettori, soddisfacenti il vincolo. Dalla (2.110 ) si ha: Awj =

1 j w µj

per ogni j = 1, 2, 3.

Moltiplicando scalarmente per wj si trova 1 = hAwj , wj i =

1 j2 |w | µj

ovvero f (wj ) = |wj |2 = µj

(j = 1, 2, 3).

86

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Si pu` o trarre allora la seguente conclusione: Il massimo di f `e µ3 , moltiplicatore massimo; il minimo `e µ1 , moltiplicatore p minimo. Essendo f il quadrato della distanza dall’origine, ricaviamo che µ3 p e µ1 sono rispettivamente le lunghezze dei semiassi maggiore e minore dell’ellissoide. Il moltiplicatore intermedio µ2 corrisponde a un punto di sella: partendo da w2 e muovendosi sull’ellissoide verso w1 , f diminuisce, mentre muovendosi verso w3 , f aumenta; la sua radice quadrata `e la lunghezza del semiasse intermedio. o essere comunque caratterizzato come estremo vincolato di un Anche µ2 pu` opportuno problema, come mostrato nell’Esercizio 7. Nel caso n = 2 ed m = 1 o m = 2, il metodo dei moltiplicatori di Lagrange, e in particolare la (2.7), `e suscettibile di interpretazione geometrica e meccanica analoghe a quelle del paragrafo precedente. Lasciamo al lettore l’onere di tale estensione. *2.3

Condizioni sufficienti

Il riconoscimento della natura di un punto critico libero `e basato sullo studio del segno del di↵erenziale secondo della funzione obiettivo come forma quadratica negli incrementi delle variabili. Nel caso di punti critici condizionati `e possibile procedere in modo analogo facendo intervenire il di↵erenziale secondo (rispetto a x) della lagrangiana, ristretto per` o a incrementi tangenziali ai vincoli. Analizziamo il caso di un solo vincolo (m = 1). Sia x0 2 Rn un punto critico per f condizionato al vincolo g(x) = 0 e sia 0 il corrispondente moltiplicatore di Lagrange. Vale il seguente risultato: TEOREMA 2.5 Siano f, g : X ! R, X aperto di Rn , di classe C 2 . Se la forma quadratica (2.12)

n X

[fxi xj (x0 )

i,j=1

0

gxi xj (x0 )]hi hj = h[Hf (x0 )

0

Hg (x0 )]h, hi,

ristretta all’insieme dei vettori h 2 Rn tangenziali al vincolo in x0 , (cio`e hrg(x0 ), hi = 0), `e definita negativa (positiva), allora x0 `e punto di massimo (minimo) locale forte vincolato. Posticipiamo la dimostrazione, per presentare un criterio di riconoscimento del segno di una f.q. soggetta a vincolo lineare. Vale il seguente lemma algebrico di cui omettiamo la dimostrazione. LEMMA 2.6 Sia q(h) = hAh, hi una forma quadratica in Rn e sia b 2 Rn , b = (b1 , b2 , . . . , bn ), b1 6= 0. Allora la f.q. q(h), soggetta al vincolo lineare hb, hi = 0, `e definita positiva se sono negativi tutti i minori principali di nord-ovest, di ordine

2. Estremi vincolati. Vincoli di uguaglianza

c 978-88-08-63708-6

87

maggiore di 2, della seguente matrice 1 0 0 b1 . . . bn C B b1 C B (2.13) C. B .. A @. A bn

` definita negativa se i suddetti minori si susseguono a segni alterni a partire dal E primo (di ordine 3) positivo.

0 Hg (x0 ) e b = rg(x0 ); poich´e Il lemma si applica nel nostro caso con A = Hf (x0 ) 0 0 o sempre supporre che Dx1 g(x ) 6= 0. rg(x ) 6= 0, si pu`

Esempio 2.5 Riprendiamo ilpproblema 2.3. Verifichiamo tramite il Lemp dell’Esempio p A/2, A/2, A/2) ` e di massimo (locale!). In questo ma 2.6 che il punto critico ( p 0 caso si ha = A/8 gxx = Vyy gyy = Vzz Vxx Vxy gxy = z Vxz gxz = y Vyz gyz = x rg = (y + z, x + z, z + y).

gzz = 0;

Dunque la matrice (2.13) `e 0 1 p p p 1 0 0 1 1 1 2A 2A 2A 0 p p p p B1 0 1 1 C B 2A A/8 pA/8C C C = 2A B Bp p0 B 1 2 21 C . A @ 2A A/8 0 A/8 @ A 1 0 2 2 p p p 1 1 2A A/8 A/8 0 1 2 2 0

Poich´e il determinante di questa matrice `e negativo e il suo minore principale di nord-overst di ordine 3 `e positivo, si ottiene la conclusione desiderata. Dimostrazione del Teorema 2.5. Essendo x0 punto regolare, l’equazione g(x1 , x2 , . . . , xn ) = 0 definisce, per esempio, x1 = '(x2 , . . . , xn ), in un intorno circolare B (x0 ). Sia ora x1 2 B (x0 )\E0 e assumiamo che la (2.12) sia definita positiva. Vogliamo mostrare che, se `e sufficientemente piccolo, f (x0 ) < f (x1 ). Costruiamo una curva regolare r = r(t) = (x1 (t), . . . , xn (t)), t 2 [ 1, 1], tale che: r(0) = x0 , r(1) = x1 ; r(t) 2 B (x0 ) e g(r(t)) = 0, 8 t 2 [ 1, 1]. ` sufficiente porre: E xj (t) = x0j + t(x1j

x0j )

per j = 2, . . . , n

e x1 (t) = '(x2 (t), . . . , xn (t)).

88

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Osserviamo che r0 (0) `e tangenziale al vincolo in x0 ; inoltre si ha: x0j (t) = (x1j

x0j )

e

n X

x01 (t) =

per j = 2, . . . , n

'xj (. . .)(x1j

x0j ).

j=2

Pertanto, ponendo M1 = max |r'|2 , si ha |x01 (t)|2  M1 |r0 (t)|2  (1 + M1 )

(2.14)

n X

(x1j

j=2

n P

(x1j

x0j )2 da cui

j=2

x0j )2  (1 + M1 )|r0 (0)|2 .

Analogamente si trova |r0 (t)

(2.15)

r0 (0)| = |x01 (t)

x01 (0)| 

r'(x02 , . . . , x0n )| · |r0 (0)|.

 |r'(x2 (t), . . . , xn (t))

Poniamo ora (t) = f (r(t)). Essendo x0 punto critico vincolato, si ha Usando la formula di Mac Laurin, possiamo scrivere f (x1 )

(2.16)

f (x0 ) = (1)

(0) =

dove t `e un opportuno punto di [0, 1]. Essendo g(r(t)) = 0, 8 t 2 [ 1, 1], si ha (t) = f (r(t)) 0 00

(t) = hrf (r(t)), r0 (t)i

0

00

0

(0) = 0.

(t)

g((r(t)) e perci` o

hrg(r(t), r0 (t)i

(t) = hHf (r(t))r0 (t), r0 (t)i + hrf (r(t)), r00 (t)i 0

1 2

0

0

hHg (r(t))r0 (t), r0 (t)i

hrg(r(t)), r00 (t)i =

= h[Hf (r(t))

0

Poniamo A(t) = Hf (r(t))

0

Hg (r(t))]r0 (t), r(t)i + hrf (r(t))

rg(r(t)), r00 (t)i.

Hg (r(t)). Per ipotesi, sappiamo che esiste c > 0 tale che hA(0)r0 (0), r0 (0)i

(2.17)

0

c|r0 (0)|2 .

Osserviamo che, fissato " > 0, se `e abbastanza piccolo si ha |aij (t) i, j = 1, . . . , n, e, essendo ' di classe C 1 , per la (2.15) |r0 (t)

(2.18)

aij (0)|  " per ogni

r0 (0)|  "|r0 (0)|.

Si ha: hA(t)r0 (t), r0 (t)i = h(A(t)

A(0))r0 (t), r0 (t)i + hA(0)(r0 (t)

+ hA(0)r0 (0), r0 (t) Pertanto, se

r0 (0)), r0 (t)i+

r0 (0)i + hA(0)r0 (0), r0 (0)i.

`e sufficientemente piccolo, abbiamo, usando (2.14), (2.15) e (2.18) hA(t)r0 (t), r0 (t)i

n2 "(1 + M1 )|r0 (0)|2

2a"|r0 (0)|2 + c|r0 (0)|2

2. Estremi vincolati. Vincoli di uguaglianza

c 978-88-08-63708-6

dove a = n2

max

i,j=1,...,n

|aij (0)|. Se " 

89

1 si trova 2n2 ["(1 + M1 ) + 2a]

hA(t)r0 (t), r0 (t)i

c 0 |r (0)|2 . 2

D’altra parte, essendo r00 (t) = (x001 (t), 0, . . . , 0) e x001 (t) =

n X

'xi xj (. . .)x0i (t)x0j (t),

i,j=2

si ha: |r00 (t)|  nM2 |r0 (0)|2 , dove M2 = Siccome poi rf (x0 )

0

max

i,j=1,...,n

|'xi xj |.

rg(x0 ) = 0, diminuendo eventualmente 0

|rf (r(t))

c 4nM2

rg(r(t))| 

e quindi |hrf (r(t))

0

si ha:

rg(r(t)), r00 (t)i| 

c 0 |r (0)|2 . 4

Finalmente: 00

(t)

hA(t)r0 (t), r0 (t)i c 0 |r (0)|2 2

0

|hrf (r(t))

c 0 c |r (0)|2 = |r0 (0)|2 . 4 4

rg(r(t)), r00 (t)i|

Ponendo t = t e sostituendo nella (2.16) si ottiene f (x1 ) > f (x0 ). La dimostrazione nel caso in cui la (2.12) sia definita negativa `e analoga.



Esercizi 1. Siano f (x, y) = x e g(x, y) = y 2 x3 . Mostrare che (0, 0) ` e di minimo per f , vincolato a g(x, y) = 0 ma che non `e critico per f e pertanto non vale la (2.2). Quale rilevanza ha questo esempio per il Teorema 2.1? 2. Trovare gli estremi vincolati di f (x1 , x2 , . . . , xn ) =

n P

xj log xj sotto la condizione

j=1 n P

xj = 1 (Esercizio 7, pag. 292, Vol. 1).

j=1

3. Determinare massimi e minini di f (x, y) = y(x2 + log(1 + x + y)) in

X=



(x, y) 2 R2 : 1

4. Siano

f (x, y) =

(

(x2 1

y 2 )(4

xy

x2

3

y2 )

x 3

1

, y

0 .

x2 + y 2 = 6 4 2 2 x +y =4

e Da = {(x, y) 2 R2 : 0  x  a,

0y

p 2}

dove a 2 (0,

p 2).

90

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Calcolare massimi e minimi di f in Da . Determinare poi estremo superiore e inferiore di f in Dp2 . 5. Determinare i punti della superficie z 2

xy = 1 pi` u vicini all’origine.

6. Determinare gli estremi di f (x, y, z) = (x + y + z)2 sotto la condizione x2 + 2y 2 + 3z 2 = 1.

Con riferimento all’Esempio 2.4, dimostrare che il moltiplicatore intermedio µ2 `e il massimo di f (x) = |x|2 sotto le condizioni

7.

hx, w1 i = 0

hAx, xi = 1 ed `e il minimo di f (x) sotto le condizioni

hx, w2 i = 0.

hAx, xi = 1

Interpretare geometricamente le due a↵ermazioni. 8. Generalizzazione dell’Esempio 2.4. Sia A = (aij ) una matrice di ordine n, simmetrica e

definita positiva. a) Studiare i punti critici di f (x) = |x|2 sotto la condizione (⇤)

hAx, xi =

n X

aij xi xj = 1.

i,j=1

Mostrare, in particolare, che, se 0 < µ1  µ2  . . .  µn sono i reciproci degli autovalori di A, µ1 e µn sono, rispettivamente, minimo e massimo vincolato (globali), mentre µ2 , . . . , µn 1 sono selle. b)⇤ Siano w1, w2 , . . . , wn autovettori corrispondenti a µ1, . . . ,µn e soddisfacenti il vincolo (⇤). Si fissi j tra 1 ed n. Mostrare che µj `e massimo di |x|2 sotto le condizioni hAx, xi = 1 hx, wk i = 0

per ogni k = 1, . . . j

1

e minimo di |x|2 sotto le condizioni hAx, xi = 1

hx, wk i = 0

per ogni k = j + 1, . . . , n.

9. Sia f (x1 , . . . , xn ) = x1 + x2 + . . . + xn ,

n

2, xj

0, per j = 1, . . . , n.

a) Determinare il minimo di f sotto la condizione x1 x2 . . . xn = 1. b) Dedurre la seguente disuguaglianza tra media geometrica e media aritmetica: p a1 + a2 + . . . + an n a1 a2 . . . an  n dove aj

0 per ogni j = 1, . . . , n; (formula (3.14), pag. 91, Vol. 1).

10. Sia f (x1 , . . . , xn ) =

1 1 + ... + ,n x1 xn

2, xj > 0 per j = 1, . . . , n.

3. Vincoli di disuguaglianza

c 978-88-08-63708-6

91

a) Determinare il minimo di f sotto la condizione x1 x2 . . . xn = 1. b) Dedurre la seguente disuguaglianza tra media armonica e media geometrica: p n  n a1 a2 . . . an dove aj > 0 per ogni j = 1, . . . , n. 1 1 + ... + a1 an 11. Significato dei moltiplicatori di Lagrange. Siano f, g di classe C 2 (X), X aperto di R2 e

t un parametro reale. Sia inoltre (x0 , y0 ) un punto critico per f , condizionato al vincolo g(x, y) = t0 , con moltiplicatore 0 . a) Dimostrare che, se L(x, y, ) = f (x, y) (g(x, y) (x0 , y0 , 0 ), il sistema 8 > gx = 0

: g=t

t) ha hessiana non singolare in

definisce in un intorno di t = t0 una famiglia di soluzioni (x(t), y(t), (t)). b) Posto '(t) = f (x(t), y(t)) = valore di f nel punto critico (x(t), y(t)), dimostrare che (t) = '0 (t). ( (t) misura la sensibilit` a del valore critico '(t) rispetto a variazioni di livello di g). [Suggerimento: a) applicare il teorema di Dini. b) Calcolare '0 (t) col teorema di derivazione delle funzioni composte. Usare le prime due equazioni del sistema (⇤⇤) e la seguente gx (x(t), y(t))x0 (t) + gy (x(t), y(t))y 0 (t) = 1, che si ottiene per derivazione dalla terza.]

3.

VINCOLI DI DISUGUAGLIANZA

3.1 Generalit` a sui problemi di programmazione I problemi di estremo condizionato che si possono risolvere mediante la teoria svolta nella Sezione 2 sono caratterizzati dall’avere i vincoli espressi in forma di uguaglianza. Questa limitazione appare piuttosto rigida dal punto di vista delle applicazioni. Per esempio, nell’analisi economica ci si imbatte frequentemente nel problema di ottimizzare una funzione f (x) quando la variabile x `e soggetta a uno o pi` u vincoli del tipo 0, '(x)  0, oltre alla condizione di non-negativit` a delle sue componenti, cio`e xj ` questo un tipico problema di programmazione matematica. j = 1, 2, . . . , n. E Usando la teoria sviluppata finora un problema come quello ora formalizzato ci obbligherebbe a un procedimento abbastanza lungo: a) la ricerca degli estremi (liberi) di f nell’interno della regione individuata dai vincoli e dove f `e di↵erenziabile; b) la ricerca degli estremi di f sulla frontiera di tale regione; c) la considerazione dei punti in cui f non `e di↵erenziabile. Esempio 3.1 Determinare gli estremi di f (x, y) = (x + y)|x2

y|

92

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

nella regione ammissibile (Fig. 2.8): E = {(x, y) 2 R2 : x + y

2  0, x

1  0, x

0, y

0}.

y 2

y=2–x

E1 y = x2 E2 1

x

Figura 2.8. Regione ammissibile E nell’Esempio 3.1.

Il teorema di Weierstrass assicura che esistono massimo e minimo globali. Si verifica facilmente che f non ha punti critici interni a E1 ed E2 . Sulla parabola y = x2 , f non `e di↵erenziabile e assume il valore 0 che `e minimo globale in quanto f 0 in E. La frontiera di E `e composta da quattro segmenti di retta: • • • •

su x = 1, 0  y  1 si ha: f (1, y) = 1 y 2 ; su y = 0, 0  x  1 si ha: f (x, 1) = x3 ; su x = 0, 0  y  2 si ha: f (0, y) = y 2 ; e infine su y = 2 x, 0  x  1, si ha: f (x, 2

x) = 2(2

x

x2 ).

` facile allora trarre le seguenti conclusioni: E

I punti sulla parabola y = x2 , 0  x  1, sono tutti punti di minimo globale, in corrispondenza ai quali f = 0. Il punto (0, 2) `e di massimo globale con f (0, 2) = 4 mentre il punto (1, 0), dove f = 1, `e di massimo relativo, essendo di massimo globale in E2 . Se la funzione obiettivo ha un’espressione analitica abbastanza semplice si pu` o ricorrere a considerazioni grafiche. Esempio 3.2 Metodo delle curve di livello. Determinare gli estremi di f (x, y) = x+y nella regione E = {(x, y) : x2 + y 2 1  0, x 0, y 0}. Come si vede dalla Figura 2.9, per individuare i punti di estremo `e sufficiente determinare la linea di massimo e di minimo livello che interseca la p regione E. In questo p caso (0, 0) `e punto di minimo con f (0, 0) p = 0 mentre (1/ 2, 1/ 2), punto di tangenza della circonferenza con la retta x + y = 2, `e il punto di massimo. I metodi indicati negli Esempi 3.1 e 3.2 risultano laboriosi o legati a situazioni troppo particolari. Occorrono metodi agevoli e adattabili a casi di sufficiente generalit` a.

3. Vincoli di disuguaglianza

c 978-88-08-63708-6

93

c crescenti

y

2 2

2 2

E

1

x

f = 0 f= c1 f = c2 f= c3 Figura 2.9. Linee di livello di f .

Il problema di cui ci occuperemo principalmente ha la formulazione seguente: Siano f, '1 , '2 , . . . , 'm : Rn ! R, funzioni di↵erenziabili. (P): Massimizzare f ristretta alla regione

E = {x 2 Rn ; 'j (x)  0, j = 1, . . . , m}; E viene detta regione ammissibile. Tale formalizzazione richiede alcune precisazioni e commenti: a) non c’`e alcuna relazione tra il numero delle variabili n, e il numero dei vincoli m. Naturalmente supporremo sempre che E 6= ?; b) abbiamo assunto la di↵erenziabilit` a della funzione obiettivo e delle funzioni 'i in a di trattazione, avendo come scopo quello di presentare le tutto Rn per semplicit` idee principali della programmazione; c) tutti i risultati che esporremo si estendono facilmente al problema della minimizzazione di f in E in quanto min f = max( f ). Gli estremi si intendono globali, E

E

rispetto alla regione E. 0 `e del tutto convenzionale d) Scrivere i vincoli nella forma 'j  0 anzich´e 'j ` ovvio che ogni vincolo pu` e generale. E o essere espresso nella forma 'j  0. In questo caso osserviamo che se 'j (x0 ) = 0 e r'j (x0 ) 6= 0, r'j (x0 ) `e normale all’insieme di livello {x 2 Rn : 'j (x) = 0} e diretto verso l’esterno della regione Ej = {x 2 Rn , 'j (x)  0} (Fig. 2.10). Si osservi che E = \m j=1 Ej . Il nostro primo obiettivo `e, come al solito, cercare condizioni necessarie affinch´e un punto x0 sia soluzione di (P). Come vedremo, si tratta di condizioni che generalizzano il metodo dei moltiplicatori di Lagrange e si basano, in ultima analisi, sulla linearizzazione delle funzioni f e 'j in un intorno di x0 . I Teoremi 2.1 e 2.4 richiedono che x0 sia punto regolare o, geometricamente, che la regione E ammissibile sia una variet` a di dimensione n m in un intorno di x0 . Le condizioni di regolarit` a in programmazione fanno intervenire il cono delle direzioni ammissibili uscenti da x0 .

94

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

Ñjj (x0)

x0 jj ≤ 0

Figura 2.10. r'j (x0 ) ` e una normale esterna per l’insieme Ej = {x 2 Rn : 'j (x)  0}.

Pi` u che di regolarit` a del punto x0 si parla di qualificazione dei vincoli nel punto x0 . A questo argomento `e dedicato il prossimo paragrafo. 3.2

Direzioni ammissibili e qualificazione dei vincoli

Per ogni x 2 E, indichiamo con J(x) l’insieme degli indici j 2 {1, 2, . . . , m} tali che 'j (x) = 0. I vincoli corrispondenti si chiamano attivi in x.

j3 = 0 x2

x2 E j2 = 0

j1 = 0 E

j2 = 0

x

j2 = 0

j1 = 0

E

G(x)

h0

j1 = 0

x G(x)

0

x1

0

a) Figura 2.11. a) Il cono (x) delle direzioni ammissibili ` e convesso. b) parte ombreggiata, (x) contiene anche la semiretta th0 , t 2 R+ .

x1 b) (x) non ` e convesso: oltre alla

Introduciamo ora la seguente definizione: DEFINIZIONE 3.1 Sia x 2 E. Un vettore h 2 Rn costituisce una direzione ammissibile a: per per E in x se esiste una successione di punti {xk } ⇢ E con le seguenti propriet` k ! +1 i) xk ! x e xk 6= x definitivamente; xk x h ii) k ! . |x x| |h|

3. Vincoli di disuguaglianza

c 978-88-08-63708-6

95

Se indichiamo con (E, x) o con (x), se E `e fissato, l’insieme di tutte le direzioni ammissibili per E in x, vale la seguente proposizione: PROPOSIZIONE 3.1 (x) `e un cono chiuso, non vuoto. Dimostrazione. Evidentemente 0 2 (x), dunque (x) 6= ?. Inoltre se h 2 (x) anche th 2 (x) per ogni t 2 R+ ; infatti `e sufficiente scegliere per th la stessa successione {xk } che va bene per h; quindi (x) `e un cono. La dimostrazione che (x) `e chiuso `e suggerita ⇤ nell’Esercizio 3.

In virt` u della Proposizione 3.1, (x) si chiama cono delle direzioni ammissibili o cono tangente in x. ` facile verificare (farlo per esercizio) che (x) contiene l’insieme dei vettori h 2 Rn E tali che esiste una curva regolare r(t), definita per t 2 [0, ], > 0, con le seguenti propriet` a: r(0) = x, r0 (0) = h e r(t) 2 E, 8 t 2 [0, ]. Le direzioni ammissibili sono sostanzialmente quelle che puntano verso l’interno di E oppure sono tangenziali a E. Abbiamo osservato che se 'j (x) = 0, r'j (x) `e nullo oppure `e diretto verso l’esterno di Ej . Cos`ı, se h 2 Rn `e tale che hr'j (x), hi > 0, anche h sar` a diretto verso l’esterno di Ej . ` perci` E o naturale chiedersi che relazione esista tra (x) e il cono e (x) dei vettori h 2 Rn tali che hr'j (x), hi  0 per ogni j 2 J(x), che si chiama cono tangente linearizzato in x. PROPOSIZIONE 3.2 Vale la seguente inclusione: (x) ✓ e (x). Dimostrazione. Siano h 2 (x) e {xk } come nella Definizione 3.1. Ora, ogni 'j `e di↵erenziabile; inoltre essendo xk 2 E si ha 'j (xk )  0 ed essendo j 2 J(x), si ha 'j (x) = 0; perci` o (3.1)

0

'j (xk ) = hr'j (x), xk

xi + o(|xk

x|).

Dividendo la (3.1) per |xk x|, passando al limite per k ! 1 e ricordando la ii) della Definizione 3.1 si ottiene hr'j (x), hi  0; dunque h 2 e (x). ⇤

Si noti che e (x) `e sempre convesso. Questo indica che in Figura 2.11b) (x) ⇢ e (x). Un altro esempio `e il seguente:

Esempio 3.3 Siano '1 (x1 , x2 ) = x2 + (x1 1)3 , '2 (x1 , x2 ) = x2 . La regione ammissibile E `e mostrata in Figura 2.12. (1, 0) coincide con la semiretta t(1, 0), t 0. Essendo r'1 (1, 0) = (0, 1) e r'2 (1, 0) = (0, 1) si ha e (1, 0) = {(h1 , h2 ) 2 R2 ;

h1  0 e

h2  0}

e cio`e e (1, 0) coincide con la retta t(1, 0), t 2 R, ossia l’asse x1 .

96

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

x2

ϕ1= 0 E

0 Figura 2.12.

ϕ2= 0

1

x1

(1, 0) ` e l’insieme dei vettori h = (h1 , 0), h1  0.

DEFINIZIONE 3.2 Si dice che i vincoli sono qualificati in x0 2 E se (x0 ) = e (x0 ).

(3.2)

I seguenti tre lemmi illustrano condizioni sufficienti affinch´e m vincoli siano qualificati in un punto. LEMMA 3.3 Se esiste h⇤ 2 Rn tale che, per ogni j 2 J(x0 ), hr'j (x0 ), h⇤ i < 0

(⇤)7 oppure allora vale (3.2) in x0 .

'j `e affine8 e hr'j (x0 ), h⇤ i  0,

Dimostrazione. Occorre mostrare che e (x0 ) ✓ (x0 ). Sia h 2 e (x0 ). Facciamo vedere che per ogni > 0, h + h⇤ 2 (x0 ). Sia {"k } una successione di reali tale che "k # 0; poniamo k 0 h+ h⇤ xk = x0 + "k (h + h⇤ ). Allora xk ! x0 e |xxk xx0 | = |h+ . h⇤ | La Definizione 3.1 richiede ancora di mostrare che xk 2 E, definitivamente per k ! +1. a delle funzioni 'j si ha: Sia j 2 J(x0 ) e hr'j (x0 ), h⇤ i < 0. Allora, per la di↵erenziabilit` 'j (xk ) = 'j (x0 ) + hr'j (x0 ), xk 0



x0 i + o(|xk

x0 |) =

= "k hr'j (x ), h + h i + o("k ). 0



Poich´e hr'j (x ), h + h i = hr'j (x0 ), hi + hr'j (x0 ), h⇤ i < 0, si ottiene che per k grande, 'j (xk ) < 0. Se j 2 J(x0 ), 'j `e affine e hr'j (x0 ), h⇤ i  0 si ha: 'j (xk ) = "k hr'j (x0 ), h + h⇤ i  0 per ogni k.

a 'j (xk ) < 0 se k `e abbastanza grande. Se infine j 62 J(x0 ), allora 'j (x0 ) < 0 e, per continuit` k o h + h⇤ 2 (x0 ). In conclusione x 2 E definitivamente e perci` ⇤ Poich´e lim (h + h⇤ ) = h e (x0 ) `e chiuso, segue che h 2 (x0 ). !0+

7 La

(⇤) ` e talvolta citata come condizione di Mangarasian-Fromowitz. ` e affine se 'j ` e un polinomio di 1 grado in x1 , . . . , xn .

8 ' (x) j

3. Vincoli di disuguaglianza

c 978-88-08-63708-6

97

LEMMA 3.4 Se per ogni j 2 J(x0 ) esiste x tale che o oppure allora vale (3.2) in x0 . Dimostrazione. Il vettore h⇤ = x j 2 J(x0 ): o

0 > 'j (x)

oppure

0

'j (x) < 0 'j (x)  0

e 'j `e convessa e 'j `e affine

x0 soddisfa le condizioni del Lemma 3.3. Infatti, se hr'j (x0 ), h⇤ i

'j (x) = hr'j (x0 ), h⇤ i

(per la convessit` a di 'j ) ⇤

(poich´e 'j `e affine)

Dal Lemma 3.4 si deduce che se tutti i vincoli sono affini, essi sono qualificati in ogni punto. Si noti inoltre che, se ogni 'j `e convessa, anche E risulta un insieme convesso in Rn . LEMMA 3.5 Se i vettori r'j (x0 ) per j 2 J(x0 ) sono linearmente indipendenti, allora vale (3.2) in x0 . Dimostrazione. Possiamo supporre che J(x0 ) = {1, 2, . . . , p}, p  n. Poniamo ' = ('1 , . . . , 'p ) '(x0 )h = b `e certamente risolubile essendo e b = ( 1, 1, . . . , 1) 2 Rp . Il sistema lineare D' 0 ⇤ '(x ). Se h `e una soluzione, essa soddisfa le condizioni del Lemma 3.3, poich´e p il rango di D' ⇤ la j-esima equazione del sistema `e hr'j (x0 ), hi = 1.

3.3 Il teorema di Karush-Kuhn-Tucker Il seguente risultato `e fondamentale in programmazione. TEOREMA 3.6 (di Karush-Kuhn-Tucker) Sia x0 soluzione di (P). Se i vincoli sono qualificati in x0 , allora, per ogni j 2 J(x0 ), esiste X 0 0 (3.3) rf (x0 ) = j r'j (x ).

0 j

0 tale che

j2J(x0 )

Alla dimostrazione del teorema premettiamo alcuni commenti ed esempi. OSSERVAZIONE 3.1 La (3.3) fa intervenire solo i vincoli attivi in x0 . Per la pratica del u conveniente introdurre la lagrangiana calcolo, poich´e x0 non `e conosciuto a priori, `e pi` (3.4)

m X

L(x, ) := f (x)

j 'j (x),

j=1

nella quale intervengono tutti i vincoli, e osservare che la condizione necessaria del teorema equivale a richiedere che x0 e 0 siano soluzione del seguente sistema: a) b)

(3.5)

@L @f = @xk @xk @L = @ j

'j

m X

j

j=1

0

@'j =0 @xk

k = 1, . . . , n j = 1, . . . , m

e inoltre c)

j

0,

j 'j (x)

=0

j = 1, . . . , m.

98

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

Si noti che se j 2 / J(x0 ) le (3.5c) implicano realt` a solo i vincoli attivi.

j

c 978-88-08-63708-6

= 0 per cui nella (3.5a) compaiono in

Le (3.5) sono dette condizioni di Karush-Kuhn-Tucker. 1)3 + x2 + 1 nella regione

Esempio 3.4 Si voglia minimizzare g(x1 , x2 ) = (x1 E = {(x1 , x2 ) 2 R2 : x1 Usando la relazione min g =

0}.

max( g), questo problema rientra nella nostra formu-

E

lazione ponendo

0 x2

E

1)3 ,

f (x1 , x2 ) = g(x1 , x2 ) = 1 x2 (x1 '1 (x1 , x2 ) = x1 , '2 (x1 , x2 ) = x2 . I vincoli sono affini e pertanto vale la (3.2) in ogni punto. La lagrangiana `e L(x1 , x2 , Il sistema (3.5) diventa:

1,

@L = @x1

3(x1

@L = @x2

1+

1

0,

2

2)

=

1)2 +

1

x2

1

(x1

1)3 +

1 x1

+

2 x2 .

=0

=0

2

0,

1 x1

= 0,

2 x2

= 0, x1

0, x2

0.

Si trova subito 2 = 1 e quindi x2 = 0. Se poi x1 = 0 si trova 1 = 3, mentre se 1 = 0 si trova x1 = 1. Dunque le condizioni di Karush-Kuhn-Tucker selezionano i due possibili punti (0, 0) e (1, 0), con f (0, 0) = 0 e f (1, 0) = 1. Osserviamo ora che f|E  0 e pertanto 0 `e massimo globale per f ovvero di minimo globale per g. OSSERVAZIONE 3.2 Come traspare dall’Esempio 3.4, le condizioni (3.5) si scrivono nella stessa maniera per i problemi seguenti: max f e min f

con i vincoli nella forma 'j  0 con i vincoli nella forma 'j

0.

OSSERVAZIONE 3.3 I numeri j che compaiono nella (3.3) prendono il nome di moltiplicatori di Karush-Kuhn-Tucker. Per la loro interpretazione valgono considerazioni del tutto analoghe a quelle fatte per i moltiplicatori di Lagrange. Infatti, nella (3.3) compaiono solo i vincoli attivi che si comportano dunque come vincoli di uguaglianza per x = x0 . Per quanto riguarda il loro segno si veda l’Esercizio 4.

3. Vincoli di disuguaglianza

c 978-88-08-63708-6

99

Veniamo ora alla dimostrazione del teorema di Karush-Kuhn-Tucker. Premettiamo due lemmi. Incominciamo con l’osservare che, se x0 `e soluzione di (P), allora f non pu` o crescere lungo una direzione ammissibile uscente da x0 . LEMMA 3.7 Sia x0 soluzione di (P). Allora, per ogni h 2 (x0 ) hrf (x0 ), hi  0.

(3.6)

Dimostrazione. Sia {xk } come nella Definizione 3.1. Poich´e f (x0 ) `e il massimo di f in E, ed f `e di↵erenziabile in E, si ha: (3.7)

0

f (xk )

f (x0 ) = hrf (x0 ), xk

x0 i + o(|xk

Dividendo ambo i membri della (3.7) per |xk x0 | e ricordando che si ottiene la (3.6).

x|). xk |xk

x0 x0 |

! h per k ! +1 ⇤

LEMMA 3.8 (di Farkas) Siano v e w1 , w2 , . . . , wp vettori di Rn . Allora vale l’inclusione (3.8)

{h 2 Rn : hh, wj i  0,

se e solo se esistono p scalari

j

8 j = 1, . . . , p} ✓ {h 2 Rn : hh, vi  0} 0, tali che v=

p X

j wj .

j=1

Omettiamo la dimostrazione del lemma illustrandone solo il significato geometrico. L’insieme a destra della (3.8) `e il semispazio V dei vettori che formano con v un angolo ottuso. Analogamente, se Wj `e il semispazio dei vettori che formano con wj un angolo ottuso, l’insieme a sinistra della (3.8) rappresenta \pj=1 Wj . Il lemma a↵erma che, se \pj=1 Wj ⇢ V , allora v `e combinazione lineare a coefficienti non negativi dei wj (Fig. 2.13). Dimostrazione del teorema di Karush-Kuhn-Tucker. Essendo i vincoli qualificati in x0 , per ogni h 2 (x0 ) e ogni j 2 J(x0 ) si ha hr'j (x0 ), hi  0. D’altra parte, il Lemma 3.7 implica che, se h 2 (x0 ), allora hrf (x0 ), hi  0. Applicando il lemma di Farkas con v = rf (x0 ) e wj = r'j (x0 ) si ottiene immediatamente ⇤ la tesi.

3.4 Condizioni sufficienti Abbiamo gi` a avuto modo di constatare nel Lemma 3.4 come la presenza di vincoli convessi o affini semplifichi molto la verifica della condizione (3.2). Se poi la funzione obiettivo `e concava, le condizioni di Kuhn-Tucker diventano necessarie e sufficienti. TEOREMA 3.9 Supponiamo che f sia concava e che le funzioni 'j , j = 1, . . . , m, siano convesse. Sia x0 2 E un punto in cui i vincoli sono qualificati. Allora x0 `e soluzione di (P) se e solo se, per ogni j 2 J(x0 ), esiste 0j 0 tale che valga la (3.3).

100

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

w2 W1–

v

W2–

w1

V–

Figura 2.13. Essendo W1 \ W2 ✓ V





W1



W2

,v` e combinazione lineare a coefficienti positivi di w1 e w2 .

Dimostrazione. Occorre mostrare solo la sufficienza della (3.3). Dalla concavit` a di f e dalla (3.3), si ha, per ogni x 2 E: X 0 0 f (x)  f (x0 ) + hrf (x0 ), x x0 i = f (x0 ) + j hr'j (x ), x j2J(X0 )

x0 i.

0

Dalla convessit` a delle 'j e dal fatto che '(x ) = 0 se j 2 J(x0 ), si ricava: 'j (x) Essendo

0 j

hr'j (x0 ), x

0 e 'j (x)  0 per x 2 E, si trova X f (x)  f (x0 ) +

x0 i.

0 j 'j (x)

j2J(X0 )

 f (x0 )

e perci` o x0 `e soluzione di (P).



Esempio 3.5 Si voglia massimizzare f (x1 , x2 ) = x1 + log(1 + x2 ) nell’insieme E = {(x1 x2 ) 2 R2 : x1 + x2 1  0, x1 0, x2 0}. Come somma di due funzioni concave f `e concava; inoltre '1 = x1 +x2 1, '2 = x1 , '3 = x2 sono affini e pertanto convesse. La lagrangiana del problema `e L(x1 , x2 ,

1,

2,

3)

= x1 + log(1 + x2 )

1 (x1

+ x2

1) +

2 x1

+

3 x2 .

Le condizioni di Karush-Kuhn-Tucker, in questo caso necessarie e sufficienti, sono: 1

1

+

2

1 1 + x2 1

0,

1 (x1

1

2

+ x2

=0 + 0,

3

=0 3

1) = 0,

0 2 x1

= 0,

3 x2

= 0.

3. Vincoli di disuguaglianza

c 978-88-08-63708-6

101

Con un po’ di pazienza si trova l’unico punto (1, 0) con i moltiplicatori (1, 0, 0). Il valore f (1, 0) = 1 `e pertanto massimo globale per f . Le condizioni del Teorema 3.9 sono verificate in particolare quando il problema `e di programmazione lineare (f e 'j affini). In questo tipo di problemi la teoria ha raggiunto un notevole grado di perfezione tanto che a essa sono dedicati interi volumi. 3.5 Vincoli di uguaglianza e disuguaglianza Terminiamo il capitolo esaminando brevemente il caso in cui vincoli di uguaglianza e di disuguaglianza sono presenti simultaneamente. Il problema si formula come segue: (P ⇤ ). Massimizzare la funzione f soggetta ai vincoli: 'j (x)  0 gi (x) = 0

j = 1, . . . , m i = 1, . . . , k (k < n).

dove f, 'j , gi : Rn ! R sono di↵erenziabili. In questo caso, il cono tangente linearizzato in un punto x amissibile `e definito da ) ( hr'j (x), hi  0, 8 j 2 J(x) ˜ (x) = h 2 Rn : hrgi (x), hi = 0, 8 i = 1, . . . , k e la condizione di qualificazione dei vincoli in v `e ancora espressa dall’ugugaglianza tra il cono delle direzioni ammissibili (x) e ˜ (x). Condizioni sufficienti per la qualificazione dei vincoli in x sono le seguenti a) I gradienti r'j (x), j 2 J(x) e rgi (x), i = 1, . . . , k sono linearmente indipendenti. b) (Mangarasian-Fromowitz). Esiste un vettore h⇤ 2 Rn , tale che hr'j (x), h⇤ i < 0, hrgi (x), h⇤ i = 0,

8 j 2 J(x) i = 1, . . . , k.

Il teorema di Karush-Kuhn-Tucker si generalizza allora nel modo seguente: TEOREMA 3.10 Sia x0 soluzione del problema (P ⇤ ). Se i vincoli sono qualificati in a, eistono m scalari x e le funzioni gi , i = 1, . . . , n, sono di↵erenziabili con continuit` 0 0 0 e k scalari µ tali che j i 0

rf (x0 ) =

m X j=1

0 0 j r'j (x )

+

k X i=1

µ0i rgi (x0 )

e 0 j 'j (x )

= 0,

j = 1, . . . , m.

Esercizi x2 nella regione E = {(x, y) 2 R2 : y + x3  0, x + y + 1 0}, usando sia il metodo delle curve di livello, sia il metodo dei moltiplicatori di Kuhn-Tucker. Mostrare che (3.2) `e verificata in ogni punto di E. 1. Determinare gli estremi di f (x, y) = y

102

CAPITOLO 2. Ottimizzazione delle funzioni di pi` u variabili

c 978-88-08-63708-6

2. Dire se nei casi illustrati in Figura 2.14a) e b) ` e verificata la condizione (3.2) in (0, 0).

Qual `e la rilevanza degli esempi in Figura 2.14 rispetto al Lemma 3.5? y

y y = x4 + x

y = x4 + x

y = 2x2 E y = x2

(0,0)

y=x

(0,0)

x

a)

b)

x

y = x3 + x

Figura 2.14. 3.*

Dimostrare che (x) `e chiuso. [Suggerimento: Sia {hi } una successione contenuta in (x), tale che hi ! h per i ! +1. Per ogni i, sia {xki } come nella Definizione 3.1. Estrarre con un procedimento diagonale h ys h ! .] una sottosuccessione ys = xkiss convergente a h, tale che s |y h| |h| 4.* In base al significato dei moltiplicatori di Kuhn-Tucker illustrare la ragione della loro positivit` a. 5. Dimostrare che se, oltre ai vincoli 'j (x)  0, j = 1, . . . , m, si richiede la non-negativit` a di o scrivere tutte le variabili: xk 0, k = 1, . . . , n allora il complesso delle condizioni (3.5) si pu` nel modo seguente:

@L  0, @xk

xk

0,

xk

0,

j

0,

j

1, . . . ,

m)

@L @ j dove L(x1 , . . . , xn ;

= f (x)

@L =0 @xk

@L =0 per ogni j = 1, . . . , m @ j m P j 'j (x).

j=1

6. Determinare il massimo globale di

f (x1 , x2 , x3 ) = x21 con i vincoli x1 + x2 + x3

per ogni k = 1, . . . , n

1  0, x1

0, x2

x3 + x2

0, x3

0.

7. Risolvere il problema della dieta (Esempio 1.3) quando:

n = 2;

c1 = 2,

m = 3;

A = (aij ) i = 1, 2

c2 = 1 j = 1, 2, 3

=



◆ 30 2 1 , 10 4 3

b = (20, 16, 9).

8. Determinare il minimo di f (x1 , x2 ) = x1 + x2 con i vincoli x31

Si pu` o usare il metodo dei moltiplicatori di Kuhn-Tucker?

x2

0, x2

0.

CAPITOLO 3

Spazi funzionali e approssimazione di funzioni

1.

SPAZI FUNZIONALI

Ricordiamo che il nostro obiettivo principale `e lo studio delle applicazioni tra spazi euclidei, cio`e tra spazi lineari a dimensione finita; perci` o abbiamo presentato, all’inizio del Volume 1, questi spazi e ne abbiamo illustrato la struttura algebrica (di spazio lineare) e quelle topologica, metrica, di spazi normati e dotati di prodotto scalare. Conviene ora, per uno studio pi` u approfondito delle applicazioni tra questi spazi, considerare queste stesse applicazioni non come oggetti a s´e stanti, ma come elementi di un certo insieme (insieme delle funzioni continue, insieme delle funzioni limitate, . . . ) e indagare se tali insiemi posseggano anch’essi qualcuna delle strutture sopra menzionate per gli spazi euclidei (da ci` o il nome che sar` a loro dato di spazi di funzioni o spazi funzionali). Riprenderemo perci` o (Par. 1.1, 1.4, 1.5, 1.7) l’esame di queste strutture un po’ pi` u in dettaglio di quanto sia stato fatto nel Capitolo 3, Volume 1; in particolare studieremo lo spazio delle funzioni continue e delle funzioni continue e di↵erenziabili con continuit` a (Par. 1.2, 1.3). Le applicazioni tra spazi funzionali formano l’oggetto dell’Analisi Funzionale (una branca della matematica, il cui forte sviluppo nel ventesimo secolo, ha fatto compiere notevoli progressi in vari campi, quali, per esempio, le equazioni di↵erenziali) e perci` o il loro studio supera i limiti di questa trattazione; tuttavia alcuni semplici ma importanti risultati (come il teorema delle contrazioni di Banach-Caccioppoli1 ) sono dati nel Paragrafo 1.6. 1.1

Metrica e topologia

Conviene richiamare la nozione di spazio metrico gi` a introdotta in 3.1.4, Volume 1. DEFINIZIONE 1.1 Un insieme X si dice spazio metrico se `e definita un’applicazione (detta distanza o metrica) d : X ⇥X ! R tale che2 , 8 x, y, z 2 X valgono le seguenti 1 S.

Banach, matematico polacco (1892-1945). R. Caccioppoli, matematico italiano (1904-1959). x, y, z, . . . indichiamo elementi generici dello spazio X, che chiameremo punti; se X ` e uno spazio lineare, i suoi elementi si diranno vettori (o ancora punti); nel caso particolare di Rn si user` a la convenzione solita di indicarli in grassetto. 2 Con

104

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

propriet` a: D

1. d(x, y) 0; d(x, y) = 0 , x = y 2. d(x, y) = d(y, x) 3. d(x, y)  d(x, z) + d(z, y).

Sottolineiamo che con spazio metrico s’intende la coppia (X, d); infatti, su uno stesso insieme X potrebbero definirsi pi` u metriche diverse: d1 , d2 , . . .; in tal caso l’insieme X con la metrica d1 e l’insieme X con la metrica d2 sono spazi metrici distinti. Se X `e anche uno spazio lineare parleremo di spazio lineare metrico; si osservi che la struttura di spazio lineare e quella di spazio metrico possono sussistere indipendentemente una dall’altra. Esempi 1.1 Qualunque insieme pu` o diventare uno spazio metrico con la seguente definizione di distanza: ( 0 se x = y (1.1) d(x, y) := 1 se x 6= y. (Verificare la validit` a delle propriet` a D 1. 2. 3.). Una tale metrica (detta metrica discreta) non sar` a, in generale, di alcuna utilit` a per le applicazioni. Per esempio, se in R3 si adottasse la metrica (1.1) invece di quella pitagorica, tale spazio, evidentemente, non sarebbe pi` u un accettabile modello dello spazio fisico. La scelta della metrica deve tener conto della sua utilit` a in vista delle applicazioni. 1.2 Gli spazi euclidei Rn e Cn sono metrici con la consueta definizione di distanza di due vettori x e y: !1/2 n X 2 |xi yi | d(x, y) := |x y| := i=1

(metrica pitagorica). Altre metriche in Rn e Cn sono, per esempio, d1 (x, y) :=

n X i=1

|xi

yi |,

d1 (x, y) := max {|xi i=1,...,n

yi |}.

1.3 L’insieme R⇤ = R [ {+1} [ { 1} non `e uno spazio lineare; esso pu` o essere metrizzato con la seguente definizione di distanza:

(1.2)

d(x, y) := | arctg x arctg y| ⇡ d(x, +1) = d(+1, x) := arctg x 2 ⇡ d(x, 1) = d( 1, x) := arctg x + 2 d(+1, +1) = d( 1, 1) := 0 d(+1, 1) = d( 1, +1) := ⇡.

8 x, y 2 R 8x 2 R 8x 2 R

1. Spazi funzionali

c 978-88-08-63708-6

105

La verifica della validit` a delle propriet` a D, 1. 2. 3. `e immediata. Si osservi che diam(R⇤ ) = sup d(x, y) = ⇡, cio`e lo spazio R⇤ `e limitato. x,y2R⇤

1.4 Sia I ✓ R un intervallo; con C 0 (I) abbiamo indicato la classe delle funzioni continue su I a valori reali o complessi; questo insieme ha la struttura di spazio lineare, i cui punti (o vettori) sono le singole funzioni: lo zero dello spazio `e la funzione identicamente nulla su I, l’opposto di f `e f . Supponiamo ora che I = [a, b] cio`e chiuso e limitato (compatto) in R. In C 0 ([a, b]) possiamo facilmente introdurre una metrica nel modo seguente: se f (t) e g(t) sono due elementi dello spazio, poniamo: (1.3)

d(f, g) :=

max |f (t)

t2I=[a,b]

g(t)|.

Osserviamo anzitutto che la definizione `e sensata, poich´e il massimo che in essa compare esiste (teorema di Weierstrass, pag. 214, Vol. 1); inoltre le propriet` a D 1. 2. 3. sono verificate: la verifica di D 1. e D 2. `e immediata; per la D 3. si osservi che, se f, g, h 2 C 0 ([a, b]), risulta, 8 t 2 [a, b] |f (t)

g(t)| = |f (t) h(t) + h(t) g(t)|   |f (t) h(t)| + |h(t) g(t)|   max |f (t) h(t)| + max |h(t) t2[a,b]

t2[a,b]

g(t)|.

La disuguaglianza ottenuta, essendo vera per ogni t 2 [a, b], sar` a vera anche per il punto (o i punti) di massimo di |f (t) g(t)|; ne segue perci` o la D 3. La metrica D 3. viene detta metrica lagrangiana. Non c’`e nessuna difficolt` a a estendere le cose viste sopra alle funzioni di pi` u variabili continue in un sottoinsieme A ✓ Rn . 1.5 Se, nell’Esempio 1.4, l’intervallo I non `e un compatto, la definizione D 3. perde significato. Tuttavia, se consideriamo l’insieme Cb0 (I) delle funzioni continue e limitate3 su I (`e ancora uno spazio lineare!) possiamo definire una metrica ponendo (1.4)

d(f, g) := sup |f (t)

g(t)|.

t2I

Pi` u in generale, la funzione (1.4) sar` a una metrica per lo spazio B(I) di tutte le funzioni limitate in I. 1.6 Sia ancora I = [a, b] e introduciamo una metrica in C 1 ([a, b]). Essendo C 1 ([a, b]) ⇢ a introdotta C 0 ([a, b]), possiamo certamente adottare su C 1 ([a, b]) la stessa metrica gi` in C 0 ([a, b]); oppure, tenendo conto del fatto che gli elementi di C 1 ([a, b]) sono funzioni derivabili con continuit` a, possiamo definire (1.5)

d(f, g) := max |f (t) t2[a,b]

g(t)| + max |f 0 (t) t2[a,b]

g 0 (t)|.

` facile verificare che questa `e una metrica su C 1 ([a, b]); perch´e questa sia preferibile E alla (1.3) sar` a chiaro tra poco. 3b

sta per bounded, cio` e (in inglese) limitato.

106

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

In generale, su C k [a, b], k (1.6)

0, si pone la seguente metrica (f (0) = f ): k X d(f, g) := max |f (j) (t) g (j) (t)|. j=0

t2[a,b]

Queste metriche sono dette metriche lagrangiane di ordine k. e b), insieme delle funzioni continue e assolutamente integrabili in senso 1.7 In C(a, generalizzato sull’intervallo (a, b), possiamo definire una metrica ponendo Z b |f (t) g(t)|dt. (1.7) d(f, g) := a

La metrica (1.7) `e detta metrica integrale (di ordine 1). La verifica delle propriet` a D 1. 2. 3. `e immediata. e b); `e particolarmente Altre metriche integrali possono essere introdotte su C(a, significativa per le applicazioni la metrica integrale di ordine 2, e cio`e !1/2 Z b 2 |f (t) g(t)| dt . (1.8) d(f, g) := a

La verifica della propriet` a triangolare non `e immediata: seguir` a da un risultato generale che vedremo nel Paragrafo 1.7. Il punto di vista adottato con la (1.8) `e di assumere, come misura della distanza di due funzioni, lo scarto quadratico globale tra di esse; `e lo stesso punto di vista adottato in Probabilit` a, quando si assume, come misura della dispersione di una variabile casuale, la deviazione standard; oppure, nelle scienze sperimentali, quando si vuole tracciare una retta che interpoli i punti rappresentanti le osservazioni fatte e si sceglie quella retta che minimizza la somma dei quadrati delle distanze dai punti dati (metodo dei minimi quadrati); ritorneremo su questo argomento nel prossimo paragrafo. Osserviamo infine che, ovviamente, le metriche integrali (1.7) o (1.8) possono essere utilizzate anche sull’insieme C 0 ([a, b]); tuttavia, per ragioni che saranno chiare tra poco, supporremo sempre che C 0 ([a, b]) sia munito della metrica lagrangiana. La presenza di una metrica su un insieme X consente di definire gli intorni dei punti di X e i limiti delle successioni a valori in X, cio`e, in altre parole, la topologia di X. Ricordiamo la definizione di intorno sferico. DEFINIZIONE 1.2 Se (X, d) `e uno spazio metrico e x 2 X, chiameremo intorno sferico di x (o palla di centro x) di raggio r l’insieme4 B(x, r) := {y 2 X : d(x, y) < r}. Questi intorni soddisfano le propriet` a U 1.-4. del Paragrafo 3.1.4, Volume 1. Le consuete definizioni topologiche, introdotte in Rn , e cio`e le definizioni di: punti interni, esterni, di frontiera, di accumulazione, . . . insiemi aperti, chiusi, limitati, compatti, . . . , essendo fondate sulla definizione di intorno, si estendono pari pari agli spazi metrici qualsiasi. 4 Invece

di B(x, r) si user` a anche la notazione Br (x).

1. Spazi funzionali

c 978-88-08-63708-6

107

Esempi 1.8 Sia X un insieme dotato della metrica (1.1). Per ogni x 2 X, gli intorni B(x, r) contengono solo x se r  1, tutto lo spazio se r > 1. Perci` o ogni sottoinsieme E ✓ X `e aperto (ogni suo punto `e punto interno) e quindi ogni sottoinsieme `e anche chiuso (essendo il complementare di un aperto). Lo spazio `e limitato (il suo diametro `e 1). 1.9 Gli intorni sferici in Rn (indotti dalla metrica pitagorica) sono le sfere (o ipersfere) della Geometria euclidea; in particolare, in R, gli intorni B(x, r) sono gli intervalli (x r, x + r). Vediamo quali sono gli intorni sferici di R⇤ indotti dalla metrica (1.2). Esaminiamo gli intorni di +1: n o ⇡ B(+1, r) = {y 2 R⇤ : d(+1, y) < r} = y 2 R⇤ : arctg y < r = 2 (prendendo 0 < r < ⇡ e ponendo a = tg(⇡/2

r))

= {y 2 R⇤ : y > a}; essi sono dunque le semirette (a, +1], in accordo con la definizione da noi gi` a introdotta, indipendentemente da ogni considerazione di tipo metrico. Analogamente si vede che gli intorni B( 1, r) di 1 sono le semirette [ 1, b) con b = tg(r ⇡/2). Infine, se x `e un punto al finito, gli intorni B(x, r) nella metrica (1.2) sono (lasciamo la verifica al lettore) gli intervalli (x a1 , x + a2 ) con a1 = x tg(arctg x r), o la topologia indotta dalla metrica (1.2), ristretta a2 = x + tg(arctg x + r); perci` a R, non coincide con quella indotta dalla metrica pitagorica (gli intorni di x sono intervalli non simmetrici rispetto a x); tuttavia `e ad essa equivalente, nel senso che, 8 x 2 R, ogni intorno pitagorico di x contiene un intorno sferico nella metrica (1.2) e ogni intorno sferico nella metrica (1.2) contiene un intorno pitagorico di x. Ci` o implica che gli aperti, i chiusi, i punti di accumulazione, ecc. nelle due topologie coincidono. 1.10 Sia X = C 0 ([a, b]) dotato della metrica lagrangiana (1.3). Sia f 2 X; un intorno di f di raggio r `e dato da: ⇢ B(f, r) = g 2 C 0 ([a, b]) : max |f (t) g(t)| < r . t2[a,b]

Esso `e costituito da tutte le funzioni g continue in [a, b] tali che: f (t) r < g(t) < f (t) + r, 8 t 2 [a, b], cio`e dalle funzioni continue il cui grafico `e contenuto nella striscia evidenziata in Figura 3.1. Se su C 0 ([a, b]) si adottasse la metrica integrale (1.7), un intorno di f di raggio r sarebbe ) ( Z b 0 |f (t) g(t)|dt < r . g 2 C ([a, b]) : a

Esso `e costituito da tutte le funzioni g continue in [a, b] tali che l’area della regione piana delimitata dai grafici di f e di g (si veda Fig. 3.2) risulti < r.

108

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

g g

f

f

b

a Figura 3.1.

a

b

Figura 3.2.

1.11 In C 1 ([a, b]), munito della metrica (1.5), un intorno di f di raggio r `e costituito da tutte le funzioni g tali che max |f (t)

t2[a,b]

g(t)| + max |f 0 (t) t2[a,b]

g 0 (t)| < r.

Perci` o non soltanto i grafici di f e di g devono essere “vicini”, ma anche i grafici di f 0 0 e g . La condizione di vicinanza in questa metrica `e molto pi` u forte della condizione di vicinanza nella metrica di C 0 (si veda la Fig. 3.3).

a

b

Figura 3.3. Due funzioni “vicine” in metrica C 0 ([a, b]) ma “lontane” in metrica C 1 ([a, b]).

Mentre le definizioni topologiche, introdotte in Rn , si trasportano senza modifiche agli spazi metrici pi` u generali, lo stesso non accade per alcune importanti propriet` a, che abbiamo dimostrato nel Capitolo 3, Volume 1, le quali sono tipiche degli spazi euclidei e non si possono generalizzare agli spazi metrici qualsiasi, come vedremo nel Paragrafo 1.3. Per chiarire questo punto, conviene considerare le successioni a valori

1. Spazi funzionali

c 978-88-08-63708-6

109

in uno spazio metrico X, per lo stretto legame che esse hanno con la topologia dello spazio. Riprendiamo dunque la definizione di successione convergente e di successione di Cauchy (o fondamentale). DEFINIZIONE 1.3 Sia (X, d) uno spazio metrico e {xn } una successione a valori in X; essa si dir` a convergente a un punto x 2 X se vale una delle seguenti a↵ermazioni, tra di loro equivalenti: i) fissato un qualunque intorno V di x, per n ! +1, xn appartiene definitivamente a V. ii) 8 " > 0, esiste un intero positivo N tale che, per n > N , risulta d(xn , x) < ". iii) lim d(xn , x) = 0. n!+1

d

Scriveremo xn ! x o, pi` u specificamente, xn ! x, per indicare che {xn } converge a x nella metrica d. Delle tre definizioni, la prima `e pi` u schiettamente topologica, poich´e fa intervenire solo gli intorni; la seconda tiene conto della metrica di X e utilizza gli intorni sferici; la terza riconduce la definizione di limite di una successione a valori in uno spazio metrico al limite di una successione di numeri reali non negativi. Se una successione ammette limite, questo `e unico; infatti se, per assurdo, si avesse xn ! x e xn ! y,

x 6= y,

presi due intorni, Vx di x e Vy di y disgiunti, si avrebbe, definitivamente, xn 2 Vx e xn 2 Vy : assurdo! Come avevamo gi` a osservato dimostrando il Teorema 2.1, pagina 144, Volume 1, a di questa semplice dimostrazione discende dalla propriet` a U4 degli intorni (propriet` separazione di Hausdor↵). DEFINIZIONE 1.4 Sia (X, d) uno spazio metrico e {xn } una successione a valori in X; essa si dir` a fondamentale o di Cauchy se (1.9)

lim

n,m!+1

d(xn , xm ) = 0.

Se una successione `e convergente, essa `e fondamentale; questa a↵ermazione `e gi` a stata dimostrata per le successioni a valori in Rn (Prop. 4.7, pag. 195, Vol. 1); quella dimostrazione si ripete pari pari per le successioni a valori in uno spazio metrico qualsiasi. Uno dei risultati principali dimostrati nel Volume 1 `e che l’a↵ermazione inversa `e vera negli spazi euclidei, ma, come abbiamo gi` a avvertito, non `e vera per tutti gli spazi metrici (si veda l’Esempio 4.15, pag. 196, Vol. 1). Uno spazio metrico in cui ogni successione fondamentale `e convergente si dice completo. 1.2 Successioni di funzioni. Convergenza puntuale e convergenza uniforme a, supporPer definire il limite di una successione di funzioni {fn } (che, per semplicit` remo reali di variabile reale) possiamo assumere un punto di vista pi` u elementare, o, per cos`ı dire, pi` u “ingenuo”, di quello assunto con la Definizione 1.3. Sia infatti I ✓ R

110

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

un intervallo, fn : I ! R una successione di funzioni e sia t0 2 I. La successione {fn (t0 )} `e allora una successione di numeri reali e potremo determinarne il carattere: convergente, divergente, irregolare. Possiamo ripetere questa operazione per tutti i punti t 2 I. Supponiamo che, per ogni t 2 I, la corrispondente successione numerica {fn (t)} sia convergente e f (t) sia il suo limite (ovviamente dipendente in generale da t); risulta cos`ı definita una funzione f : I ! R, che sar` a naturale chiamare limite della successione di funzioni {fn }. Pi` u precisamente, poniamo la seguente a convergente in I, con DEFINIZIONE 1.5 Una successione di funzioni fn : I ! R si dir` limite f : I ! R, se, fissato " > 0, 8 t 2 I, 9 N = N (", t) tale che: |fn (t)

f (t)| < "

se n > N.

Questa definizione di convergenza di una successione di funzioni `e una semplice estensione dell’analoga definizione di convergenza delle successioni numeriche. Essa viene detta anche convergenza puntuale o ordinaria. L’altro punto di vista (quello della Def. 1.3) consiste invece nel considerare le funzioni come elementi di un dato spazio metrico X; allora il limite `e gi` a definito dalla metrica di questo spazio. Vediamo che cosa avviene se X `e uno degli spazi metrici precedentemente illustrati. Se X `e R (o, pi` u in generale, Rn o Cn ) ritroviamo la definizione di limite di una successione numerica (o di vettori). Sia X = C 0 ([a, b]) con I = [a, b] compatto, dotato della metrica lagrangiana. Una successione {fn } ⇢ C 0 ([a, b]) converge a f 2 C 0 ([a, b]) se accade che d(fn , f ) tende a zero, cio`e: lim max |fn (t) f (t)| = 0. n!1 t2[a,b]

Ci` o significa che, fissato " > 0, 9 N = N ("), per cui: (1.10)

max |fn (t)

t2[a,b]

f (t)| < " se n > N.

a per Ma se, per n > N ("), |fn (t) f (t)| < " nei punti di massimo, lo stesso accadr` ogni altro t 2 [a, b]; perci` o concludiamo senz’altro che fn converge a f puntualmente; ma la (1.10) implica qualcosa di pi` u. Per mettere in luce questo fatto diamo la seguente a convergente uniforDEFINIZIONE 1.6 Una successione di funzioni fn : I ! R si dir` memente in I, con limite f : I ! R, se, fissato " > 0, 9 N = N (") tale che: (1.11)

|fn (t)

f (t)| < "

8t 2 I

se n > N.

Confrontando le Definizioni 1.5 e 1.6 si osserva che, nel primo caso, prima si fissa t 2 I e poi si trova N , che dipender` a dunque (oltre che dal prefissato ") dal punto t scelto; nel secondo caso invece siamo in grado di trovare un N (indipendente da t) per cui la (1.11) `e verificata. La relazione tra le due situazioni (convergenza uniforme e convergenza puntuale) `e analoga a quella gi` a incontrata tra continuit` a uniforme e continuit` a (ordinaria o puntuale). Naturalmente la convergenza uniforme implica quella puntuale ma non vale il viceversa, come mostreremo nell’Esempio 1.12.

1. Spazi funzionali

c 978-88-08-63708-6

111

Tornando ora alla convergenza delle successioni in C 0 (I), osserviamo che la convergenza “naturale”, indotta dalla metrica lagrangiana, `e proprio la convergenza uniforme. In modo identico si osserva che anche la metrica (1.4) (metrica dell’estremo superiore), u in generale, sullo spazio B(I) di tutte le funzioni adottata sullo spazio Cb0 (I) o, pi` limitate su un insieme I, conduce alla convergenza uniforme. Esempi 1.12 Sia fn : [0, 1] ! R : t 7! tn e sia f (t) = 0 se 0  t < 1, f (1) = 1. La successione fn converge puntualmente a f ; infatti, se t = 1 oppure t = 0, l’a↵ermazione `e ovvia; se 0 < t < 1, fissato " > 0, basta prendere N = log "/ log t per essere certi che tn < " se n > N ; anzi, questa `e la scelta migliore di N (cio`e l’N pi` u piccolo). Si osserva che, scegliendo t prossimo a 1, N diventa sempre pi` u grande: non esiste un N adatto per tutti i t 2 [0, 1], la successione non converge uniformemente. Alternativamente: sup |fn (t) f (t)| = 1 9 0 t2[0,1]

per n ! +1 e quindi fn non converge uniformemente a f in [0, 1]. 1.13 La successione fn : R 7! R : t ! n1 sin(nt) converge uniformemente a 0; infatti risulta 1 1 | sin(nt)| < " se n > . n " Poich´e, con le definizioni precedenti, la convergenza delle successioni di funzioni `e ricondotta alla convergenza delle successioni numeriche, resta valido il criterio di convergenza di Cauchy che qui sotto riportiamo. PROPOSIZIONE 1.1 (Criterio di convergenza puntuale) Condizione necessaria e sufficiente affinch´e la successione di funzioni fn : I ! R converga puntualmente in I `e che, fissato " > 0, 8 t 2 I, esista N = N (", t) tale che: |fn (t)

fm (t)| < "

se n, m > N.

PROPOSIZIONE 1.2 (Criterio di convergenza uniforme) Condizione necessaria e sufficiente affinch´e la successione di funzioni fn : I ! R converga uniformemente in I `e che, fissato " > 0, esista N = N (") tale che: |fn (t)

fm (t)| < "

8 t 2 I,

se n, m > N.

OSSERVAZIONE 1.1 Se le fn sono funzioni di pi` u variabili, potrebbe accadere che la convergenza sia uniforme rispetto a una variabile e puntuale rispetto a un’altra. Per esempio siano S ✓ R e T ✓ R due intervalli; fn (s, t) ! f (s, t) uniformemente rispetto a s 2 S e puntualmente rispetto a t 2 T significa: fissato " > 0, 8 t 2 T , 9 N = N (", t) tale che: 8 s 2 S, se n > N. |fn (s, t) f (s, t)| < " Alternativamente: sup |fn (s, t) s2S

f (s, t)| ! 0 per ogni t 2 T , se n ! +1.

112

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

OSSERVAZIONE 1.2 Passando dalla variabile discreta n alla variabile continua s, possiamo parlare di limite uniforme di funzioni, anzich´e di successioni. In breve, diremo che: lim f (s, t) = l(t) uniformemente rispetto a t 2 T s!s0

se, fissato " > 0, 9 = (") tale che: |f (s, t)

l(t)| < "

8 t 2 T,

se 0 < |s

s0 | < .

Ovvero se sup |f (s, t) t2T

l(t)| ! 0

per

s ! s0 .

Se f (s, t) `e uniformemente continua in S ⇥ T , `e chiaro che risulta: lim f (s, t) = f (s0 , t) uniformemente rispetto a t 2 T.

s!s0

1.3

Scambio di limiti; di limite e derivata, di limite e integrale. Gli spazi di Lagrange La di↵erenza tra la convergenza puntuale e quella uniforme acquista maggior risalto dai seguenti teoremi, che illustrano la possibilit` a di scambiare tra di loro due operazioni di limite, oppure un limite con una derivata, oppure un limite con un integrale. Da essi risulter` a che talune propriet` a delle funzioni, quali la continuit` a, la derivabilit` a o l’integrabilit` a, permangono anche dopo aver eseguito un passaggio al limite, se si tratta di limite uniforme, mentre ci` o in generale non accade, se si tratta di limite puntuale. In questo ordine di idee cominciamo col mostrare questa semplice PROPOSIZIONE 1.3 Il limite f di una successione di funzioni limitate fn : I ! R, convergente uniformemente, `e una funzione limitata. Dimostrazione. Per l’ipotesi di uniforme convergenza, esiste N tale che (1.12)

|fn (t)

fm (t)| < 1

8 t 2 I,

se n, m

N.

Nella (1.12) facciamo tendere n all’1 e prendiamo m = N ; risulta fN (t)| < 1

8t 2 I

|f (t)| < 1 + |fN (t)|

8t 2 I

|f (t) cio`e e dunque anche

sup |f | < 1 + sup |fN |. I



I

Se la convergenza `e solo puntuale la Proposizione 1.3 `e falsa. Un controesempio `e illustrato nell’Esercizio 9. TEOREMA 1.4 (dello scambio dei limiti) Siano ln 2 R, fn , f funzioni da I ✓ R in R, t0 2 I. Se i) lim fn (t) = f (t) uniformemente in I; n!1

ii) lim fn (t) = ln , t!t0

1. Spazi funzionali

c 978-88-08-63708-6

113

allora esistono finiti i limiti lim f (t) e lim ln e sono uguali, cio`e: t!t0

n!1

lim lim fn (t) = lim lim fn (t).

(1.13)

t!t0 n!1

n!1 t!t0

Dimostrazione. Mostriamo anzitutto che la successione {ln } `e convergente; infatti risulta |ln

lm | = |ln  |ln

fn (t) + fn (t)

fm (t) + fm (t)

fn (t)| + |fn (t)

fm (t)| + |fm (t)

lm | 

lm |.

Fissato " > 0, per l’ipotesi i) esiste N = N (") tale che: |fn (t)

fm (t)| < ", 8 t 2 I,

se n, m N . Facendo allora tendere t a t0 , per l’ipotesi ii) risulter` a |ln fn (t)| ! 0, o |ln lm | < "; la successione {ln } `e dunque fondamentale, perci` o |fm (t) lm | ! 0 e perci` convergente; sia l il suo limite. Mostriamo che lim f (t) = l. Fissato " > 0, sia N = N (") t!t0

tale che Abbiamo allora

|f (t) Per la ii), esiste |f (t) l| < 3".

fN (t)| < "

8 t 2 I : |f (t) l|  |f (t)

e

fN (t)| + |fN (t)

 2" + |fN (t)

= (") tale che: |fN (t)

lN |.

|lN

l| < ".

lN | + |lN

lN | < " se 0 < |t

l|  t0 | < ; allora sar` a anche ⇤

COROLLARIO 1.5 Se la successione di funzioni continue fn : I ! R converge uniformemente, il suo limite f : I ! R `e una funzione continua. Dimostrazione. Sia t0 2 I; per l’ipotesi risulta: lim fn (t) = fn (t0 ); applicando allora la t!t0

(1.13) abbiamo:

lim f (t) = lim lim fn (t) = lim lim fn (t) = lim fn (t0 ) = f (t0 );

t!t0

t!t0 n!1

n!1 t!t0

n!1

a di t0 , f (t) risulta continua in I. f (t) `e pertanto continua in t0 ; per l’arbitrariet`



Questo risultato `e falso in generale se la convergenza della successione {fn } `e puntuale, ma non uniforme, come si `e visto nell’Esempio 1.12. Il Corollario 1.5 `e spesso utilizzato al negativo, per mostrare che, se una successione di funzioni continue converge a una funzione discontinua, la convergenza non pu` o essere uniforme. Lasciamo al lettore il compito di formulare enunciati analoghi a quello del Teorema 1.4, sulla possibilit` a di scambiare le operazioni di limite nel caso di funzioni di due (o pi` u) variabili: lim lim f (s, t) = lim lim f (s, t) s!s0 t!t0

t!t0 s!s0

e nel caso di successioni doppie (o multiple), cio`e matrici infinite: lim lim anm = lim lim anm .

n!1 m!1

m!1 n!1

114

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

TEOREMA 1.6 (dello scambio del limite con la derivata) Sia data una successione di funzioni fn : (a, b) ! R, derivabili; se i) la successione delle derivate {fn0 } converge uniformemente in (a, b) con limite g; ii) la successione delle funzioni {fn } converge almeno in un punto t0 2 (a, b);

allora anche la successione {fn } converge uniformemente in (a, b). Sia f il suo limite; risulta f derivabile e f 0 = g, cio`e: (1.14)

lim

n!1

d d fn (t) = lim fn (t). dt dt n!1

Dimostrazione. Mostriamo anzitutto che la successione {fn } converge uniformemente in (a, b). Sia t 2 (a, b), diverso da t0 ; per il teorema di Lagrange, applicato alla funzione fn (t) fm (t), abbiamo: fn (t)

fm (t) = fn (t0 )

fm (t0 ) + (t

t0 )(fn0 (⇠)

0 fm (⇠))

o risulta con ⇠ compreso tra t e t0 . Perci` |fn (t)

fm (t)|  |fn (t0 )

fm (t0 )| + (b

a)|fn0 (⇠)

0 fm (⇠)|.

Per le ipotesi del teorema, fissato " > 0, esiste N = N (") tale che: se n, m > N allora 0 (⇠)| < ", 8 ⇠ 2 (a, b); pertanto |fn (t0 ) fm (t0 )| < " e |fn0 (⇠) fm |fn (t)

fm (t)| < (1 + b

a)".

Ci` o prova, per la Proposizione 1.2, la convergenza uniforme della successione {fn }. Sia f (t) = lim fn (t). Mostriamo che f `e derivabile. A tale scopo, fissato t 2 (a, b), consideriamo il n!1

rapporto incrementale

f (t + h) h

f (t)

= lim

n!1

fn (t + h) h

fn (t)

= lim gn (t, h), n!1

avendo posto gn (t, h) := [fn (t + h) fn (t)]/h. Osserviamo ora che, fissato t, la successione {gn } converge uniformemente rispetto ad h in (a t, b t); infatti, applicando ancora il teorema di Lagrange, abbiamo gn (t, h)

1⇥ (fn (t + h) fm (t + h)) (fn (t) h 0 0 (⌘) con t < ⌘ < t + h. = fn (⌘) fm

gm (t, h) =

⇤ fm (t)) =

La convergenza uniforme di {gn (t, h)} rispetto ad h segue dalla convergenza uniforme della successione {fn0 }. Ora possiamo far tendere h a zero e applicare il Teorema 1.4: f (t + h) f (t) = lim lim gn (t, h) = h!0 n!1 h = lim lim gn (t, h) = lim fn0 (t),

f 0 (t) = lim

h!0

n!1 h!0

che prova la (1.14).

n!1



COROLLARIO 1.7 Nelle stesse ipotesi del Teorema 1.6, se fn 2 C 1 (a, b) anche il limite f 2 C 1 (a, b).

1. Spazi funzionali

c 978-88-08-63708-6

115

Ancora invitiamo il lettore a formulare le ipotesi per la validit` a dell’equazione: lim

s!s0

@ @ f (s, t) = lim f (s, t). @t @t s!s0

TEOREMA 1.8 (dello scambio del limite con l’integrale) Sia data una successione {fn } ⇢ R(a, b) di funzioni limitate integrabili sull’intervallo [a, b], convergente uniformemente con limite f ; allora risulta f 2 R(a, b) e Z b Z b fn (t)dt = f (t)dt. (1.15) lim n!1

a

a

Dimostrazione. Osserviamo anzitutto che il limite f `e una funzione limitata (Prop. 1.3); mostriamo che `e integrabile su [a, b]. Presa una qualsiasi suddivisione D di [a, b] e posto ti = ti ti 1 (i = 1, 2, . . . , k), abbiamo: i = (ti 1 , ti ), |S(D, f )

S(D, fn )| =

k X

(sup f

sup fn ) ti 

i

i=1

i

k X i=1

sup |f i

fn | ti .

Per l’uniforme convergenza di fn verso f , fissato " > 0, esiste N = N (") tale che sup |f

fN | < ";

[a,b]

risulta perci` o |S(D, f )

S(D, fN )| < "(b

|s(D, f )

s(D, fN )| < "(b

a).

Analogamente si mostra che (eventualmente aumentando N ) a).

Ora, per l’integrabilit` a di fN , esiste una suddivisione D tale che |S(D, fN )

s(D, fN )| < "(b

a).

Presa una tale suddivisione, risulta allora |S(D, f )

s(D, f )|  |S(D, f )

S(D, fN )| + |S(D, fN )

+ |s(D, fN )

s(D, f )| < 3(b

Ci` o prova che f 2 R(a, b); allora abbiamo Z b Z b Z b fn (t)dt f (t)dt  |fn (t) a

a

a

f (t)|dt  (b

s(D, fN )|+

a)".

a) sup |fn [a,b]

f |;

facendo tendere n all’infinito, segue la (1.15).



In particolare, se {fn } ⇢ C 0 ([a, b]), allora f 2 C 0 ([a, b]) (per il Cor. 1.5) e vale la (1.15). Esempi e controesempi sono illustrati negli esercizi. Invitiamo il lettore a enunciare un teorema, analogo al Teorema 1.8, per la validit` a dell’equazione Z b Z b f (s, t)dt = lim f (s, t)dt lim s!s0

a

a s!s0

e a ritrovare, come caso particolare, la Proposizione 1.14, pagina 414, Volume 1.

116

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

Come abbiamo visto, la convergenza uniforme `e la convergenza associata alla metrica del massimo o dell’estremo superiore. Tale metrica `e stata adottata sullo spazio delle funzioni continue su un compatto C 0 ([a, b]) o delle funzioni continue e limitate su un intervallo qualsiasi Cb0 (I) o di tutte le funzioni limitate B(I); comprenderemo ora la ragione di una simile scelta. TEOREMA 1.9 Lo spazio C 0 ([a, b]) `e completo nella metrica lagrangiana. Dimostrazione. Sia {fn } ⇢ C 0 ([a, b]) una successione fondamentale; ci` o significa che, fissato " > 0, 9 N = N (") tale che: max |fn (t)

t2[a,b]

fm (t)| < "

se

n, m > N.

Perci` o, per la Proposizione 1.2, questa successione converge uniformemente in [a, b]; sia f il suo limite; per il Corollario 1.5 f `e continua in [a, b]. ⇤

Con analoga dimostrazione, ricordando la Proposizione 1.3, si prova che: Cb0 ([a, b]) e B([a, b]), sono completi nella metrica dell’estremo superiore. Consideriamo ora C 1 ([a, b]) dotato della metrica (1.5); una successione fondamentale `e una successione {fn } tale che: max |fn [a,b]

fm | ! 0 e

max |fn0 [a,b]

0 fm |!0

per n, m ! 1. Ci` o implica che le successioni {fn } e {fn0 } siano entrambe uniformemente convergenti in [a, b]; sia f il limite di {fn }; per il Corollario 1.7, f 2 C 1 ([a, b]) e risulta fn ! f

fn0 ! f 0

uniformemente in [a.b],

cio`e {fn } `e convergente nella metrica (1.5). Possiamo enunciare il risultato dicendo: C 1 ([a, b]) `e completo nella metrica lagrangiana (1.5). ` chiaro che C 1 ([a, b]) non risulterebbe completo nella stessa metrica di C 0 ([a, b]); E per questa ragione si pone su C 1 la metrica (1.5). In generale, tutti gli spazi C k ([a, b]) risultano completi nella metrica (1.6). Tali spazi si chiamano spazi di Lagrange; essi sono fondamentali nello studio delle equazioni di↵erenziali. La convergenza in media Ricordiamo infine le metriche integrali (1.7) (di ordine 1) e (1.8) (di ordine 2). Queste inducono, sugli spazi muniti di tali metriche (esempio R(a, b) o anche C 0 ([a, b])) nuovi tipi di convergenza: la convergenza in media (di ordine 1, di ordine 2, . . . ). Purtroppo per` o nessuno degli spazi finora considerati, n´e R(a, b) n´e C 0 ([a, b]), risulterebbe completo (si veda l’Esercizio 10). D’altra parte, come abbiamo gi` a accennato, tali metriche, soprattutto quella di ordine 2, intervengono in molti problemi, non solo di Matematica, ma anche di Statistica, di Fisica, di Ingegneria; `e perci` o importante

1. Spazi funzionali

c 978-88-08-63708-6

117

poter disporre di uno spazio che risulti completo rispetto ad esse. La questione `e per` o piuttosto delicata e richiede la revisione del concetto di integrale; questo problema sar` a a↵rontato nel Capitolo 5, Sezione 2; solo allora saremo in grado di presentare spazi completi rispetto alle metriche integrali. u OSSERVAZIONE 1.3 Gli spazi langrangiani si possono definire anche per funzioni di pi` variabili. Sia ⌦ ✓ Rn un aperto limitato e ⌦ la sua chiusura. C 0 (⌦) denota lo spazio delle funzioni reali (o complesse) continue in ⌦. Con la metrica dC 0 (⌦) (f g) = max |f (x) g(x)|, x2⌦

C 0 (⌦) diventa uno spazio metrico completo. — C k (⌦) lo spazio delle funzioni dotate di derivate fino all’ordine k incluso, continue in ⌦ ed estendibili con continuit` a fino al bordo di ⌦. Per introdurre in C k (⌦) la metrica lagrangiana di ordine k, introduciamo un simbolo comodo per le derivate parziali. Sia ↵ = (↵1 , ↵2 , . . . , ↵n ) una n-pla di interi con 0  ↵j  k, 8 j = 1, . . . , n; ↵ si chiama multiindice. Chiamiamo |↵| = ↵1 + ↵2 + . . . + ↵n lunghezza di ↵ e poniamo D↵ f =

@ ↵1 @ ↵2 @ ↵n . . . f. ↵2 1 n @x↵ @x↵ n 1 @x2

Se |↵| = 0, cio`e ↵0 = ↵1 = . . . = ↵n = 0, poniamo D↵ f = f . In C k (⌦) introduciamo la metrica dC k (⌦) (f, g) =

k X

|↵|=0

max D↵ f (x)

D↵ g(x) .

x2⌦

Con tale metrica C k (⌦) risulta spazio metrico completo. Se {fm } ⇢ C k (⌦) e fm ! f in questa metrica, tutte le derivate D↵ f fino all’ordine k incluso convergono uniformemente a D↵ f in ⌦. *1.4 Completezza, chiusura, limitatezza, compattezza In questo paragrafo ci proponiamo di esaminare le relazioni che intercorrono tra i concetti sopra elencati. Cominciamo con l’osservare che un sottoinsieme E di uno spazio metrico X `e esso stesso uno spazio metrico (un sottospazio) adottando in E la stessa definizione di distanza data in X; se X `e completo, non `e detto per` o che il sottospazio lo sia. Vale comunque la seguente PROPOSIZIONE 1.10 Sia X spazio metrico completo e E ⇢ X. Allora E `e un sottospazio metrico completo di X se e solo se E `e chiuso in X. Dimostrazione. i) E chiuso ) E completo. Sia {xn } ⇢ E una successione fondamentale; essa converge a un elemento x 2 X, essendo X completo; bisogna mostrare che x 2 E. Ci` o `e evidente se {xn } `e definitivamente costante; altrimenti segue dal fatto che x, essendo il limite o x 2 E poich´e E `e chiuso. della successione {xn }, `e un punto di accumulazione di E e perci` ii) E completo ) E chiuso. Sia x 2 X un punto di accumulazione di E; allora possiamo costruire una successione {xn } ⇢ E convergente a x; ma allora x 2 E perch´e E `e completo. ⇤

118

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

OSSERVAZIONE 1.4 Q ⇢ R `e un esempio di spazio metrico non completo; come sottoinsieme di R ovviamente Q non `e chiuso. Si noti che Q, considerato come spazio metrico a s´e stante (non come sottospazio di R) `e chiuso nella sua topologia (ogni spazio metrico X `e contemporaneamente chiuso e aperto in se stesso!). Le nozioni di chiusura e completezza sono equivalenti quando sono riferite a sottoinsiemi (sottospazi) di uno spazio metrico X. Veniamo ora al concetto di compattezza. La definizione di compattezza data per gli insiemi di Rn si trasporta pari pari ai sottoinsiemi di uno spazio metrico X e coinvolge la nozione di copertura. Ricordiamo (cfr. Vol. 1, pag. 128) che per copertura di E ✓ X si intende una famiglia di aperti la cui unione contiene E. Dal momento che, come abbiamo osservato, ogni sottoinsieme di uno spazio metrico `e esso stesso uno spazio metrico, possiamo dare la nozione di compattezza direttamente per uno spazio metrico X. DEFINIZIONE 1.7 Diremo che uno spazio metrico X `e compatto se da ogni sua copertura `e possibile estrarre una famiglia finita di aperti che sia ancora una copertura. Diremo che `e compatto per successioni, o sequenzialmente compatto, se da ogni successione a valori in X si pu` o estrarre una sottosuccessione convergente. Per insiemi X in Rn noi abbiamo dimostrato l’equivalenza delle seguenti a↵ermazioni: (a) X `e compatto; (b) X `e chiuso e limitato; (c) X `e sequenzialmente compatto; (si veda, sul Vol. 1, il Teorema 2.5, pagina128, di Heine-Borel per l’implicazione: (a) ) (b) e il Teorema 4.6, pagina 195, per l’implicazione: (b) ) (c)). Ora le cose non stanno pi` u cos`ı; cominciamo col mostrare con un esempio che (b) ; (c). Esempio 1.14 Consideriamo l’insieme X ⇢ C 0 ([0, 1]) cos`ı definito: X = {f 2 C 0 ([0, 1]) : max |f |  1};

tale insieme `e chiuso e limitato in C 0 ([0, 1]): infatti `e contenuto in ogni intorno dell’origine con raggio > 1 ed `e complementare dell’insieme {f 2 C 0 ([0, 1]) : max |f | > 1}

che `e chiaramente un insieme aperto. Mostriamo che X non `e compatto per successioni. Consideriamo la successione di funzioni fn (t) = tn , che evidentemente appartiene a X. Sappiamo (Esempio 1.12) che essa converge puntualmente, ma non uniformemente, alla funzione (discontinua) f (t) = 0 se 0  t < 1, f (1) = 1. Se una sottosuccessione convergesse uniformemente alla funzione g, questa sarebbe continua per il Corollario 1.5; inoltre, per l’unicit` a del limite, dovrebbe in ogni punto coincidere con f : assurdo! Perci` o dalla successione data non `e possibile estrarre alcuna successione convergente e quindi l’insieme X non `e compatto per successioni in C 0 ([0, 1]).

c 978-88-08-63708-6

1. Spazi funzionali

119

Lo stesso esempio mostra la non validit` a del teorema di Bolzano-Weierstrass al di fuori degli spazi euclidei; infatti l’insieme di funzioni {tn }, limitato e infinito, non ammette alcun punto di accumulazione in C 0 ([0, 1]). Il fatto che il teorema di BolzanoWeierstrass e le sue conseguenze (il teorema di Heine-Borel, il criterio di Cauchy, . . . ) non siano pi` u validi `e l’aspetto pi` u rilevante della di↵erenza tra gli spazi euclidei e gli spazi funzionali non a dimensione finita. Vediamo ora come si possano caratterizzare gli insiemi compatti negli spazi metrici. A questo proposito dobbiamo riconsiderare il concetto di limitatezza di un insieme: esso sembra essere troppo debole negli spazi funzionali. Introduciamo la seguente a totalmente limitato se, DEFINIZIONE 1.8 Sia X uno spazio metrico; esso si dir` 8 " > 0, esiste una copertura di X costituita da un numero finito di aperti, ciascuno con diametro < ". OSSERVAZIONE 1.5 Ovviamente, se uno spazio metrico X `e totalmente limitato `e anche limitato: infatti, se N `e il numero di insiemi che costituiscono la copertura di X, ognuno con diametro < ", tutto lo spazio sar` a contenuto in una palla con diametro < N ". Viceversa, in Rn , un insieme limitato `e anche totalmente limitato: infatti, sia C un cubo di lato l che contiene l’insieme; fissiamo p " > 0 e dividiamo Cp in k n cubi, ognuno di lato l/k, e quindi di diametro l n/k: se scegliamo k > l n/", otteniamo una copertura dell’insieme per mezzo di N = kn cubi, ognuno con diametro < ". Che il concetto di totale limitatezza sia pi` u efficace negli spazi funzionali del concetto di limitatezza `e messo in risalto dalla seguente Proposizione 1.11. Sia X uno spazio metrico completo e consideriamo un insieme E ⇢ X totalmente limitato e infinito. Poich´e E pu` o essere ricoperto da una famiglia finita di palle di a infiniti punti di E; poich´e raggio r, una almeno di queste, diciamo B0 (r), conterr` o essere ricoperto da un numero finito di palle di raggio r/2, B0 (r), a sua volta, pu` a infiniti punti di E; proseguendo in una almeno di queste, diciamo B1 (r/2), conterr` tal modo, si costruisce una successione Bn (r/2n ) di palle, ognuna delle quali contiene infiniti punti di E. Scegliamo ora x0 2 B0 , x1 2 B1 , . . . , xn 2 Bn . . .; la successione {xn } ⇢ E `e tale che: d(xn , xm ) < 2r/2m (se m  n) e pertanto `e fondamentale. Essendo X completo, esiste y 2 X tale che xn ! y; questo punto y `e dunque un punto di accumulazione di E. Abbiamo cos`ı dimostrato una estensione del teorema di Bolzano-Weierstrass: PROPOSIZIONE 1.11 Sia X uno spazio metrico completo e E ⇢ X un insieme totalmente limitato e infinito. Allora E possiede almeno un punto di accumulazione. Consideriamo ora la seguente a↵ermazione: (b0 ) X `e completo e totalmente limitato. Il seguente teorema, di cui non riportiamo la dimostrazione, ci d` a la richiesta caratterizzazione degli insiemi compatti.

120

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

TEOREMA 1.12 Sia X uno spazio metrico. Allora le tre a↵ermazioni: (a), (b0 ), (c) sono equivalenti. Per le applicazioni, `e utile avere a disposizione criteri sufficienti di compattezza, almeno negli spazi metrici pi` u comuni. Uno di tali criteri, valido in C 0 ([a, b]), `e illustrato negli esercizi (teorema di Ascoli-Arzel` a). Questo tipo di teoremi si `e rivelato fondamentale per lo sviluppo della teoria in molti settori dell’Analisi Funzionale, del Calcolo delle variazioni, delle Equazioni alle derivate parziali. *1.5

Densit` a

Esaminiamo ora un altro concetto topologico che gi` a abbiamo introdotto in Rn : quello di insieme denso in un altro. Sia X uno spazio metrico completo; E ⇢ X si dice denso in X se E = X, cio`e se, aggiungendo a E i limiti delle successioni fondamentali di E non convergenti in E, si ottiene tutto lo spazio X; X viene detto il completamento di E (nella metrica assegnata). Esempio 1.15 Q `e denso in R; R `e il completamento di Q. La densit` a di Q in R permette di a↵ermare che, preso un qualsiasi numero reale r (non razionale) e fissato " > 0, possiamo trovare un numero razionale p/q che dista da r meno di " : |r p/q| < ". Cos`ı, se x `e un elemento di uno spazio metrico completo X ed E `e un sottoinsieme di X denso in X, succede, che, o x 2 E, oppure `e possibile trovare un elemento di E, diciamo y, che dista da x meno di " : d(x, y) < ". In altri termini `e possibile approssimare, nella metrica di X, gli elementi di X per mezzo di elementi di E, tanto bene quanto si voglia. Nelle applicazioni spesso accade che X sia uno spazio lineare (oltre che metrico completo). Come abbiamo detto, un sottoinsieme E di X `e esso stesso uno spazio metrico, in generale non completo; non `e uno spazio lineare, a meno che non contenga tutte le combinazioni lineari dei suoi elementi. Conviene allora introdurre una nomenclatura pi` u precisa di quella finora utilizzata. a DEFINIZIONE 1.9 Un sottoinsieme E di uno spazio lineare metrico completo X si dir` sottospazio se `e esso stesso un sottospazio lineare metrico completo di X; si dir` a variet` a lineare se `e un sottospazio lineare di X, metrico, ma non necessariamente completo. Esempi a lineare di C 0 ([0, 1]), 1.16 L’insieme E = {f 2 C 0 ([0, 1]): f (0) = 0} `e una variet` poich´e combinazioni lineari di funzioni continue nulle nell’origine sono ancora funzioni dello stesso tipo; `e anche un sottospazio, poich´e una successione fondamentale di funzioni continue nulle nell’origine converge (uniformemente) a una funzione continua, nulla nell’origine.

1. Spazi funzionali

c 978-88-08-63708-6

121

1.17 L’insieme E = {f 2 C 0 ([a, b]): f polinomio} `e chiaramente una variet` a lineare, non `e un sottospazio: infatti la successione di polinomi 1 1+t 1+t+

t2 2!

.. . 1+t+

tn t2 + ··· + 2! n!

.. . converge uniformemente alla funzione et , che non `e un polinomio (questa a↵ermazione sar` a dimostrata nel Par. 2.3). Condizione necessaria e sufficiente affinche´e una variet` a lineare E sia un sottospazio di X `e che sia chiusa in X (Prop. 1.10). L’Esempio 1.17 ci mostra una variet` a lineare dello spazio delle funzioni continue che non `e un sottospazio; sarebbe interessante vedere o consentirebbe di approssimare (nella metrica se essa `e per` o densa in C 0 ([a, b]); ci` lagrangiana, cio`e uniformemente) ogni funzione continua per mezzo di polinomi. Il seguente teorema d` a una risposta a↵ermativa: esso `e il prototipo di molti “teoremi di densit` a”, sui quali non possiamo so↵ermarci. TEOREMA 1.13 (di Weierstrass) Sia f : [a, b] ! R continua; esiste una successione {Pn } di polinomi tale che: lim Pn = f

n!1

uniformemente in [a, b].

In altre parole, la variet` a lineare dei polinomi `e densa in C 0 ([a, b]). Il tipo di approssimazione considerato nel Teorema 1.13 `e ben diverso dall’approssimazione per mezzo di polinomi ottenuta con la formula di Taylor: innanzitutto, per mezzo dei polinomi di Taylor, si possono approssimare funzioni continue e derivabili con continuit` a un certo numero di volte; ma soprattutto il tipo di approssimazione ottenuto con i polinomi di Taylor `e locale, cio`e l’approssimazione `e tanto migliore quanto pi` u vicini si `e al punto intorno a cui si fa lo sviluppo, mentre in questo caso l’approssimazione `e globale, cio`e `e “ugualmente buona” su tutto l’intervallo considerato. 1.6

Applicazioni tra spazi metrici. Teorema delle contrazioni

Pur essendo il nostro scopo limitato allo studio delle applicazioni tra spazi euclidei, avremo bisogno, per esempio nel Capitolo 4, di un risultato che conviene considerare nella sua piena generalit` a, riguardante applicazioni tra spazi metrici generali. D’altra parte, abbiamo gi` a incontrato esempi di tali applicazioni.

122

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

Esempi 1.18 L’applicazione I che associa a ogni funzione f limitata integrabile sull’intervallo (a, b) il suo integrale definito: Z b f (x)dx. f 7! a

`e un’applicazione lineare (cio`e additiva e omogenea). 1.19 L’applicazione D : C 1 ([a, b]) ! C 0 ([a, b]) associa a ogni funzione f derivabile con continuit` a sull’intervallo [a, b] la sua derivata f 7! f 0 . Anch’essa `e un’applicazione lineare. Siano (X, dX ) e (Y, dY ) due spazi metrici, dotati ognuno della propria metrica: dX e dY . DEFINIZIONE 1.10 Un’applicazione F : X ! Y si dice limitata se l’immagine F (X) `e un insieme limitato (nella metrica di Y ); si dice continua in x0 2 X, se per ogni successione {xn } a valori in X convergente a x0 risulta: lim F (xn ) = F (x0 );

n!1

si dice continua in X se `e continua in ogni punto di X. Queste definizioni ripetono le analoghe definizioni date negli spazi euclidei. Si osservi che, quando si dice: xn convergente a x0 , F (xn ) convergente a F (x0 ), si intende che ognuna di queste successioni converge nella metrica specifica dello spazio a cui u esplicitamente, diremo che: F : X ! Y `e appartiene, xn 2 X, F (xn ) 2 Y . Pi` continua in x0 2 X, se, fissato " > 0, `e possibile trovare = (x0 , "), tale che dY (F (x), F (x0 )) < "

se dX (x, x0 ) < .

L’equivalenza di questa definizione con la precedente si prova esattamente come negli spazi euclidei. Esempi e b) dotato della 1.20 L’applicazione I dell’Esempio 1.18, definita sullo spazio C(a, metrica integrale (1.7), `e continua; infatti risulta |I(f )

I(g)| =

Z

b

(f (t) a

g(t))dt 

Z

b

a

|f (t)

La precedente disuguaglianza si pu` o scrivere nella forma:

che prova la continuit` a di I.

dR (I(f ), I(g))  dCe (f, g)

g(t)|dt.

1. Spazi funzionali

c 978-88-08-63708-6

Anche l’applicazione I : C 0 ([a, b]) ! R `e continua; infatti risulta Z b |f (t) g(t)|dt  max |f g| · (b |I(f ) I(g)|  [a,b]

a

123

a),

cio`e dR (I(f ), I(g))  (b

a)dC 0 (f, g).

Rb Si osservi che la legge che definisce I `e la stessa nei due casi (f 7! a f (t)dt) ma I `e definita su due spazi metrici diversi in un caso e nell’altro. Il secondo caso `e interessante perch´e da esso si deduce subito un corollario del Teorema 1.8: se fn ! f in C 0 ([a, b]) allora I(fn ) ! I(f ) (passaggio al limite sotto il segno di integrale). 1.21 L’applicazione D : C 1 ([a, b]) ! C 0 ([a, b]) dell’Esempio 1.19 `e continua. L’affermazione `e ovvia, viste le metriche adottate su C 1 e su C 0 ; infatti dC 0 (Df, Dg) = max |f 0 [a,b]

g 0 |  max |f 0 [a,b]

g 0 | + max |f [a,b]

g| = dC 1 (f, g).

1.22 Sia (X, dX ) uno spazio metrico. Allora anche X ⇥ X `e metrico con la seguente definizione di distanza: se x e = (x1 , x2 ) e ye = (y1 , y2 ) sono due elementi di X ⇥ X si pone x, ye) = dX (x1 , y1 ) + dX (x2 , y2 ). dX⇥X (e Mostriamo ora che la funzione distanza (in X):

dX : X ⇥ X 7! R

`e continua. Dobbiamo mostrare che (scriviamo ora semplicemente d in luogo di dX ): x ! x0 in X y ! y0 in X

) d(x, y) ! d(x0 , y0 ) in R.

Per la disuguaglianza triangolare si ha: d(x, y)  d(x, y0 ) + d(y0 , y) cio`e d(x, y)

d(x, y0 )  d(y0 , y).

Analogamente, scambiando y con y0 , otteniamo: d(x, y0 ) (1.16)

|d(x, y)

d(x, y)  d(y, y0 ), da cui

d(x, y0 )|  d(y, y0 ).

Allo stesso modo, dalla disuguaglianza: d(x0 , y0 )  d(x0 , x) + d(x, y0 ) si ricava (1.17)

|d(x, y0 )

d(x0 , y0 )|  d(x, x0 ).

E infine, dalle (1.16) e (1.17), abbiamo |d(x, y)

d(x0 , y0 )|  |d(x, y) d(x, y0 )| + |d(x, y0 )  d(y, y0 ) + d(x, x0 ).

d(x0 , y0 )| 

124

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

Quando x ! x0 e y ! y0 il secondo membro della disuguaglianza tende a zero; lo stesso allora avviene del primo membro. Occupiamoci ora di una classe speciale di applicazioni continue. DEFINIZIONE 1.11 Siano (X, dX ) e (Y, dY ) spazi metrici. Un’applicazione F : X ! Y si dice lipschitziana se esiste un numero ⇢ > 0 tale che, per ogni coppia x, y di punti di X, si abbia dY (F (x), F (y))  ⇢dX (x, y). Se poi risulta ⇢ < 1, F si dir` a contrazione, di costante ⇢. Una contrazione, come si vede, “accorcia” le distanze di un fattore ⇢ < 1; da ci` o il nome. La continuit` a delle applicazioni lipschitziane `e evidente. Esempi 1.23 f : R ! R, t 7! at (retta per l’origine) `e una contrazione se |a| < 1, a 6= 0; pi` u in generale, se a `e un vettore (non nullo) di Rn , f : Rn ! R, t 7! ha, ti (iperpiano per l’origine) `e una contrazione se |a| < 1. 1.24 La funzione e t , ristretta alla semiretta [a, +1) con 0 < a, `e una contrazione; infatti, dal teorema del valor medio di Lagrange, abbiamo, presi t, s 2 [a, +1), t > s: e

t

s

=e

(t

s)e



con ⇠ 2 (s, t)

e pertanto |e

t

s

e

|e



|t

s|  e

a

|t

s|.

1.25 Sia f : Rn ! R, di↵erenziabile. Se |rf (x)|  ⇢ < 1, 8x 2 Rn f `e una contrazione. Infatti, per il teorema del valor medio di Lagrange, si pu` o scrivere: f (x)

f (y) = hrf (⇠), x

yi

con ⇠ opportuno sul segmento [x, y]. Poich´e yi  rf (⇠) · x

hrf (⇠), x

y ⇢x

y

si conclude che f (x)

f (y)  ⇢ x

y

e cio`e che f `e una contrazione. 1.26 L’applicazione F : C 0 ([a, b]) ! C 0 ([a, b]) cos`ı definita: Z b f (s) 7! k(s, t)f (t)dt a

dove k : [a, b] ⇥ [a, b] ! R `e una funzione continua, `e detta operatore integrale di nucleo k; essa `e una contrazione se Z b |k(s, t)|dt  ⇢ < 1; max s2[a,b]

a

1. Spazi funzionali

c 978-88-08-63708-6

125

infatti abbiamo: Z

dC 0 (F (f ), F (g)) = max

s2[a,b]

k(s, t)(f (t)

g(t))dt 

a

 max |f [a,b]

b

g| · max

s2[a,b]

Z

a

b

|k(s, t)|dt  ⇢dC 0 (f, g).

Particolarmente significativo `e il caso X = Y . Data un’applicazione F : X ! X, `e spesso importante stabilire se essa ammette dei punti fissi, cio`e punti che vengono trasformati in s´e stessi dall’applicazione F ; in altri termini x ¯ `e punto fisso per F se F (¯ x) = x ¯. Abbiamo gi` a incontrato questo problema parlando della risoluzione numerica di equazioni (Teor. 3.7, pag. 308, Vol. 1). Il teorema seguente generalizza il risultato citato, situandolo nel suo ambiente naturale: gli spazi metrici. TEOREMA 1.14 (di Banach-Caccioppoli, delle contrazioni) Sia X uno spazio metrico completo ed F : X ! X una contrazione di costante ⇢. Allora F ammette un unico punto fisso x ¯. Inoltre, dato un qualunque x0 2 X, la successione definita ricorsivamente ponendo (1.18)

xn+1 = F (xn ),

n

0,

converge a x ¯. Dimostrazione. Unicit` a. Se x1 e x2 sono due punti fissi per F , risulta F (x1 ) = x1 , F (x2 ) = x2 e quindi: d(x1 , x2 ) = d(F (x1 ), F (x2 ))  ⇢d(x1 , x2 ) da cui si ricava, essendo ⇢ < 1, d(x1 , x2 ) = 0, cio`e x1 = x2 . Esistenza. Consideriamo la successione {xn } definita in (1.18) e dimostriamo che `e convergente. Si ha, per ogni n, (1.19)

d(xn+1 , xn ) = d(F (xn ), F (xn

1 ))

 ⇢d(xn , xn

1 ).

Iterando la (1.19) si ottiene, per induzione, (1.20)

d(xn+1 , xn )  ⇢n d(x1 , x0 ).

Sia ora n > m; usando ripetutamente la disuguaglianza triangolare e la (1.20) si ottiene d(xn , xm ) 

n X1

k=m

d(xk+1 , xk )  d(x1 , x0 )

 d(x1 , x0 )

1 X

k=m

⇢k = d(x1 , x0 )

n X1

k=m

⇢k 

⇢m . 1 ⇢

Poich´e ⇢m ! 0 per m ! 1, la successione {xn } risulta fondamentale e pertanto, essendo X completo, convergente. Detto x e il suo limite, risulta, per la continuit` a dell’applicazione F , e. F (e x) = F (lim xn ) = lim F (xn ) = lim xn+1 = x



126

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

OSSERVAZIONE 1.6 Assegnato x0 2 X, i punti della successione ricorsiva {xn } definita dalla (1.18) si calcolano applicando ripetutamente la funzione f (detta generatrice): x1 = f (x0 ), x2 = f 2 (x0 ), . . . , xn = f n (x0 ), . . . , dove f n = f f . . . f indica l’iterata | {z } n volte

n-esima di f . La successione {xn } = {f n (x0 )} prende il nome di orbita uscente da x0 . Il teorema a↵erma che l’orbita uscente da un qualunque punto di X converge all’unico punto fisso x ¯. Significativi esempi di applicazione del Teorema 1.14 si avranno nel Capitolo 4.

1.7 Spazi normati e spazi dotati di prodotto scalare Gli spazi pi` u importanti che si incontrano nelle applicazioni non soltanto sono metrici e lineari, ma sono anche normati; in qualche caso risultano anche dotati di prodotto scalare. Conviene richiamare la definizione di spazio normato, gi` a introdotta nella Sezione 3.1.4, Volume 1. DEFINIZIONE 1.12 Uno spazio lineare X (sul campo ⇤ reale o complesso) si dice normato se `e definita un’applicazione (detta norma) k·k : X ! R tale che 8 x, y 2 X, 2 ⇤ valgono le seguenti propriet` a N

1.

kxk

0; kxk = 0 , x = 0

2.

k xk = | | kxk

3.

kx + yk  kxk + kyk.

Vale anche (si veda 3.1.4 Vol. 1) la seguente, che si deduce dalle precedenti: N

4.

kxk

kyk  kx

yk.

Uno spazio normato `e anche metrico, con la seguente definizione di distanza: d(x, y) := kx

yk.

Gli intorni sferici di x di raggio r sono gli insiemi B(x, r) := {y 2 X : kx

yk < r}.

Le successioni fondamentali in X sono quelle per cui lim kxn

n,m!1

xm k = 0.

Una successione {xn } si dir` a convergente a x 2 X se: lim kxn

n!1

xk = 0.

Se lo spazio X `e completo prende il nome di spazio di Banach.

1. Spazi funzionali

c 978-88-08-63708-6

127

Esempi 1.27 Lo spazio C 0 ([a, b]) `e normato con la norma kfC 0 k = max |f |. [a,b]

Questa norma `e detta lagrangiana; la metrica indotta da questa norma `e precisamente la metrica lagrangiana (1.3); perci` o C 0 ([a, b]) `e uno spazio di Banach. 1 Anche C ([a, b]) `e uno spazio di Banach con la seguente definizione di norma kf kC 1 ([a,b]) = max |f | + max |f 0 |. [a,b]

[a,b]

L’a↵ermazione si estende in modo ovvio a tutti gli spazi di Lagrange C k ([a, b]). 1.28 Se l’intervallo I non `e compatto, ma le funzioni sono limitate in I, useremo la norma dell’estremo superiore invece che la norma del massimo. Cos`ı, sugli spazi a k volte, con derivate limitate, Cbk (I) delle funzioni continue e derivabili con continuit` porremo kf kC k = sup |f | + sup |f 0 | + · · · + sup |f (k) | I

I

I

cosicch´e anch’essi sono spazi di Banach. Osserviamo infine che la norma: k·k : X ! R `e un’applicazione continua, cio`e xn ! x ) kxn k ! kxk. Ci` o segue subito dalla propriet` a N 4 della norma, scrivendo kxk

kxn k  kx

xn k.

Sia ora X uno spazio lineare (sul campo reale o complesso ⇤); ricordiamo che il prodotto scalare `e un’applicazione h·, ·i : X ⇥ X ! ⇤, tale che, 8 x, y, z 2 X e 8 2 ⇤ valgono le seguenti propriet` a: S

1. hx, xi reale

0; hx, xi = 0 , x = 0

2. hx, yi = hy, xi 3. hx + y, zi = hx, zi + hy, zi 4. h x, yi = hx, yi.

Un’altra propriet` a del prodotto scalare (Teor. 1.1, pag. 112, Vol. 1) `e la disuguaglianza di Cauchy-Schwarz: p p |hx, yi|  hx, xi · hy, yi che consente di introdurre una norma, ponendo: p kxk := hx, xi.

Cos`ı, uno spazio dotato di prodotto scalare `e anche normato (e dunque metrico); se `e completo, prende il nome di spazio di Hilbert. Un tale spazio, che supponiamo,

128

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

ovviamente, non a dimensione finita, ha dunque un complesso di strutture che lo rendono “simile” a uno spazio euclideo; naturalmente, dal punto di vista topologico vi sono importanti di↵erenze, come abbiamo messo in luce nel Paragrafo 1.4. Non siamo in grado, per il momento, di fornire alcun esempio di spazio hilbertiano non euclideo (si veda per` o l’Esercizio 3). Il problema non `e quello di definire un prodotto scalare, ma piuttosto quello della completezza dello spazio. Per esempio, in C 0 ([a, b]) possiamo tentare di introdurre un prodotto scalare imitando la definizione data in Rn : n X xk yk . hx, yi := k=1

Passiamo dal discreto al continuo: sostituiamo all’indice discreto k, variabile tra 1 e n, la variabile continua t 2 [a, b], al vettore x = (x1 , . . . , xn ) la funzione x = x(t), alla sommatoria l’integrale, e poniamo (1.21)

hx, yi :=

Z

b

x(t)y(t)dt.

a

` facile mostrare che la (1.21) `e una buona definizione di prodotto scalare in C 0 ([a, b]) E sul campo reale; ma la metrica indotta dalla (1.21), e cio`e

d(x, y) = kx

yk =

Z

b

(x(t)

2

!1/2

y(t)) dt

a

non `e la metrica lagrangiana, ma la metrica integrale di ordine 2; come abbiamo gi` a avvertito, C 0 ([a, b]) non `e completo rispetto a questa metrica. Quale sia il suo completamento `e una questione delicata, che sar` a ripresa pi` u avanti. Il prodotto scalare, cos`ı come la distanza e la norma, `e una funzione continua, cio`e: xn ! x yn ! y

) hxn , ym i ! hx, yi.

Infatti, basta scrivere hxn , ym i

hx, yi = hxn

x, ym

yi + hxn

x, yi + hx, ym

yi

e applicare la disuguaglianza di Cauchy-Schwarz: |hxn , ym i

hx, yi|  kxn

xk · kym

yk + kxn

xk · kyk + kxk · kym

yk.

L’asserto segue facendo tendere n, m all’infinito. In uno spazio funzionale dotato di prodotto scalare si pu` o parlare di funzioni (vettori) ortogonali; due funzioni si diranno ortogonali se il loro prodotto scalare `e nullo. Mostriamo esempi di funzioni ortogonali rispetto al prodotto scalare (1.21).

1. Spazi funzionali

c 978-88-08-63708-6

129

Esempi 1.29 Il sistema trigonometrico sul campo reale. Nello spazio C 0 ([ ⇡, ⇡]) consideriamo le funzioni sin nt cos nt 1 sin t cos t sin 2t cos 2t p , p , p , p , p ,..., p , p ,... ⇡ ⇡ ⇡ ⇡ ⇡ ⇡ 2⇡ Valgono le seguenti relazioni (che si possono verificare, per esempio, applicando le formule di prostaferesi): 8 n, m 2 N abbiamo ( Z ⇡ 0 se m 6= n cos mt cos nt dt = ⇡ se m = n 6= 0 ⇡ Z ⇡ cos mt sin nt dt = 0 (1.22) ⇡ ( Z ⇡ 0 se m 6= n sin mt sin nt dt = ⇡ se m = n 6= 0. ⇡ Queste relazioni possono essere scritte in forma pi` u compatta ed espressiva; poniamo, per n = 1, 2, . . .: 1 x0 (t) = p , 2⇡

cos nt x2n (t) = p , ⇡

x2n

1 (t)

sin nt = p ⇡

e definiamo un prodotto scalare ponendo: Z ⇡ x(t)y(t)dt. (1.23) hx, yi := ⇡

Risulta allora, 8 n, m 2 N: (1.24)

hxm , xn i =

nm

dove nm `e il simbolo di Kronecker. Perci` o la successione {xn } costituisce un sistema di versori (cio`e vettori di norma unitaria) ortogonali, esattamente come succede, in Rn , per i vettori della base canonica: e1 , e2 , . . . , en . Si noti, che, essendo le funzioni xn (t) tutte periodiche di periodo comune 2⇡, le relazioni (1.22) restano valide se si sostituisce all’intervallo ( ⇡, ⇡) un qualunque altro o un sistema di intervallo, purch´e di ampiezza 2⇡; le funzioni {xn } costituiscono perci` versori ortogonali su qualunque intervallo del tipo (a, a + 2⇡). 1.30 Un sistema di versori ortogonali rispetto al prodotto scalare (1.23) su un generico intervallo (a, b) si ottiene dal precedente con una semplice sostituzione di variabili. Posto ⌧ = b a e ⌧ (1.25) s=t 2⇡ le funzioni

✓ ◆ ✓ ◆ 1 2⇡n 2⇡n p , . . . , sin s , cos s ,... ⌧ ⌧ 2⇡

130

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

risultano ora periodiche di periodo comune ⌧ ; come subito si verifica, esse sono ortogonali sull’intervallo (0, ⌧ ), come su qualunque altro intervallo (a, b) di ampiezza ⌧ . ` talvolta utile, invece che 1.31 Il sistema trigonometrico sul campo complesso. E considerare le funzioni (reali) dell’Esempio 1.29, considerare certe loro combinazioni lineari a coefficienti complessi, e precisamente: sin nt eint cos nt p +i p =p , 2⇡ 2⇡ 2⇡

cos nt p 2⇡

sin nt e int ip = p . 2⇡ 2⇡

Consideriamo allora il sistema di funzioni: eint xn (t) = p 2⇡

n 2 Z.

Esso risulta un sistema di versori ortogonali rispetto al prodotto scalare cos`ı definito: Z ⇡ (1.26) hx, yi = x(t)y(t)dt. ⇡

Ancora potremo sostituire all’intervallo ( ⇡, ⇡) qualunque intervallo di ampiezza 2⇡. OSSERVAZIONE 1.7 Consideriamo lo spazio delle funzioni continue su [ ⇡, ⇡], dotato del prodotto scalare (1.23) o (1.26) e perci` o della metrica integrale di ordine 2, rispetto alla quale tale spazio non `e completo. Il sistema trigonometrico (sia quello sul campo reale che quello sul campo complesso) ci fornisce un esempio di insieme infinito, limitato (tutti i vettori hanno norma 1 e perci` o sono contenuti in una palla di raggio r > 1), senza punti di accumulazione (ogni vettore `e un punto isolato, perch´e ha distanza da p qualunque altro pari a 2).

Complementi con esercizi Spazio metrico dei compatti Indichiamo con K la famiglia degli insiemi compatti di R2 . Se A 2 K e intorno di A l’insieme A := {x 2 R2 : d(x, A) < }

> 0, definiamo

dove d(x, A), la distanza del punto x dall’insieme A, `e cos`ı definita: d(x, A) := inf |x y2A

y|.

Mostrare che K `e uno spazio metrico con la seguente definizione di distanza (metrica di Hausdor↵): dK (A, B) := inf{ : A ⇢ B e B ⇢ A }. Per esempio, la distanza di due cerchi concentrici, di raggi r1 e r2 (r2 > r1 ) `e r2 r1 ; la distanza di due cerchi disgiunti `e pari alla distanza dei centri pi` u r2 r1 (si veda Fig. 3.4).

1. Spazi funzionali

c 978-88-08-63708-6

B A

r2

xA r1

r1

dK (A, B) = r2

xB

131

r2

A B

r1

dK (A, B) = r2

r1 + d(xA , xB )

Figura 3.4. Metrica di Hausdor↵ in R2 .

Spazi di successioni Siano x = (x1 , x2 , . . . , xn , . . .), y = (y1 , y2 , . . . , yn , . . .) successioni a valori in R oppure in C. L’insieme di tali successioni forma uno spazio lineare, avendo definito la somma di successioni x + y := (x1 + y1 , x2 + y2 , . . . , xn + yn , . . .) e il prodotto di una successione per un numero x := ( x1 , x2 , . . . , xn , . . .). Questo spazio sar` a indicato con R1 (o C1 ). In questo spazio consideriamo i seguenti vettori: e1 = (1, 0, 0, . . . , 0, . . .) e2 = (0, 1, 0, . . . , 0, . . .) .. .

(1.27)

en = (0, 0, 0, . . . , 1, . . .) .. . Questi sono linearmente indipendenti e costituiscono una base per R1 , il quale perci` o non ha dimensione finita. Questo esempio illustra il passaggio, diciamo cos`ı, “naturale”, dalla dimensione finita alla dimensione infinita. Si indicano con l1 , l1 , l2 , rispettivamente, i sottoinsiemi di R1 cos`ı definiti: l1 := {x 2 R1 : sup |xi | < 1} i

1

l :=

2

l :=

( (

1

x2R

1

x2R

:

1 X i=1

:

1 X i=1

)

|xi | < 1 2

)

|xi | < 1 ;

l1 `e l’insieme delle successioni limitate, l1 delle successioni sommabili, l2 delle successioni di quadrato sommabile.

132

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

1. Mostrare che l1 , l1 , l2 sono spazi lineari, sottospazi di R1 . (Per l2 ricordare che: |a+b|2 

2|a|2 + 2|b|2 ).

2. Mostrare che l1 , l1 , l2 , sono spazi normati con le seguenti definizioni di norma:

per l1 , kxk1 := sup |xi | i

1

per l , kxk1 := 2

per l , kxk2 :=

1 X i=1

|xi |

1 X i=1

2

|xi |

!1/2

;

l2 inoltre `e dotato di prodotto scalare, cos`ı definito: hx, yi :=

1 X

xi y i .

i=1

Si osservi che le metriche indotte su l1 , l1 , l2 dalla precedente definizione di norma sono analoghe rispettivamente alle metriche d1 , d1 , e pitagorica introdotte in Rn nell’Esempio 1.2 3.* Dimostrare che tutti e tre gli spazi nell’Esercizio 2 sono completi, cio` e sono spazi di Banach; l2 inoltre, essendo dotato di prodotto scalare, `e uno spazio di Hilbert. 4. Mostrare che, in ognuno degli spazi l1 , l1 , l2 , l’insieme dei vettori en (n 2 N) (definiti in (1.27)) `e limitato, non ha punti di accumulazione (quindi `e chiuso), non `e compatto. p 2 5. Sia '(t)R= e t /2 / 2⇡ (campana di Gauss; diagramma n. 22 sul Vol. 1). Mostreremo pi` u +1 avanti che 1 '(t)dt = 1 (Esempio 1.22, pag. 334):

i) Mostrare che R pu` o essere metrizzato con la seguente definizione di distanza: Z y '(t)dt ; d(x, y) = x

R risulta limitato, diam(R) = 1. Interpretare geometricamente questa distanza. ii) Si dimostri che xn ! y nella metrica d se e solo se xn ! y nella solita metrica pitagorica; da ci` o si deduca che R, con la metrica d, `e completo. 6. Dimostrare che la successione di funzioni:

fn (t) =

nt 1 + n2 t2

i) converge a 0 in ogni punto di R; ii) converge uniformemente in [1, +1]; iii) non converge uniformemente in [ 1, 1]. Pu` o essere utile disegnare i grafici delle funzioni fn . 7. Trovare il limite della successione di funzioni:

fn (t) =

n2 t2 , 1 + n2 t2

t2R

Discutere l’uniformit` a della convergenza, sia direttamente sia utilizzando il Corollario 1.5.

1. Spazi funzionali

c 978-88-08-63708-6

133

8. Dimostrare che la successione di funzioni:

fn (t) = n↵ te

nt

↵2R

i) converge a 0 per ogni t 2 [0, +1) (qualunque sia ↵); ii) converge uniformemente in [1, +1] (qualunque sia ↵); iii) converge uniformemente in [0, 1] se ↵ < 1, non converge uniformemente se ↵

1.

(Conviene disegnare i grafici delle funzioni fn ). 9. Sia

8 p 0 possiamo determinare N = N (") (N indipendente da t) tale per cui risulti |s(t)

sn (t)| < " se n > N,

8 t 2 [ r, r].

Ci` o assicura la convergenza uniforme della serie data in [ r, r]. La serie non converge uniformemente in ( 1, 1), come sar` a osservato nell’Esempio 2.2. Come per le serie numeriche, cos`ı per quelle di funzioni vale il criterio di Cauchy che P si deduce dall’omonimo criterio per le successioni, Proposizioni 1.1 e 1.2: la serie xn (t) di funzioni: I ! R converge puntualmente in I se e solo se, fissato " > 0, 8 t 2 A si pu` o determinare un indice N = N (", t) tale che, 8 p N e 8 q 0 si abbia (2.1)

|xp (t) + xp+1 (t) + · · · + xp+q (t)| < ".

La convergenza `e uniforme se e solo se esiste un indice N = N (") (indipendente da t) tale che la (2.1) sia valida 8 t 2 I, 8 p N , 8 q 0. Come corollario immediato si ricava che: P se xn (t) converge puntualmente (uniformemente) in I allora xn (t) ! 0 puntualmente (uniformemente) in I. Un semplice criterio sufficiente per la convergenza uniforme di una serie `e il seguente: PROPOSIZIONE 2.1 (Criterio di Weierstrass) Data la successione di funzioni xn : I ! R, se esistono costanti positive cn tali che i) |xn (t)|  cn , 8 t 2 A, definitivamente; P ii) cn `e convergente; P allora la serie di funzioni xn (t) converge uniformemente in I.

P Dimostrazione. La convergenza della serie cn implica che, fissato " > 0, esista N = N (") per cui 8 p N, 8 q 0. cp + cp+1 + · · · + cp+q < " Allora abbiamo, per la i), eventualmente aumentando N = N ("), t 2 I : |xp (t) + · · · + xp+q (t)|  |xp (t)| + · · · + |xp+q (t)|  cp + · · · + cp+q < "; ci` o garantisce la convergenza uniforme in base al criterio di Cauchy.



In molte applicazioni le funzioni xn sono elementi di uno spazio diPBanach; allora il criterio di Cauchy, necessario e sufficiente per la convergenza di xn , prende la forma seguente: fissato " > 0, esiste N = N (") tale che

|xp + xp+1 + · · · + xp+q | < "

8p

N, 8 q

0.

Abbiamo anche un criterio sufficiente di convergenza che ricorda il criterio di Weierstrass.

2. Serie di funzioni

c 978-88-08-63708-6

137

TEOREMA 2.2 (della convergenza totale)P Sia {xn } una successione a valori inPuno xn spazio di Banach. Se la serie delle norme kxn k `e convergente, anche la serie `e convergente, e inoltre 1 X

(2.2)

n=0

xn 

1 X

n=0

kxn k.

Dimostrazione. La convergenza della serie numerica N = N (") per cui

P

kxn k implica che, fissato " > 0, esista

kxp k + kxp+1 k + · · · + kxp+q k < "

8p

N, 8 q

0.

Allora abbiamo, per la propriet` a N 3 della norma, kxp + xp+1 + · · · + xp+q k  kxp k + kxp+1 k + · · · + kxp+q k < ",

P che implica la convergenza della serie xn per il criterio di Cauchy. La (2.2) segue poi dal ⇤ fatto che essa `e vera per ogni somma parziale.

Una serie per la quale converge la serie delle norme si dice totalmente convergente. Se lo spazio `e R o C, e dunque si tratta di serie numeriche, la convergenza totale coincide con la convergenza assoluta, cio`e la convergenza della serie dei valori assoluti. Se lo spazio `e C 0 ([a, b]) oppure Cb0 (I) oppure B(I) (spazi di Banach con la norma del massimo o dell’estremo superiore) il teorema a↵erma che la serie di funzioni P P (limitate) xn (t) converge uniformemente se `e convergente la serie (numerica) sup |xn (t)|; t2I

ritroviamo quindi il criterio di Weierstrass. L’importanza della convergenza uniforme rispetto alla convergenza puntuale viene messa in luce dai seguenti teoremi, che non sono altro che la riformulazione dei Teoremi 1.4, 1.6, 1.8 gi` a dimostrati per le successioni. TEOREMA 2.3 (Limite di una serie) Siano fn : I ! R e t0 2 I. Se i)

1 P

fn (t) converge uniformemente in I con somma F (t);

n=0

ii) esistono finiti i limiti: lim fn (t) = ln ; allora la serie

t!t0

1 P

ln converge, e, detta L la sua somma, risulta lim F (t) = L, cio`e t!t0

n=0

(2.3)

lim

t!t0

1 X

n=0

fn (t) =

1 X

n=0

lim fn (t).

t!t0

Dal teorema scende immediatamente il seguente corollario (analogo del Corollario 1.5 per le successioni) COROLLARIO 2.4 La somma di una serie uniformemente convergente di funzioni continue `e una funzione continua.

138

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

Esempio 2.2 Mostriamo che la serie geometrica

1 P

c 978-88-08-63708-6

tn non converge uniformemente

n=0

nell’intervallo ( 1, 1); se infatti convergesse uniformemente, essendo lim tn = 1,

t!1

lim tn = ( 1)n

t! 1

le due serie dei limiti: 1 + 1 + 1 + ··· ,

1

1+1

1 + ···

sarebbero convergenti. TEOREMA 2.5 (Derivata di una serie) Sia data una successione di funzioni fn : (a, b) ! R derivabili; se P 0 i) la serie delle derivate fn (t) `e uniformemente convergente in (a, b), con somma G(t); ii) la serie delle funzioni converge almeno in un punto t0 2 (a, b); P allora anche la serie fn (t) converge uniformemente in (a, b); detta F (t) la sua somma, risulta F derivabile e F 0 = G cio`e: (2.4)

1 1 X d X fn (t) = fn0 (t). dt n=0 n=0

P P 0 COROLLARIO 2.6 Se le funzioni fn sono di classe C k in (a, b) e le serie fn , fn , . . ., P (k) fn convergono uniformemente in (a, b) con somma F, G1 , . . . , Gk rispettivamente, allora anche F `e di classe C k in (a, b) e risulta F (i) = Gi (i = 1, 2, . . . , k). Esempio 2.3 La serie 1 X tn+1 n+1 n=0

converge per t = 0 (con somma 0). La serie delle derivate

1 P

tn converge unifor-

n=0

memente in [ r, r], 0 < r < 1, con somma (1 t) 1 ; allora la serie data converge anch’essa uniformemente in [ r, r] e, detta F la sua somma, risulta F 0 (t) =

1 1

Tenuto conto che F (0) = 0, abbiamo F (t) =

t

.

log(1

t).

OSSERVAZIONE 2.1 Il Teorema 1.6 e, di conseguenza, il Teorema 2.5, possono estendersi alle funzioni di pi` u variabili senza difficolt` a. In particolare, ci sar` a utile nel seguito la seguente proposizione, analoga del Corollario 2.6: sia ⌦ ✓ Rm , aperto;

2. Serie di funzioni

c 978-88-08-63708-6

139

P P se le funzioni fn : ⌦ ! R sono di classe C 1 in ⌦ e le serie fn , @fn /@ti (i = 1, 2, . . . , m) convergono uniformemente in ⌦ con somma F , Gi rispettivamente, allora anche F `e di classe C 1 in ⌦ e risulta @F/@ti = Gi . Si pu` o estendere il teorema anche alle funzioni di variabile complessa; anzi, in questo caso, valgono risultati pi` u specifici, tipici della teoria delle funzioni olomorfe, sui quali non possiamo so↵ermarci. TEOREMA 2.7 (Integrale di una serie) Sia data P una successione fn di funzioni limitate e integrabili sull’intervallo (a, b); se la serie fn (t) converge uniformemente in (a, b) con somma F (t), allora F `e integrabile e si ha Z

(2.5)

1 bX

fn (t)dt =

a n=0

1 Z X

n=0

b

fn (t)dt.

a

In particolare, se le fn sono continue su [a, b], anche la somma F `e continua, perci` o integrabile su [a, b] e vale la (2.5). Questo teorema, che `e di larghissimo impiego in molte applicazioni, pu` o essere utilizzato anche in presenza di integrali generalizzati. Verifichiamolo con un esempio. Esempio 2.4 Si consideri l’integrale J=

Z

1

0

t3 dt . et 1

Esso interviene in Meccanica quantistica, quando si voglia calcolare, a partire dalla legge di Planck dell’irraggiamento, la densit` a totale di energia di un risonatore (per esempio, un oscillatore armonico). L’integrale J esiste, poich´e la funzione integranda, continua in (0, +1), `e continua anche nell’origine (tende a zero per t ! 0+) ed `e infinitesima all’infinito di ordine superiore a qualsiasi potenza di 1/t. Abbiamo perci` o: J = lim

!!+1

Osserviamo ora che la serie

Z

!

0

1 P

t3 dt = lim et 1 !!+1

t3 e

nt

Z

!

e

t

0

t3 1 e

t

dt.

`e uniformemente convergente in [0, +1) con

n=0

somma t3 /(1 e t ) (si ricordi la somma della serie geometrica; per dimostrare l’uniforme convergenza si usi il criterio di Weierstrass dopo aver notato che: t3 e

nt



max t3 e

nt

t2[0,+1)

=

27e n3

3

(n = 1, 2, . . .)).

Allora possiamo applicare il Teorema 2.7; abbiamo: J = lim

!!+1

Z

0

1 !X

n=0

3

t e

(n+1)t

dt = lim

!!+1

1 Z X

n=0

0

!

t3 e

(n+1)t

dt.

140

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

La serie

1 P

R!

'n (!), con 'n (!) =

0

n=0

t3 e

(n+1)t

c 978-88-08-63708-6

dt, `e uniformemente convergente in

[0, +1) ancora per il criterio di Weierstrass, poich´e: Z ! Z 1 t3 e (n+1)t dt  t3 e (n+1)t dt = 6/(n + 1)4 . 0

0

Allora possiamo applicare il Teorema 2.3 e scrivere finalmente: J=

1 X

n=0

lim

!!+1

Z

!

t3 e

(n+1)t

dt = 6

0

1 X

1 . (n + 1)4 n=0

Nel Paragrafo 2.5 dimostreremo che l’ultima serie (si veda l’Esercizio 10), ha somma ⇡ 4 /90. In conclusione abbiamo ottenuto: J=

⇡4 . 15

2.2 Serie di potenze Studiamo ora in dettaglio una classe speciale di serie di funzioni; si tratta delle serie di potenze, cio`e serie della forma 1 X

an (x

x0 )n

n=0

dove an sono numeri reali assegnati; x varia in un insieme A ✓ R e x0 2 A `e dato. Diciamo subito che serie di questo tipo trovano la loro collocazione pi` u naturale nel campo complesso e perci` o considereremo sin dal principio serie della forma 1 X

an (z

z0 )n

n=0

an , z0 2 C

dove z varia in un insieme A ✓ C. Con un semplice cambiamento di variabile, si pu` o assumere z0 = 0 e ricondursi allo studio delle serie del tipo 1 X

(2.6)

n=0

an z n = a0 + a1 z + a2 z 2 + · · · + an z n + · · ·

` evidente che tutte le serie del tipo (2.6) convergono almeno in un punto: z = 0. Si E tratta di vedere se convergono in qualche altro punto; il seguente lemma precisa, dal punto di vista geometrico, l’insieme di convergenza. LEMMA 2.8 Se una serie di potenze converge in un punto z0 2 C, allora converge (assolutamente) in ogni punto z con |z| < |z0 |.

P Dimostrazione. Per ipotesi, la serie an z0n `e convergente e perci` o il suo termine generale n a definitivamente minore di 1, tende a zero: lim an z0 = 0; ne segue che il suo modulo sar` n!1

cio`e esiste N tale che

|an z0n | < 1

per n > N.

2. Serie di funzioni

c 978-88-08-63708-6

141

Risulta allora, per n > N , |an z n | = |an z0n |

z z0

n



z z0

n

;

P poich´e la serie (geometrica) |z/z0 |n converge se |z/z0 | < 1, nella stessa ipotesi la serie ⇤ data risulta convergente (assolutamente) per il teorema del confronto.

Il lemma ci dice non solo che, se la serie (2.6) converge in z0 , converge anche nel o convergere neppure cerchio: |z| < |z0 |, ma anche che, se non converge in z0 , non pu` o l’insieme dei punti z 2 C in cui una serie del tipo (2.6) converge per |z| > |z0 |; perci` `e un cerchio con centro nell’origine e un certo raggio r: tale cerchio si chiama cerchio di convergenza e r si dir` a raggio di convergenza. Una definizione pi` u precisa `e la seguente: sia A ✓ C l’insieme di convergenza per la serie (2.6) e sia E = {|z| : z 2 A} l’insieme dei numeri reali non negativi che coincidono con i moduli dei numeri che stanno in A: tale insieme non `e vuoto, poich´e contiene almeno lo zero. Definiamo allora il raggio di convergenza r ponendo: r := sup E Pu` o essere: i) r = 0; la serie converge solo per z = 0; ii) r = +1; la serie converge per ogni z 2 C; iii) 0 < r < +1; la serie converge per |z| < r, non converge per |z| > r; nessuna informazione abbiamo per |z| = r. Si noti che, all’interno del cerchio di convergenza, la serie converge assolutamente; possiamo perci` o determinare il raggio di convergenza applicando i criteri di convergenza P |an | |z|n . assoluta, cio`e studiando la convergenza della serie Il seguente teorema `e utile per il calcolo del raggio di convergenza. P TEOREMA 2.9 (Criterio della radice) Data la serie an z n , sia p (2.7) l = lim n |an |. n!1

Allora r = 1/l `e il raggio di convergenza (si intende che r = 0 se l = +1, r = +1 se l = 0).

Dimostrazione. Sia 0 < l < +1. p Poich´e l `e l’estremo inferiore dei numeri definitivamente maggioranti della successione { n |an |} (si veda la Proposizione 3.14, pag. 178, Vol. 1), fissato " > 0 si avr` a p n |an | < l + " definitivamente e q nk |ank | > l " per infiniti indici nk .

Sia ora |z| < 1/l; posso scegliere " > 0 in modo che sia |z|(l + ") = q < 1. Utilizzando la o prima disuguaglianza risulter` a allora, definitivamente, |an ||z|n < q n ; la serie data `e perci` convergente per il teorema del confronto. Sia |z| > 1/l; posso scegliere " > 0 in modo che sia |z|(l ") 1; utilizzando la seconda disuguaglianza risulter` a allora, definitivamente, o non pu` o convergere. |ank ||z|nk 1; la serie data perci` Lasciamo per esercizio la discussione dei casi l = 0 e l = 1.



142

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

Invece di usare il criterio della radice, si pu` o anche usare il criterio del rapporto, meno generale ma spesso pi` u conveniente; una formulazione semplificata, ma utile, `e la seguente: P an z n , se esiste il limite PROPOSIZIONE 2.10 (Criterio del rapporto) Data la serie lim

n!1

|an+1 | =l |an |

allora r = 1/l `e il raggio di convergenza. L’a↵ermazione `e unaPconseguenza immediata del Corollario 2.9, pagina 436, Volume 1, applicato alla serie |an | |z|n . Esempio 2.5 Le serie 1 X

n=0

n!z n ,

1 X zn , n! n=0

1 ✓ ◆ X ↵ n z , n n=0

1 X zn n↵ n=1

↵2R

hanno, rispettivamente, i seguenti raggi di convergenza: 0, 1, 1, 1. Verifichiamolo per la terza serie, usando il criterio del rapporto: ✓ ◆ ↵ n! |↵(↵ 1) . . . (↵ n)| n+1 ✓ ◆ = = ↵ (n + 1)! |↵(↵ 1) . . . (↵ n + 1)| n |↵ n| = !1 per n ! 1. n+1 Consideriamo ora le serie con raggio di convergenza r > 0; esse definiscono, per |z| < r, una funzione f (z), la loro somma: (2.8)

f (z) =

1 X

n=0

an z n ,

|z| < r.

Ci proponiamo di studiare le propriet` a di f e le sue relazioni con i coefficienti della serie. PROPOSIZIONE 2.11 i) La serie (2.8) converge uniformemente in ogni cerchio: |z|  r0 , con r0 < r. ii) La somma f (z) `e continua in |z| < r. Dimostrazione. i) La serie (2.8) converge assolutamente nel punto (dell’asse reale positivo) z = r0 , poich´e `e interno al cerchio di convergenza; cio`e converge la serie numerica P |an |r0n . D’altra parte, se |z|  r0 , risulta |an z n |  |an |r0n ; la serie (2.8) allora converge uniformemente, in virt` u del criterio di Weierstrass. ii) La somma f (z) della serie (2.8) risulta continua in ogni cerchio |z|  r0 , con r0 < r, essendo la somma di una serie uniformemente convergente di funzioni continue; per l’arbitrariet` a ⇤ di r0 , f (z) `e continua nel cerchio: |z| < r.

2. Serie di funzioni

c 978-88-08-63708-6

143

PROPOSIZIONE 2.12 i) La serie delle derivate della serie (2.8) `e ancora una serie di potenze che ha lo stesso cerchio di convergenza della (2.8). ii) La somma f (z) della serie (2.8) `e derivabile (in senso complesso) con derivata continua in |z| < r; la sua derivata f 0 (z) `e la somma della serie delle derivate. Dimostrazione.

i) La serie delle derivate `e

1 P

nan z n

1

la quale, cambiando l’indice di

n=1

sommatoria da n in n + 1, pu` o anche scriversi 1 X

(2.9)

(n + 1)an+1 z n .

n=0

` dunque una serie di potenze con coefficienti bn = (n + 1)an+1 . E Scriviamo ora p p p n+1 n |bn | = n n + 1( n+1 |an+1 |) n .

Risulta allora (applicando il Teorema 2.9, tenuto conto che: lim

n!1

p n n + 1 = 1) che la serie

(2.9) ha lo stesso raggio di convergenza della serie (2.8). ii) Sia g(z) la somma della serie (2.9); per quanto dimostrato nella Proposizione 2.11, essa `e continua in |z| < r. Inoltre, scrivendo z = x+iy, possiamo applicare il teorema di derivazione di una serie (nella forma ricordata nell’Osservazione 2.1). Abbiamo, in ogni cerchio |z|  r0 , con r > r0 : 1 1 X @ X @f (x + iy) = an (x + iy)n = (n + 1)an+1 (x + iy)n = g(x) @x @x n=0 n=0

e analogamente 1 1 X @f @ X (x + iy) = an (x + iy)n = i (n + 1)an+1 (x + iy)n = ig(z); @y @y n=0 n=0

cio`e fx e fy sono continue e soddisfano la relazione (di Cauchy-Riemann): fy = ifx in |z|  r0 . Per l’arbitrariet` a di r0 , la relazione vale in |z| < r; la funzione f (z) `e quindi derivabile in senso complesso (Teor. 2.2, pag. 348, Vol. 1), cio`e olomorfa, nel cerchio |z| < r, e risulta ⇤ f 0 (z) = g(z).

PROPOSIZIONE 2.13 i) La somma f (z) della serie (2.8) `e di classe C 1 in |z| < r. ii) 8 k 2 N, la derivata f (k) (z) `e la somma della serie ottenuta derivando la (2.8) termine a termine k volte. iii) Tra i coefficienti ak della serie (2.8) e le derivate della somma f (z) sussistono le seguenti relazioni: (2.10)

ak =

1 (k) f (0) k!

8 k 2 N.

Dimostrazione. Le a↵ermazioni i) e ii) seguono immediatamente dalla Proposizione 2.12, applicata ripetutamente alle derivate successive della serie (2.8).

144

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

Derivando k volte questa serie otteniamo f (k) (z) =

1 X

n(n

1) . . . (n

k + 1)an z n

k

=

1 X

(n + 1) . . . (n + k)an+k z n .

n=0

n=k

Prendendo z = 0 nell’espressione precedente, otteniamo la (2.10).



I teoremi precedenti non ci danno informazioni circa la convergenza della serie sulla circonferenza |z| = r; per stabilire il carattere della serie in questi punti `e necessaria un’analisi specifica. Esempi 2.6 La serie geometrica

1 P

n=0

z n non converge in alcun punto della circonferenza |z| =

1. Essa diverge a +1 per z = 1 ed `e irregolare in ogni altro punto z = ei✓ (0 < ✓ < 2⇡); infatti risulta: 1 1 1 X X X (ei✓ )n = cos n✓ + i sin n✓. n=0

2.7 La serie

1 P

n=0

n=0

z n /n diverge a +1 per z = 1 (serie armonica); converge (non

n=1

assolutamente) in ogni altro punto z = ei✓ (0 < ✓ < 2⇡) (Esempio 2.17, pag. 442, Vol. 1). 2.8 La serie

1 P

z n /n2 converge assolutamente e uniformemente in ogni punto della

n=1

circonferenza |z| = 1; infatti essa `e maggiorata in modulo dalla serie numerica convergente.

1 P

1/n2

n=1

Quanto alla somma della serie negli eventuali punti del cerchio di convergenza in cui essa converge vale il seguente teorema. P TEOREMA 2.14 (di Abel)5 . Sia an z n una serie con raggio di convergenza r e somma f (z). Se la serie converge in un punto rei✓0 (per un certo ✓0 : 0  ✓0 < 2⇡) con somma S, allora converge uniformemente sul raggio che unisce il centro 0 con questo punto e risulta lim f (⇢ei✓0 ) = S.

(2.11)

⇢!r

Dimostrazione. Possiamo senz’altro assumere ✓0 = 0 e r = 1; infatti a questo caso ci possiamo sempre ricondurre con un cambio di variabile, ponendo z = rei✓0 w. 1 P an convergente con somma S e Sia dunque, per ipotesi, n=0

1 X

n=0

5 Niels

an xn = f (x) per 0  x < 1.

Abel, matematico norvegese (1802-1829).

2. Serie di funzioni

c 978-88-08-63708-6

145

Dalla formula di sommazione per parti (formula (2.11), pag. 441, Vol. 1), si ha, posto Sn = n P ak :

k=0

q X

an xn =

n=p

q 1 X

Sn (xn

xn+1 ) + Sq xq

Sp

p 1x .

n=p

D’altra parte `e facile verificare che q 1 X

S(xn

xn+1 ) + Sxq

Sxp = 0.

n=p

Dunque si pu` o scrivere q X

an xn =

n=p

q 1 X

(Sn

S)(xn

xn+1 ) + (Sq

S)xq

(Sp

1

S)xp .

n=p

Sia " > 0 e p0 tale che |Sn q X

n=p

S| < " per p

an xn  "

q 1 X

(xn

n=p

p0 ; allora per p > p0 e per ogni x 2 [0, 1] si ha xn+1 ) + xq + xp = 2xp "  2".

Ci` o prova la convergenza uniforme della serie

1 P

an xn sull’intervallo [0, 1]; la sua somma

n=0

f (x) `e perci` o una funzione continua su tale intervallo, cio`e lim f (x) = S. x!1



Esempio 2.9 Nell’Esempio 2.3 abbiamo ricavato 1 X xn+1 = n+1 n=0

log(1

x)

x 2 ( 1, 1);

la serie sopra scritta converge anche per x = 1 (per il criterio di Leibniz per le serie a termini di segno alterno); abbiamo perci` o, applicando il teorema di Abel, 1 X ( 1)n =1 n+1 n=0

1 1 + 2 3

1 + · · · = log 2 4

come avevamo gi` a anticipato nell’Esercizio 2.7, pagina 451, Volume 1. Tutti i risultati sopra esposti nel campo complesso valgono, in particolare, nel campo reale, cio`e per serie del tipo (2.12)

1 X

n=0

an xn

an 2 R, x 2 R.

Queste serie convergono perci` o assolutamente in un intervallo ( r, r) e uniformemente in ogni intervallo [ r0 , r0 ] con 0 < r0 < r. La somma f (x) della serie (2.12) `e di classe C 1 ( r, r) e valgono le relazioni (2.10).

146

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

In particolare f (x), essendo continua, risulta integrabile in ogni intervallo contenuto in ( r, r) e possiamo applicare il Teorema 2.7 di integrazione per serie. Integrando sull’intervallo (0, x), per ogni x 2 ( r, r), otteniamo una primitiva di f (x): Z

(2.13)

x

f (t)dt =

0

1 X an n+1 . x n +1 n=0

La serie che compare nella (2.13) si chiama serie integrale della (2.12); essa `e ancora una serie di potenze, che, per la Proposizione 2.12, ha lo stesso raggio di convergenza della (2.12). Esempio 2.10 Calcoliamo l’integrale Z 1 log(1 + x) dx x 0 (si osservi che la funzione integranda `e continua anche nell’origine, poich´e tende a 1 per x tendente a 0). Per quanto visto nell’Esempio 2.9 possiamo scrivere: 1 xn log(1 + x) X ( 1)n = x n+1 n=0

e la serie ottenuta converge uniformemente in [0, 1]. Possiamo allora applicare il teorema di integrazione per serie sull’intervallo [0, 1]; otteniamo: ! Z 1 Z 1 X 1 1 Z 1 n X log(1 + x) xn n x ( 1) ( 1)n dx = dx = dx = x n+1 n+1 0 0 n=0 n=0 0 =

1 X ( 1)n =1 (n + 1)2 n=0

1 1 + 4 9

1 ⇡2 + ··· = 16 12

come vedremo nel prossimo paragrafo (formula (2.58)). 2.3 Funzioni analitiche Nel precedente paragrafo abbiamo esaminato le propriet` a della somma di una serie di potenze: esse sono descritte nella Proposizione 2.13. Mettiamoci ora dal punto di vista contrario, partiamo, cio`e, da una qualsiasi funzione (necessariamente di classe C 1 ) e domandiamoci se questa `e la somma di una serie di potenze. Trattiamo separatamente il caso reale dal caso complesso. Sia dunque f di classe C 1 (I), dove I ✓ R `e un intervallo. Poich´e le serie di potenze convergono in intervalli u correttamente dell’asse reale, del tipo (x0 r, x0 + r), la domanda va riformulata pi` nel modo seguente: preso x0 2 I, `e possibile rappresentare f come somma di una serie di potenze in un intervallo (x0 r, x0 + r) ✓ I? In caso a↵ermativo, tenuto conto che dovrebbero valere le (2.10), si scriverebbe: (2.14)

f (x) =

1 X f (n) (x0 ) (x n! n=0

x0 )n

x 2 (x0

r, x0 + r)

2. Serie di funzioni

c 978-88-08-63708-6

147

e, in particolare, se x0 = 0, (2.15)

f (x) =

1 X f (n) (0) n x n! n=0

x 2 ( r, r).

La serie (2.14) si dice serie di Taylor (relativa al punto x0 ) della funzione f ; la (2.15) si dice anche serie di McLaurin. Se vale la rappresentazione (2.14), la funzione f si dir` a sviluppabile in serie di Taylor in (x0 r, x0 + r). Ci riferiremo ancora a serie del tipo (2.15), lasciando al lettore il compito di trasferire i risultati alle serie pi` u generali di tipo (2.14). Il seguente esempio mostra che la risposta alla domanda sopra formulata `e negativa. Esempio 2.11 La funzione f (x) = exp( 1/x2 )

se x 6= 0, f (0) = 0

(rappresentata nel diagramma n. 24, Vol. 1) `e di classe C 1 (R); essa e tutte le sue derivate sono nulle nell’origine. Se perci` o scriviamo la serie (2.15), questa ha i termini tutti nulli; pertanto la sua somma `e 0 per ogni x 2 R e non coincide con f in alcun intorno dell’origine. Dunque la funzione f non `e sviluppabile in serie di Taylor in alcun intorno dell’origine, pur essendo C 1 su tutta la retta. Cerchiamo allora condizioni sufficienti a garantire la sviluppabilit` a in serie di Taylor. Conviene partire dalla formula di Taylor (formula (2.21), pag. 280, Vol. 1) : f (x) =

n X f (k) (0)

k!

k=0

xk + En (x)

valida per ogni n, dal momento che f 2 C 1 (( r, r)). Le somme sn (x) =

n X f (k) (0)

k=0

k!

xk

sono le somme parziali della serie di Taylor. Dimostrare che sn (x) ! f (x) per n ! 1 equivale dunque a dimostrare che il resto En (x) ! 0. TEOREMA 2.15 Sia f 2 C 1 (( r, r)) ed esista una costante M , indipendente da n e da x, tale che si abbia, definitivamente, sup |f (n) (x)|  M n! r

(2.16)

n

;

( r,r)

allora f `e sviluppabile in serie di Taylor in ( r, r). Dimostrazione. Scriviamo il resto nella forma di Lagrange (formula (2.23), pag. 280, Vol. 1): En (x) =

f (n+1) (c) n+1 x (n + 1)!

(c compreso tra 0 e x).

Risulta allora, tenuto conto della (2.16), per n abbastanza grande, ✓ ◆n+1 |x| . |En (x)|  M r Essendo |x|/r < 1, il resto En (x) tende a zero quando n tende all’infinito.



148

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

OSSERVAZIONE 2.2 La (2.16) `e soddisfatta in particolare se le derivate f (n) (x) sono limitate uniformemente rispetto a n (o, come anche si dice, sono equilimitate), cio`e se: (2.17)

|f (n) (x)|  M

8 x 2 ( r, r)

con M indipendente da n e da x; basta osservare infatti che n!/rn `e definitivamente > 1 qualunque sia r > 0. Pi` u in generale, la (2.16) `e soddisfatta se risulta, definitivamente, (2.18)

|f (n) (x)|  M n

8 x 2 ( r, r).

DEFINIZIONE 2.1 Una funzione f : R ◆ I ! R si dice analitica (in senso reale) nel a analitica punto x0 2 I se `e sviluppabile in serie di Taylor in un intorno di x0 . Si dir` nell’aperto I se `e analitica in ogni punto di I. Passando al campo complesso, le cose diventano pi` u semplici; ma ci limitiamo a enunciare il risultato principale, poich´e esso fa parte della teoria delle funzioni olomorfe (cio`e derivabili in senso complesso), teoria che supera i limiti di questa trattazione. Sia f (z) una funzione olomorfa in un aperto A ✓ C. Come abbiamo gi` a ricordato nel Paragrafo 7.2.3, pagina 347, Volume 1, l’esistenza della derivata prima (in senso complesso) implica (senza altre condizioni) l’esistenza delle derivate di ogni ordine; cio`e una funzione olomorfa in A `e di classe C 1 (A); dunque, preso un punto z0 2 A, possiamo scrivere la serie (di Taylor): 1 X f (n) (z0 ) (z n! n=0

z0 )n .

z0

z0

A

Figura 3.5.

Come ha dimostrato Cauchy, questa serie ha raggio di convergenza pari alla distanza di z0 dalla frontiera @A di A (Fig. 3.5); la somma di questa serie coincide con f (z) nel cerchio di convergenza. In altre parole, ogni funzione olomorfa in un aperto A `e sviluppabile in serie di Taylor nell’intorno di ogni punto z0 2 A. Per questa ragione tali funzioni sono dette anche analitiche. Si osservi la di↵erenza, per quanto riguarda

2. Serie di funzioni

c 978-88-08-63708-6

149

la regolarit` a, tra le funzioni di variabile reale e le funzioni di variabile complessa. Mentre nel campo reale esiste una gerarchia di classi di funzioni sempre pi` u regolari C 0 (I)

C 1 (I)

C 2 (I)

...

C 1 (I)

Analitiche (I)

nel campo complesso abbiamo soltanto C 0 (A)

C 1 (A) = C 2 (A) = · · · = C 1 (A) = Analitiche (A),

dove, sottolineiamo, le derivate sono intese nel senso della variabile complessa. Passiamo ora in rassegna le principali funzioni sviluppabili in serie di Taylor. Serie esponenziale Per ogni x 2 R abbiamo: 1 X xn = ex . n! n=0

(2.19)

Infatti la serie che compare nella (2.19) converge su tutto R; che la sua somma sia ex segue dalla formula di Taylor (con x0 = 0) per la funzione f (x) = ex (Esempio 2.12, pag. 277, Vol. 1) osservando che, 8 r > 0 sup |f (n) (x)| = sup ex = er ;

(2.20)

( r,r)

( r,r)

perci` o la (2.17) `e soddisfatta con M = er . L’uguaglianza (2.19) vale anche nel campo complesso; infatti la funzione ez `e olomorfa in tutto C (Esempio 2.13, pag. 348, Vol. 1) e perci` o sviluppabile in serie di Taylor; d’altra parte le maggiorazioni (2.20) valgono anche se si sostituisce la variabile complessa z al posto della variabile reale x e il cerchio |z| < r al posto dell’intervallo ( r, r). Dalla (2.19) si ricava anche: (2.21)

e

x

=

1 X

( 1)n

n=0

xn . n!

Per mezzo di queste formule si calcolano usualmente le potenze del numero e; per esempio, ponendo, nella (2.21), x = 1/2, abbiamo: 1 p =1 e

1 1 + 2 22 · 2

1 1 + 23 · 3! 24 · 4!

1 + · · · ⇡ 0.60651 25 · 5!

valore approssimato per difetto con un errore non superiore a 1/(26 · 6!) ⇡ 0.00002. Ponendo, nella (2.21), x2 al posto di x, si ottiene (2.22)

e

x2

=

1 X

( 1)n

n=0

x2n . n!

150

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

Integrando questa serie termine a termine, si ottiene una rappresentazione per serie della funzione degli errori di Gauss: Z x 1 2 2 X ( 1)n x2n+1 2 e t dt = p (2.23) erf(x) = p . ⇡ 0 ⇡ n=0 n! 2n + 1 Serie iperboliche Combinando la (2.19) con la (2.21) si ottengono le serie, convergenti su tutto R, (2.24)

Sh x =

(2.25)

Ch x =

1 X x2n+1 (2n + 1)! n=0 1 X x2n . (2n)! n=0

Serie circolari Dalle formule di Taylor (con x0 = 0) per le funzioni sin e cos, con ragionamento analogo a quello tenuto per la funzione esponenziale, si ottengono gli sviluppi, validi 8 x 2 R: (2.26)

sin x =

(2.27)

cos x =

1 X

( 1)n

n=0 1 X

( 1)n

n=0

x2n+1 (2n + 1)! x2n . (2n)!

Le formule (2.24) . . . (2.27) valgono anche in tutto il campo complesso: si ottengono cos`ı le rappresentazioni per serie delle funzioni Sh z, Ch z, sin z, cos z, definite nel Paragrafo 5.3.7, pagina 235, Volume 1. Per mezzo di queste rappresentazioni si ritrovano facilmente alcune propriet` a gi` a viste, come: sin z = i Sh(iz), D Ch z = Sh z ecc. Le serie viste finora hanno raggio di convergenza 1; le loro somme sono dunque funzioni olomorfe in tutto C; tali funzioni sono anche dette trascendenti intere. Vediamo ora alcune serie con raggio di convergenza finito. Abbiamo incontrato pi` u volte la serie geometrica: 1

(2.28)

1

x

=

1 X

xn

n=0

|x| < 1.

L’uguaglianza (2.28) pu` o essere ricavata partendo dalla funzione f (x) = (1 x) 1 e (n) calcolando le derivate f (x) = n!(1 x) n 1 ; si verifichi poi che la condizione (2.16) non pu` o essere soddisfatta se r > 1. Integrando termine a termine la (2.28) tra 0 e x si ottiene la serie logaritmica, gi` a vista: (2.29)

log(1

x) =

1 X xn+1 n+1 n=0

|x| < 1.

2. Serie di funzioni

c 978-88-08-63708-6

151

Come abbiamo gi` a osservato a proposito del teorema di Abel, l’uguaglianza (2.29) vale anche per x = 1, fornendo una rappresentazione di log 2 per mezzo di una serie (troppo lentamente convergente per essere utilizzata con profitto per il calcolo di log 2). Sostituendo a x, x2 nella (2.28) otteniamo 1 X 1 = ( 1)n x2n 1 + x2 n=0

(2.30)

|x| < 1.

Integrando termine a termine questa serie si ottiene la serie dell’arcotangente: (2.31)

arctg x =

1 X

( 1)n

n=0

x2n+1 2n + 1

|x| < 1.

Per il teorema di Abel, l’uguaglianza (2.31) vale anche per x = ±1 e fornisce 1 X ( 1)n ⇡ = =1 4 n=0 2n + 1

(2.32)

1 1 + 3 5

1 + ··· . 7

Dalla (2.29) si ottiene facilmente anche il seguente sviluppo: (2.33)

log

1 X x2n+1 1+x =2 1 x 2n + 1 n=0

|x| < 1.

Serie binomiale Nell’Esempio 2.18e, pagina 283, del Volume 1, abbiamo ricavato la formula di Taylor (con x0 = 0) per la funzione (1 + x)↵ , ↵ 2 R: n ✓ ◆ X ↵ k ↵ (1 + x) = x + En (x) k k=0

dove

↵ k

= ↵(↵

1) . . . (↵

k + 1)/k! sono i coefficienti binomiali. La serie 1 ✓ ◆ X ↵ n x n n=0

`e detta serie binomiale; naturalmente, se ↵ 2 N, essa `e una somma finita poich´e ↵ ↵ n = 0 per n > ↵ e rappresenta precisamente lo sviluppo del binomio (1 + x) ; se ↵ 2 / N, essa `e una somma infinita, con raggio di convergenza 1, come abbiamo mostrato nell’Esempio 2.5. Se si indica con f (x) la somma della serie, si ha, derivando termine a termine: ✓ ◆ ✓ ◆ 1 1 X X ↵ n 1 ↵ n x = (m + 1) xm + (1 + x)f 0 (x) = (1 + x) n m + 1 n=0 m=0 ✓ ◆ ✓ ◆ ✓ ◆ 1 1 ⇢ X X ↵ n ↵ ↵ n x = + (n + 1) +n xn = n n + 1 n n=0 n=0 1 ✓ ◆ X ↵ n =↵ x = ↵f (x) n n=0

152

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

Posto allora g(x) = (1 + x)



f (x).

abbiamo g 0 (x) =

↵(1 + x)

↵ 1

f (x) + (1 + x)

↵ 0

f (x) = 0

e cio`e g(x) = costante; essendo g(0) = 1 deve essere g(x) = 1 per ogni x, perci` o f (x) = (1 + x)↵ . Abbiamo cos`ı ottenuto la seguente formula, dovuta a Newton: 1 ✓ ◆ X ↵ n ↵ x , ↵ 2 R, |x| < 1. (2.34) (1 + x) = n n=0 x2 al posto di x, ricaviamo la serie ✓ ◆ 1 X 1/2 2n 1 n p = ( 1) |x| < 1. x n 1 x2 n=0

Dalla (2.34), ponendo ↵ = (2.35)

1/2 e

Integrando ambo i membri dalla (2.35) tra 0 e x otteniamo lo sviluppo dell’arcoseno: ✓ ◆ 1 X 1/2 x2n+1 n ( 1) |x| < 1. (2.36) arcsin x = n 2n + 1 n=0 La (2.34) si presta al calcolo delle radici dei numeri. Per esempio, si voglia calcolare p 67. Si prende il quadrato pi` u vicino a 67, cio`e 64, e si scrive p p p 67 = 64 + 3 = 8 1 + 3/64 = ) ( ✓ ◆2 ✓ ◆3 1 1 3 1 3 3 + ··· . =8 1+ · 2 64 8 64 16 64 2.4 Serie trigonometriche Esaminiamo ora una serie di funzioni di un genere diverso da quello considerato nei due paragrafi precedenti: invece di potenze xn , consideriamo le funzioni trigonometriche sin nx e cos nx. Precisamente si chiama serie trigonometrica una serie del tipo: (2.37)

1

a0 X (an cos nx + bn sin nx) + 2 n=1

dove an , bn sono numeri reali o complessi assegnati, x una variabile reale. Come vedremo, queste serie risultano di grandissima utilit` a in svariate applicazioni. 1 P an z n Vale forse la pena di notare che, se si vuol studiare una serie di potenze n=0

sul cerchio di convergenza, posto z = rei✓ , 0  ✓ < 2⇡, si `e ricondotti a studiare la serie 1 X (an rn cos n✓ + ian rn sin n✓) a0 + n=1

che `e appunto una serie trigonometrica.

2. Serie di funzioni

c 978-88-08-63708-6

153

Cominciamo lo studio delle serie (2.37) facendo alcune semplici osservazioni preliminari. 1. Periodicit` a. Le funzioni sin xn e cos xn sono periodiche: il minimo periodo comune a, con la a tutte quante `e 2⇡. Se perci` o la serie converge in un punto x, converger` o la somma di una serie trigonometrica stessa somma, anche in x + 2k⇡ (k 2 Z); perci` come la (2.37) `e una funzione periodica di periodo 2⇡. 2. Condizione sufficiente di convergenza. Una semplice condizione sufficiente di convergenza per la (2.37) `e che le serie numeriche 1 X

n=1

1 X

|an |,

n=1

|bn |

siano convergenti. In tal caso, anzi, essendo |an cos nx + bn sin nx|  |an | + |bn | la serie (2.37) risulta assolutamente e uniformemente convergente su tutto R; la sua somma `e allora una funzione continua. 3. Relazione tra i coefficienti an , bn e la somma della serie. Ammettiamo, provvisoriamente, che la serie (2.37) sia uniformemente convergente su R e indichiamo con f (x) la sua somma, che risulta una funzione continua: (2.38)

f (x) =

1

a0 X (an cos nx + bn sin nx). + 2 n=1

Moltiplichiamo ambo i membri dell’equazione (2.38) per cos mx (m 2 N) e integriamo su x da ⇡ a ⇡; otteniamo Z ⇡ Z ⇡ Z 1 X a0 ⇡ f (x) cos mx dx = cos mx dx + cos mx · an cos nx dx+ 2 ⇡ ⇡ ⇡ n=1 Z ⇡ 1 X cos mx · bn sin nx dx. + ⇡

n=1

Essendo le serie uniformemente convergenti, possono essere integrate termine a termine; ricordando le formule (1.22) otteniamo Z 1 ⇡ f (x) cos mx dx = am m = 0, 1, 2, . . . (2.39) ⇡ ⇡ Analogamente, moltiplicando ambo i membri dell’equazione (2.38) per sin mx e integrando ancora da ⇡ a ⇡ otteniamo: Z 1 ⇡ f (x) sin mx dx = bm m = 1, 2, . . . (2.40) ⇡ ⇡ Si osservi che i coefficienti (2.39) e (2.40) sono legati alla somma della serie da relazioni integrali, mentre i coefficienti di una serie di potenze sono legati alla somma da relazioni di↵erenziali.

154

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

4. Periodi diversi da 2⇡. Il fatto di considerare funzioni di periodo 2⇡ non `e limitativo e solo per comodit` a abbiamo scritto la serie nella forma (2.37); potremmo infatti considerare serie trigonometriche costruite con funzioni del tipo ◆ ✓ ◆ ✓ 2⇡n 2⇡n y , sin y ⌧ >0 cos ⌧ ⌧ le quali sono tutte periodiche con periodo ⌧ (Esempio 1.30), cosicch´e anche la somma g(y) di tali serie (se convergenti!) sarebbe una funzione periodica di periodo ⌧ : le formule (2.38), (2.39), (2.40) sarebbero allora sostituite dalle seguenti: ✓ ✓ ◆ ◆◆ 1 ✓ 2⇡n 2⇡n a0 X an cos (2.41) + y + bn sin y g(y) = 2 ⌧ ⌧ n=1 ✓ ◆ Z 2 ⌧ /2 2⇡n g(y) cos an = (2.42) y dy ⌧ ⌧ ⌧ /2 ✓ ◆ Z 2 ⌧ /2 2⇡n g(y) sin bn = (2.43) y dy. ⌧ ⌧ ⌧ /2 Si passa dalle formule (2.38) . . . alle (2.41) . . . con la sostituzione di variabili ✓ ◆ 2⇡ 2⇡ y, f (x) = f y = g(y). (2.44) x= ⌧ ⌧ Abbiamo visto che, se la serie trigonometrica (2.37) converge uniformemente, i coefficienti an , bn sono legati alla somma f della serie dalle formule (2.38), (2.39) o (2.42), (2.43); in tal caso essi prendono il nome di coefficienti di Fourier di f . D’altra parte, questi coefficienti hanno senso per una funzione qualunque, integrabile su un intervallo di lunghezza ⌧ . Precisamente, diamo la seguente definizione. DEFINIZIONE 2.2 Data una qualsiasi funzione ⌧ -periodica g, se gli integrali (2.42), (2.43) esistono, anche in senso generalizzato, i numeri an , bn si dicono coefficienti di Fourier della funzione g. Se, per una funzione g, possiamo calcolare i coefficienti an e bn , possiamo anche scrivere la corrispondente serie trigonometrica, che prende il nome di serie di Fourier di g: diremo che essa `e la serie associata alla funzione g, e scriveremo: ✓ ✓ ◆ ◆◆ 1 ✓ 2⇡n 2⇡n a0 X an cos + y + bn sin y . (2.45) g(y) ⇠ 2 ⌧ ⌧ n=1 Il fatto che, per una funzione g, possiamo calcolare i coefficienti an , bn , e dunque possiamo scrivere la serie di Fourier associata, non implica che detta serie sia convergente, n´e che, se convergente, la sua somma coincida con la funzione g; questo problema fondamentale sar` a a↵rontato nel prossimo paragrafo. OSSERVAZIONE 2.3 (Sul calcolo dei coefficienti; funzioni pari e dispari) Se f (x) `e una funzione ⌧ -periodica, risulta, 8 a 2 R, Z ⌧ Z a+⌧ f (x)dx = f (x)dx. (2.46) a

0

2. Serie di funzioni

c 978-88-08-63708-6

155

Infatti, abbiamo Z

a+⌧

f (x)dx =

a

Z

0

f (x)dx +

a

Z



f (x)dx +

0

Z

a+⌧

f (x)dx.



Nell’ultimo integrale si faccia la sostituzione: x = t + ⌧ ; esso diventa allora Z a Z a f (t + ⌧ )dt = f (t)dt 0

0

e perci` o cancella il primo integrale a secondo membro. Cos`ı, nelle formule (2.42), (2.43) gli integrali possono essere calcolati sull’intervallo (0, ⌧ ) invece che ( ⌧ /2, ⌧ /2), o su qualsiasi altro intervallo di ampiezza ⌧ . Si osservi anche che, se g `e una funzione pari, i coefficienti bn , dati dalla (2.43), o la serie sono tutti nulli; mentre se g `e dispari sono nulli tutti i coefficienti an ; perci` di Fourier associata a una funzione pari `e una serie di soli coseni, quella associata a una funzione dispari `e una serie di soli seni. Esempi 2.12 I coefficienti di Fourier della funzione (x) = x di periodo 1, sono: a0 = 2

Z

[x] (mantissa di x), periodica

1

xdx = 1

0

an = 2

Z

1

x cos(2⇡nx)dx = 0

n = 1, 2, . . .

0

bn = 2

Z

1

x sin(2⇡nx)dx =

0

–3

–2

–1

0

1

2

1 ⇡n

3

Figura 3.6. Mantissa di x.

Scriveremo pertanto: (2.47)

(x) ⇠

1 2

1 1X1 sin(2⇡nx). ⇡ n=1 n

156

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

Si osservi che, per x = 0, il secondo membro della (2.47) vale 1/2 mentre il primo membro vale 0; non possiamo perci` o scrivere = al posto di ⇠ nella (2.47) (almeno per x = 0). 2.13 Sia f (x) il prolungamento periodico della restrizione della funzione x2 all’intervallo [ ⇡, ⇡] (cfr. Fig. 3.7); f (x) `e funzione pari; i suoi coefficienti di Fourier sono: Z Z 1 ⇡ 2 2 ⇡ 2 2 x dx = x dx = ⇡ 2 a0 = ⇡ ⇡ ⇡ 0 3 Z 2 ⇡ 2 ( 1)n an = x cos nx dx = 4 2 n = 1, 2, . . . ⇡ 0 n bn = 0. Possiamo perci` o scrivere: 1 X ⇡2 ( 1)n f (x) ⇠ cos nx. +4 3 n2 n=1 P 1/n2 `e convergente, la serie di Fourier Si osservi che, poich´e |an |  4/n2 e la serie considerata `e assolutamente e uniformemente convergente su tutta la retta.

12 10 8 6 4 2 0 –10

–8

–6

–4

–2

0

2

4

6

8

10

Figura 3.7. La funzione periodica dell’Esempio 2.13.

2.14 La funzione tg x, ⇡-periodica, non ammette coefficienti di Fourier; gli integrali (generalizzati) Z ⇡/2 Z ⇡/2 tg x cos(2nx)dx, tg x sin(2nx)dx ⇡/2

⇡/2

non sono tutti convergenti.

2.15 Sia f (x) il prolungamento periodico della restrizione della funzione |x| 1/2 all’intervallo [ 1, 1) (Fig. 3.8); la funzione non `e definita per x = 2n (n 2 Z); possiamo completare la definizione ponendo, per esempio, f (2n) = 0.

2. Serie di funzioni

c 978-88-08-63708-6

157

f (x) `e funzione pari, di periodo 2; gli integrali generalizzati che definiscono i suoi coefficienti di Fourier sono tutti convergenti; risulta infatti: bn = 0 an = 2

Z

0

1

2 1 p cos(⇡nx)dx = p x ⇡n

Z

0

⇡n

4 cos t p dt = p ⇡n t

Z

p ⇡n

cos(s2 )ds.

0

9 8 7 6 5 4 3 2 1 0 –1 –5

–4

–3

–2

–1

0

1

2

3

4

5

Figura 3.8. La funzione periodica dell’Esempio 2.15.

R1 L’integrale di Fr´esnel 0 cos(s2 )ds `e convergente (si veda l’Esercizio 1, pag. 464, p o i coefficienti an saranno Vol. 1) e si pu` po dimostrare che il suo valore `e 2⇡/4. Perci` asintotici a 2/n. Possiamo allora scrivere f (x) ⇠

1

a0 X an cos(⇡nx). + 2 n=1

1 P an ; essa non `e convergente, poich´e Per x = 0 la serie a secondo membro `e: a0 /2 + n=1 P p non converge la serie 1/ n.

Ancora qualche osservazione, prima di passare alla discussione della convergenza delle serie di Fourier. Nel seguito ci riferiremo per lo pi` u a serie della forma (2.37).

5. Serie di funzioni ortogonali. Le funzioni cos nx e sin nx sono funzioni ortogonali, nel senso precisato nell’Esempio 1.29. Utilizzando notazioni simili a quelle col` a introdotte, le formule (2.38), (2.39), (2.40) possono essere riscritte in forma pi` u compatta. Posto infatti 1 cos mx sin mx m = 1, 2, . . . (2.48) '0 (x) = p , '2m (x) = p , '2m 1 (x) = p ⇡ ⇡ 2⇡

158

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

e c0 =

(2.49)

p ⇡/2,

c2m =

p ⇡am ,

c2m

1

c 978-88-08-63708-6

=

p ⇡bm

possiamo scrivere la (2.38) nella forma (2.50)

f (x) =

1 X

cn 'n (x)

n=0

dove i coefficienti cn sono dati dalla formula Z ⇡ (2.51) cn = hf, 'n i = f (x)'n (x)dx. ⇡

La (2.50) ci d` a una rappresentazione della funzione f (intesa come punto o vettore di uno spazio lineare dotato del prodotto scalare (1.23)) come combinazione lineare (ino essere rappresenfinita) di versori ortogonali, esattamente come in Rn un vettore pu` tato come combinazione lineare (finita) dei versori della base canonica: e1 , e2 . . . , en . Da questo punto di vista i coefficienti di Fourier cn sono, per la funzione f , quello che, per un vettore o punto di Rn , sono le sue coordinate cartesiane ortogonali. 6. Serie trigonometriche e di Fourier nel campo complesso. Una serie trigonometrica nel campo complesso `e una serie del tipo +1 X

(2.52)

inx ne

n

n= 1

2 C.

Procedendo come si `e fatto al punto 3., se (per esempio) assumiamo

+1 P

n= 1

|

n|

con-

vergente6 , la serie data converge assolutamente e uniformemente; detta ancora f (x) la sua somma (2⇡-periodica) abbiamo le formule: Z ⇡ +1 X 1 inx , e inx f (x)dx, (2.53) f (x) = ne n = 2⇡ ⇡ n= 1 e la (2.52) `e la serie di Fourier di f nel campo complesso. La seconda delle (2.53) si ottiene moltiplicando ambo i membri della prima per e imx e integrando su ( ⇡, ⇡), ricordando (Esempio 1.31) che: Z ⇡ einx e imx dx = 2⇡ nm . ⇡

La (2.52) `e un modo di scrivere la (2.37) in forma compatta; si passa da una forma all’altra ponendo 0 = a0 /2 e inoltre n

n

6 Ci` o

1 (an ibn ), 2 1 = (an + ibn ), 2

=

significa che le serie

1 P

n=0

|

n|

e

an =

n

+

n

n = 1, 2, . . . bn = i(

P1

n= 1

|

n|

n

n ).

sono convergenti, ognuna per conto suo.

2. Serie di funzioni

c 978-88-08-63708-6

159

7. Una interpretazione musicale della serie di Fourier. L’operazione di scomporre una funzione periodica f (di periodo 2⇡, per esempio) in somma (finita o infinita) di funzioni periodiche semplici del tipo cos nx e sin nx costituisce l’analisi armonica della funzione f : il termine a1 cos x + b1 sin x si chiama armonica fondamentale; il termine an cos nx + bn sin nx (n = 2, 3, . . .) si chiama armonica n-esima. Questa terminologia `e derivata dall’acustica. Quando un diapason, colpito, si mette a vibrare, le sue vibrazioni possono essere descritte da una funzione periodica semplice come x(t) = a cos

2⇡ 2⇡ t oppure a sin t ⌧ ⌧

(x(t) misura lo spostamento, al tempo t, di un corno del diapason dalla sua posizione di riposo). a

Figura 3.9.

Il numero positivo a misura l’ampiezza dell’oscillazione (spostamento massimo) e viene percepito dall’orecchio come intensit` a o volume di suono; 1/⌧ `e la frequenza tipica del diapason: essa viene percepita dall’orecchio come altezza del suono. Il diapason ha la propriet` a di emettere suoni puri cio`e suoni di una determinata frequenza. In generale i suoni emessi dagli strumenti musicali (per esempio, una corda del pianoforte) non sono puri, ma risultano dalla sovrapposizione di diverse armoniche. Ci` o `e dovuto al fatto che una corda, fissata agli estremi, pu` o oscillare in diversi modi, cio`e con diverse frequenze: queste frequenze (teoricamente infinite) sono multipli di una frequenza fondamentale propria della corda (la corda di un do pu` o vibrare, oltre che con la frequenza propria di quella nota, anche con frequenza doppia, corrispondente al do dell’ottava superiore, o tripla, corrispondente al sol dell’ottava superiore e cos`ı via). La vibrazione e↵ettiva di un dato punto della corda risulta dalla sovrapposizione delle vibrazioni corrispondenti ai singoli modi: essa `e perci` o descritta da una somma

160

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

Figura 3.10. Modi diversi di vibrare di una corda con estremi fissi; la frequenza del secondo modo ` e doppia di quella del primo; quella del terzo ` e tripla. In un dato modo, i vari punti della corda vibrano, con ampiezza diversa, ma con la stessa frequenza.

(teoricamente infinita) di funzioni periodiche semplici del tipo an cos

2⇡n 2⇡n t oppure bn sin t ⌧ ⌧

(cio`e da una serie di Fourier). In pratica, per` o, solo alcuni (pochi) termini della serie contribuiscono e↵ettivamente alla vibrazione totale della corda. Il nostro orecchio percepisce il risultato di queste vibrazioni, trasmesse dall’aria, come un suono regolare: la nota do, la nota mi, . . . . Il numero delle armoniche che si accompagnano all’armonica fondamentale determina il cosiddetto timbro del suono (la stessa nota emessa da una corda di violino o di pianoforte ha un timbro diverso, cos`ı come hanno un timbro diverso le voci maschili e femminili). Quando pi` u corde vengono percosse contemporaneamente, al nostro orecchio arriva la sovrapposizione delle vibrazioni di ciascuna di queste corde: la vibrazione totale `e descritta perci` o come una somma di funzioni periodiche di diverso periodo: se i periodi stanno tra loro in particolari rapporti, si ha una sensazione gradevole (per esempio: accordo do-mi-sol); altrimenti si pu` o percepire un suono sgradevole (do-re). Se poi si sommano vibrazioni di frequenze qualsiasi la funzione che rappresenta la vibrazione totale, essendo somma di funzioni con periodi qualsiasi, potrebbe non essere pi` u neanche periodica e si ha una sensazione di suono non pi` u regolare, ma di rumore. 2.5 Convergenza delle serie di Fourier Veniamo ora alla questione fondamentale: data una funzione 2⇡-periodica, dotata dei coefficienti di Fourier, sotto quali condizioni la serie di Fourier associata converge e con quale somma? Evidentemente, per rispondere a questa domanda, dobbiamo anzitutto precisare quale tipo di convergenza si richiede alla serie data, se puntuale o uniforme o di altro tipo. Convergenza in media quadratica Il seguente lemma, oltre che illustrare una propriet` a importante dei coefficienti di u naturale” Fourier, potr` a anche suggerirci quale dovrebbe essere la convergenza “pi` per le serie di Fourier. Sia f una funzione 2⇡-periodica, limitata, integrabile sull’intervallo [ ⇡, ⇡], cio`e f 2 R( ⇡, ⇡): ci` o garantisce l’esistenza degli integrali (2.39), (2.40). Sia n

(2.54)

sn (x) =

a0 X (ak cos kx + bk sin kx) + 2 k=1

2. Serie di funzioni

c 978-88-08-63708-6

161

la somma parziale n-esima della serie di Fourier associata alla f . Un’espressione come la (2.54) si chiama polinomio trigonometrico di grado n. Sia n

n (x)

(2.55)

=

↵0 X (↵k cos kx + + 2

k

sin kx)

k=1

un altro polinomio trigonometrico dello stesso grado n (con coefficienti qualsiasi). LEMMA 2.16 Nelle ipotesi sopra specificate per f , valgono le seguenti a↵ermazioni: i) al variare di medio

n

tra tutti i polinomi trigonometrici di grado n, lo scarto quadratico Z ⇡ 1 2 |f (x) n (x)| dx 2⇡ ⇡

risulta minimo se n = sn . Z ⇡ Z ⇡ |f (x) sn (x)|2 dx = f (x)2 dx ii) ⇡

iii)

Z



f (x)2 dx





"



a20 2

+

1 X

"

# n a20 X 2 2 ⇡ (ak + bk ) ; + 2

#

k=1

(a2k + b2k ) .

k=1

La iii) si chiama disuguaglianza di Bessel. Dimostrazione. Con le notazioni introdotte nel punto 5. del precedente paragrafo (formule (2.48) e (2.49)) abbiamo: sn (x) =

2n X

ck 'k (x)

k=0 n (x)

=

2n X

k 'k (x)

k=0

(dove i k sono legati agli ↵k , k da relazioni analoghe alle (2.49), che legano i ck agli ak , bk ). Allora risulta Z ⇡ 2 |f (x) n (x)| dx = hf n, f ni = ⇡

(essendo h'k , 'j i =

= hf, f i

2hf,

= hf, f i

2

2n X

k=0

ni

+h

n,

k hf, 'k i

ni

+

=

2n 2n X X

k=0 j=0

k j h'k , 'j i

kj )

= hf, f i =

Z

⇡ ⇡

2

2n X

k ck

+

k=0

f (x)2 dx +

2n X

2 k

=

k=0 2n X

(ck

k=0

2 k)

2n X

k=0

c2k .

=

162

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

L’ultima espressione scritta assume il suo valore minimo quando ck = o prova la i). In tal caso risulta 0, 1, . . . , 2n, cio`e quando n = sn ; ci` Z

⇡ ⇡

|f (x)

2

sn (x)| dx =

Z



f (x)2 dx



2n X

k

per ogni k =

c2k ,

k=0

che coincide con la ii). Poich´e il primo membro della precedente uguaglianza `e deve essere del secondo membro: Z ⇡ 2n X f (x)2 dx c2k . ⇡

0, lo stesso

k=0

Poich´e questa disuguaglianza `e valida 8 n 2 N, risulta provata la iii).



COROLLARIO 2.17 I coefficienti di Fourier an e bn di una funzione f 2⇡-periodica, limitata e integrabile su [ ⇡, ⇡] sono infinitesimi per n ! 1, cio`e: Z ⇡ f (x) cos nx dx = 0 lim n!1 ⇡ (2.56) Z ⇡ lim f (x) sin nx dx = 0. n!1



Ci` o segue immediatamente dalla disuguaglianza di Bessel. Dalla ii) del Lemma 2.16 si ricava che, se la disuguaglianza di Bessel `e una uguaglianza, la successione delle somme parziali sn converge in media quadratica alla funzione f . E↵ettivamente, si potrebbe dimostrare che, nelle ipotesi del lemma, la iii) vale col segno =. Ma, per dimostrare questo risultato, e altri ancora pi` u significativi, bisogna operare in uno spazio metrico completo rispetto alla metrica integrale di ordine 2 che presenteremo nel Capitolo 5, Sezione 3.7. Perci` o, bench´e i risultati pi` u semplici e pi` u generali si possano conseguire proprio in un tale spazio, ci occuperemo ora di un altro tipo di risultati, tuttavia importanti e di grande utilit` a. Convergenza puntuale Studiamo la convergenza puntuale e uniforme delle serie di Fourier. A questo premettiamo alcune definizioni. DEFINIZIONE 2.3 i) Una funzione f : [a, b] ! R si dice continua a tratti se `e continua in [a, b] tranne al pi` u un numero finito di punti x1 , . . . , xN nei quali esistono finiti i limiti destro e sinistro7 ; scriveremo: lim f (x) = f (xi +),

x!xi +

lim f (x) = f (xi )

x!xi

i = 1, 2, . . . , N.

ii) Una funzione f : R ! R si dir` a continua a tratti se `e tale in ogni intervallo limitato.

7 Solo

limite destro, o sinistro, se il punto ` e un estremo dell’intervallo.

2. Serie di funzioni

c 978-88-08-63708-6

163

Indichiamo con P⌧ la classe delle funzioni f : R ! R con le seguenti propriet` a: i) f `e ⌧ -periodica; ii) f `e continua a tratti. P⌧ `e uno spazio lineare; esso `e sufficientemente ampio per molte applicazioni. Ossero gli integrali viamo subito che, se f 2 P⌧ , f `e limitata e integrabile su [0, ⌧ ]; perci` (2.42) e (2.43) che definiscono i suoi coefficienti di Fourier esistono e possiamo parlare di serie di Fourier associata alla f . Considereremo in seguito prevalentemente il caso ⌧ = 2⇡. La funzione considerata nell’Esempio 2.12 appartiene a P1 , quella dell’Esempio 2.13 appartiene a P2⇡ , mentre quella dell’Esempio 2.15 non `e continua a tratti. DEFINIZIONE 2.4 Una funzione f : [a, b] ! R soddisfa, nel punto x0 2 (a, b), la condizione (D)8 se: i) `e derivabile in x0 oppure 0 (x0 ) e sinistra f 0 (x0 ), oppure ii) `e continua in x0 e dotata di derivata destra f+ a iii) ha una discontinuit` a di 1 specie in x0 , ed esistono finiti i limiti: f (x) f (x0 +) , x!x0 + x x0 lim

(che indicheremo con

0⇤ f+ (x0 )

lim

x!x0

f (x) f (x0 ) x x0

0⇤

e f (x0 ) rispettivamente).

x0

x0

x0

Figura 3.11. Esempi di funzioni soddisfacenti la condizione (D) nel punto x0 .

Abbiamo il seguente risultato fondamentale. TEOREMA 2.18 (Convergenza puntuale) Sia f 2 P2⇡ . Allora la serie di Fourier della f converge in ogni punto x in R in cui `e soddisfatta la condizione (D); la sua somma s(x) `e data da: 1 [f (x ) + f (x+)]; 2 in particolare, se x `e un punto di continuit` a per la f , la serie converge con somma f (x). (2.57)

s(x) =

Prima di dimostrare il teorema esaminiamo alcuni esempi. 8D

sta per Dirichlet.

164

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

Esempi 2.16 La funzione (x) (si veda l’Esempio 2.12) appartiene a P1 e verifica la condizione (D) in ogni punto di R. Pertanto la sua serie di Fourier 1 1X1 sin(2⇡nx) ⇡ n=1 n

1 2

converge in ogni punto di R con somma ( (x) se x 6= n s(x) = 1/2 se x = n

n 2 Z.

In particolare, per x = 1/4, abbiamo: 1 1 = 4 2

1 ⇣⇡ ⌘ 1X1 sin n ; ⇡ n=1 n 2

ritroviamo cos`ı il risultato gi` a noto (formula 2.32): ⇡ =1 4

1 1 + 3 5

1 + ··· 7

2.17 La funzione f (x) dell’Esempio 2.13 appartiene a P2⇡ e verifica la condizione (D) in ogni punto di R. Essendo anche continua su R abbiamo: f (x) =

1 X ( 1)n ⇡2 cos nx. +4 3 n2 n=1

In particolare, prendendo x = 0 e x = ⇡ si trova, rispettivamente, (2.58) (2.59)

⇡2 =1 12 ⇡2 =1+ 6

1 1 1 ( 1)n+1 + ··· + + ··· + 4 9 16 n2 1 1 1 1 + + + ··· + 2 + ··· 4 9 16 n

Queste serie (e altre dello stesso genere: si veda l’Esercizio 10) sono state calcolate da Eulero. Che il teorema esprima solo una condizione sufficiente risulta, per esempio, dall’osservazione che, se f 2 P2⇡ `e dispari, la sua serie di Fourier converge senz’altro a 0 nell’origine, indipendentemente dal fatto che la condizione (D) sia soddisfatta oppure no in quel punto. Un risultato pi` u profondo ottenuto dallo stesso Dirichlet, `e quello che enunciamo qui appresso senza dimostrazione. TEOREMA 2.19 Sia f 2 P2⇡ ; inoltre l’intervallo [ ⇡, ⇡] possa essere suddiviso in un numero finito di sottointervalli in ciascuno dei quali la funzione f (x) sia monotona; allora la serie di Fourier della f converge in ogni punto con somma data dalla (2.57).

2. Serie di funzioni

c 978-88-08-63708-6

165

p Esempio 2.18 Sia f (x) il prolungamento periodico della funzione |x| in [ 1, 1] (Fig. 3.12). La funzione f 2 P2 , nei punti xk = 2k (k 2 Z) non soddisfa la condizione (D): le “derivate” destra e sinistra sono 1. Ma le ipotesi del Teorema 2.19 sono verificate e possiamo concludere che la serie di Fourier considerata converge a f (x) in ogni punto di R. In particolare, per x = 0, troviamo il seguente risultato: 1 a0 X an + 0= 2 n=1 cio`e, calcolando i coefficienti an , 1 X ↵n ⇡ 3/2 = 3/2 3 n n=1

essendo ↵n =

Z

p ⇡n

sin(s2 )ds.

0

2 1.5 1 0.5 0 – 0.5 –1

–3

–2

–1

0

1

2

3

Figura 3.12.

Sottolineiamo che la sola continuit` a della funzione non `e sufficiente per la convergenza della serie di Fourier; i controesempi sono per` o piuttosto complicati. Per dimostrare il Teorema 2.18 abbiamo bisogno del seguente LEMMA 2.20 (Formula di Dirichlet)9 i) Per ogni n 2 N si ha (2.60)

9 Gustav

✓ ◆ 1 sin n + x 1 2 . + cos x + cos 2x + · · · + cos nx = x 2 2 sin 2

Lejeune Dirichlet, francese (1805-1959).

166

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

ii) Se sn (x; f ) = sn (x) `e la somma parziale n-esima della serie di Fourier (2.37), dove i coefficienti sono dati dalle (2.39) e (2.40), si ha ✓ ◆ 1 Z sin n + t 1 ⇡ 2 dt f (x + t) (2.61) sn (x) = t ⇡ ⇡ 2 sin 2 La (2.61) `e detta formula di Dirichlet. Dimostrazione. i) Usiamo il principio di induzione. Per n = 0 la (2.60) `e vera poich´e si riduce all’identit` a 1/2 = 1/2; ammettiamola vera per n 1 e dimostriamola per n. Si ha ✓ ◆ 1 sin n x 2 1 + cos x + · · · + cos((n 1)x) + cos nx = + cos nx = x 2 2 sin 2◆ ✓ 1 x sin n x + 2 cos nx sin 2 2 = . x 2 sin 2 Essendo sin(n 1/2)x = sin nx cos(x/2) cos nx sin(x/2), l’ultima espressione scritta prende la forma ✓ ◆ 1 x x sin n + x sin nx cos + cos nx sin 2 2 2 = . x x 2 sin 2 sin 2 2 ii) Tenendo conto dell’espressione dei coefficienti (2.39) e (2.40) si ha: ( ) Z n 1 ⇡ 1 X + f (s) (cos ks cos kx + sin ks sin kx) ds = sn (x) = ⇡ 2 k=1 ⇡ ( ) Z n 1 ⇡ 1 X + = f (s) cos k(s x) ds = ⇡ 2 k=1 ⇡ (ponendo s

x = t e ricordando la propriet` a (2.46)) ( ) Z ⇡ n 1 1 X + = f (x + t) cos kt dt. ⇡ 2 k=1 ⇡

Dalla (2.60) si ottiene allora la (2.61).



Dimostrazione del Teorema 2.18. Integrando tra 0 e ⇡ ambo i membri della (2.60) otteniamo: ✓ ✓ ◆ ◆ 1 1 Z ⇡ sin n + Z 0 sin n + t t 2 2 ⇡ = dt = dt (2.62) t t 2 0 ⇡ 2 sin 2 sin 2 2 Possiamo allora scrivere, tenendo conto della (2.61): ✓ ◆ Z f (x+ ) + f (x ) 1 0 f (x + t) f (x ) 1 = sin n + sn (x) t dt+ t 2 ⇡ 2 ⇡ 2 sin 2 ✓ ◆ Z ⇡ f (x + t) f (x+ ) 1 1 sin n + + t dt. t ⇡ 0 2 2 sin 2

2. Serie di funzioni

c 978-88-08-63708-6

167

Posto ora

8 f (x + t) f (x ) > > ⇡t > 2 sin(t/2) > > < per t = 0 F (t) = 0 > > > > > f (x + t) f (x+ ) > : 0 0:

Ci(x) =

Z

+1 x

cos t dt t

172

CAPITOLO 3. Spazi funzionali e approssimazione di funzioni

c 978-88-08-63708-6

i) dimostrare che l’integrale improprio converge per ogni x > 0; ii) verificare l’identit` a Z x 1 cos t dt Ci(x) = + log x t 0 R1 R1 avendo posto = 0 (1 cos t)/t dt (cos t)/t dt (incidentalmente, si pu` o dimostrare 1 che `e la costante di Eulero-Mascheroni: si veda l’Esempio 2.6, pag. 433, Vol. 1); iii) dimostrare la rappresentazione per serie, valida per ogni x > 0: x4 x2 + 2 · 2! 4 · 4!

Ci = + log x

x6 + ··· 6 · 6!

9. Ricavare gli sviluppi di Fourier sotto indicati; discutere la convergenza puntuale e uniforme

della serie. Le funzioni sono assegnate sull’intervallo base indicato a fianco di ognuna e prolungate per periodicit` a.

f (x) = –p

– p/2

0

p/2

(

1 1

in [0, ⇡/2) in (⇡/2, ⇡]

f pari, 2⇡-periodica

p

1 cos(2n + 1)x 4X ( 1)n ⇡ n=0 2n + 1

a)

f (x) = ex in ( ⇡, ⇡) 2⇡-periodica

b)

– 3p

–p

0

p

3p

+1 ein x Sh ⇡ X ( 1)n ⇡ n= 1 1 in

f (x) = x in ( ⇡, ⇡) 2⇡-periodica – 2p – p

0

p

2p

2

c)

1 X

( 1)n+1

n=1

sin nx n

f (x) = |x| in ( ⇡, ⇡)

2⇡-periodica – 2p d)

–p

0

p

2p

⇡ 2

1 4 X cos(2n + 1)x ⇡ n=0 (2n + 1)2

2. Serie di funzioni

c 978-88-08-63708-6

173

10. Sviluppare in serie di Fourier il prolungamento periodico della funzione x4 per x 2

[ ⇡, ⇡]. Dedurre la formula, gi` a utilizzata nell’Esempio 2.4, 1 X 1 ⇡4 . = 4 n 90 n=1

11. Dimostrare la validit` a dei seguenti sviluppi per x 2 ( ⇡, ⇡), validi per ogni a complesso, a2 / N:

sin ax =

1 X k sin kx 2 sin a⇡ ( 1)k+1 2 ⇡ k a2 k=1 1

X cos kx 1 + ( 1)k+1 2 2 2a k a2 k=1

2 cos ax = a sin a⇡ ⇡

!

.

Dedurre le seguenti formule: 1 X

k=1 1 X

1 k2

a2

=

⇡ 2a



( 1)k+1 ⇡ = 2 2 k a 2a k=1

1 a⇡ ✓

cos a⇡ sin a⇡



1 1 + a⇡ sin a⇡



.

12. Riportiamo qui sotto alcune approssimazioni (n = 0, n = 1 in Fig. 3.13a; n = 10 in Fig. 3.13b) della funzione di cui al punto a) dell’Esercizio 9. La Figura 3.13b illustra il comportamento tipico della serie di Fourier in prossimit` a di un salto della funzione (fenomeno di Gibbs).

2

2

1.5

1.5

1

1

0.5

0.5

0

0

–0.5

–0.5

–1

–1

–1.5

–1.5

–2 –4

–2

0

2

–2 –4

4

a)

–2

0

b)

Figura 3.13. Illustrazione del fenomeno di Gibbs. 13. Osservando che le serie

Pr (x) =

1 1X k r cos kx, 2 k=1

Qr (x) =

1 X

k=1

rk sin kx

0r 0, k > 0). (1.3) N˙ (t) = "N (t) 1 k Anche la (1.3) `e un’equazione di↵erenziale del 1 ordine, ma non lineare; il termine "N (t), che rappresenta crescita esponenziale, `e mitigato da k" N (t)2 che corrisponde a competizione all’interno della popolazione e pu` o essere considerato come una specie di “attrito sociale” proporzionale al numero di incontri tra individui nell’unit` a di tempo. La costante k rappresenta un valore di soglia che si chiama capacit` a dell’ambiente: se N (t) si avvicina a k, dalla (1.3) il tasso di crescita relativo N˙ /N `e vicino a zero. Anche per la (1.3) `e possibile trovare un’espressione esplicita della soluzione soggetta alla condizione iniziale N (0) = N0 . Si ottiene (i calcoli si trovano nel Par. 1.6, Esempio 1.23) k N0 e"t . N (t) = k N0 + N0 e"t Si vede (Fig. 4.1) che N (t) ! k per t ! +1 tranne nel caso in cui N0 = 0.

N0 > k

N0 = k

N0 < k t Figura 4.1. Soluzioni dell’equazione logistica per diverse condizioni iniziali.

Esempio 1.3 Modello preda-predatore di Lotka-Volterra. Negli anni immediatamente successivi al primo conflitto mondiale, nel mare Adriatico si registr` o un calo di una certa specie di pesce commestibile e un aumento del suo predatore. Si trattava di capire come mai l’assenza di pesca durante la guerra avesse favorito lo sviluppo del predatore e sfavorito quello della preda. La questione fu posta al matematico italiano Vito Volterra, nel 1924 circa, che risolse il problema con un modello divenuto celebre. Posto x = x(t) = densit` a di prede e y = y(t) = densit` a di predatori al tempo t, Volterra formul` o le seguenti ipotesi, basate sulle informazioni fornitegli dai biologi: il tasso (relativo) di crescita delle prede `e costante in assenza di predatori ma decresce

178

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

linearmente come funzione di y; i predatori decrescono a un tasso costante in assenza di prede, ma crescente linearmente con x. Il modello che ne deriva `e il seguente: 8 x˙ > < = a by x a, b, c, d 2 R+ . (1.4) > : y˙ = c + dx y

Il sistema (1.4) era stato studiato gi` a nel 1920 dal polacco Lotka in relazione a un problema di cinetica chimica, ma l’analisi di Volterra si spinse considerevolmente oltre: vi ritorneremo in dettaglio pi` u avanti, nell’Esempio 3.6. Passiamo ora ad alcuni esempi fisici. Esempi Dinamica unidimensionale. L’equazione di Newton (1.5)

y¨ = F (t, y, y), ˙

regola il moto unidimensionale di un corpo materiale puntiforme. Si tratta di un’equazione di↵erenziale del secondo ordine (oltre a y e y˙ compare anche y¨). Qui y, y, ˙ y¨ hanno rispettivamente significato di posizione, velocit` a, accelerazione del punto materiale considerato. Il moto `e completamente determinato se aggiungiamo alla (1.5) le condizioni iniziali (1.6)

y(0) = y0 ,

y(0) ˙ = y1 .

Casi particolari notevoli sono: ` l’equazione della caduta libera dei gravi nel vuoto; g `e l’accelerazione 1.4 y¨ = g. E di gravit` a. La soluzione soddisfacente le (1.6) `e data dalla ben nota legge cinematica y(t) = y0 + y1 t

1 2 gt . 2

1.5 y¨ = ! 2 y. Equazione dell’oscillatore armonico. Questa equazione modella sistemi vibranti sotto una piccola sollecitazione proporzionale allo spostamento dall’equilibrio (legge di Hooke). Un esempio `e quello del sistema meccanico in Figura 4.2 in cui una massa m `e collegata a una molla di costante elastica k: in questo caso ! 2 = k/m. y O Figura 4.2. Allungamento y di una molla, collegata a una massa m, a riposo in 0.

` la celebre equazione proposta nel 1920 da 1.6 y¨ = y + "(1 y 2 )y˙ (" > 0). E Van der Pol, fisico olandese esperto in aspetti teorici della radioingegneria. Essa si

1. Concetti e teoremi fondamentali

c 978-88-08-63708-6

179

pu` o interpretare come una perturbazione dell’oscillatore armonico (! 2 = 1) mediante il termine forzante "(1 y 2 )y˙ che per valori grandi di y (|y| > 1) rappresenta una resistenza attiva (dissipa energia) e contrasta il moto, mentre per piccoli valori di y (|y| < 1) rappresenta una resistenza negativa (fornisce energia) che nei circuiti elettrici si realizza come “feed back” o controllo retroattivo. Si presenta in questo caso l’interessante fenomeno delle oscillazioni autosostenute. Un’analisi dell’equazione di Van der Pol `e presentata pi` u avanti, nel Paragrafo 3.7. 1.7 m¨ y +hy˙ +ky = f (t), h, k costanti positive. Questa equazione modella un sistema meccanico vibrante in cui le forze in gioco sono: • ky, forza elastica; • hy, ˙ attrito proporzionale alla velocit` a; • f (t), sollecitazione esogena dipendente dal tempo. Particolarmente importante `e il caso in cui f (t) = A cos !t: se il coefficiente d’attrito h non `e molto grande, si pu` o presentare il fenomeno della risonanza quando ! `e vicino alle frequenze caratteristiche proprie del sistema. Di rilievo `e il fatto che lo stesso tipo di equazione `e soddisfatta dalla intensit` a di corrente I = I(t) in un circuito elettrico LRC (L = induttanza, R = resistenza, C = capacit` a) con una potenza applicata f (t): LI¨ + RI˙ + C

1

I = f (t).

Si deduce che la teoria dei circuiti elettrici oscillanti coincide con quella dei sistemi meccanici vibranti. Lo studio della precedente equazione `e sviluppato nei Complementi alla Sezione 2. L

f(t)

C

I(t)

R

Figura 4.3. Circuito LRC.

1.8 Moto dei pianeti. Supponiamo che nell’origine del sistema di riferimento in R3 sia posto un corpo di massa M (sole) il cui campo gravitazionale di forza per unit` a p di massa `e dato dal vettore M G grad(1/r), dove r = x2 + y 2 + z 2 e G `e la costante di gravitazione. Il moto di un corpo di massa m (⌧ M , un pianeta) sotto l’influenza di questo campo di forza `e dato dal sistema seguente, di 3 equazioni di↵erenziali non lineari del secondo ordine: y z x z¨ = M G 3 . (1.7) x ¨ = M G 3 , y¨ = M G 3 , r r r Dal sistema (1.7) si possono ricavare, per esempio, le leggi di Keplero sul moto dei pianeti.

180

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

1.2 Definizioni e terminologia Incominciamo lo studio sistematico della teoria precisando la terminologia e le definizioni principali gi` a utilizzate a livello intuitivo negli esempi del paragrafo precedente. Si chiama equazione di↵erenziale ordinaria di ordine n una relazione della forma (1.8)

F (t, y(t), y 0 (t), y 00 (t), . . . , y (n) (t)) = 0,

con F : Rn+2 ◆ U ! R. Nella (1.8) compare la funzione incognita y = y(t) insieme alle sue derivate fino all’ordine n incluso, calcolate nello stesso punto. L’ordine di un’equazione `e l’ordine massimo di derivazione che vi compare. L’aggettivo ordinaria si riferisce al fatto che l’incognita `e funzione di una variabile. Si parla di equazione a derivate parziali quando l’incognita `e funzione di pi` u variabili; un esempio `e l’equazione di Laplace uxx + uyy + uzz = 0. Se nella (1.8) `e possibile esplicitare la derivata di ordine massimo: (1.9)

y (n) (t) = f (t, y(t), y 0 (t), . . . , y (n

1)

(t)),

con f : Rn+1 ◆ D ! R, l’equazione si dice scritta in forma normale. Se, nella (1.8), F `e un polinomio di primo grado in y, y 0 , . . . , y (n) , l’equazione si dice lineare; la forma generale `e la seguente: (1.10)

a0 (t)y (n) (t) + a1 (t)y (n

1)

(t) + · · · + an

1y

0

(t) + an (t)y(t) = b(t).

o scrivere in forma normale. Nel caso a0 (t) 6= 0 la (1.10) si pu` Se F nella (1.8) o f nella (1.9) non dipende esplicitamente da t, l’equazione si dice autonoma. Riferendoci agli esempi del paragrafo precedente abbiamo: 1.1: equazione lineare autonoma del 1 ordine; 1.2: non lineare autonoma del 1 ordine; 1.4 e 1.5: lineari autonome del 2 ordine; 1.6: non lineare autonoma del 2 ordine; 1.7: lineare, non autonoma, del 2 ordine. Tutte le equazioni citate sono in forma normale. Precisiamo ora la nozione di soluzione (locale) di un’equazione di↵erenziale. Ci riferiamo d’ora in poi, salvo un breve cenno negli esercizi, a equazioni in forma normale. DEFINIZIONE 1.1 Si dice soluzione (o integrale) dell’equazione (1.9) una funzione ' = '(t), definita e di↵erenziabile n-volte in un intervallo I ✓ R tale che (t, '(t), . . ., '(n 1) (t)) 2 D e '(n) (t) = f (t, '(t), '0 (t), . . . , '(n

1)

(t))

8 t 2 I.

Pi` u generalmente, si pu` o parlare di sistemi di equazioni di↵erenziali ordinarie, in pi` u funzioni incognite, tutte di una sola variabile.

1. Concetti e teoremi fondamentali

c 978-88-08-63708-6

181

Il modello di Lotka-Volterra `e un esempio di sistema di due equazioni del 1 ordine; il sistema (1.7), che modella il moto dei pianeti, `e composto da tre equazioni di↵erenziali del secondo ordine. Noi tratteremo il caso particolarmente importante e, come vedremo subito, sufficientemente generale, dei sistemi di n equazioni del 1 ordine in forma normale, in n funzioni incognite; un generico sistema di questo tipo si pu` o scrivere nel modo seguente:1 8 y˙ 1 = f1 (t, y1 , y2 , . . . , yn ) > > > >

> . > > : y˙ n = fn (t, y1 , y2 , . . . , yn ), dove le funzioni fj , j = 1, . . . , n, sono definite in una stessa regione D di Rn+1 e y1 = y1 (t), . . . , yn = yn (t) sono le funzioni incognite. Introducendo i vettori y(t) = (y1 (t), . . . , yn (t)) e f = (f1 , f2 , . . . , fn ), il sistema (1.11) pu` o essere scritto pi` u concisamente come un’unica equazione vettoriale: ˙ y(t) = f (t, y(t)).

(1.12)

Se ogni componente di f `e lineare in y si dice che il sistema `e lineare. Se f non dipende esplicitamente da t ossia f = f (y), si dice che il sistema `e autonomo. DEFINIZIONE 1.2 Per soluzione (o integrale ) del sistema (1.11) si intende una funzione ' : I ! Rn , dove I ✓ R `e un intervallo, di↵erenziabile in I tale che (t, ' (t)) 2 D e '˙ (t) = f (t, ' (t))

8 t 2 I.

Un’equazione di↵erenziale di ordine n come la (1.9) si pu` o sempre ridurre a un sistema del tipo (1.11) ponendo, per esempio, y1 = y,

y2 = y 0 , . . . , yn = y (n

1)

.

Si ottiene il sistema:

(1.13)

8 y˙ 1 = y2 > > > > > y˙ = y3 > < 2 .. . > > > >y˙ n 1 = yn > > : y˙ n = f (t, y1 , y2 , . . . , yn ).

Il procedimento di riduzione non `e certamente unico. L’equazione (1.9) e il sistema (1.13) sono equivalenti nel senso seguente: una soluzione ' della (1.9) genera il vettore (', '0 , . . . , '(n 1) ) soluzione del sistema; viceversa, 1 Quando

y, ˙ y¨.

interverranno solo derivate prime o seconde useremo di preferenza la notazione di Newton

182

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

se ' = ('1 , . . . , 'n ) `e soluzione del sistema, allora '1 `e di↵erenziabile n volte ed `e soluzione della (1.9). La teoria delle equazioni di ordine n `e pertanto riconducibile a quella dei sistemi di n equazioni del 1 ordine. Esempio 1.9 L’equazione di Van der Pol (Esempio 1.6) si riduce, con il procedimento sopra esposto, al sistema ( y˙ 1 = y2 y˙ 2 = y1 + "(1 y12 )y2 . Osservando poi che y¨ + "(y 2

1)y˙ =

 ✓ 3 d y y˙ + " dt 3

ponendo z = y˙ + "



y3 3

y



,

◆ y ,

l’equazione si riduce al sistema

(1.14)

✓ 3 8 1 f (t, y) `e localmente lipschitziana in D = R2 rispetto a y, uniformemente in t; per ↵ = 1 `e lipschitziana in tutto R2 . b) f `e localmente lipschitziana in R+ ⇥ R2 . TEOREMA 1.2 (di esistenza e unicit` a locale) Sia f : D ! Rn , con D aperto di Rn+1 . Se: i) f `e continua in D; ii) f `e localmente lipschitziana in D rispetto a y, uniformemente in t, , ⌧ + ], nel quale allora, per ogni punto (⌧, ⇠) 2 D esiste un intorno I di ⌧ , I = [⌧ `e definita una soluzione ' del problema di Cauchy (1.16). Tale soluzione `e unica nel senso che ogni altra soluzione coincide con ' nell’intervallo comune di definizione. Useremo, in seguito, la notazione ' (t; ⌧, ⇠) quando servir` a mettere in evidenza la condizione iniziale. Si noti che, essendo f continua in D, la soluzione ' risulta non solo di↵erenziabile in I bens`ı anche di classe C 1 (I ). Infatti, dall’equazione di↵erenziale si ha '˙ (t) = f (t, ' (t)) ed f (t, ' (t)) `e continua in I come composta di funzioni continue. Per la dimostrazione del teorema seguiremo la seguente strategia: a) riduzione del problema di Cauchy a un’equazione integrale (Lemma 1.3); b) interpretazione dell’equazione integrale come problema di punto fisso per un particolare operatore in un opportuno spazio metrico; c) uso del teorema delle contrazioni di Banach-Caccioppoli. LEMMA 1.3 Valgano le ipotesi del Teorema 1.2. Se ' 2 C 1 (I ) `e soluzione del problema di Cauchy (1.16), allora ' soddisfa la seguente equazione integrale (detta equazione integrale di Volterra): Z t f (s, y(s))ds 8t 2 I . (1.18) y(t) = ⇠ + ⌧

Viceversa, se ' 2 C(I ) `e soluzione di (1.18), allora ' 2 C 1 (I ) ed `e soluzione del problema di Cauchy (1.16). Dimostrazione. Integriamo l’equazione '˙ (t) = f (t, ' (t)) tra ⌧ e t, t 2 I . Usando il teorema fondamentale del calcolo integrale e la condizione iniziale ' (⌧ ) = ⇠ si ricava Z t f (s, ' (s))ds (1.19) ' (t) ⇠ = ⌧

che `e la (1.18) per ' . Viceversa, se ' 2 C(I ) `e soluzione di (1.19), `e automaticamente di classeR C 1 (I ) essent dolo, ancora per il teorema fondamentale del calcolo integrale, la funzione ⌧ f (s, ' (s))ds. Derivando la (1.19) si ottiene '˙ (t) = f (t, ' (t)) per ogni t 2 I e sostituendo, sempre nella ⇤ (1.19), t = ⌧ , si deduce ' (⌧ ) = ⇠. Pertanto ' `e soluzione del problema di Cauchy.

188

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Dimostrazione del Teorema 1.2. In base al Lemma 1.3 `e sufficiente dimostrare che, se `e opportunamente scelto, l’equazione integrale (1.18) ha un’unica soluzione in , ⌧ + ]. Interpretiamo tale equazione come equazione di punto fisso introducendo I = [⌧ l’operatore seguente: Z t f (s, y(s))ds (t 2 I ) (1.20) y(t) 7! F[y](t) := ⇠ + ⌧

ben definito sulle funzioni y = y(t) che hanno il grafico contenuto in D. Risolvere la (1.18) '] = ' ovvero un punto fisso per F. equivale allora a trovare ' 2 C(I ) tale che F[' Per usare il teorema di Banach-Caccioppoli occorre trovare uno spazio metrico completo Y tale che F(Y ) ✓ Y , nel quale F sia contrazione. Osserviamo che non si pu` o scegliere Y = C(I ) in quanto, in generale, in C(I ) vi sono funzioni che non hanno il grafico contenuto in D. Siano allora a, b 2 R+ tali che il cilindro (rettangolo per n = 1) := {(t, y) 2 Rn+1 : |t

(1.21)

⌧ |  a, |y

⇠|  b}

sia contenuto in D. Introduciamo lo spazio metrico Y delle funzioni continue in I , il cui grafico sia contenuto in ; in formule: ' 2 C(I ) : |' '(t) ⇠|  b, 8 t 2 I }. Y := {' ', ) := max |' '(t) Con la metrica della convergenza uniforme, d(' t2I

(t)|, Y `e uno spazio

metrico completo (Esercizio 11, Cap. 3, Sez. 1). L’operatore integrale (1.20) `e ben definito in Y . Il problema `e ora scegliere che:

in modo tale

'] 2 Y ; i) F(Y ) ✓ Y , ovvero che se ' 2 Y anche F[' ii) F risulti una contrazione in Y , ovvero che esiste ↵, 0  ↵ < 1, tale che '], F[ ])  ↵ d(' ', ). d(F[' '] 2 C(I ). Occupiamoci di i). Chiaramente, se ' 2 Y allora F[' Poniamo M = max |f (t, y)|. Si ha, per ogni t 2 I : (t,y)2

'](t) |F['

Z

⇠| =

t ⌧

f (s, ' (s))dx 

Z

t ⌧

|f (s, ' (s))|ds  M |t

⌧|  M .

'] 2 Y . Ne segue che, se M  b e cio`e  b/M , allora F[' Sia allora  b/M e veniamo alla ii). Per ogni coppia ' , 2 Y e ogni t 2 I , indicando con L la costante di Lipschitz di f relativa al compatto , si ha Z t '](t) F[ ](t)| = [f (s, ' (s)) f (s, (s))]ds  |F[' 

Z

L



t



Z

|f (s, ' (s))

f (s, (s))|ds 

t ⌧

'(s) |'

(s)|ds  L|t

', )  L d(' ', ). ⌧ |d('

Scegliendo < 1/L si ottiene che F `e una contrazione di costante L < 1. ¯ per F in Y . D’altra Conclusione: se < min{a, b/M, 1/L} esiste un unico punto fisso ' parte, se ' 1 2 C(Is ) `e una soluzione dell’equazione (1.18), necessariamente ' 1 2 Y 1 , dove ¯ in Is \ I . ⇤ 1 = min{s, }, e quindi ' 1 = '

1. Concetti e teoremi fondamentali

c 978-88-08-63708-6

189

Dalla dimostrazione del teorema si ricava dunque un’informazione riguardante l’in, ⌧ + ] con tervallo di esistenza della soluzione: essa esiste almeno in I = [⌧ < min{a, b/M, 1/L}. Nel prossimo paragrafo a↵ronteremo la questione della prolungabilit` a di una soluzione a un intervallo massimale di esistenza. La seguente proposizione indica che il metodo di dimostrazione `e in un certo senso costruttivo. PROPOSIZIONE 1.4 Nelle ipotesi del Teorema 1.2, la seguente successione definita per ricorrenza converge uniformemente in I alla soluzione del problema di Cauchy (1.16): Z t 'n ] = ⇠ + (1.22) ' 0 (t) = ⇠, ' n+1 = F[' f (s, ' n (s))ds (n 0) 2 ⌧

Dimostrazione. La (1.22) `e esattamente la successione che tende al punto fisso nel teorema di Banach-Caccioppoli. La convergenza `e uniforme perch´e `e questa la convergenza ⇤ in Y .

Per la costruzione e↵ettiva della soluzione si pu` o quindi usare la successione (1.22); questo metodo si chiama metodo delle approssimazioni successive ed `e legato ai u che altro teorico per via nomi di Liouville, Peano, Picard3 . Il suo interesse `e pi` soprattutto delle difficolt` a connesse col calcolo, anche numerico, degli integrali a ogni passo. Illustriamo tuttavia il metodo su un esempio molto elementare. Esempio 1.12 Consideriamo il problema di Cauchy ( y˙ = y + t 1 y(0) = 1 che ha come soluzione y(t) = et t, come facilmente si verifica. L’equazione integrale equivalente `e: Z t [y(s) + s 1]ds. y(t) = 1 + 0

La successione (1.22) prende la forma seguente: Z t '0 (t) = 1, 'n+1 (t) = 1 + ['n (s) + s

1]ds.

0

Si ottiene:

Z

t

t2 [1 + s 1]ds = 1 + 2 0 Z t 2 s t2 t3 1+ + s 1 ds = 1 + + '2 (t) = 1 + 2 2 3! 0 .. . Z t s2 s3 sn 1 1+ + + ··· + +s 'n (t) = 1 + 2 3! (n 1)! 0 '1 (t) = 1 +

2 Anzich´ e 3 Joseph

1 ds = 1 +

t2 t3 tn + + ··· + . 2 3! n!

' 0 (t) = ⇠, si pu` o scegliere ' 0 (t) = (t), dove ` e arbitraria in Y . ´ Liouville (1809-1882), Emile Picard (1856-1921), matematici francesi.

190

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Dunque 'n (t) = 1 + t +

t2 tn + ··· + 2 n!

t ! et

t

per n ! +1,

con convergenza uniforme in ogni intervallo limitato di R. Abbiamo gi` a osservato che la continuit` a di f in D implica che una soluzione ' dela di f si ripercuote in l’equazione y˙ = f (t, y) sia di classe C 1 . Una ulteriore regolarit` ulteriore regolarit` a di ' come esprime la seguente proposizione. a delle soluzioni) Se f 2 C k (D), k intero 0, allora una PROPOSIZIONE 1.5 (Regolarit` ' ˙ soluzione dell’equazione y = f (t, y) `e di classe C k+1 nel suo dominio; dunque, se f 2 C 1 (D), anche ' `e di classe C 1 . Infine, se f `e analitica in D, anche ' lo `e. Dimostrazione. Per induzione. Il caso k = 0 `e gi` a stato dimostrato. Supponiamo che la propriet` a “f 2 C j (D) ) ' di classe C j+1 ” sia vera per j = 0, 1, . . . , k 1. Se f 2 C k (D), sappiamo allora che ' `e di classe C k ; inoltre, derivando l’equazione di↵erenziale '˙ = f (t, ' ) si ottiene (1.23)

¨ = ft (t, ' ) + Dy f (t, ' )'˙ '

dove Dy f indica la matrice Jacobiana di f rispetto a y. Poniamo g(t, y) := ft (t, ' (t))+Dy f (t, ' (t))y; allora = '˙ soddisfa l’equazione y˙ = g(t, y) con g 2 C k 1 (D). Ne segue, per l’ipotesi di ricorrenza, che '˙ `e di classe C k e pertanto che a, che esula dai limiti della ' `e di classe C k+1 . Tralasciamo la dimostrazione dell’analiticit` ⇤ presente trattazione.

Esempi 1.13 Per un’equazione lineare di ordine n in forma normale (1.24)

y (n) = a1 (t)y (n

1)

+ · · · + an

1 (t)y

0

+ an (t)y + b(t)

la regolarit` a delle soluzioni dipende da quella dei coefficienti aj , j = 0, . . . , n, e da quella di b. Se aj , b 2 C k (I), i vettori soluzione del sistema equivalente, sono, in base alla Proposizione 1.5, di classe C k+1 e di conseguenza ogni soluzione della (1.24) `e di classe C n+k . Vedremo tra breve che queste soluzioni sono definite in tutto I. 1.14 Consideriamo il problema di Cauchy 8

> > >

> . > > : y˙ n = an1 (t)y1 + an2 (t)y2 + · · · + ann (t)yn + bn (t) o in forma matriciale

y˙ = A(t)y + b(t),

dove A(t) = (aij (t))i,j=1,...,n

0

1 y1 (t) B C y(t) = @ ... A yn (t)

0

1 b1 (t) B C b(t) = @ ... A . bn (t)

Se aij , b 2 C([⌧1 , ⌧2 ]) le condizioni del Teorema 1.6 sono soddisfatte; infatti in questo caso @fi /@yi (t, y) = aij (t) e quindi, se Lij = max |aij (t)| e L0 = max Lij si ha t2[⌧1 ,⌧2 ]

i,j

|@fi /@yj (t, y)|  L0 , 8 (t, y) 2 S. Dunque le soluzioni del sistema (1.28) esistono in tutto [⌧1 , ⌧2 ]. Questa propriet` a si estende anche al caso in cui A(t) e b(t) siano continui in un intervallo I qualunque, non necessariamente compatto. In particolare se I = R tutte le soluzioni di (1.28) sono definite in R. Il seguente esempio mostra come si pu` o utilizzare la teoria svolta fino a questo punto e l’equazione stessa per uno studio qualitativo delle curve integrali. Esempio 1.17 Consideriamo il problema di Cauchy ( y˙ = arctg(ty) y(0) = ↵ (↵ 2 R). Poich´e f (t, y) = arctg(ty) 2 C 1 (R2 ) e |f (t, y)|  ⇡/2, 8 (t, y) 2 R2 , si ricava che, per ogni ↵, la soluzione esiste, `e unica, `e definita su tutto R ed `e di classe C 1 (R). Possiamo trarre qualche informazione sul suo grafico. Intanto, se ↵ = 0 l’unica soluzione `e ' = 0. Sia ↵ > 0. Dall’equazione si deduce che '(0) ˙ = 0, '(t) ˙ > 0 per t > 0 e '(t) ˙ < 0 per t < 0: t = 0 `e una linea di minimi assoluti per le soluzioni per cui '(t) > 0 in R. Si noti che '(t) = ↵ + ↵2 t2 + o(t2 ) per t ! 0. Poich´e cambiando t in t l’equazione rimane invariata e cos`ı pure la condizione iniziale, l’unicit` a delle soluzioni implica '(t) = '( t), ovvero i grafici sono simmetrici rispetto all’asse y. Derivando l’equazione, si trova '(t) ¨ =

'(t) + t'˙ 1 + t2 '(t)2

che `e positiva per ogni t 2 R. La soluzione risulta dunque strettamente convessa in R.

196

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Studiamo l’andamento di ' per t ! +1. Essendo ' monotona crescente in (0, +1) ˙ = ⇡/2 e esiste lim '(t) = l. Dall’equazione di↵erenziale si deduce che lim '(t) t!+1

t!+1

quindi l = +1. Vediamo se esiste un asintoto obliquo che dovr` a avere un’equazione del tipo y = ⇡2 t + q. Per determinare q occorre calcolare lim ('(t) ⇡2 t). t!+1

Dall’equazione si ricava, per t > 0 '(t)

↵=

Z

t

arctg(s'(s))ds

0

e quindi '(t)

⇡ t=↵+ 2

Z th arctg(s'(s)) 0

⇡i ds. 2

Dunque l’asintoto esiste se `e convergente l’integrale improprio ✓ ◆ Z +1 h Z +1 1 ⇡i arctg arctg(s'(s)) ds = ds.4 2 s'(s) 0 0 Sia t0 > 1 tale che, per t > t0 , arctg(t'(t)) > ⇡/4. Allora, per t > t0 , '(t) ˙ > ⇡/4, ovvero '(t) > '(t0 )+⇡(t t0 )/4; ne segue che arctg(1/s'(s)) = O(1/s2 ) per s ! +1 e pertanto l’integrale `e convergente. Un grafico qualitativo di ' `e illustrato in Figura 4.7. Per ↵ < 0 l’andamento `e simmetrico rispetto all’asse t. y j a t Figura 4.7. Andamento qualitativo della soluzione del problema di Cauchy dell’Esempio 1.17.

Un altro teorema di prolungamento `e il seguente, che esprime la prolungabilit` a di una soluzione fino alla frontiera di D. TEOREMA 1.7 Valgano le ipotesi del Teorema 1.2. Siano D0 un compatto contenuto in D, (⌧, ⇠) un punto in D0 e J' = (Tmin , Tmax ) l’intervallo massimale di esistenza di ' (t; ⌧, ⇠). + e per t ! Tmax . Allora il grafico di ' esce da D0 definitivamente per t ! Tmin Dimostrazione. Poich´e D0 `e compatto e D aperto, la distanza di D0 da @D `e positiva. Precisamente si ha: inf dist((t, y), @D) = d > 0. (t,y)2D0

Sia K {(t, y) 2 D : dist((t, y), D0 )  d2 }. Allora K `e compatto e D0 ⇢ K ⇢ D. Se b2 + a2  d2 , per ogni (⌧, ⇠) 2 D0 , il cilindro = {(t, y) 2 D : |y ⇠|  b, |t ⌧ |  a} `e contenuto in 4 K e pertanto max |f (t, y)|  M := max |f (t, y)|. (t,y)2

4⇡ 2

arctg

= arctg

(t,y)2K

1

.

1. Concetti e teoremi fondamentali

c 978-88-08-63708-6

197

, ⌧ + ] dove = Ma allora, 8 (⌧, ⇠) 2 D0 , la soluzione ' (t; ⌧, ⇠) esiste almeno in [⌧ b }. Essendo indipendente da (⌧, ⇠), operando il prolungamento a destra e a sinistra, min{a, M a ogni passo si avanza (almeno) di e perci` o, dopo un numero finito di passi il grafico di y ⇤ esce da D0 .

Come conseguenza del Teorema 1.7 si ottiene il seguente criterio di prolungabilit` a, frequentemente utilizzato nelle applicazioni. COROLLARIO 1.8 Valgano le ipotesi del Teorema 1.7 con D = Rn+1 . Se esistono due costanti c1 0, c2 0 tali che (1.29)

'(t)|  c1 + c2 (t |'

⌧ ),

8 t 2 J'+ = [⌧, Tmax )

o accade se ' `e limitata in J'+ (c2 = 0). allora J'+ = [⌧, 1). In particolare ci` Per il prolungamento a sinistra l’enunciato si modifica in modo ovvio. Dimostrazione. Per assurdo sia Tmax < +1. Con una traslazione, possiamo riportarci al caso in cui ⌧ = 0 e ⇠ = 0. In tal caso Tmax > 0. Consideriamo il cilindro = {(t, y) 2 Rn+1 : t 2 J'+ , |y|  b} dove b `e un qualunque numero maggiore di c1 + c2 Tmax . Allora dalla (1.29) si ha: (1.30)

'(t)|  c1 + c2 Tmax < b, |'

8 t 2 J'+ .

In base al Teorema 1.7, il grafico di ' deve uscire dal cilindro compatto ; d’altra parte, la (1.30) implica che esso deve uscire attraverso la base destra del cilindro e che quindi ' si ⇤ pu` o prolungare a destra di J'+ . Contraddizione.

Vediamo un importante esempio di applicazione del Corollario 1.8. Esempio 1.18 Consideriamo l’equazione (autonoma) di Newton (1.31)

y¨ = f (y),

che modella un sistema conservativo a un grado di libert` a. Supponiamo che f 2 C 1 (R), cosicch´e per ogni ⌧, ⇠0 , ⇠1 2 R, il problema di Cauchy ˙ ) = ⇠1 ha un’unica soluzione, definita in un con condizioni iniziali y(⌧ ) = ⇠0 , y(⌧ intervallo massimale J' . Il sistema equivalente alla (1.31) ha la forma ( y˙ 1 = y2 (1.32) y˙ 2 = f (y1 ). Nella spazio delle variabili y1 , y2 (spazio delle fasi) consideriamo le seguenti funzioni: T (y2 ) =

y22 = energia cinetica 2Z y1

U (y1 ) =

f (s)ds = energia potenziale

0

E = T + U = energia meccanica.

198

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

La ragione del termine conservativo sta nel fatto che, durante il moto, l’energia meccanica E rimane costante (si conserva). Pi` u precisamente, se ' (t) = ('1 (t), '2 (t)) `e una traiettoria del sistema si ha: d d d E('1 (t), '2 (t)) = T ('2 (t)) + U ('1 (t)) = dt dt dt = '2 (t)'˙ 2 (t) f ('1 (t))'˙ 1 (t) = [utilizzando le (1.32)] = 0 8 t 2 J' . Si dice in tal caso che E `e una costante del moto o un integrale primo del sistema. Vogliamo mostrare che: se l’energia potenziale U si mantiene limitata inferiormente, vale a dire se esiste c0 tale che U (y) c0 per ogni y 2 R, allora J' = R e cio`e ogni soluzione di (1.32) esiste in tutto R. Sia ' una soluzione di (1.32); poich´e l’energia `e una costante del moto si ha: '2 (t)2 + U ('1 (t)) = E('1 (t), '2 (t)) = c, 2

(1.33)

Essendo U (y) c0 , dalla (1.33) si deduce '2 (t)2  2(c p 2(c c0 ), 8 t 2 J' . Essendo poi '˙ 1 (t) = '2 (t) si ha: '1 (t)

'1 (⌧ ) = '˙ 1 (t)(t

8 t 2 J' . c0 ) ovvero |'2 (t)| 

⌧ ),

dove t `e un opportuno valore compreso tra ⌧ e t, t 2 J' . Pertanto p |'1 (t)|  |'1 (⌧ )| + 2(c c0 )|t ⌧ |.

La tesi segue allora dal Corollario 1.8.

Cos` dell’equazione y¨ = y 3 sono definite in tutto R essendo U (y) = R y ı,3 le soluzioni 4 s ds = y /4 0. 0 Non cos`ı per l’equazione y¨ = 2y 3 soddisfatta, per esempio, da '(t) = 1/(t 1). Esercizi 8. Si consideri il problema di Cauchy nell’Esempio 1.14. Stabilire se la soluzione ` e prolungabile indefinitamente a +1. In tal caso studiarne il comportamento per t ! +1. 9. Studiare l’andamento delle curve integrali delle equazioni seguenti:

t2 y 3 ; 1 + y2 2 (sin t) b) y˙ = e 1 + t2 a) y˙ =

y2

;

2

1); c) y˙ = t3 (e2 y cos y d) y˙ = p . 1 + t2 + y 2

10. Dato il problema di Cauchy:

8 0)

1. Concetti e teoremi fondamentali

c 978-88-08-63708-6

199

a) discutere unicit` a ed esistenza locale; b) determinare l’intervallo massimale di esistenza; c)⇤ per i valori di b per i quali l’intervallo massimale `e (0, +1) stabilire se esistono asintoti obliqui; d)⇤⇤ dimostrare che esiste un unico b tale che la soluzione corrispondente esiste in (0, +1) e tende a zero per t ! +1. e)⇤ tracciare un grafico qualitativo delle soluzioni; 11. Dato il problema di Cauchy

8 1 0)

studiare l’andamento delle soluzioni. Stabilire in particolare se le soluzioni sono prolungabili a destra di 1 fino a +1. 12. Dato il problema di Cauchy

8 >

:y˙ = ty e 2 1

t2 y2

con y1 (0) = y2 (0) = 1, discutere esistenza e unicit` a locali e prolungabilit` a della soluzione a destra di t = 0. 13.*

Dimostrare il seguente teorema di confronto.

TEOREMA: siano ', (*)

definite in [⌧, T ], derivabili e tali che: '(t) ˙ < f (t, '(t)), '(⌧ ) < (⌧ ), ˙ (t) = f (t, (t))

dove f verifica le ipotesi del Teorema 1.2 in S = [⌧, T ] ⇥ R. Allora '(t) < (t), 8 t 2 [⌧, T ]. (t)}. Dimostrare [Suggerimento: ragionare per assurdo e porre ⌧1 = inf{t 2 [⌧, T ) : '(t) o, dedurre che che ⌧1 > ⌧ , che '(⌧1 ) = (⌧1 ) e che '(t) < (t) per t 2 [⌧, ⌧1 ). Da ci` ˙ (⌧1 ), in contraddizione con le (*) per t = ⌧1 .] '(⌧ ˙ 1) 14. Usare il teorema dell’Esercizio 13 per dimostrare che la soluzione del problema di Cauchy

(

y˙ = ty + y 2 + 1 y(0) = 1

non `e prolungabile indefinitamente a destra di t = 0. 15. Sia ' soluzione di y˙ = f (t, y) in [⌧

, ⌧ + ]. Dimostrare che, se '(⌧ ˙ ) = 0, ⇠ = '(⌧ ) e ft (⌧, ⇠) > 0, allora ' ha un minimo locale in t = ⌧ .

*1.5 Dipendenza delle soluzioni dai dati iniziali e da eventuali parametri Nel modellare fenomeni in evoluzione mediante equazioni di↵erenziali, spesso i dati iniziali sono noti con un certo grado di approssimazione. Pu` o inoltre comparire nell’equazione un certo numero di parametri rilevanti, determinati sperimentalmente,

200

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

e perci` o soggetti a errori di misura. Si pensi, per esempio, all’equazione dei circuiti elettrici LI¨ + RI˙ + CI = A cos !t, dipendente dai parametri L, R, C, A e !. Quanto `e sensibile la soluzione a un errore sui dati iniziali e sui parametri? Per l’attendibilit` a dei risultati occorre che piccole variazioni su di essi (dati e parametri) producano piccole variazioni sulla soluzione. Formalizziamo il problema, cominciando con la dipendenza dai dati iniziali. Sia f : D ! Rn , con D aperto di Rn+1 , f = f (t, y) continua e localmente lipschitziana rispetto a y uniformemente in t. Supponiamo inoltre che per ogni (⌧, ⇠) in un intorno A di (⌧0 , ⇠0 ) 2 D, ogni soluzione ' (t; ⌧, ⇠) sia definita in un intervallo comune a tutte [⌧1 , ⌧2 ].5 TEOREMA 1.9 Valgano le ipotesi anzi dette. Se (⌧, ⇠) ! (⌧0 , ⇠0 ), (⌧, ⇠) 2 A, allora ' (t; ⌧, ⇠) ! ' (t; ⌧0 , ⇠0 ) uniformemente in t 2 [⌧1 , ⌧2 ]. Per la dimostrazione facciamo uso del seguente lemma, di interesse indipendente. LEMMA (di Gronwall) Siano I ⇢ R un intervallo e ⌧ 2 I. Siano inoltre u, v : I ! R due funzioni continue in I, non negative e c 2 R+ . Se: Z t (1.34) v(t)  c + u(s)v(s)ds 8t 2 I ⌧

allora v(t)  ce|

(1.35) Dimostrazione. Sia t

Rt ⌧

u(s)ds|

8 t 2 I.

⌧ ; poniamo w(t) := c +

Z

t

u(s)v(s)ds; ⌧

allora w0 (t) = u(t)v(t)  u(t)w(t) per l’ipotesi (1.34). Di conseguenza d [w(t)e dt

Rt ⌧

u(s)ds

]=e

Rt ⌧

u(s)ds

[w0 (t)

u(t)w(t)]  0

Rt

e perci` o e ⌧ u(s)ds w(t)  w(⌧ ) = c, da cui la tesi. Se t  ⌧ si pone t0 = ⌧ al caso precedente. Lasciamo i dettagli al lettore.

t e ci si riporta ⇤

Dimostrazione del Teorema 1.9. Restringendo eventualmente l’intorno A di (⌧0 , ⇠ 0 ) si pu` o trovare un compatto ⇢ D che contiene tutti i grafici delle ' (t; ⌧, ⇠) per (⌧, ⇠) 2 A. Siano M = max |f (t, y)| ed L la costante di Lipschitz di f in . (t,y)2

Dall’equazione di Volterra si ha, per ogni t 2 [⌧1 , ⌧2 ]: Z t f (s, ' (s; ⌧, ⇠))ds ' (t; ⌧, ⇠) = ⇠ + ⌧

e

' (t; ⌧0 , ⇠ 0 ) = ⇠ 0 +

5 Si

Z

t ⌧0

f (s, ' (s; ⌧0 , ⇠ 0 ))ds.

potrebbe dimostrare che un intorno A di (⌧0 , ⇠0 ) con questa propriet` a esiste sempre.

1. Concetti e teoremi fondamentali

c 978-88-08-63708-6

Sottraendo membro a membro, si ottiene, scrivendo '(t; ⌧, ⇠) |' +

Z

' (t; ⌧0 , ⇠ 0 )|  |⇠

⇠0 | +

t

f (s; ' (s; ⌧, ⇠)) ⌧

Rt

⌧0

Z

... =



⌧0

R⌧

⌧0

... +

Rt ⌧

201

. . .:

f (s, ' (s; ⌧0 , ⇠ 0 ))ds +

f (s, ' (s; ⌧0 , ⇠ 0 )) ds .

Da qui si ricava '(t; ⌧, ⇠) |'

' (t; ⌧0 , ⇠ 0 )|  |⇠ +

Z

⇠ 0 | + M |⌧ t

⌧0 |+

'(s; ⌧, ⇠) L|' ⌧

' (s; ⌧0 , ⇠ 0 )|ds .

Applichiamo ora il lemma di Gronwall in I = [⌧1 , ⌧2 ] con: '(t; ⌧, ⇠) v(t) = |'

' (t; ⌧0 , ⇠ 0 )|, c = |⇠

⇠ 0 | + M |⌧

⌧0 |

e

u(t) = L.

Si ottiene, per ogni t 2 [⌧1 , ⌧2 ] (1.36)

'(t; ⌧, ⇠) |'

' (t; ⌧0 , ⇠ 0 )|  (|⇠

⇠ 0 | + M |⌧

⌧0 |)eL(⌧2

⌧1 )

.

La (1.36) implica immediatamente la tesi6 .



Sottolineiamo che la (1.36) fornisce una limitazione di quanto le soluzioni corrispondenti a dati iniziali diversi possono allontanarsi nell’intervallo [⌧1 , ⌧2 ]. La presenza del fattore eL(⌧2 ⌧1 ) indica che la convergenza `e uniforme in intervalli limitati, mentre non si esclude un allontanamento esponenziale all’infinito anche per soluzioni corrispondenti a dati iniziali molto vicini. Infatti, per esempio, i problemi di Cauchy ( ( y˙ = y y˙ = y e y(0) = 1 y(0) = 1 + " (" > 0) hanno soluzioni rispettivamente date da '1 (t) = et e '2 (t) = (1 + ")et ma '2 (t) '1 (t) = "et ! +1 per t ! +1. Incidentalmente sottolineiamo che valutazioni del tipo (1.36) sono molto utili nell’analisi numerica delle equazioni di↵erenziali. La dipendenza continua dai parametri `e una semplice conseguenza del Teorema 1.9. Sia infatti f = f (t, y, ) con parametro vettoriale variabile in un aperto ⇤ ✓ Rk . Si richiede che f sia continua in D ⇥ ⇤ e lipschitziana rispetto a y e uniformemente in t. Supponiamo inoltre che per ogni in un intorno di il problema di Cauchy ( y˙ = f (t, y, ) (1.37) y(⌧ ) = ⇠ abbia un’unica soluzione ' = ' (t; ) definita in un intervallo comune [⌧1 , ⌧2 ].7 Allora: 6 La 7 Si

(1.36) implica che ' (t; ⌧, ⇠) ` e lipschitziana rispetto a (⌧, ⇠) uniformemente in t 2 [⌧1 , ⌧2 ]. pu` o dimostrare che un intorno di con questa propriet` a esiste sempre.

202

CAPITOLO 4. Equazioni di↵erenziali ordinarie

PROPOSIZIONE 1.10 Se

c 978-88-08-63708-6

! , '(t; ) ! ' (t, ) uniformemente in [⌧1 , ⌧2 ].

` sufficiente osservare che il problema (1.37) equivale al seguente: Dimostrazione. E 8 >

: y(⌧ ) = ⇠, z(⌧ ) =

ottenuto aggiungendo la funzione “fittizia” z = z(t). Il sistema (1.38) soddisfa le ipotesi del ⇤ Teorema 1.9 e pertanto la conclusione `e immediata.

La considerazione delle soluzioni come funzioni dei dati iniziali `e alla base della teoria dei sistemi dinamici continui. In questo ordine di idee, tuttavia, oltre alla dipendenza continua espressa dal Teorema 1.9, servono risultati di di↵erenziabilit` a. A questo proposito ci limitiamo a enunciare il seguente risultato. a. Se inoltre le PROPOSIZIONE 1.11 Valgano le ipotesi del teorema di esistenza e unicit` derivate parziali @fj /@yk , j, k = 1, . . . , n, sono continue in D, allora esistono continue anche le derivate di ' (t; ⌧, ⇠) rispetto a ⇠j , j = 1, . . . , n. Inoltre le derivate miste @ 2 'j /@t@⇠i sono continue. Un teorema analogo vale per la dipendenza rispetto a un parametro. Si osservi che, per il teorema di Schwarz, si ha (j, k = 1, . . . , n): ◆ ✓ ✓ ◆ k X @fj @'h @ @'j @ d @'j fj (t; ' (t; ⌧, ⇠)) = . = = (1.39) dt @⇠k @⇠k @t @⇠k @yh @⇠k h=1

2

Radunando le n equazioni (1.39) in un’unica equazione matriciale si ottiene d D⇠' (t; ⌧, ⇠) = Dy f (t, ' (t; ⌧, ⇠))D⇠' (t; ⌧, ⇠), dt dove D⇠' (t; ⌧, ⇠) `e la matrice jacobiana di ' rispetto a ⇠ e Dy f (t; ' (t, ⌧, ⇠)) `e la jacobiana di f rispetto a y calcolata per y = ' . La (1.40) si chiama equazione alle variazioni.

(1.40)

1.6 Integrazione di alcune equazioni del primo ordine Illustriamo in questo paragrafo il metodo di integrazione per tre tipi di equazioni di↵erenziali: lineari, esatte e a variabili separabili. Altri numerosi esempi si trovano negli esercizi. Equazioni lineari Sono le equazioni del tipo (1.41)

y˙ = P (t)y + Q(t),

dove P e Q sono continue in un intervallo I ✓ R. Se Q = 0 la (1.41) si dice lineare omogenea. La formula, valida in I, che d` a l’integrale generale `e: ⇢ Z R R P (t)dt c + Q(t)e P (t)dt dt , (1.42) y(t) = e dove c `e una costante arbitraria e

R

P (t)dt `e una primitiva di P in I.

1. Concetti e teoremi fondamentali

c 978-88-08-63708-6

203

Dimostrazione della (1.42). Osserviamo che: d [e dt

R

P (t)dt

y(t)] = e

Pertanto, moltiplicando la (1.41) per e d [e dt

R

R

P (t)dt

R

P (t)dt

P (t)dt

[y(t) ˙

P (t)y(t)].

si trova

y(t)] = e

R

P (t)dt

Q(t).

Integrando (per t 2 I) entrambi i membri di questa uguaglianza si ottiene Z R R e P (t)dt y(t) = Q(t)e P (t)dt dt + c, da cui la (1.42).



Esempi 1.19 L’equazione dell’Esempio 1.1, N˙ = "N `e lineare omogenea con P (t) = ". L’integrale generale `e (c 2 R). N (t) = ce"t 1.20 Si voglia risolvere il problema di Cauchy ( y y˙ = + 3t3 t y( 1) = 2. L’equazione `e lineare con P (t) = 1/t e Q(t) = 3t3 . Essendo l’istante iniziale ⌧ = negativo, occorre scegliere I = ( 1, 0). Si ha: Z Z 1 dt = log( t), P (t)dt = t

1

e pertanto dalla (1.42):

y(t) = elog(

t)

⇢ Z c + 3t3 e

log( t)

dt

=

ct + t4 .

Imponendo la condizione iniziale si trova 2=

c( 1) + ( 1)4 ,

ovvero c = 1. Dunque la soluzione cercata `e y(t) =

t + t4 .

Si noti che la soluzione trovata `e soluzione in tutto R ed `e di classe C 1 (R), cosa non prevedibile a priori, dal momento che il coefficiente di y nell’equazione non `e nemmeno continuo. Equazioni di↵erenziali esatte Sono equazioni del tipo (1.43)

y˙ =

P (t, y) , Q(t, y)

204

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

dove P, Q sono continue in un dominio A ✓ R2 , Q 6= 0, e tali che la forma di↵erenziale ! = P (t, y)dt + Q(t, y)dy sia esatta, esista cio`e F = F (t, y) funzione potenziale, tale che (1.44)

@F =P @t

e

@F =Q @y

in A.

Ricordiamo che, se A `e semplicemente connesso in R2 e se @Q/@t, @P/@y sono continue in A, ! `e esatta se e solo se, in A, risulta @P @Q = . @t @y In tal caso una formula per la funzione F `e, per esempio, la seguente: Z y Z t P (s, y)ds + Q(⌧, s)ds, (1.45) F (t, y) = ⌧



valida (almeno) in un intorno di (⌧, ⇠) 2 A. L’integrale generale della (1.43) `e assegnato in forma implicita dalla formula seguente: (1.46)

F (t, y) = c.

Dimostrazione. Se ' = '(t) `e soluzione della (1.43), definita in un intervallo I, si ha F (t, '(t)) = costante in I; infatti: d F (t, '(t)) = Ft (t, '(t)) + Fy (t, '(t))'(t) ˙ = (per le (1.44)) dt = P (t, '(t)) + Q(t, '(t))'(t) ˙ = 0 (per la (1.43)). Viceversa, dato un punto (⌧, ⇠) 2 A, posto F (⌧, ⇠) = c, per il teorema di Dini l’equazione F (t, y) = c definisce una funzione y = '(t), tale che '(⌧ ) = ⇠, e che soddisfa l’equazione ⇤ (1.43). Infatti @F/@y = Q 6= 0 in ogni punto di A e inoltre '˙ = Ft /Fy = P/Q.

Si noti che usando la (1.45), l’equazione F (t, y) = 0 definisce la curva integrale passante per (⌧, ⇠). Esempio 1.21 Si voglia risolvere il problema di Cauchy 8 3y e t < 3y. Poich´e (⌧, ⇠) = (0, 1) appartiene al semipiano t < 3y, scegliamo quest’ultimo come dominio A. Essendo poi @Q @P =1= in R2 , @y @t

1. Concetti e teoremi fondamentali

c 978-88-08-63708-6

205

la forma di↵erenziale ! = (t + y)dt + (t 3y)dy `e esatta. La soluzione cercata `e assegnata dalla formula: Z y Z t (s + y)ds + ( 3s)ds = 0, 0

1

ossia t2 + 2ty

3y 2 + 3 = 0.

Equazioni a variabili separabili Sono della forma (1.47)

y˙ = f (t)g(y)

con f 2 C(I) e g 2 C(J), dove I e J sono intervalli contenuti in R. Se y `e soluzione dell’equazione g(y) = 0, la retta y = y `e una curva integrale. Se g(y) 6= 0 in J 0 ✓ J, la (1.47) `e esatta con P (t, y) = f (t) e Q(t, y) = 1/g(y). L’integrale generale in tal caso `e dato dalla formula Z Z 1 dy = f (t)dt + c. (1.48) g(y) Esempio 1.22 Sia data l’equazione

Le due rette y = 1 e y =

ossia

p y˙ = 2t 1

y2 .

1 sono soluzioni. Le altre soluzioni sono date dalla formula Z Z 1 p dy = 2 t dt + c 1 y2 y = sin(t2 + c).

(1.49)

Si noti che le rette y = ±1 costituiscono l’inviluppo8 della famiglia (1.49), come `e facile verificare. p Inoltre esse costituiscono la frontiera dell’insieme di definizione di f (t, y) = 2t 1 y 2 e pertanto non rientrano nella teoria svolta nei paragrafi precedenti. Queste soluzioni si chiamano integrali singolari o di frontiera. Pi` u in generale si chiama integrale singolare per un’equazione di↵erenziale una curva integrale tale che in ogni suo punto non siano verificate le condizioni del teorema di esistenza e unicit` a. La definizione si pu` o estendere alle equazioni in forma non normale, ma non intendiamo approfondire ulteriormente l’argomento. Esempio 1.23 Sia data l’equazione (logistica, Esempio 1.2) y˙ = ay(1

8 Cfr.

Sezione 3.4, pag. 374, Vol. 1.

by)

a, b > 0.

206

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Le rette y = 0 e y = 1/b sono soluzioni. Le altre soluzioni sono date dalla formula Z Z dy = a dt. y(1 by) Poich´e

1 y(1

1 b = + , by) y 1 by

si ha: log ossia

y 1

by

Z

y 1

dy y(1

by)

= log

y 1

by

,

= at + c,

by

= c0 eat

(c0 = ec ).

Se 0 < y < 1/b otteniamo y(t) =

c0 eat . 1 + c0 beat

La soluzione soddisfacente la condizione y(0) = ⇠, 0 < ⇠ < 1/b, `e data da y(t) =

1

⇠eat . b⇠ + ⇠beat

Per a = ", b = 1/k, ⇠ = N0 si ottiene la formula dell’Esempio 1.2.

Complementi con esercizi 16. Integrare le seguenti equazioni lineari:

a. (1 + t2 )y˙ + ty = (1 + t2 ) t+1 y ; c. y˙ 2 = t t

1

;

b. y˙ = y tg t + sin t; ny d. y˙ = + et (t + 1)n t+1

n 2 N.

17. Integrare le seguenti equazioni a variabili separabili:

a. y˙ = 2ty 2 ; c. t(1 + y 2 )y˙ = 3;

b. ye2t dt (1 + e2t )dy = 0; d. (t2 yt2 )y˙ + y 2 + ty 2 = 0.

18. Integrare le seguenti equazioni di↵erenziali esatte:

y + 2ty 3 ; t + 3t2 y 2 1 3y 2 2y dy c. ( 2 + 4 )dt = ; t t t3

a. y˙ =

b. (y 3 t)y˙ = y; d. 2(3ty 2 + 2t3 )dt + 3(2t2 y + y 2 )dy = 0.

1. Concetti e teoremi fondamentali

c 978-88-08-63708-6

207

Equazioni di Bernoulli Sono equazioni del tipo y˙ = P (t)y + Q(t)y ↵ ,

(↵ 2 R, ↵ 6= 0, ↵ 6= 1),

con P, Q continue in un intervallo I ✓ R. Se ↵ > 0, y = 0 `e una soluzione dell’equazione. Se y 6= 0, dividendo per y ↵ si ottiene y ↵ y˙ = P (t)y 1 z = y1



+ Q(t). Ponendo

,

si ha z˙ = (1



↵)y



y, ˙

e perci` o z `e soluzione dell’equazione lineare z˙ = (1

↵)P (t)z + (1

Trovata z con la formula (1.42) si trova9 y = z 1

1



↵)Q(t).

.

19. Integrare le seguenti equazioni di Bernoulli:

a. y˙ + y sin t + y ↵ sin 2t = 0; c. y y˙ cos t y 2 cos t(2 sin t) = 0;

b. (1 t2 )y˙ ty aty 2 = 0; d. ty˙ + y(1 ty n ) = 0 n 2 N.

Equazioni di Riccati Sono equazioni del tipo y˙ = P (t)y + Q(t)y 2 + R(t)

(1.50)

con P, Q, R continue in un intervallo I ✓ R, R(t) 6= 0. Non si conoscono metodi generali di soluzione. Conoscendo una soluzione particolare la (1.50) si riduce a lineare con il cambio di variabili y= Si ha infatti: y˙ = ˙

zz ˙

2

+

1 . z

che, sostituita nella (1.50), d` a per z l’equazione lineare: z˙ = [P (t) + 2Q(t) ]z + Q(t).

20. Risolvere le equazioni

a. y˙

t2 y 2 + t4

1 = 0;

[a. cercare una soluzione 21.*

b. y˙

= t↵ ; b. cercare una soluzione

y 2 cos t

1 = 0; cos t

= ↵(cos t)n ].

Si chiama birapporto di 4 funzioni y1 , y2 , y3 , y4 l’espressione seguente: y1 y1

9y

y tg t

= ±z 1

1



se 1

y3 y4

y2 y2

y3 . y4

↵` e un intero pari o un razionale con numeratore pari.

208

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Dimostrare che il birapporto di 4 soluzioni di una equazione di Riccati `e costante. [Suggerimento: porre y1

y3 = z1 , y1

y4 = z2 , y2

y3 = u1 , y2 y4 = u2 ; dimostrare che d log(z1 /z2 ) = P (y3 y4 ). z˙1 /z1 = z1 P Q 2P y1 , z˙2 /z2 = z2 P Q 2P y2 e quindi che dt d log(u1 /u2 ) = P (y3 y4 ). La conclusione `e poi facile.] Dimostrare in maniera analoga che dt Equazioni omogenee (o di Manfredi) Sono equazioni della forma (1.51)

y˙ = f

⇣y⌘ t

,

o alternativamente, y˙ = '(t, y) con ' positivamente omogenea di grado zero: ('( t, y) = '(t, y)), > 0. Assumiamo che f e ' siano continue in un intervallo e in un aperto di R2 , rispettivamente. Ponendo (1.52)

z(t) =

y(t) t

ossia

y(t) = tz(t)

si trova y˙ = z + tz˙ che, sostituita nella (1.51), d` a per z l’equazione a variabili separabili z˙ =

f (z) t

z

.

Risolta l’equazione in z, si determina y dalla (1.52). 22. Integrare le seguenti equazioni omogenee:

a. y˙ =

t3 + y 3 ; ty 2

b. y˙ =

t+

y p . t2 + y 2

23. Dimostrare che l’integrale generale della (1.51) si pu` o scrivere nella forma

t=c

⇣y⌘ t

,

a cui vanno aggiunte le eventuali rette del tipo y = mt dove m soddisfa la relazione f (m) = m. Dedurre che la famiglia di soluzioni `e invariante per omotetie con centro nell’origine. 2

2

24. Con riferimento alla Figura 4.8, determinare tutte le curve per le quali M T = OT .

y

M

O

T

t

Figura 4.8. 25. Un problema di inseguimento. Un punto p si muove nel piano (x, y) lungo l’asse y, mentre un altro punto T lo “insegue” mantenendo costante (= a) la distanza da p. Il termine

1. Concetti e teoremi fondamentali

c 978-88-08-63708-6

209

“insegue” `e riferito al fatto che il moto di T `e sempre diretto verso p. Determinare la traiettoria di T (Fig. 4.9) supponendo che p parta dall’origine e T dal punto (a, 0). y p a

T a

Figura 4.9.

x

26. Dimostrare che un’equazione del tipo

y˙ = f



ax + by + c a0 x + b0 y + c0



,

pu` o essere ricondotta a un’equazione omogenea se ab0 a0 b 6= 0 o ad una equazione a variabili separabili se ab0 a0 b = 0. Integrare poi le equazioni seguenti: a.

y˙ =

2y + t + 1 ; 2t + 4y + 5

b.

y˙ =

2y t + 1 . 2t + 4y + 5

Equazioni riconducibili a di↵erenziali esatte. Fattore integrante Un’equazione del tipo (1.53)

y˙ =

P (t, y) , Q(t, y)

`e associata alla forma di↵erenziale ! = P (t, y)dt + Q(t, y)dy. Se ! `e esatta il metodo di integrazione `e illustrato nel Paragrafo 1.6. Se ! non `e esatta si pu` o cercare un fattore integrante come s’`e visto nell’Esercizio 1.2.13, ossia una funzione µ = µ(t, y) tale che µ! sia esatta. Ricordiamo che µ deve soddisfare l’equazione (alle derivate parziali) @(µQ) @(µP ) = @y @t che `e, in generale, pi` u difficile della (1.53). Se per` o si ha che ✓ ◆ @Q 1 @P = g(t) (funzione della sola t) Q @y @t oppure 1 P allora



@P @y

@Q @t R

µ(t) = e



= h(y)

g(t)dt

oppure

(funzione della sola y)

µ(y) = e

R

h(y)dy

sono rispettivamente fattori integranti. Se µ 6= 0, l’integrale generale della (1.53) `e assegnato dalla formula G(x, y) = c, dove G `e una funzione potenziale per la forma di↵erenziale µ!.

210

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

27. Integrare, mediante l’uso di fattori integranti, le seguenti equazioni:

a.

(t + y 2 )dt + ty dy = 0;

c.

(3t + 2y)dt + t dy = 0;

(y + ty 2 )dt

b.

t dy = 0.

Traiettorie di una famiglia di curve Sia (x, y, c) = 0 una famiglia a un parametro di curve piane di equazione y = y(x), con di classe C 2 in un aperto di R3 . Derivando rispetto a x si ottiene: (1.54)

x

+

yy

0

= 0.

Supponendo c 6= 0, l’equazione (x, y, c) = 0 definisce (localmente) c = c(x, y), che sostituita in (1.54) d` a l’equazione di↵erenziale della famiglia: (1.55)

F (x, y, y 0 ) :=

x (x, y, c(x, y))

+

y (x, y, c(x, y))y

0

= 0.

A partire dalla (1.55) possiamo costruire l’equazione di↵erenziale (1.56)

F (x, z, (z 0 )) = 0

dove `e una opportuna funzione reale. L’integrale generale della (1.56) si chiama famiglia delle -traiettorie della famiglia data. Si noti che confrontando la (1.55) e la (1.56) si vede che, se (x, y) = (x, z) e la curva soluzione della (1.55) che passa per questo punto ha pendenza y 0 , allora la pendenza z 0 della curva soluzione della (1.56), che passa per il medesimo punto, `e legata a y 0 dalla relazione (1.57)

y 0 = (z 0 ).

Il caso pi` u importante si ha quando (s) = 1/s. Le -traiettorie si chiamano traiettorie ortogonali e la (1.56) diventa F (x, z, 1/z 0 ) = 0. In tal caso infatti le -traiettorie tagliano ortogonalmente le curve della famiglia; y 0 = `e infatti la relazione di ortogonalit` a delle tangenti in un punto di intersezione.

1/z 0

28. Determinare le traiettorie ortogonali alle seguenti famiglie; illustrarle graficamente:

a. y = cx2 ; b. y 2 = 2p(x c) (p fisso); y2 x2 + = 1 (c > 0); c. 9+c 4+c x3 (famiglia di cissoidi, pag. 369, Vol. 1) d. y 2 = a 2 x e. (x2 + y 2 )2 = a(x2 y 2 ) (famiglia di lemniscate, pag. 369, Vol. 1). 29. Dimostrare che la scelta di

(x) = (s tg ↵)/(1 + s tg ↵) nella (1.57), corrisponde alle traiettorie isogonali, che tagliano le curve della famiglia data sotto l’angolo ↵.

30. Determinare le traiettorie isogonali alla famiglia di rette y = cx, per ↵ = ⇡/6 e ↵ = ⇡/4. Disegnare le curve isogonali. 31. Determinare la forma che uno specchio curvo deve avere per riflettere parallelamente all’asse x i raggi luminosi provenienti da una sorgente S posta nell’origine (Fig. 4.10).

1. Concetti e teoremi fondamentali

c 978-88-08-63708-6

211

y

s

x a

Figura 4.10. Riflessione su uno specchio curvo.

Equazioni di Clairaut Sono equazioni del tipo seguente (non in forma normale) y = xy 0 + (y 0 )

(1.58)

dove `e una funzione derivabile in un intervallo I ✓ R. A equazioni del tipo (1.58) si perviene quando si cerca di determinare una curva a partire da una propriet` a che coinvolge le sue rette tangenti ma non i punti di contatto. Infatti se (x, y) `e un punto sulla curva e y 0 `e la pendenza della tangente, questa ha equazione ⇠ = y + y 0 (⌘

x) = y 0 ⌘ + y

xy 0 .

Una propriet` a della tangente si esprime dunque con una relazione tra y 0 e y xy 0 , proprio come la (1.58). Per integrare la (1.58), poniamo y 0 = p e . . . deriviamo entrambi i membri; si ottiene: p = p + xp0 + ovvero

p0 [x + 0

0

0

(p)p0 ,

(p)] = 0,

0

(p). che `e risolta da p = 0 e da x = L’equazione p0 = 0 `e risolta da p = c (costante) che, sostituita nella (1.58) individua la famiglia di rette (integrale generale): (1.59)

y = cx + (c)

(c 2 I).

La seconda equazione, insieme con la (1.58), d` a la rappresentazione parametrica seguente di un’altra curva soluzione (integrale singolare) ( 0 (p) x= (1.60) y = p 0 (p) + (p). Si noti che, se

00

(p) 6= 0, la (1.60) `e l’inviluppo della famiglia di rette (1.59).

32. Integrare le seguenti equazioni di Clairaut

a.

y = xy 0 + y 02 ;

b.

0

y = xy 0 + ey ;

c.

y = xy 0 +

p

1

y 02 .

33. Determinare una curva tale che il segmento sulla tangente in ogni suo punto intercettato

dagli assi cartesiani abbia lunghezza costante.

212

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

y AB = costante

A

B

x

Figura 4.11.

Equazioni di Lagrange Sono generalizzazioni delle equazioni di Clairaut: y = x'(y 0 ) + (y 0 ).

(1.61)

con ', derivabili in I ✓ R. Posto y 0 = p, derivando l’equazione si ottiene: p = '(p) + x'0 (p)p0 +

0

(p)p0 ,

ovvero (1.62)

p0 [x'0 (p) +

0

(p)] = p

'(p).

Se p0 `e tale che p0 = '(p0 ), allora la retta y = xp0 + (p0 ) `e un integrale (in generale singolare) della (1.61). Se p 6= '(p), allora p0 6= 0 e p = p(x) risulta invertibile; se x = x(p) `e a la funzione inversa, si ha: x0 = 1/p0 , che, sostituita nella (1.62), d` [p

'(p)]x0 = x'0 (p) +

0

(p),

che `e lineare in x = x(p). Se x = x(p, c) `e l’integrale generale, la soluzione della (1.61) `e data in forma parametrica dalle equazioni: ( x = x(p, c) y = x(p, c)'(p) + (c). 34. Integrare le seguenti equazioni di Lagrange:

a. y = xy 02 + y 03 ;

p b. y = x y 0 + y 0 .

35. Dimostrare che, se una famiglia (x, y, c) = 0 di soluzioni di un’equazione di↵erenziale F (x, y, y 0 ) = 0 ammette inviluppo, allora l’inviluppo `e esso stesso soluzione dell’equazione di↵erenziale (`e un integrale singolare). 36. Interpretare geometricamente un’equazione del secondo ordine

y 00 = f (t, y, y 0 ), in termini di curvatura e pendenza del grafico di una soluzione nel punto (t, y). Per concludere presentiamo alcuni artifici che permettono di trovare famiglie a un parametro di soluzioni (che chiameremo ancora integrale generale) per equazioni in forma non normale.

2. Equazioni lineari

c 978-88-08-63708-6

213

Equazioni della forma a) x = F (y 0 ) oppure b) y = F (y 0 ). a) Si pone y 0 = p. Allora x = F (p) e, di↵erenziando, si trova dx = F 0 (p)dp. Essendo poi dy = p dx si ottiene dy = pF 0 (p)dp. Pertanto l’integrale generale `e dato in forma parametrica dalle formule seguenti Z x = F (p),

y=

pF 0 (p)dp.

b) Ancora si pone y 0 = p. Allora y = F (p) e, di↵erenziando, si trova dy = F 0 (p)dp. Essendo poi dx = p 1 dy si ottiene dx = p 1 F 0 (p)dp. L’integrale generale `e dato dalle equazioni parametriche seguenti: Z F 0 (p) dp, y = F (p). x= p 37. Integrare le seguenti equazioni:

a. y 0 log y 0 x = 0; p c. y 1 + y 02 = 1;

b. y 02 = y 03 + x = 0; d. yy 0 yy 02 1 = 0.

Equazioni della forma F (y, y 0 , y 00 ) = 0. Si assume y come variabile indipendente e x = x(y) come funzione incognita, pensando di cercare funzioni localmente invertibili. Posto poi p = y 0 si ha: y 00 =

dp dp dy = p. dy dx dy

e l’equazione di↵erenziale si trasforma nell’equazione, del primo ordine in p, ✓ ◆ dp (1.63) F y, p, p = 0. dy Se p = p(y, c1 ) `e integrale generale della (1.63) si ha, essendo dx = p1 dy: Z dy + c2 (c1 , c2 2 N). (1.64) x= p(y, c1 ) Alle soluzioni (1.64) vanno aggiunte eventuali soluzioni non invertibili localmente, del tipo y = y0 dove F (y0 , 0, 0) = 0. 38. Integrare le seguenti equazioni:

a. 2yy 00 + y 02 = 0; c. y 5 y 00 = 1; e. y 00 y 02 + y 2 y 03 = 0;

2.

b. yy 00 + y 02 a = 0 p d. 3 y 0 y 000 = 2; f. y 00

(a 2 R);

0

yy 0 ey = 0.

EQUAZIONI LINEARI

I sistemi lineari sono l’unica (o quasi) vasta classe di equazioni di↵erenziali per le quali l’insieme delle soluzioni possa essere descritto con grande accuratezza, e, nel caso dei sistemi autonomi, anche rappresentato esplicitamente. Essi hanno grande importanza, sia perch´e molti fenomeni fisici possono essere modellati da equazioni di questo tipo, sia perch´e anche fenomeni non lineari possono, in prima approssimazione, essere descritti da equazioni lineari.

214

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

2.1 Definizione e prime propriet` a n n Sia A(t) : R ! R una famiglia di applicazioni lineari (cio`e additive e omogenee) dipendente dal parametro t 2 I, I intervallo di R. Scelto un sistema di riferimento in a rappresentata da una matrice quadrata n ⇥ n, Rn , per ogni fissato t 2 I, A(t) sar` che indicheremo con A(t) o, pi` u esplicitamente, con {aij (t)} (i, j = 1, . . . , n): A : y 7! A(t)y dove A(t)y `e il prodotto righe per colonne della matrice A(t) per il vettore (colonna) y; il risultato A(t)y `e ancora un vettore colonna. Sia pure b(t) una famiglia di vettori (colonna) dipendenti da t. DEFINIZIONE 2.1 Si dice sistema lineare un’equazione della forma y˙ = A(t)y + b(t).

(2.1)

A(t) prende il nome di matrice dei coefficienti, b(t) `e il termine noto. Se b(t) = 0, il sistema si dice omogeneo. Se A e b sono costanti, cio`e indipendenti da t, il sistema `e a `e A(t)y + b(t). autonomo. Lo spazio delle fasi della (2.1) `e Rn , il campo di velocit` Scriviamo per una volta il sistema (2.1) in forma scalare: y˙ 1 = a11 (t)y1 + a12 (t)y2 + · · · + a1n (t)yn + b1 (t) y˙ 2 = a21 (t)y1 + a22 (t)y2 + · · · + a2n (t)yn + b2 (t) .. . y˙ n = an1 (t)y1 + an2 (t)y2 + · · · + ann (t)yn + bn (t). Il sistema (2.1) `e dunque un sistema di n equazioni di↵erenziali lineari del 1 ordine. A questa forma `e riconducibile la singola equazione di↵erenziale lineare di ordine n, cio`e l’equazione del tipo (2.2)

y (n) = a1 (t)y (n

ponendo

1)

0

Abbiamo perci` o il sistema

+ · · · + an (t)y + b(t), 1

y y0 .. .

B B y=B @ y (n

1)

C C C. A

y˙ 1 = y2 y˙ 2 = y3 .. . y˙ n 1 = yn y˙ n = a1 (t)yn + · · · + an (t)y1 + b(t),

2. Equazioni lineari

c 978-88-08-63708-6

215

che `e del tipo (2.1) ove si ponga 0

0 1 0 B 0 0 1 B . . . A(t) = B B @ 0 0 0 an (t) an 1 (t) an 2 t

0

1 0 0 C C C C ... 1 A . . . a1 (t)

... ...

0 0 .. .

1

B C B C B C b(t) = B C. B C @ 0 A b(t)

Analogamente, alla forma (2.1) possono ricondursi anche sistemi di ordine superiore al primo. Esempi 2.1 Moto di una carica in un campo elettromagnetico. Una carica elettrica e, situata in un campo elettromagnetico, non solo `e soggetta a una forza esercitata dal campo, ma, a sua volta, essa agisce sul campo modificandolo; le equazioni del moto risultano cos`ı non lineari. Tuttavia, se la carica `e piccola, l’azione di questa sul campo pu` o essere trascurata, e il campo pu` o essere considerato noto, indipendente dalle coordinate o dalla velocit` a della carica; le equazioni del moto sono allora le seguenti: e ma = eE + v ⇥ H, c

(2.3)

dove e `e la carica, m la massa della particella, c la velocit` a della luce, v la velocit` a della particella carica, a la sua accelerazione, E e H (eventualmente dipendenti da t) il campo elettrico e magnetico rispettivamente; la forza rappresentata dal secondo membro della (2.3) `e detta forza di Lorentz. La (2.3) `e della forma (2.1) ove si ponga 0 1 0 H3 H2 e @ e H3 0 H1 A . A= y = v, b = E, m mc H2 H1 0 2.2 Piccole oscillazioni del pendolo. Secondo le leggi della meccanica, le piccole oscillazioni di un pendolo sono descritte dall’equazione (2.4)

✓¨ =

k✓

g q

dove ✓ `e l’angolo di deviazione dalla verticale, k = l/g, l la lunghezza del pendolo e g l’accelerazione di gravit` a. L’equazione (2.4) corrisponde a un sistema 2 ⇥ 2 del tipo (2.1) ponendo ✓ ◆ ✓ ◆ ✓ ◆ ✓ 0 1 0 y= ˙ , A= , b= . k 0 0 ✓ Nelle applicazioni, l’equazione (2.1) descrive l’evoluzione di un sistema fisico, il cui stato `e individuato dal vettore y; il termine noto b rappresenta le forze esterne che

216

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

agiscono sul sistema, i coefficienti della matrice A descrivono generalmente propriet` a fisiche del sistema stesso: per esempio, nell’equazione (2.4) k `e determinato dalla lunghezza del pendolo e b = 0, cio`e non ci sono forze esterne che agiscono sul pendolo. Nell’equazione (2.3) il campo elettrico E `e la forza esterna, mentre il campo magnetico H `e interpretabile come una propriet` a fisica del mezzo in cui ha sede il moto della particella. Possiamo pensare alla forza come alla causa che produce l’e↵etto y; nei problemi trattati in questo capitolo la forza esterna b e le propriet` a fisiche del mezzo (matrice A) sono ritenute note e si vuol determinare l’e↵etto y: `e questo il problema diretto. Non meno interessanti sono i problemi inversi, nei quali, a partire da informazioni sullo stato y del sistema, si vuole ricavare la forza b o i coefficienti aij . Principio di sovrapposizione Una propriet` a fondamentale che discende dalla linearit` a dell’equazione (2.1) `e il principio di sovrapposizione. Siano ' e due funzioni tali che: ' + b1 (t) '˙ = A(t)' ˙ = A(t) + b2 (t); se moltiplichiamo la prima equazione per c1 , la seconda per c2 e quindi sommiamo membro a membro, si vede che la funzione = c1' + c2 soddisfa l’equazione: (2.5)

˙ = A(t) + (c1 b1 (t) + c2 b2 (t)).

In particolare: se una forza b1 produce sul sistema l’e↵etto ' , e una forza b2 l’e↵etto , allora la forza b1 + b2 produce l’e↵etto ' + . Dalla (2.5) discendono due conseguenze elementari, ma importanti. Accanto al sistema (2.1) consideriamo il sistema omogeneo associato: (2.6)

z˙ = A(t)z.

i) Se ' e sono soluzioni del sistema (2.6), allora anche c1' + c2 `e soluzione dello stesso sistema. In altre parole, l’insieme delle soluzioni del sistema omogeneo forma uno spazio lineare; vedremo tra un momento che la dimensione di questo spazio `e precisamente n. ii) Se ' `e una soluzione del sistema (2.1) e una soluzione del sistema (2.6), allora anche ' + `e soluzione di (2.1); viceversa, fissata una particolare soluzione ' di (2.1), ogni altra soluzione della stessa equazione `e della forma: ' + , essendo una soluzione di (2.1) (infatti: = ' `e soluzione di (2.6) in virt` u della (2.5)). In altre parole, l’insieme delle soluzioni del sistema non omogeneo forma una spazio affine10 . Le seguenti a↵ermazioni discendono immediatamente dai teoremi della Sezione 1. iii) (Esistenza e unicit` a). Se t 7! A(t) e t 7! b(t) sono continue in I, allora esiste una sola soluzione di (2.1) di classe C 1 (I), soddisfacente la condizione (2.7)

y(⌧ ) = ⇠

⌧ 2 I, ⇠ 2 Rn .

Si noti che tale soluzione risulta definita in tutto l’intervallo I. 10 Se X ` e uno spazio lineare e h ` e un vettore fissato di X, diremo spazio affine l’insieme Y = {y 2 X : y = x + h con x 2 X}. Per una definizione pi` u precisa si rimanda ai testi di Algebra.

2. Equazioni lineari

c 978-88-08-63708-6

217

In particolare, l’equazione omogenea (2.6), accompagnata dalla condizione omogenea (2.8)

z(⌧ ) = 0,

ammette solo la soluzione nulla. Per l’equazione (2.2) di ordine n, essendo essa riconducibile a un sistema del tipo (2.1) con le posizioni sopra illustrate, l’a↵ermazione precedente diventa: se i coefficienti ai (t) (i = 1, 2, . . . , n) e il termine noto b(t) dell’equazione sono funzioni continue in I, allora esiste una sola soluzione di (2.2) di classe C n (I) soddisfacente le n condizioni scalari: y(⌧ ) = ⇠1 y 0 (⌧ ) = ⇠2 .. .

(2.9)

y (n

1)

(⌧ ) = ⇠n

iv) (Regolarit` a). Se i coefficienti e il termine noto dell’equazione (2.1) sono di classe C k (I), ogni soluzione `e di classe C k+1 (I); se i primi sono C 1 (o analitici), anche la soluzione `e C 1 (o analitica). v) Lo spazio lineare Z, insieme delle soluzioni dell’equazione omogenea, ha dimensione n; cio`e esistono precisamente n vettori linearmente indipendenti che risolvono l’equazione (2.6). Infatti, fissato un punto ⇠ 2 Rn , esiste un’unica soluzione (t), che, a un istante fissato, diciamo t = 0, passa per questo punto; possiamo perci` o mettere in corrispondenza biunivoca le soluzioni (t) con i punti di Rn . Tale corrispondenza, tra Z e Rn , `e un isomorfismo; infatti, se (t), 1 (t), 2 (t) sono le soluzioni corrispondenti rispettivamente ai punti ⇠, ⇠1 , ⇠2 (scriviamo ⇠ $ (t), . . .) risulta, 8c 2 R, ⇠1 + ⇠2 $ 1 (t) + c⇠ $ c (t).

2

(t)

Ora, due spazi lineari isomorfi hanno la stessa dimensione. Procediamo allo studio pi` u dettagliato delle soluzioni dei sistemi lineari; cominceremo con l’esaminare i sistemi autonomi omogenei, per i quali le soluzioni possono essere rappresentate in forma esplicita. 2.2 Richiami di algebra delle matrici Raccogliamo, in questo paragrafo, alcuni risultati di algebra delle matrici, che utilizzeremo nel seguito. Questi argomenti sono in parte certamente noti al lettore dai corsi di Algebra o di Geometria; altri sono reperibili in testi classici, dove si possono trovare anche le dimostrazioni dei risultati che qui sono soltanto enunciati. 1. Matrici e applicazioni lineari Abbiamo gi` a osservato (5.2.1, Vol. 1) che le matrici rappresentano le applicazioni lineari tra gli spazi euclidei. Siamo qui particolarmente interessati alle matrici quadrate n ⇥ n, che rappresentano quindi applicazioni (o trasformazioni) lineari di Rn

218

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

in s´e11 . Queste matrici formano, rispetto alla usuale definizione di somma di matrici e prodotto di una matrice per un numero, uno spazio lineare di dimensione n2 , cio`e 2 isomorfo a Rn , che indicheremo con M (n ⇥ n), o semplicemente, M . Sia A : Rn ! Rn un’applicazione lineare. La rappresentazione di A per mezzo di una matrice dipende dalla base scelta in Rn . Sia e1 , . . . , en una base di Rn ; i vettori trasformati i = 1, 2, . . . , n ⇠i = A(ei ) saranno esprimibili come combinazione lineare degli ei per mezzo di certi coefficienti aij : n X ⇠i = aij ej . j=1

Questi coefficienti determinano univocamente l’applicazione A; infatti, preso un qualunque vettore x 2 Rn , n X ci ei , x= i=1

risulta (2.10)

A(x) = A

n X

i

ci e

i=1

!

=

n X

ci A(ei ) =

i=1

n X

ci aij ej .

i,j=1

Detta A la matrice di coefficienti aij , la (2.10) si scrive A(x) = Ax. Diremo perci` o che la matrice A rappresenta l’applicazione A nella base e1 , . . . , en . Si noti che la i-esima riga di A si ottiene calcolando A(ei ) ed esprimendo questo vettore come combinazione lineare di e1 , . . . , en ; i coefficienti della combinazione sono gli elementi della i-esima riga di A. Dal punto di vista dell’esecuzione dei calcoli, alcune basi risultano pi` u convenienti ` chiaro che sarebbe molto conveniente disporre di una base nella quale di altre. E l’applicazione A si potesse rappresentare con una matrice diagonale. Come `e noto dall’Algebra Lineare, ci` o non `e per` o sempre possibile. 2. Cambiamenti di base. Matrici diagonali. Matrici di Jordan Supponiamo che Rn sia riferito alla base canonica e1 , . . . , en . Scegliamo n vettori en e assumiamoli come nuova base. linearmente indipendenti e e1 , . . . , e Un vettore v sar` a esprimibile come combinazione lineare nelle due basi: (2.11)

v=

n X

k=1

xk ek =

n X

˜k . x ˜k e

k=1

11 Ci riferiamo qui a matrici a elementi reali; incontreremo pi` u avanti anche matrici a elementi complessi, che rappresentano naturalmente applicazioni lineari tra gli spazi Cn .

2. Equazioni lineari

c 978-88-08-63708-6

219

˜ = (˜ Ci chiediamo quale sia la relazione tra x = (x1 , . . . xn ) e x x1 , . . . , x ˜n ). Sia S = (skj ) la matrice (non singolare) che realizza il cambiamento di base, cio`e: ˜k = e

n X

sjk ej

j = 1, . . . , n .

j=1

Possiamo allora scrivere: (2.12)

n X

˜k = x ˜k e

n n X X

x ˜k sjk ej

k=1 j=1

k=1

e confrontando le (2.11), (2.12) ricaviamo che xj =

n X

sjk x ˜k

k=1

ovvero, essendo S non singolare, ˜=S x

x = S˜ x,

1

x.

˜n . Se ˜1 , . . . , e Vediamo ora quale matrice rappresenta la trasformazione A nella base e 1 n y = Ax nella base e , . . . , e , si ha

Perci` o la matrice (2.13)

e=S y

1

y=S

1

e =S A

Ax = S

1

1

ASe x.

AS,

e sono matrici rappresenta la trasformazione A nel nuovo riferimento. Diremo che A e A equivalenti. Ricordiamo ora che un vettore (non nullo) h si dice autovettore della matrice A (o della trasformazione A) e il numero (reale o complesso) si dice autovalore, se vale l’equazione (2.14)

Ah = h.

Il sistema omogeneo (2.14) ha soluzione se e solo se il determinante della matrice A In `e uguale a zero: (2.15)

D( ) := |A

In | = 0.

L’equazione (2.15) `e una equazione algebrica in di grado n; il polinomio D( ) `e detto polinomio caratteristico della matrice A; esso non dipende dal riferimento scelto o facilmente provare) ma soltanto dalla trasformazione A; perci` o matrici (come si pu` equivalenti hanno gli stessi autovalori. Si osservi che, se la matrice A `e reale, e dunque il polinomio caratteristico `e a coefficienti reali, gli autovalori sono reali oppure a coppie complessi coniugati; gli

220

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

autovettori possono essere scelti in modo che ad autovalori reali corrispondano autovettori reali e ad autovalori complessi coniugati corrispondano autovettori complessi coniugati. a m1 , . . . , mk Siano 1 , . . . , k , k  n, gli autovalori distinti di A con molteplicit` n P rispettivamente; si noti che mj = n. A ognuno dei j corrisponde un sistema di j=1

autovettori che costituisce uno spazio vettoriale di dimensione dj e che chiameremo autospazio associato a j . Resta inteso che se j `e reale (complesso), il suo autospazio `e un sottospazio vettoriale di Rn (di Cn ). Diremo che l’autovalore `e regolare se dj = mj , ossia se l’autospazio associato a j ha dimensione pari alla molteplicit` a mj . Distingueremo ora vari casi. k P dj = n e pertanto esistono n autovettori Autovalori reali tutti regolari. In tal caso j=1

h1 , . . . , hn linearmente indipendenti; essi possono essere assunti come base12 per Rn . In questa base la trasformazione A `e rappresentata da una matrice diagonale. Infatti, si ha A(hk ) = k hk e quindi A `e rappresentata nella base h1 , . . . , hn dalla matrice diagonale 1 0 1 0 ... 0 B 0 2 ... 0 C C B ⇤ = diag( 1 , . . . , n ) = B . . . . C. @ .. .. . . .. A 0 0 ... n Inoltre, se S = (h1 , . . . , hn ), le n relazioni A hi = equazione matriciale A S = S⇤.

i ih

si possono scrivere nell’unica

o S diagonalizza A e rappresenta la matrice che realizza Dunque ⇤ = S 1 A S e perci` il cambiamento dalla base e1 , . . . , en alla base h1 , . . . , hn . Esempio 2.3 La trasformazione lineare A : R2 ! R2 sia rappresentata, nella base canonica e1 = 10 , e2 = 01 , dalla matrice A = 11 11 . La matrice A possiede gli autovalori 1 = 0 e 2 = 2; al primo corrisponde l’autovettore h1 = 11 = e1 e2 ; o al secondo l’autovettore h2 = 11 = e1 + e2 . Risulta perci` S=



◆ 1 1 , 11

S

1

=

1 2

✓ ◆ 1 1 , 1 1

⇤=

✓ ◆ 00 . 02

Autovalori tutti regolari, anche complessi. In tal caso valgono ancora le considerazioni svolte precedentemente; tuttavia l’insieme di autovettori h1 , . . . , hn comprende coppie di autovettori complessi coniugati. Se alla coppia j = aj + ibj , j = aj ibj j j corrisponde la coppia di autovettori hj = uj + ivj , h = uj ivj , sostituendo hj h 12 Ci` o accade, per esempio, se gli autovalori sono tutti distinti o se la matrice ` e simmetrica. In quest’ultimo caso, come abbiamo gi` a ricordato in 2.1.4, gli autovalori sono reali ed esistono n autovettori (reali) che formano una base ortonormale di Rn .

2. Equazioni lineari

c 978-88-08-63708-6

221

con vj , uj (nell’ordine) si ottiene ancora una base di Rn . La matrice che rappresenta A in questa base si ottiene sostituendo nella matrice ✓ ◆ ✓ ◆ aj bj j 0 con il blocco . ⇤ = diag( 1 , . . . , n ), il blocco 2 ⇥ 2 bj aj 0 j Autovalori non regolari. In questo caso la riduzione di una matrice alla forma diagonale non `e possibile. Si dimostra per` o che `e sempre possibile completare il sistema degli autovettori aggiungendovi n k vettori, opportunamente scelti, in modo che l’insieme ottenuto formi una base di Rn rispetto alla quale la matrice A assume una forma particolarmente semplice, detta forma di Jordan. Si dice blocco di Jordan (corrispondente all’autovalore ) una matrice quadrata come quella in Figura 4.12 0

1 1 0 ... 0 0 B0 1 . . . 0 0C B C B .. C B. C B C @0 0 0 . . . 1A 0 0 0 ... 0 Figura 4.12. Blocco di Jordan.

Si dice che la matrice quadrata A(n ⇥ n) `e in forma di Jordan se essa consiste di uno o pi` u blocchi di Jordan dislocati lungo la diagonale principale, mentre gli elementi non contenuti nei blocchi di Jordan sono tutti nulli. Si dimostra allora che: data a rispettive una matrice quadrata A(n ⇥ n), di autovalori 1 , . . . , r con molteplicit` e = S 1 AS `e nella m1 , . . . , mr , esiste una matrice non singolare S per cui la matrice A forma di Jordan: essa risulta precisamente composta di s( r) blocchi; ogni blocco ha un autovalore dislocato lungo la diagonale; blocchi diversi possono corrispondere al medesimo autovalore. Per la dimostrazione di questi risultati rimandiamo ai testi specifici di calcolo matriciale. 3. Propriet` a invarianti per cambiamento di base Data una applicazione lineare A : Rn ! Rn , rappresentata dalla matrice A in una a di A che risultano invarianti rispetto a certa base e1 , . . . , en , quali sono le propriet` un cambiamento di base? Un teorema fondamentale dell’Algebra lineare (teorema di Cramer) a↵erma che l’applicazione A `e invertibile se e solo se |A| 6= 0; l’a↵ermazione `e significativa proprio perch´e il determinante di una matrice `e un invariante della trasformazione A, cio`e non dipende dal riferimento scelto. Ci` o discende subito dal teorema di Binet (sul determinante di un prodotto di matrici) e dalla formula (2.13): e = |S |A|

1

||A||S| = |A|.

Osserviamo che, per quanto detto al precedente punto 2, se 1 , 2 , . . . , n sono gli autovalori della matrice A (ognuno ripetuto secondo la sua molteplicit` a) risulta, con

222

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

un semplice calcolo: (2.16)

|A| =

n Y

i,

i=1

cio`e il determinante di una matrice `e il prodotto dei suoi autovalori. Pi` u in generale, come abbiamo gi` a ricordato, il polinomio caratteristico della matrice A `e un invariante per cambiamento della base; perci` o sono invarianti gli autovalori di una matrice e le rispettive molteplicit` a. OSSERVAZIONE 2.1 L’invarianza del determinante rispetto a cambiamenti del sistema di riferimento risulta chiara anche pensando al significato geometrico di |A|: esso rappresenta il volume (orientato) del parallelepipedo i cui spigoli sono individuati dai vettori colonna della matrice A

e2 (a1, b1)

(a2, b2)

e1

Figura 4.13. A =

a1 a2 b1 b2

; |A| = a1 b2

+ poich´ e la coppia di vettori

a1 b1

,

a2 b2

a2 b1 = area del parallelogramma tratteggiato presa col segno ha il medesimo orientamento della coppia e1 , e2 .

Un altro invariante importante `e la traccia di una matrice; questa `e definita come la somma degli elementi che stanno sulla diagonale principale: tr A :=

n X

aii .

i=1

Se la matrice `e diagonale o in forma di Jordan, risulta allora (2.17)

tr A =

n X

i,

i=1

e poich´e gli autovalori di A non dipendono dal riferimento scelto, cos`ı pure `e per la traccia. Tra il determinante e la traccia di una matrice intercorre la seguente relazione: (2.18)

|In + "A| = 1 + " tr A + O("2 )

per " ! 0.

2. Equazioni lineari

c 978-88-08-63708-6

Infatti, se sono 1 + "

i i

223

(i = 1, . . . , n) sono gli autovalori di A, allora gli autovalori di In + "A e perci` o: |In + "A| =

n Y

(1 + " i ) = 1 + "

i=1

n X

i

+ O("2 ).

i=1

4. Serie di matrici. La matrice esponenziale Come abbiamo gi` a osservato, l’insieme M delle matrici quadrate n ⇥ n forma uno o, in vari modi, definire su M una norma; una spazio lineare (di dimensione n2 ). Si pu` buona definizione di norma di una matrice `e la seguente: (2.19)

kAk :=

n X

i,j=1

|aij |.

Il lettore pu` o dimostrare senza difficolt` a che la definizione (2.19) soddisfa i requisiti di una norma e possiede anche la propriet` a seguente: (2.20)

kA Bk  kAk · kBk

8 A, B 2 M . (k) La norma induce su M la metrica e la topologia. Una successione {Ak } = {(aij )} di matrici si dir` a convergente alla matrice A = (aij ) se kAk

Ak =

n X

i,j=1

(k)

|aij

aij | ! 0

per k ! 1.

La serie di matrici 1 X

(2.21)

Ak

k=0

si dir` a convergente se converge la successione delle somme parziali. Una condizione sufficiente per la convergenza della serie (2.21) `e la convergenza della serie numerica 1 X

k=0

kAk k

(Teorema 3.2.2 della convergenza totale). Esempi 2.4 Se kAk < 1 la serie

1 P

Ak `e convergente; infatti, per la (2.20) risulta: kAk k 

k=0 P

kAkk e la serie geometrica

kAkk `e convergente, essendo la ragione minore di 1.

2.5 Per ogni matrice A la serie (2.22)

1 X Ak

k=0

k!

,

224

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

P `e convergente; infatti `e convergente la serie esponenziale kAkk /k!. La matrice somma della serie (2.22) si dice matrice esponenziale e si indica col simbolo eA . Una definizione alternativa della stessa matrice, certamente non inaspettata, `e la seguente (non dimostriamo l’equivalenza tra le due definizioni) ✓ ◆k A . e := lim In + k!1 k A

(2.23)

Il calcolo della matrice eA , a partire dalla matrice A, `e generalmente complicato. Se per` o A `e diagonale A = diag( 1 , . . . n ), allora si ha subito eA = diag(e 1 , . . . , e

n

).

Se A `e diagonalizzabile, cio`e esiste una matrice S tale che e =S A

allora si calcola prima

1

AS = diag(

1, . . . ,

e

eA = diag(e 1 , . . . , e

n

n ),

),

e si ritorna poi alla base originaria13 e

eA = S eA S

1

.

2.6 La matrice A = 11 11 dell’Esempio 2.3 `e diagonalizzabile avendo gli autovalori 1 = 0 e 2 = 2 distinti. Risulta ✓ ✓ ◆ ◆ 1 0 e e = 00 , A eA = , 0 e2 02

ed essendo

S=



◆ 11 11

risulta infine 1 e = 2 A

S

1

1 = 2

✓ 1 1

◆ 1 , 1

◆ ✓ 2 e + 1 e2 1 . e2 1 e2 + 1

Nonostante il calcolo della matrice eA sia generalmente assai complicato, il calcolo del suo determinante `e molto semplice; vale la formula seguente: |eA | = etr A .

(2.24)

13 Infatti:

S

S

1 eA S

=S

1 ASS 1 AS . . . S 1 AS

1



=

1 P

Ak k!



k=0 (S 1 AS)k

S=

1 P

k=0

1 S 1 Ak S. k!

si trova S

1 eA S

Essendo S

= eS

1

AS

1 Ak S

=S

1 AA . . . AS e

da cui eA = S eA S

1.

=

2. Equazioni lineari

c 978-88-08-63708-6

225

Infatti, ricordando che il determinante di una matrice `e una funzione continua dei suoi elementi, abbiamo: ✓ ◆k ◆k ✓ A A In + = lim = In + k!1 k!1 k k

|eA | = (per la (2.23)) = lim (teorema di Binet) = lim In + k!1

A k

k

= (per la (2.18)) =

✓ ✓ ◆◆k tr A 1 = etr A . 1+ +O k!1 k k2

= lim

Dalla (2.24) si ricava che la matrice eA `e non singolare. 5. Matrici dipendenti da un parametro Spesso dovremo considerare matrici (anche rettangolari e, in particolare, vettori riga o vettori colonna) i cui elementi sono funzioni di un parametro reale t. Scriveremo allora A = A(t) e diremo che questa matrice `e continua, derivabile, di classe C k , ecc. a. Porremo, per definizione, se tutti i suoi elementi aij (t) hanno l’analoga propriet` lim A(t) :=

t!t0

Z

0

A (t) := A(t)dt :=



◆ lim aij (t)

t!t0

i,j=1,...,n 0 (aij (t))i,j=1,...,n

✓Z

◆ aij (t)dt

.

i,j=1,...,n

Da queste definizioni scendono le regole usuali del calcolo di↵erenziale; per esempio, se x(t) `e un vettore (colonna), per la regola di Leibniz abbiamo d A(t)x(t) = A0 (t)x(t) + A(t)x0 (t). dt In particolare, se A `e costante, la matrice etA `e di classe C 1 (R) (anzi, analitica) e risulta e0·A = In (2.25)

(2.26)

etA · esA = e(t+s)A [etA ] 1 = e tA d tA e = AetA . dt

La prima delle precedenti formule segue subito dalla definizione della matrice esponenziale; la terza discende dalla prima e dalla seconda (ponendo in questa t = s); verifichiamo le formule (2.25) e (2.26).

226

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Per la (2.25) abbiamo: ◆✓ ◆ ✓ t2 s2 In + sA + A2 + · · · = In + tA + A2 + · · · 2 2 ✓ 2 ◆ 2 t s = In + (t + s)A + + ts + A2 + · · · 2 2 (t + s)2 2 = In + (t + s)A + A + ··· 2 Per la (2.26) abbiamo: 1

1

k=0

k=0

X tk d tA X d tk k e = A =A Ak = A etA . dt dt k! k! 2.3

Sistemi omogenei. Wronskiano. Matrice di transizione

Riprendiamo in considerazione il sistema omogeneo (2.6): z˙ = A(t)z. dove supporremo che A(t) sia continua nell’intervallo I ✓ R. Come abbiamo gi` a detto, le soluzioni di questo sistema formano uno spazio lineare Z, n-dimensionale; baster` a quindi conoscere una base di Z, cio`e n soluzioni linearmente indipendenti (o, come diremo, un sistema fondamentale di soluzioni) per avere ogni altra soluzione, cio`e la soluzione generale del sistema. Osserviamo esplicitamente che n soluzioni linearmente indipendenti sono n vettori (2.27)

'1 (t),

'2 (t), . . . , 'n (t)

(definiti sull’intervallo I) tali che l’equazione (2.28)

c1' 1 (t) + c2' 2 (t) + · · · + cn' n (t) = 0

8t 2 I

non pu` o essere soddisfatta se gli scalari c1 , c2 , . . . , cn non sono tutti nulli. In virt` u del teorema di esistenza e unicit` a, se la soluzione di un sistema omogeneo `e nulla in un punto, `e identicamente nulla in tutto l’intervallo in cui `e definita; perci` o la combinazione (2.28) `e sempre nulla o sempre diversa da 0 per ogni t 2 I. Possiamo dunque enunciare la seguente PROPOSIZIONE 2.1 Condizione necessaria e sufficiente perch´e i vettori soluzione (2.27) siano linearmente indipendenti `e che, indicata con W(t) la matrice che si ottiene accostando i vettori colonna '1 (t), . . . , 'n (t), cio`e 1 0 1 '1 (t) '21 (t) · · · 'n1 (t) C B 1 B '2 (t) '22 (t) · · · 'n2 (t)C C B (2.29) W(t) = B . .. .. C B .. . . C A @ '1n (t) '2n (t) · · · 'nn (t)

2. Equazioni lineari

c 978-88-08-63708-6

227

risulti: |W(t)| 6= 0

8 t 2 I.

Nel caso dell’equazione di ordine n (2.30)

z (n) = a1 (t)z (n

1)

+ · · · + an (t)z

(con aj (t), j = 1, . . . , n continue su I) ricordando come ci si riconduce dall’equazione al sistema, se '1 (t), '2 (t), . . . , 'n (t) sono n soluzioni della (2.30), la matrice (2.29) prende la forma seguente 0 1 '2 (t) . . . 'n (t) '1 (t) B C '02 (t) . . . '0n (t) C B '01 (t) B C (2.31) W(t) = B C. .. .. .. B C . . . @ A (n 1)

'1

(n 1)

(t) '2

(n 1)

(t) . . . 'n

(t)

In virt` u della Proposizione 2.1, i vettori colonna della matrice (2.31) sono linearmente indipendenti se e solo se il determinante di questa matrice `e 6= 0 in I. D’altra parte questi vettori sono linearmente indipendenti se e solo se lo sono le prime componenti (cio`e le soluzioni dell’equazione); infatti, se l’equazione c1 '1 (t) + · · · + cn 'n (t) = 0

8t 2 I

`e soddisfatta con coefficienti non tutti nulli, da essa, derivando n

1 volte, ricaviamo

c1 '01 (t) + · · · + cn '0n (t) = 0 ... (n 1)

c1 '1

(t) + · · · + cn '(n n

1)

(t) = 0

ovvero, le colonne della matrice (2.31) sono linearmente dipendenti. Il viceversa `e ovvio. In conclusione, la Proposizione 2.1 vale anche per le equazioni di ordine n: condizione necessaria e sufficiente perch´e n soluzioni dell’equazione (2.30) siano linearmente indipendenti `e che il determinante della matrice (2.31) sia 6= 0, per ogni t 2 I. DEFINIZIONE 2.2 Date n funzioni vettoriali ' i (t) : I ! Rn

i = 1, . . . , n

si chiama matrice wronskiana (relativa a questi vettori) la matrice (2.29), le cui colonne sono costituite dai vettori ' i (t): '1 (t), ' 2 (t), . . . , ' n (t)); W(t) = (' si chiama wronskiano, e si indica con W (t), il determinante di questa matrice: W (t) := |W(t)|.

228

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Analogamente, date n funzioni 'i (t) : I ! R

i = 1, . . . , n

si chiama matrice wronskiana (relativa a queste funzioni) la matrice (2.31) e si chiama ancora wronskiano il determinante di questa matrice. Esempio 2.7 Le funzioni cos t, sin t (che, evidentemente, sono soluzioni dell’equazione: z¨ + z = 0) sono linearmente indipendenti (su tutta la retta); infatti il loro wronskiano risulta cos t sin t W (t) = = 1. sin t cos t Il seguente controesempio indica che la Proposizione 2.1 `e falsa se le funzioni considerate non sono soluzioni di un sistema lineare; pi` u precisamente, l’annullarsi del wronskiano `e condizione solo necessaria, ma non sufficiente, per la dipendenza lineare delle funzioni. Esempio 2.8 Siano '1 (t) = t2 , '2 (t) = t|t| e I = R. Risulta W (t) =

t2 t|t| = 0, 2t 2|t|

ma '1 (t) e '2 (t) sono linearmente indipendenti. Infatti, l’equazione c1 t2 + c2 t|t| = 0 implica, per t = 1, c1 + c2 = 0 e, per t =

8 t 2 R,

1, c1

c2 = 0, da cui segue c1 = c2 = 0.

Dunque, la conoscenza della matrice wronskiana di soluzioni, con determinante diverso da zero, consente di scrivere l’integrale generale del sistema omogeneo; esso pu` o scriversi nella forma compatta seguente: ' (t) = c1' 1 + c2' 2 + · · · + cn' n = W(t)c, dove c `e un vettore (colonna) di costanti arbitrarie c1 , . . . , cn . Osserviamo che la matrice wronskiana soddisfa l’equazione seguente ˙ W(t) = A(t)W(t).

(2.32)

Infatti, uguagliando gli elementi corrispondenti delle matrici a primo e secondo membro della (2.32) abbiamo '˙ ij (t) =

n X

aik (t)'ik (t)

i, j = 1, 2, . . . , n.

k=1

Le precedenti relazioni scalari si possono anche scrivere, in forma vettoriale, 'i (t) '˙ i (t) = A(t)'

i = 1, 2, . . . , n,

che esprimono dunque il fatto che i vettori ' i sono soluzioni del sistema omogeneo.

2. Equazioni lineari

c 978-88-08-63708-6

229

Se le soluzioni ' 1 , . . . , ' n sono scelte in modo che ' 1 (⌧ ) = e1 ,

' 2 (⌧ ) = e2 , . . . , ' (n) = en ,

risulter` a W(⌧ ) = In .

(2.33)

Una matrice wronskiana che soddisfi la (2.33) si indica con W(t, ⌧ ) e prende il nome di matrice di transizione. Il nome deriva dal fatto che la soluzione del sistema omogeneo che, per t = ⌧ , coincide col vettore ⇠ 2 Rn si scrive ' (t; ⌧, ⇠) = W(t, ⌧ )⇠

(2.34)

cio`e W(t, ⌧ ), agisce come un operatore che fa passare dalla soluzione al tempo ⌧ (il vettore ⇠) alla soluzione al tempo t. Le propriet` a fondamentali della matrice di transizione sono: 8t 2 I 8 t, t1 , ⌧ 2 I

i) W(t, t) = In ii) W(t, t1 )W(t1 , ⌧ ) = W(t, ⌧ ) iii) [W(t, ⌧ )]

1

= W(⌧, t)

8 t, ⌧ 2 I.

La i) deriva dalla (2.33); la iii) segue immediatamente dalla ii); la ii) esprime semplicemente il fatto che, a partire dalla soluzione “iniziale” al tempo ⌧ , possiamo ottenere la soluzione “finale” al tempo t calcolando prima la soluzione al tempo “intermedio” t1 e poi, assumendo questa come nuovo dato iniziale, calcolare la soluzione al tempo t. Osserviamo infine che anche il determinante wronskiano, come la matrice wronskiana, soddisfa una equazione di↵erenziale. Vale infatti il seguente teorema. TEOREMA 2.2 (di Liouville) Il wronskiano di un sistema di soluzioni dell’equazione z˙ = A(t)z soddisfa l’equazione di↵erenziale (2.35)

˙ = a(t)W W

dove a(t) = tr A(t) `e la traccia della matrice A(t). Dalla (2.35), ricordando la formula (1.42), si ricava (2.36)

W (t) = W (⌧ ) exp

✓Z

t ⌧

◆ a(s)ds

dove ⌧ `e un punto qualsiasi di I. Nel caso dell’equazione (2.30) la (2.36) si scrive (2.37)

W (t) = W (⌧ ) exp

✓Z



t

◆ a1 (s)ds .

Dalla formula (2.36) si ha una conferma di quanto abbiamo osservato all’inizio del paragrafo: il wronskiano di un sistema di soluzioni dell’equazione (2.6) o `e identicamente nullo su I, o `e diverso da zero in ogni punto di I.

230

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Dunque, per concludere intorno alla dipendenza o indipendenza lineare di un sistema di soluzioni baster` a calcolare il wronskiano in un punto (convenientemente scelto) dell’intervallo I. Dimostrazione del Teorema 2.2. Per ogni intervallo (⌧, ⌧ + ") ⇢ I abbiamo: ˙ ) + o(") = (per la (2.32)) W(⌧ + ") = W(⌧ ) + "W(⌧ = (In + "A(⌧ ))W(⌧ ) + o(")

per " ! 0.

dove o(✏) indica una matrice tale che o(")/" ! 0. Abbiamo allora W (⌧ + ") = |(In + "A(⌧ ))W(⌧ )| + o(") = (teorema di Binet) = W (⌧ )|In + "A(⌧ )| + o(") = (formula (2.18)) = W (⌧ )(1 + "a(⌧ )) + o("). Risulta perci` o W (⌧ + ") W (⌧ ) = a(⌧ )W (⌧ ) + o(1). " Facendo tendere " a zero, si ha la tesi.



Una interpretazione geometrica di questo teorema `e accennata nel Paragrafo 3.8. 2.4

Sistemi omogenei a coefficienti costanti

Supponiamo ora che la matrice A del sistema sia costante (in particolare, il sistema `e autonomo). Allora, ricordando quanto `e stato detto nel Paragrafo 2.1 circa l’esistenza, unicit` a e regolarit` a delle soluzioni dei sistemi lineari, possiamo a↵ermare che: ogni soluzione del sistema (omogeneo) `e definita su tutta la retta ed `e analitica; per ogni punto ⇠ di Rn passa una e una sola soluzione. Il seguente teorema ci d` a una rappresentazione di queste soluzioni. TEOREMA 2.3 Dato il sistema omogeneo: z˙ = Az con A costante, i) detto ⇠ un vettore arbitrario di Rn , il vettore ' (t) = etA ⇠

t2R

`e una soluzione del sistema; ii) le colonne della matrice etA formano un sistema fondamentale di soluzioni; iii) il problema di Cauchy: z˙ = Az, z(⌧ ) = ⇠ ammette, 8 ⇠ 2 Rn , l’unica soluzione: ' (t; ⌧, ⇠) = e(t ⌧ )A ⇠. In altre parole, la matrice di transizione W(t, ⌧ ) `e, in questo caso, e(t

⌧ )A

.

Dimostrazione. La verifica di i) `e immediata, applicando la formula (2.26). Per provare la ii) basta scegliere per ⇠, uno dopo l’altro, i versori del riferimento canonico e1 , e2 , . . .; allora etA ⇠ fornisce, di volta in volta, la prima, la seconda, . . . colonna della matrice etA . Queste colonne sono vettori linearmente indipendenti poich´e, come abbiamo osservato, la matrice etA `e non singolare (8 t 2 R). La iii) discende dalla i) tenuto conto che e0·A = I. ⇤

2. Equazioni lineari

c 978-88-08-63708-6

231

Resta il problema di calcolare esplicitamente etA . Se A `e diagonale (cio`e le equazioni del sistema sono disaccoppiate) non c’`e alcuna difficolt` a. Supponiamo che A non sia diagonale; distinguiamo i seguenti casi. Sistema con autovalori regolari La matrice A possiede n autovettori linearmente indipendenti e perci` o `e diagonalizzabile; sia S la matrice le cui colonne sono autovettori indipendenti h1 , . . . , hn di A corrispondenti agli autovalori 1 , . . . , n , eventualmente coincidenti. Risulta allora, per quanto visto nel precedente paragrafo. e =S A

e tA

e

tA

e

1

AS = diag(

= diag(e e tA

= Se

S

1t

1

,...,e

1, . . . , nt

n ),

),

. e

Per ogni ⇠ 2 Rn il vettore ' (t) = SetA S 1 ⇠ `e dunque una soluzione. Essendo ⇠ arbitrario, anche S 1 ⇠ `e arbitrario; scegliamo allora S 1 ⇠ = ei (1  i  n). Abbiamo 0 1 0 B .. C B . C B tC e i it i C SetA ei = (h1 , h2 , . . . , hn ) B Be C = h e . B . C @ .. A 0

Perci` o un sistema fondamentale di soluzioni `e dato da: h1 e

1t

,

h2 e

2t

, . . . , hn e

nt

.

Si noti che il wronskiano di queste soluzioni `e e

W (t) = |SetA | = |S|et(

1 +···+ n )

= |S|eat

dove a `e la traccia di A. Tale risultato poteva essere dedotto dalla formula (2.24); questa formula infatti (scritta ponendo tA al posto di A) non `e altro che il caso particolare del teorema di Liouville corrispondente a una matrice A costante. Esempio 2.9 Trovare un sistema fondamentale di soluzioni del seguente sistema: 8 >

: z˙3 = z2 z3 . Trovare anche la soluzione che, per t = 0, coincide col vettore e1 . La matrice dei coefficienti `e: 0 1 01 1 A = @2 1 6A . 01 1

232

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Gli autovalori di A sono le radici dell’equazione: 1 2 1 0 1

1 6

=

3

+ 9 = 0.

1

Abbiamo perci` o: 1 = 0, 2 = 3, 3 = 3; la matrice A `e dunque diagonalizzabile. Gli autovettori corrispondenti sono proporzionali ai tre seguenti: 0 1 0 1 0 1 7 1 1 h2 = @4A , h3 = @ 2A . h1 = @ 2A , 2 1 1 Un sistema fondamentale di soluzione `e perci` o dato da: ' 1 (t) = h1 ,

' 2 (t) = h2 e3t ,

' 3 (t) = h3 e

3t

.

La soluzione generale sar` a della forma: ' (t) = c1 h1 + c2 h2 e3t + c3 h3 e

3t

con c1 , c2 , c3 costanti arbitrarie. Per trovare la soluzione che, per t = 0, coincide col versore e1 imponiamo la condizione: ' (0) = e1 . Si determinano cos`ı le tre costanti: si trova, con facili calcoli, c1 = e perci` o

1 , 9

c2 =

1 , 9

c3 =

1 . 9

0 7 1 1 1 + e3t + e 3t B 9 9 C 9 B C B 2 4 3t 2 3t C 1 ' (t; 0, e ) = B + e e C. B 9 9 C 9 @ A 2 1 3t 1 3t + e + e 9 9 9

Il caso degli autovalori non regolari `e pi` u complicato; prima di occuparcene, esaminiamo il caso della singola equazione di ordine n. Equazione di ordine n Consideriamo l’equazione (2.38)

z (n) = a1 z (n

1)

+ · · · + an

1z

0

+ an z.

Per avere una rappresentazione esplicita delle soluzioni non c’`e bisogno di passare al corrispondente sistema del primo ordine. Istruiti da quanto abbiamo visto nel caso precedente sappiamo che (almeno nel caso di autovalori distinti) le soluzioni sono esponenziali della forma e t ; sostituendo e t al posto di z nella (2.38) scopriamo che

2. Equazioni lineari

c 978-88-08-63708-6

l’esponenziale `e soluzione dell’equazione se algebrica: (2.39)

D( ) :=

n

`e una radice della seguente equazione

n 1

a1

233

···

an = 0.

La (2.39) non `e altro che l’equazione caratteristica del sistema corrispondente alla (2.38); la chiameremo equazione caratteristica dell’equazione di↵erenziale (2.38) e D( ) sar` a chiamato polinomio caratteristico. Se dunque la (2.39) ha n radici distinte: 1

6=

2

6= · · · 6=

n,

un sistema fondamentale di soluzioni `e dato dalle funzioni: (2.40)

e

1t

,e

2t

,...,e

nt

.

Che le funzioni (2.40) siano linearmente indipendenti segue, oltre che dall’analogo risultato gi` a ottenuto per i sistemi, anche osservando direttamente la matrice wronskiana che, per le (2.40), si scrive 1 0 e 2t ··· e nt e 1t 2t nt C B 1e 1t ··· 2e ne C B W(t) = B C. .. A @ . n 1 e 1

1t

n 1 e 2

2t

···

n 1 e n

nt

Abbiamo allora

1 W (t) = e

1 + 2 +···+ n )t

1

1

2

n 1 1

n 1 2

.. .

··· ··· ···

1 n

.

n 1 n

Come `e noto (se non `e noto, dimostrare per esercizio che) l’ultimo determinante sopra scritto (detto determinante di Vandermonde) `e nullo se e solo se i numeri 1 , . . . , n non sono tutti diversi tra di loro. Esempio 2.10 L’equazione dell’oscillatore armonico classico: z¨ + ! 2 z = 0 ha, come equazione caratteristica: 2 + ! 2 = 0; alle due radici 1 = i!, 2 = i! corrispondono le due soluzioni: ei!t , e i!t . Al posto di queste due soluzioni (che fanno intervenire esponenziali complessi) possiamo sceglierne altre due, ottenute dalle precedenti per combinazione lineare14 : per esempio, cos !t, sin !t. La soluzione generale dell’equazione si scrive allora z(t) = c1 cos !t + c2 sin !t. 14 Si

ricordino le formule di Eulero 1 cos !t = (ei!t + e 2

i!t

),

sin !t =

1 i!t (e 2i

e

i!t

).

234

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

L’equazione z¨ possiede invece le due soluzioni: e!t , e

! 2 z = 0, !t

; l’integrale generale `e perci` o

z(t) = c1 e!t + c2 e

!t

.

La prima equazione descrive un fenomeno oscillatorio, periodico con periodo p = 2⇡/!, la seconda fenomeni di decadimento oppure di crescita esponenziale se c1 = 0 o c2 = 0, rispettivamente. Se l’equazione caratteristica (2.39) possiede autovalori multipli, e perci` o vi sono soltanto r < n radici distinte: 1 , 2 , . . . , r , dovremo procurarci altre n r soluzioni indipendenti (oltre agli esponenziali e 1 t , . . . , e r t ) per avere un sistema fondamentale di soluzioni. Possiamo congetturare la forma di soluzioni diverse dalle precedenti nel modo seguente. Se 1 e 2 sono autovalori, 1 6= 2 , e 1 t e e 2 t sono soluzioni indipendenti; anche e 1 t e (e 1 t e 2 t )/( 1 2 ) sono soluzioni indipendenti; quando 2 ! 1 la prima coppia di soluzioni si riduce all’unica funzione e 1 t , mentre la seconda coppia fornisce le funzioni e 1 t e t e 1 t , che, come `e facile verificare, sono ancora soluzioni indipendenti. Considerazioni analoghe fanno pensare che, se `e una radice di molteplicit` a m dell’equazione caratteristica, le funzioni e t , t e t , t2 e t , . . . , tm

1

e t,

sono soluzioni indipendenti dell’equazione di↵erenziale. Le precedenti considerazioni vengono precisate nel seguente TEOREMA 2.4 L’equazione caratteristica (2.39) abbia le radici

2

con molteplicit` a m1 con molteplicit` a m2

r

con molteplicit` a mr

1

.. .

(m1 +m2 +· · ·+mr = n). Allora un sistema fondamentale di soluzioni per l’equazione (2.38) `e dato da e 1 t , t e 1 t , . . . , tm1 1 e 1 t , e 2 t , t e 2 t , . . . , tm2 1 e 2 t , ......................... e r t , t e r t , . . . , tm1 1 e r t , Dimostrazione. Sia (2.41)

una radice dell’equazione caratteristica con molteplicit` a m. Sar` a allora

D( ) = D0 ( ) = · · · = D(m

Ponendo ↵0 = 1, ↵k =

1)

( ) = 0,

ak per 1  k  n abbiamo D( ) =

n X

j=0

↵n

j

j

.

D(m) ( ) 6= 0.

2. Equazioni lineari

c 978-88-08-63708-6

235

Le successive derivate di D( ) sono date da (2.42)

D

(k)

( ) = k!

n X

↵n

j

j=k

j k

!

j

k

,

0  k  n.

Poniamo ora, nella (2.38), z(t) = e t y(t) e cerchiamo l’equazione soddisfatta dalla nuova incognita y(t). Abbiamo, per la formula di Leibniz ! ! j X j (k) (j) j k y (t) e t. z (t) = k k=0 Risulta allora n X

↵n

! j (k) y (t) j k j=0 k=0 ! n n X X j =e t y (k) (t) ↵n j k k=0 j=k

(j) (t) = e jz

j=0

=e

t

t

n X

↵n

j X

j

k

=

j

k

= (per la (2.42))

n X D(k) ( ) (k) y (t). k! k=0

Tenuto conto delle (2.41), l’equazione soddisfatta dalla y(t) `e: D(m) ( ) (m) D(n) ( ) (n) y (t) + · · · + y (t) = 0. m! n! Questa possiede le m soluzioni

1, t, t2 , . . . , tm

1

.

Perci` o la (2.38) possiede le m soluzioni e t , t e t , . . . , tm

1

e t.

Ripetendo il ragionamento per i diversi autovalori 1 , . . . , r otteniamo tutte le n soluzioni indicate nell’enunciato del teorema. Dobbiamo mostrare che esse sono linearmente indipendenti. Un esame diretto del wron` preferibile procedere nel modo seguente. Se le soluzioni indicate skiano `e troppo complicato. E non fossero linearmente indipendenti, esisterebbe una loro combinazione lineare, con costanti non tutte nulle, identicamente uguale a zero. Tale identit` a non pu` o coinvolgere soluzioni corrispondenti a un solo autovalore, altrimenti sarebbe del tipo p(t)e t = 0, 8 t 2 R (con p(t) polinomio); dovrebbe essere perci` o p(t) = 0, 8 t 2 R, e il polinomio p dovrebbe avere tutti i coefficienti nulli. L’identit` a cercata dovr` a essere pertanto del tipo (2.43)

p1 (t)e

1t

+ p2 (t)e

2t

+ · · · + pk (t)e

kt

=0

8t 2 R

con 2  k  r e p1 , p2 , . . . , pk polinomi di gradi rispettivi l1  m1 1, l2  m2 1, . . . . . . , lk  mk 1. Dividiamo ora ambo i membri della (2.43) per e 1 t , deriviamo m1 volte, e a nuovamente moltiplichiamo per e 1 t ; otteniamo l’identit` (2.44)

q2 (t)e

2t

+ · · · + qk (t)e

kt

=0

8t 2 R

dove q2 , . . . , qk sono nuovi polinomi sempre di gradi rispettivi l2 , . . . , lk . Ripetiamo ora sulla (2.44) le operazioni analoghe fatte sulla (2.43) (dividiamo per e 2 t , deriviamo ecc.); si trova

236

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

una nuova identit` a; procedendo in tal modo si arriva ad avere un’identit` a del tipo p(t)e che abbiamo riconosciuto come assurda.

kt

=0 ⇤

Esempio 2.11 Si consideri l’equazione z (4)

4z 000 + 8z 00

8z 0 + 4z = 0.

Il polinomio caratteristico `e D( ) =

4

4

3

+8

2

2

8 +4=(

2 + 2)2 .

Abbiamo perci` o le due radici doppie 1

= 1 + i,

2

=1

i.

Un sistema fondamentale di soluzioni `e perci` o: e(1+i)t ,

t e(1+i)t ,

e(1

i)t

t e(1

,

i)t

.

Pu` o essere desiderabile sostituire le quattro soluzioni sopra scritte con altre quattro, pure linearmente indipendenti, ma reali. Ricordando che e(1±i)t = et (cos t ± i sin t), abbiamo il seguente sistema, ancora fondamentale, di soluzioni et cos t,

t et cos t,

et sin t,

t et sin t.

Osserviamo che, a una coppia di autovalori complessi coniugati = ↵+i , = ↵ i , ognuno di molteplicit` a m, si possono sempre far corrispondere, in luogo delle 2m soluzioni complesse e t,

te t , . . . , tm

1

e

t

e t,

te t , . . . , tm

1

e t,

le 2m soluzioni reali e↵t cos t, ↵t

e

sin t,

te↵t cos t, . . . , tm ↵t

te

1 ↵t

e

m 1 ↵t

sin t, . . . , t

e

cos t,

sin t.

Sistema con autovalori anche non regolari La discussione svolta per l’equazione di ordine n si generalizza ai sistemi; si dimostra che, dato il sistema z˙ = Az, se l’equazione caratteristica |A In | = 0 possiede a rispettiva m1 , . . . , mr , la soluzione generale del le radici 1 , . . . , r di molteplicit` sistema `e della forma (2.45)

' (t) =

mj r X X

cij ti

1

e

jt

,

j=1 i=1

dove i cij sono opportuni vettori (contenenti in totale n costanti arbitrarie). Ci limiteremo a illustrare questa situazione con un esempio.

2. Equazioni lineari

c 978-88-08-63708-6

237

Esempio 2.12 Si consideri il sistema z˙1 = z1 + z2 z˙2 = z3 z˙3 =

z1

z2 + 3z3 .

L’equazione caratteristica 1 |A

I3 | =

possiede i due autovalori: sar` a pertanto della forma

1

1 0 1

0 1

3

=

+4

2

4 =0

1 3

= 0 (semplice) e

2

= 2 (doppio). La soluzione generale

' (t) = c1 + c2 e2t + c3 t e2t . Per determinare i vettori c1 , c2 , c3 (i quali dovranno dipendere soltanto da 3 costanti arbitrarie k1 , k2 , k3 ), inseriamo ' nel sistema; otteniamo: 0 + c2 2e2t + c3 (1 + 2t)e2t = Ac1 + e2t Ac2 + t e2t Ac3 . Uguagliando i coefficienti dei termini corrispondenti, abbiamo: Ac1 = 0 Ac2 = 2c2 + c3 Ac3 = 2c3 . Si osservi che c1 e c3 sono autovettori di A corrispondenti rispettivamente agli autovalori 0 e 2, ma c2 non `e un autovettore. Risolvendo le tre equazioni precedenti si trova: 0 1 0 1 0 1 0 1 1 1 1 1 B C B C B C B C 1 2 3 c = k1 @ 1A , c = k2 @1A + k3 @ 0A , c = k3 @1A . 0 2 1 2 o rapOSSERVAZIONE CONCLUSIVA La soluzione di un sistema lineare autonomo pu` presentarsi in forma elegante e (concettualmente) semplice per mezzo della matriu ce esponenziale. Ma i calcoli necessari per ottenere poi una rappresentazione pi` esplicita sono piuttosto laboriosi e, armati solo di carta e penna, non si pu` o andare generalmente oltre i sistemi 3 ⇥ 3. Tuttavia esistono oggi programmi di calcolo che consentono, con l’utilizzo di un PC, la risoluzione rapida di sistemi anche complessi.

238

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

2.5 Sistemi non autonomi Consideriamo il sistema omogeneo z˙ = A(t)z R

con A(t) di classe C (I); sia I ✓ R il massimo intervallo in cui A(t) `e continua. Le soluzioni allora sono definite (almeno) 8 t 2 I e l’unione dei loro grafici riempie tutta la striscia I ⇥ Rn (Fig. 4.14). Esse formano ancora uno spazio lineare n-dimensionale; ma, in generale, non potremo ora arrivare a dare una rappresentazione delle soluzioni in forma esplicita, come nel caso dei sistemi autonomi.

n

I

R

Equazioni di Eulero Un caso in cui una rappresentazione esplicita `e possibile riguarda l’equazione z˙ =

(2.46)

Figura 4.14.

1 Az, t

dove A `e una matrice costante; l’intervallo I sar` a la semiretta (0, +1) oppure ( 1, 0). La (2.46) `e detta equazione di Eulero. Se si e↵ettua il cambio di variabile indipendente t = es

(t > 0),

s

(se interessa t < 0 si porr` at=

e ), essendo d ds d 1 d = = , dt dt ds t ds

la (2.46) diventa d z = Az, ds

(2.47)

che pu` o dunque essere trattata con i metodi del precedente paragrafo. Poich´e la (2.47) a soluzioni della ha soluzioni della forma he s , possiamo prevedere che la (2.46) avr` forma ht ; inserendo questa espressione nella (2.46) otteniamo l’equazione ht

1

=

1 Aht , t

che pu` o essere riscritta nella forma (2.48)

t

1

(A

In )h = 0.

La condizione perch´e la (2.48) abbia soluzioni `e: |A In | = 0. Se perci` o la matrice A ha n autovalori distinti, un sistema fondamentale di soluzioni della (2.46) sar` a: h1 t 1 , h2 t 2 , . . . , hn t

n

(t > 0)

dove h1 , . . . , hn sono corrispondenti autovettori di A.

2. Equazioni lineari

c 978-88-08-63708-6

239

Se vi sono autovalori multipli, bisogner` a procedere in maniera analoga a quanto fatto per il sistema a coefficienti costanti. Consideriamo il caso della singola equazione di ordine n. Si chiama equazione di Eulero di ordine n un’equazione del tipo z (n) =

(2.49)

a1 (n z t

1)

a2 (n z t2

+

2)

+ ··· +

an tn

1 0 z 1

+

an z. tn

Questa pu` o essere ricondotta alla forma (2.46) ponendo z2 = tz 0 ,

z1 = z,

z3 = t2 z 00 , . . . , zn = tn

1 (n 1)

z

.

Considerando ancora il solo caso t > 0, con la sostituzione t = es , la (2.49) diventa un’equazione a coefficienti costanti: z (n) = b1 z (n

(2.50)

1)

+ · · · + bn ,

dove i coefficienti bi sono legati agli ai da relazioni che non interessa qui scrivere esplicitamente. Pertanto, se `e radice dell’equazione caratteristica n

(2.51)

b1

n 1

···

bn = 0,

di molteplicit` a m abbiamo, per la (2.50), le soluzioni e s , s e s , . . . , sm corrispondono, per la (2.49), le soluzioni t , t log t, . . . , t (log t)m

1

1

e s , alle quali

(t > 0).

Per trovare i valori di (soluzioni della (2.51)) conviene per` o procedere direttamente, senza passare all’equazione a coefficienti costanti, inserendo t nella (2.49); si trova cos`ı l’equazione ( 1) . . . ( n + 1) = = a1 ( 1) . . . ( n + 2) + · · · + an

(2.52)

1

+ an .

La (2.52) `e detta equazione caratteristica della (2.49) e non `e altro che la (2.51) scritta nei coefficienti ai invece che nei bi . Esempio 2.13 Risolvere l’equazione (per t > 0) t4 z (4) + 2t3 z (3) + 2t2 z 00

2tz 0 + 2z = 0.

L’equazione caratteristica `e: (

1)(

3) + 2 (

2)(

1)(

2) + 2 (

1)

2 + 2 = 0.

Sviluppando i prodotti abbiamo 4

4

3

+7

2

6 + 2 = 0,

che pu` o essere riscritta nella forma (

4

4

3

+6

2

4 + 1) + (

2

2 + 1) = 0,

240

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

e cio`e 1)4 + (

(

1)2 = 0.

Abbiamo dunque le radici 1 2 3

=1 =1+i = 1 i.

(doppia)

Un sistema fondamentale di soluzioni `e pertanto t, t log t,

t1+i ,

t1 i .

Al solito, pu` o essere pi` u conveniente esprimere le soluzioni in forma reale. Ricordando che t1±i = t exp(±i log t) = t(cos(log t) ± i sin(log t)), possiamo sostituire alle precedenti soluzioni le seguenti t,

t log t,

t cos(log t),

t sin(log t).

Per t ! 0 le soluzioni delle equazioni di Eulero sono generalmente singolari; ma ci` o non accade sempre; per esempio, la semplice equazione t2 z 00

2tz 0 + 2z = 0,

o la soluzione generale: '(t) = c1 t + c2 t2 `e ha le soluzioni indipendenti t e t2 e perci` addirittura analitica 8 t 2 R. Questo esempio mostra che un’equazione i cui coefficienti sono singolari (discontinui) in un punto pu` o avere anche tutte le soluzioni regolari (addirittura analitiche) in quel punto. Alcuni sistemi non autonomi, in particolare alcune equazioni del 2 ordine, si incontrano molto frequentemente in diversi campi della Fisica e di altre scienze; esse sono state studiate a fondo e le loro soluzioni sono state tabulate con grande accuratezza. A titolo d’esempio, citiamo le seguenti: ◆ ✓ ⌫2 1 z=0 equazione di Bessel: z¨ + z˙ + 1 t t2 equazione di Hermite: z¨ tz˙ + z = 0 equazione di Laguerre: t¨ z + (1 t)z˙ + z = 0 equazione di Legendre: equazione di Mathieu:

z 2tz˙ + z = 0 (1 t2 )¨ z¨ + (a + b cos t)z˙ = 0.

In generale, cio`e per valori generici dei parametri che vi compaiono, le soluzioni di queste equazioni non sono esprimibili mediante funzioni trascendenti elementari; esse definiscono perci` o nuove funzioni trascendenti, non elementari. Per ottenere informazioni circa la natura di queste soluzioni, il loro comportamento in vicinanza dei punti singolari o all’infinito, bisogna per` o ricorrere a metodi che qui non possiamo sviluppare. Tuttavia uno di questi metodi `e concettualmente assai semplice e viene qui di seguito descritto.

2. Equazioni lineari

c 978-88-08-63708-6

241

Metodo di Frobenius Se si osservano le equazioni sopra scritte si scopre che, a parte i punti singolari, i coefficienti sono molto regolari, addirittura analitici; pertanto anche le soluzioni saranno tali e potranno essere rappresentate in serie di potenze. Illustriamo il metodo con due esempi. Equazione di Hermite. I coefficienti di questa equazione (dove `e un parametro reale) sono analitici su tutta la retta e perci` o ogni sua soluzione potr` a essere rappresentata mediante una serie di potenze del tipo: (2.53)

z(t) =

1 X

an tn ,

n=0

in qualche intorno dell’origine. Per determinare i coefficienti an della serie, inseriamo questa nell’equazione: otteniamo (2.54)

1 X

n(n

1)an tn

2

n=0

1 X

n an tn +

n=0

1 X

an tn = 0.

n=0

Nella prima sommatoria l’indice pu` o partire da 2 poich´e i primi due termini sono nulli; ponendo poi m = n 2 questa sommatoria si scrive 1 X

(m + 2)(m + 1)am+2 tm .

m=0

Indicando nuovamente con n l’indice di sommatoria, l’equazione (2.54) prende la forma (2.55)

1 X

[(n + 2)(n + 1)an+2 + (

n)an ]tn = 0.

n=0

Poich´e la (2.55) deve valere identicamente per ogni t compreso nell’intervallo di convergenza, dovr` a essere (2.56)

an+2 =

n an . (n + 1)(n + 2)

La (2.56) `e una relazione di ricorrenza per i coefficienti an : da essa, noti i primi due, o a0 e a1 , tutti gli altri possono essere ricavati, uno dopo l’altro. Il coefficiente a0 pu` essere determinato assegnando la posizione al tempo 0: z(0) = a0 ; a1 assegnando la velocit` a: z(0) ˙ = a1 . Prima di procedere, osserviamo che, se z(t) `e soluzione dell’equazione di Hermite, anche z( t) `e soluzione (verificare!); allora anche z(t) + z( t) e z(t) z( t) sono soluzioni, la prima pari e la seconda dispari. Possiamo dunque limitarci a ricercare separatamente le soluzioni pari e le dispari. Otterremo le soluzioni pari assumendo a0 6= 0, a1 = 0 (cosicch´e tutti i coefficienti dispari sono nulli); otterremo le soluzioni

242

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

dispari assumendo a0 = 0, a1 6= 0. Dalla (2.56) otteniamo allora a2 =

1·2

a2n+1 =

a4 =

(2

a2n = a3 =

a0 ,

)(4

1 a1 , 2·3 (1

)(3

2 (2 ) a2 = a0 , . . . 3·4 1·2·3·4

) . . . (2n 2 ) a0 (2n)! 3 (1 )(3 ) a5 = a3 = a1 , . . . 4·5 2·3·4·5 ) · . . . · (2n (2n + 1)!

1

)

a1 .

P Applicando il criterio del rapporto, ricaviamo che entrambe le serie a2n t2n e P a2n+1 t2n+1 sono convergenti su tutta la retta; esse rappresentano perci` o due soluzioni (linearmente indipendenti) dell’equazione. Osserviamo, dalle precedenti formule, che, se = 2k, cio`e un intero P pari, i coefficienti o la serie a2n t2nP si arresta e la a2n sono tutti nulli a partire da n = k+1 in poi e perci` sua somma `e un polinomio (di grado 2k); se = 2k + 1, dispari, la serie a2n+1 t2n+1 `e un polinomio di grado 2k + 1; tali polinomi vengono detti polinomi di Hermite. Equazione di Bessel. Il metodo di Frobenius pu` o essere applicato anche nell’intorno di un punto singolare; in tal caso esso ci fornir` a la rappresentazione per serie di una (eventuale) soluzione analitica in quel punto. Consideriamo l’equazione di Bessel con ⌫ = m (intero positivo o nullo). Il punto t = 0 `e singolare per l’equazione; cerchiamo tuttavia eventuali soluzioni analitiche in un intorno dell’origine; cerchiamole nella forma z(t) = t

k

1 X

an tn

n=0

(a0 6= 0, k

0).

Inserendo questa espressione nell’equazione e raccogliendo le potenze simili di t, otteniamo ⇢ 1 X ([(k + n)2 m2 ]an + an 2 tn = 0. tk 2 (k2 m2 )a0 + [(k + 1)2 m2 ]a1 t + n=2

Annullando allora i coefficienti delle potenze di t abbiamo: k = m,

a1 = 0,

an =

an 2 (k + n)2 m2

(n = 2, 3, . . .).

Tutti i coefficienti di indice dispari sono nulli e i coefficienti di indice pari sono determinati da a0 ; scegliendo a0 = 2 m /m! otteniamo la serie ✓ ◆m+2n t n ( 1) 1 X 2 (2.57) Jm (t) = . n!(m + n)! n=0 Questa soluzione si chiama funzione di Bessel di prima specie di ordine m. Jm (t) si comporta come tm per t ! 0.

2. Equazioni lineari

c 978-88-08-63708-6

243

Dal criterio del rapporto possiamo dedurre che la serie (2.57) converge su tutta la retta. Fissato m, abbiamo cos`ı trovato una soluzione (analitica) dell’equazione di Bessel. Un’altra soluzione, linearmente indipendente da questa, non sar` a analitica, e perci` o non potr` a essere trovata col metodo sopra illustrato. Lo studio del comportamento delle soluzioni nell’intorno di un punto singolare e, in base a questo, la classificazione dei punti singolari, `e uno dei problemi principali della teoria delle equazioni di↵erenziali. 2.6 Sistemi non omogenei Come abbiamo gi` a osservato, per ottenere la soluzione generale del sistema y˙ = A(t)y + b(t),

(2.58)

baster` a aggiungere, alla soluzione generale del corrispondente sistema omogeneo z˙ = A(t)z, una soluzione particolare della (2.58). Mostreremo ora che `e sempre possibile trovare (esplicitamente) una tale soluzione, purch´e sia noto un sistema fondamentale di soluzioni del corrispondente sistema omogeneo. Il metodo, qui sotto illustrato, per trovare questo integrale particolare della (2.58) `e dovuto a Lagrange ed `e noto come metodo della variazione delle costanti arbitrarie. '1 , ' 2 , . . . , ' n ) di un sistema fondaConsideriamo la matrice wronskiana W(t) = (' mentale di soluzioni del sistema omogeneo. La soluzione generale del sistema omogeneo `e della forma ' (t) = c1' 1 + c2' 2 + · · · + cn' n = W(t)c, dove c `e un vettore (colonna) di costanti arbitrarie c1 , . . . , cn . Cerchiamo ora una soluzione di (2.58) nella forma (2.59)

(t) = W(t)c(t),

dove c(t) `e un vettore incognito. Imponendo che (t) sia soluzione della (2.58) troviamo ˙ ˙ W(t)c(t) + W(t)c(t) = A(t)W(t)c(t) + b(t), e cio`e, ricordando la (2.32), ˙ W(t)c(t) = b(t). Essendo W(t) non singolare, possiamo ricavare ˙ c(t) =W

1

(t)b(t),

da cui, integrando, (2.60)

c(t) =

Z

t

W

1

(s)b(s)ds



essendo ⌧ un valore particolare della variabile t. Abbiamo trascurato di aggiungere, al secondo membro della (2.60), un vettore costante arbitrario, poich´e ci interessa una sola soluzione della (2.58). Questa `e data allora dalla formula Z t W 1 (s)b(s)ds. (2.61) (t) = W(t) ⌧

244

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Scriviamo ora la soluzione della (2.58) soddisfacente la condizione: y(⌧ ) = ⇠. Conviene utilizzare, al posto di una generica W(t), la matrice di transizione W(t, ⌧ ). Ricordando le propriet` a i), ii), iii) (Par. 2.3) della matrice di transizione, la soluzione cercata si scrive Z t W(⌧, s)b(s)ds. (2.62) (t; ⌧, ⇠) = W(t, ⌧ )⇠ + W(t, ⌧ ) ⌧

Il primo termine a secondo membro della (2.62) `e la soluzione del sistema omogeneo passante per il punto (⌧, ⇠); il secondo `e la soluzione del sistema non omogeneo passante per il punto (⌧, 0). Se A `e costante, risulta W(t, ⌧ ) = e(t s)A e la (2.62) si scrive Z t (t ⌧ )A (2.63) (t; ⌧, ⇠) = e ⇠+ e(t s)A b(s)ds ⌧

in perfetta analogia con la formula (1.42) Nel caso dell’equazione di ordine n possiamo ottenere un’analoga formula deducendola dalla (2.61) oppure ricavandola direttamente. Sia '1 (t), . . . , 'n (t) un sistema fondamentale di soluzioni dell’equazione z (n) = a1 (t)z (n

1)

+ · · · + an (t)z.

Cerchiamo una soluzione dell’equazione (2.64)

y (n) = a1 (t)y (n

1)

+ · · · + an (t)y + b(t),

della forma (2.65)

(t) = c1 (t)'1 (t) + · · · + cn (t)'n (t).

Alle n funzioni c1 , . . . , cn possiamo imporre, a nostra scelta, n 1 relazioni, purch´e queste non siano incompatibili con l’equazione (2.64). Imponiamo allora le seguenti relazioni:

(2.66)

c01 '1 + · · · c0n 'n = 0 c01 '01 + · · · c0n '0n = 0 .. . (n 2)

c01 '1

+ · · · c0n '(n n

2)

= 0.

Tali relazioni sono state scelte in modo da semplificare il calcolo delle successive derivate di ; infatti, derivando successivamente ambo i membri della (2.65), tenuto conto delle (2.66), otteniamo 0 00

... (n 1)

= c1 '01 + · · · + cn '0n = c1 '001 + · · · + cn '00n (n 1)

= c1 '1

+ · · · + cn '(n n

1)

.

2. Equazioni lineari

c 978-88-08-63708-6

245

Resta da calcolare l’ultima derivata, che risulta (n)

(n)

(n 1)

0 = c1 '1 + · · · + cn '(n) n + c1 '1

Imponendo ora alla

+ · · · + c0n '(n n

1)

.

di soddisfare la (2.64) otteniamo (n 1)

c01 '1

(2.67)

+ · · · + c0n '(n n

1)

= b(t).

Quest’ultima equazione, insieme con le (2.66), consente di determinare le funzioni c01 , . . . , c0n ; infatti le (2.66), (2.67) formano un sistema lineare algebrico non omogeneo, nelle incognite c01 , . . . , c0n il cui determinante `e il wronskiano delle soluzioni '1 , . . . , 'n . Risolvendo questo sistema, con la regola di Cramer, si trova: 0 1 0 B 0 C B C c0 (t) = W 1 (t) B . C , @ .. A b(t) e cio`e, indicando con Wni (t) il complemento algebrico dell’elemento di posto (n, i) nella matrice wronskiana, Wni (t) b(t). c0i (t) = W (t) Si ha perci` o la formula (2.68)

(t) =

n X i=1

'i (t)

Z

t



Wni (s) b(s)ds, W (s)

che ci d` a un integrale particolare dell’equazione (2.64). Esempio 2.14 Cerchiamo un integrale particolare dell’equazione y¨ + ! 2 y = b(t). Abbiamo: '1 (t) = cos !t '2 (t) = sin !t

W(t) =



◆ cos !t sin !t ! sin !t ! cos !t

W (t) = !, (2.69)

W21 (t) = sin !t, W22 (t) = cos !t Z Z sin !t t cos !t t sin !s b(s)ds + cos !s b(s)ds = (t) = ! ! ⌧ ⌧ Z 1 t sin[!(t s)]b(s)ds. = ! ⌧

Artifici particolari Nelle applicazioni, prima di sviluppare questi metodi generali, conviene osservare bene se, per caso, un integrale particolare dell’equazione non sia reperibile pi` u direttamente.

246

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Una semplice regola da tener presente deriva dal principio di sovrapposizione: se b(t) = b1 (t) + b2 (t) e conosciamo un integrale particolare dell’equazione con termine noto b1 (t) e uno dell’equazione con termine noto b2 (t), allora la somma dei due integrali sar` a un integrale dell’equazione con termine noto b(t). Se l’equazione omogenea `e a coefficienti costanti, una regola utilissima nelle applicazione `e la seguente: o essere, sia b(t) = pr (t)e t , dove pr (t) `e un polinomio di grado r e 2 C; pu` oppure no, radice dell’equazione caratteristica dell’equazione di↵erenziale data. Sia k = 0 se non `e radice dell’equazione caratteristica; altrimenti sia k la molteplicit` a di questa radice; allora esiste un integrale particolare dell’equazione della forma (t) = tk qr (t)e t , dove qr (t) `e un polinomio di grado r. La dimostrazione dell’a↵ermazione precedente (che qui non riportiamo) pu` o essere svolta per verifica diretta. Osserviamo che rientrano, nel caso considerato, molte situazioni comuni nelle applicazioni: b(t) `e un polinomio ( = 0), oppure `e una combinazione di seni, coseni, funzioni iperboliche, eccetera. Esempio 2.15 Trovare un integrale particolare dell’equazione y¨ + ! 2 y = t cos t.

(2.70)

Si pu` o utilizzare la formula (2.69) oppure procedere direttamente come segue. Il secondo membro `e della forma: b(t) = b1 (t) + b2 (t) con b1 (t) = 12 t eit , b2 (t) = 1 it . Consideriamo dapprima l’equazione: 2t e y¨ + ! 2 y = b1 (t) =

(2.71)

1 it te . 2

Le radici dell’equazione caratteristica 2 + ! 2 = 0 sono 1 = i! e 2 = i!. Perci` o, se ! 6= 1, applicando la regola enunciata con k = 0, r = 1, = i, cercheremo un integrale particolare della forma (t) = (c1 + c2 t)eit . Inserendo questa espressione nella (2.71) si trova c1 + c2 (2i

t) + ! 2 (c1 + c2 t) =

1 t, 2

da cui, uguagliando i coefficienti delle potenze di t, c1 =

i (! 2

1)2

,

c2 =

1 2(! 2 1)

(! 6= 1).

Se ! = 1, applicheremo la regola enunciata con k = 1, r = 1, un integrale particolare della forma (t) = t(c1 + c2 t)eit ,

= i; cercheremo allora

2. Equazioni lineari

c 978-88-08-63708-6

247

ottenendo

1 i , c2 = . 8 8 Se il secondo membro dell’equazione (2.71) `e b2 (t) invece di b1 (t), non avremo da fare altro che porre i invece di i nei risultati ottenuti. In conclusione, un integrale particolare della (2.70) `e c1 =

se ! 6= 1: '(t) = =

2.7

1)2 2

(! 2 se ! = 1: '(t) =

i

(! 2

1)2

1 it t(e + e 8

(eit

e

sin t +

it

)+

it

)+

1 !2

1

t 2(! 2

1)

(eit + e

it

)=

t cos t

1 2 it t (e 8i

e

it

)=

t t2 cos t + sin t. 4 4

Problemi ai limiti per equazioni lineari del secondo ordine

L’argomento di questo paragrafo riguarda lo studio di soluzioni di equazioni di↵erenziali del secondo ordine cui si richiede di essere definite in un prefissato intervallo (↵, ) e di verificare certe condizioni ai limiti di questo intervallo, cio`e per t = ↵ e t = . Non si tratta dunque di un problema di Cauchy, in cui le condizioni (posizione e velocit` a assegnate) sono imposte nello stesso punto, ma di un problema di tipo nuovo. Questi problemi sono noti col nome di problemi di Sturm-Liouville e presentano forti agganci con problemi tipici delle equazioni alle derivate parziali (si veda il Cap. 7, Sez. 1). Noi limiteremo la nostra analisi a una breve introduzione allo studio di questi problemi. In molti problemi fisici si incontrano equazioni del secondo ordine del tipo (2.72)

p0 (x)y 00 + p1 (x)y 0 + (p2 (x) + p3 (x))y = f (x),

dove `e un parametro dipendente da propriet` a fisiche del sistema. Assumiamo che i coefficienti dell’equazione e il termine noto siano continui in [↵, ]; inoltre supporremo p0 (x) 6= 0 in [↵, ]. La variabile indipendente x `e solitamente una variabile spaziale (e ci` o giustifica il cambio di notazione: x anzich´e t). Si cerca una soluzione definita sull’intervallo [↵, ], di classe C 2 , e tale che le seguenti due condizioni siano soddisfatte: ( a0 y(↵) + a1 y 0 (↵) + a2 y( ) + a3 y 0 ( ) = k1 (2.73) b0 y(↵) + b1 y 0 (↵) + b2 y( ) + b3 y 0 ( ) = k2 . Si noti che le condizioni (2.73) coinvolgono funzione e derivata prima ai limiti dell’intervallo. I numeri a0 , . . . , a3 , b0 , . . . , b3 , k1 , k2 sono ritenuti noti. Il problema (2.72), (2.73) `e lineare, poich´e sia l’equazione che le condizioni al contorno sono tali. Lo studio di questi problemi si riconduce allo studio di sistemi di equazioni algebriche lineari nelle costanti arbitrarie contenute nell’integrale generale della (2.72).

248

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Accanto al problema non omogeneo, consideriamo anche il problema omogeneo associato, e cio`e: (2.74) (2.75)

po (x)z 00 + p1 (x)z 0 + (p2 (x) + p3 (x))z = 0 ( a0 z(↵) + a1 z 0 (↵) + a2 z( ) + a3 z 0 ( ) = 0 b0 z(↵) + b1 z 0 (↵) + b2 z( ) + b3 z 0 ( ) = 0,

il quale certamente avr` a almeno la soluzione identicamente nulla in [↵, ]. Lo studio del problema dato viene condotto secondo le seguenti linee. Sia z(x, ) = c1 '1 (x, ) + c2 '2 (x, ) la soluzione generale dell’equazione (2.74). Imponiamo le condizioni (2.75); otteniamo un sistema lineare algebrico omogeneo 2 ⇥ 2 nelle incognite c1 e c2 . Sia ( ) il determinante di questo sistema. i) Se, per il valore di che interessa, risulta ( ) 6= 0, il sistema omogeneo in c1 , o il problema omogeneo (2.74), (2.75) c2 ammette solo la soluzione nulla e perci` ammette solo la soluzione identicamente nulla. ii) Se ( ) = 0 (per un certo ; tale si chiamer` a un autovalore del problema) il a infinite soluzioni non nulle; se c1 , c2 `e una sistema omogeneo in c1 , c2 ammetter` di queste, il corrispondente integrale della (2.74), z(x, ) = c1 '1 (x) + c2 '2 (x), `e una soluzione non nulla del problema omogeneo (2.74), (2.75) (le soluzioni non nulle del problema omogeneo sono dette autosoluzioni del problema). In questo caso, dunque, il problema omogeneo ammette infinite autosoluzioni delle quali soltanto una o, al massimo, due, sono indipendenti, secondo il rango della matrice a, generalmente, 1 ma pu` o anche essere 0 in casi del sistema in c1 e c2 che sar` degeneri. Veniamo alla discussione del problema non omogeneo. Sia y(x, ) = c1 '1 (x, ) + c2 '2 (x, ) + (x, ) la soluzione generale dell’equazione (2.72) (somma della soluzione generale della (2.74) e di un integrale particolare della (2.72)). Imponiamo le condizioni (2.73): otteniamo un sistema algebrico non omogeneo nelle incognite c1 e c2 , i cui termini noti contengono le costanti k1 e k2 e i valori f (↵), f ( ), f 0 (↵), f 0 ( ); il corrispondente sistema omogeneo `e proprio quello discusso nei precedenti casi i) e ii). iii) In corrispondenza del caso i), e cio`e se ( ) 6= 0, il sistema non omogeneo in c1 , c2 ha soluzione unica, comunque siano assegnati i termini noti (tale soluzione si ricava con la regola di Cramer). Determinate cos`ı le costanti c1 e c2 risulta univocamente determinata la soluzione del problema (2.72), (2.73). In questo caso dunque, assegnati comunque il termine noto f (t) e le costanti k1 e k2 , il problema (2.72), (2.73) ammette, in corrispondenza, un’unica soluzione. iv) In corrispondenza del caso ii), e cio`e se ( ) = 0, il sistema non omogeneo in c1 , c2 ha infinite soluzioni se i termini noti sono opportunamente scelti, soddisfacenti

2. Equazioni lineari

c 978-88-08-63708-6

249

opportune condizioni di compatibilit` a (teorema di Rouch´e-Capelli), altrimenti non ha alcuna soluzione. Allora, il problema (2.72), (2.73) non ha, in generale, alcuna soluzione; ha per` o infinite soluzioni se la funzione f (t) e le costanti k1 e a. k2 soddisfano opportune condizioni di compatibilit` Le conclusioni dei punti iii) e iv) possono essere riassunte nel seguente principio dell’alternativa: i teoremi di unicit` a e di esistenza (senza speciali condizioni sui termini noti) o sussistono entrambi (iii) o mancano entrambi (iv). Esempio 2.16 Si voglia risolvere il problema y 00 + ! 2 y = f (x) y(0) = y(⇡) y 0 (0) = y 0 (⇡).

0 >

> > :(! sin !⇡)c1 + !(1

(e↵⇡ 1) (↵2 + ! 2 )

cos !⇡)c2 =

↵(e↵⇡ 1) , (↵2 + ! 2 )

che ammette un’unica soluzione, determinabile esplicitamente con la regola di Cramer. a, in generale, alSe invece ! 2 = 4n2 (per qualche intero n) il problema non avr` cuna soluzione. Sia, per fissare le idee, ! 2 = 16, e consideriamo ancora f (x) = e↵x . I primi membri delle equazioni (2.77) sono nulli (la matrice ha rango 0); perci` o anche i secondi membri devono essere nulli; ci` o accade se ↵ = 2ki (k 2 Z) perch´e e2k⇡i = 1; scarteremo il valore ↵ = 4i perch´e altrimenti sarebbe ↵2 + ! 2 = 0 (in tal caso va scelto un altro integrale particolare dell’equazione). Si osservi che, per ↵ = 2ki, il termine noto dell’equazione, f (x) = e2kix , `e anch’essa una funzione ⇡-periodica. Dunque, se ! 2 = 4n2 (per un certo n) e il termine noto f (x) `e della forma e2kix (con k2 6= n2 ) il nostro problema ammette soluzione; anzi, ne ammette infinite, della forma: e2kix y(x) = c1 cos 2nx + c2 sin 2nx + . 4(n2 k2 ) Complementi con esercizi 1. Diagonalizzare le seguenti matrici, dopo aver verificato che ci` o `e possibile



◆ 4 1 0 2



0

◆ 1 1 5 3

4 2 @ 5 3 2 4

1 2 2A 1

2. Trovare gli autovalori della matrice simmetrica:

0

0 B0 B @1 0

0 1 0 0

1 0 0 0

1 0 0C C; 0A 1

trovare un sistema ortogonale di 4 autovettori; diagonalizzare la matrice. 3. Se A =

31 11

, mostrare che non esiste alcuna matrice 2 ⇥ 2 non singolare S tale che S AS `e diagonale; trovare una matrice non singolare S tale che S 1 AS sia in forma di Jordan. 1

2. Equazioni lineari

c 978-88-08-63708-6

251

4. Calcolare la matrice eA se A ` e della forma:

a)



◆ 0 1 0 0

b)



0 1

◆ 1 0

5. Mostrare, utilizzando la definizione (2.19) di norma di una matrice, che lo spazio M (n⇥n)

delle matrici quadrate di ordine n `e completo. 6. Ricordiamo che due norme, k·k1 e k·k2 , definite sullo stesso spazio lineare X, si dicono

equivalenti se esistono due costanti positive c1 e c2 tali che c1 kxk2  kxk1  c2 kxk2

8x 2 X

(Esercizio 19, Sez. 1, Cap. 3). i) Mostrare che la seguente `e una buona definizione di norma nello spazio delle matrici quadrate M (n ⇥ n): kAk1 = sup |Ax| |x|=1

(di fatto, l’estremo superiore che compare nella definizione `e un massimo). ii) Mostrare che la norma sopra definita e quella definita dalla (2.19) sono equivalenti. 7. Risolvere (cio` e trovare la soluzione generale) le seguenti equazioni a coefficienti costanti (esprimere la soluzione in forma reale):

i) ii) iii) iv)

z 000 + 6z 00 + 11z 0 + 6z = 0; z 000 + 3z 00 = 0; z (4) + 2z 00 + z = 0; z (6) 3z (4) + 3z 00 z = 0.

8. Trovare un sistema fondamentale di soluzioni per i seguenti sistemi a coefficienti costanti:

(

z10 = z1 + 4z2 i) z20 = 4z1 z2 8 0 z1 = z3 (Esercizio 2) > > >

z = z 1 > 3 > : 0 z4 = z4 8 2 0 > >

> : 0 z3 = 3z2 + 4z3 .

8

: 0 z3 = 6z1

11z2 + 6z3

9. Metodo di eliminazione

u laboriosa della Poich´e la risoluzione di un sistema di n equazioni (del 1 ordine) `e pi` risoluzione di una singola equazione (di ordine n), pu` o essere conveniente talvolta cercare di ricondursi dal sistema all’equazione singola per “eliminazione delle incognite”. Illustriamo il metodo con un esempio.

252

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Si voglia risolvere il sistema: (

z10 = z1 + z2 z200 = z10 + 4z1 + 2z2 .

Si potrebbe introdurre una terza incognita z3 = z20 e scrivere il sistema nella solita forma: 8 0 >

: 0 z3 = 3z1 + z2 .

Ricaviamo z2 dalla prima equazione: z2 = z10 z1 e sostituiamo questa nella seconda; otteniamo z100 z10 = z3 . Derivando entrambi i membri e usando la terza equazione si trova: z1000

z100 = 3z1 + z2 ,

cio`e (2.78)

z1000

z100

z10

2z1 = 0.

Abbiamo cos`ı “eliminato” l’incognita z2 ; la (2.78) ha le tre soluzioni: p 3 1 1 +i , 3= e 1 t , e 2 t , e 3 t con 1 = 2, 2 = 2 2 2

i

p 3 . 2

Trovata l’incognita z1 si determinano poi z2 = z10 z1 e z3 = z20 . Questo metodo `e utile solo per piccoli sistemi: esso diventa rapidamente assai laborioso. 10.

i)

(

Risolvere, col metodo di eliminazione, i seguenti sistemi: ( z10 + z1 + z20 = 0 z10 + 2z1 4z2 = 0 ii) 0 0 z1 + 2z2 2z2 = 0 z100 z1 + z200 + z2 = 0.

[Suggerimento per ii): si derivi la prima equazione ricavando: z100 + z200 = z10 ; tenendo conto di questa relazione, dalla seconda si ricava z2 = z10 + z1 ; sostituendo questa nella prima . . . ] Si tenga presenta che derivando un’equazione se ne ottiene una non equivalente a quella data. Occorre dunque in generale una verifica a posteriori dei risultati ottenuti. 11. Riduzione dell’ordine

La soluzione di un sistema omogeneo di n equazioni pu` o essere ricondotta alla soluzione di un sistema omogeneo di n 1 equazioni qualora si conosca un integrale particolare del sistema; la stessa a↵ermazione vale ovviamente anche per le equazioni di ordine n. i) Si dimostri l’asserto per le equazioni del 2 ordine, applicando il metodo della variazione delle costanti arbitrarie; cio`e, se '(t) `e una soluzione (non nulla) dell’equazione z 00 = a1 (t)z 0 + a2 (t)z, si cerchi un’altra soluzione, indipendente da ', nella forma: (t) = c(t)'(t). [Soluzione: una soluzione, linearmente indipendente da ', `e data da: R Z exp( a1 (t)dt) dt.] (t) = '(t) '(t)2 **ii) Si dimostri l’asserto per le equazioni di ordine n e per i sistemi.

2. Equazioni lineari

c 978-88-08-63708-6

253

` interessante notare che un’equazione del 2 12. E

ordine lineare omogenea si pu` o sempre ricondurre a una del 1 ordine non lineare: precisamente, a una di Riccati. Si mostri infatti che, data l’equazione: z 00 = a1 (t)z 0 + a2 (t)z, e posto y = z 0 /z, la nuova incognita y soddisfa l’equazione y 0 = y 2 + a1 (t)y + a2 (t). 13. Data l’equazione: (2t2

1)z 00 +(z tz 0 )(2+4t2 ) = 0, si osservi che '(t) = t `e un integrale particolare. Trovare l’integrale generale.

14. Risolvere le seguenti equazioni: 2 000

i) t z

iii) t2 z 00

+ tz

0

z = 0;

ii)

(

tz10 = z2 tz20 = 2z1 + 3z2 ;

iv) t2 z 00

z = 0;

3tz 0 + 4z = 0.

15. Risolvere le seguenti equazioni:

i) ii) iii) iv) v)

y 00 + 9y = 2 et ; y 00 + 4y = tg t; y 000 y = t et ; y (4) y = sin t + cos t; y 00 + y = log t.

(Per la ricerca di un integrale particolare, ricorrere al metodo di variazione delle costanti arbitrarie solo dopo aver esaurito la fantasia). 16. Risolvere i sistemi:

(

y10 y1 + y2 = 2 i) y20 y2 + y1 = t 8 0 >

: 0 y3 = 6y1 11y2

ii)

6y1 + e

(

y10 y2 = et y20 + y1 = sin t

t

.

17. Vibrazioni libere

Un problema di fondamentale interesse in Meccanica `e quello di calcolare il movimento di un punto materiale P soggetto a una forza elastica attrattiva (cio`e a una forza centrale proporzionale alla distanza dal centro O come, per esempio, quella esercitata da una molla). Come `e noto (o come `e facile dimostrare), se la velocit` a del punto `e radiale, cio`e diretta come la retta OP , il movimento si svolge su questa retta; fissata su di essa l’origine (in O) e un verso, detta y(t) l’ascissa di P all’istante t, l’equazione del moto del punto `e: m¨ y=

ky

cio`e: y¨ + ! 2 y = 0

(2.79) avendo posto ! =

p

k/m, dove k > 0 `e la costante della molla, m la massa del punto.

254

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

y

O

Figura 4.15. Forza proporzionale all’allungamento (y) della molla.

L’integrale generale della (2.79) `e: '(t) = c1 cos !t + c2 sin !t (c1 , c2 costanti arbitrarie), che si pu` o anche scrivere nella forma, pi` u significativa (2.80)

'(t) = A cos(!t + ↵),

dove A e ↵ sono costanti arbitrarie che possono essere determinate assegnando la posizione e la velocit` a iniziali del punto. Questo esegue infinite oscillazioni di periodo 2⇡/!, di ampiezza ! `e detta A, mentre ↵ rappresenta la fase iniziale. Il moto `e detto armonico; la frequenza 2⇡ frequenza caratteristica dell’oscillatore. Si parla, in questo caso, di oscillazioni libere. 18. Vibrazioni smorzate

Se sul punto P agisce, oltre alla forza elastica, anche una resistenza di tipo viscoso, cio`e proporzionale alla velocit` a (per esempio, la resistenza dell’aria), allora l’equazione del moto `e: m¨ y = ky hy, ˙ che pu` o scriversi: (2.81)

y¨ + 2 y˙ + ! 2 y = 0,

avendo posto = h/2m; questo parametro, positivo, rappresenta la resistenza del mezzo al moto del punto. L’equazione caratteristica della (2.81): 2 + 2 + ! 2 = 0 possiede le due radici p p 2 2 + !2 , 2 = !2 . 1 = Si presentano i seguenti tre casi:

i) > ! (resistenza elevata). Le radici generale di (2.81) `e: (2.82)

1

'(t) = c1 e

e

1t

2

sono reali negative,

+ c2 e

1

6=

2.

L’integrale

2t

Il moto non `e oscillatorio. Il lettore verifichi le seguenti a↵ermazioni. a iniziale; Si assuma che il punto si trovi inizialmente in y e abbia una assegnata velocit` se tale velocit` a `e centrifuga, la y raggiunge (in valore assoluto) un massimo e poi decresce tendendo asintoticamente a zero (Fig. 4.16a); se la velocit` a iniziale `e centripeta e grande (precisare quanto grande!) il punto passa una volta per l’origine, procede oltre fino a un certo limite e poi inverte il moto, tendendo asintoticamente verso il centro (Fig. 4.16b); se la velocit` a iniziale `e centripeta e piccola, il punto tende asintoticamente verso il centro senza eseguire alcuna oscillazione (Fig. 4.16c).

2. Equazioni lineari

c 978-88-08-63708-6

y

y

255

y y

y

y t

t

a)

t

b)

c)

Figura 4.16. Vibrazioni smorzate.

ii)

= !. Allora

1

=

2

=

< 0. L’integrale generale di (2.81) `e: '(t) = (c1 + c2 t)e

(2.83)

t

,

ancora il moto non `e oscillatorio; il comportamento `e simile a quello discusso in i). p + i⌫, 2 = i⌫, ⌫ = ! 2 iii) < ! (resistenza debole). Abbiamo 1 = L’integrale generale della (2.81) si pu` o scrivere nella forma: (2.84)

'(t) = Ae

t

2.

cos(⌫t + ↵),

con A, ↵ costanti arbitrarie. Il punto mobile esegue infinite oscillazioni attorno al centro, 1 p 2 t 2 e di ampiezza Ae ! ; l’ampiezza delle oscillazioni diventa dundi frequenza 2⇡ que sempre pi` u piccola col passare del tempo e il punto tende asintoticamente all’origine (Fig. 4.17). Si parla, in tal caso, di oscillazioni smorzate. y

y t

Figura 4.17. Oscillazioni smorzate.

Riassumendo, l’e↵etto principale della viscosit` a `e quello di smorzare o addirittura di eliminare le oscillazioni, e il punto P tende asintoticamente alla sua posizione di equilibrio naturale (il centro O). 19. Vibrazioni forzate. Risonanza

Supponiamo che sul punto P agisca, oltre alla forza elastica e alla resistenza viscosa, anche una forza impressa dall’esterno, diretta come l’asse y, cosicch´e il moto permane rettilineo.

256

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

L’equazione del moto `e ora non omogenea: m¨ y = ky hy˙ + F (t); ponendo f (t) = F (t)/m (e adottando le stesse notazioni gi` a introdotte in (2.76) e (2.78)) l’equazione prende la forma: y¨ + 2 y˙ + ! 2 y = f (t).

(2.85)

La soluzione generale della (2.85) `e del tipo: y(t) = '(t) + (t) dove '(t) `e l’integrale generale dell’omogenea associata e della (2.85). Consideriamo un caso tipico: (2.86)

(t) `e una soluzione particolare

f (t) = B cos t.

Se = 0 la forza impressa `e costante; altrimenti `e armonica (cio`e periodica semplice) con frequenza /2⇡. i) Supponiamo dapprima che la resistenza sia nulla ( = 0). Allora un integrale particolare della (2.85) `e (verificare!):

(2.87)

(t) =

8 B > > > < !2

2

cos t

> > > : B t sin !t 2!

se

6= !

se

= !.

Pertanto, alle oscillazioni libere, rappresentate da '(t) in (2.80), si sovrappongono delle oscillazioni forzate, rappresentate da (t) in (2.87); queste sono di ampiezza costante = 2 ) se 6= !. Il caso interessante si ha quando la forza impressa oscilla con la B/(! 2 stessa frequenza caratteristica dell’oscillatore (! = ); allora le oscillazioni forzate hanno un’ampiezza (tB/2!) che si amplifica col tempo, crescendo oltre ogni limite; `e questo il fenomeno della risonanza (Fig. 4.18). ii) Sia ora > 0. Allora un integrale particolare della (2.85) `e: (2.88)

(t) = B⇢ cos( (t

⌧ )),

dove si `e posto

(2.89)

⇢= p

1 (! 2

2 )2

+4

2 2

,

tg ⌧ =

2 !2

2

(si osservi che la (2.88) `e ora un integrale particolare della (2.85) qualunque sia il valore di ).

2. Equazioni lineari

c 978-88-08-63708-6

257

t

Figura 4.18. Risonanza.

Dalla discussione svolta in 18. sappiamo che l’integrale generale della omogenea, '(t), tende esponenzialmente a zero per t ! +1; perci` o, dopo un transitorio iniziale, la situazione di regime `e descritta dall’integrale particolare (t). Dalla (2.88) ricaviamo perci` o che il moto a regime `e armonico, con lo stesso periodo 2⇡/ della forza impressa, con ampiezza B⇢ costante (dipendente dai vari parametri del sistema) e con ritardo di fase ⌧ rispetto alla forza ` interessante osservare come varia l’ampiezza B⇢ di queste oscillazioni forzate al impressa. E variare della frequenza di eccitazione (per p valori fissati di !, , B); bisogna studiare cio`e la funzione ⇢ = ⇢( ). Si p osserva che, se < !/ 2 (resistenza debole) la funzione ⇢( ) presenta un massimo per = ! 2 2 2 e tale massimo `e ⇢max =

1 p 2 !2

2

.

Appare cio`e ancora il fenomeno della risonanza. Rispetto alla situazione descritta in i) ( = 0) si osserva che ora la risonanza compare quando la frequenza di eccitazione `e “vicina” (ma non uguale) a quella p caratteristica ! e l’ampiezza delle oscillazioni forzate rimane limitata. Se invece !/ 2 la funzione ⇢( ) `e decrescente e non si ha risonanza (Fig. 4.19b). r(g)

r(g)

1 w

1 w 0

Vw2 – 2d2 a)

Figura 4.19. a)

p < !/ 2. b)

g p !/ 2.

g

0 b)

258

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

20. Si consideri un circuito elettrico costituito da una resistenza R, un’induttanza L, un

condensatore di capacit` a C, a cui sia applicata una forza elettromotrice variabile V (t), (Fig. 4.20). R C

V(t) L Figura 4.20. Circuito LRC.

La di↵erenza di potenziale ai capi del condensatore `e soluzione della seguente equazione: CL¨ y + CRy˙ + y =

V (t).

Il lettore interessato pu` o rivedere tutta la discussione svolta in 17, 18, 19, e reinterpretare i parametri nei termini adatti alla nuova situazione. 21. Trovare autovalori e autofunzioni dei seguenti problemi ai limiti:

z¨ + ! 2 z = 0 ( z(0) = 0 i) z(⇡) = 0

ii)

(

z(0) ˙ =0 z(⇡) ˙ =0

iii)

(

z(0) = 0 z(⇡) = z(⇡). ˙

22. Considerare i problemi ai limiti non omogenei:

y¨ + ! 2 y = f (t) ( y(0) = k1 i) y(⇡) = k2

ii)

(

y(0) ˙ = k1 y(⇡) ˙ = k2

iii)

(

y(0) = k1 y(⇡) y(⇡) ˙ = k2 .

Esprimere le condizioni di compatibilit` a sui dati f (t), k1 , k2 affinch´e il corrispondente problema abbia soluzione. 23. Discutere la risolubilit` a del seguente problema ai limiti:

y¨ + ! 2 y = f (t),

y(0) = y(⇡),

Z



y(t)dt = k. 0

Delle due condizioni supplementari, una `e del tipo “ai limiti”, l’altra `e del tipo “integrale”; la discussione pu` o essere svolta secondo lo stesso schema illustrato nel Paragrafo 2.7.

3.

` SISTEMI AUTONOMI. STABILITA

3.1 Generalit` a sui sistemi autonomi Consideriamo un sistema autonomo del tipo (3.1)

y˙ = f (y),

con f localmente lipschitziana in un aperto ⌦ di Rn . Vale perci` o il Teorema 1.2 di esistenza e di unicit` a locale.

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

259

Come gi` a accennato alla fine del Paragrafo 1.2 il fatto che f non dipenda esplicitamente dalla variabile t consente di analizzare le soluzioni di (3.1) attraverso le loro immagini nello spazio del vettore di stato y, lo spazio delle fasi. Data una curva soluzione t 7! ' (t) chiameremo orbita, traiettoria o caratteristica l’immagine di ' . Salvo avviso contrario supporremo che ' sia definita nel suo intervallo massimale J' . A volte si considera solo l’immagine di ' per t ⌧ o per t  ⌧ , (⌧ 2 J' ) nel qual caso parleremo di semi-orbita a destra o a sinistra rispettivamente. Occorre evitare di confondere le soluzioni con le orbite. Esempio 3.1 La curva t 7! (cos t, sin t), un’elica cilindrica nello spazio (t, y1 , y2 ), `e soluzione del sistema ( y˙ 1 = y2 (3.2) y˙ 2 = y1 .

Orbita

Soluzione

y2

t y1

Figura 4.21. Orbita del sistema (3.2).

L’orbita corrispondente sul piano delle fasi (il piano t = 0) `e la circonferenza unitaria con centro in (0, 0), (Fig. 4.21). In questo paragrafo illustriamo le propriet` a principali delle traiettorie dei sistemi autonomi attraverso una serie di proposizioni. PROPOSIZIONE 3.1 Sia ' una soluzione di (3.1) definita in J' = (⌧1 , ⌧2 ), ⌧1 , ⌧2 2 R⇤ . Allora, per ogni c 2 R, anche (t) := ' (t + c) `e soluzione, definita in J = (⌧1 c, ⌧2 c): la traslata nel tempo di una soluzione `e ancora soluzione. '(t + c)) = f ( (t)), t 2 (⌧1 Dimostrazione. Si ha: ˙ (t) = '˙ (t + c) = f ('

PROPOSIZIONE 3.2 Siano ' e (3.3)

due soluzioni tali che ' (t1 ) =

con t1 2 J' , t2 2 J . Allora ' (t) =

(t + t2

(t2 ) t1 ) in J' .

c, ⌧2

c).



260

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Dimostrazione. Per la Proposizione 3.1, (t) := (t + t2 t1 ) `e soluzione di (3.1). Inoltre (t1 ) = (t1 + t2 t1 ) = (t2 ) = ' (t1 ). Dunque e ' soddisfano lo stesso problema di ⇤ Cauchy e quindi coincidono su J' .

Le due proposizioni precedenti implicano le seguenti propriet` a delle traiettorie: a) Un’orbita corrisponde a una famiglia di soluzioni del tipo ' = ' (t + c), c 2 ` dunque fissata un’orientazione R, traslate nel tempo di una soluzione data. E dell’orbita, comune a tutte le soluzioni corrispondenti. b) Due orbite non possono intersecarsi. La regione ⌦ dello spazio delle fasi risulta pertanto unione di orbite disgiunte. Si noti che le Proposizioni 3.1 e 3.2 non sono valide per sistemi non autonomi e per questo l’analisi nello spazio delle fasi risulta poco efficace. Traiettorie di particolare importanza sono le seguenti. DEFINIZIONE 3.1 Se y0 2 ⌦ `e tale che f (y0 ) = 0, allora y0 si chiama punto di equilibrio (o punto critico o punto singolare) per il sistema (3.1). Esso costituisce l’orbita della soluzione costante ' (t) = y0 . Se il sistema si trova in uno stato di equilibrio vi rimane per sempre. Una soluzione pu` o tendere a un punto di equilibrio per t ! ±1; non pu` o mai raggiungerne alcuno in un tempo finito T , altrimenti si avrebbero due orbite passanti per uno stesso punto. Viceversa, se ' (t) ! y0 per t ! ±1, allora y0 `e punto di equilibrio (Esercizio 1). Esempio 3.2 Nel modello logistico (Esempio 1.2) vi sono due punti di equilibrio: N (t) = 0 e N (t) = k = capacit` a dell’ambiente. Se 0 < N0 < k, N (t) ! k per t ! +1. Nel modello di Lotka-Volterra (1.4) l’unico punto di equilibrio `e (c/d, a/b). Di fondamentale importanza sono le soluzioni ' = ' (t) periodiche, ossia tali che esiste T > 0 tale che ' (t + T ) = ' (t), 8 t 2 R, ma ' (t + s) 6= ' (t) per s 2 (0, T ). In questo caso T si chiama periodo minimo e la traiettoria descritta `e una curva semplice e chiusa o ciclo (Esempio 3.1). La seguente proposizione implica che le traiettorie possono essere solo di tre tipi: punti di equilibrio, cicli, curve semplici non chiuse. Non vi sono orbite (non chiuse) che si autointersechino. Inoltre ogni curva semplice e chiusa non contenente punti di equilibrio corrisponde a soluzioni periodiche. PROPOSIZIONE 3.3 Sia ' una soluzione di (3.1) non costante. Se esistono t1 , t2 2 J' tali che ' (t1 ) = ' (t2 ), allora J' = R e ' `e periodica. Dimostrazione. Sia J' = (⌧1 , ⌧2 ). Le due soluzioni '(t) e (t) = '(t + t2 t1 ) soddisfano la condizione ' (t1 ) = (t1 ) = ' (t2 ) e pertanto coincidono. , ⌧2 ) dove = t2 t1 . Se, per esempio, > 0, La soluzione `e definita in (⌧1 , ⌧2 ). Deve dunque essere ⌧1 = 1 e risulta un prolungamento di ' all’intervallo (⌧1 ⌧2 = +1. Essendo poi ' (t) = (t) = ' (t + ), segue che `e un periodo per ' . Sia P l’insieme dei periodi di ' e T := inf P. Se T = 0 allora 8 " > 0 esiste un periodo , 0 < < ". Fissato un qualunque numero reale c > 0 sia m 2 N tale che (m 1) < c  m .

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

261

Allora 0 < m c < < ". Essendo m un periodo, allora m 2 P e c risulta un punto di accumulazione per P. Poich´e ' `e continua, P `e un insieme chiuso in R e pertanto c 2 P. Poich´e ogni reale positivo c `e un periodo, ' `e costante, contro le ipotesi. Allora T > 0 e ' `e ⇤ periodica con periodo T .

Concetti fondamentali sono quelli di derivata lungo una traiettoria del sistema (o derivata di Lie) e di integrale primo o costante del moto. Sia E : ⌦ ! R, E 2 C 1 (⌦). Se ' = ' (t) `e una soluzione del sistema (3.1), `e ben '(t)), si ha: '(t)), t 2 J' . Essendo '˙ (t) = f (' definita la funzione E(' (3.4)

˙ '(t)) = hrE(' '(t)), '˙ (t)i = hrE(' '(t)), f (' '(t))i. E('

˙ 0 ) dipende solo da y0 e non dai valori che la La (3.4) indica che se y0 = ' (t0 ), E(y soluzione assume in un intorno di t0 . Hanno senso dunque le seguenti definizioni. DEFINIZIONE 3.2 Sia E : ⌦ ! R, ⌦ aperto in Rn , E 2 C 1 (⌦). a) La derivata di E lungo le traiettorie del sistema (3.1) `e definita dalla formula (3.5)

˙ E(y) := hrE(y), f (y)i,

y 2 ⌦.

˙ b) Se E(y) = 0 per ogni y 2 ⌦, E si chiama integrale primo o costante del moto per il sistema 3.1.

Esempi 3.3 Per un sistema conservativo a un grado di libert` a, y¨ = dU/dy, equivalente al sistema y˙ 1 = y2 , y˙ 2 = dU/dy1 , la funzione energia E(y1 , y2 ) = y22 /2 + U (y1 ) `e un integrale primo come gi` a osservato nell’Esempio 1.18. 3.4 Sia H = H(p1 , . . . , pn ; q1 , . . . , qn ) una funzione reale di classe C 2 (R2n ). Il sistema di 2n equazioni (sistema hamiltoniano)15 8 @H > >

> :q˙i = @pi ha la funzione H come integrale primo. Infatti: ✓ ◆ n  X @H @H @H @H ˙ H(p1 , . . . , pn ; q1 , . . . , qn ) = + @pi @qi @qi @pi i=1

3.5 Il sistema di Lotka-Volterra (1.4) ha come integrale primo (3.7)

15 William

E(x, y) =

c log x + dx

R. Hamilton (1805-1865), irlandese.

a log y + by.

= 0.

262

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Infatti, moltiplicando la prima delle (1.4) per ( c + dx) e la seconda per (a sottraendo si trova: ✓ ◆ ⌘ ⇣ c a d + d x˙ b y˙ = [ c log x + dx a log y + by] 0= x y dt

by) e

e quindi E˙ = 0.

Le seguenti propriet` a caratterizzano un integrale primo. PROPOSIZIONE 3.4 E `e un integrale primo per il sistema (3.1) se e solo se ogni orbita `e interamente contenuta in un unico insieme di livello di E o, equivalentemente, se e solo se E `e costante su ogni soluzione del sistema. Lasciamo la dimostrazione per esercizio. Come conseguenza, se il sistema ammette un integrale primo i cui insiemi di livello sono limitati in Rn le soluzioni esistono in tutto R. Infatti: PROPOSIZIONE 3.5 Se la semi-orbita destra (risp. sinistra) `e contenuta in un compatto, la soluzione corrispondente `e prolungabile a +1 (risp. a 1). Per la dimostrazione si veda l’Esercizio 3. Un’analisi completa di un sistema autonomo consiste nel fornire un quadro generale dell’andamento delle traiettorie: tale quadro si chiama ritratto di fase del sistema. Particolare interesse riveste l’esistenza di orbite chiuse (soluzioni periodiche) o di punti di equilibrio e lo studio, nelle vicinanze di questi ultimi, del comportamento delle altre traiettorie. Nel prossimo paragrafo vedremo alcuni esempi di applicazione dei concetti precedenti. Terminiamo con un’osservazione. Ogni sistema non autonomo y˙ = f (t, y) pu` o trasformarsi in autonomo ponendo yn+1 = t e aggiungendo l’equazione fittizia y˙ n+1 = 1. Dunque, i concetti illustrati in questo paragrafo valgono per il nuovo sistema. Naturalmente si `e perso il vantaggio di poter ragionare in uno spazio a n, anzich´e n + 1, dimensioni. 3.2 Sistemi bidimensionali. Alcuni esempi Un sistema bidimensionale autonomo ha la forma ( x˙ = F (x, y) (3.8) y˙ = G(x, y), o dove F, G sono localmente lipschitziane in un aperto ⌦ ✓ R2 . Il ritratto di fase si pu` descrivere in molti casi usando semplici metodi geometrici basati sulle osservazioni seguenti. I punti di equilibrio sono le soluzioni del sistema F (x, y) = G(x, y) = 0. Nell’intorno di un punto regolare (non di equilibrio), al sistema (3.8) `e associata l’equazione di↵erenziale (ottenuta eliminando t dalle due equazioni del sistema) G(x, y) dy = dx F (x, y)

(F (x, y) 6= 0),

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

263

oppure dx F (x, y) = dy G(x, y)

(G(x, y) 6= 0).

Ogni soluzione dell’equazione di↵erenziale coincide (almeno localmente) con una traiettoria del sistema e viceversa. Si noti che nei punti regolari in cui G(x, y) = 0 o F (x, y) = 0 la direzione del campo vettoriale (F, G), tangente all’orbita, `e orizzontale o verticale, rispettivamente. Studiando i segni di F e di G si pu` o poi ripartire il piano delle fasi nelle zone di crescenza o decrescenza per x e y, determinando cos`ı anche il verso di percorrenza sulle orbite. Se infine `e noto un integrale primo E del sistema, allora le orbite sono descritte dalla famiglia E(x, y) = c degli insiemi di livello di E. Esempio 3.6 Analisi del sistema di Lotka-Volterra (1.4). Abbiamo visto nell’Esempio 3.5 che E(x, y) =

c log x + dx

a log y + by,

`e un integrale primo. Essendo @ 2 E/@x2 = c/x2 ,

@ 2 E/@y 2 = a/y2 e @ 2 E/@x@y = 0,

si ha che E `e strettamente convessa in R2+ . Inoltre @E/@x = c/x+d = 0 per x = c/d e @E/@y = a/y + b = 0 per y = a/b. Quindi il punto di equilibrio (c/d, a/b) `e di minimo globale per E. Osserviamo inoltre che E(x, y) ! +1 quando x oppure y tendono a 0 oppure a +1. Si deduce allora che, per k > E(c/d, a/b), gli insiemi di livello {(x, y) 2 R2+ : E(x, y) = k} sono curve chiuse regolari che contengono il punto di equilibrio (c/d, a/b) nel loro interno. L’evoluzione della coppia x(t), y(t) `e di conseguenza periodica con un periodo minimo T che dipende da k. Il ritratto di fase `e indicato in Figura 4.22; in Figura 4.23 `e illustrato l’andamento tipico di x = x(t) e y = y(t). Lo studio dei segni di a by e c + dx indica che il verso di percorrenza sulle orbite `e antiorario. Possiamo ora rispondere alla questione relativa alla pesca nel mare Adriatico posta nell’Esempio 1.3 Anzitutto osserviamo che, essendo x(0) = x(T ) e y(0) = y(T ), si ha: Z

0

e, analogamente

T

x˙ dt = [log x(t)]T0 = log x(T ) x Z

0

T

y˙ dt = 0. y

log x(0) = 0.

264

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Figura 4.22. Esempi di orbite del sistema di Lotka-Volterra (a = b = c = d = 1).

Figura 4.23. Grafici di una soluzione del sistema di Lotka-Volterra: x = x(t) (linea continua) y = y(t) linea tratteggiata.

Integrando ora entrambi i membri delle (1.4) si ottiene: 0=

Z

T

(a

by)dt = aT

b

0

0=

Z

Z

T

0

T

( c + dx)dt =

cT + d

0

y(t)dt Z

T

x(t)dt,

0

ovvero (3.9)

1 T

Z

0

T

y(t)dt =

a , b

1 T

Z

0

T

x(t)dt =

c . d

Le formule (3.9) indicano che le coordinate a/b e c/d del punto di equilibrio han` no anche il significato di densit` a media della popolazione nell’arco di un periodo. E interessante osservare che questi valori medi sono comuni a tutte le orbite. Una diminuzione della pesca: • • •

aumenta il tasso di crescita di x; invece di a si ha a + "; riduce il tasso di diminuzione di y; da c si passa a c ⌘; lascia inalterati i coefficienti b, d di interazione tra le specie.

I numeri (3.9) diventano allora (a+")/b per i predatori, che cos`ı registrano un aumento medio e (c ⌘)/d per le prede, che registrano una diminuzione media.

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

265

La conclusione, nota come “principio di Volterra”, `e valida in molti altri casi, per modelli anche pi` u realistici del sistema (1.4). Alcune varianti sono indicate negli esercizi. Esempio 3.7 Moto di un pendolo senza attrito. Un corpo (puntiforme) di massa m `e appeso all’estremit` a di un’asta rigida, di massa trascurabile e lunghezza l. L’asta `e fissata all’altra estremit` a a un perno ed `e libera di ruotare senza attrito in un piano verticale, soggetta alla sola forza gravitazionale (Fig. 4.24). L’equazione (di Newton) del moto `e ml'¨ = mg sin ' ossia, ponendo k = g/l, (3.10)

'¨ =

k sin '.

˙ Alla (3.10) `e associato il sistema (z1 = ', z2 = '): ( z˙1 = z2 z˙2 = k sin z1 . I punti di equilibrio sono infiniti e hanno coordinate (⌫⇡, 0), ⌫ 2 Z. La periodicit` a di sin z1 indica che `e sufficiente limitarsi a considerare z1 2 [ ⇡, ⇡]. j l l 0

j

mg

Figura 4.24. Moto di un pendolo.

Essendo il sistema conservativo, la funzione energia E(z1 , z2 ) =

1 2 z + (k 2 2

k cos z1 )

`e un integrale primo (Esempio 3.3). Incidentalmente osserviamo che l’energia potenziale U (z1 ) = k k cos z1 `e non negativa e quindi le soluzioni sono definite su tutto R. Le orbite sono descritte dalla famiglia degli insiemi di livello dell’energia 1 2 z + (k 2 2

k cos z1 ) = c

c

0,

266

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

U(z1)

E = c3 E = 2k

U(z1) = k – k cos z1 E = c2 E = c1 –p

0

p

z1

E = c3 E = 2k

z1 E = c2

E = 2k E = c3

Figura 4.25. Energia potenziale e orbite per il moto del pendolo senza attrito.

che si pu` o risolvere rispetto a z2 , ottenendo p (3.11) z2 = ± 2(c k + k cos z1 ).

Si distinguono allora i casi seguenti.

1. c = 0; `e questo il livello minimo di energia e le (3.11) si riducono al punto di equilibrio (0, 0). 2. 0 < c < 2k; ogni coppia di equazioni (3.11) individua una traiettoria chiusa attorno all’origine. Questi livelli di energia corrispondono al moto oscillatorio intorno alla posizione di equilibrio (0, 0). 3. c = 2k; ogni coppia di equazioni (3.11) individua una curva chiusa nel piano contenente quattro orbite: i due punti di equilibrio (±⇡, 0) e altre due orbite che li connettono che si chiamano eterocline e corrispondono a un avvicinamento (in tempo infinito) del pendolo alla posizione di equilibrio verticale sopra il perno. 4. c > 2k; ciascuna delle (3.11) individua un’orbita non chiusa. Questi livelli di energia corrispondono al moto di rivoluzione completa del pendolo. La configurazione generale delle orbite `e indicata in Figura 4.25. Il verso di percorrenza `e determinato (per esempio) dal fatto che z˙1 = z2 > 0 per z2 > 0.

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

267

3.3 Il concetto di stabilit` a In questo paragrafo presentiamo alcuni classici risultati relativi alla stabilit` a di una soluzione di un sistema autonomo. Il concetto di stabilit` a `e tra i pi` u importanti sia a livello teorico sia a livello applicativo. L’idea essenziale `e la seguente. Supponiamo che un sistema del tipo y˙ = f (y) modelli l’evoluzione nel tempo di un determinato fenomeno. Al sistema `e associato solitamente un altro tipo di informazione sotto forma, per esempio, di dati iniziali o ai limiti. Tra i dati del problema `e da considerarsi anche f . Ora, una variazione dei dati produce una variazione nella soluzione ed `e cos`ı definita un’applicazione del tipo dati 7! soluzione.

La stabilit` a `e sostanzialmente una sorta di continuit` a di questa corrispondenza: un piccolo cambiamento sui dati produce un cambiamento piccolo (o controllabile) sulla soluzione. ` evidente l’importanza della stabilit` E a, per esempio nel funzionamento di ogni meccanismo, dove essa va letta come insensibilit` a a perturbazioni pi` u o meno grandi delle condizioni di lavoro. I teoremi di dipendenza continua del Paragrafo 1.5 possono essere considerati dei risultati di stabilit` a. Essi, tuttavia, hanno validit` a solo su intervalli di tempo finiti. La considerazione di tempi illimitati si rende necessaria quando si vogliano considerare tempi lunghi o di regime. I risultati di questo paragrafo vanno letti in questa direzione. Tra le varie definizioni di stabilit` a illustriamo qui quella dovuta a Liapunov16 . y2

y2

e

d

y1

j= 0

t

y1

Figura 4.26. Stabilit` a della soluzione ' = 0.

Sia ' = ' (t; 0, ⇠) una soluzione del sistema (3.1) definita nell’intervallo massimale destro J'+ , che possiamo sempre supporre sia [0, +1). DEFINIZIONE 3.3 La soluzione ' (t; 0, ⇠) si dice stabile (secondo Liapunov) se per ogni " > 0 esiste = (") tale che: se |⌘ | (t)

⇠| < allora la soluzione (t) = ' (t)| < " per ogni t 2 [0, +1).

16 Alexander

(t; 0, ⌘) `e definita in [0, +1) e

Mikhailovich Liapunov (1857-1918), matematico e ingegnere russo.

268

CAPITOLO 4. Equazioni di↵erenziali ordinarie

Se ' `e stabile e inoltre | (t) stabile.

c 978-88-08-63708-6

' (t)| ! 0 per t ! +1, ' si dice asintoticamente

In parole povere: • •

stabile significa che, se si parte abbastanza vicino a ⇠, si rimane per tutto il tempo vicino alla soluzione ' (t; 0, ⇠), (Fig. 4.26); asintoticamente stabile significa che non solo ci si mantiene vicino a ' (t; 0, ⇠), ma la distanza da ' tende a zero all’infinito.

Se una soluzione ' (t; 0, ⇠) non `e stabile si dice instabile; ci` o significa essenzialmente che esistono soluzioni che partono vicino quanto si vuole a ⇠ ma non rimangono per sempre vicino a ' (t; 0, ⇠). Analoghe definizioni si possono dare quando interessi il comportamento per t ! 1 anzich´e per t ! +1. Particolarmente importante `e lo studio della stabilit` a dei punti di equilibrio ' (t) = y0 , f (y0 ) = 0. Se un punto di equilibrio y0 `e asintoticamente stabile, si chiama bacino di attrazione di y0 l’insieme dei punti ⇠ 2 ⌦, tali che ' (t; 0, ⇠) ! y0 per t ! +1. Se il bacino di attrazione coincide con ⌦ il punto y0 si dice globalmente asintoticamente stabile (in ⌦). Esempio 3.8 a) Nel modello logistico, la soluzione N (t) = 0 `e instabile mentre la soluzione N (t) = k `e asintoticamente stabile con bacino di attrazione R+ . b) Nel modello di Lotka-Volterra il punto di equilibrio (c/d, a/b), ossia la soluzione x(t) = c/d, y(t) = a/b, `e stabile ma non asintoticamente. c) Nell’equazione del pendolo, nell’Esempio 3.7, il punto di equilibrio (0, 0) (come pure i punti (0, 2k⇡), k 2 Z) `e stabile, non asintoticamente. Il punto (0, ⇡) (come pure i punti (0, (2k + 1)⇡), k 2 Z) `e instabile. Se y0 `e punto di equilibrio, con la traslazione z(t) = y(t) y0 , il sistema y˙ = f (y) si ˙ trasforma in z(t) = f (z(t) + y0 ) := g(z(t)). Alla soluzione y(t) = y0 del sistema originale corrisponde la soluzione z(t) = 0 del ` pertanto possibile riferirsi sempre all’origine, ossia alla nuovo sistema e viceversa. E soluzione ' (t) = 0. 3.4

Stabilit` a dell’origine per sistemi lineari autonomi. Il caso bidimensionale

1. Sia y˙ = Ay con A matrice di ordine n, a elementi (reali) costanti. La stabilit` a di ' (t) = 0 si determina facilmente in base alla formula (2.45). Indichiamo con j , j = 1, . . . , k gli autovalori di A. TEOREMA 3.6 i) L’origine `e punto di equilibrio asintoticamente stabile se e solo se Re 8 j = 1, . . . , k. La stabilit` a `e globale in Rn .

j

< 0,

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

269

ii) L’origine `e stabile, ma non asintoticamente (stabilit` a neutra), se e solo se Re j  0 e tutti gli autovalori con parte reale nulla sono regolari (cio`e la dimensione dell’autospazio `e pari alla molteplicit` a dell’autovalore). iii) L’origine `e instabile negli altri casi. Dimostrazione. 1) Dalla formula (2.45) segue che ogni soluzione ' `e somma di addendi o 0 del tipo cth e j t , c 2 Rn . Se Re j < 0 per ogni j , ' (t) ! 0 per t ! +1 e perci` `e asintoticamente stabile, con bacino di attrazione coincidente con Rn . Viceversa, se 0 `e asintoticamente stabile, allora non possono esistere autovalori con parte reale non negativa. Esisterebbero, infatti, in tal caso, soluzioni che non tendono a 0 per t ! +1. 2) Se vale la condizione sugli autovalori, gli addendi nella (2.45) sono della forma: (3.12)

cth e

jt

(h

0) se Re

j

< 0 oppure cei im

jt

se Re

j

= 0.

I primi tendono a 0 per t ! +1, i secondi sono neutralmente stabili. Viceversa, se 0 `e stabile neutralmente, gli addendi nella (2.45) possono essere soltanto del tipo indicato nella (3.12) e perci` o vale la condizione indicata sugli autovalori. 3) Se esistono autovalori con parte reale positiva oppure immaginari puri e non regolari allora esistono soluzioni del tipo ' (t) = ce

jt

o ' (t) = (c + c1 t + · · · + ckj

kj 1t

1

)ei im

jt

la cui norma tende all’infinito, per t ! +1. ' `e ancora soluzione con ' (0) = ↵c. Dunque, Si noti che ' (0) = c e che la funzione ↵' scegliendo opportunamente ↵ 6= 0, la soluzione parte da un punto vicino all’origine quanto '(t)| ! +1. Ci` si vuole, mentre |↵' o significa instabilit` a per 0. Per concludere `e poi sufficiente notare che, se 0 `e instabile, le condizioni sugli autovalori ⇤ in 1) oppure in 2) non possono valere.

Quando l’origine `e stabile o asintoticamente stabile si usa dire anche che la matrice A o che il sistema stesso `e stabile o asintoticamente stabile, rispettivamente. 2. Nel caso dei sistemi bidimensionali l’analisi pu` o essere condotta facilmente in modo completo fino a una classificazione di tutti i possibili comportamenti delle traiettorie vicino a 0. Vediamola nei suoi aspetti essenziali. Consideriamo dunque un sistema omogeneo bidimensionale ( x˙ = ax + by a, b, c, d 2 R. y˙ = cx + dy Supponiamo che |A| = ad bc 6= 0, cosicch´e l’origine `e l’unico stato di equilibrio del sistema. Ricordiamo che nessun’altra traiettoria pu` o passare per l’origine. Indichiamo con 1 e 2 gli autovalori di A, soluzioni dell’equazione 2

tr A + |A| = 0

(tr A =

1

+

2 , |A|

e distinguiamo vari casi secondoch´e la matrice A possegga i) due autovalori 1 , 2 reali e distinti; ii) due autovalori reali coincidenti; iii) due autovalori complessi coniugati.

=

1 2 ),

270

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Distingueremo poi dei sottocasi in corrispondenza del segno degli autovalori. Autovalori reali e distinti Il sistema possiede le due soluzioni (linearmente indipendenti) h1 e 1 t , h2 e 2 t , dove a della forma h1 e h2 sono autovettori (reali) di A; ogni soluzione (reale) sar` ' (t) = c1 h1 e

1t

+ c2 h2 e

2t

,

con c1 , c2 costanti reali arbitrarie. i1) Sia 1 < 2 < 0. L’origine `e globalmente asintoticamente stabile. Ogni traiettoria, partendo da un punto qualsiasi dello spazio delle fasi (x, y), si avvicina indefinitamente all’origine. Prendendo c2 = 0 si hanno le due traiettorie rettilinee indicate in Figura 4.27 con 1+ e 1 ; prendendo c1 = 0 abbiamo le traiettorie 2+ e 2 ; l’andamento delle altre traiettorie `e pure illustrato in Figura 4.27. Si osservi che, essendo 1 1t `e infinitesimo di ordine superiore all’altro 2 > 1 , per t ! +1 il termine c1 h e 2 2t c2 h e , cosicch´e tutte le traiettorie (tranne 1± ) sono asintotiche a 2± . Il punto di equilibrio prende il nome di nodo a due tangenti (stabile). i2) Sia 2 > 1 > 0. L’origine `e instabile. La discussione di questo caso `e del tutto analoga alla precedente; le traiettorie hanno, geometricamente, lo stesso andamento; ma il punto mobile, rappresentante la soluzione, partendo da un punto qualsiasi dello spazio delle fasi, prossimo quanto si vuole all’origine, si allontana indefinitamente da essa. Si parla, in questo caso, di nodo (instabile).

g1+ h1

h2

g2+

g1– g2–

Figura 4.27. Nodo stabile (a due tangenti).

i3) Sia 1 < 0 < 2 . L’origine `e instabile. Per c2 = 0 abbiamo le traiettorie rettilinee 1± lungo le quali il punto mobile si avvicina indefinitamente all’origine (essendo ± 1 < 0); per c1 = 0 abbiamo le traiettorie 2 lungo le quali il punto si allontana indefinitamente dall’origine (essendo 2 > 0). Ogni altra traiettoria risulta asintotica a una del tipo 1 per t ! 1 e a una del tipo 2 per t ! +1; l’andamento `e illustrato in Figura 4.28. L’origine si chiama, in questo caso, colle o sella.

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

271

g2+

h2 g1–

g1+

h1

g2–

Figura 4.28. Colle o sella.

Autovalori reali coincidenti Sia l’autovalore (doppio) della matrice A. La soluzione generale del sistema `e della forma ' (t) = c1 e t + c2 te t , dove c1 e c2 sono due opportuni vettori, dipendenti da due sole costanti arbitrarie. Se < 0, l’origine, `e globalmente asintoticamente stabile: tutte le traiettorie convergono verso l’origine; se > 0, tutte si allontanano indefinitamente dall’origine. Sia < 0; tutte le traiettorie sono asintotiche alle traiettorie rettilinee di equazione: . ' (t) = c2 te t , indicate in Figura 4.29a) con + e Il punto 0 si chiama ancora nodo (a una tangente).

g–

a)

h

g+

b)

Figura 4.29. a) Nodo stabile a una tangente. b) Nodo a stella stabile.

Un caso speciale si ha se la matrice A `e diagonale (e allora a = d); la soluzione generale `e semplicemente ' (t) = ce t

272

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

con c vettore arbitrario. Le traiettorie sono allora tutte rettilinee (si veda la Fig. 4.29b). L’origine si chiama ora nodo a stella. Autovalori complessi coniugati Siano = ↵ + i e = ↵ i gli autovalori di A; gli autovettori corrispondenti possono essere scelti in modo che risultino coniugati anch’essi; abbiamo cos`ı la coppia di soluzioni (linearmente indipendenti) he↵t+i t ,

he↵t

i t

.

Conviene sostituire a queste soluzioni una coppia di soluzioni reali. Posto h = 12 (h1 + ih2 ), con h1 e h2 vettori reali, possiamo, con i soliti calcoli, sostituire le due soluzioni sopra scritte con le seguenti ' 1 (t) = e↵t (h1 cos t

h2 sin t), ' 2 (t) = e↵t (h1 sin t + h2 cos t).

La soluzione generale `e dunque rappresentata in forma reale da: ' (t) = c1' 1 (t) + c2' 2 (t) = = e↵t [(c1 h1 + c2 h2 ) cos t + (c2 h1

c1 h2 ) sin t]

con c1 , c2 costanti (reali) arbitrarie. iii1) Sia ↵ = 0 (autovalori immaginari puri). L’origine `e stabile neutralmente. Le traiettorie sono delle ellissi. Si noti che in tal caso il sistema ha un integrale primo della forma: E(x, y) = cx2 2axy by 2 = costante (si veda l’Esercizio 5). Abbiamo quindi una infinit` a di orbite periodiche; l’origine `e, in questo caso un centro (Fig. 4.30a).

a)

b)

Figura 4.30. a) Centro. b) Fuoco stabile.

iii2) Sia ↵ < 0. L’origine `e globalmente asintoticamente stabile. Tutte le traiettorie si avvicinano indefinitamente all’origine, con andamento a spirale (si veda la Fig. 4.30b). L’origine `e un fuoco stabile.

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

273

iii3) Se ↵ > 0 l’andamento geometrico delle traiettorie `e lo stesso che nel caso precedente, ma il punto mobile si allontana indefinitamente dall’origine; l’origine `e un fuoco instabile. Il lettore `e invitato a completare la discussione con l’esame del caso degenere, cio`e quando il rango della matrice A `e 1. Possiamo riassumere nel seguente quadro i risultati relativi alla natura di 0. Poniamo := (tr A)2 4|A|. ( 8 > a. tr A < 0 asint. stabile 0 nodo i. > 0 b. tr A > 0 instabile > : 2. |A| < 0 colle instabile ( ( 1. b2 + c2 6= 0 nodo a. tr A < 0 asint. stabile ii. = 0 2. b = c = 0 nodo (a stella) b. tr A > 0 instabile 8 stabile (neutralmente) >

:2. tr A 6= 0 fuoco b. tr A > 0 instabile Resta inteso che, salvo avviso contrario, si parla di stabilit` a per t ! +1. Se t ! 1, nel quadro vanno scambiati asintoticamente stabile e instabile in i.1., ii.1. e ii.2. e iii.2. Applichiamo quanto detto allo studio delle piccole oscillazioni di un pendolo con attrito.

Esempio 3.9 Piccole oscillazioni del pendolo con attrito. Riprendiamo lo studio delle oscillazioni del pendolo in Figura 4.25 inserendo una forza d’attrito proporzionale alla velocit` a ', ˙ limitatamente per` o a “piccole oscillazioni” in modo da poter considerare sin ' ' '. L’equazione diventa '¨ =

k'

k'˙

˙ corrispondente al sistema (z1 = ', z2 = '): ( z˙1 = z2 (3.13) z˙2 = kz1

(k, h > 0),

hz2 .

Ritroviamo cos`ı la situazione dell’Esercizio 18 (Sez. 2); mentre l` a si sono esaminate le soluzioni dell’equazione, qui analizzeremo le orbite del sistema corrispondente. La matrice dei coefficienti `e ✓ ◆ 0 1 A= . k h Si ha: tr A =

h < 0 e |A| = k > 0.

274

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Distinguiamo dunque 3 casi in riferimento al quadro riassuntivo. Sia h2 4k (attrito forte); siamo nel caso i.1.a o ii.1.a. L’origine `e un nodo asintoticamente stabile. Il pendolo non esegue oscillazioni ma va direttamente alla posizione di equilibrio (che raggiunge per` o in un tempo infinito). 2 Sia 0 < h < 4k (attrito debole); siamo nel caso ii.2.b. L’origine `e un fuoco asintoticamente stabile. Il periodo esegue oscillazioni smorzate, di ampiezza sempre minore, fino a raggiungere, asintoticamente, la posizione di equilibrio. Nel caso h = 0, assenza di attrito, l’origine `e un centro: il pendolo esegue indefinitamente oscillazioni sempre della medesima ampiezza. 3.5

Il metodo di Liapunov

Per determinare la stabilit` a dell’origine presentiamo un metodo dovuto allo stesso Liapunov e che ha le sue origini storiche nel seguente classico teorema di Lagrange (1788); se in un sistema meccanico conservativo l’energia potenziale ha un minimo locale forte, allora l’equilibrio in quel punto `e stabile. ` il caso, per esempio, di una pallina che rotola senza attrito in una buca la cui E superficie ha un punto di minimo. Dunque, nella classe dei sistemi meccanici conservativi si pu` o risolvere in molti casi la questione della stabilit` a dell’equilibrio studiando le propriet` a dell’energia potenziale. Nel metodo di Liapunov il ruolo determinante `e svolto da una funzione scalare (detta appunto funzione di Liapunov), che, sebbene non sempre interpretabile in termini di energia potenziale, ne costituisce una generalizzazione. DEFINIZIONE 3.4 Sia V : A ! R, V 2 C 1 (A) con A ✓ Rn aperto contenente l’origine 0. V si dice funzione di Liapunov per il sistema y˙ = f (y) se: i) V (0) = 0 e V (y) > 0, ii) V˙ (y)  0, 8 y 2 A.

8 y 2 A, y 6= 0;

Per analogia con le forme quadratiche, una funzione che soddisfa i) si dice definita positiva in A. Analogamente si definiscono le nozioni di funzione definita negativa e semidefinita (negativa o positiva). La ii) indica che V˙ `e semidefinita negativa in A. Il risultato principale `e il seguente: TEOREMA 3.7 Sia dato il sistema y˙ = f (y), con f localmente lipschitziana in un aperto ⌦ ✓ Rn e tale che f (0) = 0. a) Se in un intorno A ✓ ⌦ dell’origine esiste una funzione V di Liapunov per il sistema, allora 0 `e stabile. b) Se inoltre V˙ < 0 in A\{0}, allora 0 `e asintoticamente stabile. Premettiamo alla dimostrazione alcune osservazioni ed esempi. OSSERVAZIONE 3.1 L’idea geometrica (e anche un poco meccanica. . . ) sottostante al metodo di Liapunov si pu` o comprendere meglio considerando il seguente caso particolare, bidimensionale.

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

275

V(x(t),y(t)) t

Figura 4.31.

Supponiamo di avere un sistema: (3.14)

( x˙ = f (x, y) y˙ = g(x, y)

che ammetta come funzione di Liapunov V (x, y) = x2 + y 2 e tale che V˙ < 0 lungo le traiettorie del sistema. Il grafico di V `e un paraboloide (Fig. 4.31). Poich´e lungo le traiettorie del sistema, V˙ < 0, la funzione (della sola t) V (x(t), y(t)) `e decrescente e il limite di V (x(t), y(t)) per t ! +1 deve essere 0. Essendo V definita positiva, ci` o costringe x(t) e y(t) a tendere a 0 per t ! +1. Questo `e, euristicamente, quello che capita. OSSERVAZIONE 3.2 Il fatto che V˙ lungo le traiettorie del sistema sia negativo ha un altro significato geometrico. Consideriamo le curve di livello di V , definite dall’equazione V (x, y) = c. Si ha, riferendoci sempre al sistema (3.14): @V @V @V @V x˙ + y˙ = f (x, y) + g(x, y). V˙ = @x @y @x @y Ora grad V `e un vettore normale alle curve di livello di V , diretto esternamente all’insieme V (x, y)  c, mentre xi ˙ + yj ˙ `e tangente alla traiettoria del sistema. Dunque la condizione V˙ < 0 esprime il fatto che il campo vettoriale: F = f (x, y)i + g(x, y)j associato al sistema `e diretto internamente all’insieme V (x, y) = c; ci` o implica che una traiettoria che entra o parte nell’insieme V (x, y)  c non ne pu` o pi` u uscire (Fig. 4.32).

276

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

V (x,y) = c grad V

V (x,y) # c j F

Figura 4.32. Insieme di livello di un funzione di Liapunov V e campo vettoriale F associato ad un sistema autonomo.

Si noti inoltre che la condizione V˙ < 0 in A\{0} implica che in A non vi sono altri punti di equilibrio. In generale la ricerca di una funzione di Liapunov `e difficoltosa. A volte si pu` o prendere l’energia totale associata al sistema oppure un integrale primo se questo `e definito positivo in un intorno di 0. Pi` u in generale, se il sistema ammette uno o pi` u integrali primi E1 , E2 , . . . , Em 2 (m < n), allora V = E12 + E22 + · · · + Em `e una funzione di Liapunov se y = 0 `e l’unica soluzione del sistema E1 = 0, E2 = 0, . . . , Em = 0. Infatti, in tal caso V `e definita positiva in un intorno di 0 e V˙ = 2E1 E˙ 1 + 2E2 E˙ 2 + · · · + 2Em E˙ m = 0 essendo E˙ j = 0 per ogni j = 1, . . . , m. Esempi 3.10 Il punto di equilibrio del sistema di Lotka-Volterra `e stabile neutralmente; un integrale primo definito positivo `e dato da V (x, y) = E(x, y) E(c/d, a/b) dove la E(x, y) `e definita nella 3.7. Per l’equazione del pendolo (Esempio 3.7), l’energia `e un integrale primo definito positivo in un intorno di (0, 0), che risulta cos`ı stabile. Naturalmente tutto ci` o risulta direttamente dal ritratto di fase, come pure che i punti (±⇡, 0) sono instabili (corrispondono alla posizione verticale del pendolo al di sopra del perno). 3.11 Equazioni di Eulero per la rotazione di un solido sospeso nel suo centro di inerzia. Il sistema 8 >

: I3 z˙ = (I1 I2 )xy,

ove I1 , I2 , I3 sono costanti positive (momenti di inerzia rispetto al centro di sospensione) ha i seguenti integrali primi, che si annullano nei punti di equilibrio (0, 0, a), a 2 R: E1 (x, y, z) = I12 x2 + I22 y 2 + I32 (z 2

a2 )

E2 (x, y, z) = I1 x2 + I2 y 2 + I3 (z 2

a2 ).

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

277

La funzione V (x, y, z) = E1 (x, y, z)2 + E2 (x, y, z)2 `e di Liapunov se I1 > I3 e I2 > I3 oppure I1 < I3 e I2 < I3 . Lasciamo i facili calcoli al lettore. In questo caso, pertanto, i punti (0, 0, a) sono stabili. Il risultato mostra la stabilit` a della rotazione di un solido attorno ai suoi assi di minore e maggiore inerzia. Veniamo ora alla dimostrazione del teorema che spezzeremo in 3 lemmi, di interesse indipendente. LEMMA 3.8 (di intrappolamento delle orbite) Sia un aperto limitato tale che ⇢ A e ⇠ 2 . Supponiamo che V (⇠) < a e che V (y) a per ogni y 2 @ . Allora la soluzione ' (t; 0, ⇠) esiste per t 0 e ' (t; 0, ⇠) 2 per ogni t 0. Dimostrazione. Supponiamo per assurdo che ' (t; 0, ⇠) esca da . Poniamo t⇤ = inf{t 0 : ' (t) 2 / } = “primo tempo di uscita da ”. Per la continuit` a di ' si ha ' (t⇤ ) 2 @ ; inoltre, ⇤ ⇤ '(t)) avremmo: per la definizione di t , ' (t) 2 per 0  t < t . Allora, ponendo (t) := V (' '(0)) = V (⇠) < a, ˙ (t) = V˙ (' '(t))  0 (0) = V ('

e

'(t⇤ )) (t⇤ ) = V ('

Contraddizione. Dunque ' non pu` o uscire da Proposizione 3.5, ' esiste per t 0.

a.

e pertanto `e limitata in J'+ . In base alla ⇤

j(t*)

0G j(t)

x G A

Figura 4.33. Intrappolamento delle orbite: V

a su @

e V (⇠) < a; ' non pu` o uscire da

.

LEMMA 3.9 (di escursione delle orbite) Sia aperto limitato con ⇢ A. Supponiamo che V (y) a e V˙ (y)  b < 0, 8 y 2 . Se ⇠ 2 e ' (t; 0, ⇠) `e definita per t 0, allora ' (t; 0, ⇠) esce da . Dimostrazione. Per assurdo, sia ' (t; 0, ⇠) 2 per ogni t 0. Si ha: Z t '(s))ds + V (⇠)  bt + V (⇠). '(t)) = V˙ (' a  V (' 0

Per t ! +1,

bt + V (⇠) !

1. Contraddizione.



278

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

V$a>0 ?

V # –b < 0 d

j

0

0Bd

x

G Figura 4.34. Lemma di escursione delle orbite: ' deve uscire da

.

LEMMA 3.10 (Attrattivit` a dell’origine) Sia 0 aperto limitato, 0 ⇢ A, 0 2 0 . Sia V funzione di Liapunov con V˙ < 0 in A\{0}. Se ⇠ 2 0 e ' (t; 0, ⇠) 2 0 per t 0 allora ' (t; 0, ⇠) ! 0 per t ! +1.

'(t)) `e strettamente decrescente. Facciamo Dimostrazione. Essendo V˙ < 0 in A, (t) = V (' vedere che (t) ! 0 per t ! +1. Se cos`ı non fosse, (t) ! µ > 0 per t ! +1 e (t) µ per t 0. Essendo V (0) = 0, esiste un intorno B (0) tale che, se y 2 B (0), V (y)  µ/2. Si noti che allora ⇠ 2 0 \B (0). Siano a > 0 il minimo di V e b < 0 il massimo di V˙ su 0 \B (0). o tuttavia uscire In base al Lemma 3.9, '(t; 0, ⇠) deve uscire da = 0 \B (0). Non pu` '(t))  µ/2. attraverso @ 0 per ipotesi e neppure attraverso @B (0) poich´e, se ' 2 B (0), V (' '(t)) ! 0, che implica ' (t) ! 0 per t ! +1. ⇤ Contraddizione. Dunque V (' Dimostrazione del Teorema 3.7. Sia " > 0 tale che B" (0) ⇢ A. Poniamo = B" (0) e a = min V . Essendo @ un compatto e V continua e definita positiva, a `e ben definito @

e positivo. Poich´e V (0) = 0, esiste B (0) tale che V (y)  a/2, 8 y 2 B (0). In base al o 0 `e stabile. Lemma 3.8, 8 ⇠ 2 B (0), ' (t; 0, ⇠) esiste per t 0 e non esce da B" (0). Perci` ⇤ Se V˙ < 0, l’asintotica stabilit` a segue dal Lemma 3.10 con 0 = B" (0).

Il Lemma 3.10 indica che se si riesce a trovare un aperto 0 ⇢ ⌦, limitato e contenente l’unico punto di equilibrio 0, nel quale sono intrappolate le orbite, e V˙ `e definita negativa, allora 0 `e contenuto nel bacino di attrazione di 0. Ci` o suggerisce la seguente PROPOSIZIONE 3.11 Sia ⌦ = Rn e sia 0 l’unico punto di equilibrio per il sistema y˙ = f (y). Sia V una funzione di Liapunov per il sistema. Se V˙ (y) < 0 in Rn \{0} e V (y) ! +1 per |y| ! +1, allora l’origine `e globalmente asintoticamente stabile. Dimostrazione. Sia ⇠ un qualunque punto di Rn , ⇠ 6= 0, e V (⇠) = a > 0. Poich´e V (y) ! +1 2a per |y| ! +1, esiste una sfera Br (0) di raggio r abbastanza grande, tale che V (y) 2a su @Br (0). Ma allora, in base al Lemma 3.7, per y 2 Rn \Br (0). In particolare V (y) ' (t; 0, ⇠) esiste per t 0 e non esce da Br (0). Essendo V˙ < 0 in tutto Rn , segue dal Lemma 3.10 che ' (t; 0, ⇠) ! 0, t ! +1. Essendo ⇠ arbitrario, il bacino di attrazione di 0 ⇤ `e Rn .

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

279

Esempio 3.12 Nel caso dei sistemi autonomi y˙ = Ay a coefficienti costanti, se A `e definita negativa, allora V (y) = |y|2 `e una funzione di Liapunov. Infatti V `e definita positiva e ˙ = 2hy, Ayi < 0 V˙ (y) = 2hy, yi 8 y 6= 0. Essendo poi V (y) ! +1 se |y| ! +1 ritroviamo il fatto che 0 `e globalmente asintoticamente stabile. La condizione V˙ < 0 richiesta per la stabilit` a asintotica si rivela in molti casi troppo restrittiva, come nel seguente esempio. Esempio 3.13 Oscillazioni del pendolo con attrito. '¨ =

k sin '

h'˙

Consideriamo l’equazione

(k, h > 0),

il cui significato `e ormai ben noto al lettore. L’energia (3.15)

E(z1 , z2 ) =

z22 + (k 2

k cos z1 ),

non `e pi` u un integrale primo del sistema equivalente (3.16)

( z˙1 = z2 z˙2 = k sin z1

a causa della presenza del termine dissipativo Infatti: (3.17)

˙ 1 , z2 ) = E(z

hz2 , hz2 .

hz22  0.

In base alla teoria svolta in precedenza possiamo concludere soltanto che 0 `e stabile mentre l’intuizione (e anche il caso delle piccole oscillazioni nell’Esempio 3.9), suggerisce che `e asintoticamente stabile per via della perdita di energia indicata dalla (3.17). Possiamo risolvere la questione posta nell’esempio precedente raffinando un poco la teoria. Anzitutto si dice che un insieme K ⇢ ⌦ `e positivamente (risp. negativamente) invariante se ogni semi-orbita che parte da un punto di K rimane in K per t ! +1 (risp. t ! 1). Un punto di equilibrio costituisce un insieme invariante, come pure ogni orbita chiusa. Se V `e una funzione di Liapunov, l’insieme Kc = {y 2 ⌦ : V (y) < c} `e invariante (per il lemma di intrappolamento). Notiamo poi che, se ⌦ = Rn e se V (y) ! +1, allora Kc `e anche limitato.

280

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Vale allora la seguente proposizione che ci limitiamo a enunciare. PROPOSIZIONE 3.12 Siano ⌦ = Rn e 0 punto di equilibrio per il sistema y˙ = f (y). Sia inoltre V una funzione di Liapunov tale che V (y) ! +1 per |y| ! +1. Se 0 `e l’unico sottoinsieme invariante di H := {y 2 Rn : V˙ (y) = 0} allora 0 `e asintoticamente stabile. La stabilit` a `e globale se 0 `e l’unico punto di equilibrio in Rn . Esempio 3.14 Continuazione dell’Esempio 3.13. In Figura 4.35 `e illustrato l’andamento del campo vettoriale z2 i + [ k sin z1 hz2 ]j associato al sistema, vicino a 0. z1

–p

p

z1

z2 = – k sin z1 h

Figura 4.35. Campo vettoriale per il pendolo con attrito.

Se V `e data dalla formula (3.15) l’insieme {(z1 , z2 ) 2 R2 : V˙ (z1 , z2 ) = 0} `e l’asse z2 . Dalla figura si vede che, preso un qualunque punto (0, ⇠2 ), ⇠2 6= 0, l’orbita uscente da questo punto si allontana dall’asse. L’unico insieme invariante contenuto nell’asse z2 `e dunque l’origine che, in base alla Proposizione 3.12, risulta asintoticamente stabile. A questa conclusione si pu` o giungere anche con il metodo di linearizzazione illustrato nel prossimo paragrafo (Esempio 3.15). Terminiamo il paragrafo osservando che, se in un intorno di 0 esiste una funzione V definita positiva insieme con V˙ , l’origine `e un punto instabile. Lasciamo al lettore la dimostrazione (si veda comunque l’Esercizio 13). 3.6

Metodo di linearizzazione

Per un sistema lineare autonomo la stabilit` a di un punto di equilibrio `e risolta completamente dal Teorema 3.6. Nel caso non lineare la situazione `e molto meno soddisfacente. Anche se si pu` o dimostrare che l’esistenza di una funzione di Liapunov `e non solo sufficiente (Teor. 3.7), ma anche necessaria per la stabilit` a di un punto di equilibrio, questa caratterizzazione ha un valore pi` u teorico che pratico, in quanto la ricerca di una funzione di Liapunov pu` o costituire un problema molto complesso. Un altro modo di procedere `e cercare di sostituire il sistema originale con un sistema lineare approssimante, utilizzare la teoria lineare e cercare di trasferire le informazioni ottenute a quello non lineare.

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

281

In generale l’approssimazione `e efficace solo nell’intorno del punto di equilibrio considerato e perci` o, anche se le informazioni sul sistema lineare hanno carattere globale, ` un’altra istanza la loro validit` a in riferimento al sistema originale `e per lo pi` u locale. E della dicotomia locale-globale associata a non lineare-lineare che abbiamo gi` a avuto modo di riscontrare in altre occasioni. Consideriamo un sistema autonomo y˙ = f (y)

(3.18)

con f 2 C 1 (⌦), ⌦ aperto di Rn e tale che f (0) = 0. Ipotesi fondamentale per il seguito `e che la matrice jacobiana di f in 0, Df (0), sia non singolare. Questo, tra l’altro, assicura che 0 `e un punto di equilibrio isolato, ossia che esiste un intorno di 0 in cui non vi sono altri punti di equilibrio del sistema (si veda l’Esercizio 2). o scrivere Essendo f 2 C 1 (⌦) si pu` (3.19)

f (y) = Df (0)y + g(y)

con g(y) = o(|y|) per y ! 0. Poniamo A := Df (0) e consideriamo il sistema: z˙ = Az

(3.20)

che prende il nome di sistema linearizzato (in y = 0). Il risultato fondamentale `e il seguente. TEOREMA 3.13 Se 0 `e asintoticamente stabile per (3.20), allora lo `e anche per il sistema (3.18). La dimostrazione si basa su un lemma algebrico che ci limitiamo a enunciare. LEMMA 3.14 Se tutti gli autovalori di A hanno parte reale negativa, allora esiste una matrice Q simmetrica e definita positiva tale che QA + AT Q `e definita negativa. Si noti che se A `e simmetrica, nel lemma si pu` o scegliere Q = In , matrice identit` a in Rn . Dimostrazione del Teorema 3.13. Essendo 0 asintoticamente stabile per (3.20) tutti gli autovalori di A hanno parte reale negativa. Sia allora Q come nel Lemma 3.14 e consideriamo la forma quadratica definita positiva V (y) = hQy, yi. Calcoliamo la derivata di V lungo le traiettorie del sistema non lineare (3.19); si ha: (3.21)

V˙ (y) = 2hQy, Ayi + 2hQy, g(y)i.

Inoltre, per la simmetria di Q: 2hQy, Ayi = 2hy, QAyi = hy, QA + AT Qyi che, per ipotesi, `e definita negativa. Perci` o, se o scrivere AT Q, si pu` (3.22)

2hQy, Ayi 

max (

Occorre per` o un’analisi teorica, che si pu` o condurre meglio, anzich´e nel piano delle fasi, nel cosiddetto piano di Lienard17 , ossia delle variabili y e z = y˙ + "(y 3 /3 y), rispetto alle quali otteniamo il sistema, equivalente alla (3.24): ✓ 3 ◆ 8 0, |A| = 1 > 0, = a cui `e associata la matrice A = 1 0 . Poich´ 2 (tr A) 4|A| < 0, siamo nel caso iii.2 del quadro riassuntivo; l’origine `e un fuoco instabile. In base alla Proposizione 3.15, `e un fuoco instabile anche per il sistema 3.25 e le orbite che partono in un intorno di (0, 0) se ne allontanano a spirale. Vogliamo dimostrare che: esiste un unico ciclo stabile, nel senso che ogni traiettoria diversa da (0, 0) tende, per t ! +1, ad avvolgersi su di esso. 17 Alfred

Lienard (1869-1958), fisico e matematico francese.

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

: z crescente : y crescente : z decrescente

z z y

P

285

: y decrescente

x Q T y

V3

–V3

R S

–h(x)

z = F(y)

Figura 4.38. Piano di Lienard per l’equazione di Van der Pol.

Per dimostrare questo fatto, riferiamoci alla Figura 4.38, in cui `e illustrato l’andamento del campo vettoriale ◆◆ ✓ ✓ 3 y y [x F (y)]i yj F (y) := " 3 associato al sistema (3.25). Osserviamo ora che l’equazione di↵erenziale della famiglia di traiettorie `e (3.27)

dz = dy

z

y . F (y)

La sostituzione z 7! z e y 7! y lascia invariata l’equazione cosicch´e si deduce che se si riflette un’orbita rispetto all’origine si ottiene ancora un’orbita. Consideriamo l’orbita che parte da un punto P = (0, ⇠). L’andamento dell’orbita `e quello indicato in figura (invitiamo il lettore a convincersene): dopo un tempo finito interseca la cubica z = F (y) in un punto T : y diventa decrescente, cosicch´e dopo un tempo finito interseca l’asse z in un punto S di coordinate (0, ⌘(⇠)), ⌘(⇠) > 0. L’osservazione fondamentale `e ora la seguente: se esiste ⇠ > 0 tale che ⌘(⇠) = ⇠ allora, riflettendo simmetricamente all’origine, si ottiene un’altra orbita che si salda con la precedente dando luogo a un’orbita chiusa. Poich´e tutte le orbite chiuse si avvolgono intorno all’origine concludiamo: i punti fissi dell’applicazione ⇠ 7! ⌘(⇠) sono in corrispondenza biunivoca con le orbite chiuse. Dobbiamo dunque mostrare che di questi punti fissi ne esiste esattamente uno.

286

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Consideriamo la funzione V (y, z) = y 2 + z 2 e chiamiamo ⇠ il tratto di orbita da (0, ⇠) a (0, ⌘(⇠)) e ⌧ il relativo tempo di percorrenza; si ha: Z ⌧ Z ⌧ dV (y y˙ + z z)dt ˙ = (usando le (3.25) dt = 2 (⇠) := ⌘(⇠)2 ⇠ 2 = 0 dt 0 Z ⌧ Z = 2 yF (y)dt = (essendo z˙ = y) = 2 F (y)dz. 0



Facciamo vedere che: i) (⇠) > 0 per ⇠ vicino a 0; ii) (⇠) `e strettamente decrescente; iii) (⇠) ! 1 per ⇠ ! +1. Da queste propriet` a segue l’esistenza di un unico punto ⇠ tale che (⇠) = 0, che equivale a ⇠ = ⌘(⇠). i) Se ⇠ `e abbastanza vicino a 0, il punto T si trova nel tratto in cui F `e negativa. Essendo anche z˙ < 0 si ha F (y)dz > 0 e quindi (⇠) > 0. ii) Si pu` o scrivere, in base alla (3.27), (3.28)

F (y)dz =

Inoltre

Z



Z

z

yF (y) dy. F (y) Z

Z

F (y)dz = _ · · · + _ · · · + _ . PQ

QR

RS

_ _ Se ⇠ cresce, P Q si alza, RS si abbassa. Ci` o significa che z F (y) aumenta in modulo su questi tratti, mentre RyF (y) rimane inalterato e negativo. Essendo F (y)dz > 0 si R deduce dalla (3.28) che _ · · · + _ · · · diminuisce. PQ RS _ Sul tratto R QR, F `e positiva e strettamente crescente e dz < 0; ne segue che se ⇠ aumenta, _ F (y)dz diminuisce. QR _ iii) Consideriamo il tratto di orbita QR. Riferendoci alla Figura 4.39 si deduce che Z Z Z _ F (y)dz  _ F (y)dz  F (a) _ dz. QR

R

LN

LN

Poich´e _ dz = (di↵erenza tra l’ordinata di N e l’ordinata di L) ! 1 per ⇠ ! +1 LN ne segue l’asserto. La prova della stabilit` a del ciclo segue esaminando l’andamento delle orbite intorno al ciclo limite; lasciamo i dettagli al lettore. Dal punto di vista delle applicazioni radio-ingegneristiche l’esistenza di un ciclo limite rappresenta la possibilit` a del sistema di oscillare con un periodo indipendente dalle condizioni iniziali. Concludiamo il paragrafo con un teorema, che ci limitiamo a enunciare, che pu` o essere usato, nel caso bidimensionale, per dimostrare l’esistenza di un ciclo limite.

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

Q

287

L

T

V3

a

N

y

R

Figura 4.39.

TEOREMA 3.16 (di Bendixson-Poincar´e18 ). Sia dato il sistema bidimensionale autonomo ( x˙ = f (x, y) y˙ = g(x, y) con f e g di classe C 1 in un aperto ⌦ di R2 . Sia ⌦0 ⇢ ⌦ un aperto limitato non u uscire. contenente punti critici e tale che ogni orbita che entri in ⌦0 non ne possa pi` Allora esiste in ⌦0 un ciclo limite. *3.8 Il punto di vista dei sistemi dinamici In questo paragrafo accenniamo brevemente a un aspetto geometrico della teoria delle equazioni di↵erenziali, sul quale si fonda la teoria moderna dei sistemi dinamici. Ci limitiamo a sistemi autonomi definiti in tutto Rn . Sia dato il sistema (3.29)

y˙ = f (y),

dove f `e una funzione di classe C 1 (Rn ). Se ⇠ 2 Rn possiamo pensare alla soluzione ' (t; 0, ⇠) in due modi (supponiamo, per semplicit` a, che ogni soluzione sia definita in tutto R). Nel primo, adottato finora, si pensa alla curva nello spazio Rn+1 t 7! ' (t; 0, ⇠), oppure all’orbita corrispondente nello spazio delle fasi; t `e la variabile, ⇠ `e fisso. Nel secondo, si pensa, per ogni t fissato, alla trasformazione da Rn in s´e data da ⇠ 7! ' (t; 0, ⇠). 18 Henry Poincar´ e (1854-1912) matematico francese. Otto Bendixson (1861-1935) matematico svedese.

288

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Al variare di t si ottiene una famiglia a un parametro di trasformazioni di Rn in s´e, che prende il nome di flusso di fase e che indichiamo con il simbolo {g t }. In altri termini: g t (⇠) := ' (t; 0, ⇠). Le principali propriet` a della famiglia {g t } sono espresse qui di seguito:

a) g 0 = identit` a in Rn ; t+s t = g g s = g s g t ; in particolare g t g t = identit` a in Rn ; b) g c) per ogni t, g t `e una corrispondenza biunivoca tra Rn ed Rn , di classe C 1 con la sua inversa g t ; d) g˙ t (⇠) = f (g t (⇠)); e) la matrice jacobiana Gt = D⇠ g t soddisfa la seguente equazione: (3.30)

d t G (⇠) = Df (g t (⇠)) · Gt (⇠). dt

Dimostrazione. a) Segue da g 0 (⇠) = ' (0; 0, ⇠) = ⇠. a) = ' (t; s, ⌘) = b) Sia g s (⇠) = ⌘; si ha: g t+s (⇠) = ' (t + s; 0, ⇠) = (per il teorema di unicit` gt (g s (⇠)) = g t g s (⇠). c) Segue dal teorema di esistenza e unicit` a e dal teorema di di↵erenziabilit` a della soluzione di un problema di Cauchy rispetto alle condizioni iniziali (Teor. 1.2 e Prop. 1.11). d) Segue dal fatto che gt (⇠) `e soluzione di (3.29). ` l’equazione alle variazioni (1.40) scritta con la simbologia appena introdotta. e) E



Le propriet` a a), b), c), unite all’associativit` a della composizione tra funzioni, si esprimono in un’unica locuzione: il flusso di fase {g t } costituisce un sistema dinamico continuo di classe C 1 (Rn ), ossia una famiglia (locale) di di↵eomorfismi di classe C 1 (Rn ) da Rn in s´e. Esempio 3.17 Sia dato il sistema ( y˙ 1 = y2 y˙ 2 = y1 . La soluzione soddisfacente la condizione iniziale y1 (0) = ⇠1 , y2 (0) = ⇠2 `e data dalla formula: y1 (t) = ⇠1 cos t + ⇠2 sin t y2 (t) = ⇠1 sin t + ⇠2 cos t. Dunque il flusso di fase g t `e definito da: ✓ ◆ ✓ ◆✓ ◆ ⇠1 cos t sin t ⇠1 t g : 7! , ⇠2 ⇠2 sin t cos t

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

289

ossia: g t rappresenta il gruppo delle rotazioni, con centro nell’origine, del piano in s´e. In generale, dato il sistema lineare autonomo y˙ = Ay.

(3.31)

il flusso di fase `e assegnato dalla formula g t : ⇠ 7! etA ⇠; si noti che etA `e la matrice di transizione. La teoria dei sistemi dinamici ha come obiettivo lo studio delle propriet` a del flusso di fase con particolare interesse al comportamento asintotico per t ! ±1. In questo ordine di idee, `e significativo chiedersi se “il flusso di fase conserva la misura di Rn (l’area in R2 , i volumi in R3 )”19 . Precisamente, dato un insieme ⌦ misurabile in Rn , indichiamo con |⌦| la sua misura e poniamo g t (⌦) := ⌦t

e

(t) := |⌦t |.

Ci chiediamo come varia (t). Vale l’importante formula (di Liouville) Z ˙ (3.32) (t) = div f (⇠)d⇠. ⌦t

La (3.32) indica in particolare che se div f (⇠) = 0 in Rn allora ˙ (t) = 0 ossia il flusso conserva la misura n-dimensionale. Esempi tipici sono i sistemi hamiltoniani (Esempio 3.4) p˙i =

@H , @qi

q˙i =

@H @pi

i = 1, . . . , n.

Se H 2 C 2 (R2n ) si ha infatti, per il teorema di Schwarz:

✓ ◆ ✓ ◆ n  n  X X @2H @ @H @ @H @2H + + = = 0. @pi @qi @qi @pi @pi @qi @qi @pi i=1 i=1

Nel caso dei sistemi lineari (3.31) f (y) = Ay e div f = tr A. La (3.32) diventa ˙ (t) = tr A (t) che generalizza la (2.35) e che mostra come tr A sia interpretabile come tasso di variazione della misura sotto l’azione del flusso di fase. Nel caso bidimensionale possiamo immaginare il flusso di fase come il flusso di un liquido piano: ogni particella segue le traiettorie di fase. In questo caso div f = 0, conservazione dell’area significa incomprimibilit` a del fluido. 19 Il concetto di misura di un insieme ` e trattato ampiamente nel Capitolo 5 del presente volume. Qui indichiamo con |⌦| la misura (secondo Peano Jordan o secondo Lebesgue) di ⌦.

290

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

Esercizi 1. Dimostrare che se ' (t) ` e soluzione del sistema (3.1) e ' (t) ! y0 per t ! +1 oppure

t!

1, allora y0 `e punto di equilibrio, cio`e f (y0 ) = 0.

2. Sia f 2 C 1 (⌦), ⌦ aperto di Rn tale che f (0) = 0 e Df (0) non sia singolare.

Dimostrare che 0 `e punto di equilibrio isolato per il sistema y˙ = f (y). [Suggerimento: supporre per assurdo che esista una successione {yk } tale che f (yk ) = 0 e yk ! 0 per k ! +1. Usare la formula di Taylor per ottenere una contraddizione.]

3. Dimostrare la Proposizione 3.5.

[Suggerimento: sia ' una soluzione la cui semiorbita destra sia contenuta in un compatto e per assurdo sia Tmax < 1. Si usi l’equazione integrale di Volterra per mostrare che lim ' (t) = t!Tmax

⌘. Si proceda poi come nella parte finale della dimostrazione del Teorema 1.7.] 4. Studiare nel piano delle fasi la seguente equazione

y¨ = a2

y2

(a 2 R)

Stabilire in particolare se al variare di a: a) esistono orbite periodiche; b) esistono soluzioni non periodiche definite in R. 5. Sia dato il sistema autonomo bidimensionale (3.8). Dimostrare che, se l’equazione di↵erenziale delle traiettorie `e esatta, allora esiste un integrale primo.

Siano F (x,y) e G(x,y) due funzioni reali di classe C 1 in un aperto ⌦ ✓ R2 . F e G si dicono funzionalmente dipendenti in ⌦ se esiste una funzione H(s, t) tale che H(F (x, y), G(x, y)) = 0 in ⌦. Si dimostra che: se H `e di classe C 1 , F e G sono funzionalmente dipendenti se e solo se @(F, G) Fx Fy = =0 in ⌦. Gx Gy @(x, y) Siano ora F e G integrali primi per il sistema (3.8). Possono essere linearmente indipendenti in ⌦? Giustificare la risposta. 6.*

7.*

Sia y˙ = f (y) un’equazione scalare con f 2 C 1 (R). Dimostrare che:

a) se f (y0 ) = 0 e f 0 (y0 ) < 0 allora y0 `e asintoticamente stabile e inoltre, per ⇠ abbastanza a esponenziale, vicino a y0 , la soluzione '(t) = '(t; 0, ⇠) ! y0 per t ! +1 con velocit` cio`e |'(t) y0 |  ce kt con c e k costanti positive opportune. b) Esaminare il caso f (y0 ) = f 0 (y0 ) = f 00 (y0 ) = 0, f 000 (y0 ) 6= 0 e f 000 (y) < 0 in un intorno di y0 , y0 escluso. 8. Un problemino di farmacocinetica. Sia c = c(t) la concentrazione di una sostanza nel sangue di un paziente. Una dose costante c0 viene somministrata a ogni intervallo di tempo T , in particolare al tempo t = 0. Si studi l’andamento di c(t) nei seguenti due casi:

a) c(t) ˙ = kc(t);

b) c(t) ˙ = kc(t)2 .

In particolare: tracciare il grafico di c(t) in un intervallo del tipo [0, mT ], m 2 N. Studiare il comportamento asintotico di c(t) per t ! +1 e dimostrare che esiste una concentrazione ` c1 un punto di equilibrio? E ` stabile? Come dipende c1 dalla dose iniziale c0 ? limite c1 . E

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

291

9. Determinare la natura del punto di equilibrio (0, 0) per i seguenti sistemi:

a) c)

(

(

x˙ = 2x + 3y y˙ = x y; x˙ = y˙ =

3x + 4y 2x + 3y;

(

x˙ = 4x 3y y˙ = 8x y; ( x˙ = 3x + y d) y˙ = x y.

b)

z E1 E2 E4 y1

y0

E3 y

E5

Figura 4.40. Energia potenziale per un sistema conservativo.

10. Studiare il ritratto di fase per i seguenti sistemi: (punti critici, equazione di↵erenziale delle traiettorie, risolvere se possibile tale equazione, trovare il verso di percorrenza sulle traiettorie) ( ( x˙ = ey x˙ = x2 y 2 b) a) y˙ = 2xy; y˙ = ey cos x. 11. Si consideri l’equazione del pendolo (senza attrito) (3.10). Calcolare l’energia meccanica necessaria per avere oscillazioni di ampiezza almeno ⇡/3 e almeno ⇡/2. Ry 12. Dato il sistema conservativo y¨ = f (y), f 2 C 1 (R), poniamo U (y) = f (s)ds, energia 0 potenziale, y˙ 2 /2+U (y) = E, energia totale. Si supponga che il grafico di U sia quello indicato in Figura 4.40. Tracciare le orbite corrispondenti ai livelli di energia indicati (si veda l’Esempio 3.7). 13. Dimostrare che se V e V˙ sono definite positive per il sistema (3.1) allora 0 ` e punto di

equilibrio instabile. [Suggerimento: dimostrare che, fissato un intorno di 0, ogni soluzione che parte da questo intorno vi esce definitivamente.] 14. Studiare la stabilit` a dell’origine per il seguente sistema:

(

x˙ = y x3 y˙ = x5 .

[Suggerimento: considerare V (x, y) = x6 + 3y 2 e calcolare V˙ . . . ]

292

CAPITOLO 4. Equazioni di↵erenziali ordinarie

c 978-88-08-63708-6

15. Sia g 2 C 1 (R) tale che y g(y) > 0 per y 6= 0. Si consideri l’equazione

y¨ + y˙ + g(y) = 0. Dimostrare che l’origine `e punto di equilibrio e studiarne la natura. 16. Variante del modello di Lotka-Volterra.

Si consideri il sistema: (

x˙ = ax bxy hx2 y˙ = cy+dxy ky 2

(a, b, c, d, h, k 2 R+ ).

Interpretare il modello in termini di prede (x = x(t)) e predatori (y = y(t)). Stabilire se esistono condizioni sui parametri che implicano l’estinzione dei predatori (ossia che implichi l’esistenza di un punto di equilibrio asintoticamente stabile di coordinate (⇠, 0)). 17.*

Si consideri l’equazione di Van der Pol (Esempio 3.16) y¨ + "(y 2

1)y˙ + y = 0.

(" > 0)

Si pu` o dimostrare che, quando " ! 0+ , la soluzione periodica dell’equazione tende a una soluzione periodica dell’oscillatore armonico. Determinarla. [Suggerimento: usare il piano delle fasi: y˙ = z, z˙ = y + "(1 y 2 )z. Sia y0 (t) = ⇢0 cos t, z0 (t) = ⇢0 sin t la soluzione incognita dell’oscillatore armonico; possiamo allora scrivere la soluzione T" -periodica dell’equazione di Van der Pol nel seguente modo: y" (t) = (⇢0 + ⇢" (t)) cos(t + !" (t)), z" (t) = (⇢0 + ⇢" (t)) sin(t + !" (t)), dove T" ! 2⇡, ⇢" ! 0, !" ! 0 per " ! 0. Dalla periodicit` a di (z" , y" ) si ricava che Z T" d (y" (t)2 + z" (t)2 )dt = 0. (⇤⇤) dt 0 Osservare che d 2 [y" (t) + z" (t)2 ] = 2(y" y˙ " + z" z˙" ) = 2"z"2 (1 y"2 ) = dt = 2"(⇢0 + ⇢" (t))2 [sin(t + !" (t))]2 {1 (⇢0 + ⇢" (t))2 [cos(t + !" (t))]2 }. Sostituire nella (⇤⇤), dividere per " e poi passare al limite per " ! 0. Si trova Z 2⇡ ⇢20 (sin t)2 (1 ⇢20 (cos t)2 )dt = 0 da cui . . . ]. 0

18. Studiare la stabilit` a dell’origine per il seguente sistema, dando informazioni sull’eventuale bacino di attrazione ( x˙ = x(y 2 1) y˙ = y(x2 1). 19. Sia dato il sistema

(

x˙ = (x y˙ = (y

y)(x2 + y 2 x)(x2 + y 2

1) 2y 1) + 2x.

3. Sistemi autonomi. Stabilit` a

c 978-88-08-63708-6

293

Studiarne le traiettorie. Dare informazioni sull’insieme massimale di esistenza delle soluzioni. [Suggerimento: passare in coordinate polari: x(t) = ⇢(t) cos ✓(t), y(t) = ⇢(t) sin ✓(t); si noti ˙ da tg ✓(t) = y(t)/x(t) si trova che da ⇢(t)2 = x(t)2 + y(t)2 si ricava ⇢˙ = (xx˙ + y y)/⇢; 2 . Risolvere poi le equazioni in ⇢ e ✓.] ✓˙ = (xy˙ y x)/⇢ ˙ 20. Illustrare geometricamente il flusso di fase associato al sistema

(

x˙ = y y˙ = kx + y

al variare di k 2 R.

21. Pu` o un sistema hamiltoniano avere un fuoco come punto di equilibrio?

˙ = f (y), che div f < 0 oppure 22. Che cosa significa geometricamente, per il sistema y div f > 0? 23. Considerare il sistema

(

x˙ 1 = x2 x˙ 2 = x1 + x2 (1

x21

x22 ).

a) Controllare che (0, 0) `e l’unico punto di equilibrio. Identificarne la natura. < x21 + x22 < 1} esiste un’orbita chiusa. [Suggerimento: usare il Teorema 3.16. Definire V (x1 , x2 ) = 12 (x21 + x22 ) e mostrare che V˙ 0 per x21 + x22 < 12 e V˙  0 per x21 + x22 > 1.]

b) Mostrare che nella corona circolare {(x1 , x2 ) :

1 2

CAPITOLO 5

Misura e integrazione

Presentiamo, in questo capitolo, la teoria dell’integrazione multipla e la teoria della misura degli insiemi di Rn ; le due teorie sono, in modo naturale, profondamente interrelate. Nello sviluppare l’argomento, ci siamo attenuti al seguente schema. Nella Sezione 1 `e presentato l’integrale multiplo secondo Riemann. Questo paragrafo `e il naturale prolungamento del capitolo ottavo del Volume I e racchiude gli aspetti pi` u elementari della teoria. I dettagli sono sviluppati soprattutto per l’integrale doppio con cenni agli integrali generalizzati nella versione pi` u semplice. Avendo la nozione di integrale a disposizione, si definisce rapidamente la classe (pi` u tecnicamente, l’algebra) degli insiemi misurabili secondo Peano-Jordan. Nelle Sezioni 2 e 3 sono esposti gli aspetti pi` u rilevanti della teoria della misura e dell’integrale secondo Lebesgue. Se nel primo paragrafo si `e partiti dalla nozione di integrale per arrivare a quella di misura, ora il punto di vista cambia. Si comincia col definire una misura per i u flessibile e completa di quella di Peano-Jordan (la misura di sottoinsiemi di Rn , pi` Lebesgue), per arrivare alla nozione di integrale secondo Lebesgue. La trattazione, nelle Sezioni 2 e 3, ha un carattere meno elementare rispetto a quella della Sezione 1. Concludiamo con un’osservazione sul percorso didattico che l’eventuale utilizzatore pu` o seguire. Un corso di carattere elementare pu` o fermarsi alla Sezione 1, ignorando le altre, senza con ci` o pregiudicare la comprensione degli argomenti successivi. In un corso pi` u avanzato si pu` o passare direttamente alle Sezioni 2 e 3, ritornando poi alla Sezione 1 per gli aspetti pi` u algoritmici riguardanti il calcolo degli integrali (in particolare al Paragrafo 1.6: Cambiamento delle variabili di integrazione, e al Paragrafo 1.8: Alcune applicazioni). 1. 1.1

INTEGRALE MULTIPLO SECONDO RIEMANN Integrale doppio per funzioni definite su un rettangolo

Cominciamo col definire l’integrale doppio secondo Riemann per funzioni reali definite e limitate su un rettangolo. Il procedimento ricalca quello seguito nella Sezione 1, Capitolo 8, Volume 1, per definire l’integrale di Riemann per funzioni di una variabile, limitate su un intervallo.

296

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Consideriamo il rettangolo Q = [a, b] ⇥ [c, d] e siano D1 , D2 suddivisioni di [a, b] e [c, d], rispettivamente, date da D1 = {x0 = a, x1 , . . . , xr 1 , xr = b} D2 = {y0 = c, y1 , . . . , ys 1 , ys = d}. Il prodotto cartesiano D = D1 ⇥ D2 `e detto suddivisione o partizione di Q. Relativamente a D poniamo: Ik = [xk Jh = [yh

1 , xk ],

xk = xk yh = yh

1 , yh ],

xk yh

1 1

per k = 1, . . . , r per h = 1, . . . , s

Il rettangolo Q risulta decomposto nell’unione degli rs rettangoli Qkh = Ik ⇥ Jh . Consideriamo ora una funzione f : Q ! R, limitata: (1.1)

m  f (x, y)  M

8 (x, y) 2 Q.

Per k = 1, . . . , r e h = 1, . . . , s poniamo: mkh = inf f,

(1.2)

Qkh

Mkh = sup f Qkh

d yh

Q kh

yh – 1 c

xk – 1 xk

a

b

Figura 5.1.

Definiamo le somme inferiore e superiore di f relativamente alla suddivisione D: s = s(D, f ) =

s r X X

mkh xk yh

k=1 h=1 s r X X

S = S(D, f ) =

Mkh xk yh

(somma inferiore) (somma superiore).

k=1 h=1

Osserviamo subito che, per ogni suddivisione D di Q, risulta, in base alle (1.1): m(b

a)(d

c)  s(D, f )  S(D, f )  M (b

Sono perci` o ben definite le due quantit` a inf S(D, f ) e D

sup s(D, f ), D

a)(d

c).

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

297

dove estremo inferiore e superiore sono cercati al variare di tutte le possibili suddivisioni di Q. Inoltre, come nel caso unidimensionale, si pu` o mostrare che sup s(D, f )  inf S(D, f ). D

D

Per una assegnata funzione f , due circostanze possono verificarsi: o sup s(D, f ) = inf S(D, f ) D

D

D

D

o sup s(D, f ) < inf S(D, f ). DEFINIZIONE 1.1 Una funzione f : Q ! R, limitata, si dice integrabile secondo Riemann se sup s(D, f ) = inf S(D, f ). D

D

Il valore comune di questi due estremi si chiama integrale (di Riemann) di f in Q e si denota con uno dei simboli seguenti: ZZ ZZ Z bZ d Z f, f, f (x, y)dxdy, f (x, y)dxdy. I(Q, f ), Q

Q

a

Q

c

Q si chiama dominio di integrazione ed f funzione integranda. Scriveremo anche I(f ) qualora non sorgano ambiguit` a circa il dominio di integrazione. Osserviamo che nella quarta e nella quinta notazione le variabili x e y sono “mute” e si pu` o usare una qualsiasi altra coppia di variabili, senza cambiare il valore dell’integrale; per esempio: ZZ ZZ f (u, v)du dv = f (⇠, ⌘)d⇠ d⌘. Q

Q

La classe delle funzioni limitate Riemann-integrabili su Q si indicher` a con il simbolo R(Q). Esempio 1.1 Ogni costante p `e integrabile su qualunque rettangolo Q = [a, b]⇥[c, d] e ZZ p = p(b a)(d c) = p · area (Q). Q

Infatti, per ogni suddivisione D di Q si ha: s=S=

s r X X

k=1 h=1

p xk yh = p

r X

k=1

xk

s X

yh = p(b

a)(d

c).

h=1

Esempio 1.2 Sia Q = [0, 1] ⇥ [0, 1] ed f la funzione di Dirichlet bidimensionale, ovvero ( 1 se (x, y) 2 Q, x e y razionali f (x, y) = 0 negli altri punti di Q.

298

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Allora, per ogni suddivisione D di Q si ha: s= S=

s r X X

k=1 h=1 s r X X k=1 h=1



xk yh = 0



xk yh = 1

e perci` o f non `e integrabile in Q. RR o interpretare come volume della Se f 2 R(Q) e f 0 in Q, l’integrale Q f si pu` regione tridimensionale T (detta cilindroide) limitata dal basso da Q e dall’alto dal grafico di f (Fig. 5.2b). In tale caso, infatti, il generico addendo di S(D, f ) (risp. s(D, f )), dato da Mkh xk yh (risp. mkh xk yh ), rappresenta il volume del parallelepipedo di base Qkh e altezza Mkh (risp. mkh ). La somma S(D, f ) (risp. s(D, f )) rappresenta dunque il volume RR di una regione che contiene T (risp. contenuta in T ). Essendo inf S = sup s = Q f `e dunque ragionevole interpretare l’integrale come il D

volume di T .

D

z

M kh

T

m kh y

y

Q kh

x

Q

Q

x a)

b)

Figura RR 5.2. a) Significato degli addendi nelle somme inferiori e superiori. b) Il cilindroide T ha come volume Q f .

Si presentano in modo naturale le seguenti questioni: – stabilire l’integrabilit` a di una funzione, cio`e individuare classi di funzioni integrabili; – calcolare l’integrale. Una risposta parziale alla prima questione si trova nel seguito di questo paragrafo, alla seconda nel successivo.

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

299

Un criterio necessario e sufficiente di integrabilit` a `e contenuto nel seguente teorema, analogo del Teorema 8.1.3, Volume 1, con identica dimostrazione, che perci` o omettiamo. TEOREMA 1.1 Sia f : Q ! R limitata. Allora f 2 R(Q) se e solo se per ogni " > 0 esiste una suddivisione D" di Q tale che (1.3)

S(D" , f )

s(D" , f ) < ".

Mediante il Teorema 1.1 `e facile dimostrare che: TEOREMA 1.2 Se f `e continua in Q, allora `e integrabile in Q. Dimostrazione. Per il teorema di Cantor-Heine (Teor. 2.7, pag. 214, Vol. 1), f `e uniformemente continua, essendo Q un compatto ed `e limitata per il teorema di Weierstrass (Cor. 2.5, pag. 214, Vol. 1). Fissato " > 0 esiste dunque " tale che su ogni sottoinsieme di Q di diametro minore di " , l’oscillazione di f `e minore di "1 . Scegliamo ora una suddivisione D in modo tale che i rettangoli in cui viene ripartito Q abbiano diametro minore di " . Con le solite notazioni, avremo perci` o: oscillazione di f su Qkh = Mkh

mkh < ".

Di conseguenza S(D, f )

s(D, f ) =

s r X X

(Mkh

k=1 h=1

mkh ) xk yh < " · area (Q).

Per la (1.3) e l’arbitrariet` a di " segue la tesi.



Come nel caso unidimensionale, `e possibile una definizione alternativa di integrale di Riemann, mediante un procedimento di limite su somme in generale diverse da quelle superiori e inferiori. Lo accenniamo brevemente. Se D = D1 ⇥ D2 `e una suddivisione di Q = [a, b] ⇥ [c, d], chiameremo ampiezza di D xk e |D2 | = max yh sono il numero |D| := max{|D1 |, |D2 |} dove |D1 | = max k=1,...,r

h=1,...,s

le ampiezze delle suddivisioni di [a, b] e [c, d] rispettivamente. Introduciamo le somme di Riemann mediante la formula (1.4)

(D, f ) =

s r X X

µkh xk yh

k=1 h=1

dove µkh `e un qualunque valore compreso tra mkh e Mkh . DEFINIZIONE 1.2 Sia l 2 R; diciamo che lim

(D, f ) = l

|D|!0

se: per ogni " > 0 esiste " tale che | (D, f ) |D| < " e per ogni scelta dei valori µkh . 1 Ricordiamo

che: oscillazione di f su E = sup f E

l| < " per ogni suddivisione D con

inf f . E

300

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Sussiste il seguente teorema: TEOREMA 1.3 Sia f : Q ! R, limitata. Allora f 2 R(Q) se e solo se lim

|D|!0

(D, f ) = l 2 R.

In tale caso risulta l = I(f ). La dimostrazione `e identica a quella del Teorema 1.4, pagina 396, Volume 1. 1.2

Calcolo di un integrale doppio mediante due integrazioni semplici

Il teorema che esponiamo in questo paragrafo permette, sotto opportune ipotesi, di ridurre il calcolo di un integrale doppio a quello di due integrali unidimensionali. TEOREMA 1.4 (di riduzione) Sia f 2 R(Q), Q = [a, b] ⇥ [c, d]. Rb a) Se, per ogni y 2 [c, d], esiste l’integrale G(y) = a f (x, y)dx, allora la funzione y 7! G(y) `e integrabile in [c, d] e vale la formula ! Z Z Z ZZ d

f=

(1.5)

d

b

G(y)dy =

f (x, y)dx dy.

c

Q

c

a

b) Se, per ogni x 2 [a, b], esiste l’integrale H(x) = x 7! H(x) `e integrabile in [a, b] e vale la formula (1.6)

ZZ

f=

Z

b

H(x)dx =

a

Q

Z

b

a

Z

Rd c

d

f (x, y)dy, allora la funzione !

f (x, y)dy dx.

c

Anteponiamo alla dimostrazione del teorema alcune osservazioni e un esempio. OSSERVAZIONE 1.1 Le formule (1.5) e (1.6) prendono il nome di formule di riduzione; gli integrali a destra si dicono integrali iterati. Se `e possibile applicare entrambe le (1.5) e (1.6) si ottiene (1.60 )

Z

c

d

dy

Z

a

b

f (x, y)dx =

Z

a

b

dx

Z

d

f (x, y)dy,

c

formula di scambio dell’ordine di integrazione. Sottolineiamo che l’esistenza dell’integrale doppio non comporta automaticamente l’esistenza degli integrali iterati: questa deve essere provata per poter applicare le formule di riduzione. Se per` o f `e continua su Q (e pertanto integrabile, in base al Teorema 1.2) allora, per ogni y 2 [c, d], la funzione x 7! f (x, y) `e continua in [a, b] e perci` o integrabile; esiste, Rd Rb cio`e 8 y 2 [c, d], l’integrale a f (x, y)dx; analogamente esiste l’integrale c f (x, y)dy per ogni x 2 [a, b]; le ipotesi del teorema sono cos`ı verificate ed `e possibile utilizzare entrambe le formule (1.5) e (1.6).

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

301

Nell’Esercizio 1.1 `e suggerito un esempio di funzione integrabile sul quadrato [0, 1] ⇥ [0, 1], per la quale uno dei due integrali iterati non esiste. OSSERVAZIONE 1.2 Un caso interessante si presenta quando f (x, y) = g(x)h(y) (si dice che le variabili sono separate). Se g 2 R(a, b) e h 2 R(c, d) allora f 2 R(Q) e la formula di riduzione vale nella forma seguente:

cio`e

RR

Q

ZZ

f=

Z

b

g(x)dx

a

Q

Z

d

h(y)dy,

c

f `e uguale al prodotto dei due integrali di g e h.

OSSERVAZIONE 1.3 Le formule di riduzione hanno un’interpretazione geometrica che le propone come generalizzazioni del principio di Cavalieri-Lagrange. Consideriamo, per esempio, la (1.5). Sia f 0 in Q. Fissato y 2 [c, d], G(y) = Rb f (x, y)dx rappresenta l’area della regione (ombreggiata in Fig. 5.3) che si ottiene a intersecando il cilindroide T , delimitato da Q e dal grafico di f , con il piano y = y. Il volume di T si ottiene integrando tali aree tra c e d. z

T

y y

Q x Figura 5.3. Interpretazione geometrica del Teorema 1.4.

Esempio 1.3 Consideriamo la funzione f (x, y) = x 3 ey/x nel rettangolo Q = [1, 2] ⇥ [0, 1]. Poich´e f 2 C(Q), possiamo utilizzare le formule (1.5) o (1.6). Vediamo qual `e la pi` u conveniente nel presente caso. R2 Con la (1.5) si deve calcolare prima 1 x 3 ey/x dx, mentre con la (1.6) occorre il R 1 3 y/x calcolo di 0 x e dy. Poich´e il secondo integrale `e immediato, utilizziamo la (1.6). Si trova Z x

1

3

0

ey/x dy = x

3

[xey/x ]10 = x

2

[e1/x

1].

302

CAPITOLO 5. Misura e integrazione

Quindi

ZZ

Q

f=

Z

2

2

x

1/x

[e

c 978-88-08-63708-6

1]dx =

1



1 x

e1/x +

2

=e

p e

1

1 . 2

Veniamo ora alla dimostrazione del Teorema 1.4. Dimostrazione. Dimostriamo solo la (1.5); per la (1.6) si procede in modo analogo. Sia D = D1 ⇥ D2 una qualunque suddivisione di Q e siano Ik , Jh , xk , yh , xk , yh , mkh , Mkh per k = 1, . . . , r e h = 1, . . . , s come nel Paragrafo 1.1. Rb Poich´e per ogni y 2 [c, d] esiste G(y) = a f (x, y)dx, la definizione di quest’ultimo integrale implica che r X

(1.7)

k=1

r X

mk (y) xk  G(y) 

Mk (y) xk

k=1

dove abbiamo posto mk (y) = inf f (x, y) e Mk (y) = sup f (x, y). x2Ik

x2Ik

Essendo f limitata, lo `e anche G. Consideriamo ora, relativamente alla partizione D2 di [c, d], le somme superiori e inferiori di G: S(D2 , G) = (1.8) s(D2 , G) =

s X

h=1 s X

h

yh

dove

= sup G(y)

h

Jh

h

yh

dove

h

= inf G(y).

h=1

Jh

Dalla (1.7) otteniamo, osservando che sup Mk (y) = Mkh : y2Jh

h

= sup G(y)  sup y2Jh

y2Jh

r X

k=1

Mk (y) xk 

r X

k=1

sup Mk (y) xk = y2Jh

r X

Mkh xk .

k=1

Analogamente, sempre dalla (1.7), osservando che inf mk (y) = mkh : y2Jh

h

= inf G(y)

inf

y2Jh

y2Jh

r X

mk (y) xk

k=1

r X

k=1

inf mk (y) xk =

y2Jh

r X

mkh xk .

k=1

Di conseguenza, sostituendo nelle (1.8), otteniamo: S(D2 , G)  (1.9)

e s(D2 , G)

r s X X

Mkh xk yh = S(D, f )

h=1 k=1

r s X X

mkh xk yh = s(D, f )

h=1 k=1

Dalle (1.9) si deduce che (1.10)

S(D2 , G)

s(D2 , G)  S(D, f )

s(D, f ).

o `e possibile grazie al Sia " > 0 e si scelga D = D1 ⇥ D2 in modo che S(D, f ) s(D, f ) < "; ci` Teorema 1.1. Allora dalla (1.10) si ricava che anche S(D2 , G) s(D2 , G) < ". Ancora in base

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

303

al Teorema 1.1 deduciamo che G 2 R(c, d). Inoltre dalle (1.9) si ha, per ogni suddivisione D di Q: Z d G(y)dy  S(D2 , G)  S(D, f ) s(D, f )  s(D2 , G)  che implica

1.3

Rd c

G(y) =

RR

c

Q

f.



Integrale su regioni pi` u generali. Misura di Peano-Jordan

La definizione di integrale doppio per funzioni definite su rettangoli risulta troppo restrittiva per le applicazioni. In questo paragrafo consideriamo regioni ⌦ del piano limitate e funzioni f : ⌦ ! R limitate. Per utilizzare la definizione di integrale che gi` a conosciamo, racchiudiamo ⌦ in un rettangolo Q e definiamo una nuova funzione fe nel modo che segue: ( f (x, y) se (x, y) 2 ⌦ e (1.11) f (x, y) = 0 se (x, y) 2 Q\⌦. DEFINIZIONE 1.3 Diciamo che f `e integrabile in ⌦ (secondo Riemann) se fe `e integrabile in Q e poniamo ZZ ZZ I(⌦, f ) =

f :=



Q

fe.

RR La definizione `e corretta in quanto n´e l’integrabilit` a di f n´e il valore di ⌦ f dipendono dal rettangolo Q che si usa per racchiudere ⌦; la verifica di questa a↵ermazione `e molto semplice ed `e lasciata al lettore. Indicheremo con R(⌦) la classe delle funzioni limitate integrabili in ⌦. y Q

f˜ = f

W

f˜ = 0

x Figura 5.4. Estensione di f a zero fuori da ⌦.

304

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

La Definizione 1.3 `e sufficientemente generale. Tuttavia, data l’enorme variet` a dei u sostanziale il problema di riconoscere sottoinsiemi di R2 , si presenta in modo pi` l’integrabilit` a di una funzione e quello del calcolo dell’integrale. Per lo sviluppo della teoria `e allora conveniente legare l’integrale al problema della misura (o area) dei sottoinsiemi di R2 . Il primo punto da a↵rontare `e stabilire a quali insiemi sia possibile associare un’area. Avendo a disposizione una nozione di integrale, si pu` o procedere nel seguente modo, che conduce al concetto di misurabilit` a secondo Peano-Jordan. Sia ⌦ ⇢ R2 , limitato, e sia 1⌦ = 1⌦ (x, y) la sua funzione caratteristica2 . DEFINIZIONE 1.4 Un sottoinsieme ⌦ ⇢ R2 , limitato, si dice misurabile (secondo PeanoJordan)3 se 1⌦ 2 R(⌦). In questo caso chiameremo area o misura di ⌦ e scriveremo |⌦|, il numero non negativo ZZ dxdy. (1.12) |⌦| := I(1⌦ ) = ⌦

Evidentemente ogni rettangolo Q = [a, b] ⇥ [c, d] `e misurabile e |Q| = area (Q) = (b a)(d c). Si vedr` a in seguito che gli insiemi della geometria elementare (poligoni, cerchi ecc.) sono tutti misurabili e l’area secondo la Definizione 1.4 coincide con l’area che tutti conoscono. Un insieme limitato non misurabile secondo Peano-Jordan `e l’insieme dei punti del quadrato [0, 1] ⇥ [0, 1] con entrambe le coordinate razionali. Nell’Esempio 1.2 abbiamo infatti visto che la funzione caratteristica di questo insieme non `e integrabile. Ritorneremo nella Sezione 2 sulla classe degli insiemi misurabili secondo PeanoJordan, da un punto di vista pi` u strutturale. Per lo sviluppo della teoria dell’integrazione, giocano un ruolo importante gli insiemi di misura nulla. Dalla RR Definizione 1.4 segue che un insieme Z ha misura nulla se 1Z `e integrabile in Z e Z dxdy = 0. Un’utile e pi` u diretta caratteristica degli insiemi di misura nulla `e contenuta nella seguente proposizione. PROPOSIZIONE 1.5 Un insieme Z ⇢ R2 `e di misura nulla (secondo Peano-Jordan) se e solo se 8 " > 0 esistono un numero finito N" di rettangoli, Q1 , Q2 , . . . , QN" tali che i) Z ⇢ ii)

N" X j=1

N" [

Qj ;

j=1

|Qi | < ".

Dimostrazione. Sia |Z| = 0 e Q un rettangolo contenente Z. Fissato " > 0 `e possibile trovare una suddivisione D di Q tale che S(D, 1Z ) < ". (

1 se (x, y) 2 ⌦ . 0 se (x, y) 2 /⌦ 3 In questo paragrafo, parlando di insiemi misurabili, intenderemo sempre “secondo PeanoJordan”, anche se non sar` a esplicitamente detto. 2 Cio` e

1⌦ (x, y) =

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

305

Tra i rettangoli in cui Q resta suddiviso siano Q1 , Q2 , . . . , QN quelli che hanno intersezione non vuota con Z. La loro unione contiene Z e risulta N X |Qj | = S(D, 1Z ) < ". j=1

Viceversa, siano Q1 , Q2 , . . . , QN" rettangoli tali che valgano i) e ii). Aumentando eventualmente il loro numero possiamo ritenere che i rettangoli Qj siano a due a due non sovrapposti. Evidentemente Z risulta limitato; sia Q un rettangolo che contiene tutti i Qj , j = 1, . . . , N" . Sia inoltre D una suddivisione di Q tale che fra i rettangoli in cui Q `e suddiviso vi siano anche i Qj , j = 1, . . . , N" . Allora: N" X |Qj | < " S(D, 1Z ) = j=1

che implica |Z| = 0 in base al Teorema 1.1.



Con una dimostrazione dello stesso stile (Esercizio 2) si prova la seguente caratterizzazione degli insiemi secondo Peano-Jordan. PROPOSIZIONE 1.6 Un insieme ⌦ ⇢ R2 limitato `e misurabile (secondo Peano-Jordan) se e solo se @⌦ `e misurabile e |@⌦| = 0. Esempi I seguenti sono insiemi di R2 di misura nulla. 1.4 Un insieme costituito da un numero finito di punti. 1.5 Un segmento di retta. 1.6 Se Z1 `e misurabile, e Z1 ⇢ Z e Z ha misura nulla, allora anche Z1 ha misura nulla. 1.7 L’unione di un numero finito di insiemi di misura nulla. In particolare il bordo di un poligono di m lati. Lasciamo la facile verifica al lettore. Un esempio meno elementare `e indicato nel seguente enunciato. PROPOSIZIONE 1.7 Sia g : [a, b] ! R, limitata, integrabile. Allora il suo grafico ha misura nulla. Dimostrazione. Sia " > 0 e D1 = {x0 = a, x1 , . . . , xr 1 , xr = b} una partizione di [a, b] tale che S(D1 , g) s(D1 , g) < ". Consideriamo i rettangoli Qk aventi per base Ik [xk 1 , xk ] e altezza [mk , Mk ] (Fig. 5.5) dove, al solito, mk = inf g e Mk = sup g. Ik Ik r r S P Qk e |Qk | = S(D, g) s(D1 , g) < ". Ci` o implica il grafico di g ha Allora graf(g) ⇢

misura nulla.

k=1

k=1



OSSERVAZIONE 1.4 La Proposizione 1.7 si estende senza difficolt` a alle curve regolari : [a, b] ! R3 . I sostegni di tali curve, come insiemi di punti in R3 (o in R2 , se la curva `e piana) hanno misura nulla. Tale misura non va ovviamente confusa con la lunghezza della curva, data dalla formula (1.8) del Capitolo 1, che `e positiva. La lunghezza di una curva rettificabile `e una specie di misura unidimensionale per insiemi che non sono contenuti in una retta.

306

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

y Qk Mk mk

T

a

Ik

b

x

Figura 5.5. Se g 2 R([a, b]), | graf(g)| = 0.

Dalla Proposizione 1.7 segue che il trapezioide T individuato da una funzione g, integrabile in [a, b], `e misurabile. Con un ulteriore piccolo sforzo si dimostra poi che Rb se g 0, |T | = a g, in accordo con quanto visto nel Capitolo 8, Volume 1. In particolare, il grafico di una funzione continua su un intervallo [a, b] ha misura nulla e risultano misurabili regioni del tipo seguente: (1.13)

{(x, y) 2 R2 ,

x 2 [a, b],

g1 (x)  y  g2 (x)}

y 2 [c, d],

h1 (y)  x  h2 (y)}

con g1 e g2 continue, (1.14)

{(x, y) 2 R2 ,

con h1 e h2 continue. Le regioni definite dalle (1.13) e (1.14) si dicono semplici (o normali) relativamente all’asse y e all’asse x, rispettivamente (Fig. 5.6). semplice rispetto Per esempio, il cerchio {(x, y) 2 R2 , x2 + y 2  1} `e una regione p 2 a entrambi p gli assi essendo delimitata dai grafici di y = ± 1 x o dai grafici di x = ± 1 y 2 . Esso `e dunque misurabile ed `e facile verificare che la sua misura di Peano-Jordan `e ⇡. 1.4 Funzioni generalmente continue Siamo ora in grado di stabilire l’integrabilit` a di una vasta classe di funzioni per le quali sia anche possibile il calcolo dell’integrale mediante le formule di riduzione. Premettiamo anzitutto la seguente definizione. DEFINIZIONE 1.5 Sia Q un rettangolo ed f : Q ! R limitata. Si dice che f `e generalmente continua se l’insieme dei suoi punti di discontinuit` a ha misura nulla. Vale il seguente risultato. TEOREMA 1.8 Sia f : Q ! R, limitata. Se f `e generalmente continua, allora `e integrabile. Dimostrazione. Fissiamo " > 0 e sia Z l’insieme dei punti di discontinuit` a di f . Poich´e |Z| = 0 si pu` o trovare una partizione D di Q tale che:

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

y

307

y y = g2(x) d x = h2(y) x = h1(y) c

y = g1(x) a

x

b

x

a)

b)

Figura 5.6. a) Regione semplice relativamente all’asse y. b) Regione semplice relativamente all’asse x.

i) l’unione dei rettangoli che contengono punti di Z ha misura < "; ii) sui restanti rettangoli l’oscillazione di f `e minore di " (f `e uniformemente continua sull’unione di tali rettangoli). o scrivere, con le solite notazioni: Sia M1 = sup |f |. Allora si pu` Q

S(D, f )

s(D, f ) =

s r X X

(Mkh

k=1 h=1

mkh ) xk yh =

XX (i)

··· +

XX

.

(ii)

dove le prime somme sono estese agli indici h, k relativi ai rettangoli del tipo i), le seconde sono relative a rettangoli del tipo ii). Abbiamo perci` o S(D, f )

s(D, f )  2M1 " + |Q|".

Per il Teorema 1.1 segue la tesi.



Dal Teorema 1.8 si ricava subito che: a) le funzioni continue su un compatto ⌦ misurabile sono integrabili in ⌦. Infatti, se Q `e un rettangolo contenente ⌦ ed fe estende f a zero in Q\⌦, le sole discontinuit` a di fe sono contenute in @⌦ che ha misura zero;

b) le funzioni limitate e continue su un aperto ⌦ misurabile sono integrabili in ⌦. Si ragiona esattamente come al punto a). In particolare vale la seguente proposizione molto usata nelle applicazioni.

PROPOSIZIONE 1.9 Sia ⌦ una regione semplice rispetto a uno dei due assi. Se f : ⌦ ! R `e limitata e continua in ⌦ (l’interno di ⌦), allora `e integrabile in ⌦ e valgono le

308

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

seguenti formule di calcolo: (1.15) (1.16)

ZZ

ZZ

f=



f=

Z

Z

b

dx

a d

dy

c



Z

Z

g2 (x)

f (x, y)dy

(⌦ semplice rispetto all’asse y)

f (x, y)dx

(⌦ semplice rispetto all’asse x)

g1 (x) h2 (y)

h1 (y)

Dimostrazione. L’unica cosa che occorre verificare sono le formule (1.15) e (1.16). Occupiamoci della (1.16). Siano Q = [↵, ] ⇥ [c, d] ⌦ ed fe definita come in (1.11). La funzione e x 7! f (x, y) ha, per ogni y 2 [c, d], due soli punti eventuali di discontinuit` a e pertanto l’inR tegrale ↵ fe(x, y)dx esiste per ogni y 2 [c, d]. D’altra parte, essendo fe = 0 fuori da ⌦, si ha Z h2 (y) Z f (x, y)dx. fe(x, y)dx = ↵

h1 (y)

Dunque, in base al Teorema 1.4: ZZ Z ZZ f := fe = ⌦

Q

d

dy c

Z



fe(x, y)dx =

Z

d

dy c

Z

h2 (y)

f (x, y)dx.



h1 (y)

Esempio 1.8 Siano Q = [0, 1] ⇥ [0, 3] e f : Q ! R definita da y ( 2xy se y  x2 , (x, y) 2 Q f (x, y) = 3 3 2 x + 2x y se y > x2 , (x, y) 2 Q. La funzione `e discontinua lungo l’arco di parabola y = x2 , 0  x  1, che ha misura zero. Dunque f `e integrabile in Q. Per ogni x 2 [0, 1], la funzione y ! f (x, y) ha un solo punto di R3 discontinuit` a e perci` o 0 f (x, y)dy esiste per ogni x 2 [0, 1]. Valgono dunque le ipotesi del Teorema 1.4 e possiamo applicare la formula di riduzione (1.6). Si ha: Z

3

f (x, y)dy = 0

e infine

Z

x2

2xy dy +

Z

3

f=x3 +2x2y y = x2

0

f = 2xy

1

x

(x3 +2x2 y)dy = 3x3 +9x2 x6

x2

0

ZZ

Q

f=

Z

1

(3x3 + 9x2

x6 )dx =

0

101 . 28

Esempio 1.9 Si voglia calcolare il volume del cilindroide delimitato, dall’alto, dal grafico della funzione z = xy, sul dominio ⌦ = {(x, y) 2 R2 : 0  y 

3 x, 4

x2 + y 2

25  0}

(Fig. 5.7).

La funzione z = xy `e continua sul dominio ⌦, RR semplice rispetto a entrambi gli assi. Essendo xy 0 su ⌦, il volume cercato `e ⌦ xy dxdy.

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

p Utilizziamo per il calcolo la formula (1.16), con h1 (y) = 43 y, e h2 (y) = 25 ha: Z 3 Z p25 y2 Z 3 ZZ 25 225 25 3 xy dxdy = dy xydx = y y dy = . 4 2 18 8 0 0 ⌦ 3y

309

y 2 . Si

y 3 x = 4y 3

y

x =V25 – y2

W 0

4

5

x

Figura 5.7. Dominio di integrazione dell’Esempio 1.9.

1.5

Propriet` a dell’integrale

L’operazione di integrazione “produce” numeri a partire da funzioni. Precisamente, a o essere dunque ogni funzione f 2 R(⌦), ⌦ limitato in R2 , associa un numero reale. Pu` considerata come un’applicazione (pi` u propriamente un funzionale) da R(⌦) in R. Presentiamo in questo paragrafo le propriet` a fondamentali di questa applicazione. 2 R.

TEOREMA 1.10 Siano f, g 2 R(⌦), ↵,

1. Linearit` a: ↵f + g 2 R(⌦) e ZZ ZZ (↵f + g) = ↵ f+ ⌦

2. Monotonia: i) f

g)

ZZ



f

ZZ

ii) |f | 2 R(⌦) e si ha



g.



ZZ



f 

ZZ



|f |.

In particolare, se ⌦ `e misurabile e M1 = sup |f |, ⌦

(1.17)

ZZ



f  M1 |⌦|.

ZZ



g.

310

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

3. Teorema della media: i) Se ⌦ `e misurabile e m = inf f , M = sup f si ha: ⌦



m Il numero

1 |⌦|

RR



1 |⌦|

ZZ



f M

f si chiama valore medio di f su ⌦ .

ii) Se ⌦ `e misurabile, compatto e connesso e se f 2 C(⌦), allora esiste (x0 , y0 ) 2 ⌦ tale che ZZ 1 f = f (x0 , y0 ). |⌦| ⌦ La dimostrazione pu` o essere e↵ettuata sulla falsariga di quella del Teorema 1.8, pagina 400, Volume 1, con gli ovvi cambiamenti dovuti alla dimensione 2. Lasciamo i dettagli al lettore. Un’altra importante propriet` a riguarda l’additivit` a rispetto al dominio di integrazione. PROPOSIZIONE 1.11 Siano ⌦1 e ⌦2 domini limitati in R2 tali che ⌦1 \⌦2 sia un insieme di misura nulla. Se f `e integrabile su ⌦1 e su ⌦2 , allora `e integrabile su ⌦1 [ ⌦2 e vale la formula ZZ ZZ ZZ f= f+ f. (1.18) ⌦1 [⌦2

⌦1

⌦2

Dimostrazione. Sia ⌦ = ⌦1 [ ⌦2 . Allora si ha: f = f 1⌦1 + RR f 1⌦2 f 1⌦1RR \⌦2 . RR Le funzioni f 1⌦1 e f 1⌦2 sono integrabili su ⌦ e inoltre ⌦ f 1⌦1 = ⌦1 f , ⌦ f 1⌦2 = RR f . Osserviamo poi, che essendo ⌦1 \ ⌦2 misurabile con misura nulla, dalla (1.17) si ⌦2 RR RR deduce ⌦ f 1⌦1 \⌦2 = ⌦1 \⌦2 f = 0. Per la propriet` a di linearit` a si deduce quindi la (1.18). ⇤

Si noti come la Proposizione 1.11 non sia invertibile; per esempio, sia f la funzione caratteristica del quadrato [0, 1]⇥[0, 1] ovviamente integrabile; tuttavia se ⌦1 `e l’insieme dei punti a coordinate razionali e ⌦2 il suo complementare (rispetto al quadrato), si vede che ⌦1 \ ⌦2 = ?, e quindi |⌦1 \ ⌦2 | = 0, ma f non `e integrabile su ⌦1 n´e su ⌦2 . Vale per` o la seguente proposizione, molto utile nelle applicazioni. PROPOSIZIONE 1.12 Siano ⌦, ⌦1 , ⌦2 misurabili tali che ⌦ = ⌦1 [ ⌦2 e |⌦1 \ ⌦2 | = 0. Se f 2 R(⌦), allora f 2 R(⌦1 ) \ R(⌦2 ) e vale la (1.18). Per la dimostrazione si veda l’Esercizio 12. Supponiamo ora che la funzione integranda dipenda, oltre che dalle variabili di integrazione, anche da un parametro t (eventualmente un vettore di parametri). Una volta e↵ettuata l’integrazione si trova una funzione di tale parametro: ZZ f (x, y, t)dxdy. (t) = ⌦

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

311

` importante stabilire se per (t) valgono propriet` E a quali la continuit` a e la derivabilit` a e se le operazioni di limite e di derivazione si possono scambiare con quella di integrazione. Raduniamo i principali risultati in un unico teorema nel quale il lettore non mancher` a di riscontrare la forte analogia con i teoremi del Paragrafo 8.1.9, Volume 1 e quelli del Paragrafo 3.1.3 di questo volume sull’argomento. TEOREMA 1.13 Sia f : ⌦ ⇥ [a, b] ! R, ⌦ ⇢ R2 , aperto limitato e f (·, t) 2 R(⌦), per ogni t 2 [a, b]. a) Se t 7! f (x, y, t) `e continua in [a, b], uniformemente rispetto a (x, y) 2 ⌦, allora, se t0 2 [a, b], ZZ ZZ f (x, y, t)dxdy = f (x, y, t0 )dxdy. lim t!t0





@f b) Se t 7! f (x, y, t) e t 7! (x, y, t) sono continue in [a, b], uniformemente rispetto @t @f 2 R(⌦), 8 t 2 [a, b], allora a (x, y) 2 ⌦ e @t ZZ ZZ @f @ (x, y, t)dxdy = (x, y, t)dxdy. @t ⌦ ⌦ @t Le ipotesi del Teorema 1.13 sono verificate se, per esempio, f e @f @t 2 C(⌦ ⇥ [a, b]). La dimostrazione del Teorema 1.13 `e identica a quella dei Teoremi 1.14, 1.15 e 1.16 alle pagine 414 e 415 del Volume 1 e perci` o la omettiamo. 1.6 Cambiamento delle variabili di integrazione L’obiettivo del presente paragrafo `e esaminare il comportamento dell’integrale rispetto ai cambiamenti di variabili nel piano. Ci` o conduce a una generalizzazione della formula (1.35), pagina 135, Volume 1 (metodo di sostituzione per l’integrale unidimensionale) che costituisce un importante strumento per il calcolo degli integrali. Se ne ricaver` a altres`ı un’importante interpretazione del determinante jacobiano di una trasformazione del piano in s´e. Consideriamo nel piano un aperto limitato ⌦ e una trasformazione biunivoca T : ⌦ $ T(⌦) ⇢ R2 assegnata dalle seguenti formule: ( x = '(u, v) (1.19) y = (u, v) o anche, in forma compatta, T(u, v) = ('(u, v), (u, v)). Sia ora A un aperto misurabile, tale che A ⇢ T(⌦) e f : A ! R una funzione continua. Ci si chiede come si trasforma l’integrale ZZ f (x, y)dx dy (1.20) A

operando la trasformazione di variabili (1.19).

312

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Intuitivamente ci si aspetta un integrale esteso a S = T 1 (A) mentre f (x, y) si trasforma in f (u, v) = f (x(u, v), y(u, v)). Il punto chiave sta nel capire come si trasforma l’elemento d’area dxdy. Contrariamente a quanto ingenuamente ci si potrebbe aspettare dxdy non si trasforma nel prodotto d'd . Per arrivare alla corretta formula lasciamoci guidare dal caso lineare, dal caso cio`e in cui T `e una trasformazione lineare. Fissata la base canonica in R2 , T `e allora rappresentata da una matrice M e, invece della (1.19), possiamo scrivere ✓ ◆ ✓ ◆ x u (1.21) =M . y v Se ora Q `e un rettangolo nel piano u, v, individuato dai vettori v1 , v2 , T(Q) `e un parallelogramma individuato dai vettori w1 = Mv1 , w2 = Mv2 . Dall’Algebra lineare `e noto4 che (1.22)

area(T(Q)) = | det M| · area (Q).

Se invece di un’applicazione lineare ne abbiamo una affine (composizione di una lineare e di una traslazione), cio`e del tipo ✓ ◆ ✓ ◆ ✓ ◆ x u u0 , =M + v0 y v la formula (1.22) rimane inalterata. Ritorniamo alla (1.19) e consideriamo un rettangolo Q ⇢ ⌦. Nasce subito un problema: T(Q) sar` a misurabile? Supponiamo per il momento che lo sia e cerchiamo di calcolare |T(Q)| sfruttando la (1.22). L’idea `e approssimare T con una trasformazione lineare o affine nel miglior modo possibile. Sapendo, per` o, che tale approssimazione avr` a carattere locale, supponiamo che Q sia di dimensioni du, dv molto piccole (“infinitesime”, direbbero i pionieri del calcolo integrale). Su Q approssimiamo T mediante la trasformazione affine L assegnata dalle formule seguenti, dove (u0 , v0 ) 2 Q: (1.23)

x(u, v) = '(u0 , v0 ) + 'u (u0 , v0 )(u y(u, v) = (u0 , v0 ) + u (u0 , v0 )(u

u0 ) + 'v (u0 , v0 )(v u0 ) + v (u0 , v0 )(v

v0 ) v0 )

Si noti che la (1.23) si pu` o scrivere nella forma L = T(u0 , v0 ) + dT(u0 , v0 ). A L corrisponde la matrice ◆ ✓ 'u (u0 , v0 ) 'v (u0 , v0 ) = jacobiana della trasformazione T nel punto (u0 , v0 ). J= u (u0 , v0 ) v (u0 , v0 ) Euristicamente, abbiamo, dalla (1.22): (1.24) dxdy ⇡ area (T(Q)) ⇡ area (L(Q)) = | det J| · area (Q) = 4 Si

veda comunque l’Esercizio 20.

@(', ) dudv. @(u, v)

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

313

Ci aspettiamo dunque che l’integrale (1.20) si trasformi nell’integrale ZZ @(', ) f (u, v) dudv. @(u, v) S Tutto funziona bene se valgono le seguenti ipotesi su T: i) T 2 C 1 (⌦); vale a dire: ' e sono di↵erenziabili con continuit` a in ⌦; ii) lo jacobiano della trasformazione non si annulla in ⌦; vale a dire det J =

@(', ) ' ' = u v 6= 0 @(u, v) u v

in ⌦.

Si noti che se valgono i) e ii), in base al teorema di inversione locale (Teor. 2.3, pag. 351, Vol. 1), T trasporta punti interni in punti interni e quindi T(⌦) `e aperto. a di T. Di conseguenza T 1 ha le stesse propriet` Vale il seguente risultato. TEOREMA 1.14 Sia T : ⌦ ! T(⌦), ⌦ aperto in R2 , una applicazione biunivoca, soddisfacente i) e ii). Sia S un insieme tale che S ⇢ ⌦. Allora: a) S `e misurabile se e solo se T(S) `e misurabile; b) se S `e misurabile e f 2 C(T(S)), vale la formula ZZ ZZ @(', ) f (x, y)dxdy = f (u, v) (1.25) dudv. @(u, v) T(S) S La dimostrazione del teorema, piuttosto complessa, `e riportata alla fine del paragrafo. Prima di dare esempi di applicazione del Teorema 1.14 `e opportuna qualche osservazione. OSSERVAZIONE 1.5 Nei casi concreti ⌦ e T(⌦) sono spesso aperti misurabili. In tal caso, se T e le sue derivate sono continue e limitate in ⌦, a) vale sotto l’ipotesi pi` u debole S ⇢ ⌦ e b) vale se f `e continua e limitata in T(S). Si pu` o poi ammettere che l’ipotesi di biunivocit` a di T e l’ipotesi ii) valgano su ⌦ eccetto un insieme di misura nulla. In tal caso `e ancora vero che, se S ⇢ ⌦ `e misurabile, allora T(S) `e misurabile e continua a valere la (1.25). La dimostrazione di questi fatti si ottiene modificando lievemente quella del Teorema 1.14. ) OSSERVAZIONE 1.6 Nella (1.25), @(', @(u,v) rappresenta un fattore locale di ingrandimento per le aree. Ci` o si mette maggiormente in evidenza considerando un cerchio Br = Br (u0 , v0 ), con centro in (u0 , v0 ) e raggio r e il suo trasformato T(Br ) (Fig. 5.8). Dalla (1.25) e dal teorema della media (3.ii del Teor. 1.10) si ha: ZZ 1 @(', ) @(', ) area (T(Br )) = 2 dudv = area (Br ) ⇡r @(u, v) @(u, v) u=eu,v=ev Br

dove (e u, ve) `e un opportuno punto di Br .

314

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

v

T(Br)

y Br T

v0

u0

u

x

Figura 5.8. Cerchio Br (u0 , v0 ) e suo trasformato.

Ne segue, passando al limite per r ! 0 (1.26)

lim

r!0

area (T(Br )) @(', ) = area (Br ) @(u, v)

. u=u0 ,v=v0

Dunque, il determinante jacobiano in un punto rappresenta il tasso (puntuale) di variazione relativa dell’area, subordinato alla trasformazione T. Esempio 1.10 Coordinate polari.

Sia T = T(⇢, ✓) definita dalle equazioni: x(⇢, ✓) = ⇢ cos ✓ y(⇢, ✓) = ⇢ sin ✓.

Abbiamo gi` a incontrato questa trasformazione nell’Esempio 2.6, pagina 344, del Volume 1. Se ⌦ = (0, +1) ⇥ (0, 2⇡), allora T(⌦) coincide con il piano privato del semiasse y = 0, x 0. Poich´e @(x,y) @(⇢,✓) = ⇢, T soddisfa le ipotesi del Teorema 1.14. Se A ⇢ T(⌦) `e misurabile e limitato ed f continua e limitata su A si ha dunque (1.27)

ZZ

A

f (x, y)dxdy =

ZZ

T

f (⇢ cos ✓, ⇢ sin ✓)⇢d⇢d✓. 1 (A)

L’elemento d’area in coordinate polari ⇢d⇢d✓ ha un significato intuitivo che invitiamo il lettore a individuare esaminando la Figura 5.9. Nella (1.27) A pu` a, un qualunque sottoinsieme limitato e misurabile RRo essere, in realt` del piano. Infatti A f non cambia togliendo da A la sua intersezione con il semiasse reale positivo poich´e tale intersezione ha misura nulla. Applichiamo la (1.27) al caso seguente. p Sia f (x, y) = 1+x12 +y2 , A = {(x, y) : 0 < y < 3x, 1 < x2 + y 2 < 4}. La funzione `e continua in A, misurabile, quindi `e integrabile.

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

315

y

q + dq

q

r

r + dr

x

Figura 5.9. L’area della regione ombreggiata approssima ⇢d⇢d✓.

Passando a coordinate polari si ha (Fig. 5.10) S=T

1

(A) = {(⇢, ✓) : 0 < ✓
0, 0 < y < 2

x} (Fig. 5.11).

316

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Poich´e f 2 C(A), l’integrale esiste. La forma di f suggerisce di porre u=x+y

e v=x

y

u

v

ovvero (1.28)

x=

u+v 2

e y=

2

.

La trasformazione `e lineare e non singolare, rappresentata dalla matrice 1 M= 2

✓ 1 1

◆ @(x, y) 1 1 . Dunque = | det M| = . La regione A corrisponde alla 1 @(u, v) 2

regione S = {(u, v) : v < u < 2, u >

v} e f (x(u, v), y(u, v)) = uv log(1 + u4 ).

y

u

2 y=2–x

2

x = 1 (u + v) 2 y = 1 (u – v) 2

S u=–v

A 0

2 x

u=v

–2

2

v

Figura 5.11. S ` e trasformato in A dalla (1.28).

Dalla (1.27): ZZ

ZZ

1 f (x(u, v), y(u, v))dudv = S 2 ◆ Z ✓Z u 1 2 vdv u log(1 + u4 )du = 0. = 2 0 u

f (x, y)dxdy =

A

Dimostrazione del Teorema 1.14. Essendo un po’ complicata la suddividiamo in vari passi; in ciascuno di essi indicheremo con K una costante tale che |'u |, | u |, |'v |, | v |  K in S. 1. S misurabile , T(S) misurabile

Sia S misurabile e Q ⇢ ⌦ un rettangolo. Sia D una suddivisione di Q e siano Ikh i rettangoli della suddivisione, con k = 1, . . . , r e h = 1, . . . , s. Fissato " > 0, poich´e T `e di classe C 1 , `e possibile scegliere D in modo tale che l’oscillazione di ciascuna delle derivate 'u u , 'v , v sia < " su ogni Ikh . Esaminiamo il trasformato di Ikh . A tale scopo approssimiamo T su Ikh con la mappa affine Lkh data dalla formula seguente: 'kh (u, v) = '(uk , vh ) + 'u (uk , vh )(u kh (u, v)

= (uk , vh ) +

dove (uk , vh ) `e un vertice di Ikh .

u (uk , vh )(u

uk ) + 'v (uk , vh )(v

vh )

uk ) +

vh )

v (uk , vh )(v

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

317

T(Ikh)

Ikh 4 e dkh

(uk, vh)

Figura 5.12. La regione ombreggiata ` e T(Ikh ); quella indicata dal parallelogramma punteggiato ` e Lkh (Ikh ).

Dato (u, v) 2 Ikh , valutiamo la distanza tra T(u, v) e Lkh (u, v). Per il teorema di Lagrange, si ha: '(u, v) = '(uk , vh ) + 'u (uk , v h )(u uk ) + 'v (uk , v h )(v vh ), con (uk , v h ) opportuno in Ikh , e (u, v) = (uk , vh ) + con (e uk , veh ) opportuno in Ikh . Dunque, |'(u, v)

uk , veh )(u u (e

uk ) +

uk , veh )(v v (e

vh ),

'kh (u, v)|  |'u (uk , v h ) 'u (uk , vh )||u uk |+ + |'v (uk , v h ) 'v (uk , vh )||v vh |  2"

kh

dove kh = diametro di Ikh . Lkh (u, v)|  4" kh . Analogamente, | (u, v) kh (u, v)|  2" kh e quindi |T(u, v) Ci` o implica che Ikh viene trasformato in un insieme i cui punti distano da quelli di Lkh (Ikh ) al massimo di 4" kh . Poich´e Lkh (Ikh ) `e un parallelogramma di area | det J(uk , vh )| |(Ikh )| si deduce che T(Ikh ) `e contenuto in un parallelogramma di area (1 + c")| det J(uk , vh )| |(Ikh )|, dove c dipende solo dalla costante5 K. Sia ora Z ⇢ Q di misura nulla. Allora |T(Z)| = 0. Infatti se Q1 , Q2 , . . . , QN sono rettangoli N N S P Qj Z e |Q1 | < ", si vede che T(Z) `e contenuto nell’unione dei T(Qj ), in ⌦ tali che j=1

j=1

e si ha: (1.29)

N X

j=1

|T(Qj )|  (1 + c") max | det J| Q

N X

j=1

|Qj |  "(1 + c") max | det J|. Q

Dunque, se S `e misurabile in ⌦, T(S) `e misurabile, in quanto |@S| = 0 implica |T(@S)| = |@T(S)| = 0. In particolare T(Q) risulta misurabile. Poich´e T 1 ha le stesse propriet` a di T, T(S) misurabile ) T 1 (T(S)) = S misurabile. 5 Con

un po’ di buona volont` a si potrebbe calcolare esattamente c.

318

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

2. Se S `e misurabile e S ⇢ ⌦, |T(S)| = Poniamo

RR

S

) | @(', |dudv @(u,v)

) |. Per l’additivit` a dell’integrale (e quindi della misura): = | det J| = | @(', @(u,v)

|T(Q)| = 

X h,k

X k,h

|T(Ikh )|  (1 + c") max Ikh

|T(Q)| 

P

| det J(uk , vh )| |Ikh |  |Q|.

Q

,

(1.30)

k,h

|Ikh | + c" max

Ci` o implica, per l’arbitrariet` a di ", che, essendo di

X

max

k,h kh

ZZ

|Ikh | una generica somma superiore

dudv. Q

e un rettangolo contenente S e si consideri una sudLa (1.30) vale anche per S. Sia infatti Q e in rettangoli Jrs in modo che quelli che intersecano S siano tutti contenuti divisione D di Q ⇤ ⇤ e ` in ⌦. Indichiamo P ⇤ con Jrs i sottorettangoli di ⌦ tali che Jrs \ @S 6= ?. E possibile fare in modo che |Jrs | < ", essendo |@S| = 0. Considerando poi solo i Jrs interni a S (se non ce ne sono allora S = @S), si ha, usando l’additivit` a della misura e le (1.29) e (1.30): X X ZZ X ⇤ |T(Jrs )|  dudv+ |T(S)|  |T(Jrs )| + Jrs ZZ dudv + "(1 + c") max . + "(1 + c") max  S

Per l’arbitrariet` a di " si deduce (1.31)

S

S

|T(S)| 

ZZ

dudv. S

a di T, possiamo sostituire T(S) a S nella (1.31), ottenendo, Poich´e T 1 ha le stesse propriet` 1 essendo JT 1 = J 1 (e quindi T 1 = ), con e (x, y) = (u(x, y), v(x, y)): ✓ ◆ 1 ZZ 1 e |S|  dxdy  min |T(S)| T (S) T(S) e

ovvero

|T(S)|

|S| min e . e T(S)

Applichiamo quest’ultima disuguaglianza ai rettangoli Jrs interni a S della suddivisione D P ⇤ ) < ": precedentemente considerata. Si ha, essendo (Jrs X X X min e |Jrs | = min |Jrs | = T(S) |T(Jrs )| Jrs T (Jrs ) X ⇤ |Jrs | s(D, ) " min . = s(D, ) min ⇤ Jrs

S

Essendo s(D, ) una generica somma inferiore di ne segue |T(S)| assieme alla (1.30), completa la dimostrazione del punto 2.

3. Siano S misurabile, S ⇢ ⌦ e f 2 C(T(S)). Allora vale la formula (1.25)

RR

S

dudv, che,

Siano Ikh i rettangoli di una suddivisione di un rettangolo contenente S, con le seguenti P ⇤ ⇤ \ @S 6= ? allora |Ikh | < ". propriet` a: se Ihk ⇢ S, l’oscillazione di f su T(Ikh ) `e < "; se Ikh

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

319

RR ⇤ Consideriamo i rettangoli Ikh ⇢ S; poich´e in virt` u del punto 2, |T(Ikh )| = I ⇤ dudv, kh abbiamo ZZ ZZ ZZ X ⇤ f f  |f |  max |f | |T(Ikh )|  max |f | max ". T(S)

⇤ ) [T(Ikh

[T(Ikh )

S

S

S

Dunque, se l’ampiezza della suddivisione tende a zero, si ha ZZ ZZ (1.32) f! f. [T(Ikh )

T(S)

Analogamente: ZZ

(1.33)

f

dudv !

[Ikh

ZZ

f

dudv.

S

D’altra parte, per il teorema della media ponderata (Esercizio 7), si ha: ZZ ZZ (1.34) f dudv = f (uk , v h ) dudv = f (uk , v h )|T(Ikh )|. Ikh

Ikh

Utilizziamo ora il fatto che l’oscillazione di f su T(Ikh ) `e minore di "; ponendo T(uk , v h ) = (xk , y h ) e quindi f (uk , v h ) = f (xk , y h ) si ricava:

(1.35)

ZZ

f (x, y)dxdy T(Ikh )

f (xk , y h )|T(Ikh )| =

ZZ

(f (x, y) T(Ikh )

f (xk , y h ))dxdy

 "|T(Ikh )|. Ne segue, dalla (1.34) e dalla (1.35), che (1.36)

ZZ

ZZ

f (x, y)dxdy [T(Ikh )

[Ikh

f dudv  "

X

|T(Ikh )|  "|T(S)|.

La tesi segue da (1.32), (1.33) e (1.36).



Esercizi 1. Sia Q = [a, b] ⇥ [c, d] ed f 2 R(Q). Mostrare che non ` e vero che, 8 x 2 [a, b], la funzione y 7! f (x, y) `e integrabile in [c, d]; che rilevanza ha questo fatto relativamente al Teorema 1.4? [Suggerimento: considerare la funzione 8 0, x1 + x2 + . . . + xn < a}. Poich´e Tn (a) si ottiene con una dilatazione di rapporto a dal tetraedro Tn (1) si ha |Tn (a)| = an |Tn (1)|n

(Esercizio 21).

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

327

Usiamo l’integrazione per strati, fissando xn tra 0 e 1 e lasciando variare le altre variabili sulla corrispondente sezione, che risulta essere l’insieme {(x1 , . . . , xn

1)

2 Rn

Z

, x1 > 0, . . . , xn

1 (1

e che coincide con Tn |Tn (1)|n =

1

dx =

Z

> 0, x1 + x2 + . . . + xn

1

> > > > x2 = ⇢ sin '1 cos '2 > > > > < x3 = ⇢ sin '1 sin '2 > ... > > > > > > xn 1 = ⇢ sin '1 sin '2 . . . sin 'n 2 cos 'n 1 > > : xn = ⇢ sin '1 sin '2 . . . sin 'n 2 sin 'n 1 , dove

(⇢, '1 , '2 , . . . , 'n

1)

2 (0, +1) ⇥ (0, ⇡) ⇥ (0, ⇡) ⇥ . . . ⇥ (0, ⇡) ⇥ (0, 2⇡).

Abbreviando si pu` o scrivere x = ⇢!('1 , . . . , 'n

1 ).

a) Dimostrare che |!| = 1. b) Verificare che per n = 2 ed n = 3 si ritrovano le trasformazioni a coordinate polari nel piano e nello spazio. Si pu` o dimostrare che (1.46)

@(x1 , x2 , . . . , xn ) = ⇢n 1 (sin '1 )n 2 (sin '2 )n 3 . . . sin 'n 2 . @(⇢, '1 , . . . , 'n 1 )

28. Integrale di una funzione radiale.

a) Sia f una funzione da Rn ! R, radiale, cio`e f (x) = f (|x|). Mostrare che Z R Z f (|x|)dx = !n f (⇢)⇢n 1 d⇢ (1.47) |x| b > 0. 8 Pappo

di Alessandria (⇠ 300 a.C.).

336

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

34. Sia S un corpo di massa totale m, con centro di gravit` a nell’origine. Dimostrare che, se ⇢ `e la distanza di un punto p dall’origine, detto U (p) il potenziale generato da S in p, si ha:

U (p) ⇠

m ⇢

per

⇢ ! +1.

35. Calcolare il momento di inerzia della figura delimitata dalla parabola y 2 = 2x e della

retta x = 2, rispetto alla retta y =

2.

36. Calcolare il momento di inerzia di un cono circolare rispetto a un diametro della base.

1.9 Cenno agli integrali multipli generalizzati Quando la funzione integranda o il dominio di integrazione, o entrambi, non sono limitati, si parla di integrale generalizzato o improprio. Consideriamo per primo il caso in cui la funzione integranda non `e limitata ma il dominio ⌦ di integrazione resta limitato. Le funzioni che si integrano, nella maggioranza dei casi concreti, sono funzioni continue, illimitate in un intorno di insiemi di misura nulla, per esempio nell’intorno di un numero finito di punti isolati. L’idea allora `e quella di togliere dalla regione ⌦ di integrazione un insieme S di misura piccola, contenente i punti “irregolari”, integrare su ⌦\S, indi calcolare il limite facendo tendere a zero la misura di S. Se il limite esiste, si chiamer` a integrale improprio o generalizzato di f in ⌦. Poich´e non vogliamo che il limite dipenda dalla particolare scelta degli insiemi S, ci limitiamo alla situazione pi` u semplice in cui esiste non solo l’integrale improprio di f , bens`ı anche quello di |f |, cio`e al caso in cui le funzioni sono assolutamente integrabili (in senso generalizzato). Precisamente, siano ⌦ una regione misurabile e limitata di Rn ed f : ⌦ ! R. Supponiamo di poter trovare una successione {⌦j }j 1 di sottoinsiemi di ⌦ con le seguenti propriet` a: 1) ⌦j ⇢ ⌦j+1 per j 1; 2) ogni ⌦j `e misurabile e |⌦j | ! |⌦| se j ! +1; 3) f 2 R(⌦j ) (e quindi anche |f | 2 R(⌦j )) e Z |f | lim j!+1

⌦j

esiste finito. Allora si pu` o dimostrare (Esercizio 42) che anche Z f (1.52) I = lim j!+1

⌦j

esiste finito e che non dipende dalla particolare scelta della successione {⌦j } approssimante ⌦. Il numero I che compare nella (1.52) si Rchiama R integrale generalizzato o improprio di f su ⌦ e si indica ancora con i simboli ⌦ f , ⌦ f (x, y)dxdy ecc.

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

337

Esempi 1.20 Siano f (x, y) =

1 x+y

e

⌦ = {(x, y) : x < 0, x2 + y 2 < 1, 0 < y < La funzione `e illimitata nell’intorno del segmento di retta y = ha misura nulla in R2 . Inoltre f > 0 in ⌦.

x}. x,

p 2 2

< x < 0, che

1 1 j

y = –x

Wj r = 1/j Figura 5.20.

Come ⌦j scegliamo i seguenti insiemi, definiti in coordinate polari (Fig. 5.20): ⇢ 1 3 1 ⌦j = (⇢, ✓) : < ⇢ < 1, ⇡ + < ✓ < ⇡ . j 4 j Evidentemente area(⌦j ) ! area(⌦) e f 2 R(⌦j ). Usando le coordinate polari si ha: ZZ

⌦j

f=

Z

Essendo sin( 34 ⇡

1

d⇢

1/j

Z

⇡ 3⇡ 1 4 +j

✓) ⇠ 34 ⇡

1 d✓ = cos ✓ + sin ✓

✓ 1

1 j

◆Z

⇡ 3 1 4 ⇡+ j

p 2 sin

d✓ 3 4⇡



.

✓ quando ✓ ! 34 ⇡, si deduce che

ZZ

⌦j

f ! +1 per j ! +1.

Dunque f non `e integrabile in ⌦. 1.21 Siano f = (x2 +y21+z2 )↵ (↵ > 0) e ⌦ = {(x, y, z) 2 R3 : x2 + y 2 + z 2 < 1}. La funzione `e illimitata; scegliamo ⌦j = {(x, y, z) 2 R3 : 1j < x2 + y 2 + z 2 < 1}. Allora f 2 R(⌦j ) (f `e > 0) e vol(⌦j ) ! vol(⌦). Si ha, passando a coordinate polari: 8 Z 2⇡ Z ⇡ Z 1 ZZZ 0 in R2 . Si ha, usando le coordinate polari Z 2⇡ Z j ZZ 2 2 2 2 e x y dxdy = d✓ ⇢e ⇢ d⇢ = ⇡[1 e j ] ! ⇡ 0

Bj

se j ! +1. Pertanto

ZZ

(1.54)

R2

e

0

x2 y 2

dxdy = ⇡.

D’altra parte, si deve ottenere lo stesso risultato scegliendo ⌦j = Qj = {(x, y) 2 R2 : |x| < j, |y| < k}. Ora ZZ

e

Qj

per j ! +1.

x2 y 2

dxdy =

Z

j

e j

x2

dx

Z

j

e j

y2

dy !

✓Z

+1

e 1

t2

◆2 dt = I 2 ,

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

339

Quindi I 2 = ⇡ e perci` o Z

(1.55)

+1

x2

e

dx =

p ⇡.

1

Sottolineiamo ancora che, con le precedenti definizioni, abbiamo ritenuto integrabili (in senso generalizzato) quelle funzioni che risultino Rassolutamente integrabili. Altre definizioni sono possibili, in cui l’integrale ⌦ f `e definito come il limite di integrali del tipo (1.52) e (1.53) rispetto a una determinata successione ⌦; ma non ci so↵ermeremo su questi casi. 1.10 La funzione Gamma di Eulero. Volume della sfera in Rn Ci occupiamo ora di un’importante funzione speciale, nota come funzione Gamma di Eulero (alla quale abbiamo accennato brevemente a pagina 465 del Volume 1). Questa funzione compare in molte questioni matematiche, (in particolare nell’espressione esatta del valore di certe costanti notevoli o di certi integrali) e in molte questioni fisiche e probabilistiche. Vedremo come entri nel calcolo del volume della sfera n-dimensionale. Poniamo, per x > 0, Z +1 tx 1 e t dt. (1.56) (x) = 0

L’integrale nella (1.56) `e l’integrale generalizzato della funzione reale di variabile reale f (t) = tx 1 e t , che dipende dal parametro x; la funzione f `e continua in (0, 1); per t ! +1 tende a zero molto rapidamente e pertanto risulta integrabile; per t ! 0+ si ha: f (t) ⇠ tx 1 ,

che risulta integrabile purch´e l’esponente x 1 sia > 1, ossia9 per x > 0. Quindi l’integrale in (1.56) `e ben definito per ogni x > 0 e il suo valore dipende dal parametro x. Pertanto `e corretto dire che (x) `e una funzione, definita in (0, +1) a valori reali10 ; viene detta appunto funzione Gamma di Eulero. Il prossimo teorema riassume alcune propriet` a importanti di questa funzione. TEOREMA 1.16 (a) La funzione di Eulero `e derivabile infinite volte in (0, +1) . (b) Vale la formula di ricorrenza: (x) = (x

1) (x

1) per ogni x > 1.

(c) Per ogni n intero positivo `e: (n) = (n

1)!

9 Si vedano i criteri di integrabilit` a studiati per gli integrali generalizzati in una variabile nel Capitolo 8, pagina 455 del Volume 1. 10 Si pu` o definire la funzione anche se x ` e complesso, purch´ e con parte reale positiva; noi ci limiteremo al caso di x reale e positivo.

340

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

(d) Vale l’identit` a: (x) = 2

Z

+1

u2x

1

u2

e

du.

0

Le propriet` a (a) e (c) ci dicono che la funzione si pu` o vedere come una funzione regolare (infinitamente derivabile) che interpola i valori del fattoriale, cio`e che assume i valori (x 1)! quando il suo argomento x `e intero, ma `e definita su tutta la semiretta x > 0. Non stupisce di conseguenza che, alla pari dell’espressione n!, la funzione Gamma compaia in tante formule matematiche notevoli. Dimostrazione. (a) Osserviamo che

e che l’integrale generalizzato

dk ⇥ x t dxk Z

1

e

+1

t⇤

tx

= tx

1

t

e

1

t

e

log t

k

k

log t dt

0

converge per ogni k. Si pu` o dimostrare (si veda l’Esercizio 7, Sezione 3) che la derivata kesima della funzione si pu` o e↵ettivamente calcolare derivando sotto il segno di integrale; pertanto `e derivabile infinite volte. (b) Integriamo per parti nell’integrale generalizzato: (x) =

Z

+1

tx

0

1

f

= 0 + (x

t

e

dt =

g0

1) (x

1),



tx

1

t ⇤+1 0

e

+

Z

+1

1) tx

(x

2

e

t

dt =

0

dove si `e inteso (coerentemente alla definizione di integrale generalizzato): ⇥

tx

1

e

t ⇤+1 0

= lim

r!+1

rx

1

e

r

lim

"!0

"x

1

e

"

=0+0

perch´e per ipotesi x > 1. (c) Dalla (b) abbiamo: (1.57)

(n) = (n

1) (n

1)

mentre, direttamente dalla definizione, osserviamo che: (1.58)

(1) = 1.

Per ricorrenza, dalle (1.57)-(1.58) segue che (n) = (n 1)! ` sufficiente calcolare l’integrale che definisce (x) col cambio di variabili t = u2 . (d) E



Funzione Gamma sui semiinteri Abbiamo bisogno dei valori che la (x) assume per x semiintero, ossia quando x = n/2 con n intero positivo. Se n `e pari, n = 2k, sappiamo gi` a che: ⇣n⌘ ⇣n ⌘ = (k) = (k 1)! = 1 ! 2 2

1. Integrale multiplo secondo Riemann

c 978-88-08-63708-6

341

Occupiamoci quindi del caso n dispari, cio`e n = 2k + 1 con k intero positivo. Il caso pi` u semplice `e k = 0: dalla (d) del teorema precedente si ha: ✓ ◆ Z Z +1 p 2 2 1 e u du = e u du = ⇡. =2 2 0 R Pi` u in generale, usando pi` u volte la formula di ricorrenza per la Gamma (punto (b) del Teorema 1.16) abbiamo, per k 1: ✓ ◆ ✓ ◆ ✓ ◆ ⇣n⌘ 1 1 1 = k+ = k 1+ k 1+ = 2 2 2 2 ◆✓ ◆ ✓ ◆ ✓ 1 1 1 k 2+ k 2+ = ... = k 1+ 2 2 2 ◆✓ ◆ ✓ ◆✓ ◆✓ ◆ ✓ ◆ ✓ 1 1 1 1 1 1 k 2+ ... 2 + 1+ = = k 1+ 2 2 2 2 2 2 (2k 1)!! p (2k 1) (2k 3) (2k 5) · · · · 5 · 3 p ⇡= ⇡, = k 1 2 2k dove il simbolo (2k 1)!! (“semifattoriale”) indica per definizione il prodotto di tutti gli interi dispari da (2k 1) in gi` u: (2k

1)!! = (2k

1) (2k

3) (2k

Possiamo quindi scrivere: ✓ ◆ p 1 = ⇡ 2 ⇣ n ⌘ (n 2)!! p (1.59) ⇡ = n 1 2 2 2 ⇣n⌘ ✓n 2◆ = ! 2 2

5) · · · · 5 · 3.

per n dispari

3,

per n pari.

Calcolo del volume della ipersfera n-dimensionale di raggio 1, B1 R 2 Calcoliamo Rn e |x| dx in due modi:

a) Dalla (1.47) dell’Esercizio 28 a) si ha: Z Z +1 2 n 1 |x|2 e dx = !n e ⇢ ⇢ d⇢ = (ponendo ⇢2 = t) = Rn Z0 !n 1 t n 1 !n ⇣ n ⌘ = e t 2 dt = . 2 0 2 2

b) D’altra parte Z

Rn

e

|x|2

dx =

Z

e

R

per quanto visto nell’Esempio 22.

x21

Z dx1 e R

x22

Z dx2 · · · e R

x2n dxn

n

=⇡ 2

342

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Dalla (1.48) dell’Esercizio 28 abbiamo dunque |B1 |n

n n ⇣n⌘ = ⇡2 2 2

da cui

n

|B1 |n =

2 ⇡2 n . n 2

Osserviamo che: (1) = 1, |B1 |2 = ⇡,

✓ ◆ p ⇡ 3 = , (2) = 1, 2 2 4 ⇡2 |B1 |3 = ⇡, |B1 |4 = , 3 2

✓ ◆ 5 3p ⇡, . . . = 2 4 8 2 |B1 |5 = ⇡ ,... 15

Esercizi 1 (↵ 2 R+ ) e ⌦ = {(x, y) 2 R2 , x2 + y 2 < 1}. Stabilire per (x2 + y 2 )↵ quali valori di ↵ f `e integrabile in ⌦. 37. Siano f (x, y) =

38. (Generalizzazione dell’Esercizio 37).

1 , (↵ 2 R+ ), e ⌦ = {x 2 Rn , |x| < 1}. |x|↵ Stabilire per quali valori di ↵ f `e integrabile in ⌦. ⇢ 1 1 39. Siano f (x, y) = y e ⌦ = (x, y) 2 R2 , x 1, p < y < p . x x Stabilire se f `e integrabile in ⌦. Siano f (x) =

40. Dimostrare i seguenti criteri di integrabilit` a e di non integrabilit` a.

a) Se f `e integrabile in ⌦ e |g|  |f | in ⌦, allora g `e integrabile in ⌦. b) Se f non `e integrabile in ⌦ e |g| |f | in ⌦, allora g non `e integrabile in ⌦. 41. Sia f 2 R([1, +1]) f

Calcolare

RR

0, tale che

R +1

f (u)du = 3. 1 f (xy)dxdy, dove ⌦ = {(x, y) 2 R2 : y > , x < y < 4x}. ⌦ x 1

42.* Dimostrare che se {⌦j } soddisfa le propriet` a 1) 2) e 3) del Paragrafo 1.9, allora lim

R

j!+1 ⌦j

f

esiste finito e non dipende dalla particolare scelta della successione {⌦j } approssimante ⌦. R [Suggerimento: per la prima parte, usare il criterio di Cauchy per la successione Ij = ⌦ f . j

Per la seconda parte, considerare una successione {⌦0k } di insiemi con le propriet` a 1, 2, 3. R Posto J = lim ⌦ f , dimostrare che, fissato " > 0, per k e j abbastanza grandi si ha k k!+1 R |J f | < " ecc.] ⌦0 \⌦j k

c 978-88-08-63708-6

2.

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

343

MISURA DI LEBESGUE DEGLI INSIEMI DI Rn . INSIEMI MISURABILI E FUNZIONI MISURABILI

Nella Sezione 1, parlando dell’integrale di Riemann, abbiamo definito la misura (seconu comuni applicazioni do Peano-Jordan) di una vasta classe di insiemi di Rn . Per le pi` la classe degli insiemi PJ-misurabili (misurabili secondo Peano-Jordan) `e sufficientemente ampia, anche se, come abbiamo visto, non `e difficile trovare esempi di insiemi che non sono PJ-misurabili. La classe degli insiemi L-misurabili (misurabili secondo Lebesgue), che definiremo in questo paragrafo, `e un ampliamento della prima; il vantaggio della nuova definizione non consiste tanto (o non consiste solo) nel fatto che, ora, `e ben pi` u vasta la classe degli insiemi di Rn che risultano misurabili (“praticamente” tutti) ma piuttosto risiede nelle propriet` a della nuova misura, che sono assai pi` u soddisfacenti, come sar` a messo in luce nel Paragrafo 2.2. Il vantaggio sar` a poi reso pi` u evidente nella Sezione 3, quando, sulla base dei risultati conseguiti in questo paragrafo, sar` a definito l’integrale di Lebesgue. La nuova teoria dell’integrazione, sviluppata soprattutto ad opera di Lebesgue all’inizio del secolo scorso, ma alla quale hanno dato contributi fondamentali anche matematici italiani, come Vitali, Fubini, Tonelli. . . , costituisce uno dei capisaldi dell’Analisi moderna. I risultati di questa teoria hanno trovato applicazione in svariati campi, sia della matematica, che delle scienze applicate, consentendo uno sviluppo straordinario, per esempio, nella teoria delle equazioni alle derivate parziali, nel calcolo delle probabilit` a, nella meccanica quantistica. Lo scopo di questo e del prossimo paragrafo `e quello di presentare i risultati principali di questa teoria, avendo in vista soprattutto l’impiego che di essi si fa nelle applicazioni. Noi riteniamo infatti che le nozioni fondamentali sulla misura degli insiemi di Rn e sull’integrale di Lebesgue debbano far parte del bagaglio culturale non solo, come `e ovvio, di ogni matematico, ma anche di ogni fisico e di molti ingegneri. Infine vogliamo far notare che, dato il carattere di questa esposizione, che `e finalizzata soprattutto all’utilizzazione dei risultati della teoria, e per non rendere eccessivamente gravoso un testo gi` a abbastanza denso di argomenti, abbiamo rinunciato, soprattutto nella Sezione 3, a dare le dimostrazioni di tutti i risultati enunciati, limitandoci ad alcune che abbiamo ritenuto particolarmente significative e importanti. 2.1

Misura degli insiemi limitati

In questo paragrafo definiamo la misura (secondo Lebesgue) degli insiemi limitati di u semplici (gli Rn . Procederemo per gradi, a partire dagli insiemi geometricamente pi` n-intervalli) per arrivare a insiemi di tipo qualsiasi. Indicheremo con |E| la misura dell’insieme11 E di Rn . 11 Scriveremo |E| quando sia necessario precisare la dimensione dello spazio. Queste notazioni sono n le stesse gi` a utilizzate nella Sezione 1, per indicare la misura di E secondo Peano-Jordan; poich´ e come vedremo, la misura di Lebesgue ` e un’estensione della precedente, l’uso degli stessi simboli non porta alcuna confusione.

344

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

1. Intervalli e plurintervalli Sia Q un intervallo limitato di Rn , o, come anche si dice, un n-intervallo, cio`e il prodotto cartesiano di n intervalli di R: Q = [a1 , b1 ] ⇥ [a2 , b2 ] ⇥ . . . ⇥ [an , bn ]

(2.1)

(si osservi che gli intervalli considerati sono chiusi). La misura (n-dimensionale) di Q `e semplicemente il prodotto delle lunghezze degli intervalli [ai , bi ]: |Q| := (b1

a1 )(b2

a2 ) . . . (bn

an ).

Tale definizione, gi` a usata nella Sezione 1, `e la naturale estensione delle definizioni di area di un rettangolo e volume di un parallelepipedo.

b2

a2

a1

b1

Figura 5.21. Plurintervalli in R2 .

Sia ora D1 una suddivisione dell’intervallo [a1 , b1 ], D2 una suddivisione di [a2 , b2 ], . . ., Dn una suddivisione di [an , bn ]; il prodotto D = D1 ⇥D2 ⇥. . . Dn determina una suddivisione di Q in tanti sottointervalli di Rn ; chiamiamo plurintervallo (o plurirettangolo) l’unione di un numero finito di questi sottointervalli: R=

N [

Qi

i=1

dove i Qi sono sottointervalli di Q relativi alla suddivisione D. La misura di un plurintervallo viene definita come la somma delle misure degli intervalli di cui `e costituito: (2.2)

|R| :=

N X i=1

|Qi |.

` chiaro che uno stesso plurintervallo pu` E o risultare dalla unione di intervalli diversi, corrispondenti a diverse suddivisioni di Q; ma `e altres`ı chiaro che la sua misura non dipende dalla scelta della suddivisione (Esercizio 1).

c 978-88-08-63708-6

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

345

Nel seguito utilizzeremo alcune propriet` a della misura dei plurintervalli, facili conseguenze della definizione (2.2); se R1 e R2 sono plurintervalli, si ha: i) |R1 |  |R2 | se R1 ✓ R2 ; ii) |R1 [ R2 |  |R1 | + |R2 |; il segno uguale vale se e solo se R1 e R2 non hanno intervalli in comune. 2. Insiemi aperti e insiemi chiusi Passiamo ora a definire la misura degli aperti e dei chiusi di Rn . DEFINIZIONE 2.1 Siano Q un n-intervallo e A ⇢ Q un aperto non vuoto di Rn ; la misura di A `e l’estremo superiore delle misure dei plurintervalli contenuti in A: (2.3)

|A| := sup{|H| : H plurintervallo, H ⇢ A}.

Risulta chiaramente |A|  |Q|; risulta anche |A| > 0; infatti se x 2 A, esiste un intorno B(x, r) di x, di raggio r > 0, tutto contenuto in A; questo intorno contiene p almeno un n-intervallo: per esempio, il cubo n-dimensionale di lato r/ 2. Osserviamo anche che, se R ✓ Q `e un plurintervallo, ed R `e l’aperto costituito dai

punti interni di R, risulta |R| = |R| (Esercizio 2).

DEFINIZIONE 2.2 Sia C ✓ Q un chiuso di Rn ; la misura di C `e l’estremo inferiore delle misure dei plurintervalli contenenti C: (2.4)

|C| := inf{|K| : K plurintervallo, K ◆ C}.

` chiaro che, nella (2.4) possiamo limitarci a considerare i plurintervalli K ✓ Q; E risulta perci` o |C|  |Q|, se poi C = Q, si ha evidentemente |C| = |Q|. Che possa poi essere |C| = 0 anche per insiemi chiusi non vuoti `e gi` a noto: infatti la caratterizzazione degli insiemi di misura nulla data nella Proposizione 1.5 `e un caso particolare della Definizione 2.2 se l’insieme `e chiuso. Le propriet` a principali della misura degli aperti e dei chiusi, sopra introdotta, sono raccolte nella proposizione seguente. PROPOSIZIONE 2.1 Siano A, A1 , A2 insiemi aperti, C, C1 , C2 chiusi, B1 , B2 aperti oppure chiusi (contenuti in Q). Risulta allora: |B1 |  |B2 | |A1 [ A2 |  |A1 | + |A2 | |C1 [ C2 |  |C1 | + |C2 | iii) |A1 [ A2 | = |A1 | + |A2 | |C1 [ C2 | = |C1 | + |C2 | iv) |A\C| = |A| |C|

i) ii)

se B1 ✓ B2

se A1 \ A2 = ? se C1 \ C2 = ? se C ⇢ A

` immediato estendere la ii) e la iii) a un numero finito qualunque di addendi. E

346

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Dimostrazione. La dimostrazione di i) `e suggerita nell’Esercizio 3. Proviamo la ii) per gli aperti. Sia H un plurintervallo contenuto in A1 [ A2 . Raffinando eventualmente la suddivisione di Q si pu` o supporre che ogni intervallino di H sia contenuto in A1 oppure in A2 (Esercizio 4): sia H1 l’unione degli intervallini di H contenuti in A1 , H2 l’unione di quelli contenuti in A2 : abbiamo H = H1 [ H2 e perci` o |H|  |H1 | + |H2 |  |A1 | + |A2 | per ogni plurintervallo H ⇢ A1 [ A2 ; da ci` o segue la tesi. a anche H1 \ H2 = ?, e allora |H| = |H1 | + |H2 |, da Se poi A1 e A2 sono disgiunti, sar` cui ricaviamo |A| |H1 | + |H2 |. Facendo variare H1 e H2 in tutti i modi possibili, si ha a la iii) per gli aperti. |A| |A1 | + |A2 |, che, combinata con la precedente, d` Proviamo la ii) per i chiusi. Siano K1 e K2 due plurintervalli che ricoprono C1 e C2 rispettivamente; allora K1 [ K2 ricopre C = C1 [ C2 e perci` o |C| = |C1 [ C2 |  |K1 [ K2 |  |K1 | + |K2 |. Teniamo fisso K2 e facciamo variare K1 ; risulta allora: |C|  |C1 |+|K2 |, cio`e |K2 | facciamo ora variare K2 ; otteniamo |C2 | |C| |C1 |, da cui la tesi. Proviamo la iii) per i chiusi. Sia r = d(C1 , C2 ) la distanza di C1 da C2 , cio`e r=

inf

x1 2C1 ,x2 2C2

|C| |C1 |;

d(x1 , x2 );

questa distanza `e > 0 poich´e la funzione d(x1 , x2 ), continua sul compatto C1 [ C2 , essendo positiva ha un minimo positivo. Sia K un plurintervallo che ricopre C1 [ C2 , costituito da intervallini, ognuno con diametro < r/2. Sia K1 l’unione degli intervallini di K che hanno punti in comune con C1 , K2 l’unione di quelli che hanno punti in comune con C2 ; abbiamo K1 [ K2 ✓ K

C2 ✓ K1

K1 \ K2 = ? C2 ✓ K2

e perci` o |K|

|K1 [ K2 | = |K1 | + |K2 |

|C1 | + |C2 |;

allora, tenuto conto della ii), segue la tesi. Proviamo infine la iv). Osserviamo anzitutto che A\C `e un aperto. Sia ora B un aperto tale che B C e |B| < |C| + " (basta prendere la parte interna di un plurintervallo R con |R| < |C| + "). Allora, osservando che l’aperto A = C [ (A\C) `e contenuto nell’aperto B [ (A\C), si ha, per ogni " > 0, |A|  |B [ (A\C)|  |B| + |A\C|  |C| + |A\C| + " da cui |A|  |C| + |A\C|.

(2.1)

Sia ora D un chiuso (per esempio, un plurintervallo), D ⇢ A\C e |D| > |A\C| |A| = |C [ (A\C)|

|C [ D| = |C| + |D| > |C| + |A\C|

"; si ha

"

da cui (2.2)

|A|

|C| + |A\C|.

Combinando le (2.1) e (2.2) otteniamo la tesi. Il teorema `e completamente dimostrato.



c 978-88-08-63708-6

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

347

3. Insiemi di tipo generale Avendo cos`ı definito la misura degli aperti e dei chiusi, possiamo ora considerare un generico insieme di Rn , limitato. DEFINIZIONE 2.3 Sia E ✓ Q, Q intervallo di Rn . La misura esterna di E, |E|⇤ , `e l’estremo inferiore delle misure degli aperti che ricoprono E; la misura interna di E, |E|⇤ , `e l’estremo superiore delle misure dei chiusi contenuti in E: |E|⇤ := inf{|A| : A aperto, A ◆ E} |E|⇤ := sup{|C| : C chiuso, C ✓ E}. PROPOSIZIONE 2.2 Per ogni insieme E ✓ Q risulta: (2.3)

|E|⇤

|E|⇤ .

Dimostrazione. Sia C un chiuso e A un aperto con C ✓ E ✓ A. Abbiamo, per la i) della Proposizione 2.1, (2.4)

|C|  |A|.

Essendo la (2.4) valida per ogni chiuso C ✓ E e ogni aperto A ◆ E, segue la (2.3).



OSSERVAZIONE 2.1 Se E `e un aperto e |E| `e la sua misura, precedentemente definita, si ha: |E|⇤ = |E| = |E|⇤ . La prima uguaglianza `e ovvia; per la seconda si osservi che, essendo i plurintervalli particolari insiemi chiusi, si ha: |E| = sup{|H| : H plurintervallo, H ⇢ E}   sup{|C| : C chiuso, C ⇢ E} = |E|⇤ e perci` o, tenuto conto della (2.3), sar` a |E| = |E|⇤ . Analogamente, se E `e un chiuso, risulta |E|⇤ = |E| = |E|⇤ . Gli aperti e i chiusi non sono certo gli unici insiemi per cui accade che la misura interna coincida con la misura esterna; anzi questa circostanza, come vedremo, `e praticamente la regola. DEFINIZIONE 2.4 Un insieme E limitato di Rn si dice misurabile (secondo Lebesgue) se le sue misure interna ed esterna sono uguali. Il numero |E| := |E|⇤ = |E|⇤ si chiama misura (n-dimensionale) di E. Segue subito dalla definizione che: condizione necessaria e sufficiente perch´e E sia misurabile `e che, fissato " > 0, esistano un aperto A e un chiuso C, con C ✓ E ✓ A, tali che (2.5)

|A|

|C| < "

348

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Figura 5.22. Misura di Peano Jordan. Plurirettangoli contenuti in e contenenti un insieme.

o anche, tenuto conto della iv) della Proposizione 2.1, (2.6)

|A\C| < ".

OSSERVAZIONE 2.2 Misura di Lebesgue e misura di Peano-Jordan. Nella Sezione 1 abbiamo definito la misura secondo Peano-Jordan; un insieme E ✓ Q `e PJ-misurabile R se esiste l’integrale multiplo Q 1E dx, e il valore di questo integrale `e la PJ-misura di E. Ma una somma inferiore s(D) di questo integrale (relativa a una suddivisione D di Q) rappresenta la misura di un plurintervallo contenuto in E, mentre una somma superiore S(D) rappresenta la misura di un intervallo contenente E; perci` o sup s viene D

definita come la misura interna (secondo Peano-Jordan) di E, inf S come misura D esterna. La misura di Peano-Jordan di↵erisce dunque da quella di Lebesgue per il fatto che le misure interna ed esterna di un insieme E vengono definite utilizzando plurintervalli, invece che insiemi chiusi e aperti. D’altra parte, tenendo conto che la misura di un plurintervallo R coincide con la misura dell’aperto R si vede che un insieme PJmisurabile `e anche misurabile (nel senso di Lebesgue) e le due misure coincidono. D’ora in avanti, parlando di insiemi misurabili, intenderemo sempre nel senso di Lebesgue. OSSERVAZIONE 2.3 (Sugli insiemi di misura nulla) Gli insiemi di misura nulla occupano una particolare posizione nella teoria di Lebesgue, poich´e essi non giocano alcun ruolo in molte questioni, come vedremo parlando dell’integrale; perci` o essi sono anche detti insiemi trascurabili. Affinch´e un insieme E sia misurabile con misura nulla, occorre e basta che sia |E|⇤ = 0, cio`e che, fissato " > 0, si possa trovare un aperto A" E, tale che sia |A" | < " (si noter` a che gli insiemi di misura nulla introdotti in 1.3 rientrano ovviamente in questa classe). Pi` u avanti vedremo vari esempi di insiemi trascurabili; per ora osserviamo che: ogni sottoinsieme misurabile di un insieme trascurabile `e pure trascurabile.

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

c 978-88-08-63708-6

2.2

349

Propriet` a della misura

DEFINIZIONE 2.5 Sia F una famiglia di insiemi contenuti in un n-intervallo Q di Rn (in questa definizione l’n-intervallo potrebbe anche non essere limitato, per esempio coincidere con Rn ), cio`e F ✓ P(Q). Diremo che F costituisce un’algebra se: i) ?, Q 2 F; ii) E, F 2 F ) E [ F, E\F 2 F.

Da i) e ii) si ricava che anche E \ F = E\(E\F ) 2 F e il complementare (rispetto a ` inoltre chiaro Q) di ogni insieme E 2 F appartiene pure a F, essendo CQ E = Q\E. E N N S T che, se E1 , E2 , . . . , EN 2 F anche Ei e Ei 2 F; in altre parole, la famiglia F `e i=1

i=1

chiusa rispetto alle operazioni fondamentali definite sugli insiemi, ripetute un numero finito di volte. Per esempio, la coppia {?, Q} forma un’algebra (minima) cos`ı come la totalit` a dei sottoinsiemi di Q, P(Q), forma un’algebra (massima). TEOREMA 2.3 Dati due insiemi misurabili E, F (contenuti nell’intervallo Q) anche gli insiemi E [ F , E \ F , E\F , CQ E sono misurabili e risulta: (2.7) (2.8)

|E|  |F | se E✓F |E| + |F | = |E [ F | + |E \ F |.

In particolare, se E ed F sono disgiunti, o almeno la loro intersezione `e un insieme trascurabile, risulta: (2.9)

|E [ F | = |E| + |F |.

La dimostrazione del Teorema 2.3 sar` a presentata nel prossimo paragrafo. Osserviamo che il teorema a↵erma, tra l’altro, che la famiglia degli insiemi misurabili costituisce un’algebra. Si potrebbe dimostrare che la stessa propriet` a vale anche per gli insiemi PJ-misurabili; anch’essi formano un’algebra, contenuta nell’algebra degli insiemi misurabili. Il Teorema 2.3 non presenta dunque alcun risultato nuovo rispetto a quanto si sarebbe potuto dimostrare gi` a nella Sezione 1 per gli insiemi PJ-misurabili. L’importanza decisiva della nuova misura rispetto a quella di Peano-Jordan `e costituita dal fatto che la classe degli insiemi misurabili resta chiusa rispetto alle operazioni insiemistiche fondamentali (unione e intersezione) ripetute un’infinit` a misurabile di volte. TEOREMA 2.4 Siano E1 , E2 , . . . , En , . . . insiemi misurabili (tutti contenuti nell’inter1 1 S T vallo Q); sia E = Ei , G = Ei ; si ha: i=1

i) E `e misurabile: 1 P ii) |E|  |Ei |;

iii) |E| =

i=1 1 P i=1

i=1

|Ei | se Ei \ Ej = ?

8 i 6= j;

350

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

iv) |E| = lim |Ei | se E1 ✓ E2 ✓ . . .; i!1

v) G `e misurabile; vi) |G| = lim |Ei | se E1 ◆ E2 ◆ . . . . i!1

Le propriet` a espresse dalla ii) e dalla iii) vengono dette rispettivamente, subadditivit` a e additivit` a numerabile (o completa) della misura; si dice anche che la famiglia degli insiemi misurabili costituisce una -algebra: con ci` o si intende dire che essa costituisce un’algebra, e, in pi` u, l’unione e l’intersezione di una infinit` a numerabile di insiemi della famiglia `e ancora un insieme dello stesso tipo. Per comprendere l’importanza delle propriet` a sopra elencate (la cui dimostrazione sar` a data nel prossimo paragrafo) si osservi che l’intersezione di una infinit` a numerabile di aperti non `e in generale un aperto, e l’unione di una infinit` a numerabile di chiusi non `e in generale un chiuso; tuttavia l’insieme definito da queste operazioni, per complicato che sia, resta misurabile, come lo sono tutti i chiusi e tutti gli aperti. Notiamo infine un’ultima propriet` a della misura (condivisa anche dalla misura di Peano-Jordan), di natura diversa da quelle espresse nei Teoremi 2.3 e 2.4 che avremo occasione di richiamare nel seguito. PROPOSIZIONE 2.5 Sia E un insieme misurabile di Rn (contenuto nell’intervallo Q); i) dato il vettore h 2 Rn , si consideri l’insieme Eh = {y 2 Rn : y = x + h, x 2 E}; Eh `e misurabile e |E| = |Eh | (invarianza per traslazioni) ii) data una matrice A, n ⇥ n, ortogonale, si consideri l’insieme F = {y 2 Rn : y = Ax, x 2 E} F `e misurabile e |E| = |F |

(invarianza per trasformazioni ortogonali).

La dimostrazione della proposizione `e accennata nell’Esercizio 5. Diamo ora alcuni esempi significativi di insiemi misurabili. Esempi 2.1 L’insieme X dei numeri razionali compresi tra 0 e 1 `e misurabile, con misura (unidimensionale) nulla. Ci` o pu` o essere provato direttamente: sia {r1 , r2 , . . . } la successione dei numeri razionali compresi tra 0 e 1; fissato " > 0, copriamo r1 con un intervallino (aperto) di misura "/2, r2 con uno di misura "/22 , r3 con uno di misura "/23 e cos`ı via; l’unione di questi intervallini aperti `e un aperto A" che contiene Q; la 1 P misura di A" , per la ii) del Teorema 2.4, `e  "2 i = ". i=1

Pi` u semplicemente, si pu` o osservare che: un punto ha misura nulla; un’infinit` a numerabile di punti, per la iii) del Teorema 2.4, ha pure misura nulla; dunque Q ha misura nulla. Pi` u in generale, l’unione di una infinit` a numerabile di insiemi di misura nulla `e un insieme di misura nulla.

c 978-88-08-63708-6

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

351

Si ricordi che l’insieme X, essendo @X = [0, 1], non `e misurabile secondo PeanoJordan. 2.2 L’insieme Y dei numeri irrazionali compresi tra 0 e 1 `e misurabile con misura 1. Infatti risulta Y = [0, 1]\X; perci` o Y `e misurabile (Teor. 2.3); inoltre Y [ X = [0, 1] e Y \ X = ?; perci` o |Y | + |X| = 1, cio`e |Y | = 1. 2.3 Insieme di Cantor. Gli insiemi di misura nulla non sono soltanto quelli con la potenza del numerabile. Il seguente `e un esempio di insieme (della retta) con la potenza del continuo e di misura nulla. Consideriamo l’intervallo [0, 1], dividiamolo in tre parti uguali e togliamo l’intervallo aperto di mezzo, cio`e l’intervallo (1/3, 2/3). Ora suddividiamo ciascuno dei rimanenti due intervalli [0, 1/3] e [2/3, 1] in tre parti uguali e ancora togliamo gli intervalli aperti di mezzo, cio`e (1/9, 2/9) e (7/9, 8/9). Procediamo allo stesso modo indefinitamente. I primi tre passi di questa costruzione sono illustrati in Figura 5.23. (............................) 1/3 2/3

0 0

(.........) 1/9 2/9

1

(............................) 1/3 2/3

(...) (.........) (...) (............................)

(.........) 7/9 8/9

1

(...) (.........) (...)

0

1

Figura 5.23. Costruzione dell’insieme di Cantor.

Se indichiamo con Ck l’unione degli intervalli rimasti al k-esimo passo, definiamo insieme di Cantor l’insieme 1 \ Ck C= k=1

Poich´e ogni Ck `e chiuso, C `e chiuso. Ogni Ck consiste di 2k intervalli chiusi e disgiunti, ognuno di lunghezza 3 k . Poich´e C1 C2 . . ., abbiamo, per la vi) del Teorema 2.4, |C| = lim |Ck | = lim 2k · 3 k!1

k!1

k

= 0.

Nell’Esercizio 7 si prover` a che C ha la potenza del continuo. C `e misurabile anche secondo Peano-Jordan? 2.4 Siano X1 , X2 , X3 gli insiemi dei punti del quadrato [0, 1] ⇥ [0, 1] rispettivamente con ascissa razionale, con ordinata razionale, con entrambe le coordinate razionali. a numerabile di segmenti verticali nel quadrato, ognuno X1 `e l’unione di una infinit` dei quali ha misura (bidimensionale) nulla; analogamente X2 `e unione di infiniti sega numerabile; in conclusione tutti e tre menti orizzontali; i punti di X3 sono un’infinit` hanno misura (bidimensionale) nulla. La classe degli insiemi misurabili `e cos`ı vasta che `e lecito chiedersi se esistano insiemi non misurabili. La risposta `e a↵ermativa; ma va detto che, per la costruzione di

352

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

un esempio di insieme non misurabile si fa uso sostanziale dell’assioma di Zermelo (si veda l’appendice al Cap. 1, Vol. 1); il che significa che, in nessun caso, possiamo assegnare una legge esplicita per la costruzione di detto insieme, ma possiamo soltanto a↵ermarne l’esistenza. Nei Complementi a questa sezione `e accennata la costruzione di un insieme non misurabile. 2.3

Dimostrazione delle propriet` a della misura

Dimostrazione del Teorema 2.3. Mostriamo anzitutto che E\F `e misurabile. Fissato " > 0, siano A1 , A2 due aperti, C1 , C2 due chiusi tali che C1 ✓ E ✓ A1 , C2 ✓ F ✓ A2 ,

|A1 \C1 | < "/2

|A2 \C2 | < "/2.

Posto A = A1 \C2 e C = C1 \A2 , A `e un aperto e C `e un chiuso tali che C ✓ E\F ✓ A. Mostriamo che |A\C| < ". Infatti A\C `e un aperto e A

C ✓ (A1 \C1 ) [ (A2 \C2 )

e perci` o |A\C|  |A1 \C1 | + |A2 \C2 | < ".

Ci` o prova che E\F `e misurabile. Segue allora immediatamente che sono misurabili anche gli insiemi CQ E = Q\E, e E \F = E\(E\F ). Mostriamo che E [ F `e misurabile; basta provare l’a↵ermazione nel caso che E ed F siano disgiunti, perch´e, diversamente, si scrive (2.10)

E [ F = (E \ F ) [ (E\F ) [ (F \E)

e gli insiemi a secondo membro della (2.10) sono a due a due disgiunti. Supponiamo dunque che E ed F siano disgiunti; siano A1 , A2 , C1 , C2 scelti come in precedenza. Posto ora A = A1 [ A2 e C = C1 [ C2 risulta A ◆ E [ F ◆ C. Poich´e, per la iii) della Proposizione 2.1, |C| = |C1 | + |C2 |, abbiamo |A\C| = |A|

|C|  |A1 | + |A2 |

|C1 |

|C2 | = |A1 \C1 | + |A2 \C2 | < ".

Perci` o E [ F `e misurabile. Proviamo ora la (2.9). Essendo |C1 |  |E|  |A1 | < |C1 | + "/2

|C2 |  |F |  |A2 | < |C2 | + "/2 deduciamo che

|C| = |C1 | + |C2 |  |E| + |F | < |C1 | + |C2 | + " = |C| + "; ma, essendo anche |C|  |E [ F |  |A| < |C| + ",

c 978-88-08-63708-6

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

353

ne segue ||E [ F |

|E|

per l’arbitrariet` a di ", la (2.9) `e provata. Per provare la (2.8) baster` a scrivere

|F || < ";

E = (E \ F ) [ (E\F ),

F = (E \ F ) [ (F \E)

|E| = |E \ F | + |E\F |,

|F | = |E \ F | + |F \E|;

e perci` o essendo anche, per la (2.10)

|E [ F | = |E \ F | + |E\F | + |F \E|, otteniamo la (2.8) combinando le ultime tre relazioni scritte. Infine la (2.7) segue dal fatto che, essendo, se F ◆ E, F = E [ (F \E) con E \ (F \E) = ?, abbiamo |F | = |E| + |F \E| |E|

Il Teorema 2.3 `e completamente dimostrato.



Alla dimostrazione del Teorema 2.4 premettiamo due lemmi. LEMMA 2.6 Sia A1 , A2 , . . . una successione di aperti e sia A =

(2.12)

Ai limitato; allora

i=1

risulta (2.11)

1 S

|A| 

1 X i=1

|Ai |

|A| = lim |Ai | i!1

se A1 ✓ A2 ✓ . . .

Dimostrazione. Essendo A un aperto, A `e misurabile. Sia H un plurintervallo contenuto in A; la famiglia di aperti {Ai } (i = 1, 2, . . .) costituisce una copertura di H. Poich´e H `e compatto, si pu` o estrarre da essa una famiglia finita A1 , . . . , Ap di aperti che sia ancora una copertura di H: (2.13)

H ⇢ A1 [ A2 [ . . . [ Ap .

Avremo allora (2.14)

|H| 

p X i=1

|Ai | 

1 X i=1

|Ai |;

poich´e la (2.14) `e vera per ogni plurintervallo contenuto in A, `e vera la (2.11). o |Ai |  |A| per ogni i. D’altra Supponiamo ora che A1 ✓ A2 ✓ . . .; allora Ai ✓ A e perci` o ammette limite finito e parte la successione {|Ai |} `e monotona crescente e limitata; perci` risulta (2.15)

lim |Ai |  |A|.

i!1

Ma, se H `e un plurintervallo contenuto in A, ragionando come sopra, dalla (2.13) ricaviamo anche che H ⇢ Ap e perci` o |H|  |Ap | per un certo p. Allora, essendo la successione {|Ai |} crescente, risulta che (2.16)

|H|  lim |Ai |. i!1

354

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

La (2.16) vale per ogni plurintervallo contenuto in A; ne segue che |A|  lim |Ai |; i!1

questa disuguaglianza, insieme con la (2.15), prova la (2.12).



LEMMA 2.7 Siano E1 , E2 , . . . insiemi misurabili limitati e sia E =

1 S

Ei ; allora

i=1



|E| 

(2.17) (2.18)

|E|⇤

1 X i=1 1 X i=1

|Ei | |Ei |

se Ei \ Ej = ?

8 i 6= j.

Dimostrazione. Fissato " > 0, sia Ai un aperto tale che |Ai | < |Ei | + "2 i .

Ai ◆ Ei , Posto A =

1 S

Ai , A `e un aperto che contiene E e perci` o (usando la (2.11))

i=1

|E|⇤  |A| 

1 X

|Ai |
|B| ", da cui, per l’arbitrariet` a di ", segue l’asserto.

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

c 978-88-08-63708-6

355

o |Fi |  |Ei |, Dimostriamo la ii). Sempre per la iii), tenuto conto che Fi ✓ Ei 8 i, e perci` risulta anche 1 1 X X |Fi |  |Ei |. |E| = i=1

i=1

Dimostriamo la iv). Per ipotesi E1 ✓ E2 ✓ . . .; risulta, 8 i = 2, 3, . . .: Ei = Ei da cui |Ei | = |Ei

1|

+ |Ei \Ei

1 |,

1

[ (Ei \Ei

cio`e |Ei \Ei

1|

1)

= |Ei |

E = E1 [ (E2 \E1 ) [ . . . [ (Ei \Ei

|Ei 1)

1 |,

e perci` o, essendo

[ ...

(unione di insiemi a due a due disgiunti) abbiamo |E| = |E1 | + (|E2 |

|E1 |) + . . . + (|Ei |

|Ei

1|

+ . . . = lim |Ei |. i!1

Dimostriamo v). Siccome gli Ei sono misurabili, tali sono anche i CEi . Inoltre CG = ✓1 ◆ la 1 S S C Ei = CEi e perci` o CG `e misurabile, e dunque anche G lo `e (l’operazione C `e fatta i=1

i=1

rispetto all’intervallo A che contiene tutti gli Ei ). Dimostriamo la vi). Con l’ipotesi E1 ◆ E2 ◆ . . . possiamo scrivere E1 = G [ (E1 \E2 ) [ . . . [ (Ei \Ei+1 ) [ . . .

(unione di insiemi misurabili a due a due disgiunti) e dunque abbiamo |E1 | = |G| + (|E1 |

|E2 |) + . . . + (|Ei |

|Ei+1 |) + . . . = |G| + |E1 |

da cui segue la vi). Il teorema `e completamente dimostrato.

lim |Ei |,

i!1



2.4 Insiemi non limitati ` naturale aspettarsi che, Definiamo una misura anche per insiemi non limitati di Rn . E in tal caso, un insieme possa avere misura infinita. DEFINIZIONE 2.6 Sia E ✓ Rn e sia {Qk } (k = 1, 2, . . .) la successione degli n-intervalli (ipercubi): |xi |  k (i = 1, 2, . . . , n). Diremo allora che E `e misurabile se E \ Qk `e misurabile per ogni k; porremo |E| := lim |E \ Qk |. k!1

Si osservi che il limite indicato esiste poich´e la successione {|E \ Qk |} `e crescente; tale limite pu` o essere finito o +1. Indicheremo con M la classe degli insiemi misurabili. OSSERVAZIONE 2.4 Perch´e la definizione abbia senso, bisogna mostrare che la misurabilit` a di E (e la sua misura) dipendono soltanto dall’insieme E stesso, e non dagli insiemi Qk utilizzati nella definizione. Infatti, sia B la totalit` a degli insiemi misurabili e limitati di Rn . Preso un qualsiasi o elemento B 2 B, esiste un Qk che lo contiene; perci` E \ B = E \ (Qk \ B) = (E \ Qk ) \ B;

356

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Q3

E Q2

Q3

|E| : = lim |E

.

E

.

Q1

k→∞

Qk|

Figura 5.24.

dunque la misurabilit` a di tutti gli insiemi E \ Qk implica la misurabilit` a di E \ B, qualunque sia B; e viceversa. Con analogo ragionamento si vede anche che: |E| = lim |E \ Qk | = sup |E \ Qk | = sup |E \ B|. k!1

B2B

k

` evidente, da quanto detto, che, nella Definizione 2.6, in luogo degli n-intervalli Qk E si possono considerare intorni sferici dell’origine di raggio k o altre convenienti figure geometriche. Esempi 2.5 Tutto lo spazio Rn `e misurabile con misura (n-dimensionale) +1. Ogni sottospazio di Rn di dimensione k < n `e misurabile con misura (n-dimensionale) nulla. 2.6 L’insieme costituito dalla totalit` a dei punti di Rn con almeno una coordinata razionale `e di misura nulla (ricordare l’Esempio 2.4). In particolare l’insieme dei punti della retta aventi ascissa razionale `e un insieme trascurabile. Le a↵ermazioni contenute nei Teoremi 2.3 e 2.4 (tranne la vi)) e nella Proposizione 2.5 si trasportano inalterate al caso generale di insiemi non necessariamente limitati. La tecnica dimostrativa `e standard e non presenta difficolt` a. Come esempio, estendiamo al caso generale la propriet` a iii) del Teorema 2.4. Dimostrazione. Sia Qk la successione di n-intervalli: |xi |  k (i = 1, 2, . . . , n) e poniamo S1 = Q1 , Sk = Qk \Qk 1 per k 2. Gli S insiemi Ej,k = Ej \ Sk (j, k = 1, 2, . . .) sono limitati, o abbiamo disgiunti, e misurabili; inoltre Ej = Ej,k ; perci` k

S j

Ej =

S

j,k

Ej,k =

X j,k

|Ej,k | =

XX j

k

|Ej,k | =

X j

|Ej |



2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

c 978-88-08-63708-6

357

Abbiamo allora il seguente TEOREMA 2.8 Siano E1 , E2 , . . . insiemi misurabili di Rn ; sia E = allora anche E e G sono misurabili e risulta (2.19)

|E| 

(2.20)

|E| =

1 X i=1 1 X i=1

Ei e G =

i=1

1 T

Ei ;

i=1

|Ei | |Ei |

|E| = lim |Ei |

(2.21)

1 S

i!1

se E1 \ Ej = ?

8 i 6= j

se E1 ✓ E2 ✓ . . .

OSSERVAZIONE 2.5 Le (2.19), (2.20), (2.21) sono significative quando gli insiemi Ei eventualmente illimitati, hanno misura finita; esse infatti diventano banali se, per almeno un i, risulta |Ei | = +1. La vi) del Teorema 2.4 non si trasporta al caso di insiemi illimitati; infatti, sia Ei il complementare (in Rn ) della palla di centro 0 e raggio i; allora |Ei | = +1 per ogni T T i, E1 E2 . . ., Ei = ?; perci` o risulta lim |Ei | = +1 mentre Ei = 0. i

i!1

i

*2.5 Misura e dimensione. Insiemi frattali Riprendiamo in esame l’insieme di Cantor C dell’Esempio 2.3. Si tratta di un insieme compatto, coincidente con il suo derivato C 0 , ovvero tutti i punti di C sono di accumulazione per C stesso; C `e dunque un insieme perfetto. Come abbiamo visto, C ha la potenza del continuo, tuttavia, per la misura di Lebesgue, esso `e trascurabile, essendo |C| = 0. Tutto ci` o pu` o sembrare piuttosto sorprendente. Si potrebbe pensare che la misura di Lebesgue non sia abbastanza raffinata da tener conto delle caratteristiche di C. L’insieme C `e un esempio, forse il pi` u semplice, di insieme frattale (dal latino: fractus = rotto, spezzato), termine coniato da B. Mandelbrot negli anni 70 per indicare insiemi che non rientravano negli schemi classici della Geometria e dell’Analisi. Un altro esempio di frattale, questa volta nel piano, `e la curva di Von Koch. Essa `e costruita nel modo seguente: si parte dal segmento E0 = [0, 1]; sia E1 la spezzata che si ottiene rimuovendo il terzo medio di E0 , (1/3, 2,3), e rimpiazzandolo con due segmenti di lunghezza 1/3 in modo che questi ultimi formino con il terzo medio rimosso un triangolo equilatero. Si costruisce E2 applicando la stessa procedura a ognuno dei quattro segmenti di E1 ; in generale, si costruisce Ek applicando ancora la medesima procedura, ai 4k 1 segmenti di Ek 1 . Quando k ! +1 la successione di poligonali Ek definisce un insieme limite E, detto curva di Von Koch (Fig. 5.25). Non esiste oggi un’unica, soddisfacente definizione di frattale. L’atteggiamento corrente `e quello di considerare frattale un insieme F che abbia propriet` a simili alle quattro elencate qui di seguito: i) Autosimilarit` a: F `e unione di un numero di parti che, ingrandite di un certo fattore, riproducono tutto F ; in altri termini F `e unione di copie di se stesso a scale di↵erenti.

358

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

E0

E1

E2

E3

E4

. . . Figura 5.25. Costruzione della curva di Von Koch.

Per esempio l’insieme di Cantor `e l’unione di 4 copie di se stesso scalate di un fattore 1/9 (o di 16 copie scalate di un fattore 1/27 ecc.). La curva di Von Koch `e l’unione di 4 copie di se stessa scalate di un fattore 1/3. ii) Struttura fine: F rivela dettagli a ogni ingrandimento. Per esempio, pi` u si ingrandisce la figura dell’insieme di Cantor, e un maggior numero di spazi vuoti si rivelano all’osservatore. iii) Irregolarit` a: F non si pu` o descrivere come luogo di punti che soddisfano semplici condizioni geometriche o analitiche. La quarta propriet` a fa intervenire il concetto di dimensione ed `e forse la pi` u importante e distintiva. Il concetto di dimensione `e stato introdotto a proposito degli spazi vettoriali euclidei. Sappiamo che lo spazio euclideo Rn ha dimensione n, cio`e ogni sua base `e composta precisamente di n vettori. Per la considerazione degli insiemi frattali `e conveniente estendere il concetto di dimensione agli insiemi contenuti negli spazi euclidei. Siano dunque A, B, . . . , A1 , A2 . . . insiemi di Rn ; indichiamo con dim(A) la dimensione dell’insieme A. Una buona definizione di dimensione dovrebbe soddisfare, ragionevolmente, le seguenti propriet` a: a) A = Rk ) dim(A) = k; k intero, 0 < k  n; b) A ✓ B ) dim(A)  dim(B) (monotonia);

c 978-88-08-63708-6

c) d) e) f)

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

359

A ✓ Rn aperto ) dim(A) = n; A numerabile ) dim(A) = 0; Invarianza per traslazioni, rotazioni, similarit` a; dim(A [ B) = max{dim(A), dim(B)} (stabilit` a).

Invece della f) si pu` o richiedere la -stabilit` a: f0 ) A =

1 S

j=1

Aj ) dim(A) = max{dim(Aj )}. j

Un esempio di estensione, abbastanza naturale, `e quello di dimensione topologica che si pu` o definire nel modo ricorsivo seguente: La dimensione topologica di un insieme F ✓ Rn `e sempre un intero naturale. ` 0 se F `e totalmente sconnesso13 , `e 1 se ogni punto ha un intorno (in F ) E arbitrariamente piccolo con frontiera di dimensione 0, `e 2 se ogni punto ha un intorno (in F ) arbitrariamente piccolo con frontiera di dimensione 1, e cos`ı via. Evidentemente si ha, per l’insieme C di Cantor e la curva E di Von Koch: dimtop (C) = 0,

dimtop (E) = 1.

Anche questo tipo di dimensione non distingue tra C e, per esempio, l’insieme dei razionali in [0, 1]. Cambiamo punto di vista: sia F ⇢ Rn ; se operiamo una dilatazione su F di rapporto > 0, otteniamo l’insieme F := { x 2 Rn : x 2 F }. La formula | F | = n |F | (vedere Esercizio 6) indica un legame tra la dimensione dello spazio e la misura di Lebesgue. Se ora |F | > 0 e F `e unione di m copie disgiunte m P n |F | = m n |F |, cio`e di se stesso, scalate di un fattore < 1, avremo |F | = 1=m

n

j=1

e infine

log m . log Si noti come in quest’ultima formula la misura di Lebesgue non compaia: la dimensione dipende da m e da soltanto. Si pu` o allora ragionevolmente definire, per insiemi che hanno la propriet` a di autosimilarit` a, una dimensione nel modo seguente. n=

DEFINIZIONE 2.7 Se F ✓ Rn `e unione di m(> 1) copie disgiunte di se stesso, scalate di un fattore < 1, si chiama dimensione di autosimilarit` a di F il numero reale non negativo: (2.22)

dimsim (F ) :=

log m . log

Abbiamo, per l’insieme di Cantor C e la curva di Von Koch E: dimsim (C) =

log 2 , log 3

dimsim (E) =

log 4 . log 3

13 Un insieme ` e totalmente sconnesso se non possiede sottoinsiemi connessi all’infuori di quelli costituiti da un solo punto.

360

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Si noti come

log 2 log 4 dimensione topologica. Nella iv) possono trovar posto dimensioni frattali diverse da quella di autosimilarit` a; infatti questa si applica a una classe troppo ristretta di insiemi. Molti dei frattali che si incontrano nelle applicazioni non sono rigorosamente autosimili. Inoltre rimane irrisolto il problema di “misurare” un frattale. Da un punto di vista teorico il tipo di “dimensione frattale” pi` u significativo `e forse quello dovuto ad Hausdor↵, sviluppatosi indipendentemente e molto tempo prima della teoria dei frattali. La dimensione di Hausdor↵ `e basta sulla definizione di misura di Hausdor↵, che risolve anche il problema di assegnare un “contenuto” a un frattale. Ne diamo qui un rapido cenno, limitandoci a sottoinsiemi del piano. Per F ✓ R2 e > 0 chiamiamo -copertura di F una famiglia {Cj }j 1 di cerchi di diametro dj  . Poniamo, per s reale non negativo: 8 9 1 s. H s (F ) pu` o essere 1 o un numero reale non negativo. DEFINIZIONE 2.9 Il valore critico s soddisfacente la (2.25) si chiama dimensione di Hausdor↵ di F e si indica con dimH (F ).

c 978-88-08-63708-6

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

361

La dimensione di Hausdor↵ verifica tutte le propriet` a a)-f0 ). Una volta determinata dimH (F ) = s,H s (F ) assegna il “contenuto” appropriato a F . Se F `e autosimile, allora dimH (F ) = dimsim (F ). 2 o mostrare poi, che Per l’insieme di Cantor C si ha dunque dimH (C) = log log 3 ; si pu` log 2/ log 3 H (C) = 1. Altre definizioni di dimensione, non meno significative di quelle qui presentate, sono state introdotte per un migliore adattamento della teoria all’ambito applicativo. La forte interazione con scienze sperimentali quali per esempio la meteorologia, la fluidodinamica, l’ecologia, la biologia, `e infatti una caratteristica della teoria dei frattali che ne sta determinando un rapido sviluppo, anche se per ora piuttosto di natura descrittiva. 2.6

Funzioni misurabili

Al concetto di insieme misurabile, sviluppato nei precedenti paragrafi, viene associato, in maniera naturale, il concetto di funzione misurabile; insiemi misurabili e funzioni misurabili sono i due ingredienti con i quali sar` a confezionato l’integrale di Lebesgue. Sar` a conveniente, qui e nel seguito di questo capitolo, considerare funzioni da Rn in R⇤ , cio`e permettere alle funzioni di assumere i valori +1 e 1; quando vorremo escludere tale circostanza, diremo che la funzione `e finita. DEFINIZIONE 2.10 Sia E ✓ Rn misurabile; una funzione f : E ! R⇤ si dice misurabile se, 8 t 2 R, l’insieme ⌦t (f, E) := {x 2 E : f (x) > t} `e misurabile. Si osservi che, prolungando la funzione f da E a tutto Rn (ponendo, per esempio, f = 0 su Rn \E) f : E ! R⇤ `e misurabile se e solo se il suo prolungamento `e misurabile; possiamo perci` o riferirci a funzioni definite su tutto Rn . In tal caso scriveremo semplicemente ⌦t (f ) in luogo di ⌦t (f, Rn ) o anche semplicemente ⌦t , se `e chiaro dal contesto quale sia la funzione f e {f > t} (e simili) in luogo di {x 2 Rn : f (x) > t}. Gli insiemi ⌦t (f ) vengono anche detti insiemi di livello della funzione f . Si noti che ⌦t (f ) = f 1 ((t, +1]) e cio`e ⌦t (f ) `e la controimmagine di (t, +1] tramite f . Esempi 2.7 Ogni funzione f : Rn ! R continua `e misurabile. Ci` o segue dal fatto che, 8 t 2 R, l’insieme ⌦t `e un aperto, quindi misurabile: infatti, se f (x0 ) > t, per il teorema della o permanenza del segno esiste un intorno di x0 in cui risulta ancora f (x) > t e perci` x0 `e punto interno di ⌦t . 2.8 La funzione di Dirichlet (da R in R) `e misurabile; infatti, se t < 0, ⌦t = R, se 0  t < 1, ⌦t = Q (insieme dei numeri razionali), se t 1, ⌦t = ?. Si noti che questa funzione `e discontinua in ogni punto di R.

362

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

La misurabilit` a di ⌦t , 8 t 2 R, `e equivalente alla misurabilit` a di vari altri insiemi; precisamente, posto ⌦1t := {f  t} = f ⌦2t ⌦3t

:= {f < t} = f := {f

t} = f

1 1 1

([ 1, t])

([ 1, t)) ([t, +1])

abbiamo la seguente PROPOSIZIONE 2.10 Sia i 2 {1, 2, 3}; le a↵ermazioni (i): ⌦it `e misurabile 8 t 2 R sono tra loro equivalenti e sono equivalenti all’a↵ermazione (0): ⌦t `e misurabile 8 t 2 R. Dimostrazione. (0) ) (1)

⌦1t = Rn \⌦t

(1) ) (2)

⌦2t =

(2) ) (3)

⌦3t = R \⌦2t

(3) ) (0)

⌦t =

1 [

⌦1t

1/k

k=1 n 1 [

⌦3t+1/k



k=1

Inoltre, se f `e misurabile, risulter` a anche misurabile 8 t 2 R l’insieme ⌦4t := {f = t} = ⌦1t \⌦2t , cio`e le superfici di livello di una funzione misurabile sono misurabili. Osserviamo anche che {t1 < f < t2 } = {f > t1 } \ {f t2 }, per cui anche questo insieme risulta misurabile per ogni t1 , t2 2 R. Poich´e ogni insieme aperto in R⇤ si pu` o scrivere come unione di un’infinit` a numea del seguente teorema. rabile di intervalli aperti, disgiunti14 , si deduce la validit` TEOREMA 2.11 f `e misurabile se e solo se la controimmagine f A ✓ R⇤ `e misurabile.

1

(A) di ogni aperto

Gli enunciati contenuti nella proposizione seguente mostrano che, eseguendo sulle funzioni misurabili le operazioni elementari, otteniamo ancora funzioni misurabili. Indichiamo con M = M(Rn ) la classe delle funzioni misurabili. PROPOSIZIONE 2.12 Siano f, g 2 M, c 2 R. Abbiamo i) cf, f + c 2 M; ii) l’insieme {f > g} `e misurabile; 14 Sia A ✓ R⇤ , aperto. Dato x 2 R⇤ , sia I il pi` u grande intervallo aperto contenente x e contenuto x S in A. Se x 6= x0 , allora Ix e Ix0 sono disgiunti. Si ha A = Ix . Poich´ e ogni Ix contiene un numero x2A

razionale, l’insieme degli intervalli Ix distinti deve essere al pi` u numerabile.

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

c 978-88-08-63708-6

363

iii) se f e g sono finite15 , anche f + g, f g, f /g (se g 6= 0) 2 M: iv) f+ , f , |f | 2 M. Dimostrazione. i) Viene lasciata per esercizio. ii) Sia x 2 Rn tale che f (x) > g(x); esiste allora un numero razionale r compreso tra f (x) e g(x). Se {rk } `e la successione dei numeri razionali, abbiamo [ [ {f > g} = {f > rk > g} = {f > rk } \ {g < rk }. k

k

iii) Proviamo che f + g 2 M. Infatti t g 2 M per ogni t 2 R (per la i)) e l’insieme {f > t g}, che coincide con l’insieme {f + g > t}, `e misurabile per p la ii). p t}, mentre, Proviamo che f 2 2 M. Infatti per t 0, si ha: {f 2 > t} = {f > t} [ {f < per t < 0, {f 2 > t} = Rn . Allora f g 2 M poich´e f g = 14 (f + g)2 14 (f g)2 . Proviamo che 1/g 2 M (g 6= 0). Infatti, per t > 0, si ha: {1/g < t} = {g > 1/t} [ {g < 0}; se t < 0,. . . Allora f /g 2 M (g 6= 0). 0. iv) {|f | > t} coincide con Rn se t < 0 mentre coincide con {f > t} [ {f < t} se t ⇤ Perci` o |f | `e misurabile e, di conseguenza, lo sono anche f+ , f .

Anche la seguente proposizione `e importante. PROPOSIZIONE 2.13 Sia {fk } una successione di funzioni misurabili. Allora le funzioni i) sup fk (x), inf fk (x) sono misurabili; k

k

ii) lim sup fk (x), lim inf fk (x) sono misurabili; k!1

k!1

iii) in particolare, se lim fk (x) esiste, la funzione limite `e misurabile. k!1

L’a↵ermazione iii) si enuncia dicendo che la classe delle funzioni misurabili `e chiusa rispetto all’operazione di passaggio al limite (puntuale). Possiamo confrontare questa propriet` a con una analoga valida per l’insieme delle funzioni continue: esso `e chiuso rispetto all’operazione di limite uniforme (non lo `e se il limite `e puntuale). Dimostrazione. i) {sup fk > t} = k

[ k

{fk > t};

ii) lim sup fk = inf {sup fk }; k!1

j

k j

inf fk = k

sup( fk ) k

lim inf fk = sup{ inf fk } k!1

j

k j



Concetto di propriet` a valida quasi ovunque A proposito degli insiemi di misura nulla, `e invalso nell’uso un modo di dire assai comune e molto comodo: si dice che una propriet` a `e valida quasi ovunque (abbreviato: 15 Poich´ e consentiamo alle funzioni f, g di assumere anche i valori +1 e 1, pu` o accadere che le espressioni f + g, f g, f /g non siano ben definite (possono intervenire le forme di indecisione 1 1, 0 · 1,. . . ). Perci` o assumiamo qui che le funzioni siano finite. Si potrebbe in alternativa, introdurre delle convenzioni apposite, tendenti a eliminare le forme di indecisione.

364

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

q.o.) in E, se essa vale in tutti i punti di E ad eccezione di un insieme trascurabile di E. Esempio 2.9 Funzione q.o. nulla. Sia f : E ! R⇤ ; f = 0 q.o. in E significa che f (x) = 0 per ogni x 2 E \ Z, con Z ⇢ E, |Z| = 0. Per esempio f (x) = 1Q (x), la funzione caratteristica dei razionali, `e nulla q.o. Esempio 2.10 Funzione definita q.o.; f : E ! R⇤ `e definita q.o. se `e definita in E \ Z, con Z ⇢ E, |Z| = 0. Esempio 2.11 Funzione q.o. limitata. Sia f : E ! R⇤ definita q.o.; f `e limtata superiormente q.o. in E se esiste una costante k tale che f (x) < k,

q.o. in E.

Per esempio, (2.26)

( 1 se x 6= n f (x) = n se x = n

n 2 N,

`e limitata q.o. in R. Si noti che f (x) = x1 , definita q.o. in R, non `e q.o. limitata anche se esiste un unico punto nell’intorno del quale `e illimitata. Per le funzioni q.o. limitate `e appropriata la nozione di estremo superiore essenziale, definito come segue: ess sup f = {inf k : f (x) < k q.o. in E}. E

Osserviamo che per la funzione in (2.26) si ha supR f = +1 mentre ess sup f = 1. Analogamente, ess sup 1Q = 0 mentre sup 1Q = 1.

R

R

Esempio 2.12 Funzione q.o. continua. Sia f : E ! R⇤ , definita q.o.; f `e q.o. continua in E se l’insieme dei suoi punti di discontinuit` a ha misura nulla. Per esempio f (x) = [x], parte intera di x, `e q.o. continua. Invece la funzione di Dirichlet (funzione caratteristica dei razionali) non `e q.o. continua, pur essendo q.o. nulla). Esempio 2.13 Successione convergente q.o. Sia {fk }, k 1, fk : E ! R⇤ , definita q.o. Osserviamo subito che se fk `e definita in Ek = E \ Zk , con |Zk | = 0, posto Z0 = [Zk , si ha |Z0 | = 0 e le fk sono tutte ben definite sull’insieme comune E0 = E \ Z0 . Si ha che fk ! f q.o. in E se fk (x) ! f (x) per ogni x 2 E0 , tranne che per un insieme di punti di misura nulla. Per esempio, la successione definita da fk (x) = (sin x)k , k 1, `e convergente q.o. alla funzione nulla.

c 978-88-08-63708-6

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

365

PROPOSIZIONE 2.14 Se f `e misurabile e g = f q.o., anche g `e misurabile. Dimostrazione. Sia Z = {f 6= g}, |Z| = 0; allora {g > t} [ Z = {f > t} [ Z; perci` o {g > t} [ Z `e misurabile e dunque anche {g > t} `e misurabile poich´e di↵erisce dal precedente insieme per un insieme di misura nulla. Risulta anche |{g > t}| = |{g > t} [ Z| = |{f > t} [ Z| = |{f > t}|.



Il precedente risultato suggerisce, in maniera naturale, di estendere la Definizione 2.10 in modo da includere funzioni che sono definite q.o. in E; baster` a dire che una tale funzione `e misurabile in E se `e misurabile un suo prolungamento (ottenuto, per esempio, ponendo uguale a zero la funzione nei punti di E in cui non `e definita). Pertanto, quando parleremo di funzioni f misurabili su E, sar` a inteso che f `e definita q.o. sull’insieme (misurabile) E ✓ Rn . Le funzioni f : E ! R⇤ misurabili possono essere caratterizzate anche in termini di un certo insieme detto l’insieme delle ordinate di f : se f 0 si chiama cos`ı il sottoinsieme di Rn+1 cos`ı definito: (2.27)

(f, E) := {(x, y) 2 Rn ⇥ R : x 2 E, 0  y  f (x)}.

Spesso scriveremo (f ) o semplicemente la stessa f siano chiari dal contesto.

in luogo di (f, E), quando l’insieme E o

Figura 5.26. Insieme delle ordinate della funzione x 7! sin x.

Esempio 2.14 L’insieme delle ordinate della funzione di Dirichlet definita su [0, 1] `e costituito dai punti del quadrato [0, 1] ⇥ [0, 1] aventi ascissa razionale e dal segmento [0, 1] dell’asse delle x; risulta perci` o (Esempio 2.4) | | = 0. Se f  0 la definizione (2.27) va modificata ponendo f (x)  y  0. Se f `e di segno qualsiasi, consideriamo i due insiemi +

= (f+ , E),

= ( f , E).

Chiameremo insieme delle ordinate di f l’insieme =

+

[

.

366

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

La seguente proposizione, che enunciamo senza dimostrazione, sar` a utile nella Sezione 3, per l’interpretazione geometrica dell’integrale di Lebesgue. PROPOSIZIONE 2.15 f misurabile ,

misurabile

Nella (2.27) si sarebbe anche potuto scrivere . . . 0  y < f (x), dal momento che `e indi↵erente, dal punto di vista della misura, includere o non il grafico di f nell’insieme delle ordinate; si dimostra infatti che, se f `e misurabile, il suo grafico `e misurabile e ha misura ((n + 1)-dimensionale) nulla; questa a↵ermazione va confrontata con la Proposizione 1.7 (si veda anche l’Osservazione 1.4). La classe delle funzioni misurabili `e vastissima; ci si pu` o chiedere addirittura se esistano funzioni non misurabili. Si osserva subito che la funzione caratteristica 1E di un insieme E non misurabile `e non misurabile; cio`e, l’esistenza di un insieme non misurabile implica l’esistenza di una funzione non misurabile; anche il viceversa `e vero, come segue subito dalla definizione di misurabilit` a. Perci` o, dare un esempio di funzione non misurabile `e equivalente a dare un esempio di insieme non misurabile. Complementi con esercizi 1. Sia R un plurintervallo che, in relazione a due diverse suddivisioni D e D0 dell’intervallo

o rappresentare in due modi diversi: R = Q ✓ Rn , si pu`

N S

Qi e R =

i=1

N S0

Q0i . Mostrare che la

i=1

misura di R non dipende dalla suddivisione considerata. [Suggerimento: si prenda la suddivisione D [ D0 , pi` u fine di entrambe. . . ] 2. Provare le propriet` a della misura dei plurintervalli utilizzate nel testo:

i) |R1 |  |R2 | se R1 ✓ R2 ; ii) |R1 [ R2 |  |R1 | + |R2 |; vale il segno = se e solo se . . . ; iii) |R| = |R|. [Suggerimento: per la iii) si osservi che, 8 " > 0, esiste un plurintervallo H" ⇢ R tale che |R|

⇤ "  |H" |  |R|  |R| .

3. Dimostrare la i) della Proposizione 2.1.

[Suggerimento: se B2 `e un chiuso, ogni plurintervallo K che ricopre B2 ricopre anche B1 , perci` o |B2 | = inf{|K|} . . ..] 4. Siano A1 e A2 due aperti (contenuti nell’intervallo Q) e H un plurintervallo contenuto in A1[A2 . Mostrare che, 8 x 2 H, esiste un intorno B(x, r) tutto contenuto in A1 oppure in A2 . [Suggerimento: sia d1 (x) = d(x, Rn \A1 ), d2 (x) = d(x, Rn \A2 ); la funzione d1 (x) + d2 (x) `e continua e positiva sul compatto H, perci` o avr` a un minimo positivo; sia 2r tale minimo . . . ]. 5.*

Dimostrare la Proposizione 2.5. [Suggerimento: la procedura standard consiste nel provare l’asserto per gli intervalli, poi per i plurintervalli ecc. . . . ].

c 978-88-08-63708-6

2. Misura di Lebesgue degli insiemi di Rn . Insiemi e funzioni misurabili

367

Sia E ⇢ Rn misurabile, t > 0; posto tE = {x 2 Rn : x/t 2 E} si dimostri che tE `e misurabile e |tE| = tn |E|.

6.*

7.*

Ogni numero x 2 [0, 1], rappresentato in base 3, si pu` o scrivere nella forma: x = 0.a1 a2 a3 , . . . dove ai = 0 oppure 1 oppure 2. Tale rappresentazione non `e unica: per esempio 1/3 = 0.10 ma anche 1/3 = 0.02; in simili casi decidiamo di scegliere la rappresentazione che contiene meno numeri 1; in tal modo, ogni numero `e rappresentato in modo univoco. Dimostrare che x appartiene all’insieme di Cantor se e solo se la sua rappresentazione (in base 3) non contiene la cifra 1. Si osservi ora che le rappresentazioni composte con le cifre 0 e 2 sono tante quante quelle composte con le cifre 0 e 1 e di queste ultime ve ne `e una infinit` a continua (cio`e, con la potenza del continuo) poich´e ogni numero dell’intervallo [0, 1] si pu` o rappresentare con una tale successione usando il sistema binario. In conclusione, l’insieme di Cantor ha la potenza del continuo. 8.* Insieme di Cantor di misura positiva. Costruire un insieme di Cantor, rimuovendo al passo k intervalli di lunghezza 3 k anzich´e 3 k , con 0 < < 1. Mostrare che l’insieme risultante `e perfetto, totalmente sconnesso, con misura 1 . 9. Un insieme non misurabile

Questo esempio `e dovuto a Vitali. Sui punti dell’intervallo [0, 1] poniamo la seguente relazione di equivalenza: x ⇡ y se x y `e un numero razionale. Sia A l’insieme delle classi di questa equivalenza (cio`e l’insieme quoziente di [0, 1] rispetto all’equivalenza introdotta, pag. 19, Vol. 1). Sia ora E ⇢ [0, 1] un insieme ottenuto scegliendo esattamente un punto (un rappresentante) da ciascuna delle classi di A. (Per a↵ermare l’esistenza di un tale insieme facciamo ricorso all’assioma della scelta). Mostriamo, ragionando per assurdo, che E non `e misurabile. Sia E misurabile e, per ogni numero razionale r, 0  r < 1, poniamo: Fr = E \ [r, 1],

Gr = E \ [0, r),

cosicch´e

Fr [ Gr = E,

Fr \ Gr = ?,

e Hr = ⌧r G1

r

[ ⌧r

1 F1 r

dove ⌧h T `e l’insieme T traslato di h verso destra: ⌧h T = {x 2 R : x Si osservi ora che:

h 2 T }.

• Hr ` e misurabile (Proposizione 2.5) e |Hr | = |E|;

• Hr \ Hs = ? se r 6= s razionali, perch´ e altrimenti un punto x apparterrebbe a due classi

distinte di A; S Hr , perch´e ogni x 2 [0, 1] di↵erisce per un numero razionale da un punto di E.

• [0, 1] =

P

r

P Allora |Hr | = |[0, 1]| = 1 e anche, essendo |Hr | = |E|, |E| = 1; ma, se |E| = 0, r r P P |E| = 0 mentre se |E| > 0, |E| = +1. Essendo pervenuti a una contraddizione, si r

r

conclude che E non `e misurabile. 10.*

Dimostrare che la composizione f g di una funzione misurabile f con una funzione continua g `e una funzione misurabile. Si potrebbe dimostrare che, in generale, la composizione di due funzioni misurabili non `e misurabile.

368

3.

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

INTEGRALE SECONDO LEBESGUE

3.1 Integrale di funzioni misurabili e limitate Sia ⌦ ⇢ Rn un insieme di misura finita e sia f : ⌦ ! R una funzione misurabile e limitata, la cui immagine sia strettamente contenuta nell’intervallo [m, M ]: (3.1)

m < f (x) < M

8 x 2 ⌦.

Introduciamo le somme inferiori e superiori (alla Lebesgue) di f nella maniera seguente. Facciamo una suddivisione D = D(↵0 , ↵1 , . . . , ↵N ) dell’intervallo [m, M ], con ↵0 = m < ↵1 < . . . < ↵N = M ; consideriamo gli insiemi (Fig. 5.27) ⌦i = {x 2 ⌦ : ↵i

1

 f (x) < ↵i } = f

1

([↵i

1 , ↵i ))

(i = 1, 2, . . . , N ).

aN = M

ai ai – 1

a0 = m

Figura 5.27. L’unione dei tre intervalli pi` u marcati sull’asse x costituisce f

1 ([↵ i 1 , ↵i ))

= ⌦i .

Tali insiemi sono tutti misurabili; poniamo allora s = s(D, f ) =

N X

↵i

i=1

S = S(D, f ) =

N X i=1

i 1 |⌦ |

↵i |⌦i |.

Risulta ovviamente (3.2)

m|⌦|  s(D, f )  S(D, f )  M |⌦|.

La (3.2) confronta la somma inferiore e la somma superiore di f relativa alla stessa suddivisione. Tuttavia si vede facilmente che, infittendo la suddivisione D, le somme superiori non aumentano e le somme inferiori non diminuiscono: infatti, sia D0 una suddivisione pi` u fine di D; sia, per esempio, un punto della suddivisione D0 che non compare in D, ↵i 1 < < ↵i (per un certo i); allora il termine ↵i |⌦i | = ↵i |{↵i

1

 f < ↵i }|

3. Integrale secondo Lebesgue

c 978-88-08-63708-6

369

nella somma S(D, f ) viene sostituito, nella somma S(D0 , f ), dal termine |{↵i

1

 f < }| + ↵i |{  f < ↵i }|

che risulta minore di ↵i |{↵i

1

 f < }| + ↵i |{  f < ↵i }| = ↵i |⌦i |;

analoghe disuguaglianze valgono per le somme inferiori. Ci` o permette di concludere che: ogni somma inferiore `e  ogni somma superiore; infatti, se D1 e D2 sono due qualsiasi suddivisioni, e D = D1 [ D2 , dette s1 , s2 , s, S1 , S2 , S le rispettive somme inferiori e superiori, si ha s1  s  S  S2 . Sia ora D una qualunque suddivisione di [m, M ]; abbiamo naturalmente s(D, f )  sup s  inf S  S(D, f ).

(3.3)

D

D

Fin qui, a parte la diversa definizione di s e S, il discorso ripete gli stessi argomenti gi` a utilizzati per definire l’integrale di Riemann; ma ora osserviamo che (3.4)

S(D, f )

s(D, f ) =

N X (↵i

↵i

i=1

i 1 )|⌦ |

 |⌦|

dove abbiamo indicato con l’ampiezza della suddivisione. Poich´e pu` o essere preso piccolo quanto si vuole, dalle (3.3) e (3.4) si ricava che, per ogni f , risulta sup s = inf S.

(3.5)

D

D

DEFINIZIONE 3.1 Sia ⌦ ⇢ Rn di misura finita e f : ⌦ ! R misurabile e limitata. Il numero sup s = inf S viene detto integrale (secondo Lebesgue) di f su ⌦. D

D

Dunque tutte le funzioni misurabili e limitate sono integrabili (secondo Lebesgue) su un insieme di misura finita. Esempio 3.1 Dalla definizione precedente discende direttamente che, per ogni c 2 R, risulta Z c = c|⌦|. ⌦

OSSERVAZIONE 3.1 Da quanto precede si vede che si pu` o anche definire l’integrale come (3.6)

lim

!0

N X i=1

i i |⌦ |

dove i `e un qualsiasi numero nell’intervallo [↵i 1 , ↵i ]; infatti le somme che compaiono nella (3.6), che sono dette somme integrali alla Lebesgue, sono intermedie tra s e S

370

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

e perci` o tendono al limite comune di s e S quando scelta dei valori i .

! 0, indipendentemente dalla

La definizione precedente illustra chiaramente la di↵erenza tra le somme integrali di Riemann e quelle di Lebesgue. Le prime (riferiamoci, per semplicit` a, a funzioni di una variabile) vengono costruite facendo una suddivisione dell’intervallo di integrazione, quindi moltiplicando la misura di ogni intervallino della suddivisione per un’ordinata compresa tra gli estremi inferiore e superiore di f in quell’intervallino e infine sommando su tutti gli intervallini. Le seconde sono basate su una suddivisione di un intervallo che contiene l’immagine della funzione integranda: si moltiplica una ordinata qualsiasi di un intervallino [↵i 1 , ↵i ) della suddivisione per la misura della controimmagine f 1 ([↵i 1 , ↵i )) di questo intervallino, quindi si somma su tutti gli intervallini. In questo modo siamo certi che l’ordinata scelta `e e↵ettivamente rappresentativa della funzione f sull’insieme ⌦i = f 1 ([↵i 1 , ↵i )), anche se questa funzione `e molto “irregolare”; invece, nel procedimento di Riemann, la scelta dell’ordinata rappresentativa di f `e piuttosto arbitraria, a meno che la funzione, non sia, per esempio, continua o, comunque, non abbia troppe discontinuit` a. Questo discorso risulta pi` u chiaro se si considera la funzione di Dirichlet nell’intervallo [0, 1]; fatta una suddivisione di questo intervallo, la scelta di un’ordinata compresa tra 0 e 1 per rappresentare f (x) in un intervallino `e comunque del tutto arbitraria; come gi` a sappiamo, tale funzione non `e integrabile nel senso di Riemann. Procedendo secondo Lebesgue invece, le somme inferiori e superiori per questa funzione, relative a una suddivisione ↵0 = 0 < ↵1 < . . . < ↵n

1

= 1 < ↵n

sono s = ↵0 |{0  f < ↵1 }| + ↵1 |{↵1  f < ↵2 }| + . . . + ↵n 1 |{1  f < ↵n }| = = 0 · 1 + ↵1 · 0 + . . . + 1 · 0 = 0 S = ↵1 |{0  f < ↵1 }| + ↵2 |{↵1  f < ↵2 }| + . . . + ↵n |{1  f < ↵n }| = = ↵1 · 1 + ↵2 · 0 + . . . + ↵n · 0 = ↵1 . o essere scelto piccolo quanto si vuole, risulta inf S = 0, cosicch´e la Poich´e ↵1 pu` D

funzione `e integrabile con integrale nullo. Possiamo chiederci: quanto discontinua pu` o essere la funzione, perch´e risulti ancora integrabile secondo Riemann? Lebesgue ha dimostrato che una funzione f : [a, b] ! R limitata `e integrabile secondo Riemann se e solo se `e continua q.o. in [a, b], cio`e i suoi punti di discontinuit` a formano un insieme di misura nulla, secondo Lebesgue. Abbiamo cos`ı risposto alla questione posta alla fine del Paragrafo 8.1.3, pagina 400, del Volume 1. Naturalmente, il vantaggio della nuova definizione di integrale non `e quello di poter integrare funzioni cos`ı “bizzarre” come la funzione di Dirichlet, ma risulter` a dalle propriet` a che esso possiede, che discuteremo ai Paragrafi 3.3, 3.4 e 3.5. D’ora in avanti, parlando di funzioni integrabili e di integrale, intenderemo sempre secondo Lebesgue. Per indicare l’integrale di f su ⌦ useremo le stesse notazioni gi` a

3. Integrale secondo Lebesgue

c 978-88-08-63708-6

371

usate per indicare l’integrale di Riemann; ci` o, come vedremo, non pu` o dar luogo a confusione. Soltanto quandoRi due integrali saranno messi a confronto useremo, R per distinguerli, le notazioni L ⌦ f e R ⌦ f , con evidente significato e parleremo di funzioni L-integrabili e di funzioni R-integrabili. Significato geometrico dell’integrale Sia f : ⌦ ! R misurabile e limitata, |⌦| < 1; inoltre sia f 0. Sia = (f, ⌦) l’insieme delle ordinate di f su ⌦, definito dalla formula (2.27). Sappiamo (Prop. 2.15) che `e misurabile e, essendo limitato, di misura finita. Mostriamo che risulta16 Z (3.7) f = | |n+1 ⌦

Infatti, con riferimento a una suddivisione D(↵0 , ↵1 , . . . , ↵N ) di [m, M ], sia '(x) la funzione uguale a ↵i 1 in ⌦i (i = 1, 2, . . . , N ) e (x) la funzione uguale a ↵i in ogni ⌦i ; risulta allora (3.8)

(') ✓ (f ) ✓ ( )

e, ricordando la definizione delle somme inferiori e superiori, s(D, f ) = | (')|,

S(D, f ) = | ( )|.

R Facendo tendere a zero l’ampiezza della suddivisione, s e S tendono entrambi a ⌦ f ; dalla (3.8), prendendo le misure degli insiemi, si ricava la (3.7). Se f `e di segno qualsiasi, posto f = f+ f , risulta, con ragionamento analogo a quello svolto sopra Z f = | +| | | (3.9) ⌦

essendo + = (f+ , ⌦) e = ( f , ⌦). Le formule (3.7) e (3.9) illustrano il significato geometrico dell’integrale. Esse forniscono anche una definizione alternativa ed equivalente dell’integrale, pi` u intuitiva di quella basata sulle somme integrali. Le stesse formule permettono anche di mostrare rapidamente la seguente proposizione, di importanza fondamentale. PROPOSIZIONE 3.1 Sia f limitata e R-integrabile sull’insieme ⌦ limitato e P J-misurabile; allora f `e misurabile e pertanto L-integrabile e i due integrali sono uguali: Z Z f =L f. (3.10) R ⌦



Dimostrazione. Sia f 0. Le somme inferiore e superiore di Riemann, Rs e RS, rappresentano la misura di plurintervalli contenenti e contenuti nell’insieme delle ordinate (f, ⌦): risulta Rs  | |⇤  | |⇤  RS

(3.11) 16 Se

⌦ ⇢ Rn , allora

(f, ⌦) ⇢ Rn+1 ; nel seguito scriveremo semplicemente | | in luogo di | |n+1 .

372

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Facendo tendere a zero l’ampiezza della suddivisione, Rs e RS tendono a un limite comune, R R ⌦ f = | |⇤ = | R|⇤ ; cio`e risulta L-misurabile e, per la Proposizione R 2.14, f `e misurabile. o con R ⌦ . Il suo integrale, L ⌦ f , coincide con | | (per la (3.7)) e perci` ⇤ Se f `e di segno qualsiasi, si ragiona su f+ e f utilizzando la (3.9).

3.2 Funzioni integrabili Estendiamo ora la definizione dell’integrale a funzioni non limitate e a insiemi di misura non finita; nella teoria di Riemann integrali di tal genere si dicono generalizzati o impropri. f N

[f ]N

Figura 5.28. In nero il grafico della troncata [f ]N .

Procediamo per gradi: 1. Sia ⌦ di misura finita e f : ⌦ ! R⇤ una funzione misurabile N > 0 definiamo la funzione troncata [f ]N :

0. Per un intero

[f (x)]N = f (x) per quegli x in cui f (x)  N per quegli x in cui f (x) > N. [f (x)]N = N R Per ogni N , l’integrale ⌦ [f ]N esiste e, posto N = ([f ]N , ⌦), abbiamo Z [f ]N = | N |. (3.12)



o ammette limite per N ! 1; se questo La successione | N | `e crescente con N , perci` limite `e finito, diremo che la funzione f `e integrabile (o sommabile) su ⌦ e porremo Z f := lim | N | (3.13) N !1



Poich´e

N



N +1

e

1 S

N

=

= (f, ⌦), per la iv) del Teorema 2.4 abbiamo

N =1

Z



f = | |.

2. Sia ora f di segno qualsiasi (e ⌦ come in 1.).

3. Integrale secondo Lebesgue

c 978-88-08-63708-6

373

Consideriamo le funzioni non negative f+ e f . La funzione f si dir` a integrabile (o sommabile17 ) su ⌦ se risultano integrabili entrambe le funzioni f+ e f ; si pone allora Z Z Z (3.14) f := f+ f = | +| | | ⌦



dove si `e posto, come al solito,

+



= (f+ ) e

= ( f ).

3. Sia ora ⌦ misurabile (di misura finita o infinita) e f misurabile, non negativa. Sia {⌦k } la successione degli n-intervalli: |xi |  k (i = 1, 2, . . . , n); poniamo ⌦k = ⌦ \ Qk e k = (f, ⌦k ). Se f `e integrabile su ogni ⌦k (k = 1, 2, . . .) abbiamo: Z f = | k |. ⌦k

La successione | k | `e crescente; se il suo limite, per k ! 1 (che coincide con | (f, ⌦)|), `e finito, la funzione f si dice integrabile su ⌦ e si pone Z f := | |. (3.15) ⌦

4. Infine, se f `e di segno qualsiasi (e ⌦ come in 3.), diremo che f `e integrabile su ⌦ se sono tali f+ e f e porremo ancora Z Z Z f := f+ f = | + | | |. (3.16) ⌦





In conclusione, con le notazioni e le ipotesi sopra adottate, abbiamo, se f Z Z f = lim lim [f ]N . (3.17) k!1 N !1



0,

⌦k

Il lettore si convincer` a facilmente che, trattandosi di successioni monotone (e limitate) `e indi↵erente l’ordine in cui i due limiti sono calcolati (Esercizio 3.1.18). In particolare: Z Z f = lim [f ]N (3.18) ⌦

N !1



Dall’insieme delle definizioni 1., 2., 3., 4. si ricava la seguente PROPOSIZIONE 3.2 Una funzione misurabile f : ⌦ ! R⇤ `e integrabile se e solo se |f | `e integrabile. Dimostrazione. La proposizione f integrabile , f+ , f

integrabili , |f | integrabile

17 Alcuni autori distinguono tra funzioni sommabili (quelle per cui sia f hanno integrale + che f finito) e funzioni integrabili (quelle per cui almeno una delle due funzioni f+ e f ha integrale finito). Noi riteniamo sinonimi le due espressioni.

374

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

si scrive, in termini di insiemi delle ordinate, | (f )| < 1 , | (f+ )| < 1, | (f )| < 1 , | (|f |)| < 1; poich´e (f ) = (f+ ) [ ( f ), (|f |) = (f+ ) [ (f ), e ovviamente | (f )| = | ( f )|, | = 0 (l’insieme + \ , essendo l’asserto `e provato. Inoltre, osservando che | + \ contenuto in Rn , ha misura (n + 1)-dimensionale nulla) abbiamo: | (|f |)| = | + | | |, cio`e Z ⇤ |f | = | + | + | |. (3.19) ⌦

Perci` o, nella teoria di Lebesgue, l’integrabilit` a coincide con l’integrabilit` a assoluta. Ancora si pu` o dimostrare che, se f `e assolutamente integrabile in senso improprio (secondo Riemann) allora `e integrabile (secondo Lebesgue) e i due integrali coincidono. D’altra parte, esistono esempi di funzioni integrabili in senso improprio, ma non assolutamente integrabili; (come sin x/x in R, Esempio 3.9, pag. 458, Vol. 1) per tali funzioni l’integrale di Lebesgue non `e definito. 3.3 Prime propriet` a dell’integrale di Lebesgue Supporremo, negli enunciati che seguono, che le funzioni e gli insiemi considerati siano misurabili. Indichiamo con L(⌦) la classe delle funzioni integrabili su ⌦. TEOREMA 3.3 Valgono le seguenti propriet` a (da 1. a 5.): 1. Omogeneit` a. Se f 2 L(⌦) e c 2 R, allora cf 2 L(⌦) e Z Z cf = c f ⌦



2. Additivit` a (rispetto alla funzione integranda). Se f, g 2 L(⌦), anche f + g 2 L(⌦) e Z Z Z (f + g) = f+ g. ⌦





Da 1. e 2. discende che L(⌦) `e uno spazio lineare vettoriale.

3. Monotonia

R R i) Se f, g 2 L(⌦) e f  g, allora ⌦ f  ⌦ g. R R 8 f 2 L(⌦). ii) ⌦ f  ⌦ |f | iii) Teorema della media. Se m  f  M e |⌦| < 1, allora esiste , m  tale che Z f = |⌦|. ⌦

iv) Se |f |  g e g 2 L(⌦), anche f 2 L(⌦).

4. Additivit` a completa rispetto al dominio di integrazione. 1 S Se f 2 L(⌦) e ⌦ = ⌦k , ⌦k \ ⌦j = ? per k 6= j, allora k=1

Z



f=

1 Z X

k=1

⌦k

f.

 M,

3. Integrale secondo Lebesgue

c 978-88-08-63708-6

375

5. Insiemi di misura nulla R i) Se |⌦| = 0, ⌦ f = 0. R ii) Se f = 0 q.o. in ⌦, ⌦ f = 0. R R iii) Se f = g q.o. in ⌦ e f 2 L(⌦), anche g 2 L(⌦) e ⌦ f = ⌦ g. R iv) Se f 0 e ⌦ f = 0, allora f = 0 q.o. in ⌦.

Le propriet` a sopra elencate, pur estendendo quelle dell’integrale di Riemann, non giustificano ancora pienamente il lavoro svolto per sviluppare la nuova teoria. Nel prossimo paragrafo illustreremo le propriet` a principali del nuovo integrale, che mostrano quanto esso sia flessibile rispetto all’operazione di passaggio al limite; sono queste propriet` a che lo rendono preferibile al pi` u semplice integrale di Riemann.

Dimostrazione del Teorema 3.3. La 1. viene lasciata per esercizio. Dimostriamo la 3. i) Se f 0, risulta (f ) ✓ (g) e perci` o | (f )|  | (g)|. Incidentalmente, ci` o prova anche la iv), risultando, per l’ipotesi, | (|f |)| < | (g)| < 1. Se f `e di segno g su ⌦, risulta qualsiasi, essendo f+  g+ e f | (f+ )|  | (g+ )|

e

| (f )|

| (g )|

da cui | (f+ )|

| (f )|  | (g+ )|

| (g )|.

ii) Segue subito dalle (3.16) e (3.17). iii) Segue dalla disuguaglianza m  f  M , integrando su ⌦, applicando la i) e ricordando l’Esempio 3.1. 1 S = (g, ⌦) e k = (f, ⌦k ). Poich´e Dimostriamo la 4. Sia f 0, = k dove k=1

⌦k \ ⌦j = ? (k 6= j) risulta

k

\

j

= ? e perci` o| |=

1 P

k=1

|

k |.

Se f `e di segno qualsiasi, si

procede scomponendo f = f+ f ecc. Dimostriamo la 2. Questa propriet` a richiede una dimostrazione non immediata. Assumiamo dapprima che f e g siano limitate e | | < 1. Proviamo la tesi nel caso g = c (costante). Se N N P P ↵i 1 |⌦i | `e una somma inferiore per f , allora s0 = (↵i 1 +c)|⌦i | = s+c|⌦| s = s(D, f ) = i=1

i=1

`e una somma inferiore per f + c. Facendo tendere a zero l’ampiezza della suddivisione D, abbiamo allora (ricordando l’Esempio 3.1) Z Z Z (f + c) = f+ c. ⌦





Se g non `e costante (ma ancora limitata), consideriamo gli insiemi ⌦i relativi alla funzione f e a una suddivisione D; abbiamo (utilizzando le propriet` a 4. e 3i) Z

Z

(f + g) = ⌦



N Z X i=1

(f + g) 

N X i=1

(f + g) ⌦i

N Z X i=1

(↵i

1

+ g) = s(D, f ) +

⌦i

(↵i + g) = S(D, f ) +

Z

g. ⌦

Facendo tendere a zero l’ampiezza della suddivisione, ricaviamo la tesi.

Z

g ⌦

376

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Lasciamo cadere ora l’ipotesi di limitatezza per f e g. Se f e g sono non negative, per le corrispondenti funzioni troncate abbiamo [f + g]N  [f ]N + [g]N  [f + g]2N . Integrando le precedenti disuguaglianze e passando al limite per N ! 1 otteniamo la tesi. Se invece f e g non sono sempre 0, dobbiamo suddividere ⌦ in sei (al pi` u) sottoinsiemi (ovviamente misurabili) in cui f, g, f + g sono di segno costante e procedere in ognuno di essi come dove f e f + g sono 0 e g 0 risulta: f = (f + g) + ( g) e R sopra; R per esempio, R perci` o f = (f + g) + ( g), da cui ancora la tesi. Infine, se |⌦| = 1, detti Qk i soliti ipercubi centrati nell’origine con lato di semilunghezza k, abbiamo, per quanto visto sopra, Z Z Z (f + g) = f+ g ⌦\Qk

⌦\Qk

⌦\Qk

e, facendo tendere k all’infinito, otteniamo la tesi. Dimostriamo le 5. La i) `e ovvia. ii) Sia ⌦ = Z [ (⌦\Z) dove Z `e l’insieme trascurabile in cui f 6= 0. Risulta allora, per la 4. Z Z Z f= f+ f. ⌦

Z

⌦\Z

Il primo integrale a secondo membro `e nullo (per la i)), il secondo `e nullo poich´e f = 0. ` un immediato corollario di ii). iii) E iv) Ragioniamo per assurdo: supponiamo che sia f > 0 sull’insieme G ⇢ ⌦, |G| > 0; 1 S Gk dove Gk = {f > 1/k}. Poich´e, per un decomponiamo G nella maniera seguente: G = k=1

certo k, deve essere |{f > 1/k}| > 0, avremo Z

f= ⌦

Z

f G

Z

f Gk

1 |Gk | > 0 k

contro l’ipotesi. L’allievo confronti questa propriet` a con quella espressa negli Esercizi 8.1.2, ⇤ 8.1.3, 8.1.4, del Volume 1.

3.4

Limite, serie e derivata di integrali

Presentiamo, in questo paragrafo, le propriet` a pi` u importanti dell’integrale di Lebesgue. Supporremo sempre, negli enunciati che seguono, che le funzioni e gli insiemi considerati siano misurabili. TEOREMA 3.4 (di Lebesgue, della convergenza dominata) Sia {fk } una successione di funzioni da ⌦ in R, misurabili. Se i) fk ! f q.o. in ⌦; ii) esiste g 2 L(⌦) tale che: 8 k, |fk |  g q.o. in ⌦; allora iii) f 2 L(⌦); R R iv) lim ⌦ fk = ⌦ f . k!1

3. Integrale secondo Lebesgue

c 978-88-08-63708-6

377

Questo teorema va confrontato col Teorema 3.1.8 che illustra un’analoga propriet` a per l’integrale di Riemann: si vede che, per la validit` a di passaggio al limite sotto il segno di integrale, l’ipotesi di convergenza uniforme `e sostituita qui dall’ipotesi, di impiego assai pi` u largo, di convergenza dominata, cio`e convergenza ordinaria (quasi ovunque) accompagnata dall’esistenza di una maggiorante integrabile. Si noti come questa ipotesi implichi che ogni fk sia integrabile, in base alla 3.iv) del Teorema 3.3. Senza l’ipotesi che una maggiorante integrabile esista, il teorema `e falso; anzitutto il limite f , che di certo `e misurabile, potrebbe non essere integrabile; anche se risultasse integrabile potrebbe essere falsa la iv), come vedremo nell’Esempio 3.2. Osserviamo che l’ipotesi ii) del teorema `e soddisfatta se, per esempio, |⌦| < 1,

|fk |  M

8k

con M costante; si parla, in questo caso, di convergenza limitata. Si noti che, anche con queste ipotesi pi` u restrittive, il teorema sarebbe falso per l’integrale di Riemann per la semplice ragione che la funzione limite di una successione convergente di funzioni R-integrabili pu` o essere una funzione non R-integrabile, anche se le funzioni sono equilimitate (cio`e limitate uniformemente rispetto a k). Dal Teorema 3.4 si ricava immediatamente il seguente corollario, da confrontare con il Teorema 3.2.7. COROLLARIO 3.5 (Scambio della serie con l’integrale) Sia {fk } una successione di funzioni da ⌦ in R, integrabili. Se i)

1 P

fk = F q.o. in ⌦;

k=1

ii) esiste G 2 L(⌦) tale che, per ogni n allora

1,

n P

k=1

fk  G q.o. in ⌦,

iii) F 2 L(⌦); Z Z 1 P fk = F. iv) k=1





Esempi 3.2 Siano fk : [0, 1] ! R cos`ı definite, per k 1: (Fig. 5.29) ( 2xk2 + 2k per 0  x  1/k fk (x) = 0 per 1/k < x  1. R1 Si ha che fk (x) ! 0 per ogni x 2 (0, 1], mentre 0 fk (x)dx = 1 per ogni k; dunque la iii) del Teorema 3.4 `e vera, ma la iv) `e falsa; si noti che la ii) non `e soddisfatta. 1. Poich´e |fk (x)|  12 per ogni k, applicando R1 il criterio della convergenza limitata si ha: lim 0 fk (x)dx = 0. Si osservi che non si

3.3 Sia fk (x) =

kx 1+k2 x2 ,

x 2 [0, 1], k

k!1

pu` o applicare il criterio della convergenza uniforme.

378

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

y 2k

0

1/k

1

x

Figura 5.29. Le funzioni fk dell’Esempio 3.2.

p k3/2 x 3.4 f (x) = 1+k e massima per x = 1/k, dove vale 12 k; 2 x2 , x 2 [0, 1]; fk (x) ` perci` p o la successione non `e limitata; tuttavia si verifica facilmente che |fk (x)|  o, applicando il criterio della convergenza dominata, abbia1/ x per ogni k; perci` R1 mo: lim 0 fk (x)dx = 0. Anche in questo caso il criterio della convergenza uniforme k!1

non `e applicabile.

Non c’`e alcuna difficolt` a a estendere l’enunciato del Teorema 3.4 al caso in cui, invece di una famiglia numerabile di funzioni, {fk (x)}, abbiamo una famiglia continua, f (x, t). 3.5

Z

Z 1 sin xt sin xt dx = lim 3/2 dx = 0. lim t!0 0 t!0 x3/2 x 0 Infatti abbiamo le maggiorazioni seguenti: 1

sin xt 8 x 2 R, t 2 R  |x| 3/2 x3/2 sin xt |t| | sin xt| = · 1/2  |x| 1/2 xt |x|3/2 |x|

8 x 2 R, |t| < 1.

Perci` o la funzione g(x) = x 1/2 per x 2 [0, 1], g(x) = x 3/2 per x > 1 `e una maggiorante integrabile del modulo della funzione integranda; possiamo perci` o applicare il criterio della convergenza dominata. 3.6 Il Teorema 3.4 non `e applicabile all’integrale Z +1 x2 /2t e p dx. 2⇡t 1 Tale integrale infatti vale 1 per ogni t 2 (0, +1) (Esempio 1.22), mentre la funzione integranda, per t ! 0+ , tende alla funzione q.o. nulla; di fatto non esiste una maggiorante integrabile (indipendente da t) della funzione integranda.

3. Integrale secondo Lebesgue

c 978-88-08-63708-6

379

Premettiamo alla dimostrazione del Teorema 3.4, il seguente R LEMMA 3.6 Sia f 2 L(⌦); 8 " > 0, 9 (") > 0 tale che A |f | < " per ogni insieme misurabile A ⇢ ⌦, con |A| < . Dimostrazione. Per la 3.ii) del Teorema 3.3 possiamo assumere f R 0. Se f `e limitata, f  M , l’a↵ermazione segue dalla maggiorazione A f  M |A|, prendendo = "/M . Se f non `e limitata, consideriamo le troncate [f ]N definite nella (3.12). Essendo, per la (3.18), Z Z f = lim

risulter` a, 8 " > 0, se N

0

Z

f ⌦

Z

[f ]N ,

N !1



[f ]N = ⌦

Z



(f

N ("). Perci` o risulta anche che, 8 A ⇢ ⌦, Z Z (f [f ]N ) = f 0 A

Preso

A

[f ]N ) < "/2



Z

A

[f ]N < "/2.

= "/2N abbiamo allora, se |A| < , Z [f ]N < N |A| < "/2 A

la quale, combinata con la precedente disuguaglianza, dimostra la tesi.



Dimostrazione del Teorema 3.4. Anzitutto, essendo |fk |  g, risulter` a anche |f |  g, e perci` o, per la 3.iv) del Teorema 3.3, f `e integrabile. Assumiamo, per il momento, |⌦| < 1. Sia B ⇢ ⌦ l’insieme in cui fk ! f ; risulta |B| = |⌦|. Fissato " > 0, sia ⇢ " (3.20) Bk = x 2 B : |fk (x) f (x)| < . 2|⌦| Abbiamo,allora: B=

1 [

Bk ,

B1 ✓ B2 ✓ . . .

k=1

e perci` o

lim |Bk | = |B| = |⌦|.

k!1

Osserviamo esiste >R 0 tale che, 8 A ⇢ Q con |A| < , R R ora che, per il precedente lemma, o anche, 8 k, A |fk | < "/4 e A |f | < "/4. Poniamo A = ⌦\Bk e abbiamo A g < "/4 e perci` prendiamo k abbastanza grande in modo che risulti |A| < . Scriviamo ora Z Z Z |fk f | = |fk f | + |fk f |. ⌦

Per k

Bk ¯

A

k abbiamo, essendo Bk¯ ✓ Bk , Z |fk f | < B

Zk

A

|fk

" " |B | < 2|⌦| k 2 Z Z f|  |fk | + |f | < "/2 A

A

380

CAPITOLO 5. Misura e integrazione

e perci` o

Z

Z

f A



c 978-88-08-63708-6

fk 

Z



|f

fk | < ".

Il teorema `e cos`ı dimostrato se |⌦| < 1. Sia ora |⌦| = 1; posto ⌦j = ⌦ \ Qj (dove i Qj sono i soliti ipercubi: |xi |  j, i = 1, 2, . . . , n), da quanto precede risulta, 8 j = 1, 2, . . . Z Z lim fk = f. k!1

Abbiamo allora Z Z f = lim ⌦

j!1

⌦j

f = lim lim

j!1 k!1

⌦j

Z

⌦j

fk = lim lim

k!1 j!1

⌦j

Lo scambio dei limiti operato sopra `e lecito poich´e lim

R

j!1 ⌦j

a k; infatti, 8 " > 0, si ha, in base al Lemma 3.6, Z

fk ⌦

Z

fk = ⌦j

Z

⌦\⌦j

fk 

Z

⌦\⌦j

Z

fk = lim ⌦j

k!1

Z

fk . ⌦

fk esiste uniformemente rispetto

|fk | 

Z

g 0 `e un parametro che dipende dalla precisione del dispositivo: pi` u piccolo `e , pi` u preciso `p e il dispositivo; per esempio, si ricava dalla (3.25) che in un cerchio di raggio R = 2 log 10 ⇡ 3 , centrato sul bersaglio, cade il 99% dei colpi sparati. La (3.25) corrisponde alla distribuzione normale (o gaussiana) bidimensionale.

392

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

Uno dei risultati pi` u profondi del Calcolo delle Probabilit` a `e la “dimostrazione” della congettura di Gauss, cio`e il cosiddetto Teorema centrale limite. *3.7 Gli spazi L1 (E) e L2 (E). Ancora sulle serie di Fourier Come abbiamo visto, l’insieme L(E) delle funzioni integrabili sull’insieme (misurabile) E ✓ Rn `e uno spazio vettoriale lineare. Vogliamo ora vedere se `e possibile dotarlo di una norma. Un primo tentativo, consistente nel porre Z |f |, kf kL(E) := E

non riesce, poich´e la propriet` a fondamentale

(3.26)

kf k = 0 ) f = 0

non `e soddisfatta: infatti non c’`e bisogno che sia f (x) = 0 in tutti i punti di E R a 5.iv)). perch´e risulti E |f | = 0; basta che sia f (x) = 0 q.o. in E (Teor. 3.3, propriet` Con la definizione (3.25) le altre propriet` a della norma sono invece soddisfatte, come facilmente si verifica. Per ottemperare anche alla (3.26), procediamo come segue. Date due funzioni f, g 2 L(E), la relazione f = g q.o. `e evidentemente un’equivalenza: f ⇡ g , f = g q.o. in E. Si considerano allora le classi di questa equivalenza che, per comodit` a di scrittura, saranno indicate con gli stessi simboli f, g, . . . , utilizzati per indicare gli elementi di L(E). L’insieme di queste classi (cio`e l’insieme quoziente di L(E) rispetto all’equivalenza introdotta) sar` a indicato con L1 (E). Scrivendo f 2 L1 (E) penseremo f come una classe di funzioni (tra loro equivalenti) oppure, indi↵erentemente, come una singola funzione (rappresentante della classe a cui appartiene). Sugli elementi di L1 (E) si definiscono al solito modo la somma e il prodotto per un numero, cosicch´e L1 (E) `e uno spazio lineare. Esso `e anche normato, con la definizione Z |f |. (3.27) kf kL1 (E) := E

La definizione ora `e buona, poich´e, anzitutto, essa non dipende dalla funzione scelta per rappresentare la classe (funzioni q.o. uguali hanno lo stesso integrale); poi, come facilmente si verifica, tutte le propriet` a della norma sono ora soddisfatte; per esempio, la propriet` a kf kL1 (E) = 0 , f = 0 R si legge ora: E |f | = 0 se e solo se f appartiene alla classe di equivalenza che contiene la funzione 0, cio`e se f `e q.o. nulla (e ci` o `e vero, per la gi` a ricordata propriet` a 5.iv) del Teorema 3.3)21 . 21 Per usare una pittoresca immagine, dovuta, sembra, allo stesso Lebesgue, possiamo dire che L1 (E) ` e lo stesso spazio L(E) osservato con un microscopio il cui potere risolutore non permette di vedere gli insiemi di misura nulla, cosicch´ e due funzioni q.o. uguali appaiono all’osservatore come la stessa funzione.

3. Integrale secondo Lebesgue

c 978-88-08-63708-6

393

La metrica indotta dalla norma (3.27) `e la metrica integrale di ordine 1 e la convergenza tipica di questo spazio `e la convergenza in media (di ordine 1): Z 1 |fn f | ! 0. fn ! f in L (E) significa E

Il seguente risultato, che riportiamo senza dimostrazione, `e stato uno dei pi` u significativi successi della teoria di Lebesgue: TEOREMA 3.15 L1 (E) `e completo. Consideriamo ora l’insieme delle funzioni f misurabili tali che |f |2 risulti integrabile su E (funzioni di quadrato integrabile). Lasciamo in vigore la convenzione precedentemente adottata circa le funzioni equivalenti e indichiamo con L2 (E) l’insieme o costituito dalle classi di equivalenza di queste funzioni. L2 (E) `e uno spazio lineare (ci` segue dalla disuguaglianza: |f +g|2 < 2|f |2 +2|g|2 ). In tale spazio possiamo introdurre un prodotto scalare ponendo: Z f (x)g(x)dx (3.28) hf, giL2 (E) := E

Osserviamo che il prodotto f g `e integrabile se f e g sono di quadrato integrabile, come segue dalla disuguaglianza: |f g|  12 |f |2 + 12 |g|2 . Si verificano senza difficolt` a tutte le propriet` a del prodotto scalare, in particolare vale la disuguaglianza di Schwarz: Z

E

fg 

✓Z

E

2

|f |

◆1/2 ✓Z

2

E

|g|

◆1/2

.

La norma indotta dal prodotto scalare (3.28) `e kf kL2 (E) =

✓Z

E

2

|f |

◆1/2

e la corrispondente metrica `e la metrica integrale (di ordine 2); la convergenza tipica di questo spazio `e la convergenza in media quadratica: Z |fn f |2 ! 0. fn ! f in L2 (E) significa E

Ancora si pu` o dimostrare il seguente risultato fondamentale. TEOREMA 3.16 L2 (E) `e completo. Abbiamo cos`ı ottenuto un esempio di spazio di Hilbert (non euclideo). OSSERVAZIONE 3.2 In tutto il presente capitolo abbiamo considerato funzioni reali da Rn in R e gli spazi ora introdotti L1 (E) e L2 (E) sono intesi sul campo reale. Non c’`e alcuna difficolt` a ad estendere tali spazi al campo complesso, il che si rende necessario in varie applicazioni, per esempio, alla Meccanica Quantistica. Nella formula (3.27) e seguenti il simbolo |f | andr` a interpretato come modulo della quantit` a

394

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

complessa f . La definizione (3.28) di prodotto scalare in L2 (E) andr` a modificata (in analogia con la definizione di prodotto scalare in Cn , pag. 115, Vol. 1) come segue Z hf, giL2 (E) := f (x) g(x) dx . E

u adatto per trattare adeguatamente un gran Lo spazio L2 costituisce l’ambito pi` numero di problemi, sia della Matematica, che della Fisica e dell’Ingegneria. Gli conferisce questa prerogativa il fatto di essere, in un certo senso, l’estensione pi` u naturale degli spazi euclidei Rn (o Cn ) al caso infinito-dimensionale. Per illustrare meglio questo aspetto, riprendiamo in considerazione le serie di Fourier, gi` a trattate nella Sezione 2 del Capitolo 3. Nello spazio L2 ( ⇡, ⇡) (sul campo reale) il sistema trigonometrico 1 '0 (x) = p , 2⇡

'2k

1 (x)

sin kx = p , ⇡

cos kx '2k (x) = p ⇡

k = 1, 2, . . .

costituisce, come abbiamo gi` a osservato, un sistema di funzioni ortogonali: abbiamo infatti (k, j = 1, 2, . . . , ) h'k , 'j i = kj (dove abbiamo scritto h·, ·i, in luogo di h·, ·iL2 ( ⇡,⇡) ). Esso possiede anche una propriet` a, di fondamentale importanza, detta propriet` a di completezza, che si pu` o enunciare nella forma seguente: PROPOSIZIONE 3.17 L’unica funzione f 2 L2 ( ⇡, ⇡) ortogonale a tutte le funzioni del sistema trigonometrico `e la funzione nulla (cio`e q.o nulla). Sia ora f una funzione 2⇡-periodica e di quadrato integrabile sull’intervallo ( ⇡, ⇡); essa ammette i coefficienti di Fourier ak e bk , poich´e gli integrali Z ⇡ Z ⇡ f (x) cos kx dx, f (x) sin kx dx ⇡



esistono per ogni k grazie alla disuguaglianza di Schwarz: Z

⇡ ⇡

f (x) cos kx dx 

✓Z

⇡ ⇡

◆1/2 ✓Z f (x)2 dx

⇡ ⇡

◆1/2 (cos kx)2 dx .

Ripetendo i calcoli gi` a svolti nel Paragrafo 3.2.5 (e utilizzando le stesse notazioni col` a introdotte), ricaviamo i seguenti risultati: i) anzitutto ritroviamo la disuguaglianza di Bessel: " # Z 1 1 X a20 X 2 2 2 ck = ⇡ (ak + bk )  + 2 k=0



k=1

ii) se sn (x) =

2n X

k=0

ck 'k (x)



f (x)2 dx = |f |2 ;

3. Integrale secondo Lebesgue

c 978-88-08-63708-6

395

`e la ridotta n-esima della serie di Fourier associata alla f , risulta (per m < n) * 2n + 2n X X |sn sm |2 = ck 'k , cj 'j = j=2m+1

k=2m+1

=

2n X

2n X

k=2m+1 j=2m+1

Poich´e la serie

1 P

k=0

ck cj h'k , 'j i =

2n X

c2k .

k=2m+1

c2k `e convergente, la successione {sn } `e fondamentale; per

la completezza di L2 ( ⇡, ⇡), la successione {sn } `e convergente, cio`e esiste una funzione S 2 L2 ( ⇡, ⇡) tale che |sn

S| ! 0.

iii) Questa funzione S possiede gli stessi coefficienti di Fourier della f ; infatti, per ogni k  2n risulta hS, 'k i = hS

sn , 'k i + hsn , 'k i = hS

sn , 'k i + ck .

Passando al limite per n tendente all’infinito (e ricordando che si pu` o portare il limite dentro il segno di prodotto scalare) abbiamo hS, 'k i = ck

8 k.

iv) Per la Proposizione 3.17 risulta allora S = f q.o.; infatti S f `e una funzione di L2 ( ⇡, ⇡) i cui coefficienti di Fourier sono tutti nulli, cio`e `e una funzione ortogonale a tutte le funzioni del sistema trigonometrico. Abbiamo cos`ı dimostrato il seguente TEOREMA 3.18 La serie di Fourier di ogni funzione f 2 L2 ( ⇡, ⇡) `e convergente in media quadratica a f e vale la relazione kf k2 =

(3.29)

1 X

c2k

k=0

La (3.29) `e detta uguaglianza di Parseval; essa segue immediatamente dalla ii) del Lemma 2.16 del Capitolo 3. Questo risultato, semplice e generale, indica che lo spazio L2 `e l’ambito naturale in cui sviluppare la teoria delle serie di Fourier. Ogni funzione di L2 ( ⇡, ⇡) si rappresenta come combinazione lineare (infinita) di vettori ortogonali (le 'k ), esattamente come in Rn ogni vettore si rappresenta come combinazione lineare (finita) dei vettori della base canonica. Viceversa, presa una qualunque successione di numeri ck tale che 1 P c2k < 1, risulta, per la (3.30), che la successione sn `e convergente a una funzione k=0

f di L2 ( ⇡, ⇡). Esiste dunque una corrispondenza 1 $ 1 tra le funzioni di L2 ( ⇡, ⇡) 1 P e le successioni {ck } tali che c2k < 1 proprio come in Rn c’`e una corrispondenza k=0

396

CAPITOLO 5. Misura e integrazione

c 978-88-08-63708-6

1 $ 1 tra i punti x dello spazio e le corrispondenti coordinate cartesiane ortogonali {x1 , . . . , xn }. L’uguaglianza di Parseval (3.29) `e l’analogo dell’uguaglianza |x|2 =

n X

x2k .

k=1

Osserviamo infine che il sistema trigonometrico `e solo un esempio (il pi` u noto) di sistemi di funzioni ortogonali e completi. Nelle applicazioni si incontrano molti altri sistemi di questo tipo (particolarmente utili sono i sistemi di polinomi ortogonali) per i quali potrebbero ripetersi, pressoch´e inalterate, le considerazioni sopra svolte per il sistema trigonometrico. Complementi con esercizi 1. Dimostrare che una funzione f 2 L(⌦) ` e finita q.o. in ⌦.

[Suggerimento: Prima si osservi che gli insiemi ⌦4+1 := {f = +1} e ⌦4 1:={f = 1} sono 1 T misurabili; per esempio, ⌦4+1 = ⌦k (f, ⌦). . . . Si ragioni poi per assurdo, utilizzando il k=1

Lemma 3.6.]

2. Dimostrare le seguenti relazioni, utilizzando il teorema di Lebesgue:

lim

n!1

lim

n!1

Z

n



Z0 n ⇣

1 1

0

x ⌘ x/2 =2 e n Z 1 ⌘ x n ↵ 1 x dx = e n 0

x ↵ 1

x

dx = (↵),

↵ > 0.

Queste relazioni possono essere dimostrate anche utilizzando i risultati del Capitolo 3? 3. Ricavare la formula

Z

1 0

xp 1

x

[Suggerimento: Rappresentare 4. Sia fn (x) = ae

nax

be

log

✓ ◆ 1 X 1 1 , dx = x (p + k)2 k=1

1 1

nbx

x

p>

1.

con la serie geometrica. . . ]

(0 < a < b). Si calcoli esplicitamente ! Z 1 X 1 b fn (x) = log a 0 n=1 1 Z 1 X fn (x)dx = 0. n=1

0

Si giustifichi il risultato. [Suggerimento: Conviene calcolare direttamente anche

1 R P 1

n=1

5. Dimostrare che la funzione integrale F (x) =

continua in [a, b]. [Suggerimento: usare il Lemma 3.6.]

Rx a

0

|fn (x)|dx. ]

f (t)dt di una funzione f 2 L(a, b) `e

3. Integrale secondo Lebesgue

c 978-88-08-63708-6

397

6. Si calcoli, giustificando il procedimento in base al Teorema 3.10, la derivata della funzione Z 1 log(x2 + t2 )dx t 7! 0

Dimostrare che la funzione gamma di Eulero, Z +1 (x) = tx

7.

1

e

t

dt

0

appartiene a C 1 (0, +1). R +1 sin x 8. Calcolo di 0 dx. x

Dimostrare le seguenti a↵ermazioni:

i) la funzione (0, 1) 3 x 7! f (x, y) = e xy sin x/x, f (0, y) = 1 `e integrabile 8 y > 0; R1 ii) la funzione (0, 1) 3 y 7! (y) = 0 f (x, y)dx `e di classe C 1 (0, 1); inoltre si ha lim

y!+1

iii)

lim

!!+1

Z

! 0

0

(y) = 0,

(y) =

1 , 1 + y2

(y) =

⇡ 2

arctg y;

sin x ⇡ dx = . x 2

[Suggerimento: mostrare che l’integrale

R +1 0

e xy x

1

sin x dx ! 0 se y ! 0.]

9. Stabilire se, per le seguenti funzioni, esistono gli integrali iterati e se sono uguali.

x2 y 2 (x, y) 2 [0, 1] ⇥ [0, 1]; (x2 + y 2 )2 1 ii) f (x, y) = (x, y) 2 [0, 1] ⇥ [0, 1]; (1 xy)↵ ( per y < x2 x 4 iii) f (x, y) = (x, y) 2 (0, 1) ⇥ (0, 1); 2 y per y > x2 i) f (x, y) =

iv) f come in iii)

(x, y) : 0 < x < 1, 1 < y < 1.

10.*

Se, nel teorema di Beppo Levi, cade l’ipotesi di monotonia, l’esistenza del limite non `e pi` u garantita. Vale per` o il seguente risultano: LEMMA DI FATOU: sia fk una successione di funzioni integrabili su ⌦, non negative, allora Z Z lim inf fk  lim inf fk ⌦ k!1

k!1



[Suggerimento: si ponga gk (x) = inf fj (x) e alla successione {gk } si applichi il teorema di j

k

Beppo Levi . . . ] Si formuli un analogo enunciato per funzioni fk non positive.

CAPITOLO 6

Superfici e integrali di superficie

Questo capitolo consiste essenzialmente di 2 parti. Nella prima sono esposti gli aspetti principali della geometria di↵erenziale delle superfici nello spazio tridimensionale. Precisamente, nella Sezione 1 i concetti principali sono quelli di piano tangente, di metrica, di area. Nella Sezione 2, meno elementare, si a↵ronta lo studio delle curvature delle sezioni di una superficie, pervenendo cos`ı alle nozioni di curvatura media e curvatura gaussiana. La seconda parte del capitolo `e dedicata ai teoremi di Green, Gauss e Stokes, fondamentali sia in geometria di↵erenziale che nella teoria (matematica e fisica) dei campi vettoriali. In tutto il capitolo gli integrali possono essere considerati sia come integrali secondo Riemann sia secondo Lebesgue. 1. 1.1

SUPERFICI IN R3 Definizioni principali. Superfici regolari

La definizione di curva come coppia insieme-parametrizzazione rispecchia la duplice natura geometrico-cinematica di regione dello spazio nella quale una particella si muove con un grado di libert` a. Analogamente si pensa a una superficie come a una regione dello spazio in cui una particella ha la possibilit` a di muoversi con due gradi di libert` a. Diversamente dal caso delle curve, l’aspetto cinematico `e per` o meno rilevante di quello geometrico. Ci` o, in ultima analisi, `e dovuto al fatto che le superfici, contraria` questo un concetto profondo mente alle curve, possiedono una geometria intrinseca. E che pu` o essere sviluppato solo in un corso di geometria di↵erenziale. Si pensi comunque alle propriet` a metriche di una curva. Esse sono identiche a quelle di una retta: introducendo come parametro l’ascissa curvilinea si pu` o deformare la curva in un segmento di retta in modo che le lunghezze rimangano invariante. Non cos`ı per una superficie, per lo meno non per tutte. Per esempio la metrica su una sfera (ovvero il modo di calcolare le distanze tra i punti su di essa), `e diversa da quella del piano: se si deforma una calotta in una porzione di piano le distanze tra i punti si alterano. Il concetto chiave in queste questioni `e quello di curvatura gaussiana che svilupperemo nella Sezione 2. Pu` o essere interessante osservare che Gauss orient` o

400

CAPITOLO 6. Superfici e integrali di superficie

Ds

c 978-88-08-63708-6

Ds

Figura 6.1. Deformazione isometrica di una curva in un segmento di retta.

le sue ricerche verso la geometria di↵erenziale delle superfici per risolvere problemi di topografia. Sia A un aperto connesso di R2 e T un insieme tale che: A✓T ✓A (ci` o implica, fra l’altro, che l’insieme dei punti interni di T , T , coincide con A). Sia r : T ! R3 una funzione continua; indichiamo con ⌃ l’immagine di T : ⌃ = r(T ); si noti che ⌃ `e connesso. La funzione r si chiama parametrizzazione di ⌃. DEFINIZIONE 1.1 Si dice superficie in R3 una coppia (⌃, r) dove ⌃ `e un insieme di R3 ed r una sua parametrizzazione1 . La Definizione 1.1 `e analoga a quella data per le curve; tuttavia, per le ragioni sopra esposte, nel caso delle superfici fisseremo maggiormente l’attenzione sull’insieme ⌃ e sulle sue propriet` a geometriche, cio`e quelle indipendenti dalla parametrizzazione. Ci` o giustifica l’uso di locuzioni improprie ma comode quali: “la superficie ⌃ di equazione r = r(u, v)” oppure semplicemente, “la superficie ⌃”, sottintendendo la parametrizzazione. Esplicitamente una parametrizzazione `e assegnata mediante l’equazione r(u, v) = (x(u, v), y(u, v), z(u, v)) (u, v) 2 T. oppure, in forma vettoriale, (1.1)

r(u, v) = x(u, v)i + y(u, v)j + z(u, v)k.

Si noti che nella Definizione 1.1 rientrano i grafici di funzioni f : T ! R, f 2 C(T ), che chiameremo superfici cartesiane; infatti, se, per esempio, ⌃ `e il grafico di una funzione del tipo z = f (x, y), una parametrizzazione di ⌃ `e assegnata dall’equazione (1.2)

r(x, y) = xi + yj + f (x, y)k (x, y) 2 T.

D’altra parte, senza ulteriori restrizioni, ⌃ pu` o degenerare in insiemi che sono ben lontani dall’idea intuitiva di superficie. Per esempio, se r(u, v) = r0 (costante), ⌃ si 1 In Geometria di↵erenziale la parametrizzazione si chiama pi` u propriamente “carta” della superficie.

1. Superfici in R3

c 978-88-08-63708-6

401

riduce a un punto, mentre se r(u, v) = r(u) oppure r(u, v) = r(v), ⌃ si riduce a una curva. Restringeremo perci` o le nostre considerazioni a superfici non degeneri nel senso che ora preciseremo. Anzitutto, se r 2 C k (T ), k

1, diremo che la superficie `e di classe C k .

DEFINIZIONE 1.2 Sia ⌃ una superficie di classe C 1 di equazione r = r(u, v), (u, v) 2 T .

Un punto p = r(u0 , v0 ), dove (u0 , v0 ) 2 T , si dice regolare se la matrice ◆ ✓ xu (u0 , v0 ) yu (u0 , v0 ) zu (u0 , v0 ) (1.3) xv (u0 , v0 ) yv (u0 , v0 ) zv (u0 , v0 ) ha caratteristica 2. In caso contrario il punto si dir` a singolare.

La superficie ⌃ si dir` a regolare se `e di classe C 1 e se per ogni (u, v) 2 T , r(u, v) `e punto regolare. Osserviamo subito che una superficie cartesiana `e regolare se la funzione f che la definisce `e di classe C 1 ; per esempio, se l’equazione della superficie `e la (1.2), la matrice (1.3) prende la forma ◆ ✓ 1 0 fx 0 1 fy che ha sempre caratteristica 2. Il significato geometrico della definizione di regolarit` a 1.2 `e il seguente: se p `e un punto regolare, allora in un intorno di p, la superficie ammette una rappresentazione cartesiana. Sia infatti ⌃ una superficie di equazione r = r(u, v) e sia p = r(u0 , v0 ) un suo punto di regolarit` a; allora almeno uno dei tre determinanti seguenti `e diverso da zero in (u0 , v0 ):

(1.4)

@(y, z) = yu zv @(u, v) @(z, x) = zu xv @(u, v) @(x, y) = xu yv @(u, v)

yv zu zv xu xv yu .

Sia, per fissare le idee, il terzo di questi determinanti non nullo. In base al teorema di inversione locale (Teor. 2.3, pag. 351, Vol. 1), dalle equazioni ( x = x(u, v) y = y(u, v) si possono ricavare, in un intorno di p, u = u(x, y) e v = v(x, y) che, sostituite in z = z(u, v), forniscono l’equazione cartesiana di ⌃ z = z(u(x, y), v(x, y)) := f (x, y).

402

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Esempio 1.1 L’emisfero destro della superficie sferica di raggio R e centro 0 pu` o essere descritto dall’equazione cartesiana p (1.5) y = R2 x2 z 2 (x, z) 2 T = {(x, z) 2 R2 : x2 + z 2 < R2 } oppure dall’equazione parametrica (1.6)

r(✓, ) = R cos ✓ sin i + R sin ✓ sin j + R cos k (✓, ) 2 T = (0, ⇡) ⇥ (0, ⇡).

La matrice (1.3) in questo caso `e la seguente: ✓ ◆ ✓ x✓ y✓ z✓ R sin ✓ sin R cos ✓ sin = x y z R cos ✓ cos R sin ✓ cos

0 R sin



che ha caratteristica 2 per (✓, ) 2 T . Si tratta di una superficie di classe C 1 , regolare. Si osservi che scegliendo, nella (1.6), T = [0, 2⇡] ⇥ [0, ⇡], l’equazione descrive tutta la superficie sferica. z y

q

R

y

x

Figura 6.2. L’emisfero destro della superficie sferica di raggio R e centro 0 : ✓ ` e la longitudine, colatitudine.

Esempio 1.2 Le equazioni p (1.7) z = x2 /a2 + y 2 /b2 ,

la

(x, y) 2 R2 \{0, 0}, a, b 2 R+

oppure (1.8)

r(✓, t) = at cos ✓i + bt sin ✓j + tk con (✓, t) 2 T = [0, 2⇡] ⇥ R+

definiscono una superficie regolare di classe C 1 che, come mostrato in Figura 6.3a, `e un cono a sezione ellittica, privato del vertice. Se, nella (1.8), si prende T = [0, 2⇡]⇥R, l’equazione descrive il cono doppio (a due falde); l’origine `e allora un punto singolare. Oltre a superfici definite mediante equazioni parametriche o cartesiane, `e utile considerare un terzo tipo di superfici definite come insiemi di livello di funzioni di tre

1. Superfici in R3

c 978-88-08-63708-6

403

z

t

bt at

y

x a) Figura 6.3. a) Cono a sezione ellittica.

b) b) Cono doppio (a due falde).

variabili. Precisamente, sia F : A ! R, A aperto di R3 , F 2 C 1 (A) e consideriamo l’insieme di livello E0 di equazione (1.9)

F (x, y, z) = 0.

Diremo che E0 definisce una superficie ⌃ se rF (x, y, z) 6= 0 in ogni punto di E0 tranne al pi` u in un numero finito di punti. Tale definizione di superficie si concilia localmente con quella data come coppia insieme-parametrizzazione. Infatti se (x0 , y0 , z0 ) 2 E0 e rF (x0 , y0 , z0 ) 6= 0, E0 coincide, in un intorno di (x0 , y0 , z0 ) (Teor. 3.5, pag. 377, Vol. 1), con il grafico di una funzione di due variabili, dunque con una superficie cartesiana. Si dice che (1.9) definisce ⌃ implicitamente. a visto nel I punti E0 in cui rF = 0 si dicono singolari in accordo con quanto gi` Paragrafo 7.3.5, pagina 379, Volume 1. Se non esistono punti singolari la superficie ⌃ si dir` a regolare. Esempio 1.3 L’equazione x2 +y 2 +z 2 R2 = 0 definisce implicitamente una sfera; non vi sono punti singolari. L’equazione z 2 x2 /a2 y 2 /b2 = 0 definisce un cono ellittico (a due falde) che ha un punto singolare nell’origine. Pi` u in generale, un’equazione del tipo Q(x, y, z) = 0, dove Q `e un polinomio di secondo grado soddisfacente opportune condizioni (Esercizio 1), definisce una superficie algebrica di nome quadrica. 1.2

Bordo di una superficie. Superfici regolari a pezzi

Se ⌃ `e una superficie di equazione vettoriale r = r(u, v) e la restrizione di r a T `e 1 $ 1, la superficie si dice semplice. L’emisfero dell’Esempio 1.1 `e una superficie semplice. In generale, le superfici in forma cartesiana sono semplici. Anche la superficie sferica di equazione (1.6) con

404

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

T = [0, 2⇡] ⇥ [0, ⇡] `e semplice; si noti che, scegliendo per esempio T = R2 , si ottiene invece una superficie non semplice. Avremo bisogno pi` u avanti delle nozioni di bordo di una superficie e di superficie chiusa. Si tratta di concetti piuttosto delicati e perci` o, in questa introduzione, ci limitiamo a superfici ⌃ di equazione vettoriale r = r(u, v) 2 C 1 (T ), dove T `e aperto. Chiamiamo bordo di ⌃ l’insieme @⌃ := ⌃\⌃ dove ⌃ `e la chiusura di ⌃ in R3 . Il bordo di ⌃ pu` o ridursi a un punto come nel caso del cono privato del vertice: ⌃\⌃ si riduce al vertice stesso. Pu` o essere una linea regolare: nel caso dell’emisfero dell’Esempio 1.1, @⌃ coincide con il cerchio massimo passante per i poli. Pu` o anche essere vuoto come nel caso del paraboloide di equazione z = x2 + y 2

(x, y) 2 R2 .

Se ⌃ coincide con l’insieme di livello F (x, y, z) = 0 (con F di classe C 1 ), per la ` il caso, per continuit` a di F , ⌃ `e un insieme chiuso in R3 e quindi ⌃\⌃ = ?. E esempio, della sfera. Le superfici senza bordo (cio`e con @⌃ = ?) e limitate in R3 si dicono chiuse. Si osservi dunque che superficie chiusa non implica solo che ⌃ sia un chiuso in R3 , bens`ı o `e in accordo con l’intuizione in che sia anche limitato, ovvero un compatto in R3 . Ci` quanto, secondo questa definizione, un paraboloide non `e una superficie chiusa mentre una sfera lo `e. Come si nota dalla definizione, i concetti di bordo e di superficie chiusa non dipendono dalla parametrizzazione (ricordiamo che T deve essere aperto). Possiamo infine allargare il nostro concetto di superficie a quelle di classe C 1 a pezzi. Come modello si pu` o pensare a un poliedro, che pu` o essere suddiviso da un numero finito di segmenti (spigoli) in un numero finito di superfici piane (facce). DEFINIZIONE 1.3 Diremo che ⌃ 2 R3 rappresenta una superficie C 1 a pezzi se esistono un numero finito di curve regolari a tratti (dette spigoli) 1 , . . . , N , contenute in ⌃, che suddividono ⌃ in un numero finito N0 di superfici di classe C 1 (dette facce). Pi` u precisamente deve essere: ⌃\

N S

j=1

j

=

N S0

⌃i dove ogni ⌃i ammette una parame-

i=1

trizzazione r : Ti ! R3 , r 2 C 1 (Ti ), Ti aperto in R2 e dove ogni i non pu` o essere parte del bordo di pi` u di due facce. Il bordo @⌃ di ⌃ `e in questo caso costituito dall’unione dei bordi delle ⌃j con esclusione degli spigoli che appartengono al bordo di due facce adiacenti. Se ogni faccia di una superficie C 1 a pezzi `e regolare diremo che la superficie `e regolare a pezzi. Diremo che ⌃, C 1 a pezzi, `e chiusa se @⌃ = ? e se `e limitata. Tipici esempi di superfici regolari a pezzi sono, oltre ai gi` a citati poliedri, l’unione di due calotte sferiche aventi il bordo circolare in comune o la superficie laterale di un tronco di piramide (Fig. 6.4).

1. Superfici in R3

c 978-88-08-63708-6

405

Figura 6.4. Esempi di superfici C 1 a pezzi: guscio formato da due calotte sferiche (superficie chiusa) e superficie laterale di un tronco di piramide (@⌃ ` e l’unione dei bordi di due quadrilateri, basi del tronco).

1.3 Linee coordinate. Coordinate locali. Cambiamento di parametri La condizione di regolarit` a di un punto pu` o essere espressa in un altro modo, pi` u utile per il prosieguo della teoria. A tale scopo, per una superficie regolare di equazione vettoriale r = r(u, v), introduciamo le curve di equazione u 7! r(u, v),

(1.10)

v 7! r(u, v)

che si ottengono, cio`e, considerando v = v = costante o u = u = costante. Le (1.10) si chiamano linee coordinate sulla superficie (Fig. 6.5). In questo contesto u e v si chiamano coordinate locali dei punti sulla superficie. z

v r v

rv(u,v)

T

ru(u,v) u

u

S

y

x

Figura 6.5. Linee coordinate e vettori tangenti.

Per esempio, per la superficie sferica di equazione (1.6) con (✓, ) 2 [0, 2⇡] ⇥ (0, ⇡), le linee coordinate corrispondono ai meridiani (✓ = costante) e ai paralleli ( = costante). I vettori tangenti alle linee coordinate sono assegnati dalle formule seguenti: (1.11)

ru (u, v) = xu (u, v)i + yu (u, v)j + zu (u, v)k rv (u, v) = xv (u, v)i + yv (u, v)j + zv (u, v)k.

Ora, eseguendo il prodotto vettoriale tra ru ed rv si ottiene: i j k @(z, x) @(x, y) @(y, z) ru ⇥ rv = xu yu zu = i+ j+ k. @(u, v) @(u, v) @(u, v) xv yv zv Ricordando le (1.4) si deduce che: r(u, v) `e regolare se e solo se ru ⇥ rv 6= 0 ovvero se ru ed rv sono linearmente indipendenti. I vettori ru , rv e ru ⇥ rv giocheranno un ruolo fondamentale nel seguito.

406

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Come abbiamo gi` a visto negli Esempi 1.1 e 1.2 diverse equazioni parametriche possono individuare lo stesso insieme ⌃. Dal punto di vista geometrico `e importante isolare le quantit` a che rimangono invariate in un cambiamento di parametri (o di coordinate locali). Sia ⌃ una superficie regolare di equazione vettoriale r(u, v) = x(u, v)i + y(u, v)j + z(u, v)k,

(u, v) 2 T ✓ R2 .

Introduciamo il cambiamento di parametri definito dalle equazioni (1.12)

u = '(s, t),

dove (s, t) 2 S ✓ R2 e ',

v = (s, t)

2 C(S).

Supponiamo che ', 2 C 1 (S), che @(', )/@(s, t) 6= 0 in S e che le (1.12) realizzino una corrispondenza biunivoca tra S e T . Se valgono le ipotesi indicate, il cambiamento di variabile si dir` a regolare. La superficie `e allora descritta dall’equazione

dove

e r(s, t) = x e(s, t)i + ye(s, t)j + ze(s, t)k x e(s, t) = x('(s, t), ye(s, t) = y('(s, t), ze(s, t) = z('(s, t),

(s, t)), (s, t)), (s, t)).

Nelle nuove coordinate locali si ha: (1.13) (1.14)

@' @ @' @ e + rv , e rt = ru + rv rs = ru @s @s @t @t ✓ ◆ @' @ @(', ) @' @ e rt = · · ru ⇥ rv = ru ⇥ rv . rs ⇥ e @s @t @t @s @(s, t)

Si deduce dalla (1.14) che la regolarit` a dei punti non cambia se si opera una trars ⇥ e rt 6= 0 sformazione regolare di parametri: se ru ⇥ rv 6= 0 in p 2 ⌃, anche e in p. rs , e rt individuano lo stesso piano, Le (1.13) indicano che le coppie di vettori ru , rv e e che, come vedremo nel prossimo paragrafo, sar` a detto piano tangente alla superficie. Due parametrizzazioni r ed e r di una stessa superficie ⌃ si dicono equivalenti se sono legate da un cambiamento regolare di parametri con determinante jacobiano positivo. rt e ru ⇥ rv hanno stessa direzione e verso. In questo caso si vede che i due vettori e rs ⇥e ` facile verificare che la relazione appena introdotta tra le parametrizzazioni di E una stessa superficie `e una relazione di equivalenza. Ritorneremo pi` u avanti sul suo significato geometrico. Esempi 1.4 Sia r(u, v) = (x0 + a1 u + b1 v)i + (y0 + a2 u + b2 v)j + (z0 + a3 u + b3 v)k dove (x0 , y0 , z0 ) 2 R3 , aj , bj 2 R per j = 1, 2, 3.

1. Superfici in R3

c 978-88-08-63708-6

407

Se i due vettori ru = a := a1 i+a2 j+a3 k e rv = b := b1 i+b2 j+b3 k sono indipendenti, allora l’equazione r = r(u, v) definisce un piano passante per (x0 , y0 , z0 ) e a ⇥ b `e un vettore normale al piano. In questo caso la superficie `e regolare. Le linee coordinate u = u e v = v costituiscono una rete di rette parallele rispettivamente a b e ad a. Il piano pu` o essere descritto dall’equazione (implicita): x

x0 y y0 z z0 a1 a2 a3 = 0. b1 b2 b3

z c

–b y a x Figura 6.6. Ellissoide.

1.5 L’equazione x2 y2 z2 + + =1 (a, b, c 2 R+ ) a2 b2 c2 definisce una superficie chiusa di classe C 1 che si chiama ellissoide di semiassi a, b, c (Fig. 6.6). Infatti rF (x, y, z) = (2x/a2 , 2y/b2 , 2z/c2 ) e non vi sono punti singolari; la rappresentazione cartesiana `e possibile in un intorno di ciascun punto. Per esempio, nell’intorno del punto (0, 0, c) l’equazione definisce F (x, y, z) =

z = c(1

x2 /a2

y 2 /b2 )1/2 .

Lo stesso ellissoide si pu` o rappresentare mediante l’equazione vettoriale (1.15)

r(✓, ) = a cos ✓ sin i + b sin ✓ sin j + c cos k

con (✓, ) 2 [0, 2⇡] ⇥ [0, ⇡]. Si ha r✓ = a sin ✓ sin i + b cos ✓ sin j r = a cos ✓ cos i + b sin ✓ cos j c sin k. Si noti che i due vettori r✓ e r sono linearmente indipendenti per

6= 0, ⇡.

1.6 L’equazione (in R3 ) x2 + y 2 = R2

(z 2 R)

con R > 0, definisce un cilindro infinito di raggio R. Si tratta di una superficie di classe C 1 ; non vi sono punti singolari.

408

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Lo stesso cilindro ammette la rappresentazione parametrica r(✓, v) = R cos ✓i + R sin ✓j + vk con (✓, v) 2 [0, 2⇡] ⇥ R. In questa rappresentazione le linee coordinate sono cerchi (v = costante) e rette parallele all’asse z (✓ = costante). Si ha: r✓ (✓, v) = R sin ✓i + R cos ✓j rv (✓, v) = k e pertanto i due vettori sono linearmente indipendenti per ogni (✓, v) 2 [0, 2⇡] ⇥ R; non vi sono punti singolari. Limitandosi a |z| < M si ottiene un cilindro finito di altezza 2M . In questo caso la superficie ha come bordo l’unione delle due circonferenze {(x, y, z) 2 R3 ; x2 +y 2 = R2 , z = +M } e {(x, y, z) 2 R3 ; x2 +y 2 = R2 , z =

M }.

z

a v

b

u

y

x Figura 6.7. Toro.

1.7 Sia r(u, v) = (a + b sin u) cos vi + (a + b sin u) sin vj + b cos uk con 0 < b < a e (u, v) 2 [0, 2⇡] ⇥ [0, 2⇡]. Si tratta di una superficie chiusa, di classe C 1 , che si chiama toro; la forma `e quella di una ciambella o di una salvagente, come si vede in Figura 6.7, dove sono indicati anche i significati di u, v e di a, b. Le linee coordinate si chiamano cerchi meridiani (v = costante) e cerchi paralleli (u = costante). Si ha: ru (u, v) = b cos u cos vi + b cos u sin vj b sin uk rv (u, v) = (a + b sin u) sin vi + (a + b sin u) cos vj. Per u 6= 0, ⇡ `e chiaro che ru e rv sono indipendenti; per u = 0 e u = ⇡ sono ortogonali, dunque ancora indipendenti. Non vi sono pertanto punti singolari.

1. Superfici in R3

c 978-88-08-63708-6

409

Si noti che lo stesso toro `e rappresentabile implicitamente dall’equazione p ( x2 + y 2 a)2 + z 2 = b2 . 1.8 Superfici di rivoluzione. Se si fa ruotare una curva piana intorno a una retta (asse) giacente nel piano della curva si ottiene una superficie di rivoluzione; si chiama generatrice. Se il piano `e il piano di equazione x = 0, la retta `e l’asse z e la curva ha equazioni parametriche y = f (t), z = g(t) t 2 I ✓ R, la corrispondente superficie di rivoluzione ha equazione vettoriale (1.16)

r(✓, t) = f (t) cos ✓i + f (t) sin ✓j + g(t)k

dove (✓, t) 2 [0, 2⇡] ⇥ I (Fig. 6.8). z

t parallelo t = t

generatrice

q

meridiano q = q y x Figura 6.8. Superficie di rivoluzione.

Se la curva `e di classe C k (I), la superficie sar` a della stessa classe. Se la curva `e chiusa, anche la superficie risulter` a chiusa. Sfera, toro, ellissoide (con 2 semiassi uguali), cono (a sezione circolare) sono esempi di superfici di rivoluzione; le prime 3 sono inoltre chiuse. Le linee coordinate ✓ = costante corrispondono alle diverse posizioni assunte dalla generatrice e si chiamano linee meridiane mentre quelle corrispondenti a t = costante sono cerchi e si chiamano paralleli. Per esempio, prendiamo come generatrice la catenaria di equazione y = Ch t,

z = t (t 2 R).

La superficie di rivoluzione corrispondente si chiama catenoide; `e semplice e di classe C 1 in [0, 2⇡] ⇥ R e ha equazione vettoriale r(✓, t) = Ch t cos ✓i + Ch t sin ✓j + tk.

410

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Si ha: r✓ (✓, t) = Ch t sin ✓i + Ch t cos ✓j rt (✓, t) = Sh t cos ✓i + Sh t sin ✓j + k. Essendo questi vettori sempre linearmente indipendenti, la catenoide `e regolare.

Complementi con esercizi 1. Le quadriche sono superfici definite da equazioni della forma

Ax2 + By 2 + Cz 2 + 2Dxy + 2Exz + 2F yz + Gx + Hy + Iz + K = 0. Con una rototraslazione le quadriche non degeneri e reali si riducono alle seguenti: x2 a2 x2 a2 x2 a2 x2 a2 x2 a2 x2 a2

y2 z2 + 2 = 1 (ellissoide) 2 b c y2 z2 + 2 = 1 (iperboloide a una falda) b c2 y2 z2 = 1 (iperboloide a due falde) 2 b c2 y2 + 2 z = 0 (paraboloide ellittico) b y2 z = 0 (paraboloide iperbolico: sella di cavallo) b2 y2 + 2 z 2 = 0 (cono doppio). b +

Verificare regolarit` a, connessione e chiusura delle quadriche indicate. Trovare una rappresentazione parametrica, studiandone le linee coordinate. 2. La superficie di equazione

r(u, v) = v cos f (u)i + v sin f (u)j + uk dove f (u) `e una funzione di classe C 1 definita sull’intervallo [a, b], si chiama conoide retto. Studiarne la regolarit` a e le linee coordinate u = costante e v = costante; calcolare ru ed rv . 3. Elicoide. Esaminare pi` u in dettaglio il caso particolare di conoide, dato dall’equazione

r(u, v) = v cos ui + v sin uj + uk. Questa superficie si chiama elicoide ed `e rappresentata in Figura 6.24. 4. Verificare che il toro dell’Esempio 1.7 ` e una superficie di rivoluzione chiusa. Qual `e la generatrice? 5. Sia r(u, v) il toro dell’Esempio 1.7. Descrivere la curva e r(u) = r(↵u, u), u 2 R, al variare del parametro ↵ 2 R.

6. Sia z = f (y) una curva nelppiano y, z. Verificare che la superficie di rivoluzione attorno

all’asse z ha equazione z = f (

x2 + y 2 ).

7. Per la superficie di rivoluzione (1.16) dell’Esempio 1.8 calcolare r✓ (✓, t) e rt (✓, t).

1. Superfici in R3

c 978-88-08-63708-6

411

1.4 Vettore normale. Piano tangente. Orientazione D’ora in poi, per lo sviluppo della teoria, interverranno solo i punti interni a T ; per evitare un appesantimento nelle notazioni supporremo, nel prosieguo di questo paragrafo, T aperto. Sia r = r(u, v), (u, v) 2 T ✓ R2 l’equazione di una superficie ⌃ regolare. I due vettori ru e rv sono pertanto linearmente indipendenti per ogni (u, v) 2 T . Sia ora una curva regolare contenuta in T di equazioni parametriche u = u(t), v = v(t), t 2 I ✓ R. La curva di equazione e r(t) = r(u(t), v(t))

(1.17)

`e allora una curva regolare giacente sulla superficie con vettore tangente (1.18)

e r0 (t) = ru (u(t), v(t))u0 (t) + rv (u(t), v(t))v 0 (t).

La (1.18) indica che e r0 `e contenuto nel piano dei vettori ru ed rv . D’altra parte, fissato un punto p0 = r(u0 , v0 ), ogni curva regolare passante per p0 e giacente su ⌃ si pu` o rappresentare localmente nella forma (1.17)2 e quindi il suo vettore tangente `e contenuto nel piano dei vettori ru e rv , per quanto spiegato nel paragrafo precedente. Il piano parallelo a questo e passante per p0 , contiene dunque tutte le rette tangenti a ogni curva regolare passante per p0 e giacente sulla superficie. Per questa ragione `e detto piano tangente a ⌃ nel punto p0 = r(u0 , v0 ). Le formule (1.13) indicano che tale piano `e invariante per cambi di parametrizzazione regolari. La sua equazione `e la seguente, ricordando che ru ⇥ rv `e normale a ru e rv . h⇠

r(u0 , v0 ), ru (u0 , v0 ) ⇥ rv (u0 , v0 )i = 0

dove ⇠ = xi + yj + zk `e il punto corrente sul piano. La formula precedente pu` o essere scritta nella forma seguente: x

x(u0 , v0 ) y y(u0 , v0 ) z z(u0 , v0 ) yu (u0 , v0 ) zu (u0 , v0 ) = 0. xu (u0 , v0 ) yv (u0 , v0 ) zv (u0 , v0 ) xv (u0 , v0 )

a Il vettore ru ⇥ rv `e un vettore normale alla superficie; il versore corrispondente sar` indicato con la lettera n: (1.19)

n=

ru ⇥ rv . |ru ⇥ rv |

Esempio 1.9 Sia z = f (x, y) l’equazione di una superficie, con f 2 C 1 (T ), T aperto connesso di R2 . 2 Ricordando che localmente ⌃ ` e rappresentabile, per esempio, dall’equazione z = f (x, y), si deduce che ogni curva (x(t), y(t), z(t)) giacente in ⌃ si potr` a scrivere nella forma (1.17)

e r(t) = x(t)i + y(t)j + f (x(t), y(t))k.

412

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

L’equazione vettoriale della superficie ha la forma r(x, y) = xi + yj + f (x, y)k. Dunque si ha: rx (x, y) = i + fx (x, y)k, rx ⇥ ry = ed infine

fx i

ry (x, y) = j + fy (x, y)k p fy j + k, |rx ⇥ ry | = 1 + |rf |2 ,

1 n= p ( fx i 1 + |rf |2

fy j + k).

Il piano tangente alla superficie nel punto (x0 , y0 , f (x0 , y0 )) ha equazione (x

x0 )fx (x0 , y0 ) + (y

y0 )fy (x0 , y0 )

(z

z0 ) = 0,

(z0 = f (x0 , y0 ))

che coincide con la (7.1.8) del Volume 1. Tra i due versori normali n e n converremo di chiamare n il versore normale. La scelta di n o n come versore normale corrisponde intuitivamente a privilegiare uno dei due “lati” di una superficie3 ; per esempio, il lato interno o quello esterno di una superficie sferica. Situazioni in cui occorre scegliere un verso per la normale si presentano spesso nelle scienze applicate, come vedremo pi` u avanti. Pi` u precisamente, la scelta di uno dei due versori n e n `e legata al concetto di orientazione di una superficie. Sia ⌃ una superficie regolare; supponiamo che sia possibile scegliere il versore normale in modo che, partendo da un punto p0 2 ⌃ e seguendo una qualunque curva regolare e chiusa (che, dunque, ritorni in p0 ) sulla superficie, il versore normale vari con continuit` a e ritorni nella posizione iniziale. In tale caso diremo che la superficie `e orientabile e che la scelta del versore normale determina l’orientazione. Una superficie regolare semplice con dominio base T aperto `e orientabile, come facilmente si verifica, essendo n = n(u, v) un vettore continuo su T (Fig. 6.9). z

n

r(u,v) y x Figura 6.9. Superficie orientabile. 3 Come

al solito, ` e efficace pensare n come spiccato da p0 anzich´ e da 0.

1. Superfici in R3

c 978-88-08-63708-6

413

` altres`ı facile verificare che tutte le superfici considerate negli Esempi 1.2-1.8 sono E orientabili. Il pi` u famoso esempio di superficie non orientabile `e il nastro di M¨ obius, definito dalla seguente equazione: ◆ ✓ ◆ ✓ ✓ ✓ ✓ i + 2 sin ✓ + t sin ✓ cos j + t sin k r(✓, t) = 2 cos ✓ + t cos ✓ cos 2 2 2 con (✓, t) 2 R ⇥ ( 1, 1). Per la periodicit` a di r ci si pu` o limitare a (✓, t) 2 [0, 2⇡] ⇥ ( 1, 1). Questa superficie `e illustrata in Figura 6.10.

Figura 6.10. Nastro di M¨ obius.

Per mostrare il fatto che questa superficie non `e orientabile calcoliamo il versore normale n nel punto p0 = r(0, 0) = 2i. Si ottiene: r✓ (0, 0) = 2j,

rt (0, 0) = i,

r✓ (0, 0) ⇥ rt (0, 0) =

2k

e quindi n(0, 0) = k. Seguiamo ora, partendo da p0 , il meridiano centrale r(✓, 0), ✓ 2 [0, 2⇡]. Si ha: r✓ (✓, 0) =

2 sin ✓i + 2 cos ✓j ✓ ✓ ✓ rt (✓, 0) = cos ✓ cos i + sin ✓ cos j + sin k 2 2 2 ✓ ✓ r✓ (✓, 0) ⇥ rt (✓, 0) = 2 cos ✓ sin i + 2 sin ✓ sin j 2 2

✓ 2 cos k 2

e quindi, essendo |r✓ (✓, 0) ⇥ rt (✓, 0)| = 2, ✓ ✓ n(✓, 0) = cos ✓ sin i + sin ✓ sin j 2 2

✓ cos k. 2

Quando ✓ ! 2⇡ , n(✓, 0) ! k = n(0, 0). D’altra parte, quando ✓ ! 2⇡ , il punto r(✓, 0) tende a r(2⇡, 0) = r(0, 0). Dunque, seguendo un percorso continuo lungo la superficie, il versore normale ha cambiato verso: la superficie non `e orientabile. Per renderci conto della non orientabilit` a del nastro M¨ obius immaginiamo di partire da p0 e muoverci lungo il meridiano centrale; dopo un giro ci ritroviamo in p0 , ma sul “lato” opposto del nastro. Esistono anche superfici chiuse non orientabili; la pi` u nota tra esse si chiama otre di Klein ed `e illustrata in Figura 6.11. Come si vede, l’otre di Klein `e una superficie

414

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

` una superficie chiusa ma non si pu` Figura 6.11. L’otre di Klein. E o parlare di interno o esterno alla superficie.

connessa ma non `e frontiera di alcun aperto connesso e limitato di R3 , propriet` a che, si pu` o dimostrare, caratterizza le superfici connesse chiuse e orientabili. Per queste ultime vale un analogo del teorema di Jordan per le curve chiuse semplici nel piano: una superficie chiusa, connessa e orientabile suddivide lo spazio R3 in due parti; una `e limitata e si chiama interno della superficie, l’altra `e illimitata e prende il nome di esterno. Sono cos`ı ben definiti i versori normali interno, ni , ed esterno ne . E↵ettuando un cambio di parametri regolare, abbiamo gi` a osservato che, in base alle (1.13), il piano tangente rimane invariato. Il versore normale (1.19) cambia verso se lo jacobiano del cambiamento di variabili `e negativo, mentre rimane invariato se `e positivo, come mostra la (1.14). Ci` o significa in particolare che, se una superficie ⌃ `e orientabile, l’orientazione rimane inalterata rispetto a parametrizzazioni equivalenti. Si pu` o allora definire superficie orientata (regolare) un insieme ⌃ con una classe di equivalenza di parametrizzazioni regolari. Un po’ pi` u delicato `e il problema dell’orientazione delle superfici regolari a pezzi. Per quelle connesse e chiuse, che siano frontiera di aperti in R3 , un’orientazione `e determinata scegliendo su ciascuna delle facce sempre il versore ne oppure il versore ni . In questo modo si `e stabilita una orientazione simile a quella delle superfici regolari. Il fatto che i versori non siano definiti sui bordi delle facce non causa problemi. Sull’orientazione delle superfici regolari a pezzi, non chiuse, torneremo in seguito.

Esercizi 8. Sia F (x, y, z) = 0 l’equazione di una superficie regolare chiusa. Determinare l’espressione

dei versori normali esterno e interno e l’equazione del piano tangente in un punto generico della superficie. Verificare che questa coincide con la (3.23) del Paragrafo 7.3.5, del Volume 1. 9. Verificare che, se r = r(u, v), il cambio di parametri s = v e t = u (scambio tra u e v) cambia l’orientazione della superficie. 10. Verificare che le superfici degli Esempi 3.5 (ellissoide), 3.6 (toro) e 3.8 (catenoide) sono orientabili.

1.5 Metrica sulla superficie. Prima forma fondamentale In questo paragrafo ci occupiamo della lunghezza delle curve giacenti su una superficie regolare.

1. Superfici in R3

c 978-88-08-63708-6

415

Sia ⌃ una superficie regolare di equazione vettoriale r = r(u, v), (u, v) 2 T ✓ R2 (T aperto) e e r(t) = r(u(t), v(t)), t 2 [a, b], una curva regolare giacente su ⌃. Per la lunghezza di e r vale la formula (1.8), Capitolo 1 l(t) =

Z

t

a

|e r0 (t)|dt (l = l(t) = lunghezza d’arco).

Poich´e e r0 = ru u0 + rv v 0 si ha

|e r0 (t)|2 = |ru |2 (u0 )2 + 2hru , rv iu0 v 0 + |rv |2 (v 0 )2 .

Ponendo: E = |ru |2 ,

(1.20)

G = |rv |2

F = hru , rv i,

si ricava la formula seguente per il di↵erenziale della lunghezza d’arco: dl2 = Edu2 + 2F du dv + Gdv2 .

(1.21)

La formula quadratica a secondo membro della (1.21) si chiama prima forma fondamentale o metrica riemanniana della superficie; essa verr` a indicata anche con il simbolo F1 . Dall’identit` a di Lagrange (Proposizione 1.1c del Cap. 1) si ha: (1.22)

EG

F 2 = |ru |2 · |rv |2

(hru , rv i)2 = |ru ⇥ rv |2 > 0.

Dunque F1 `e una forma quadratica definita positiva (cio`e positiva per ogni (du, dv) 6= (0, 0)). Si noti che, in base alla (1.22), il versore normale alla superficie si pu` o scrivere nella forma ru ⇥ rv . n= p EG F 2

(1.23)

Un primo fatto fondamentale `e che la metrica `e invariante per cambi regolari di parametri. Infatti ricordando le (1.12), si verifica facilmente che, se u = '(s, t), v = (s, t), e Fe, G, e si ha (Esercizio 11): posto e r(s, t) = r('(s, t), (s, t)) e definite analogamente E, rs |2 ds2 + 2he rs , e rt ids dt + |e rt |2 dt2 = de l2 = |e

= |ru |2 ('2s ds2 + '2t dt2 + 2's 't ds dt) + |rv |2 ( ⇣ + 2hru , rv i 's s ds2 + 't t dt2 + 2('s t +

= Edu2 + 2F du dv + Gdv2 = dl2 .

2 2 s ds

2 2 t dt

+

+2 ⌘ s 't )ds dt =

s t ds dt)+

Si noti invece che E, G, F non sono invarianti. Infatti dalle (1.12) e (1.22) si ricava (1.24)

EG

eG e F = (E 2

Fe2 )



@(', ) @(s, t)

◆2

.

416

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Esempi 1.10 Metrica per superfici in forma cartesiana z = f (x, y). Si ha, ricordando i calcoli dell’Esempio 1.9: E = 1 + (fx )2 ,

G = 1 + (fy )2

F = fx fy ,

e quindi (1.25)

dl2 = [1 + (fx )2 ]dx2 + 2fx fy dx dy + [1 + (fy )2 ]dy 2 .

1.11 Metrica per superfici in forma implicita F (x, y, z) = 0. ricavare z = f (x, y), localmente. Ricordando che allora fx = si ottiene



E =1+

Fx Fz

◆2

,

Fx Fz

e fy =

F =

Fx Fy , (Fz )2

Se Fz 6= 0 si pu` o

Fy Fz

G=1+



Fy Fz

◆2

.

Per esempio, per la sfera di p equazione x2 + y 2 + z 2 = R2 si ha, pensando z = p 2 2 2 R x y oppure z = R2 x2 y 2 : (1.26)

dl2 =

R2

R2

y2

x2

y2

dx2 +

2xy x2

R2

y2

dx dy +

R2

R2

x2

x2

y2

dy 2 .

` spesso pi` 1.12 Metrica in coordinate cilindriche e polari in R3 . E u significativo esprimere la prima forma fondamentale in coordinate che non siano quelle cartesiane ` utile in questi casi osservare che dl2 = dx2 + dy 2 + dz 2 . ortogonali. E Nelle coordinate cilindriche x = % cos ✓, y = % sin ✓, z = z si ha: dl2 = dx2 + dy 2 + dz 2 = = (cos ✓d%

% sin ✓d✓)2 + (sin ✓d% + % cos ✓d✓)2 + dz 2

da cui dl2 = d%2 + %2 d✓2 + dz 2 .

(1.27)

Nelle coordinate polari x = % sin ✓ 2 [0, 2⇡], 2 [0, ⇡], si ha: dl2 = (sin

cos ✓, y = % sin

cos ✓d% + % cos

+ (sin

cos ✓d

sin ✓d% + % cos

+ (cos d%

sin ✓, z = % cos , % > 0,

% sin

sin ✓d✓)2 +

sin ✓d + % sin

% sin d )2

da cui: (1.28)

dl2 = d%2 + %2 d

2

+ %2 (sin )2 d✓2 .

cos ✓d✓)2 +

1. Superfici in R3

c 978-88-08-63708-6

417

1.13 Ritorniamo alla superficie sferica x2 + y 2 + z 2 = R2 dell’Esempio 1.11. In coordinate polari l’equazione di tale sfera `e % = R. Usando la (1.28) e osservando che d% = 0, la metrica `e espressa in modo pi` u efficace dall’equazione dl2 = R2 (d

2

+ (sin )2 d✓2 ).

Concludiamo il paragrafo con una osservazione. Se una superficie ⌃ regolare `e connessa per archi (Esercizio 21, Sez. 1, Cap. 1), allora `e sempre possibile unire due punti qualunque p, q di ⌃ con una curva regolare contenuta in ⌃. Essendo la metrica indipendente dalla parametrizzazione di ⌃, ha senso definire (1.29)

d(p, q) := inf l( )

dove l’estremo inferiore `e cercato al variare di nell’insieme delle curve regolari giacenti su ⌃, che uniscono p a q e dove l( ) indica la lunghezza di . Si mostra che d: ⌃ ⇥ ⌃ ! R `e una distanza nel senso precisato dalla Definizione 1.1 del Capitolo 3. Pertanto la coppia (⌃, d) `e uno spazio metrico. Le linee (se esistono!) che realizzano la distanza d(p, q) si chiamano geodetiche. Per esempio, le geodetiche su una superficie sferica risultano archi di cerchio massimo. Le geodetiche di una superficie giocano lo stesso ruolo dei segmenti di retta in un piano.

Esercizi 11. Eseguire i calcoli della verifica che F1 ` e invariante per cambi regolari di parametri.

Dimostrare la formula (1.24).

12. Dimostrare che, se si esegue una trasformazione di variabili ortogonale, allora la prima

forma fondamentale F1 rimane invariata. [Posto 0 1 0 1 x x e @ y A = A @ yeA z ze con AT = A

(1.30)

1

, si ha:

x2 + de y 2 + de z 2 ]. dx2 + dy 2 + dz 2 = de

13. Calcolare la metrica riemanniana per il toro. 14. Dimostrare che la metrica riemanniana per il cilindro x2 + y 2 = R2 , si pu` o scrivere nella

forma dl2 = ds2 + dz 2 , dove ds indica il di↵erenziale della lunghezza d’arco per le curve sulla superficie. 15. Calcolare la metrica riemanniana per il paraboloide z = x2 + y 2 . 16. Siano: r(u, v) una superficie regolare, p = r(u0 , v0 ) un punto sulla superficie, r1 (t) = r(u1 (t), v1 (t)) ed r2 (⌧ ) = r(u2 (⌧ ), v2 (⌧ )) due curve sulla superficie passanti per p (per esempio r1 (0) = r2 (0) = p).

418

CAPITOLO 6. Superfici e integrali di superficie

Dimostrare che se , 0  cos

=

c 978-88-08-63708-6

< 2⇡, `e l’angolo tra le due curve in p, si ha:

Edu1 du2 +F (du1 dv2 +du2 dv1 )+Gdv1 dv2 [Edu21 +2F du1 dv1 +Gdv12 ]1/2 ·[Edu22 +2F du2 dv2 +Gdv22 ]1/2

dove E, F, G si intendono calcolati in (u0 , v0 ). Utilizzando la formula verificare che le linee coordinate u = costante e v = costante sono ortogonali se e solo se F = 0. 17. Verificare che per la superficie di rivoluzione

r(✓, t) = f (t) cos ✓i + f (t) sin ✓j + g(t)k

(f, g di classe C 1 )

le linee coordinate formano una rete ortogonale.

1.6 Area di una superficie. Integrali superficiali Alla definizione di area di una superficie si potrebbe pervenire mediante un procedimento simile a quello che ha condotto alla Definizione 1.1.5 di lunghezza di una curva (e alla conseguente formula (1.1.8)) e cio`e: approssimare la superficie ⌃ con una superficie poliedrica “appoggiata” su ⌃, per la quale la nozione di area `e quella della geometria elementare, quindi definire area di ⌃ il limite delle aree delle superfici poliedriche al tendere a zero del massimo diametro delle facce. Tale procedimento non risulta cos`ı elementare come nel caso delle curve e pertanto daremo una definizione pi` u diretta di area preoccupandoci solo di giustificarla euristicamente. Se ⇠ ed ⌘ sono due vettori di R3 linearmente indipendenti, allora |⇠ ⇥⌘| rappresenta e da essi individuato (si veda la Fig. 6.12). Se si vuole poi l’area del parallelogramma R ottenere l’area della sua proiezione R sul piano xy, `e sufficiente moltiplicare |⇠ ⇥ ⌘| per cos ↵ dove ↵, ⇡/2 < ↵ < ⇡/2, `e l’angolo tra i vettori ⇠ ⇥ ⌘ e k. In altri termini vale la formula e cos ↵. a(R) = a(R)

(1.31) z

~ R

x x

h

a

k

h R

x e cos ↵. Figura 6.12. Area (R) = area (R)

y

1. Superfici in R3

c 978-88-08-63708-6

419

Applichiamo queste considerazioni a una superficie semplice e regolare ⌃, di equazione r = r(u, v), (u, v) 2 T ⇢ R2 , T aperto limitato. Consideriamo una porzione di ⌃ (parallelogramma curvilineo) individuato da due coppie di linee coordinate, definite da u = u, u = u + du e da v = v v = v + dv, con du > 0, dv > 0, come mostrato in Figura 6.13. I due vettori ru du = ru (u, v)du e rv dv = rv (u, v)dv individuano un parallelogramma la cui area |ru ⇥ rv |du dv intuitivamente coincide, a meno di infinitesimi di ordine superiore a du2 + dv 2 , con quella del parallelogramma curvilineo. Tale area `e intuitivamente pari a |⇠ ⇥ ⌘| dove r(u, v) = ru du + o(du) r(u, v) = rv dv + o(dv)

⇠ = r(u + du, v) ⌘ = r(u, v + dv) (si veda la Fig. 6.13).

S v = v + dv ru

rv

rv

ru v=v

u=u

u = u + du

Figura 6.13. I lati del parallelogramma curvilineo sono approssimati, a meno di infinitesimi di ordine superiore a du e dv, da quelli del parallelogramma rettilineo individuato dai vettori ru du e rv dv.

` allora ragionevole chiamare elemento d’area l’espressione simbolica E (1.32)

d := |ru ⇥ rv |du dv

e dare la seguente DEFINIZIONE 1.4 L’area di ⌃ `e assegnata dalla formula seguente ZZ ZZ (1.33) a(⌃) = d := |ru ⇥ rv |du dv. ⌃

T

Alternativamente, in base alla (1.22), si pu` o scrivere ZZ p a(⌃) := EG F 2 du dv, (1.330 ) T

La norma |ru ⇥ rv | appare nella (1.33) come un fattore di ingrandimento per l’area nella trasformazione dal piano u, v, dove l’elemento d’area `e du dv, alla superficie.

420

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Esempio 1.14 Per la superficie sferica di equazione (1.6), (✓, ) 2 (0, 2⇡) ⇥ (0, ⇡), si trova facilmente d = R2 sin d✓d e quindi a(⌃) =

ZZ

(✓ longitudine,

d =

Z

2⇡

d✓

0



risultato non. . . sorprendente.

Z



colatitudine)

R2 sin d = 4⇡R2 ,

0

Pu` o essere utile scrivere la formula (1.33) o (1.330 ) nel caso di superfici in forma cartesiana. Se ⌃ ha equazione z = f (x, y), (x, y) 2 T , T aperto limitato del piano, allora, ricordando i calcoli nell’Esempio 1.8, si ha: r(x, y) = xi + yj + f (x, y)k, rx ⇥ ry = fx i fy j + k, q p |rx ⇥ ry | = 1 + (fx )2 + (fy )2 = 1 + |rf |2 e di conseguenza (1.34)

a(⌃) =

ZZ p 1 + |rf |2 dx dy. T

Esempio 1.15 L’area del paraboloide z = (x2 + y 2 )/2 con (x, y) 2 T = {(x, y) 2 R2 : x2 + y 2 < 8}, si trova con la formula ZZ p 1 + x2 + y 2 dx dy. a(⌃) = T

Passando a coordinate polari nel piano, si ottiene facilmente a(⌃) =

Z

2⇡

d✓

0

Z

0

p 8

p 52 1 + %2 %d% = ⇡. 3

La formula (1.34) ha un significato geometrico esplicito. Infatti se k(0, 0, 1) e ↵, ⇡/2 < ↵ < ⇡/2, `e l’angolo tra i due vettori k e rx ⇥ ry , si ha: p 1 = hrx ⇥ ry , ki = |rx ⇥ ry | cos ↵ = 1 + |rf |2 cos ↵ da cui l’interessante relazione

p 1 + |rf |2 =

Come conseguenza si ottiene d =

1 cos ↵ dx dy

1 . cos ↵

ovvero

dx dy = cos ↵d , formula in perfetto accordo con la (1.31) e che mostra come (1 + |rf |2 ) fattore di proiezione locale per le aree.

1/2

sia un

1. Superfici in R3

c 978-88-08-63708-6

421

Per una superficie data in forma implicita F (x, y, z) = 0, con Fz 6= 0, si ha, localmente, z = f (x, y) e pertanto l’elemento d’area in termini di F `e dato dalla formula seguente: s ✓ ◆2 ✓ ◆2 Fx Fy |rF | + dx dy = dx dy. (1.35) d = 1+ Fz Fz |Fz | Veniamo ora alla definizione di integrale di superficie. Se h = h(x, y, z) `e una funzione reale definita su ⌃, si definisce l’integrale di h su ⌃ mediante la formula ZZ ZZ hd := h(r(u, v))|ru ⇥ rv |du dv (1.36) ⌃

T

quando l’integrale a destra della (1.36) `e ben definito. L’integrale (1.36), e quindi anche l’area di ⌃, sono invarianti per cambi regolari di parametrizzazione e in particolare non dipendono dall’orientazione di ⌃. Infatti, posto u = '(s, t), v = (s, t), (s, t) 2 Te, ricordando la (1.13) e la formula del cambiamento di variabile negli integrali doppi si ha: ZZ h(r(u, v))|ru ⇥ rv |du dv = T

= =

ZZ

Te

ZZ

Te

h(e r(s, t))|e rs ⇥ e rt | ·

@(', ) @(s, t)

1

@(', ) ds dt = @(s, t)

h(e r(s, t))|e rs ⇥ e rt |ds dt.

Ci` o giustifica la notazione usata per gli integrali di superficie. Le definizioni di area e di integrale di superficie si estendono senza difficolt` a al caso delle superfici regolari a tratti. Se ⌃j , j = 1, . . . , N sono le facce di ⌃, allora ZZ

h d :=



N ZZ X j=1

hd .

⌃j

1.7 Alcune applicazioni fisiche e geometriche In questo paragrafo presentiamo alcune applicazioni degli integrali di superficie. Calcolo di baricentri e momenti d’inerzia Sia ⌃ una superficie regolare e semplice e = (x, y, z) definita su ⌃. Se siR interpreta come densit` a superficiale di una massa distribuita su ⌃, l’integrale m = ⌃ d rappresenta la massa totale. In questo caso gli integrali ZZ ZZ ZZ 1 1 1 x d , yb = y d , zb = z d xb = m ⌃ m m ⌃ ⌃ rappresentano le coordinate del baricentro della distribuzione di massa.

422

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Esempi 1.16 Una massa m `e distribuita con densit` a superficiale = x2 + y 2 su un emisfero ⌃ di raggio R. Abbiamo, utilizzando la parametrizzazione (1.6) con (✓, ) 2 (0, 2⇡) ⇥ (0, ⇡/2): m=

ZZ

d =

Z

2⇡

d✓

0



Z

⇡/2

(R sin )2 R2 sin d =

0

4 4 ⇡R . 3

Per le coordinate del baricentro, ovviamente si ha xb = yb = 0, mentre zb =

1 m

ZZ

z d =



3 4⇡R4

Z

2⇡

d✓

0

Z

⇡/2

(R cos )(R sin )2 R2 sin d =

0

3 R. 8

Se la densit` a `e costante, le coordinate del baricentro (che in questo caso si chiama pi` u propriamente centroide) sono date da ZZ ZZ ZZ 1 1 1 x d , yb = y d , zb = zd . xb = a(⌃) ⌃ a(⌃) ⌃ a(⌃) ⌃ Analogamente, se d = d(x, y, z)RRrappresenta la distanza di (x, y, z) da un punto p 2 R3 o da un asse, l’integrale ⌃ d2 d rappresenta il momento di inerzia della distribuzione di massa rispetto a p o all’asse, rispettivamente. 1.17 Si voglia calcolare il momento di inerzia di una massa distribuita uniformemente (densit` a costante = 1) su una superficie torica di raggi 1 e 2, rispetto all’asse di rivoluzione. Usando le equazioni parametriche dell’Esempio 1.7, l’asse di rivoluzione `e l’asse z; in tal caso si ha: d2 = x2 + y 2 = (2 + sin u)2 , Pertanto I=

ZZ

2

d d =

Z

0



2⇡

dv

Z

2⇡

|ru ⇥ rv | = 2 + sin u. (2 + sin u)3 du = 44⇡ 2 .

0

Flussi Consideriamo ora un campo vettoriale F = F1 i + F2 j + F3 k definito in una regione U dello spazio contenente una superficie regolare e orientabile ⌃. Se n `e il versore normale alla superficie, l’integrale del campo vettoriale F su ⌃ si chiama flusso di F attraverso ⌃ nella direzione n ed `e dato dalla formula ZZ ZZ hF, nid = [F1 cos(n, i) + F2 cos(n, j) + F3 cos(n, k)]d . 4 ⌃



4 Abbiamo indicato con (n, i) l’angolo tra i versori n e i; cos` ı pure per (n, j) ed (n, k). Si noti che cos(n, i) = hn, ii ecc.

1. Superfici in R3

c 978-88-08-63708-6

423

Come si vede il flusso `e invariante per cambi di parametrizzazione equivalenti (a jacobiano positivo) ma cambia segno se cambia il verso di n, ovvero l’orientazione di ⌃. Esempio 1.18 Il campo di velocit` a di un fluido a densit` a costante = 1 `e dato dal vettore F = ( y, x, 1). Si voglia calcolare il flusso di F attraverso la porzione di paraboloide di equazione z = f (x, y) = x2 + y 2 , 0  z < 4. Scegliendo l’orientazione del paraboloide data dal versore

si ottiene:

1 1 ( fx , fy , 1) = p ( 2x, 2y, 1) n= p 2 1 + |rf | 1 + 4x2 + 4y 2 Flusso =

ZZ



hF, nid =

ZZ

[2xy

2xy + 1]dx dy = 4⇡.

{x2 +y 2 b > 0, utilizzando le formule (1.45)

e (1.46). 20. Calcolare la superficie comune ai due cilindri di equazione z 2 + y 2 = a2 e y 2 + z 2 = a2 . 21. Calcolare il centroide della superficie del tetraedro individuato dai piani coordinati e dal piano x + y + z = 1. 22. Sulla superficie sferica x2 +y 2 +z 2 = R2 ` e distribuita uniformemente una carica elettrica. Calcolare il potenziale elettrostatico da essa generato fuori e dentro la sfera. 23. Calcolare il flusso del vettore F = zi + xj + yk attraverso il tetraedro dell’Esercizio 21. (La 1.36 ha perfettamente senso per superfici chiuse orientabili, regolari a pezzi.) 24. Una massa m ` e distribuita uniformemente sul tronco di cono di equazione z 2 = x2 + y 2 ,

1  z  2. Calcolarne il momento di inerzia rispetto all’asse z. 25.*

Sia t una famiglia di curve regolari e semplici di equazione '(x, y) = t, t 2 [t0 , t1 ]. Al variare di t tali curve descrivono una regione A del piano, in modo che ogni punto di A appartenga a una sola curva t . Dimostrare, con un ragionamento analogo a quello dell’Esempio 1.19, le seguenti formule Z t1 Z Z t1 Z 1 ds = dt dt c⌫ ds area(A) = |r'| t0 t0 t 1 (ds = di↵erenziale d’arco su

t ).

1. Superfici in R3

c 978-88-08-63708-6

427

26. Verificare che la famiglia di segmenti di equazione

tx al variare di t tra coperta.

1 2

t2 y = 1

x 2 [0, 1]

e 1, soddisfa le ipotesi indicate nell’Esercizio 25. Calcolare l’area da essi

1.8 Generalizzazione a dimensioni superiori I concetti di curva e superficie in R3 si generalizzano in modo naturale a quello di k-superficie nello spazio euclideo Rn . Intuitivamente una k-superficie (k < n) `e una a, regione di Rn dove una ipotetica particella `e libera di muoversi con k gradi di libert` tra gli n disponibili. Pi` u rigorosamente, dato un aperto A ✓ Rk e un insieme T tale che A ✓ T ✓ A, definiremo k-superficie di classe C s una coppia (⌃, r) dove r : T ! Rn , r 2 C s (A), ⌃ = r(T ). Pi` u esplicitamente una k-superficie `e assegnata da n equazioni parametriche x1 = x1 (u1 , . . . , uk ) x2 = x2 (u1 , . . . , uk ) (u1 , u2 , . . . , uk ) 2 T .. . xn = xn (u1 , . . . uk ) dove (u1 , . . . , uk ) fungono da coordinate locali su ⌃. Un punto p = r(u), u 2 T , `e regolare se la matrice jacobiana 0 @x @x @x1 1 1 1 ... B @u1 @u2 @uk C C B B @x2 @x2 @x2 C C B B @u1 @u2 . . . @uk C C B . C B . C B . A @ @x @x @x n n n ... @u1 @u2 @uk ha caratteristica k in u o, equivalentemente, se i k vettori tangenti ru1 , ru2 , . . . ruk sono linearmente indipendenti. In questo caso, il sottospazio di Rn da essi generato prende il nome di spazio tangente alla k-superficie in p. Si riconosce che nei casi n = 3 e k = 1 o k = 2 si ritrovano i concetti illustrati nei paragrafi precedenti. Nel caso k = n 1 una k-superficie si chiama ipersuperficie. Se tutti i punti p = r(u), con u 2 T , sono regolari, una k-superficie prende il nome di variet` a di↵erenziabile di dimensione k. Una k-superficie o una variet` a di dimensione k pu` o essere definita implicitamente mediante un sistema di n k equazioni del tipo 8 > g1 (x1 , . . . , xn ) = 0 > > < g2 (x1 , . . . , xn ) = 0 .. > > . > :g n k (x1 , . . . , xn ) = 0 tale che la matrice jacobiana (@gi /@xj ) abbia rango massimo.

428

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Abbiamo gi` a incontrato variet` a di↵erenziabili di dimensione (n 1) nel Capitolo 2, a proposito dell’ottimizzazione di una funzione in presenza di vincoli di uguaglianza. Le variet` a 1-dimensionali sono le curve regolari in Rn . Se nell’equazione di una variet` a k-dimensionale r = r(u) si specifica u = u(t), t 2 [a, b] ⇢ R, l’equazione r = r(u(t)) definisce una curva in Rn , contenuta in ⌃. Si possono definire le nozioni di variet` a semplice e chiusa in modo analogo al caso n = 3. Il concetto di orientazione `e invece molto pi` u delicato. Lo accenniamo solo per le ipersuperfici, restando a un livello intuitivo. In questo caso lo spazio tangente in ogni punto `e (n 1)-dimensionale, generato dagli (n 1) vettori tangenti ru1 , . . . , run 1 . Per ogni u 2 T esiste un unico versore n 2 Rn , ortogonale a ogni ruj , tale che det(ru1 , ru2 , . . . , run 1 , n) > 0. Tale versore si chiama versore normale alla variet` a e determina l’orientazione positiva, il suo opposto, n, determina l’orientazione negativa. Una variet` a `e orientabile se, sostanzialmente, il versore n (oppure il suo opposto) varia con continuit` a lungo qualunque curva giacente su di essa. Infine si possono generalizzare le nozioni di area e di integrale su una variet` a. L’elemento d’area `e assegnato dalla formula

d :=

L’integrale di f : Z



*2.

f d :=

Z

f

8 < :

P

X

j1 0: • • •

M 2 = b (a + b sin u) sin u e concludiamo che, essendo

i punti tali che sin u > 0, cio`e 0 < u < ⇡, sono ellittici; quelli tali che sin u < 0, ovvero ⇡ < u < 2⇡ sono iperbolici; quelli tali che sin u = 0, ovvero u = 0 e u = ⇡ sono parabolici.

Il lettore individui a quali punti sulla superficie corrisponde questa suddivisione. Esempio 2.2 Calcoliamo l’espressione della seconda forma fondamentale per una superficie cartesiana di equazione z = f (x, y), di classe C 2 . Abbiamo: r(x, y) = xi + yj + f (x, y)k, rx = i + fx k, ry = j + fy k, rxx = fxx k, rxy = fxy k, ryy = fyy k, 1 n= p ( fx i fy j + k). 1 + |rf |2

432

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Dunque: fxx , L= p 1 + |rf |2

fxy M=p , 1 + |rf |2

fyy N=p , 1 + |rf |2

1 d2 f F2 = p {fxx dx2 + 2fxy dx dy + fyy dy 2 } = p . 1 + |rf |2 1 + |rf |2

essendo LN M 2 = det Hf = fxx fyy (fxy )2 avremo punti ellittici, iperbolici o parabolici in dipendenza del segno del determinante hessiano di f , ritrovando una situazione gi` a esaminata da altri punti di vista nel Paragrafo 7.3.3, pagina 365, Volume 1. 2.2 Curvature delle linee su una superficie Le informazioni qualitative riguardanti la forma di una superficie nell’intorno di un suo punto, ricavate considerando il paraboloide osculatore, diventano pi` u accurate esaminando la curvatura delle linee sulla superficie passanti per quel punto. Consideriamo una curva regolare u = u(t), v = v(t), t 2 I ✓ R; se questa curva `e contenuta in T , la funzione composta r(u(t), v(t)) `e una curva regolare sulla superficie che denotiamo per semplicit` a con r(t). Indichiamo con k la sua curvatura e con N la sua normale principale. Dalla seconda formula di Fr´enet (Teorema 1.10) sappiamo che d2 r = kN ds2

(s ascissa curvilinea).

Moltiplicando scalarmente per n e chiamando ↵, 0  ↵ < ⇡, l’angolo formato da N ed n otteniamo hd2 r, ni = k cos ↵ ds2 ovvero (2.4)

k cos ↵ =

Lu02 + 2M u0 v 0 + N v 02 F2 = ; F1 Eu02 + 2F u0 v 0 + Gv 02

k cos ↵ si chiama curvatura normale e viene indicata con kn . La formula (2.4) `e densa di conseguenze. a) La direzione del vettore tangente r0 (t) = ru u0 (t) + rv v 0 (t) `e determinata, in un o significa che: dato punto della superficie, una volta assegnato il rapporto u0 /v 0 . Ci` curve sulla superficie passanti per un punto p, in cui hanno la stessa tangente, hanno la stessa curvatura normale in p, essendo per esse identico il secondo membro della (2.4). b) Se due curve su una superficie hanno stessa tangente in un punto p e stessa normale principale, hanno anche stessa curvatura se il piano osculatore in p non `e un piano tangente alla superficie. Infatti in tal caso cos ↵ `e non nullo e identico per le due curve, come pure il secondo membro di (2.5), avendo le curve la stessa tangente.

2. Curvature

c 978-88-08-63708-6

433

Le conseguenze a) e b) indicano che, per calcolare la curvatura in un punto p delle linee sulla superficie, passanti per p, ci si pu` o restringere alla considerazione delle sezioni normali in p alla superficie stessa, ovvero a curve che si ottengono intersecando la superficie con un piano contenente la normale in p alla superficie (Fig. 6.17). Evidentemente vi sono infinite sezioni normali in un punto p e se ne pu` o selezionare una fissando una direzione nel piano tangente. Cos`ı ad ogni curva passante per p, possiamo far corrispondere un’unica sezione normale, quella determinata dalla tangente alla curva in p. Per una sezione normale, la normale principale coincide con n oppure con n, per cui cos ↵ = ±1. Come terza conseguenza della (2.4), abbiamo c) La curvatura di una linea sulla superficie in un punto p in cui il piano osculatore non `e tangente `e data dalla formula kn cos ↵ dove kn `e la curvatura normale della sezione normale corrispondente. (2.5)

k=

T n = –N p g

g sezione normale corrispondente a g

Figura 6.17. Sezione normale a una superficie in p.

Esempi 2.3 Consideriamo la sfera di raggio R, di equazione r( , ✓) = R sin

cos ✓i + R sin

sin ✓j + R cos k,

( , ✓) 2 [0, ⇡] ⇥ [0, 2⇡].

Abbiamo gi` a visto che F1 = dl2 = R2 (d

2

+ (sin )2 d✓2 ).

Inoltre, essendo r = r ✓= r✓✓ =

R sin cos ✓i R sin sin ✓j R cos k R cos sin ✓i + R cos cos ✓j R sin cos ✓i R sin sin ✓j

434

CAPITOLO 6. Superfici e integrali di superficie

e n= si ha: L = hr

r = |r|

, ni = R,

sin

M = hr

cos ✓i

✓ , ni

c 978-88-08-63708-6

sin

sin ✓j

cos k

N = hr✓✓ , ni = R(sin )2 .

= 0,

Per le sezioni normali abbiamo dunque kn =

F2 Rd = 2 F1 R d

2

1 + R(sin )2 d✓2 = 2 + R2 (sin )2 d✓ 2 R

in accordo col fatto che le sezioni normali sono i cerchi massimi (quelli che hanno raggio R) con curvatura 1/R. Osserviamo che la formula (2.5) esprime una ben nota relazione geometrica quando si consideri come linea sulla superficie un qualunque altro cerchio, come indicato in Figura 6.18.

r = R cos a a R

Figura 6.18. Per il cerchio di raggio ⇢ si ha ⇢ = R cos ↵, cio` e alla (2.5).

1 ⇢

=

1 R cos ↵

che corrisponde esattamente

2.4 Calcoliamo l’espressione delle curvature delle sezioni normali per una superficie di equazione z = f (x, y). Si ha, rivedendo i risultati nell’Esempio 2.2: kn =

fxx dx2 + 2fxy dx dy + fyy dy 2 1 ·p [1 + (fx )2 ]dx2 + 2fx fy dx dy + [1 + (fy )2 ]dy 2 1 + |rf |2

2.5 Consideriamo il toro dell’Esempio 2.1. Si ha, per le sezioni normali, kn =

b du2 + (a + b sin u) sin u dv 2 . b2 du2 + (a + b sin u)2 dv 2

Le sezioni normali corrispondenti a dv = 0 sono cerchi con curvatura 1/b. Osserviamo poi che le sezioni corrispondenti a du = 0 hanno curvatura uguale a sin u/(a + b sin u), minima nei punti (⇡/2, v) del parallelo esterno dove vale 1/(a + b) e massima in quelli del parallelo interno (3⇡/2, v), dove vale 1/(a b).

2. Curvature

c 978-88-08-63708-6

435

2.3 Curvature principali. Curvatura gaussiana e curvatura media Introduciamo in questo paragrafo due importanti quantit` a geometriche: la curvatura gaussiana e la curvatura media. Esse sono invarianti rispetto a cambiamenti di parametri che mantengono l’orientazione. In pi` u la curvatura gaussiana non cambia mutando l’orientazione ed `e invariante rispetto a un’altra classe importante di trasformazioni dello spazio: i di↵eomorfismi isometrici. Cominciamo col considerare ancora la formula (2.4) per la curvatura delle sezioni normali. Fissato il punto p = r(u, v), tale formula assegna kn come funzione delle due variabili u0 e v 0 che determinano la direzione della tangente alla sezione normale. Inoltre essendo F1 e F2 omogenee di secondo grado in u0 , v 0 ne segue che kn = kn (u0 , v 0 ) `e omogenea di grado zero: kn ( u0 , v 0 ) = kn (u0 , v 0 ) per ogni 2 R, 6= 0. Quindi possiamo restringere le nostre considerazioni all’insieme {(u0 , v 0 ) : u02 + v 02 = 1}. Esa massimo e minimo, possibilmente sendo questo un compatto di R2 , kn vi ammetter` coincidenti7 . Il massimo e il minimo di kn prendono il nome di curvature principali in p e le direzioni in cui kn `e massima o minima si chiamano direzioni principali. Vediamo come si calcolano le curvature principali. Introduciamo a tale scopo le matrici simmetriche seguenti, associate rispettivamente alla prima e alla seconda forma fondamentale: ✓ ◆ ✓ ◆ E F L M (2.6) G= , Q= . F G M N Si definisce autovalore della coppia di matrici G, Q (nell’ordine) un numero dell’equazione di secondo grado (2.7)

det(Q

G) = (L

E)(N

G)

(M

soluzione

F )2 = 0.

Se G = I3 ritroviamo la nozione usuale di autovalore della matrice Q. Per la simmetria di G e Q, le soluzioni di (2.7) sono reali. Vale il seguente risultato. TEOREMA 2.1 Supponiamo che L2 + M 2 + N 2 6= 0, ovvero che il punto p non sia planare. Allora vale la seguente alternativa. a) L’equazione (2.7) ha due soluzioni 1 = 2 = k 6= 0, coincidenti. In tal caso tutte le direzioni sono principali. Oppure: b) L’equazione (2.7) ha due soluzioni = k1 e = k2 , coincidenti rispettivamente con il minimo e il massimo di kn (ovvero le curvature principali). Inoltre le direzioni principali sono ortogonali. Nel caso a) il punto p `e detto umbilicale. Dimostrazione. Come sappiamo, se una funzione di↵erenziabile ha un estremo in un punto, in tale punto il gradiente `e nullo. Dunque, le direzioni (u0 , v 0 ) che massimizzano o minimizzano kn (u0 , v 0 ), devono annullare il gradiente. Annullando @kn /@u0 e @kn /@v 0 si trova ( (LF1 EF2 )u0 + (M F1 F F2 )v 0 = 0 (M F1 F F2 )u0 + (N F1 GF2 )v 0 = 0. 7 Escludiamo

il caso in cui L = M = N = 0.

436

CAPITOLO 6. Superfici e integrali di superficie

Dividendo per F1 e ponendo F2 /F1 = si trova ( (L E)u0 + (N (2.8) (M F )u0 + (N

c 978-88-08-63708-6

F )v 0 = 0 G)v 0 = 0.

Tale sistema ammette soluzioni (u0 , v 0 ) 6= (0, 0) se e solo se la matrice dei coefficienti u0 e v 0 `e singolare ovvero se `e soluzione dell’equazione (2.7). Se questa ha due soluzioni (non nulle) coincidenti, allora il massimo e il minimo della curvatura delle sezioni normali coincidono, cosicch´e ogni direzione `e direzione principale. Viceversa, l’equazione (2.7) possiede 2 radici = k1 e = k2 reali e distinte. In tal caso, a ciascuno dei valori k1 e k2 (supponiamo k1 < k2 ) corrisponde una ben determinata direzione (u01 , v10 ) e (u02 , v20 ) soluzione del sistema (2.8), tale che kn (u01 , v10 ) = k1 = minima curvatura e kn (u02 , v20 ) = k2 = massima curvatura. Per far vedere che le direzioni principali sono ortogonali, poniamo w1 = (u01 , v10 ) e w2 = (u02 , v20 ). Allora si ha (Q

k1 G)w1 = 0

e

(Q

k2 G)w2 = 0.

Essendo G invertibile, le due equazioni precedenti sono equivalenti rispettivamente a (G

1

Q

k1 I3 )w1 = 0

e

(G

1

Q

k2 I3 )w2 = 0.

Moltiplicando scalarmente la prima equazione per w2 e la seconda per w1 e poi sottraendo membro a membro si trova8 (k2 k1 )hw1 , w2 i = 0 da cui, essendo k2

k1 6= 0, segue l’ortogonalit` a di w1 e w2 .



Sviluppando l’equazione (2.7) si trova 2

(2.9)

2H + K = 0

dove i coefficienti H e K sono definiti come segue: (2.10) (2.11)

1 1 EN 2F M + GL = (k1 + k2 ) 2 2 EG F 2 det Q LN M 2 = K= = k1 k2 . EG F 2 det G H=

H si chiama curvatura media e K curvatura gaussiana. Esempi 2.6 I punti di una sfera sono tutti umbilicali essendo la curvatura costante e uguale a 1/R se si orienta la normale verso l’interno. La curvatura media `e quindi 1/R e quella di Gauss 1/R2 . Per il toro usiamo i risultati dell’Esempio 2.1 8 Tenendo

conto della simmetria di G hG

1

1

e Q si ha

Qw1 , w2 i = hG

1

Qw2 , w1 i.

2. Curvature

c 978-88-08-63708-6

Abbiamo

✓ 2 ◆ b 0 G= , 0 (a + b sin u)2

Q=

437



◆ b 0 . 0 (a + b sin u) sin u

Le curvature principali sono soluzione dell’equazione b2 )[(a + b sin u) sin u

(b

(a + b sin u)2 ] = 0;

perci` o

1 sin u e k1 = (k1 < k2 ) b a + b sin u che riconosciamo essere le curvature dei cerchi meridiani e di quelli paralleli rispettivamente, che costituiscono le direzioni principali. Dunque sin u . K = k1 k2 = b(a + b sin u) k2 =

Osserviamo che nella parte interna (punti iperbolici) K < 0, in quella esterna (punti ellittici) K > 0, mentre lungo i due cerchi u = 0 e u = ⇡ (punti parabolici) K = 0. 2.7 Esaminiamo curvatura gaussiana e curvatura media per superfici della forma z = f (x, y). Si ha: ◆ ✓ ◆ ✓ 1 fxx fxy 1 + (fx )2 fx fy p Q = G= fx fy 1 + (fy )2 1 + |rf |2 fxy fyy

Dalla (2.11) otteniamo

1 [1 + (fx )2 ]fyy 2fx fy fxy + [1 + (fy )2 ]fxx = 2 (1 + |rf |2 )3/2 ! 1 rf = div p 2 1 + |rf |2

H= (2.12)

Dalla (2.10) (2.13)

K=

In particolare se z = (x2 zx = x,

fxx fyy (fxy )2 . [1 + (fx )2 + (fy )2 ]2

y 2 )/2, abbiamo: zy =

y,

zxx = 1,

zyy =

1,

zxy = 0

quindi: 1 y 2 x2 2 (1 + x2 + y 2 )3/2 1 K= (1 + x2 + y 2 )2 H=

2.8 Per un cilindro di raggio R si ha k1 = 0 e, se la normale `e interna, k2 = 1/R, 1 , K = 0. dunque H = 2R

438

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

k2 (0,0) = ±1 k2 = ±

1 R

k1 = ±

1 R

k1 = 0 k2 = ± 1 R

k1 (0,0) = ±1

Cilindro: K = 0

Sfera: K = 1 2 R

Iperboloide: z = 1 (x2 – y2); K(0,0) = –1 2

Figura 6.19. I segni ± dipendono dall’orientazione del versore normale.

2.4 Mappa di Gauss. Theorema Egregium Abbiamo introdotto nel precedente paragrafo la curvatura media H = (k1 + k2 )/2 e quella gaussiana K = k1 k2 . Che di↵erenza c’`e tra queste due quantit` a? Che cosa “misurano” e↵ettivamente H e K? Per esempio ci si pu` o chiedere che cosa significhi per una superficie avere curvatura media o curvatura gaussiana nulle in tutti i suoi punti. La curvatura media `e legata alla variazione dell’area di una superficie quando questa subisce una deformazione; si tratta di una questione tipica del calcolo delle variazioni, oggetto del Capitolo 7, Sezione 2, sulla quale ritorneremo dunque in seguito. Ci occuperemo invece subito del profondo significato geometrico della curvatura gaussiana. Intanto sottolineiamo che il segno di K coincide con quello di det Q = LN M 2 e pertanto esso fissa in modo qualitativo la forma della superficie vicino a un dato punto: se K > 0 il punto `e ellittico, se K < 0 il punto `e iperbolico, se K = 0 il punto `e parabolico o planare. Un livello pi` u quantitativo si raggiunge introducendo la cosiddetta mappa di Gauss, definita come segue e illustrata nella Figura 6.20. Sia r = r(u, v), (u, v) 2 T ✓ R2 , l’equazione di una superficie regolare ⌃. La mappa di Gauss associa a ogni punto r(u, v) il versore normale n = n(u, v), ossia n = (ru ⇥ rv )/|ru ⇥ rv |. Dunque la mappa di Gauss `e una mappa ⌃ ! S2 dove S 2 indica la superficie sferica unitaria in R3 , centrata in 0. Se A ✓ ⌃, la sua immagine tramite la mappa di Gauus si chiama immagine sferica di A. Risulta cos`ı definita una nuova superficie regolare di equazione vettoriale n = n(u, v), (u, v) 2 T , che chiameremo superficie di Gauss associata a ⌃.

2. Curvature

c 978-88-08-63708-6

z

439

mappa di Gauss n

S

Immagine sferica di A

A

n y x

S2

Figura 6.20. Mappa di Gauss.

Essendo ⌃ regolare possiamo considerare i vettori nu e nv che, in base al Lemma 1.5 del Capitolo 1, risultano ortogonali a n stesso, essendo n un versore. Si deduce dunque che il vettore fondamentale nu ⇥ nv , della superficie di Gauss, `e parallelo a n. Vale il seguente risultato: PROPOSIZIONE 2.2 Sia r = r(u, v), (u, v) 2 T ✓ R2 , l’equazione vettoriale di una superficie regolare (almeno di classe C 3 ). Vale la formula (2.14)

nu ⇥ nv = Kru ⇥ rv .

Dimostrazione. Poich´e nu ?n e nv ?n, esistono a, b, c, d 2 R tali che nu = aru + brv

(2.15)

nv = cru + drv .

Moltiplichiamo scalarmente le (2.15) per ru ed rv ; osservando che (Esercizio 14, Sez. 2), L = hru , nu i, M = hru , nv i, N = hrv , nv i, e ricordando che E = |ru |2 ,

F = hru , rv i,

G = |ru |2 ,

otteniamo: L = aE + bF

M = cE + dF

M = aF + bG

N = cF + dG.

Queste quattro equazioni corrispondono all’unica equazione matriciale seguente: ✓ ◆✓ ◆ ✓ ◆ a b E F L M = c d F G M N che implica, per il teorema di Binet sui determinanti: (ad

bc)(EG

F 2 ) = (LN

M 2)

440

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

ovvero che

LN M 2 = K. EG F 2 D’altra parte dalle (2.15), per calcolo diretto, otteniamo: (ad

cd) =

nu ⇥ nv = (ad

bc)ru ⇥ rv .



Conseguenza immediata della (2.14) `e la seguente formula (2.16)

|K| =

d G d

dove d = |ru ⇥ rv |du dv e d G = |nu ⇥ nv |du dv indicano rispettivamente l’elemento d’area di ⌃ e quello della superficie di Gauss ⌃G associata a ⌃. Ne ricaviamo la seguente interpretazione: il modulo della curvatura gaussiana in un punto p rappresenta il limite del rapporto tra l’area dell’immagine sferica di un intorno superficiale di p e l’area di quest’ultimo, quando il diametro dell’intorno tende a zero. Quel rapporto caratterizza il grado di dispersione del fascio di normali alla superficie in un intorno del punto p, come illustrato in Figura 6.21.

p

mappa di Gauss

0

S S2

a)

p

mappa di Gauss 0

S S2 b) Figura 6.21. a) La superficie ` e piana, le normali sono parallele e la dispersione ` e zero: d superficie ` e “curva” e le normali si disperdono (in direzione) intorno al punto p.

G

= 0. b) La

Ma c’`e qualcosa di pi` u profondo. Esaminiamo il caso di un cilindro come quello della Figura 6.22. Un esame della figura indica che l’immagine sferica del cilindro `e l’equatore; quindi ritroviamo il fatto che un cilindro ha curvatura gaussiana nulla.

441

2. Curvature

c 978-88-08-63708-6

mappa di Gauss

S2

S

Figura 6.22. Mappa di Gauss per un cilindro: l’immagine sferica della parte ombreggiata ` e l’arco di equatore in neretto.

D’altra parte, tagliando il cilindro lungo una generatrice, possiamo deformarlo in una parte di piano, come indicato in Figura 6.23. Il fatto cruciale `e per` o che nella deformazione la metrica si conserva ovvero una curva rettificabile sul cilindro `e trasformata in una curva rettificabile nel piano con la stessa lunghezza; infatti la metrica sul cilindro (Esercizio 14, Sez. 1) `e data da dl2 = dz 2 + ds2 dove ds `e il di↵erenziale d’arco nel piano x, y, che `e esattamente quella del cilindro “sviluppato”. In termini appropriati: il cilindro `e di↵eomorfo isometricamente a una parte di piano, cio`e a una superficie che ha pure curvatura gaussiana nulla in ogni punto. Questo fatto non `e casuale. Vale infatti il seguente teorema, forse il pi` u importante di tutta la geometria di↵erenziale.

B

B B

B

B

C C

dz2

dz2

ds2 D

ds2 D A

A A

A

A

Figura 6.23. Sviluppo di un cilindro in un rettangolo piano.

THEOREMA EGREGIUM (di Gauss). Siano ⌃1 e ⌃2 due superfici in R3 . Se esiste un di↵eomorfismo tra ⌃1 e ⌃2 che sia anche una isometria, allora la curvatura gaussiana in punti corrispondenti `e la stessa. Il teorema sostanzialmente a↵erma che K, definita in termini di F1 e F2 , prima e seconda forma fondamentale, in realt` a dipende solo dai coefficienti della prima

442

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

forma fondamentale9 . Per la sua dimostrazione rimandiamo ai testi di geometria di↵erenziale. Un classico esempio illustra il theorema egregium. Esempio 2.9 Consideriamo le due superfici seguenti: la catenoide di equazione r(z, ✓) = cos ✓ Ch zi + sin ✓ Ch zj + zk

(z, ✓) 2 R ⇥ [0, 2⇡],

che abbiamo gi` a introdotto nell’Esempio 1.6, e l’elicoide di equazione r(u, v) = u cos vi + u sin vj + vk (u, v) 2 R ⇥ [0, 2⇡], che abbiamo introdotto nell’Esercizio 7, Sezione 1 (si vedano le Figure 6.24 e 6.25).

Figura 6.25. Catenoide.

Figura 6.24. Elicoide.

Ricordando i calcoli nei due esempi citati, abbiamo: •

per la catenoide: E = (Ch z)2 , n = (Ch z)



2

F = 0,

2 G = (Ch z)2 ) dlcat = (Ch z)2 (dz 2 + d✓2 ),

( cos ✓ Ch zi

sin ✓ Ch zj + Ch z Sh zk);

per l’elicoide: E = 1,

F = 0,

n = (1 + u2 )

1/2

2 = du2 + (1 + u2 )dv 2 , G = 1 + u2 ) dlel

(sin vi

cos vj + uk).

Osserviamo ora che la coppia di equazioni u = Sh z v=✓ definisce una corrispondenza biunivoca tra i punti del piano (z, ✓) e quelli del piano (u, v); inoltre `e di classe C 1 . Pertanto costituisce un di↵eomorfismo tra catenoide ed 9 Nella

dipendenza intervengono anche alcune derivate prime e seconde di E, F, G.

2. Curvature

c 978-88-08-63708-6

443

elicoide. Inoltre 2 dlel

2 ! (Ch z)2 dz 2 + (1 + Sh z)2 d✓2 = (Ch z)2 (dz 2 + d✓2 ) = dlcat u = Sh z v=✓

da cui si vede che la trasformazione `e una isometria tra le due superfici. Dal theorema egregium si deduce che le due superfici devono avere curvatura gaussiana coincidente in punti corrispondenti. Verifichiamolo. Per la catenoide abbiamo: rzz = cos ✓ Ch zi + sin ✓ Ch zj ) L = hrzz , ni = 1 r✓z = sin ✓ Sh zi + cos ✓ Sh zj ) M = hr✓z , ni = 0 r✓✓ = cos ✓ Ch zi sin ✓ Ch zj ) N = hr✓✓ , ni = 1. Dunque K(z, ✓) =

LN EG

M2 = F2

1 . (Ch z)4

Per l’elicoide: ruu = 0 ruv = rvv =

) L = hruu , ni = 0

sin vi + cos vj ) M = hruv , ni = (1 + u2 ) u cos vi u sin vj ) N = hrvv , ni = 0.

Dunque K(u, v) =

1/2

1 . (1 + u2 )2

Si vede che con la trasformazione u = Sh z, v = ✓, K(u, v) coincide con K(z, ✓). Concludiamo con qualche osservazione di carattere generale. In base al theorema egregium due superfici di↵eomorfe e isometriche hanno la stessa curvatura K in punti corrispondenti. L’enunciato non `e invertibile: due superfici di↵eomorfe con medesima curvatura gaussiana in punti corrispondenti non sono in generale isometriche (Esercizio 14). C’`e tuttavia un caso speciale importante in cui ci` o accade: `e il caso delle superfici con curvatura gaussiana costante. In altre parole, se K `e costante, la prima forma fondamentale ovvero la metrica riemanniana sulla superficie `e univocamente determinata da K. In particolare se K = 0 la metrica sulla superficie `e sostanzialmente (cio`e a meno di di↵eomorfismi) quella euclidea del piano. Per questa ragione una superficie a curvatura gaussiana nulla `e detta sviluppabile: coni e cilindri sono esempi di superfici sviluppabili. Sulle superfici apcurvatura costante K > 0 l’elemento di lunghezza `e quello della sfera (di raggio 1/ K). Queste superfici costituiscono un modello della geometria non` questa una geometria in cui, sostanzialmente, euclidea chiamata geometria ellittica. E l’ultimo degli assiomi di Euclide `e sostituito dal seguente: “dati in un ‘piano’ un punto p e una retta r, con p 2 / r, non esistono rette parallele a r passanti per p”.

444

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Le superfici a curvatura costante K < 0 hanno una metrica un po’ pi` u complicata e costituiscono un modello di geometria non-euclidea chiamata iperbolica. L’ultimo assioma di Euclide `e sostituito dal seguente: “dati in un ‘piano’ un punto p e una retta r, esistono infinite rette parallele a r passanti per p00 . Infine ricordiamo anche che una conseguenza del theorema egregium `e la possibilit` a di trattare la geometria da un punto di vista intrinseco, che eviti cio`e il riferimento allo spazio circostante. Il passo decisivo in questa direzione `e dovuto a Riemann, verso la met` a dell’ottocento. Contemporaneamente ci si libera dal vincolo delle 2 dimensioni permettendo di costruire una geometria su “oggetti” di dimensione qualunque. Si parla cos`ı, in geometria di↵erenziale moderna, di geometria riemanniana quando su un insieme localmente omeomorfo (topologicamente equivalente) a un aperto di Rn si assegna una forma quadratica definita positiva n X gij dui duj (2.17) dl2 = i,j=1

che rappresenta l’elemento di lunghezza e che determina, attraverso le sue propriet` a, tutte le caratteristiche geometriche quali la curvatura gaussiana, le linee di minima lunghezza tra due punti assegnati, eccetera. Un’ulteriore generalizzazione si compie se non si richiede che la (2.17) sia definita positiva. Si parla allora di geometria pseudo-riemanniana. Un esempio `e lo spazio-tempo a ristretta di Einstein in quadridimensionale R41 (detto di Minkowsky) della relativit` cui l’elemento di lunghezza `e dato dalla formula dl2 = c2 dt2

(2.18)

dx21

dx22

dx23

con ovvio significato dei simboli. Essendo nella (2.18) i coefficienti costanti la metrica si chiama pseudo-euclidea. In questa teoria si rivela appieno l’importanza di poter lavorare intrinsecamente nello spazio-tempo. Anche la relativit` a generale viene sviluppata in uno spazio quadridimensionale (il cronotopo) in cui l’elemento di lunghezza non `e pi` u “pseudoeuclideo” ma ha la foru costanti, sono determinati dalla ma generale (2.17) in cui i coefficienti gij , non pi` distribuzione delle masse nell’universo. Esercizi 1. Sia r(u, v) una superficie di classe C 3 (T ), T ✓ R2 , regolare. Si operi il cambiamento di

coordinate

u = '(s, t), v = '(s, t) (s, t) 2 T 0 ✓ R2 con ', 2 C (T ), che realizzi una corrispondenza biunivoca tra T e T 0 e tale che @(', )/@(s, t) 6= 0 per ogni (s, t) 2 T 0 . Poniamo e r(s, t) = r('(s, t), (s, t)). Ricavare le seguenti formule: 2

0

e = L('s )2 + 2M 's L

f = L's 't + M ( M

eN e Dedurre che L

f2

s 't

e = L('t )2 + 2M 't N

M = @(', )/@(s, t)(LN

s

t

+ N(

+

t 's )

+ N( 2

2 s)

M ).

+N 2

t)

.

t

s

2. Curvature

c 978-88-08-63708-6

445

2. Calcolare la curvatura delle sezioni normali dell’emisfero di equazione

z=

p

R2

x2

0  x2 + y 2 < R.

y2 ,

Commentare il risultato confrontandolo con quello dell’Esempio 2.3. 3. Dimostrare che p ` e un punto umbilicale di una superficie se e solo se L/E = M/F = N/G. 4. Verificare la formula (2.12) per la curvatura media di una superficie cartesiana. 5. Calcolare curvatura gaussiana e curvatura media per una superficie di equazione z = f (x) + g(y). 6. Sia r = r(u, v) l’equazione vettoriale di una superficie regolare (almeno C 2 ).

Verificare che L = hruu , ni = hrvv , ni = hrv , nv i.

hru , nu i, M = hruv , ni =

hru , nv i =

hrv , nu i e N =

7. Determinare la metrica sull’ellissoide di equazione

y2 z2 x2 + + = 1. a2 b2 c2 Determinare poi direzioni principali, curvatura media e gaussiana. 8. Sia data la superficie di rivoluzione

r(t, ') = f (t) cos 'i + f (t) sin 'j + g(t)k generata dalla rotazione della curva regolare che nel piano (y, z) ha equazioni parametriche y = f (t),

z = g(t).

Dimostrare le seguenti formule: 1 g 0 (f 0 )2 + (g 0 )3 + f (f 0 g 00 f 00 g 0 ) 2 f [(f 0 )2 + (g 0 )2 ]3/2 0 0 00 f 00 g 0 ) g (f g K= . f [(f 0 )2 + (g 0 )2 ]2 H=

9. Calcolare curvature principali, curvatura media e gaussiana per la superficie di equazione

x sin z

y cos z = 0.

10. Dimostrare che la curvatura gaussiana di un cono ` e nulla (tranne che nel vertice). Un cono `e deformabile isometricamente in una superficie piana? 11. Studiare la superficie z = x2

y 3 determinandone la metrica, la natura dei punti, le

curvature principali H e K. p

12. Per una superficie di rivoluzione z = f (

parabolici.

x2 + y 2 ) determinare i punti ellittici, iperbolici,

13. Dimostrare che k1 e k2 sono date da H ±

p H2

K rispettivamente.

14. Dimostrare che le due superfici di equazione

r(u, ✓) = u cos ✓i + u sin ✓j + log uk r1 (u, ) = v cos i + v sin j + vk

(u, ✓) 2 R+ ⇥ [0, 2⇡]

(v, ) 2 R+ ⇥ [0, 2⇡]

446

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

hanno curvatura K = 1/(1 + u2 )2 e K 1 = 1/(1 + v 2 )2 rispettivamente e che, dunque, hanno curvatura coincidente nei punti corrispondenti tramite il di↵eomorfismo ( u=v ✓= . Si pu` o tuttavia dimostrare che r ed r0 non sono isometriche. 15. Verificare che la catenoide (Esempio 2.9) ha curvatura media nulla. Calcolare quella

dell’elicoide. 16. Tra le superfici di rotazione di equazione

r(u, ✓) = u cos ✓i + u sin ✓j + g(u)k oppure r(u, ✓) = f (u) cos ✓i + f (u) sin ✓j + uk determinare quelle sviluppabili (a curvatura K = 0 in ogni punto), identificandole.

3.

I TEOREMI DI GREEN, GAUSS E STOKES

3.1 La formula di Gauss-Green nel piano In questo paragrafo ci occupiamo della relazione tra integrali doppi e integrali curvilinei di forme di↵erenziali. Ricordiamo che se D `e un dominio limitato in R2 , la cui frontiera @D sia una curva di Jordan regolare a tratti, si dice che @D `e orientata positivamente se `e orientata in senso antiorario; per sottolinearlo useremo il simbolo @ + D. In tale caso, descrivendo la frontiera nel verso positivo, si lasciano i punti di D a sinistra. Cominciamo col considerare domini D semplici (o normali) rispetto agli assi (Fig. 6.26) e un campo vettoriale F(x, y) = P (x, y)i + Q(x, y)j definito sulla chiusura di D, D = D [ @D. Vale il seguente lemma. LEMMA 3.1 Sia F 2 C 1 (D).

a) Se D = {(x, y) 2 R2 ; a < x < b, '1 (x) < y < '2 (x)} con '1 , '2 regolari a tratti, allora Z ZZ Py dx dy = P dx (3.1) @+D

D

b) Se D = {(x, y) 2 R2 ; c < y < d; 1 (y) < x < allora: Z ZZ Qx dx dy = (3.2)

2 (y)}

con

1

e

2

regolari a tratti,

Q dy.

@+D

D

Dimostrazione. a) Si ha, ricordando il teorema di riduzione per integrali doppi: ZZ Z b Z '2 (x) Py dx dy = dx Py dy = a '1 (x) D (3.3) Z b

[P (x, '2 (x))

=

a

P (x, ('1 (x))]dx.

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

447

y= j2(x) y

y

x= y2(y)

d

D

c

y= j1(x)

x= y1(y) a

b

x

a)

x

b)

Figura 6.26. a) Dominio semplice rispetto all’asse y con orientazione positiva. b) Dominio semplice rispetto all’asse x con orientazione positiva.

D’altra parte, essendo dx = 0 sui tratti rettilinei del bordo: Z b Z a Z P dx = P (x, '1 (x))dx + P (x, '2 (x))dx = a b @ +D (3.4) Z b [P (x, '1 (x))

=

P (x, '2 (x))].

a

Dalle (3.3) e (3.4) si ottiene la (3.1). b) Ancora per il teorema di riduzione si ha: Z d Z 2 (y) ZZ Qx dx dy = dy Qx dx = c D 1 (y) (3.5) Z d

[Q(

=

2 (y), y)

Q(

1 (y), y)]dy.

c

Inoltre, essendo dy = 0 sui tratti rettilinei del bordo di D: Z d Z c Z Q dy = Q( 2 (y), y)dy + Q( c d @ +D (3.6) Z d [Q(

=

2 (y), y)

Q(

1 (y), y)dy

=

1 (y), y)]dy.

c

Dalle (3.5) e (3.6) si ricava la (3.2).



10

Il seguente teorema `e la versione pi` u semplice del teorema di Gauss-Green

TEOREMA 3.2 Sia D un dominio limitato in R2 la cui frontiera sia una curva di Jordan regolare a tratti e che sia semplice rispetto a entrambi gli assi. 10 George

Green, matematico inglese (1793-1841).

448

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Se F = P i + Qj 2 C 1 (D), allora vale la formula ZZ Z (3.7) (Qx Py )dx dy = P dx + Q dy. @+D

D

Dimostrazione. Nelle ipotesi del teorema valgono entrambe le (3.1) e (3.2) del lemma. ⇤ Sottraendo membro a membro la (3.1) dalla (3.2) si ottiene la (3.7).

La formula (3.7) vale per domini molto pi` u generali di quelli considerati finora. Chiameremo ammissibili i domini per i quali `e valido il teorema di Gauss-Green. Una descrizione accurata della classe dei domini ammissibili esula dalla presente trattazione. Ci limitiamo a osservare che in questa classe rientrano domini D la cui frontiera `e unione disgiunta di un numero finito di curve di Jordan regolari a tratti e che siano decomponibili in un numero finito di sottodomini D1 , D2 , . . . , Dk semplici rispetto a entrambi gli assi; risulti cio`e: D=

k [

e D\D =?

Dj

i

j=1

j

per i 6= j.

Chiameremo questi domini s-decomponibili11 . Si noti che un dominio s-decomponibile pu` o non essere semplicemente connesso. L’orientazione positiva di @D si ottiene orientando le singole curve che la compongono in modo tale che, percorrendole, si lasci il dominio alla propria sinistra. Il caso tipico `e quello in cui @D `e unione di una curva e di N curve 1 , 2 , . . . , N interne a , come in Figura 6.27. L’orientazione positiva di @D richiede il senso antiorario per e quello orario per 1 , . . . , N . D4 D5

D3 g2 g1 D2

D1

D6

Figura 6.27. Dominio s-decomponibile per il teorema di Gauss-Green.

PROPOSIZIONE 3.3 Se D `e s-decomponibile e F 2 C 1 (D), allora vale la (3.7). Dimostrazione. Sia D =

k S

j=1

Dj , D \ D = ?, Dj semplice rispetto a entrambi gli assi, per i

j

ogni j = 1, . . . , k. Usando la (3.7) su ciascun Dj , si ha: (3.8)

11 “s”

ZZ

(Qx

Py )dx dy =

D

sta per “semplicemente”.

k ZZ X j=1

(Qx Dj

Py )dx dy =

k Z X j=1

P dx + Q dy. @ +Dj

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

449

Osserviamo ora che gli archi di curva che fanno parte del bordo di due domini adiacenti compaiono due volte nella somma a destra della (3.8) con orientazione opposta e perci` o si elidono (Fig. 6.27). Rimangono gli archi di curva che compongono @ +D. Dunque k R R P P dx + Q dy = @ +D P dx + Qdy, da cui la (3.8). ⇤ @ +Dj j=1

Si noti che nel caso di domini come quello in Figura 6.27 la (3.8) si pu` o scrivere pi` u esplicitamente nella forma seguente: ZZ I I I (Qx Py )dx dy = P dx + Q dy + P dx + Q dy + P dx + Q dy (3.80 ) +

D

1

2

Esempio 3.1 Sia D il dominio indicato in Figura 6.28 e RF il campo vettoriale di componenti P (x, y) = y 2 e Q(x, y) = x2 . Si voglia calcolare @ +D y 2 dx + x2 dy. Usando il teorema di Gauss-Green si ha: ZZ Z y 2 dx + x2 dy = (2x 2y)dx dy = 0, @ +D

D

essendo D simmetrico rispetto alla bisettrice, mentre 2x 2y cambia segno scambiando x con y.

3

D

O

1

3

Figura 6.28.

3.2 Applicazioni a) Calcolo di aree mediante integrali curvilinei Le formule (3.1), (3.2) o (3.7) possono essere usate per calcolare l’area di un dominio D, ammissibile per il Teorema 3.2, mediante un integrale curvilineo esteso a @D. Infatti, scegliendo P (x, y) = y nella (3.1) otteniamo: Z ZZ dx dy = y dx. (3.9) area(D) = @ +D

D

Scegliendo Q(x, y) = x nella (3.2), otteniamo: ZZ Z (3.10) area(D) = dx dy = D

@ +D

x dy.

450

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Infine, sommando le (3.9) e (3.10) e dividendo poi per due, si ricava: (3.11)

area(D) =

1 2

Z

x dy

y dx.

@ +D

Esempio 3.2 Sia D l’interno dell’ellisse di equazione x2 /a2 + y 2 /b2 = 1. L’orientazione positiva del bordo si ottiene con la parametrizzazione x(✓) = a cos ✓, Dalla (3.11): area(D) =

1 2

Z

2⇡

y(✓) = b sin ✓

✓ 2 [0, 2⇡].

[ab(cos ✓)2 + ab(sin ✓)2 ]d✓ = ⇡ab.

0

b) Una seconda applicazione geometrica riguarda l’invarianza rispetto a deformazioni della traiettoria per integrali curvilinei di campi vettoriali irrotazionali. Siano 1 e 2 curve di Jordan regolari a tratti, tali che 1 sia contenuta nell’interno di 2 . Indichiamo con D l’intercapedine tra 1 e 2 , cio`e l’insieme dei punti del piano esterni a 1 e interni a 2 (Fig. 6.29).

D

g1

g2

Figura 6.29.

Vale la seguente proposizione. PROPOSIZIONE 3.4 Sia F(x, y) = P (x, y)i + Q(x, y)j un campo vettoriale di classe C 1 (D), irrotazionale, tale cio`e che Py = Qx in D. Allora I I P dx + Q dy = P dx + Q dy (3.12) + 1

+ 2

In altri termini gli integrali della forma di↵erenziale ! = P dx + Q dy estesi alle due curve 1 e 2 con la medesima orientazione coincidono. Dimostrazione. Essendo Qx = Py in D si ha ZZ

(Qx D

Py )dx dy = 0.

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

Osserviamo ora che @ +D `e l’unione di 1 , orientata positivamente e di vamente; dunque, dalla (3.7): Z ZZ (Qx Py )dx dy = P dx + Q dy = 0= @ +D I D I = P dx + Q dy + P dx + Q dy. + 1

2,

451

orientata negati-

2



La (3.12) risulta utile in situazioni simili a quella dell’esempio seguente. Esempio 3.3 Siano P (x, y) = y/(x2 + y 2 ) e Q(x, y) = x/(x2 + y 2 ). La forma di↵erenziale corrispondente, ! = P dx + Q dy, `e quella dell’Esempio 2.8 Capitolo 1, dove abbiamo Hverificato che Py = Qx in R2 \{0, 0}. Si voglia ora calcolare ! dove `e la curva indicata in Figura 6.30, orientata positivamente. y

g g1 ε

x

Figura 6.30.

Apparentemente, senza conoscere una parametrizzazione di , il calcolo `e improponibile. Indichiamo con 1 la circonferenza di raggio " con centro nell’origine. Se " `e sufficiente piccolo, 1 `e contenuta nell’interno di . Dalla Proposizione 3.4, si ha ora: I I != ! = 2⇡ +

+ 1

come `e facile verificare. Le considerazioni precedenti e quelle nell’Esempio 2.8 del Capitolo 1 permettono di associare all’integrale dell’importante forma di↵erenziale !=

x2

x y dx + 2 dy 2 +y x + y2

un notevole significato geometrico. Ricordiamo che, se si pensa al piano “tagliato” lungo il semiasse positivo delle x in modo da impedire a una curva di avvolgersi attorno all’origine, ! si pu` o interpretare come il di↵erenziale d✓ = d✓(x, y) dove ✓ = ✓(x, y), 0  ✓ < 2⇡, `e l’anomalia del

452

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

punto (x, y). Se si riduce il taglio e si permettono giri completi attorno all’origine, la funzione ✓ = ✓(x, y) diventa una funzione a pi` u valori (multivoca, Cap. 1, pag. 29, Vol. 1): partendo da un punto (x, y), e ritornandovi dopo un giro completo attorno all’origine in senso antiorario (risp. orario), si trova il valore di ✓(x, y) incrementato di 2⇡ (risp. 2⇡). Dunque, se si considera una curvaH che si avvolge un numero k di volteH attorno d✓; ha per` o sempre senso l’integrale ! e si all’origine non ha senso parlare di pu` o dimostrare, grazie alla Proposizione 3.4, che `e uguale a 2⇡k (se l’avvolgimento ` pertanto `e in senso antiorario) o a 2k⇡ (se l’avvolgimento `e in senso orario)12 . E ragionevole chiamare la quantit` a I 1 ! 2⇡ indice di avvolgimento di

rispetto all’origine. y

(x, y) q (x, y) x

Figura 6.31. Curva con indice di avvolgimento uguale a 2.

c) Significati fisici della (3.7) La (3.7) pu` o essere riscritta in modi diversi che ne mettono in luce il significato fisico. Introducendo il versore k = (0, 0, 1) e ricordando che per il vettore piano F si ha rot F = (Qx Py )k, abbiamo, per il primo membro della (3.7), ponendo rotz F = hrot F, ki, ZZ ZZ (Qx Py )dx dy = rotz F dx dy. (3.13) D

D

R L’integrale curvilineo a destra nella (3.7) si pu` o scrivere come @ +D hF, T ids dove T `e il versore tangente di @ +D e ds `e il di↵erenziale della lunghezza d’arco. La conclusione `e la seguente versione del teorema di Gauss-Green: TEOREMA 3.2 (II) Se D `e un dominio ammissibile per il Teorema 3.2 e F 2 C 1 (D), allora: Z ZZ rotz F dx dy = hF, T ids. (3.14) D

@ +D

H nell’integrale !, si pu` o sostituire nell’origine percorsa k volte nello stesso senso di . 12 Sostanzialmente,

con una circonferenza con centro

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

453

La (3.14) si chiama anche formula di Stokes13 nel piano. Il suo significato fisico `e evidente: il flusso del vettore rot F attraverso D nella direzione e verso di k uguaglia la circuitazione di F lungo @ +D. Si pu` o poi usare la (3.14) per ottenere una interpretazione di rot F, nel modo che segue. Consideriamo un cerchio C di raggio r e centro in un punto p 2 R2 , con la frontiera orientata positivamente. Dividiamo ambo i membri della (3.14) per l’area del cerchio ⇡r2 e passiamo al limite per r ! 0. Essendo rot F continuo in D, dal Teorema 5.1.10 (caso 3ii) si deduce che ZZ 1 rotz Fdx dy = rotz F(p). lim r!0 ⇡r 2 C Dunque (3.15)

1 rotz F(p) = lim r!0 area(C)

Z

@ +D

hF, T ids

ovvero: il rotore di un campo vettoriale piano rappresenta la densit` a superficiale di circuitazione di F nel punto p (una misura di “quanto” ruota F per unit` a di area). Una terza versione del Teorema 3.2 si ottiene ponendo, nella (3.7), P al posto di Q Q al posto di P . La formula diventa Z ZZ (Px + Qy )dx dy = P dy Q dx. (3.16) e

@ +D

D

L’integranda a primo membro `e div F; mentre, se introduciamo il versore normale o scrivere esterno a @ + D, ne = dy/ds i dx/ds j, si pu` ✓ ◆ Z Z Z dy dx P dy Q dx = hF, ne ids. P Q ds = ds ds @+D @+D @D La conclusione `e la seguente: TEOREMA 3.2 (III) Se D `e un dominio ammissibile per il Teorema 3.2, allora Z ZZ div F dx dy = hF, ne ids. (3.17) D

@D

La (3.17) si chiama formula della divergenza nel piano. Il suo significato fisico `e il seguente: il flusso di F uscente da @D uguaglia l’integrale della divergenza in D. Dalla (3.17) si ottiene un’interpretazione fisica della divergenza di un campo vettoriale piano. Operando come abbiamo fatto per la (3.14), si ottiene Z 1 hF, ne ids (3.18) div F(p) = lim r!0 area(C) @C 13 G.

Stokes, matematico irlandese (1819-1903).

454

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

da cui l’interpretazione della divergenza di F in p come densit` a superficiale di flusso uscente. Se poi F `e il vettore velocit` a di fluido di densit` a %, il vettore %F si chiama vetR a di fluido uscita tore densit` a di corrente e allora @C h%F, ne ids rappresenta la quantit` da C nell’unit` a di tempo. Dunque in questo caso, div(%F) rappresenta la variazione della massa di fluido per unit` a di area e per unit` a di tempo. Ritorneremo pi` u avanti su ulteriori applicazioni fisiche, dopo aver esteso il Teorema 3.2 nelle versioni (II) e (III) a campi vettoriali in R3 . 3.3 Il teorema di Stokes nello spazio Esamineremo ora la relazione tra integrali su una superficie orientabile e integrali curvilinei estesi al bordo della superficie stessa. Il teorema principale (di Stokes) generalizza quello di Gauss-Green nel piano, nella versione II. Come in quel caso cominciamo col considerare superfici ⌃ di tipo particolare estendendo poi il risultato a casi pi` u generali, frequenti nelle applicazioni. Sia ⌃ una superficie semplice, regolare (di classe C 1 ), orientabile e con bordo @⌃ costituito da una curva chiusa regolare a tratti. Come nel caso dei domini piani occorre definire che cosa si intende per orientazione positiva di @⌃ o, pi` u precisamente, per orientazione positiva di @⌃ rispetto all’orientazione di ⌃. Scegliendo un verso per la normale n si determinano su ⌃ due lati che chiameremo convenzionalmente positivo, quello verso il quale punta n, e negativo l’altro. Diremo che @⌃ `e orientato positivamente rispetto a ⌃ se, percorrendo @⌃ mantenendosi sul lato positivo di ⌃ si lasciano i punti di ⌃ alla sinistra. Scriveremo in tale caso @ + ⌃. Certamente, questo modo di definire l’orientazione di @⌃ ha carattere intuitivo, ma una definizione rigorosa ci porterebbe troppo lontano. In un modo pi` u “ingegneristico” si potrebbe definire positiva l’orientazione di @⌃ quando risulti destrorsa un’ipotetica vite che ruoti nel senso di @⌃ e avanzi nel verso di n. In casi frequenti ⌃ ha una parametrizzazione r : T ! R3

dove T `e l’interno di una curva di Jordan regolare a tratti in R2 , biunivoca tra T e ⌃. v

n

z r

T

S

@+T

+ @ S

u

y x

Figura 6.32. Superfici con bordo orientato positivamente.

In tal caso r(@T ) = @⌃; se, inoltre, (u(t), v(t)), t 2 [a, b], `e una parametrizzazione di @ + T , allora r(u(t), v(t)), con la scelta del versore normale n = (ru ⇥ rv )/|ru ⇥ rv |,

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

455

`e automaticamente una orientazione positiva di @⌃ (Fig. 6.32). Lasciamo la facile verifica al lettore. Generalizzando un po’, introduciamo la seguente classe di superfici: DEFINIZIONE 3.1 Indichiamo con S la classe delle superfici ⌃ che ammettono una a: parametrizzazione r : T ! R3 con le seguenti propriet` i) T `e un dominio s-decomponibile, la cui frontiera `e unione di un numero finito di curve di Jordan regolari a tratti 1 , . . . k ; ii) r 2 C 2 (T ) e r `e biunivoca tra T e ⌃. Il bordo di una superficie ⌃ 2 S consiste di un numero finito di curve chiuse j , immagini delle j . Scelto un verso per la normale a ⌃, si orienta positivamente @⌃ scegliendo il verso di percorrenza su ciascuna delle j in modo da lasciare i punti di ⌃ a sinistra. Se (uj (t), vj (t)), t 2 Ij , dove Ij ⇢ R `e un intervallo, `e una parametrizzazione di j+ , allora r(uj (t), vj (t)) `e una parametrizzazione di + j , con ovvio significato dei simboli (Fig. 6.33). v

n

z g2

r

T

G2

g1

G1 u

y x

Figura 6.33. Superficie nella classe S con bordo orientato positivamente.

Una prima versione del teorema di Stokes `e la seguente: TEOREMA 3.5 Sia ⌃ una superficie appartenente alla classe S, contenuta in un aperto A ✓ R3 . Sia poi F = P i + Qj + Rk un campo vettoriale di classe C 1 (A). Vale la formula: Z ZZ hrot F, nid = hF, T ids (3.19) ⌃

@ +⌃

dove T indica il versore tangente a @ +⌃. Il significato fisico della (3.19) `e il seguente: il flusso del rotore di F attraverso ⌃ nella direzione n uguaglia la circuitazione di F lungo @ +⌃. Si noti che, se ⌃ = D ⇢ R2 e n = k, si ha @ +⌃ = @ +D e la (3.19) si riduce alla (3.14). La (3.19) si pu` o scrivere in una forma pi` u esplicita ricordando che n = cos(n, i)i + cos(n, j)j + cos(n, k)k

456

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

e osservando che l’integrale a secondo membro `e l’integrale esteso a @ +⌃ della forma di↵erenziale ! = P dx + Q dy + R dz. La (3.20) diventa: ZZ {(Ry Qz ) cos(n, i) + (Pz Rx ) cos(n, j) + (Qx Py ) cos(n, k)}d = ⌃ Z (3.20) = P dx + Q dy + R dz. @ +⌃

Dimostrazione. Sia r(u, v) = x(u, v)i + y(u, v)j + z(u, v)k, (u, v) 2 T . Per ogni funzione g = g(x, y, z) poniamo ge = ge(u, v) = f (x(u, v), y(u, v), z(u, v)). Si ha: ZZ ZZ hrot F, nid = hrot F, ru ⇥ rv idu dv = ⌃ T ZZ ⇢ (3.21) @(y, z) @(z, x) @(x, y) + (Pz Rx ) + (Qx Py ) = (Ry Qz ) du dv. @(u, v) @(u, v) @(u, v) T R R R D’altro canto, @ +⌃ hF, T ids = @ +⌃ P dx + Q dy + R dz; consideriamo @ +⌃ P dx. Si ha: Z Z P dx = Pe (xu du + xv dv). @ +⌃

@ +T

Usando il teorema di Gauss-Green nel piano e . . . un po’ di pazienza si ottiene: ZZ Z e e {(Pe xv )u (Pe xu )v }du dv = P xu du + P xv dv = @ +T T ZZ = (Peu xv Pev xu )du dv = T ZZ = (Px xu + Py yu + Pz zu )xv (Px xv + Py yv + Pz zv )xu }du dv = Z ZT = {Py (yu xv xu yv ) + Pz (zu xv xu zv )}du dv = T ZZ ⇢ @(x, y) @(z, x) + Pz = Py du dv. @(u, v) @(u, v) T

Dunque: (3.22)

Z

P dx = @

+⌃

ZZ ⇢

Py

@(x, y) @(z, x) + Pz @(u, v) @(u, v)

du dv.

ZZ ⇢

Qz

@(y, z) @(x, y) + Qx @(u, v) @(u, v)

du dv

T

Analogamente: (3.23)

Z

Q dy = @ +⌃

Z

T

ZZ ⇢

@(z, x) @(y, z) + Ry du dv. @(u, v) @(u, v) @ T R Sommando membro a membro le (3.22)-(3.24) si RR vede che @ +⌃ P dx + Q dy + R dz coincide ⇤ con il secondo membro della (3.21) e quindi con ⌃ hrot F, nid . (3.24)

R dz =

+⌃

Rx

Il teorema di Stokes vale per superfici pi` u generali di quelle appartenenti alla classe S. Come gi` a per il teorema di Gauss-Green useremo il termine ammissibile per indicare una superficie alla quale si pu` o applicare la formula (3.19).

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

457

Alla classe delle superfici ammissibili appartengono, per esempio, superfici ⌃ orientabili, anche regolari a tratti, che si possono decomporre nell’unione di un numero finito di superfici ⌃j 2 S, tali che ⌃i \ ⌃j 6= ? se i 6= j. Risultano dunque ammissibili superfici come tronco di cono o di piramide. Un cilindro di equazioni parametriche r(t, ✓) = cos ✓i + sin ✓j + tk, (t, ✓) 2 [0, 1] ⇥ [0, 2⇡] non appartiene alla classe S, non essendo r biunivoca, ma `e chiaramente decomponibile nell’unione dei due semicilindri corrispondenti a (t, ✓) 2 [0, 1] ⇥ [0, ⇡] e (t, ✓) 2 [0, 1] ⇥ [⇡, 2⇡], che appartengono entrambi ad S. La dimostrazione del teorema `e in tal caso perfettamente analoga a quella data nel caso dei domini s-decomponibili per il Teorema 3.2: scelto il verso della normale a ⌃ e quindi a ognuna delle ⌃j , j = 1, . . . , k, `e automaticamente fissata l’orientazione di @ +⌃j . Applicando a ognuna delle ⌃j il teorema di Stokes si ha: ZZ



hrot F, nid =

k ZZ X j=1

⌃j

hrot F, nid =

k Z X j=1

@ +⌃j

hF, T id .

Nell’ultima somma, gli archi comuni a due ⌃j compaiono due volte con orientazione opposta e perci` o si elidono. Rimane cos`ı l’integrale esteso a @ +⌃ ottenendo la (3.19). Esempio 3.4 Si voglia calcolare l’integrale curvilineo Z Z ! = (y + z)dx + (z + x)dy + (x + y)dz dove `e la circonferenza intersezione della sfera di equazione x2 + y 2 + z 2 = a2 con il piano x + y + z = 0. Siano ⌃ la superficie racchiusa da sul piano x + y + z = 0 ed F = (y + z)i + (z + x)j + (x + y)k. p Orientiamo ⌃ con la normale n = (i + j + k)/ 3 e positivamente rispetto a ⌃. Dal teorema di Stokes: ZZ Z != hrot F, nid = 0 +



essendo rot F = 0. Esempio 3.5 Equazioni di Maxwell. Due leggi essenziali sull’elettromagnetismo, generalizzazioni delle leggi di Biot-Savart e di Faraday, si possono esprimere sotto la forma seguente. Siano: • • • •

E e H i vettori campo elettrico e magnetico; " e µ costante dielettrica e permeabilit` a magnetica del mezzo; coefficiente di conduttivit` a del mezzo; c velocit` a della luce nel vuoto.

458

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Sia inoltre ⌃ una superficie arbitraria con normale n e bordo . Allora, indicati con Hs , Es le componenti tangenziali a di H ed E e con Hn , En quelle normali a ⌃ si ha: ◆ Z ZZ ✓ 1 @En Hs ds = En + " d , (legge di Biot-Savart) c @t + ⌃

ossia: la circuitazione del campo magnetico lungo + uguaglia il flusso del vettore corrente totale attraverso ⌃; ZZ Z 1 @Hn Es ds = µ d , (legge di Faraday) c @t + ⌃ +

ossia: la circuitazione del campo elettrico lungo del flusso di induzione magnetica attraverso ⌃.

uguaglia la velocit` a di variazione

In virt` u del teorema di Stokes gli integrali a primo membro sono rispettivamente uguali a ZZ ZZ rotn Hd e rotn Ed , ⌃



(avendo posto rotn H = hrot H, ni e simili) cosicch´e le equazioni precedenti si possono scrivere nella forma ZZ  @En En " c rotn H d =0 @t ⌃ ZZ  @Hn c rotn E + µ d = 0. @t ⌃

Essendo ⌃ arbitraria, tale `e anche la normale n; si deducono allora le seguenti due celebri equazioni in forma di↵erenziale c rot H = E + " c rot E =

µ

@H @t

@E @t

(equazioni di Maxwell).

Mediante la (3.19) si pu` o dare un’interpretazione fisica di rot F analoga a quella vista nel caso bidimensionale. Sia ⇧ un piano con versore normale n e ⌃% un cerchio di raggio % centrato in un punto p 2 ⇧; dividiamo per area(⌃% ) = ⇡%2 la (3.19) e passiamo al limite per % ! 0. Si ha ZZ 1 rotn F d = rotn F(p) lim %!0 area(⌃% ) ⌃% e di conseguenza: 1 rotn F(p) = lim %!0 area(⌃% )

Z

@ +⌃%

hF, T ids.

a superficiale di circuitazione Da qui l’interpretazione seguente: rotn F(p) `e la densit` di F in p, in un piano perpendicolare a n. Scegliendo successivamente n = i, j, k si ottengono le interpretazioni per le singole componenti di rot F.

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

3.4

459

Potenziale vettore

R La formula di Stokes (3.19) permette di calcolare l’integrale di linea @ +⌃ hF, T ids mediante un integrale di superficie, flusso di rot F attraverso ⌃. RR Viceversa, sia dato un integrale di flusso del tipo ⌃ hV, nid dove V `e un campo vettoriale definito in un aperto contenente ⌃; se si vuole applicare la formula di Stokes, occorre determinare un vettore F tale che rot F = V. In tal caso F si chiama potenziale vettore di V. La seguente proposizione indica che, se div V 6= 0, non pu` o esistere un potenziale vettore di V. PROPOSIZIONE 3.6 Sia V 2 C 1 (A), A aperto di R2 . Se esiste F 2 C 2 (A) tale che rot F = V allora div V = 0. ` immediata, ricordando che, se F 2 C 2 (A), div rot F = 0. Dimostrazione. E



Ci chiediamo ora se la condizione div V = 0 `e anche sufficiente per l’esistenza di un potenziale vettore F di V. Il seguente contro-esempio mostra che non `e cos`ı. p Esempio 3.6 Siano A = R2 \{0} e V = % 3 (xi + yj + zk), % = x2 + y 2 + z 2 . Mostriamo che div V = 0 in A, ma che non esiste in A un potenziale vettore di V. Si ha: @ (x% @x @ (y% @y @ (z% @z

3

)=%

5

(%2

3x2 )

3

)=%

5

(%2

3y 2 )

3

)=%

5

(%2

3z 2 ).

Pertanto div V = %

5

{(%2

3x2 ) + (%2

3y 2 ) + (%2

3z 2 )} = %

5

{3%2

3%2 } = 0.

Supponiamo ora per assurdo che esista F 2 C 2 (A) tale che rot F = V in A. Dal teorema di Stokes abbiamo allora che, per ogni superficie ammissibile ⌃: Z ZZ hV, nid = hF, T ids. (3.25) ⌃

@ +⌃

Scegliamo come ⌃ la superficie sferica di raggio unitario con centro nell’origine, privata della calotta di raggio r e centro nel polo nord (0, 0, 1), come mostrato in Figura 6.34: indichiamo questa superficie con ⌃r e chiamiamo ⌃ la sfera completa. Su ⌃r scegliamo n = ne = xi + yj + zk. Allora @ +⌃r `e costituito dal bordo della calotta percorso in senso orario. Si ha, essendo % = 1 su ⌃r : hV, ni = hn, ni = 1

460

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

z

n

r

∂ +Σr

1

O

y

Σr x Figura 6.34.

e pertanto

ZZ

hV, nid =

ZZ

d = area(⌃).

area(⌃r ) =

Z

hF, T ids.

⌃r

⌃r

Dalla (3.25) si deduce quindi (3.26)

@ +⌃r

Facciamo ora tendere r a zero. Allora l’area della calotta tende a zero cosicch´e area(⌃r ) ! area (⌃) = 4⇡. D’altra parte, se M = max |F|, si ha |hF, T i|  M e quindi @⌃r

Z

@ +⌃r

hF, T ids  M

Z

ds = M l(@⌃r );

@ +⌃r

se r ! 0, l(@⌃r ) ! 0 in contraddizione con la (3.26). Dunque la condizione div V = 0 non `e sufficiente per l’esistenza di un potenziale vettore di V. La situazione `e analoga a quella della ricerca di un potenziale scalare per un campo vettoriale irrotazionale, questione a↵rontata nel Capitolo 1, Sezione 2, Paragrafo 3. Infatti, affinch´e div V = 0 diventi anche sufficiente, occorrono condizioni topologiche sull’aperto A in cui si vuole cercare il potenziale vettore. Questa volta per` o la semplice connessione di A non basta e infatti l’aperto R3 \{0} dell’Esempio 3.6 `e semplicemente connesso. Una condizione su A sufficiente `e la seguente: A `e connesso e per ogni superficie ⌃ ⇢ A regolare e chiusa, frontiera di un dominio limitato tridimensionale D, si ha D ⇢ A. Diciamo allora che A `e fortemente connesso in R3 . Vale allora il seguente risultato: PROPOSIZIONE 3.7 Sia A un aperto di R3 fortemente connesso e V 2 C 2 (A) un campo vettoriale solenoidale (div V = 0). Allora esiste F 2 C 2 (A) tale che rot F = V in A. Inoltre ogni altro potenziale vettore di V in A `e della forma (3.27) dove ' 2 C 2 (A) `e uno scalare.

F + grad '

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

461

Dimostrazione. La diamo solo nel caso particolare in cui A `e un parallelepipedo del tipo (a1 , b1 ) ⇥ (a2 , b2 ) ⇥ (a3 , b3 ). Sia dato V = V1 i + V2 j + V3 k con div V = 0 in A. Cerchiamo un potenziale vettore della forma F = F2 j + F3 k. Deve essere rot F = V e quindi, essendo ✓ ◆ @F3 @F2 @F2 @F3 j+ k, rot F = i @y @z @x @x si deve avere: (3.28)

@F3 @y

@F2 = V1 , @z

@F3 = @x

V2 ,

@F2 = V3 . @x

Le ultime due equazioni sono soddisfatte se scegliamo Z x V2 (t, y, z)dt + h(y, z) F3 (x, y, z) = x0

e F2 (x, y, z) =

Z

x

V3 (t, y, z)dt + k(y, z) x0

dove h e k sono da determinarsi in modo da soddisfare la prima delle (3.28). Derivando sotto il segno di integrale si ottiene: @F2 @F3 = @y @z Z x Z x @V2 @V3 @k @h (y, z) (t, y, z)dt (y, z) (t, y, z)dt = = @y @z x0 @y x0 @z ◆ Z x✓ @V2 @k @V3 @h (y, z) (y, z) (t, y, z) + (t, y, z) dt = = @y @z @y @z x0 ✓ ◆ @V3 @V1 @V2 + = = ricordando che = @y @z @z Z x @V1 @k @h (y, z) (y, z) + (t, y, z)dt = = @y @z x0 @x @h @k = (y, z) (y, z) + V1 (x, y, z) V1 (x0 , y, z). @y @z La prima delle (3.28) sar` a dunque verificata se si scelgono h e k in modo che: @k (y, z) = V1 (x0 , y, z). @z Ry Baster` a scegliere k(y, z) = 0 e h(y, z) = y0 V1 (x0 , s, z)ds. Il campo vettoriale F = F2 j + F3 k dove Z x V3 (t, y, z)dt F2 (x, y, z) = x0 Z x Z y (3.30) F3 (x, y, z) = V2 (t, y, z)dt + V1 (x0 , s, z)ds (3.29)

@h (y, z) @y

x0

y0

`e pertanto un potenziale vettore di V. La (3.27) segue subito osservando che, se G `e un altro potenziale vettore di V, allora rot(G F) = V V = 0. Dunque G F `e irrotazionale in una regione A semplicemente ⇤ connessa di R3 . Ne segue che esiste ' : A ! R tale che ' 2 C 2 (A) e G F = grad '.

462

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Altre formule analoghe alla (3.30) possono essere trovate dal lettore. Esempio 3.7 Sia ⌃ la porzione di paraboloide di equazione z = 1 x2 y 2 , z > 0 (si veda la Fig. 6.35). Si voglia calcolare il flusso pdel vettore V = xzi yzj 2k nella direzione della normale n = ( 2xi 2yj + k)/ 1 + 4x2 + 4y 2 . Cerchiamo di determinare un potenziale vettore F di V in R3 . Usando la (3.30) con (x0 , y0 , z0 ) = (0, 0, 0) si trova Z x Z x 2dt = 2x, F3 = yz dt = xyz. F1 = 0, F2 = 0

0

z n S

1

y

@+S x Figura 6.35.

Dunque F =

2xj

xyzk. Dalla formula di Stokes abbiamo ZZ Z hV, nid = hF, T ids. @ +⌃



Una parametrizzazione di @ +⌃ `e r(✓) = cos ✓i + sin ✓j (✓ 2 [0, 2⇡]) con T = o cos ✓j, cosicch´e, su @ +⌃, hF,T i= 2(cos ✓)2 e perci` Z 2⇡ Z hF, T ids = 2(cos ✓)2 d✓ = 2⇡. @ +⌃

sin ✓i +

0

3.5 Il teorema della divergenza Il risultato principale di questo paragrafo, noto come teorema di Gauss14 o della divergenza, connette integrali di volume con integrali superficiali. Anche questo teorema, come vedremo, `e denso di significati fisici e risulta una generalizzazione a 3 dimensioni del teorema di Gauss-Green nel piano, nella versione III. Sia D ✓ R3 un dominio limitato la cui frontiera @D sia una superficie chiusa, regolare e orientabile (per esempio un ellissoide o un toro). Indicheremo con ne il versore normale esterno a @D. 14 E `

noto anche come teorema di Ostrogradsky, matematico russo (1801-1861).

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

463

Cominciamo con lo stabilire il seguente lemma, valido in un dominio D semplice rispetto all’asse z, ovvero o n D = (x, y, z) 2 R3 : '1 (x, y) < z < '2 (x, y), (x, y) 2 B ⇢ R2 ,

dove B `e un aperto semplicemente connesso del piano e '1 , '2 sono funzioni di classe C 1 (B) (Fig. 6.36). z

ne

z = ϕ2(x, y)

D ne

ne

O

z = ϕ1(x, y) y

B x Figura 6.36. Dominio semplice rispetto all’asse z.

LEMMA 3.8 Sia F = P i + Qj + Rk 2 C 1 (D). Vale la formula ZZ ZZZ Rz dx dy dz = R cos(ne , k)d . (3.31) D

@D

Dimostrazione. Dalla formula di riduzione per gli integrali tripli si ha: ZZZ ZZ Z '2 (x,y) Rz dx dy dz = dx dy Rz dz = '1 (x,y) D B (3.32) ZZ =

[R(x, y, '2 (x, y))

R(x, y, '1 (x, y)]dx dy.

B

Ora, la frontiera di D consiste dell’unione di 3 superfici: • ⌃1 , di equazione z = '1 (x, y) con normale esterna

ne = p

1 ('1x i + '1y j 1 + |r'1 |2

k)

p ed elemento d’area d = 1 + |r'1 |2 dx dy; • ⌃2 , di equazione z = '2 (x, y) con normale esterna ne = p

1 ( '2x i 1 + |r'2 |2

'2y j + k)

p ed elemento d’area d = 1 + |r'2 x|2 dx dy; • infine ⌃, la parte laterale “cilindrica”, dove ne ` e perpendicolare a k.

464

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Si ha, essendo cos(n, k) = 0 su ⌃ e cos(ne , k) = hne , ki su ⌃1 e ⌃2 : ZZ ZZ ZZ R cos(ne , k)d = R cos(ne , k)d + R cos(ne , k)d = @ +D ⌃2 ⌃1 ZZ 1 R(x, y, '2 (x, y)) p d = 1 + |r'2 |2 B ZZ 1 R(x, y, '1 (x, y)) p d = 1 + |r'1 |2 B ZZ [R(x, y, '2 (x, y)) R(x, y, '1 (x, y))]dx dy = B

e, dalla (3.32), segue il lemma.



In modo analogo si pu` o dimostrare che: se D `e semplice rispetto all’asse y, allora (3.33)

ZZZ

Qy dx dy dz =

D

ZZ

Q cos(ne , j)d ;

@D

se D `e semplice rispetto all’asse x, allora: (3.34)

ZZZ

D

Px dx dy dz =

ZZ

P cos(ne , i)d .

@D

La seguente `e una prima versione del teorema della divergenza. TEOREMA 3.9 Sia D un dominio semplice rispetto a tutti e 3 gli assi cartesiani. Sia poi F = P i + Qj + Rk un campo vettoriale di classe C 1 (D). Allora vale la formula: ZZ ZZZ div F dx dy dz = hF, ne id . (3.35) D

@D

La (3.35) significa che il flusso di F, uscente da @D, uguaglia l’integrale della divergenza di F in D. Pi` u esplicitamente, la (3.35) si pu` o scrivere nella forma: ZZZ (Px + Qy + Rz )dx dy dz = D 0 ZZ (3.35 ) = {P cos(ne , i) + Q cos(ne , j) + R cos(ne , k)}d . @D

` sufficiente sommare membro a membro le (3.32), (3.33) e (3.34). Dimostrazione. E



Il Teorema 3.9 `e valido per una classe di domini, che ancora chiameremo ammissibili, molto pi` u vasta di quelli semplici rispetto a una terna di riferimento. Con una tecnica che ormai dovrebbe essere familiare al lettore si pu` o estendere il teorema a domini D limitati, la cui frontiera `e costituita dall’unione di un numero finito di superfici ⌃j chiuse, regolari, orientabili e disgiunte, e che siano decomponibili

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

465

in un numero finito di sottodomini semplici rispetto ai tre assi, intendendo con ci` o che esiste un numero finito di domini di quest’ultimo tipo, D1 , . . . , Dk , tali che k [ Dj , D \ D = ? se i 6= j. D= i

j=1

j

Si pu` o anche rilassare l’ipotesi di regolarit` a richiedendo che le ⌃j siano solo regolari a pezzi. Un caso tipico `e, per esempio, quello di una “scatola” D privata di N sferette come in Figura 6.37. In questo caso si noti che la normale esterna a D, ne , corrisponde a quella interna su ciascuna sferetta. Osserviamo infine che la (3.35) continua a valere nella forma Z Z div Fdx = hF, ne id . D

@D

nel caso in cui @D sia una variet` a (n

1)-dimensionale, chiusa e orientabile. ne ne !2

!1 D

!3 Figura 6.37. Dominio ammissibile per il teorema della divergenza.

Esempi 3.8 Sia F = xi + yj + zk; allora div F = 3 e otteniamo dalla (3.35) ZZZ ZZ hF, ne id = 3 dx dy dz = 3 Vol(D). @D

D

Per esempio, il flusso uscente di F attraverso il tetraedro D = {(x, y, z) 2 R3 : x > 0,

y > 0,

z > 0,

x + y + z < 1}

`e: 3 Vol(D) = 1/2 da cui ritroviamo Vol(D) = 1/6, come mostrato nell’Esempio 5.1.14. 3.9 Sia D il cubo unitario in R3 ; vale a dire D = (0, 1) ⇥ (0, 1) ⇥ (0, 1). Si voglia calcolare il flusso uscente di F = x2 i + y 2 j + z 2 k. Dal Teorema 3.9 si ha: ZZZ ZZ hF, ne id = div Fdx dy dz = @D 1

=

Z

0

Z

0

1

Z

0

D

1

2(x + y + z)dx dy dz = 3.

466

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

Dalla (3.35) si ricava la seguente interpretazione fisica della divergenza. Sia B% (p) una sfera di centro p e raggio %. Dividiamo la (3.35) per Vol(B% (p)) = 4⇡%3 /3. Dal teorema della media per integrali tripli si ha, essendo F di classe C 1 , ZZZ 1 div Fdx dy dz = div F(⌘ % ) Vol(B% (p)) B% (p) dove ⌘ % `e un opportuno punto di B% (p). Perci` o ZZZ 1 div F dx dy dz = lim div F(⌘ % ) = div F(p) lim %!0 Vol(B% (p)) %!0 B% (p) per la continuit` a della divergenza di F. Si deduce dalla (3.35) che: ZZ 1 div F(p) = lim hF, ne id %!0 Vol(B% (p)) @B% (p) ovvero: la divergenza in p di F `e la densit` a di flusso uscente in p per unit` a di volume. 3.6

Applicazioni

Fra le numerose applicazioni del teorema della divergenza ne presentiamo alcune riguardanti la fluidodinamica. Alcune altre, peraltro non meno significative, si trovano negli esercizi. Equazione di continuit` a Indichiamo con x, y, z i punti di R3 e con t il tempo. Consideriamo il moto di un fluido di densit` a % = %(x, y, z, t) la cui velocit` a sia il vettore u = u1 i + u2 j + u3 k, uj = uj (x, y, z, t), j = 1, 2, 3. Supponiamo che il moto sia regolare cosicch´e le funzioni uj e anche % siano continue insieme a tutte le loro derivate prime. Sia D ⇢ R3 una regione limitata di R3 occupata dal fluido, la cui frontiera `e una superficie chiusa regolare a pezzi, per esempio una sferetta o un cubo. Indichiamo con d un elemento di superficie su @D centrato in un punto regolare di @D. Allora la quantit` a di fluido che attraversa d nell’unit` a di tempo `e bene approssimata da %Ue d , dove abbiamo posto Ue = hu, ne i = componente di u rispetto a ne . RR In questo caso dunque si ha che il flusso del vettore %u, cio`e @D %Ue d rappresenta la massa totale di fluido “uscita” da D nell’unit` a di tempo. Dalla (3.35) ZZZ ZZ %Ue d =

@D

div(%u)dx dy dz

D

dove la divergenza `e solo rispetto alle variabili spaziali, e perci` o: ZZZ div(%u)dx dy dz = (3.36) D = massa di fluido uscita da D nell’unit` a di tempo.

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

467

u ne ds

Figura 6.38. %Ue d = massa di fluido uscita attraverso d .

D’altra parte la massa totale di fluido contenuta in D al tempo t `e data da m = RRR %(x, y, z, t)dx dy dz. Di conseguenza D ZZZ ZZZ @% dm d 15 %(x, y, z, t)dx dy dz = = dx dy dz = dt dt (3.37) D D @t = decremento della massa di fluido contenuta in D nell’unit` a di tempo. Se non vi sono in D pozzi o sorgenti di fluido, la massa di fluido “uscita” da D nell’unit` a di tempo uguaglia il decremento di fluido all’interno di D e perci` o deve essere ZZZ ZZZ @% div(%u)dx dy dz = dx dy dz. (3.38) D D @t La (3.38) si chiama equazione di continuit` a in forma integrale ed esprime il principio di conservazione della massa per il fluido in esame. Possiamo ottenere l’equazione di continuit` a in forma di↵erenziale, supponendo che D sia una sferetta di raggio r, dividendo la (3.38) per Vol(D) e passando al limite per r ! 0; utilizzando, come in precedenza, il teorema della media, essendo div(%u) e %t continue, si ricava @% . @t La (3.39) pu` o essere riscritta in una forma diversa che mette ancor pi` u in luce il significato della divergenza nel presente caso. Se si considera una particella di fluido in moto, questa avr` a coordinate dipendenti dal tempo: x = x(t), y = y(t), z = z(t). La sua densit` a % dipender` a quindi da t anche attraverso x, y, z, ovvero % = %(x(t), y(t), z(t), t). La variazione di densit` a della particella sar` a data da: (3.39)

div(%u) =

@% @% 0 @% 0 @% 0 d% = + x + y + z dt @t @x @y @z 15 Essendo

% di classe C 1 si pu` o derivare sotto il segno di integrale.

468

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

che, essendo (x0 , y 0 , z 0 ) = u la velocit` a della particella, si pu` o scrivere d% @% = + hgrad %, ui, dt @t

(3.40)

dove il gradiente `e calcolato rispetto alle variabili spaziali. Essendo poi div(%u) = hgrad %, ui + % div u, usando la (3.39) si ha: 1 d% % dt

div u =

che esprime la divergenza del vettore velocit` a come variazione relativa della densit` a di una particella in moto nell’unit` a di tempo. Notiamo infine che se il fluido `e incomprimibile si ha d%/dt = 0, da cui la condizione di incomprimibilit` a div u = 0. Se inoltre il moto del fluido `e irrotazionale (non vorticoso) e cio`e rot u = 0 allora, almeno localmente, u deriva da un potenziale : u = grad . Inserendo grad nell’equazione div u = 0 otteniamo div grad che mostra come

=

=

@2 @2 @2 + + =0 2 2 @x @y @z 2

sia una funzione armonica.

Relazione tra forze di volume e forze di superficie Mediante il teorema della divergenza si pu` o chiarire la connessione tra forze di volume (per esempio la forza gravitazionale) e forze di superficie (per esempio la pressione), agenti su un continuo deformabile. Limitiamo le considerazioni a un fluido perfetto di densit` a % = %(x, y, z), in cui, cio`e, le forze interne si riducono alla sola pressione normale; di conseguenza l’azione del resto del fluido su una parte D isolata di esso, limitata da una superficie ⌃, risulti in una forza F, diretta in tutti i punti di ⌃ secondo la normale interna. Indichiamo con p (pressione) l’intensit` a di tale forza per unit` a di superficie e con ne , al solito, la normale esterna a ⌃. Su ogni elemento di superficie d agir` a una forza data da pne d , cosicch´e la risultante F di tutte le forze agenti su ⌃ sar` a ZZ pne d . (3.41) F= ⌃

Le componenti di F rispetto a i, j, k sono, nell’ordine: ZZ ZZ p cos(ne , i)d , p cos(ne , j)d , ⌃



ZZ

p cos(ne , k)d ;



utilizzando le formule (3.31), (3.33) e (3.34), tali componenti si possono scrivere rispettivamente: ZZZ ZZZ ZZZ px dx dy dz, py dx dy dz, pz dx dy dz. D

D

D

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

469

Ne segue che F pu` o essere espressa dalla seguente formula: ZZZ (3.42) F= grad p dx dy dz. D

Le formule (3.41) e (3.42) forniscono la relazione cercata: la forza di pressione di densit` a p, che agisce perpendicolarmente a ogni elemento di superficie, uguaglia la forza di densit` a grad p, che agisce su ogni elemento di volume. Caratteristica dei campi solenoidali Il flusso di un campo vettoriale derivabile con continuit` a e solenoidale, cio`e a divergenza nulla, presenta un’invarianza rispetto a deformazioni della superficie. Precisamente, siano ⌃1 e ⌃2 superfici regolari a tratti connesse, chiuse e orientabili ciascuna delle quali sia frontiera di un aperto limitato in R3 . Supponiamo che ⌃1 sia contenuta nell’interno di ⌃2 e chiamiamo D l’intercapedine tra ⌃1 e ⌃2 , cio`e l’insieme dei punti esterni a ⌃1 e interni a ⌃2 . Vale la seguente proposizione. PROPOSIZIONE 3.10 Sia F = P i + Qj + Rk un campo vettoriale di classe C 1 (D), tale che div F = Px + Qy + Rz = 0 in D. Allora ZZ ZZ hF, ne id = hF, ne id . (3.43) ⌃1

⌃2

Dimostrazione. Applichiamo il teorema della divergenza a F in D. Si ha, osservando che la normale esterna a ⌃1 `e la normale interna a D: ZZZ ZZ ZZ 0= div F dx dy dz = hF, ne id hF, ne id D

⌃2

⌃1

da cui la (3.43).



La (3.43) `e utile in casi come il seguente. Esempio 3.10 Si voglia calcolare il flusso del campo elettrostatico E, generato da una carica puntiforme q, posta nell’origine, attraverso una qualunque superficie chiusa ⌃ che racchiuda q. Tale campo, in un conveniente sistema di misurazione, coincide con il gradiente della funzione (potenziale elettrostatico) '(x, y, z) =

q 4⇡%

Si ha dunque E = grad ' =

(% =

p x2 + y 2 + z 2 ).

q (xi + yj + zk) 4⇡%3

e di conseguenza div E = div grad ' = 0

in R3 \{0}.

470

CAPITOLO 6. Superfici e integrali di superficie

c 978-88-08-63708-6

In base alla Proposizione 3.10 il flusso uscente di E attraverso ⌃ `e uguale al flusso uscente di E attraverso una superficie sferica ⌃R centrata nell’origine e di raggio R abbastanza grande da contenere ⌃. Perci` o ZZ hE, ne id . flusso uscente di E = ⌃R

Su ⌃R si ha: ne =

1 (xi + yj + zk), R

%=R

e perci` o q 4⇡R2

flusso uscente di E =

q 4⇡R2

e hE, ne i = ZZ

d = q,

⌃R

risultato ben noto in elettrostatica.

Complementi con esercizi il bordo del quadrato di vertici (0, 0) (1, 0), (1, 1), (0, 1) e dove

H

y 2 dx+x dy dove `e `e l’ellisse x2 /a2 + y 2 /b2 = 1.

1. Usare il teorema di Gauss-Green per valutare i seguenti integrali:

+

2. Dimostrare le seguenti formule di integrazione per parti per integrali doppi: siano f, g 2 C 1 (D), D ammissibile per il Teorema 3.2, allora:

ZZ e

f gx dx dy = D

ZZ

f gy dx dy = D

Z Z

f g dy @ +D

f g dx @ +D

ZZ ZZ

fx g dx dy D

fy g dx dy. D

3. Usare il Teorema 3.2 per dimostrare che, se D ` e semplicemente connesso e ammissibile per il Teorema 3.2, allora la forma di↵erenziale P dx + Qdy, con P, Q 2 C 1 (D), `e esatta in D se e solo se rot F = 0 in D. 4. Sia

una curva chiusa semplice e regolare di equazione polare % = f (✓), ✓ 2 [✓0 , ✓1 ]. Se `e la frontiera di D, dimostrare che area(D) =

1 2

Z

✓2

[f (✓)]2 d✓.

✓1

Calcolare l’area della cardioide. 5. Sia

una curva chiusa semplice e regolare di equazioni parametriche x = x(t), y = y(t), t 2 [a, b]. Se `e la frontiera di D orientata positivamente, mostrare che area(D) =

1 2

Z

b a

x(t) y(t) dt. x0 (t) y 0 (t)

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

471

6. Come si pu` o definire l’indice di avvolgimento di una curva rispetto a un punto (x0 , y0 ) 6= (0, 0)? # " Z y y0 x x0 dx + p dy. Suggerimento : !, dove ! = p (x x0 )2 +(y y0 )2 (x x0 )2 + (y y0 )2 7. Sia D ✓ R2 ammissibile per il Teorema 3.2 ed f 2 C 2 (D).

Poniamo Dn f = hgrad f, ni su @D. Dimostrare che ZZ Z Dne f ds = f dx dy. a) @D D Z b) Dedurre che, se f `e armonica in D, Dn f ds = 0. @D

8.*

Sia D% , 0 < %  1, una famiglia di cerchi con centro (0, 0) e di raggio %. Sia poi f 2 C 2 (D1 ). Mostrare che, posto Z 1 f ds = media di f su @D% , (%) = 2⇡% @D%

si ha

Z 2⇡ Z 1 1 (fx cos ✓ + fy sin ✓)d✓ = Dne f ds; 2⇡ 0 2⇡% @D% b) dedurre da a) e dall’Esercizio 7 che, se f `e armonica, 0 (%) = 0 e quindi (%) = costante; c) concludere che Z 1 f ds f (0, 0) = 2⇡% @D% a)

0

(%) =

(propriet` a di media per funzioni armoniche). 9. Sia D il disco unitario con centro in (0, 0). Siano f e g di classe C 2 (D). Dimostrare che:

a) se f = g = 0 su @D:

ZZ

b) se f = 0 o g = 0 su @D:

ZZ

g f dx dy = D

fx gy dx dy = D

ZZ ZZ

f g dx dy; D

fy gx dx dy. D

10. Sia ⌃ una superficie chiusa ammissibile per il teorema della divergenza. Mostrare che

ZZ

cos(n, i)d = ⌃

ZZ

cos(n, j)d = ⌃

ZZ

cos(n, k)d = 0. ⌃

11. Sia D ⇢ R3 ammissibile per il teorema della divergenza; poniamo

J (D) =

Z

(x cos(ne , i) + y cos(ne , j) + z cos(ne , k))d . @D

Mostrare che, se D1 ✓ D2 , allora J (D1 )  J (D2 ). 12. Trasformare con la formula di Stokes i seguenti integrali curvilinei (su @ + ⌃) in integrali

di superficie (su ⌃).

472 a) b)

CAPITOLO 6. Superfici e integrali di superficie

Z

c 978-88-08-63708-6

(z 2 + y)dx + z dy + y dz;

Z@

+⌃

(y

x)dx + (2y + z)dy

z dz.

@ +⌃

13. Calcolare il seguente integrale curvilineo sia utilizzando la formula di Stokes sia direttamente Z (y + z)dz + (z + x)dy + (x y)dz

dove

`e il cerchio intersezione tra la sfera x2 + y 2 + z 2 = 1 e il piano z = y.

14. Calcolare mediante la formula di Stokes il flusso del vettore V = (x+y)i+(z 2

2

2

y)j+x3 yk

2

attraverso il paraboloide di equazione z = x + y , x + y  4. 15. Generalizzazione dell’Esercizio 7 Sia D ⇢ R3 ammissibile per il teorema della divergenza ed f 2 C 2 (D). Poniamo Dn f = hgrad f, ni. Mostrare che ZZ ZZZ Dne f d = f dx dy dz. @D

Si noti che, se

f = 0, allora

D

ZZ

Dne f d = 0. @D

16.*

Sia H(x, y, z) una funzione omogenea di grado µ, tale che che, se D `e la sfera unitaria con centro in (0, 0, 0), allora ZZ

Hd = @D

H = 1 in R3 . Dimostrare

4⇡ µ

[Suggerimento: utilizzare la formula di Eulero (Teor. 7.1.9 Vol. 1) e poi il teorema della divergenza.] 17. Sia ⌃ unaZsuperficie connessa chiusa e regolare con normale n. Poniamo r = xi + yj + zk. Z

Mostrare che



r ⇥ n d = 0.

18. Integrazione per parti negli integrali tripli

Sia D ammissibile per il teorema della divergenza. Siano poi f 2 C 1 (D) uno scalare e F 2 C 1 (D) un vettore. Allora ZZZ

f div F dx dy dz = D

ZZ

@D

f hF, ne id

ZZZ

D

hrf, Fidx dy dz.

Dedurre che, se F = r' e ' `e armonica, allora ZZZ ZZ f Dne 'd = hrf, r'idx dy dz. @D

D

19. Sia V = V(x, y, z) il campo di velocit` a di un fluido, tale che div V = 0. Chiamiamo

linea di corrente una curva quella di V.

tale che in ciascuno dei suoi punti la direzione tangente sia

3. I teoremi di Green, Gauss e Stokes

c 978-88-08-63708-6

473

Se ⌃ `e una superficie in R3 , consideriamo il fascio di linee di corrente che passano attraverso ⌃. Il loro insieme si chiama tubo di flusso. Dimostrare che, se ⌃1 e ⌃2 sono due sezioni piane di un tubo di flusso (Fig. 6.39), allora ZZ ZZ hV, ne id + hV, ne id = 0. ⌃1

⌃2

Interpretare il risultato in termini fisici. [Suggerimento: applicare il teorema della divergenza alla regione D in Figura 6.39.]

ne v

S2 S1 ne

Figura 6.39.

D

ne

ne

CAPITOLO 7

Equazioni alle derivate parziali e Calcolo delle variazioni

1.

EQUAZIONI ALLE DERIVATE PARZIALI

Per mezzo di equazioni di↵erenziali ordinarie siamo in grado di costruire modelli matematici che descrivono l’evoluzione temporale di sistemi il cui stato, in ogni istante, pu` o essere determinato da un numero finito di parametri: a questa categoria appartengono, per esempio, i sistemi costituiti da un numero finito di punti, i corpi rigidi ecc. . . . Ma per descrivere la configurazione di una corda a un generico istante t `e necessario prescrivere la posizione di tutti i suoi punti (un’infinit` a continua!) in quell’istante, `e necessario cio`e assegnare una funzione u = u(x, t); le leggi della fisica stabiliscono dei legami tra le derivate temporali e spaziali di u, cio`e l’evoluzione temporale della corda `e descritta da un’equazione in cui compaiono le derivate parziali di u: una tale equazione `e detta perci` o equazione alle derivate parziali (EDP). Per mezzo di equazioni di questo tipo si costruiscono modelli matematici adatti a descrivere un grandissimo numero di fenomeni che interessano ogni tipo di scienza: dalla fisica all’economia, dall’ingegneria alla biologia, alle scienze sociali, ecc. . . . La teoria delle EDP `e ormai cos`ı vasta che `e impossibile darne, in poche pagine, un’idea, anche sommaria. Pur restringendo le nostre considerazioni alle EDP lineari del secondo ordine, come faremo, quello che segue `e, pi` u che una introduzione, un “assaggio” di un grande capitolo della matematica, ancora in pieno e rigoglioso sviluppo. Questa sezione `e dedicata soprattutto a quegli studenti di Ingegneria che esauriscono i loro studi matematici nel triennio; per altri `e auspicabile che un cos`ı importante argomento trovi pi` u adeguato spazio nei corsi futuri. 1.1 Generalit` a Un’equazione alle derivate parziali `e una relazione della forma (1.1)

F (x, y, t, . . . , u, ux , uy , ut , . . . , uxy , . . .) = 0

dove F `e una funzione delle variabili reali x, y, t, . . . , u, ux , uy , ut , . . . , uxx , uxy , . . .; u = u(x, y, t, . . .) `e una funzione incognita delle variabili indipendenti x, y, t, . . . Una

476

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

soluzione (particolare) della (1.1) `e una funzione u(x, y, . . .) la quale, quando sia sostituita nella (1.1) insieme con le sue derivate parziali ux , uy , ut , . . . faccia diventare la relazione (1.1) una identit` a. Un’equazione del tipo (1.1) si dir` a di ordine n se contiene almeno una derivata parziale di ordine n e nessuna di ordine maggiore di n. La (1.1) si dir` a lineare se F `e lineare nella funzione incognita u e nelle sue derivate a quasi lineare se F `e lineare (soltanto) nelle derivate di ux , uy , uxx , uxy , . . .; si dir` ordine massimo. Per esempio, l’equazione ut + uux = 0 nella funzione incognita u = u(x, t) `e quasi lineare del 1 ordine; l’equazione u = f, cio`e

uxx + uyy + uzz = f (x, y, z)

nella funzione u = u(x, y, z) `e lineare del 2 ordine; l’equazione u2xy = f (x, y)

uxx uyy

`e non lineare del 2 . Vediamo ora alcuni semplicissimi esempi di equazioni alle derivate parziali; si intende, negli esempi che seguono, che tutte le funzioni considerate siano sufficientemente regolari, in modo che le operazioni di integrazione e di derivazione che su di esse vengono fatte abbiano significato. 1. L’equazione ux = 0

(1.2)

nella funzione u(x, t) stabilisce che u non dipende da x e ammette pertanto, come pi` u generale soluzione, (1.3)

u = w(t)

dove w `e una funzione arbitraria di t. 2. L’equazione (1.4)

ux

ut = 0

si riconduce a una del tipo 1. con la seguente trasformazione di variabili 8 > =⇠

: u(x, t) = !(⇠, ⌘). Abbiamo allora

@u @! @⇠ @! @⌘ @! @! = + = + @x @⇠ @x @⌘ @x @⇠ @⌘ @u @! @⇠ @! @⌘ @! @! = + = @t @⇠ @t @⌘ @t @⇠ @⌘

1. Equazioni alle derivate parziali

c 978-88-08-63708-6

e perci` o la (1.4) diventa

477

2!⌘ = 0

che ammette come soluzione un’arbitraria funzione di ⇠ ! = w(⇠) e pertanto, tornando alle vecchie variabili, (1.6)

u = w(x + t).

Quando l’equazione (1.4) si incontra in certi problemi di fisica, l’incognita u ha spesso il significato di densit` a di un certo mezzo ed `e funzione della variabile spaziale x e della variabile temporale t. La (1.4) descrive allora il propagarsi di una perturbazione (una variazione di densit` a) attraverso il mezzo in esame nella direzione delle x negative e con velocit` a unitaria: infatti, dalla (1.6) abbiamo che, se all’istante t = 0 e nel punto a ha il valore w(x), lo stesso valore si riscontra, per esempio, all’istante x = x la densit` t = 3, ma nel punto x = x 3. L’equazione ↵ux + ut = 0

(1.7)

(con ↵ e costanti) `e dello stesso tipo della (1.4) e si tratta nello stesso modo, usando il cambiamento di variabili x ↵t = ⇠, x + ↵t = ⌘; si ottiene la soluzione generale (o, come talvolta si dice, l’integrale generale) (1.8)

u = w( x

↵t)

che rappresenta il propagarsi di un disturbo (o di un’onda, come si dice comunemente) con velocit` a v = ↵/ (velocit` a positiva significa propagazione nel senso delle x crescenti, velocit` a negativa, in senso contrario); in due punti x1 e x2 distanti tra loro una lunghezza l lo stesso disturbo verr` a osservato con uno scarto di tempo di l/v. 3. Consideriamo ora l’equazione (1.9)

uxy = 0

nella funzione incognita u(x, y). La (1.9) implica anzitutto che ux non dipende da y, cio`e (1.10) ux = (x) dove

`e un’arbitraria funzione di x; integrando ora la (1.10) abbiamo Z u= (x)dx + (y)

R dove `e un’arbitraria funzione di y e (x)dx `e una qualsiasi primitiva di (che `e funzione arbitraria di x) e dunque una funzione arbitraria di x che indicheremo con '(x). Abbiamo cos`ı la soluzione generale della (1.9): (1.11) dove ' e

u = '(x) + (y) sono funzioni arbitrarie degli argomenti.

478

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

4. L’equazione (1.12)

utt

v 2 uxx = 0

(v costante) si riconduce alla precedente col cambiamento di variabili x + vt = ⇠, la (1.12) diventa infatti

x

vt = ⌘,

u(x, t) = !(⇠, ⌘);

4v 2 !⇠⌘ = 0

la quale ammette la soluzione generale !(⇠, ⌘) = '(⇠) + (⌘) e, tornando alle variabili x e t, (1.13)

u(x, t) = '(x + vt) + (x

vt)

come ' e funzioni arbitrarie degli argomenti. Il significato fisico dei due termini che compongono il secondo membro della (1.13) `e il seguente: '(x + vt) rappresenta una perturbazione che si propaga nel senso delle x negative con velocit` a v; (x vt) rappresenta un’analoga perturbazione che si propaga in senso contrario con la stessa velocit` a. Negli esempi precedenti abbiamo ricavato elementarmente la soluzione generale delle equazioni considerate; si sar` a osservato che essa dipende da un certo numero di funzioni arbitrarie. Nelle applicazioni, noi saremo di solito interessati a risolvere particolari problemi, che si formulano mediante equazioni accompagnate da condizioni supplementari che selezionano una (o pi` u) soluzioni particolari. Nei problemi associati a equazioni di↵erenziali ordinarie (per esempio, molti problemi di Meccanica) spesso il procedimento adottato `e il seguente: si cerca l’integrale generale delle equazioni di↵erenziali il quale contiene un certo numero di costanti arbitrarie; quindi si cerca di determinare tali costanti imponendo le condizioni supplementari del problema (per esempio, posizione e velocit` a iniziali). Ci` o conduce a risolvere equazioni algebriche o trascendenti, ma sempre con un numero finito di incognite. Invece, quando si tratta di equazioni a derivate parziali, la soluzione generale contiene funzioni arbitrarie e quindi, anche se si riesce a trovarla (cosa che accade assai raramente nei problemi concreti) per determinare poi queste funzioni per mezzo delle condizioni supplementari, si devono risolvere, generalmente, problemi matematici piuttosto difficili (per esempio, equazioni integrali). Si preferisce quindi assai spesso tener conto fin dall’inizio delle condizioni supplementari (o di una parte di esse) in modo da ricercare non la soluzione generale, ma una soluzione con un “grado limitato” di generalit` a, per esempio, contenente alcune costanti arbitrarie (vedremo applicate queste osservazioni nei Paragrafi 1.7, 1.8). 1.2 Equazioni lineari del 2 ordine. Classificazione In questa breve introduzione alle equazioni alle derivate parziali limiteremo le nostre considerazioni alle equazioni lineari del 2 ordine, cio`e a equazioni del tipo (1.14)

Lu :=

n X

i,j=1

aij (x)uxi xj +

n X i=1

ai (x)uxi + a(x)u = f (x)

1. Equazioni alle derivate parziali

c 978-88-08-63708-6

479

dove abbiamo indicato con x = (x1 , x2 , . . . , xn ) le variabili indipendenti; supporremo che i coefficienti aij (x), ai (x), a(x) dell’equazione e il termine noto f (x) siano definiti in un aperto ⌦ ✓ Rn , e che risulti aij (x) = aji (x).1 La ragione di limitare il nostro studio a equazioni del tipo (1.14) sta nel fatto che una grande quantit` a di fenomeni fisici possono essere modellati, almeno in prima approssimazione, da equazioni di questo tipo (si veda il prossimo paragrafo). Nella (1.14) la parte contenente le derivate seconde, cio`e il termine n X

(1.15)

aij (x)uxi xj

i,j=1

viene detto parte principale o dominante dell’operatore L; la classificazione dell’equazione dipende solo da questo termine, cosicch´e essa `e valida anche per equazioni pi` u generali della (1.14), per esempio equazioni del tipo n X

i,j=1

aij (x)uxi xj + f (x, u, ru) = 0

che vengono dette quasilineari. La classificazione viene fatta punto per punto. Sia x 2 ⌦ fissato e supponiamo che i coefficienti aij (x) non siano tutti nulli; associamo all’equazione (1.14) la forma quadratica (1.16)

n X

aij (x)⇠i ⇠j .

i,j=1

Come `e noto dall’Algebra, una forma quadratica pu` o essere ricondotta a una forma canonica, cio`e a una forma contenente solo i quadrati delle indeterminate; esiste cio`e una trasformazione lineare non singolare L (dipendente dal punto x) tale che, se si fa il cambiamento di coordinate (1.17)

⇣ = L⇠

la forma quadratica (1.16) assume la forma canonica (1.18)

n X

2 i ⇣i

i=1

` noto anche che la (1.16) pu` con i = 0, 1, o 1. E o essere ricondotta alla forma del tipo (1.18) in vari modi (cio`e la trasformazione L non `e unica); ma il numero dei i negativi, positivi, e nulli non dipende dalla trasformazione considerata (`e un invariante della forma quadratica; precisamente il numero dei i < 0 si chiama indice di inerzia e si indica con T , mentre il numero dei i = 0 si chiama indice di difetto e sar` a indicato con D). 1 L’equazione (1.14) pu` o sempre essere riscritta in modo da soddisfare questa condizione pur di assumere uxi xj = uxj xi .

480

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

Allora, se, nel punto fissato x 2 ⌦, risulta i) D = 0 e T = 0 oppure D = 0 e T = n, la forma quadratica (1.16) `e definita e l’equazione (1.14) sar` a detta ellittica; ii) D = 0 e T = 1 oppure D = 0 e T = n 1, la forma quadratica `e indefinita e l’equazione si dice iperbolica; se D = 0 e 1 < T < n 1 l’equazione si dice ultraiperbolica. iii) Il caso D > 0 viene generalmente detto caso parabolico; tuttavia nelle applicazioni ricorre pi` u frequentemente il caso speciale D = 1 e T = n 1 oppure T = 0; in tale caso la forma quadratica `e semidefinita; quando si parla di equazione parabolica ci si riferisce di solito a questa situazione. Nel caso di due sole variabili indipendenti x e y, l’equazione (1.14) si pu` o scrivere nella forma a(x, y)uxx + 2b(x, y)uxy + c(x, y)uyy + · · · = f (x, y)

(1.19)

con i coefficienti a, b, c non tutti nulli nello stesso punto. La matrice associata alla forma quadratica `e ✓ ◆ ab b c e perci` o la classificazione `e la seguente: i) ac ii) ac iii) ac

b2 > 0 2

b 1. Allora si dimostra che, prese opportune unit` spostamento verticale u(x, y) soddisfa l’equazione uxx + uyy = f (x, y). I problemi che, in questo contesto, pi` u frequentemente si presentano in concreto sono: i) trovare la posizione di equilibrio della membrana sapendo che il suo bordo `e fissato a una curva (la cui proiezione sul piano (x, y) deve coincidere con , cio`e la frontiera di ⌦); si suppongono note le equazioni parametriche di , cio`e 8 >

: u = '(s)

(se ' = 0, coincide con ). Matematicamente il problema si formula cos`ı: trovare u = u(x, y) tale che ( uxx + uyy = f (x, y) in ⌦ (1.21) u=' su @⌦ Tale problema si chiama problema di Dirichlet.

482

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

u

G

y W

g

x Figura 7.1. Membrana e sua proiezione sul piano xy.

ii) Un altro problema che si incontra frequentemente nelle applicazioni `e il problema di Neumann: trovare u = u(x, y) tale che 8 0 `e il coefficiente di di↵usione. La (n + 1)-esima variabile viene indicata con t per il significato di variabile temporale che generalmente assume nelle applicazioni.

1. Equazioni alle derivate parziali

c 978-88-08-63708-6

483

La forma quadratica associata alla (1.23) `e: 2 k(⇠12 + ⇠22 + · · · + ⇠n2 ) + 0 · ⇠n+1

e perci` o l’equazione `e parabolica (D = 1, T = n). La (1.23) `e detta equazione di di↵usione, poich´e descrive, sotto opportune ipotesi, la di↵usione del calore nei corpi. L’incognita u rappresenta la temperatura nel punto x all’istante t; il termine noto f rappresenta il tasso di calore per unit` a di massa fornito a (o sottratto da) una sorgente (positiva o negativa) eventualmente presente nel corpo, supposto omogeneo e isotropo. Il coefficiente di di↵usione k (costante) codifica le propriet` a termiche del corpo. La (1.23) descrive anche la di↵usione di un fluido in un dato ambiente: in tal caso u rappresenta la concentrazione di questo fluido. I problemi pi` u comuni che si incontrano sono: i) determinare la temperatura del corpo all’istante generico t > 0 conoscendone la temperatura all’istante iniziale (t = 0) e sapendo, in ogni istante, qual `e la temperatura sul bordo. Assumendo che il corpo occupi la regione ⌦ dello spazio R3 , scriveremo: (1.24) (1.25)

u(x, 0) = h(x) x2⌦ (condizione iniziale) u(x, t) = '(x, t) x 2 @⌦, t > 0 (condizione al bordo di tipo Dirichlet)

Il problema (1.23) (1.24) (1.25) prende il nome di problema di Cauchy-Dirichlet. ii) Invece della temperatura sul bordo pu` o essere nota la quantit` a di calore scambiata tra il corpo e l’ambiente circostante (per ogni istante t > 0): allora, al posto della (1.25), si formula la condizione seguente (1.26)

@u (x, t) = (x, t) x 2 @⌦, t > 0 (condizione al bordo di tipo Neumann) @n

(dove n `e la normale esterna a @⌦). Il problema (1.23), (1.24), (1.26) prende il nome di problema di Cauchy-Neumann. Si noti che ci siamo posti il problema di determinare la temperatura del corpo all’istante t > 0 conoscendone la temperatura iniziale (per t = 0); un problema completamente diverso (e che richiederebbe uno speciale trattamento) sarebbe quello di determinare la temperatura a un istante t < 0 conoscendo la temperatura finale (per t = 0): si veda il Paragrafo 1.5 e l’Esercizio 5; si osservi anche che l’equazione (1.23) cambia aspetto cambiando t in t. 3. Il prototipo delle equazioni iperboliche `e l’equazione (1.27)

utt

v2

xu

=f

dove ancora u `e funzione delle n+1 variabili (x, t) e v ha le dimensioni di una velocit` a. La forma quadratica associata alla (1.27) `e: 2 v 2 (⇠12 + ⇠22 + . . . + ⇠n2 ) + ⇠n+1

e perci` o l’equazione `e iperbolica. L’equazione (1.27) prende il nome di equazione delle onde, anche se la maggior parte delle onde non `e descritta da essa. Questa equazione interviene comunque in moltissimi campi della Fisica matematica, ma principalmente in elastodinamica, in acustica, in elettromagnetismo.

484

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

Consideriamo, per esempio, la membrana descritta al punto 1. di questo paragrafo, soggetta a una forza f (x, y, t); la funzione u = u(x, y, t), che descrive la forma della membrana all’istante t, soddisfa l’equazione (1.28)

utt

uxx

uyy = f (x, y, t)

(avendo scelto opportunamente l’unit` a di misura dei tempi in modo che v = 1). Un problema tipico per questa equazione (detto ancora di Cauchy-Dirichlet) consiste nel trovare una soluzione della (1.28) per t > 0 (oppure per t < 0) conoscendo posizione e velocit` a iniziali (o finali) dei punti della membrana, cio`e ( u(x, y, 0) = h(x, y) ut (x, y, 0) = k(x, y)

(1.29)

(x, y) 2 ⌦

e, per ogni istante, la posizione del bordo (1.30)

u(x, y, t) = '(x, y, t) (x, y) 2 @⌦,

8 t > 0 (oppure t < 0)

(si noti che la forma dell’equazione (1.27) non cambia se si cambia t in t). Invece della condizione (1.30) possiamo considerare la condizione di Neumann (1.31)

@u (x, y, t) = (x, y, t) (x, y) 2 @⌦, @n

8 t > 0(t < 0)

col solito significato. 1.4

Il problema di Cauchy. Caratteristiche

Nel paragrafo precedente abbiamo visto che, per equazioni di una determinata classe (ellittiche, paraboliche, iperboliche) si formulano problemi che sono “tipici” di quella classe: tali problemi sono suggeriti in modo naturale dalle situazioni fisiche sopra descritte. Un importante problema, che pu` o formularsi matematicamente in modo identico per ogni equazione come la (1.14) (ma anche per equazioni di tipo pi` u generale) indipendentemente dalla classe cui questa appartiene `e il problema di Cauchy, l’analogo, per equazioni alle derivate parziali, dell’omonimo problema considerato per le equazioni di↵erenziali ordinarie. Per le equazioni in due variabili indipendenti x1 , x2 il problema si formula nel modo seguente. Problema di Cauchy. parametriche

Sia dato nel piano (x1 , x2 ) un arco di curva , definito dalle equazioni

:=

(

x1 = x1 (s) x2 = x2 (s)

0sl

e contenuto nella regione ⌦ in cui i coefficienti e il termine noto dell’equazione sono definiti; siano assegnate due funzioni '(s) e (s); trovare una soluzione u della (1.14) (con n = 2)

1. Equazioni alle derivate parziali

c 978-88-08-63708-6

u

485

G

x2 g W x1

n

Figura 7.2. Curve portanti i dati nel problema di Cauchy.

che sia definita in un intorno di e soddisfi le condizioni 8 u(x1 (s), x2 (s)) = '(s) > ='

: = (x1 (s), x2 (s)) = (s) @n @n essendo n il versore normale a

0sl

(si veda la Fig. 7.2).

OSSERVAZIONE 1.1 Nello spazio R3 di coordinate cartesiane ortogonali (x1 , x2 , u) le soluzioni u = u(x1 , x2 ) della (1.14) rappresentano geometricamente delle superfici, dette superfici integrali dell’equazione. Il problema posto consiste nel cercare, tra le infinite superfici integrali della (1.14), quella (o quelle) che soddisfa le condizioni (1.32): la prima di queste impone a detta superficie di passare per una assegnata curva (di equazioni x1 = x1 (s), x2 = x2 (s), u = '(s)) e la seconda impone che tale superficie abbia un assegnato piano tangente (o, equivalentemente, un assegnato versore normale) in ogni punto di : infatti dalla prima condizione ricaviamo subito la derivata della u nella direzione tangente a ; la seconda ci d` a la derivata della u nella direzione normale a ; l’insieme di queste due informazioni ci permette di ricavare le derivate della u in qualunque direzione, per esempio ux e uy e con esse ricavare facilmente l’equazione del piano tangente alla superficie. OSSERVAZIONE 1.2 Il problema di Cauchy `e un problema “in piccolo” o locale, nel senso che la soluzione `e richiesta in un non precisato intorno della curva , portante i dati; ci` o `e in contrasto con i problemi descritti nel paragrafo precedente (problemi al contorno) in cui la soluzione era richiesta in tutta un’assegnata regione ⌦. a cos`ı: OSSERVAZIONE 1.3 Nel caso generale (n > 2) il problema di Cauchy si formuler` a (n 1)-dimensionale) individuata dalle assegnata in Rn una ipersuperficie (variet`

486

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

equazioni parametriche xi = xi (s) (i = 1, . . . , n)

s = (s1 , . . . , sn

1)

trovare una soluzione u = u(x) della (1.14), definita in un intorno di , e tale che u| = ', essendo '(s),

@u @n

=

(s) funzioni assegnate (0  si  li : i = 1, . . . , n

1).

Enunceremo ora un teorema che assicura l’esistenza e l’unicit` a della soluzione del problema di Cauchy. Tale teorema metter` a in evidenza una delle di↵erenze pi` u profonde tra le equazioni ordinarie e le equazioni alle derivate parziali. Per le prime sappiamo infatti che, se i coefficienti e il termine noto dell’equazione2 sono continui, il problema di Cauchy ammette soluzione (unica); per le seconde invece pu` o avvenire che, anche con coefficienti e termine noto di classe C 1 , il problema non abbia alcuna soluzione; questo fenomeno, scoperto da Hans Lewy3 , `e stato l’origine di molte e importanti ricerche in questo settore. Quanto detto giustifica il fatto che, nel teorema che tra poco enunceremo, si fac` per` cia riferimento a funzioni analitiche. E o necessario introdurre prima un concetto fondamentale. Superfici caratteristiche Supponiamo che l’equazione (x) = 0 definisca implicitamente una ipersuperficie a caratteristica per l’equazione (1.14) se la funzione `e in Rn . Tale superficie si dir` soluzione dell’equazione n X aij (x) xi xj = 0. (1.33) i,j=1

La (1.33) `e una equazione non lineare del 1 ordine; essa `e formata utilizzando la parte principale dell’operatore L e sostituendo le derivate seconde uxi xj con il prodotto delle derivate prime xi xj . Consideriamo in particolare il caso di due sole variabili indipendenti x e y; l’equazione (1.33), riferita all’equazione scritta nella forma (1.19), diventa: (1.34)

a(x, y)

2 x

+ 2b(x, y)

x

y

+ c(x, y)

2 y

= 0.

Se l’equazione implicita (x, y) = 0 `e risolubile, per esempio, rispetto a y, cio`e se y = y(x) `e l’equazione cartesiana di una linea caratteristica, la (1.34) diventa, essendo y , y0 = x (1.35)

a(x, y)y 02

2b(x, y)y 0 + c(x, y) = 0

2 Facciamo riferimento qui a equazioni lineari (del 2 ordine) per mantenere l’analogia con le equazioni che stiamo trattando in questa sezione. 3 Hans Lewy, matematico di origine tedesca, allievo di Hilbert.

1. Equazioni alle derivate parziali

c 978-88-08-63708-6

487

da cui, risolvendo rispetto a y 0 , abbiamo (se a 6= 0) p (1.36) y 0 = (b ± b2 ac)/a.

Se b2 ac > 0 (equazione iperbolica), la (1.36) rappresenta due equazioni di↵erenziali a di linee (nel campo reale) del 1 ordine; avremo, come soluzione, una doppia infinit` nel piano (x, y). Se b2 ac = 0 (equazione parabolica) la (1.36) rappresenta una sola equazione di↵erenziale: le linee caratteristiche formano una famiglia a un parametro nel piano (x, y). Se b2 ac < 0 (equazione ellittica) non vi sono linee caratteristiche (reali). Il lettore pu` o completare la discussione esaminando i casi: a = 0 e c 6= 0 (basta scambiare i ruoli di x e y) oppure a = 0, c = 0 e b 6= 0. Esempi 1.1 Un’equazione ellittica non ha mai caratteristiche reali; infatti l’equazione (1.33), n P aij (x)⇠i ⇠j definita, `e soddisfatta solo se xi = 0 essendo la forma quadratica i,j=1

8 i = 1, . . . , n, cio`e solo se superficie in Rn .

`e costante; allora l’equazione

= 0 non definisce alcuna

1.2 Per l’equazione di di↵usione (in 2 variabili x, t), cio`e ut kuxx = 0, l’equazione (1.35) (dove si deve leggere t al posto di y) diventa: t0 = 0. Le linee caratteristiche sono perci` o le rette di equazione t = costante. In generale, per l’equazione ut k x u = 0, le superfici caratteristiche sono date implicitamente dall’equazione (x1 , . . . , xn , t) = 0 dove `e soluzione di: 2 x1

+ ··· +

2 xn

= 0.

Si ricava perci` o che `e funzione solo di t, del resto arbitraria; allora l’equazione (t) = 0 avr` a come soluzione t = costante (ogni costante `e accettabile, essendo arbitraria). Le superfici caratteristiche sono perci` o i piani di equazione: t = costante. 1.3 Per l’equazione delle onde (in 2 variabili x, t), nella forma utt v 2 uxx (v costante), l’equazione (1.36) (con t al posto di y) diventa: t0 = ±1/v. Le linee caratteristiche sono perci` o le rette del piano (x, t) con pendenza 1/v o 1/v (si veda la Fig. 7.3). Nel caso generale, per l’equazione utt v 2 x u = 0, le superfici caratteristiche sono costituite dal “cono” di equazione: v 2 t2 = x21 +· · ·+x2n e da tutti quelli che si ottengono da questo con la traslazione arbitraria del vertice (si veda la Fig. 7.4). Siamo ora in grado di enunciare il seguente teorema. TEOREMA 1.1 (di Cauchy-Kowalewskaya) Con riferimento al problema di Cauchy sopra illustrato assumiamo che: i) i coefficienti e il termine noto dell’equazione sono analitici in un intorno di4

;

4 Si assume cio` e che queste funzioni, per esempio f (x1 , . . . , xn ), siano sviluppabili in serie di Taylor rispetto a ognuna delle variabili x1 , . . . , xn , in un intorno di ogni punto x 2 .

488

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

t t

x – vt = c1 x n

x + vt = c2

R

y

x Figura 7.3. Linee caratteristiche.

Figura 7.4. Coni caratteristici.

ii)

`e analitica (cio`e le funzioni xi (s), che definiscono parametricamente , sono analitiche); iii) i dati ' e sono analitici; iv) la superficie non `e in alcun punto tangente a una superficie caratteristica (cio`e in nessun punto ha il piano tangente in comune con una caratteristica). Allora esiste una sola funzione u, analitica in un intorno di , soluzione del problema dato. Significato delle caratteristiche Per comprendere il ruolo giocato dalle caratteristiche nel problema in esame consideriamo l’equazione (1.19) (due sole variabili indipendenti); la linea , portante i dati, sia assegnata in forma cartesiana: y = y(x). I dati del problema forniscono dunque la funzione u su , cio`e u(x, y(x)) e la derivata normale @u/@n(x, y(x)); da questi dati si ricavano facilmente ux (x, y(x)) e uy (x, y(x)). Per trovare la soluzione in un intorno di , nelle ipotesi di analiticit` a stabilite nel Teorema (1.1), baster` a calcolare tutte le derivate della u su . Cominciamo col calcolare le derivate seconde. Si hanno le relazioni: dux = uxx + uxy y 0 , dx

duy = uyx + uyy y 0 dx

da cui si ricava duy 0 dux y + dx dx du y uyy y 0 + . dx

uxx = uyy y 02 uxy =

Sostituendo queste nella (1.19) abbiamo l’equazione (1.37)

uyy [a(x, y(x))y 02

2b(x, y(x))y 0 + c(x, y(x))] + · · · = 0

1. Equazioni alle derivate parziali

c 978-88-08-63708-6

489

(dove i puntini sostituiscono quantit` a note). Dalla (1.37) possiamo ricavare uyy (cosicch´e tutte le derivate seconde saranno note) purch´e il termine entro parentesi quadra sia 6= 0. L’equazione: [· · · ] = 0 `e precisamente la (1.35), cio`e l’equazione di↵erenziale delle caratteristiche per la (1.19). Richiedere che [· · · ] 6= 0 per ogni x significa perci` o richiedere che la linea non coincida con (o risulti tangente a) una caratteristica. Determinate cos`ı le derivate seconde, si pu` o procedere al calcolo delle derivate successive; la condizione [· · · ] 6= 0 garantisce che tali derivate sono tutte univocamente determinate dai dati iniziali. 1.5 Generalit` a sui problemi al contorno. Nozione di problema ben posto Riprendiamo in esame i problemi esposti nel Paragrafo 1.3. La formulazione generale di tali problemi `e la seguente: si richiede di trovare una funzione u soddisfacente l’equazione (1.14) Lu = f e un certo numero di condizioni supplementari (condizioni al contorno e condizioni iniziali) del tipo L1 u = '1 L2 u = '2 .. . Lk u = 'k Per esempio, per il problema di Dirichlet si richiede di trovare u = u(x), x 2 ⌦, con l’unica condizione: L1 u := u(x)|x2@⌦ = '1 . Nel problema di Cauchy-Neumann per l’equazione di di↵usione si richiede di trovare u = u(x, t), x 2 ⌦, t > 0 con le condizioni: L1 u := u(x, 0) = '1 (x), x 2 ⌦ @u L2 u := (x, t)|x2@⌦,t>0 = '2 . @n Tutti i problemi considerati sono lineari, poich´e sia l’equazione che le condizioni supplementari sono lineari. ` comodo rappresentare sinteticamente l’equazione e le condizioni supplementari E nella forma: (1.38)

Lu =

dove L `e un vettore di operatori e 0

un vettore di funzioni: 1 0 1 L f BL1 C B'1 C B C B C B C B C L = BL2 C = B'2 C B .. C B .. C @ . A @ . A Lk 'k

490

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

La linearit` a degli operatori L, L1 , . . . , Lk comporta la validit` a del principio di sovrapposizione: se u1 `e una soluzione corrispondente al dato (insieme di dati) 1 e u2 corrisponde a 2 , allora al dato ↵ 1 + costanti) corrisponder` a la soluzione 2 (↵, ↵u1 + u2 : (1.39)

L(↵u1 + u2 ) = ↵

1

+

2.

Osserviamo in particolare che le soluzioni dell’equazione omogenea: Lu = 0 formano naturalmente uno spazio lineare (ma questa volta ad infinite dimensioni in contrasto con il caso delle equazioni lineari ordinarie); le condizioni supplementari permettono di selezionare una (o alcune) di queste soluzioni. La soluzione u sar` a cercata in uno spazio lineare metrico X (da precisarsi di volta in volta, secondo il problema in esame); il dato sar` a assegnato in un spazio lineare metrico Y 5 . Lo studio del problema (1.38) `e lo studio dell’applicazione L: X ! Y. I problemi principali da a↵rontare sono i seguenti. i) Unicit` a della soluzione. Pu` o accadere che, a uno stesso dato , corrispondano due (o pi` u) soluzioni diverse u1 , u2 ? Equivalentemente possiamo chiederci: l’applicazione L `e iniettiva? Essendo il problema lineare, la domanda pu` o riformularsi nella maniera seguente: il problema omogeneo Lv = 0 ammette soluzioni diverse dalla soluzione e Lu2 = nulla (che, ovviamente, possiede)? Infatti, se avvenisse che: Lu1 = risulterebbe (per la (1.39)) L(u1 u2 ) = 0 e, se il problema omogeneo ammettesse solo la soluzione nulla, seguirebbe u1 = u2 . ii) Esistenza di una soluzione. Preso un dato 2 Y , `e certo che esista (almeno) un elemento u 2 X tale che Lu = ? Equivalentemente: l’applicazione L `e suriettiva? ` conveniente, a questo proposito, spezzare il problema (1.38) in vari sottoprobleE mi, tenendo conto del principio di sovrapposizione. Infatti, se v, w1 , w2 , . . . , wk sono soluzione dei seguenti problemi: L v=f L1 v = 0 L2 v = 0 .. . Lk v = 0

L w1 = 0 L1 w1 = '1 L2 w1 = 0 .. . Lk w1 = 0

L w2 = 0 L1 w2 = 0 L2 w2 = '2 .. . Lk w2 = 0

...

L wk = 0 L1 wk = 0 L2 wk = 0 .. . Lk wk = 'k

allora u = v + w1 + w2 + · · · + wk `e soluzione del problema (1.38). Come si vede, in ognuno dei sottoproblemi considerati, un solo dato per volta `e preso diverso da zero: cosa che pu` o semplificare, nelle applicazioni, la ricerca della soluzione. Questa questione richiede, per essere a↵rontata, metodi avanzati di Analisi Funzionale. Tuttavia, in alcuni casi, si pu` o pervenire alla soluzione con metodi elementari, alcuni dei quali saranno esaminati nei prossimi paragrafi. 5 Pi` u precisamente: f sar` a assegnato in uno spazio Y0 , '1 in Y1 , . . . , 'k in Yk ; il vettore allora un elemento dello spazio Y = Y0 ⇥ Y1 ⇥ · · · ⇥ Yk .

sar` a

1. Equazioni alle derivate parziali

c 978-88-08-63708-6

491

iii) Stabilit` a della soluzione. Se due dati 1 e 2 sono tra loro “vicini” (nella metrica di Y ), possiamo a↵ermare che anche le corrispondenti soluzioni u1 e u2 sono vicine tra loro (nella metrica di X)? In altre parole, se una successione { n } converge a in Y , la corrispondente successione delle soluzioni, {un }, converge a u (soluzione corrispondente a ) in X? La questione `e importante soprattutto in vista del calcolo approssimato (numerico) della soluzione, tenuto conto che, nei casi concreti, quasi mai si riesce a ottenere una espressione analitica “esplicita”; infatti i dati inseriti in un computer sono approssimati (per via di errori di arrotondamento o di troncamento ecc. . . . ), cio`e sono “vicini” ai dati veri del problema. La questione che ci poniamo `e se la soluzione fornita dal computer possa ritenersi “vicina” (e quanto) alla soluzione vera. iv) Algoritmi numerici per ottenere una rappresentazione approssimata della soluzione. ` chiaro che i punti i, ii), iii), che costituiscono l’analisi qualitativa del problema, E sono preliminari al iv) che `e di pertinenza dell’Analisi Numerica. Nei prossimi paragrafi ci limiteremo a brevi cenni sui punti i) e ii). Un problema che soddisfi ai requisiti di esistenza, unicit` a e stabilit` a della soluzione si dice ben posto secondo Hadamard. Mentre un tempo si pensava che i problemi non ben posti occorressero sporadicamente nelle applicazioni, si riconosce oggi che un gran numero di problemi concreti (legati, per esempio, alla ricostruzione di immagini in base a segnali provenienti da sorgenti lontane, a ricerche geofisiche nel sottosuolo (ricerche petrolifere) ecc. ecc.) appartengono a questa categoria. Un esempio classico di problema mal posto `e il problema di determinare la temperatura di un corpo a un istante t < 0 conoscendone la temperatura “finale”, cio`e all’istante t = 0 (Esercizio 5). 1.6

Problemi di unicit` a

Esaminiamo la questione dell’unicit` a della soluzione dei problemi descritti nel Paragrafo 1.3. Consideriamo perci` o i corrispondenti problemi omogenei e chiediamoci se essi ammettono soluzioni diverse dalla soluzione nulla. Il metodo utilizzato `e sostanzialmente lo stesso in tutti i casi; esso prende il nome di metodo dell’integrale dell’energia, per le ragioni che indicheremo. Tale metodo si applica sia a problemi ellittici, che parabolici e iperbolici ed `e suscettibile di generalizzazioni che lo rendono utile anche in presenza di coefficienti variabili. Problemi di Dirichlet e Neumann per l’equazione di Laplace Consideriamo i problemi omogenei

(D)

(

u = 0 in ⌦ u=0 su @⌦

8 < u = 0 in ⌦ (N ) @u : = 0 su @⌦. @n

` naturale richiedere che una soluzione Dobbiamo scegliere lo spazio X delle soluzioni. E di (D) o di (N ) sia una funzione u due volte di↵erenziabile con continuit` a in ⌦ (aperto

492

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

limitato in Rn ) e continua con derivate prime continue fin sul bordo6 ; scegliamo cio`e: X = C 2 (⌦) \ C 1 (⌦). Sia ora u 2 C 2 (⌦)\C 1 (⌦) una soluzione del problema (D) oppure (N ). Moltiplicando ambo i membri dell’equazione u = 0 per u e integrando su ⌦ abbiamo Z u ud x = 0. ⌦

Osserviamo ora che, applicando la regola di Leibniz per la derivata di un prodotto, si ha: (1.40)

div(uru) = u div ru + hru, rui = u u + |ru|2 .

Ricavando u u dalla (1.40) e inserendo l’espressione nell’equazione precedente otteniamo Z Z div(uru)dx |ru|2 dx = 0. (1.41) ⌦



Per il teorema della divergenza (si assume qui che il dominio ⌦ sia connesso e ammissibile per il teorema della divergenza) risulta: Z Z Z @u div(uru)dx = uhru, nid = u d ⌦ @⌦ @⌦ @n essendo n il versore normale a @⌦ rivolto verso l’esterno di ⌦. Poich´e, su @⌦, risulta u = 0 (per il problema (D)) oppure @u/@n = 0 (per il problema (N )), l’ultimo integrale scritto `e nullo e perci` o otteniamo, dalla (1.41), Z |ru|2 dx = 0. (1.42) ⌦

Questo integrale `e detto integrale dell’energia (o anche integrale di Dirichlet) poich´e, in molte applicazioni, esso `e proporzionale all’energia del sistema (per esempio, nell’interpretazione elastica esso `e proporzionale all’energia potenziale della membrana, nell’interpretazione elettrostatica esso `e proporzionale all’energia del campo elettrico. . . ). Dalla (1.42), essendo la funzione integranda continua e non negativa, si ricava che deve essere ru = 0 in ⌦, cio`e essendo ⌦ connesso, u = costante. Allora, se u `e soluzione del problema (D), si ricava che deve essere u = 0 (essendo u nulla su @⌦); nel caso del problema (N ) qualunque costante `e accettabile. Abbiamo cos`ı dimostrato il seguente TEOREMA 1.2 Sia ⌦ un aperto connesso e limitato di Rn , per il quale valga il teorema della divergenza. Allora il problema omogeneo (D) ammette, in C 2 (⌦)\C 1 (⌦), la sola 6 Per il problema (D) sarebbe naturale richiedere solo la continuit` a di u fin sul bordo; ma il metodo che utilizziamo richiede anche la continuit` a delle derivate prime.

1. Equazioni alle derivate parziali

c 978-88-08-63708-6

493

soluzione nulla; il problema omogeneo (N ) ammette come soluzioni tutte le costanti. Il problema di Dirichlet (non omogeneo) ammette, al pi` u, una sola soluzione; il problema di Neumann (non omogeneo), se ammette soluzione, questa non sar` a unica, ma determinata a meno di una costante additiva arbitraria. o dimostrare l’unicit` a della soluzione del OSSERVAZIONE 1.4 Con altri metodi si pu` problema di Dirichlet in C 2 (⌦) \ C 0 (⌦). OSSERVAZIONE 1.5 Per il problema di Neumann non omogeneo u=f @u = @n

in ⌦ su @⌦

osserviamo subito che, se i dati f e sono assegnati in maniera arbitraria, la soluzione in generale non esiste; infatti, condizione necessaria perch´e il problema abbia soluzione `e che i dati f e soddisfino la seguente condizione di compatibilit` a Z Z f= d . (C) ⌦

@⌦

Se u 2 C 2 (⌦) \ C 1 (⌦) `e una soluzione del problema, la (C) si trova integrando su ⌦ l’equazione u = f e osservando che: Z Z Z Z Z Z @u f= u dx = div ru dx = hru, nid = d . d = ⌦ ⌦ ⌦ @⌦ @⌦ @n @⌦ Problemi di Cauchy-Dirichlet e Cauchy-Neumann per l’equazione di di↵usione Siano Qt¯ = ⌦ ⇥ (0, t¯) un cilindro spazio-temporale, con ⌦ aperto limitato e St¯ = @⌦ ⇥ (0, t¯). Consideriamo i problemi omogenei

(1.43)

( ut k u = 0 in Qt¯ u(x, 0) = 0 x2⌦

con le condizioni sulla parete laterale St¯: (CD)

u = 0 oppure

(CN )

@u = 0. @n

a illustrato nel Abbiamo scritto al posto di x con il significato dei simboli gi` Paragrafo 1.3. Siamo interessati a conoscere la soluzione u(x, t) in un intervallo di tempo [0, t] fissato ad arbitrio. Richiediamo che la soluzione u sia due volte di↵erenziabile con continuit` a rispetto alle variabili spaziali x, una volta rispetto a t, nel cilindro Qt¯, che sia continua fino a t = 0 e sia continua con derivate (rispetto a x e t) continue fin sul bora scrivendo semplicemente: do St¯. Esprimeremo sinteticamente tutte queste propriet` u 2 X⌦,t .

494

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

TEOREMA 1.3 Sia ⌦ un aperto limitato di Rn , per cui vale il teorema della divergenza e sia t > 0. Allora i problemi (1.43) (CN ) o (CD) ammettono, in X⌦,t , la sola soluzione nulla. I corrispondenti problemi non omogenei ammettono, al pi` u, una sola soluzione. Dimostrazione. Sia u 2 X⌦,t una soluzione di (1.43) (CD) oppure (CN ). Moltiplichiamo ambo i membri dell’equazione ut k u = 0 per u e integriamo su ⌦ in dx; abbiamo: Z Z u ut dx k u u dx = 0. ⌦



Applicando ancora la formula (1.40) otteniamo Z Z Z 1 @ (1.44) u2 dx k div(uru)dx + k |ru|2 dx = 0 2 @t ⌦ ⌦ ⌦ (lo scambio dell’integrale in dx su ⌦ con la derivata rispetto a t `e giustificato dal fatto che l’integranda u2 e la sua derivata 2u ut sono continue su ⌦). Il secondo integrale che compare a primo membro della (1.44) `e nullo (si applica, come prima, il teorema della divergenza e si tiene conto delle condizioni al contorno); otteniamo perci` o: Z Z 1 @ u2 dx = k |ru|2 dx  0. (1.45) 2 @t ⌦ ⌦ Poniamo H(t) =

Z

u(x, t)2 dx. ⌦

La funzione H(t) `e continua e derivabile in [0, t¯) e inoltre ha le seguenti propriet` a: i) H(t) 0 8 t: 0 < t < t; ii) H 0 (t)  0 8 t: 0  t < t¯ per la (1.45); iii) H(0) = 0 per la condizione iniziale u(x, 0) = 0. Si conclude allora che deve essere H(t) = 0 per ogni t 2 [0, t¯) e perci` o u(x, t) = 0 per ogni t 2 [0, t¯). ⇤

OSSERVAZIONE 1.6 Come abbiamo visto, se i dati sono nulli in [0, t), lo stesso avviene per la soluzione del problema; pi` u in generale, se i dati sono nulli in [0, t1 ) con t1 < t, a naturalmente essere la soluzione sar` a nulla fino al tempo t1 (e, in seguito, potr` diversa da zero). In altre parole, se assegniamo due diversi dati nell’intervallo [0, t) i quali per` o sono uguali in [0, t1 ), possiamo a↵ermare che le corrispondenti soluzioni coincidono in [0, t1 ) (e saranno poi, in generale, diverse). La soluzione, al tempo t, in un qualunque punto x 2 ⌦, viene influenzata dai dati assegnati precisamente fino al tempo t (principio di causalit` a). Chiameremo dominio di dipendenza corrispondente al punto (x, t) il cilindro ⌦ ⇥ [0, t) (Fig. 7.5). Problema di Cauchy-Dirichlet e Cauchy-Neumann per l’equazione delle onde Poich´e in questo caso l’applicazione del metodo sopra illustrato `e un po’ pi` u complicata che nei casi ellittico e parabolico, semplificheremo l’esposizione considerando solo due variabili indipendenti.

1. Equazioni alle derivate parziali

c 978-88-08-63708-6

495

t

t=t

(x, t) t

W R

n

Figura 7.5. Il valore di u in (x, t) dipende dal valore del dato iniziale (per t = 0) e dal valore dei dati al contorno su @⌦ ⇥ (0, t).

Consideriamo l’equazione omogenea: utt

v 2 uxx = 0 in R = {(x, t) : 0 < x < L, 0 < t < t}

(v costante) con condizioni iniziali omogenee u(x, 0) = 0,

ut (x, 0) = 0

00 u (x, t)

h (x)

O

c 978-88-08-63708-6

l

x

O

l

x

Figura 7.8.

Problema di Cauchy. Formula di D’Alembert Esaminiamo prima il caso ideale di una corda infinitamente lunga; consideriamo cio`e il problema di Cauchy 8 2 > 0 (oppure t < 0) (1.68) u(x, 0) = h(x) x2R > : ut (x, 0) = k(x) x 2 R.

Dall’espressione (1.67), imponendo le condizioni iniziali, abbiamo ( '(x) + (x) = h(x) (1.69) v'0 (x) v 0 (x) = k(x).

Di↵erenziamo la prima di queste equazioni, moltiplichiamola per v e sommiamola alla seconda; otteniamo 2v'0 (x) = vh0 (x) + k(x). Integrando (e indicando con ⇠ l’argomento di ') abbiamo Z ⇠ 1 1 '(⇠) = h(⇠) + k(⌧ )d⌧ + c 2 2v 0 con c costante arbitraria. Dalla prima delle (1.69) ricaviamo allora (indicando con ⌘ l’argomento di ) Z ⌘ 1 1 k(⌧ )d⌧ c. (⌘) = h(⌘) 2 2v 0 Abbiamo infine, usando la (1.67) Z x+vt 1 1 k(⌧ )d⌧. (1.70) u(x, t) = [h(x + vt) + h(x vt)] + 2 2v x vt La (1.70) si chiama formula di D’Alembert. Vale la seguente proposizione, la cui dimostrazione `e immediata. PROPOSIZIONE 1.6 Se h 2 C 2 (R) e k 2 C 1 (R), la funzione u data dalla (1.70) `e di classe C 2 (R2 ) ed `e soluzione del problema (1.68). Notiamo che la soluzione u, nel punto (x, t), si costruisce utilizzando soltanto i dati contenuti nel segmento [x vt, x + vt]; pi` u precisamente, del dato iniziale h vengono

1. Equazioni alle derivate parziali

c 978-88-08-63708-6

505

utilizzati solo i valori negli estremi x vt e x+vt, mentre del dato k vengono utilizzati tutti i valori dell’intervallo [x vt, x + vt]. Una variazione dei dati nel punto x > x comincer` a a farsi sentire nel punto x a partire dal tempo t = (x x)/v (Fig. 7.9); l’equazione perci` o descrive il propagarsi di perturbazioni con velocit` a v. t (x, t ) (x, t)

x – vt

x + vt x

x

Figura 7.9. Il valore di u in (x, t¯) dipende dai dati nel segmento [x

x vt, x + vt].

Torniamo ora al problema della corda con estremi fissi. La soluzione u `e cercata nella striscia 0 < x < l, t > 0. Nella regione triangolare T = {t  x/v, t  (l

x)/v, t

0}

illustrata in Figura 7.10 la soluzione `e rappresentata dalla formula di D’Alembert (1.70); infatti nel triangolo T la soluzione del problema `e univocamente determinata dai dati iniziali h(x) e k(x) ed `e indipendente dalle condizioni al contorno. Per avere la soluzione nei punti della striscia non appartenenti a T cerchiamo di prolungare artificialmente i dati h e k, assegnati solo nell’intervallo [0, l], a tutta la retta, in modo tale che la funzione fornita dalla formula di D’Alembert, ristretta alla striscia 0  x  l, t 0, automaticamente soddisfi le condizioni al bordo. Cominciamo col prolungare h e k all’intervallo [ l, l] come funzioni dispari ed estendiamole poi a tutta la retta come funzioni 2l-periodiche (e dispari); indichiamo con e h ee k i prolungamenti di h e k cos`ı ottenuti. Consideriamo ora la formula (1.70) con e hee k al posto di h e k. La funzione u `e tale che: Z vt 1 1e e e k(⌧ )d⌧ = 0 per ogni t u(0, t) = [h(vt) + h( vt)] + 2 2v vt t x = vt

x = l– vt

T O Figura 7.10. In T , u ` e definita dalla (1.70).

l

x

506

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

h

–l

c 978-88-08-63708-6

~ h

0

x

2l

l

Figura 7.11. Prolungamento dispari del dato iniziale h all’intervallo [ l, l], esteso con periodicit` a 2l a tutto R.

essendo e hee k dispari, e poich´e e

1 h(l + vt) + e h(l u(l, t) = [e 2 e h(l Z

1 vt)] + 2v

vt) = e h( l

l+vt

l vt

e k(⌧ )d⌧ =

Z

l+vt

l vt

vt) = Z

vt vt

e k(⌧ )d⌧ = 0

per ogni t

e h(l + vt)

e k(⌧ )d⌧ = 0.

Perci` o le condizioni al contorno sono verificate. Le condizioni iniziali sono pure manifestamente verificate. Rimane da verificare l’equazione; come sappiamo dalla Prok 2 C 1 (R). Le condizioni perch´e posizione 1.6 questa `e verificata purch´e e h 2 C 2 (R) e e ci` o avvenga sono:

(1.71)

h 2 C 2 ((0, l)) h 2 C 0 ([0, l]) h(0) = h(l) = 0 h0 (0+), h0 (l ) esistono finiti h00 (0+), h00 (l ) esistono finiti h00 (0+) = h00 (l ) = 0.

k 2 C 1 ((0, l)) k 2 C 0 ([0, l]) k(0) = k(l) = 0 k0 (0+), k0 (l ) esistono finiti

Abbiamo perci` o il seguente TEOREMA 1.7 Siano h e k funzioni assegnate in [0, l] soddisfacenti le condizioni (1.71). Siano e h e e k i prolungamenti dispari e 2l-periodici di h e k a tutta la retta. Allora la funzione u rappresentata dalla (1.70) con e hee k al posto di h e k `e di classe 2 2 0 (oppure t  0) `e (l’unica) C (R ); la sua restrizione alla striscia 0  x  l, t soluzione del problema (1.63), (1.64), (1.65). Complementi con esercizi 1. Classificare le seguenti equazioni a coefficienti costanti e trovare la famiglia delle caratteristiche (se esistono):

i) uxx + 2uxy + 2uyy = 0; ii) uxx + 4uxy + 4uyy = 0; iii) uxx + 2uxy 3uyy = 0.

1. Equazioni alle derivate parziali

c 978-88-08-63708-6

507

2. Indicare, per ognuna delle seguenti equazioni, le regioni del piano (x, y) in cui ` e ellittica, parabolica, iperbolica; trovare le linee caratteristiche

i) xuxx

(x + y)uxy + yuyy = 0;

ii) 4uxx

4 sin xuxy

iii) uxx iv) x2 uxx

3xuxy

(cos x)2 uyy = 0;

4x2 uyy = 0;

2xyuxy + y 2 uyy = 0.

3. Riduzione a forma canonica Diamo esplicitamente le trasformazioni di variabili che riducono una equazione in due variabili indipendenti, a coefficienti costanti, alla forma canonica. Il lettore `e invitato a verificare la validit` a della seguente tabella Equazione auxx + 2buxy + cuyy+ Iperbolica (termini di ordine inferiore) = 0 Segno di ac

b2

Famiglia/e di linee caratteristiche

Trasformazione di variabili

Forma standard

Soluzione generale dell’equazione con i soli termini principali: auxx + 2buxy + cuyy = 0

Parabolica

Ellittica



0

+

2

1

0

(

p ay + ( b + b2 ac)x = cost p b2 ac)x = cost ay + ( b ( x = costante se a = 0 2by cx = costante (

p ⇠ = ay + ( b + b2 ac)x p (1) b2 ac)x ⌘ = ay + ( b ( ⇠=x se a = 0 ⌘ = 2by cx oppure ( p ⇠ = (ay bx)/ b2 ac (2) ⌘=x u⇠⌘ + · · · = 0 oppure u⇠⇠ u⌘⌘ + · · · = 0 u = '(⇠) + (⌘) dove ⇠, ⌘ sono date dalle (1) e ', sono funzioni arbitrarie

ay bx costante

=

se a = b = 0 x = costante (

⇠ = ay ⌘=x

bx

se a = b = 0: ( ⇠=x ⌘=y

8 ay bx

in R (rettangolo dell’Esercizio 6.)

: uy (x, 0) = (x) Z ⇡ (x)dx = 0. con 0

[Risposta: u(x, y) =

1 Ch n(l y) a0 P + an cos nx con a0 arbitrario e 2 n Sh nl 1 Z 2 ⇡ (x) cos nx dx per n = 1, 2, . . .] an = ⇡ 0

Osservare che, se la condizione integrale sul dato non `e soddisfatta, il problema non ha soluzione; se `e soddisfatta, la soluzione non `e unica, in accordo con il Teorema 1.2 e l’Osservazione 1.5. Indicare una condizione sufficiente su perch´e la funzione u sopra rappresentata per serie sia e↵ettivamente di classe C 2 (R) \ C 1 (R). 8. Risolvere il problema (problema misto)

8 uxx + uyy = 0 > > > < u(0, y) = ux (⇡, y) = 0 > u(x, 0) = sin(x/2) > > : uy (x, l) = 0.

[Risposta: u(x, y) = sin

in R = {0 < x < ⇡, 0 < y < l}

x Ch(l y)/2 .] 2 Ch l/2

9. Risolvere il problema

8 0

1)

2

e

[(2n 1)2 +4a]t/4

✓ sin n

1 2



x.

510

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

10. Risolvere il problema

(

u=0 u(1, ✓) = (cos ✓)2

nel cerchio: r < 1

[Suggerimento: senza far lunghi calcoli, ricordando che le funzioni: rn cos n✓ e rn sin n✓ sono armoniche nel piano, e osservando che (cos ✓)2 = (1 + cos 2✓)/2, si trova subito u(r, ✓) = (1 + r2 cos 2✓)/2.] 11. In( maniera analoga alla precedente, risolvere i problemi:

a)

b)

u = 0 nel cerchio: r < 1 u(1, ✓) = (sin ✓)3 ( u=0 nel cerchio: x2 + y 2 < 4 4 u=x sulla circonferenza: x2 + y 2 = 4.

12. Per risolvere il problema

(

u=4 u(1, ✓) = sin ✓

in r < 1

conviene trovare prima una soluzione particolare dell’equazione u = 4, per esempio, v = x2 + y 2 . Se questa soluzione soddisfacesse la condizione al contorno, sarebbe la soluzione del nostro problema. Diversamente, si ponga u = w + v e si cerchi w tale che: w = 0 in r < 1 w(1, ✓) = u(1, ✓) v(1, ✓), cio`e w(1, ✓) = sin ✓ Si trova w(r, ✓) = 1 + r sin ✓. Allora u = r2 In ( maniera analoga risolvere il problema: u=2 in r < 1 u(1, ✓) = (cos ✓)2

1.

1 + r sin ✓ `e la soluzione del problema iniziale.

[Risposta: u = r2 (cos ✓)2 = x2 .] 13. Risolvere, con separazione di variabili, il problema:

[Risposta: u(x, t) =

1 P 1

14.*

8 utt v 2 uxx = 0 > > > > >

> >u(x, 0) = f (x) > > : ut (x, 0) = 0.

0 < x < ⇡, t > 0

bn cos nvt sin nx con bn =

2 ⇡

Z



f (x) sin nxdx.] 0

Risolvere, con separazione di variabili, il problema: 8 2 >

: ut (x, 0) = g(x).

0 < x < ⇡, t > 0

2. Elementi di calcolo delle variazioni

c 978-88-08-63708-6

[Risposta: u(x, t) =

1 P

511

bn Tn (t) sin nx con

1

Z 2 ⇡ g(x) sin nx dx ⇡ 0 8 at 2 > b n2 v 2 )

: at 2 2 e (n v + b a2 ) bn =

1/2

Sh(a2

1/2

sin(n2 v 2 + b

b

n2 v 2 )1/2 t a2 )1/2 t

se n2 v 2 < a2 se n2 v 2 = a2 se n2 v 2 > a2

b b b.]

L’equazione considerata `e detta equazione dei telegrafi; essa descrive la trasmissione di impulsi elettrici in un cavo con capacit` a, induttanza e resistenza distribuite.

2.

ELEMENTI DI CALCOLO DELLE VARIAZIONI

La mitologia attribuisce alla regina di Cartagine, Didone, la soluzione del seguente problema: determinare la figura piana con perimetro assegnato e di area massima. Si tratta di un tipico problema di Calcolo delle Variazioni (in breve CdV), una branca della matematica che si inserisce nella teoria dell’ottimizzazione e che costituisce oggi parte dell’Analisi Funzionale. L’oggetto matematico da ottimizzare non `e per` o riducibile (come nel Cap. 2) a una funzione reale di un numero finito di variabili reali, bens`ı `e un funzionale reale, ovvero una applicazione che associa a una funzione (scalare o vettoriale, di una o pi` u variabili) un numero reale. L’inizio di una teoria sistematica del CdV si pu` o far risalire alla seconda met` a del 17 secolo, quando Giovanni Bernoulli pose il famoso problema della brachistocrona (dal greco brachistos (il pi` u breve) + chronos (tempo)): determinare il percorso che un punto materiale pesante deve seguire per connettere due punti assegnati nel pi` u breve tempo possibile. Il problema fu risolto dallo stesso Bernoulli e da suo fratello opital. Jakob, da Newton e da De l’Hˆ Lo sviluppo del calcolo di↵erenziale diede grande impulso al CdV che si impone come strumento non soltanto adatto a risolvere particolari problemi di natura meccanica, bens`ı anche capace di produrre principi generali, detti principi variazionali, come, per esempio, il principio di Hamilton, diventati rapidamente basilari nello sviluppo della Fisica; basti pensare che Einstein ne fece intenso uso per la teoria della relativit` a generale e che Schr¨ odinger li us` o per derivare l’equazione che porta il suo nome, in meccanica quantistica. La teoria classica, legata principalmente ai nomi di Eulero e Lagrange, `e stata poi generalizzata in pi` u direzioni. Agli anni 1940-50 risalgono la teoria del controllo ottimo e quella della programmazione dinamica che oggi hanno assunto un ruolo dominante, per esempio in economia o nell’ingegneria dei sistemi elettronici. Dall’inizio del secolo si sono poi sviluppati i cosiddetti metodi diretti, che utilizzano strumenti di Analisi Funzionale. Ancora oggi il CdV `e in piena evoluzione e, unitamente a metodi numerici, `e in grado di a↵rontare problemi di notevole complessit` a come per esempio quello della segmentazione di immagini, importante nelle telecomunicazioni.

512

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

Questa sezione costituisce una breve introduzione al CdV e si pone l’obiettivo di mettere in luce la struttura tipica dei problemi che la teoria a↵ronta e di presentare i risultati pi` u importanti della teoria classica, in connessione con alcuni dei principi variazionali sopra menzionati. 2.1

Alcuni problemi tipici del Calcolo delle Variazioni

Esempi 2.1 Problema della brachistocrona. Un punto materiale, soggetto alla sola forza di gravit` a, si trova in un punto A; dato un altro punto B (non giacente sulla verticale per A), si vuole determinare il percorso che il punto deve seguire per arrivare in B nel pi` u breve tempo possibile. Per formulare il problema matematicamente scegliamo il sistema di riferimento come in Figura 7.12 A

x

x1 x

u (x) ds u1

B u

Figura 7.12.

Sia u = u(x), x 2 [0, x1 ], una curva che giace sul piano verticale che contiene A e B a e passa per detti punti; ci` o significa u(0) = 0, u(x1 ) = u1 . Sia poi v0 0 la velocit` (scalare) del punto materiale in A. p 1 + u0 (x)2 dx `e allora percorso con velocit` a7 ds/dt = pIl tratto di curva ds = v02 + 2gu(x), dove g `e l’accelerazione di gravit` a. Ne segue che il tempo T impiegato _ a percorrere l’arco AB `e assegnato dalla formula seguente8 : Z x1 p 1 + u0 (x)2 p dx. (2.1) T = T [u] = v02 + 2gu(x) 0 la conservazione dell’energia meccanica (cinetica + potenziale) abbiamo: 12 mv02 mgu(0) = massa m del punto materiale). 0, l’integrale in (2.1) ` e da intendersi in senso improprio, essendo u(0) = 0. 7 Per

1 mv(x)2 mgu(x) da cui si ricava v(x) (che non dipende dalla 2 8 Se si usa la teoria dell’integrazione di Riemann, quando v = 0

2. Elementi di calcolo delle variazioni

c 978-88-08-63708-6

513

La notazione T = T [u] indica che il tempo di percorrenza dipende dalla funzione u = u(x). Il problema consiste ora nel determinare min T [u], al variare di u tra le curve regolari che passano per i due punti A e B e per le quali l’integrale (2.1) ha senso. 2.2 Problema isoperimetrico. Si voglia determinare la figura piana di perimetro assegnato e di area massima. Per formulare analiticamente il problema supponiamo che la frontiera della figura sia una curva di Jordan regolare di equazioni parametriche x = x(t), y = y(t), t 2 [a, b]. Indichiamo con L il perimetro assegnato, ovvero la lunghezza della curva, e con A l’area da massimizzare. Ricordando la formula (1.8) del Capitolo 1 e la formula 3.11 del Capitolo 6, il problema `e: massimizzare Z 1 b (xy 0 x0 y)dt A[x, y] = 2 a al variare di tutte le curve di Jordan regolari soddisfacenti la condizione Z bp x02 + y 02 dt = L . a

Come abbiamo gi` a accennato, si tratta di un problema che rientra nella categoria dei cosiddetti problemi isoperimetrici. 2.3 Geodetiche su una superficie. Supponiamo di avere una superficie ⌃ e due punti p e q su di essa. Si chiama geodetica tra i due punti dati la curva sulla superficie che li connette e ha minima lunghezza. Se si conosce l’equazione parametrica della superficie, la ricerca delle geodetiche pu` o essere formulata nel seguente modo. Sia r = r(u, v), (u, v) 2 T , l’equazione di ⌃. Una curva su ⌃ `e allora individuata dalle equazioni u = u(t) v = v(t), t 2 [t0 , t1 ]. La sua lunghezza `e data dall’integrale della prima forma fondamentale di ⌃ calcolata su e cio`e dalla formula Z t1 p Eu02 + 2F u0 v 0 + Gv 02 dt l[u, v] = t0

dove, ricordiamo, E = hru , ru i, F = hru , rv i, G = hrv , rv i. Il problema `e allora: minimizzare l[u, v], al variare di u = u(t) e v = v(t), funzioni regolari in [t0 , t1 ] tali che r(u(t0 ), v(t0 )) = p e r(u(t1 ), v(t1 )) = q. 2.4 Sia data una membrana perfettamente elastica che in posizione di riposo occupi un dominio ⌦ del piano x, y. Supponiamo ora di deformare il bordo @⌦ della membrana in direzione parallela all’asse z, in modo cio`e che la proiezione della membrana sul piano x, y sia sempre ⌦. Si vuole determinare la nuova posizione di equilibrio assunta dalla membrana dopo la deformazione del suo bordo. Considerazioni di fisica indicano che la posizione cercata `e quella corrispondente al minimo dell’energia potenziale di deformazione.

514

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

Per formulare il problema analiticamente, supponiamo che ogni posizione della membrana coincida con il grafico di una funzione u = u(x, y), (x, y) 2 ⌦. Il bordo della membrana `e il grafico di una data funzione ' = '(x, y), con (x, y) 2 @⌦. L’energia potenziale di deformazione per una posizione u = u(x, y) `e allora assegnata dalla formula seguente ZZ ZZ 1 1 2 2 (ux + uy )dx dy = ⌧ |ru|2 dx dy (2.2) V [u] = ⌧ 2 2 ⌦ ⌦ dove ⌧ `e la tensione della membrana; l’integrale che compare nella (2.2) `e l’integrale di Dirichlet (Par. 1.6). Il problema `e allora: minimizzare V [u] al variare di u tra tutte le funzioni di classe C 1 (⌦) tali che u|@⌦ = '. 2.2 Funzionali del calcolo delle variazioni I problemi negli esempi del Paragrafo 2.1 hanno una struttura comune: `e individuato un insieme U di funzioni, dette funzioni ammissibili, sul quale `e definita un’applicazione J :U !R che prende il nome di funzionale e che costituisce l’obiettivo da ottimizzare. In altri termini, riferendosi, senza perdita di generalit` a, alla ricerca dei minimi, si vuole determinare u b 2 U in modo che (2.3)

J[b u]  J[u]

8u 2 U

Se u b verifica la (2.3) si dir` a estremante di J o, pi` u precisamente, minimante di J. In una formulazione generale di questo tipo non vi `e a priori alcuna restrizione sulla forma o sulla natura del funzionale J o della classe delle funzioni ammissibili. I funzionali tipici del CdV sono espressi mediante integrali; per esempio, se u = u(x) `e funzione di una variabile reale x, J[u] =

Z

b

f (x, u, u0 )dx;

a

il funzionale dell’Esempio 2.1 `e di questo tipo con f (x, u, u0 ) = Oppure Z b f (x, u1 , . . . , un , u01 , . . . , u0n )dx; J[u1 , . . . , un ] =

p p 1 + u02 / 2gu.

a

in questa categoriap rientrano i funzionali degli Esempi 2.2 (f (x, u1 , u2 ) = u1 u02 u01 u2 ) e 2.2 (f (x, u, v) = E(u0 )2 + 2F u0 v 0 + G(v 0 )2 ). Oppure, se u = u(x, y), ZZ f (x, y, u, ux , uy )dx dy; J[u] = ⌦

il funzionale di Dirichlet `e di questo tipo con f (x, y, ux , uy ) = u2x + u2y .

2. Elementi di calcolo delle variazioni

c 978-88-08-63708-6

515

La classe U delle funzioni ammissibili influenza profondamente la natura del problema. Essa `e determinata non solo in base al fatto ovvio che il funzionale J debba essere ben definito su U ma, in generale, anche da condizioni ulteriori. Nel problema della brachistocrona occorre che il grafico di ogni funzione ammissibile passi per i due punti assegnati A e B, mentre in quello della membrana deve avere valori bloccati su @⌦. Nei problemi isoperimetrici le funzioni di U sono soggette a vincoli integrali del tipo Z b g(x, u, u0 )dx = L. a

La formulazione (2.3) del problema di ottimizzazione non di↵erisce in linea di principio da quella data nel Capitolo 2 per le funzioni di pi` u variabili; ed infatti le questioni che, in generale, occorre a↵rontare sono le medesime: esistenza e unicit` a dei punti di estremo, loro caratterizzazione e costruzione di algoritmi di calcolo. La diversa natura dell’obiettivo che, da un certo punto di vista, pu` o essere considerato come una funzione di un numero infinito (con la potenza del continuo!) di variabili, conferisce a un problema di ottimizzazione del CdV un ordine di complessit` a molto pi` u elevato, in relazione anche alla variet` a di situazioni che si possono presentare. In questa breve introduzione ci occuperemo prevalentemente delle condizioni necessarie che i punti di estremo devono soddisfare, almeno nei casi pi` u semplici. 2.3 Variazione prima e seconda di un funzionale Ci occupiamo del problema seguente: data f : [a, b] ⇥ R ⇥ R ! R, f 2 C 1 ([a, b] ⇥ R ⇥ R), minimizzare il funzionale Z b (2.4) J[u] := f (x, u, u0 )dx a

al variare di u nella classe delle funzioni ammissibili (2.5)

U := {u 2 C 1 ([a, b]) : u(a) = A,

u(b) = B}

dove A e B sono numeri reali assegnati. Questo problema si chiama anche ad estremi fissi. Incidentalmente si noti che U `e un sottoinsieme convesso di C 1 ([a, b]). Ci proponiamo di trovare condizioni necessarie che una minimante u b di J deve soddisfare. Sia dunque (2.6)

J[b u]  J[u]

8 u 2 U.

Ogni funzione u 2 U pu` o essere scritta nella forma (2.7)

u(x) = u b(x) + h(x)

dove h 2 C 1 ([a, b]) e h(a) = h(b) = 0. Nella (2.7), u appare come somma di u b e di una sua “perturbazione” che ne lascia invariato il valore agli estremi. La funzione h, in questo caso, si chiama variazione

516

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

di u b e spesso si indica con il simbolo u b. Tale terminologia ha condotto alla locuzione “Calcolo delle Variazioni”, per significare lo studio del comportamento di un funzionale quando le funzioni da cui dipende subiscono variazioni. Si noti che il sottoinsieme di U delle variazioni ammissibili costituisce uno spazio lineare (su R). Cercando condizioni necessarie per la minimante u b ci si pu` o limitare a considerare una classe speciale di variazioni; per esempio, si pu` o fissare h 2 C 1 ([a, b]) tale che h(a) = h(b) = 0 e considerare la famiglia di variazioni u b = th, dipendente dal parametro reale t, con t variabile in un intorno I di t = 0. In corrispondenza di queste variazioni la (2.6) si particolarizza nella condizione seguente: (2.8)

J[b u]  J[b u + th]

8 t 2 I.

Pensando sempre u b e h fissati, consideriamo la funzione della sola variabile t, (t) = J[b u + th]. La (2.8) diventa (0)  (t) 8t 2 I e cio`e t = 0 `e punto di minimo per . Poich´e Z b f (x, u b + th, u b0 + th0 )dx (t) = a

1

o derivare sotto il segno di integrale; ed f `e di classe C rispetto ai suoi argomenti, si pu` pertanto (t) risulta derivabile in I e vale la formula (2.9)

0

(t) =

Z

a

b

{fu (x, u b + th, u b0 + th0 )h + fu0 (x, u b + th, u b0 + th0 )h0 }dx.

Il teorema di Fermat implica allora che (2.10)

Z

a

b

0

(0) = 0, ossia

{fu (x, u b, u b0 )h + fu0 (x, u b, u b0 )h0 }dx = 0.

La (2.10) deve dunque valere per ogni h 2 C 1 ([a, b]) con h(a) = h(b) = 0. L’argomentazione precedente conduce al seguente Rb TEOREMA 2.1 Siano f 2 C 1 ([a, b]⇥R⇥R) e J(u) = a f (x, u, u0 )dx. Se u b `e minimante di J nella classe di funzioni ammissibili U data dalla (2.5), allora vale la (2.10) per ogni h 2 C 1 ([a, b]) tale che h(a) = h(b) = 0. La condizione (2.10) acquista un significato pi` u profondo se, fissata u 2 U, si introduce il funzionale, lineare in h, (2.11)

h 7!

Z

a

b

{fu (x, u, u0 )h + fu0 (x, u, u0 )h0 }dx

definito sullo spazio vettoriale delle variazioni ammissibili di u.

2. Elementi di calcolo delle variazioni

c 978-88-08-63708-6

517

Il funzionale (2.11) prende il nome di variazione prima di J calcolata in u e si indica con il simbolo J(u) o, pi` u semplicemente, con J, se non sorgono ambiguit` a. Il Teorema 2.1 pu` o essere enunciato nella forma seguente: Se u b `e minimante per J(u), allora J(b u) = 0.

In questa forma la variazione prima appare l’analogo del di↵erenziale di una funzione e il teorema appare l’analogo del teorema di Fermat: se x 2 Rn `e punto di estremo per g : Rn ! R, allora dg(x) = 0, ovvero x `e punto critico o stazionario per g. La terminologia si estende anche ai funzionali: se J(b u) = 0, u b si dice critico o stazionario per J. Anche alcuni abusi di notazione si estendono. Come, per esempio, si scrive dg(x) = hrg(x), hi anzich´e dg(x)[h] = . . .; cos`ı `e entrato nell’uso scrivere J=

Z

a

b

{fu (· · · )h + fu0 (· · · )h0 }dx anzich´e

J[h] = . . .

OSSERVAZIONE 2.1 Il teorema di Fermat per funzioni si riferisce in realt` a a punti di estremo locale, interni al dominio della funzione. Anche nel contesto del CdV `e possibile definire la nozione di estremo locale inserendo una topologia nel dominio U del funzionale J. Nel presente caso, essendo U ⇢ C 1 ([a, b]), una topologia naturale `e quella indotta dalla metrica lagrangiana introdotta nel Capitolo 3 Paragrafo 1.1: se u1 e u2 2 U, la distanza tra u1 e u2 `e definita da d(u1 , u2 ) := max |u1 (x) x2[a,b]

u2 (x)| + max |u01 (x) x2[a,b]

u02 (x)|.

Una funzione u b 2 U `e minimante locale se esiste ⌘ > 0 tale che J[b u]  J[u] per ogni u 2 U che disti da u b per meno di ⌘. ` facile verificare che il Teorema 2.1 continua a valere inalterato per u E b minimante locale.

Naturalmente l’annullarsi della variazione prima J(b u) non `e condizione sufficiente affinch´e u b sia e↵ettivamente minimante. La ricerca di condizioni sufficienti esula dai limiti della presente trattazione. Ci limiteremo perci` o a enunciare la pi` u semplice e naturale di queste che fa intervenire la variazione seconda di J, analogo del di↵erenziale secondo per le funzioni. Se f 2 C 2 ([a, b] ⇥ R ⇥ R) e u 2 U, si definisce variazione seconda di J in u e si indica con 2 J(u), o semplicemente con 2 J, il funzionale seguente, quadratico in h Z b h 7! {fuu (x, u, u0 )h2 + 2fu0 u (x, u, u0 )hh0 + fu0 u0 (x, u, u0 )h02 }dx. a

Si noti che se f `e convessa rispetto a u, u0 la variazione seconda `e non negativa. Vale la seguente b un punto PROPOSIZIONE 2.2 Sia f = f (x, u, u0 ) di classe C 2 ([a, b] ⇥ R ⇥ R) e sia u b `e minimante per J. Se `e critico per J. Se f `e convessa rispetto a u e u0 , allora u strettamente convessa, u b `e l’unica minimante.

518

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

Dimostrazione. Sia h una variazione ammissibile. Si pu` o scrivere, usando la formula di Taylor per f rispetto a u e u0 : f (x, u b + h, u b0 + h0 ) f (x, u b, u b0 ) = fu (x, u b, u b0 )h + fu0 (x, u b, u b0 )h0 + 1 + {fuu (x, u b+b h, u b0 )h2 + 2fuu0 (x, u b+b h, u b0 + b h0 )hh0 + fu0 u0 (x, u b, u b0 + b h0 )h02 } 2

dove b h `e una variazione opportuna tra 0 e h. Essendo f convessa rispetto a u e u0 , si ha 2 J(u)[h] 0 per ogni u 2 U e ogni variazione h e perci` o: 1 2 1 u)[b h] = J(b u)[b h] 0 J[b u + h] J[b u] = J(b u)[h] + 2 J(b 2 2 che implica u b minimante. Sia f strettamente convessa e, per assurdo, esista un’altra minimante vb. Poniamo J(b u) = J(b v ) = µ e consideriamo u = (b u + vb)/2. Per la convessit` a stretta di f , si ha f (x, u, u0 ) < b(x) 6= vb(x). (f (x, u b, u b0 ) + f (x, vb, vb0 ))/2 per ogni x in cui u Per continuit` a, deve esistere un intervallo in cui questa disuguaglianza `e verificata. Integrandola tra a e b si ottiene: 1 1 1 1 u] + J[b v ] = µ + µ = µ, J[u] < J[b 2 2 2 2 contro l’ipotesi che µ `e il minimo di J.



2.4 L’equazione di Eulero La condizione di stazionariet` a di una minimante u b, espressa nel Teorema 2.1, `e equivalente a un’equazione di↵erenziale che costituisce un risultato fondamentale per il CdV. TEOREMA 2.3 Siano f e J come nel Teorema 2.1. Una funzione u b 2 U `e stazionaria b(x), u b0 (x)) `e di classe C 1 ([a, b]) e vale la seguente equazione per J se e solo se fu0 (x, u (2.12)

d b(x), u b0 (x)) fu0 (x, u dx

fu (x, u b(x), u b0 (x)) = 0

8 x 2 [a, b].

Il Teorema 2.3 esprime il fatto che, se u b `e stazionario per J, u b `e soluzione dell’equazione, nota come equazione di Eulero o Eulero-Lagrange, d fu0 (x, u, u0 ) dx

(2.13)

fu (x, u, u0 ) = 0.

Se fxu0 , fuu0 , fu0 u0 e u00 esistono, la (2.13) si pu` o scrivere nella forma esplicita seguente: fu0 u0 u00 + fuu0 u0 + fxu0

(2.14)

fu = 0

che mostra come l’equazione di Eulero sia, in generale, un’equazione di↵erenziale ordinaria del secondo ordine. Le sue soluzioni sono dette estremali. Alla dimostrazione del teorema premettiamo il seguente LEMMA 2.4 Sia g continua e integrabile in (a, b). Se Z b (2.15) g(x)h0 (x)dx = 0 a

1

per ogni h 2 C ([a, b]) tale che h(a) = h(b) = 0, allora g(x) `e costante in (a, b).

2. Elementi di calcolo delle variazioni

c 978-88-08-63708-6

519

Rx Rb Dimostrazione. Siano c = (b a) 1 a g(x)dx e h(x) = a [g(s) c]ds. Allora h 2 C 1 ([a, b]), Rb Rb Rb g(s)ds = 0. Inserendo questa h nella h(a) = 0 e h(b) = a g(s)ds c(b a) = a g(s)ds a (2.15) si trova 0=

Z

b

g(x)[g(x)

c]dx =

a

= essendo [g(x)

c]2

Z

Z

b

g(x)[g(x)

c]dx

c

a b

[g(x)

Z

b

[g(x)

c]dx =

a

c]2 dx.

a

0 e continua in (a, b) si deduce che g(x) = c per ogni x 2 (a, b).

Dimostrazione del Teorema 2.3. Sia u b 2 U. Si ha: Z Z b fu (x, u b, u b0 )h(x)dx + (2.16) J(b u) = a

Poniamo, per comodit` a: Z A(x) =

x a

fu (s, u b(s), u b0 (s))ds,

b a



fu0 (x, u b, u b0 )h0 (x)dx.

B(x) = fu0 (x, u b(x), u b0 (x)).

Integrando per parti il primo degli integrali nella (2.16), tenendo come fattore finito h(x), si scrive: Z b Z b A(x)h0 (x)dx + B(x)h0 (x)dx. J(b u) = [A(x)h(x)]ba a

a

Essendo h(a) = h(b) = 0 si ottiene (2.17)

J(b u) =

Z

b

[B(x)

A(x)]h0 (x)dx.

a

Se u b `e stazionaria, J(b u) = 0; ci` o implica, in base al Lemma 2.3, B(x) A(x) = c (costante) per ogni x 2 [a, b], ossia Z x 0 0 b(x), u b (x)) fu (s, u b(s), u b0 (s))ds = c 8 x 2 [a, b]. (2.18) fu (x, u a

0

b(s), u b (s)) continua in [a, b], il teorema fondamentale del calcolo integrale Essendo fu (s, u b(x), u b0 (x)) 2 C 1 ([a, b]); derivando la (2.18) si ottiene l’equazione di Eulero implica che fu0 (x, u (2.12). b(x), u b0 (x)) 2 C 1 ([a, b]) e vale la (2.12), per integrazione tra a e x si Se, viceversa, fu0 (x, u b(a), u b0 (a)), che, inserita nella (2.17), implica J(b u) = 0. ⇤ ottiene la (2.18) (con c = fu0 (a, u

In base al Teorema 2.3, le eventuali minimanti u b di J vanno cercate fra le estremali che soddisfano le condizioni ai limiti u(a) = A e u(b) = B. b soddisfa l’equazione esplicita (2.14). Sottolineiamo Se poi u b 2 C 2 ([a, b]), allora u che, in ogni caso, anche se u b non ha due derivate, la 2.12 ha perfettamente senso, b(x), u b0 (x)) `e derivabile in [a, b]. poich´e fu0 (x, u Una semplice condizione che assicura l’esistenza di due derivate per u b `e espressa nella seguente proposizione che ci limitiamo a enunciare. PROPOSIZIONE 2.5 Se f 2 C 2 ([a, b] ⇥ R ⇥ R), allora u b ha due derivate continue in ogni b(x), u ˆ0 (x)) > 0. punto x in cui fu0 u0 (x, u

520

CAPITOLO 7. Equazioni alle derivate parziali e Calcolo delle variazioni

c 978-88-08-63708-6

Una volta calcolate le eventuali estremali, occorre stabilire se sono e↵ettivamente estremanti. Spesso un’analisi ulteriore non `e necessaria. Infatti, in molti casi, considerazioni geometriche o fisiche indicano che il minimo del funzionale J esiste; se in questi casi esiste un’unica estremale, questa deve essere anche la minimante. Questo modo di procedere richiede tuttavia molta cautela, come mostra l’Esempio 2.5. Alternativamente si pu` o utilizzare la Proposizione 2.2: se f `e convessa come funzione di u e u0 , allora ogni estremale `e minimante. Esempio 2.5 Siano J(u) =

R1

1

(u0 )2 (1

u0 )2 dx, con

U = {u 2 C 1 ([ 1, 1]) : u( 1) = 0, Si noti che J(u) `e

0, 8 u 2 U. Si ha f (x, u, u0 ) = (u0 )2 (1 u0

(2.19)

u(1) = 1}. u0 )2 e l’equazione di Eulero

3(u0 )2 + 2(u0 )3 = costante

b(x) = da cui si ricava u0 = costante e infine, tenendo conto delle condizioni ai limiti, u (x + 1)/2. Esiste dunque un’unica estremale, che per` o non `e minimante (neppure locale). Infatti J(b u) = 1/8 mentre, se consideriamo 8 1 > > 0 1x< > > n > ◆2 < ✓ 1 n 1 1 un (x) = x+ x > 4 n n n > > > 1 > :x