Curso de Física-Matemática

  • Author / Uploaded
  • USP

Citation preview

Universidade de S˜ ao Paulo Instituto de F´ısica Departamento de F´ısica Matem´atica 2005

Curso de F´ısica-Matem´ atica Jo˜ao Carlos Alves Barata

Vers˜ao de 29 de setembro de 2005

Estas notas ou sua vers˜ao mais recente podem ser encontradas no seguinte endere¸co WWW: http://denebola.if.usp.br/∼jbarata/Notas de aula

Pref´ acio

15

Nota¸ c˜ ao e Advertˆ encias

17

´Indice I

Cap´ıtulos Introdut´ orios

20

1 No¸ co ˜es B´ asicas

21

1.1 Conjuntos, Rela¸co˜es e Fun¸co˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

1.1.1

Rela¸co˜es e Fun¸co˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

1.1.2

Rela¸co˜es de Ordem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

1.1.3

Cardinalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´Infimos e Supremos de Fam´ılias de Conjuntos . . . . . . . . . . . . . . . . . . .

37 43

1.2 Estruturas Alg´ebricas B´asicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

45

1.1.4 1.2.1

Semi-grupos, Mon´oides e Grupos . . . . . . . . . . . . . . . . . . . . . . . . . .

46

1.2.2

Corpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

1.2.3

55

1.2.4

Espa¸cos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ An´eis, Algebras e M´odulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2.5

Mais sobre An´eis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

1.2.6

A¸co˜es e Representa¸co˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

1.2.7

Morfismos, Homomorfismos, Epimorfismos, Isomorfismos, Monomorfismos, Endomorfismos e Automorfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . .

65

1.3 Cosets, Sub-Grupos Normais e o Grupo Quociente. O Centro de um Grupo . . . . . . .

67

56

1.3.1

Cosets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

67

1.3.2

Subgrupos Normais e o Grupo Quociente . . . . . . . . . . . . . . . . . . . . . .

69

1.3.3

O Centro de um Grupo. Centralizadores e Normalizadores . . . . . . . . . . . .

71

1.4 O Produto Direto e o Produto Semi-Direto de Grupos . . . . . . . . . . . . . . . . . . .

73

1.5 Somas Diretas e Produtos Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

1.5.1

Discuss˜ao Informal Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

1.5.2

Grupos Gerados por Conjuntos. Grupos Gerados por Rela¸co˜es . . . . . . . . . .

79

1.5.3

Somas Diretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

80

1.5.4

Produtos Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

81

1.5.5

Produtos Diretos e Somas Diretas Arbitr´arios . . . . . . . . . . . . . . . . . . .

83

1.5.6

M´odulos e Deriva¸co˜es

84

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

3/1304

1.6 T´opicos Especiais

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

1.6.1

O Grupo de Grothendieck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

1.6.2

Grup´oides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

87

1.6.3

Quat´ernions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

88

2 Espa¸ cos Vetoriais

94

2.1 Espa¸cos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

94

2.1.1

Sub-Espa¸cos e Espa¸cos Quocientes . . . . . . . . . . . . . . . . . . . . . . . . .

94

2.1.2

Bases Alg´ebricas de um Espa¸co Vetorial . . . . . . . . . . . . . . . . . . . . . .

95

2.1.3

O Dual Alg´ebrico de um Espa¸co Vetorial

. . . . . . . . . . . . . . . . . . . . . 101

2.2 Formas Lineares, Sesquilineares e Produtos Escalares em Espa¸cos Vetoriais . . . . . . . 108 2.2.1

Formas Multilineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

2.2.2

Formas Sesquilineares e as Desigualdades de Cauchy-Schwarz e Minkowski . . . 113

2.2.3

Produtos Escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

2.2.4

Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

2.3 Normas em Espa¸cos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 2.4 Formas Bilineares e Sesquilineares em Espa¸cos de Dimens˜ao Finita

. . . . . . . . . . . 128

2.5 Estruturas Complexas sobre Espa¸cos Vetoriais Reais . . . . . . . . . . . . . . . . . . . . 132

II

´ T´ opicos de Algebra Linear

´ 3 T´ opicos de Algebra Linear I

141 142

3.1 Rudimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 3.2 No¸co˜es B´asicas sobre o Espectro de uma Matriz . . . . . . . . . . . . . . . . . . . . . . 147 3.2.1

O Tra¸co de uma Matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

3.3 Polinˆomios de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 3.3.1

O Teorema de Hamilton-Cayley . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

3.4 Matrizes Diagonaliz´aveis e o Teorema Espectral . . . . . . . . . . . . . . . . . . . . . . 162 3.4.1

Diagonaliza¸ca˜o Simultˆanea de Matrizes . . . . . . . . . . . . . . . . . . . . . . . 176

3.5 Matrizes Auto-adjuntas, Normais e Unit´arias . . . . . . . . . . . . . . . . . . . . . . . . 180 3.5.1

Matrizes Positivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

3.6 Matrizes Triangulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 3.7 O Teorema de Decomposi¸ca˜o de Jordan e a Forma Canˆonica de Matrizes . . . . . . . . 191 3.7.1

Resultados Preparat´orios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

4/1304

3.7.2

O Teorema da Decomposi¸ca˜o de Jordan

. . . . . . . . . . . . . . . . . . . . . . 198

3.7.3

Matrizes Nilpotentes e sua Representa¸ca˜o Canˆonica . . . . . . . . . . . . . . . . 201

3.7.4

A Forma Canˆonica de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . 205

3.8 Algumas Representa¸co˜es Especiais de Matrizes . . . . . . . . . . . . . . . . . . . . . . . 207 3.8.1

A Decomposi¸ca˜o Polar de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . 207

3.8.2

O Teorema da Triangulariza¸ca˜o de Schur . . . . . . . . . . . . . . . . . . . . . . 210

3.8.3

A Decomposi¸ca˜o QR e a Decomposi¸ca˜o de Iwasawa (“KAN”) . . . . . . . . . . 212

3.9 Propriedades Especiais de Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . 215 3.9.1

Expans˜ao do Polinˆomio Caracter´ıstico . . . . . . . . . . . . . . . . . . . . . . . 215

3.9.2

A Desigualdade de Hadamard . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216

3.10 Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 ´ 4 T´ opicos de Algebra Linear II

222

4.1 Uma Topologia M´etrica em Mat ( , n) . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 4.2 Exponenciais, Logaritmos e Fun¸co˜es Anal´ıticas de Matrizes . . . . . . . . . . . . . . . . 228 4.2.1

A Exponencia¸ca˜o de Matrizes e os Grupos GL( , n) e GL( , n) . . . . . . . . 236 

4.3 A F´ormula de Lie-Trotter e a F´ormula do Comutador . . . . . . . . . . . . . . . . . . . 239 4.4 Aplica¸co˜es Lineares em Mat ( , n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 4.5 A F´ormula de Baker, Campbell e Hausdorff . . . . . . . . . . . . . . . . . . . . . . . . 248 4.6 A F´ormula de Duhamel e Algumas de suas Conseq¨ uˆencias . . . . . . . . . . . . . . . . 254

III

Equa¸ co ˜es Diferenciais

259

5 Equa¸ co ˜es Diferenciais Ordin´ arias. Uma Introdu¸ c˜ ao

260

5.1 Defini¸ca˜o e Alguns Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261 5.1.1

Equa¸co˜es Diferenciais Ordin´arias Lineares . . . . . . . . . . . . . . . . . . . . . 263

5.1.2

Equa¸co˜es Ordin´arias de Segunda Ordem. Exemplos de Interesse . . . . . . . . . 267

5.2 Sistemas de Equa¸co˜es Diferenciais Ordin´arias

. . . . . . . . . . . . . . . . . . . . . . . 269

5.3 Discuss˜ao sobre Problemas de Valor Inicial . . . . . . . . . . . . . . . . . . . . . . . . . 274 5.3.1

Problemas de Valor Inicial. Patologias e Exemplos a se Ter em Mente . . . . . . 276

5.3.2

Teoremas de Existˆencia e Unicidade de Solu¸co˜es . . . . . . . . . . . . . . . . . . 280

5.3.3

Solu¸co˜es Globais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

5.3.4

Dependˆencia Cont´ınua de Condi¸co˜es Iniciais e de Parˆametros . . . . . . . . . . . 284

5/1304

6 Alguns M´ etodos de Resolu¸ c˜ ao de Equa¸ co ˜es Diferenciais Ordin´ arias

286

6.1 Solu¸ca˜o de Equa¸co˜es Ordin´arias Lineares de Primeira Ordem . . . . . . . . . . . . . . . 286 6.2 As Equa¸co˜es de Bernoulli e de Riccati . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 6.3 Integra¸ca˜o de Equa¸co˜es Separ´aveis

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290

6.4 O M´etodo de Varia¸ca˜o de Constantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 6.5 O M´etodo de Substitui¸ca˜o de Pr¨ ufer . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293 6.6 O M´etodo de Invers˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 6.7 Solu¸ca˜o de Equa¸co˜es Exatas e o M´etodo dos Fatores Integrantes . . . . . . . . . . . . . 296 6.8 Solu¸co˜es das Equa¸co˜es de D’Alembert-Lagrange e Clairaut . . . . . . . . . . . . . . . . 301 7 Sistemas de Equa¸ co ˜es Diferenciais Ordin´ arias Lineares

306

7.1 Introdu¸ca˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307 7.2 Unicidade e Existˆencia de Solu¸co˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308 7.2.1

Unicidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308

7.2.2

Existˆencia. A S´erie de Dyson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311

7.2.3

Propriedades de D(s, t) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316

7.3 Equa¸co˜es com Coeficientes Constantes . . . . . . . . . . . . . . . . . . . . . . . . . . . 320 7.3.1

Alguns Exemplos e Aplica¸co˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322

7.4 Teoria de Perturba¸co˜es de Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . . 327 7.5 Mais sobre a S´erie de Dyson. Produtos de Tempo Ordenado . . . . . . . . . . . . . . . 330 7.6 Sistemas de Equa¸co˜es Diferenciais Lineares no Plano Complexo . . . . . . . . . . . . . 333 7.6.1

O Caso Anal´ıtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334

7.6.2

Resolu¸ca˜o por S´eries de Potˆencias . . . . . . . . . . . . . . . . . . . . . . . . . . 340

7.6.3

Sistemas com Pontos Singulares. Monodromia . . . . . . . . . . . . . . . . . . . 342

7.6.4

Sistemas com Pontos Singulares Simples . . . . . . . . . . . . . . . . . . . . . . 352

7.7 Sistemas Provenientes de EDOs de Ordem m . . . . . . . . . . . . . . . . . . . . . . . . 357 7.7.1

Pontos Singulares Simples em EDO’s de Ordem m . . . . . . . . . . . . . . . . . 358

7.7.2

Singularidades no Infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362

7.7.3

Alguns Exemplos de Interesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364

7.8 Equa¸co˜es Fuchsianas. S´ımbolos de Riemann . . . . . . . . . . . . . . . . . . . . . . . . 370 7.8.1

Equa¸co˜es Fuchsianas de Primeira Ordem . . . . . . . . . . . . . . . . . . . . . . 370

7.8.2

Equa¸co˜es Fuchsianas de Segunda Ordem . . . . . . . . . . . . . . . . . . . . . . 375

7.8.3

S´ımbolos de Riemann. Simetrias de Equa¸co˜es Fuchsianas de Segunda Ordem . . 382

7.9 Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389

6/1304

8 Solu¸ co ˜es de Equa¸ co ˜es Diferenciais Ordin´ arias Lineares no Plano Complexo

394

8.1 Solu¸co˜es em S´eries de Potˆencias para Equa¸co˜es Regulares . . . . . . . . . . . . . . . . . 395 8.1.1

A Equa¸ca˜o do Oscilador Harmˆonico Simples . . . . . . . . . . . . . . . . . . . . 396

8.1.2

A Equa¸ca˜o de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398

8.1.3

A Equa¸ca˜o de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401

8.1.4

A Equa¸ca˜o de Airy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404

8.1.5

A Equa¸ca˜o de Chebyshev

8.1.6

O Caso de Equa¸co˜es Regulares Gerais . . . . . . . . . . . . . . . . . . . . . . . . 409

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406

8.2 Solu¸ca˜o de Equa¸co˜es Singulares Regulares. O M´etodo de Frobenius . . . . . . . . . . . 411 8.2.1

Equa¸co˜es Singulares Regulares. O Caso Geral . . . . . . . . . . . . . . . . . . . 415

8.2.2

A Equa¸ca˜o de Euler Revisitada . . . . . . . . . . . . . . . . . . . . . . . . . . . 424

8.2.3

A Equa¸ca˜o de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427

8.2.4

Equa¸co˜es Relacionadas a` de Bessel. A Equa¸ca˜o de Bessel Esf´erica . . . . . . . . 438

8.2.5

A Equa¸ca˜o de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441

8.2.6

A Equa¸ca˜o Hipergeom´etrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443

8.2.7

A Equa¸ca˜o Hipergeom´etrica Confluente . . . . . . . . . . . . . . . . . . . . . . . 447

8.3 Algumas Equa¸co˜es Associadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450 8.3.1

A Equa¸ca˜o de Legendre Associada

. . . . . . . . . . . . . . . . . . . . . . . . . 450

8.3.2

A Equa¸ca˜o de Laguerre Associada . . . . . . . . . . . . . . . . . . . . . . . . . . 452

8.4 A Fun¸ca˜o Gama. Defini¸ca˜o e Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . 453 8.A Prova da Proposi¸ca˜o 8.1. Justificando os Polinˆomios de Legendre

. . . . . . . . . . . . 470

8.B Provando (8.14) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472 8.C Justificando os Polinˆomios de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . 474 8.D Provando (8.20) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476 8.E Porque λ deve ser um Inteiro Positivo na Equa¸ca˜o de Laguerre . . . . . . . . . . . . . . 477 8.6 Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480 9 Propriedades de Algumas Fun¸ co ˜es Especiais

483

9.1 Discuss˜ao Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483 9.1.1

Defini¸co˜es e Considera¸co˜es Preliminares . . . . . . . . . . . . . . . . . . . . . . . 484

9.1.2

Rela¸co˜es de Ortogonalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486

9.1.3

F´ormulas de Rodrigues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488

9.1.4

Fun¸co˜es Geratrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 491

9.2 Propriedades de Algumas Fun¸co˜es Especiais . . . . . . . . . . . . . . . . . . . . . . . . 495

7/1304

9.2.1

Propriedades dos Polinˆomios de Legendre . . . . . . . . . . . . . . . . . . . . . . 495

9.2.2

Propriedades dos Polinˆomios de Legendre Associados. Harmˆonicos Esf´ericos . . 501

9.2.3

Propriedades dos Polinˆomios de Hermite . . . . . . . . . . . . . . . . . . . . . . 511

9.2.4

Propriedades dos Polinˆomios de Laguerre . . . . . . . . . . . . . . . . . . . . . . 515

9.2.5

Propriedades dos Polinˆomios de Laguerre Associados . . . . . . . . . . . . . . . 519

9.2.6

Propriedades das Fun¸co˜es de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . 522

9.2.7

Propriedades das Fun¸co˜es de Bessel Esf´ericas . . . . . . . . . . . . . . . . . . . . 537

9.A Provando (9.44) a` For¸ca Bruta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541 9.2 Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543 10 Alguns Problemas Selecionados de Interesse F´ısico

544

10.1 As Equa¸co˜es de Helmholtz e de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . 544 10.1.1 Problemas em Duas Dimens˜oes em Coordenadas Polares . . . . . . . . . . . . . 546 10.1.2 Problemas em Trˆes Dimens˜oes em Coordenadas Esf´ericas . . . . . . . . . . . . . 549 10.2 O Problema da Corda Vibrante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553 10.2.1 Corda Vibrante Homogˆenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553 10.2.2 O Problema da Corda Homogˆenea Pendurada . . . . . . . . . . . . . . . . . . . 556 10.2.3 Corda Vibrante N˜ao-Homogˆenea . . . . . . . . . . . . . . . . . . . . . . . . . . . 560 10.3 O Problema da Membrana Circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564 10.4 O Oscilador Harmˆonico na Mecˆanica Quˆantica e a Equa¸ca˜o de Hermite . . . . . . . . . 567 ´ 10.5 O Atomo de Hidrogˆenio e a Equa¸ca˜o de Laguerre Associada . . . . . . . . . . . . . . . 568 10.6 Propaga¸ca˜o de Ondas em Tanques Cil´ındricos . . . . . . . . . . . . . . . . . . . . . . . 571 10.7 Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 582 11 Rudimentos da Teoria das Equa¸ co ˜es Diferenciais Parciais

586

11.1 Defini¸ca˜o e Alguns Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586 11.2 O M´etodo de Separa¸ca˜o de Vari´aveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 587 11.3 Unicidade de Solu¸co˜es de Equa¸co˜es Diferenciais Parciais

. . . . . . . . . . . . . . . . . 590

11.3.1 Casos Simples. Discuss˜ao Preliminar . . . . . . . . . . . . . . . . . . . . . . . . 590 11.3.2 Unicidade de Solu¸co˜es. Generaliza¸co˜es . . . . . . . . . . . . . . . . . . . . . . . 597 12 Introdu¸ c˜ ao ao Problema de Sturm-Liouville

606

12.1 Introdu¸ca˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607 12.2 O Problema de Sturm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 611

8/1304

12.2.1 Resolvendo o Problema de Sturm. A Fun¸ca˜o de Green . . . . . . . . . . . . . . 612 12.2.2 O Teorema de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615 12.3 O Problema de Sturm-Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 617 12.4 Propriedades B´asicas dos Autovalores e das Autofun¸co˜es de Problemas de Sturm-Liouville619 12.4.1 Realidade dos Autovalores. Ortogonalidade de Autofun¸co˜es . . . . . . . . . . . . 619 12.4.2 A Simplicidade dos Autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . . 622 12.4.3 Condi¸co˜es Suficientes para a Positividade dos Autovalores . . . . . . . . . . . . 623 12.5 A Equa¸ca˜o Integral de Fredholm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627 12.6 Uma Aplica¸ca˜o do Problema de Sturm-Liouville . . . . . . . . . . . . . . . . . . . . . . 630 12.7 O M´etodo dos Determinantes de Fredholm . . . . . . . . . . . . . . . . . . . . . . . . . 634 12.7.1 A Equa¸ca˜o Integral de Fredholm Linear N˜ao-Homogˆenea . . . . . . . . . . . . . 634 12.7.2 A Equa¸ca˜o Integral de Fredholm Linear Homogˆenea . . . . . . . . . . . . . . . . 638 12.8 Coment´arios Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 640 12.8.1 O Problema de Sturm-Liouville Singular . . . . . . . . . . . . . . . . . . . . . . 640 12.A Prova do Teorema 12.1. Existˆencia e Unicidade . . . . . . . . . . . . . . . . . . . . . . 643 12.B Prova da Proposi¸ca˜o 12.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644 12.C Coment´ario Sobre o Determinante Wronskiano . . . . . . . . . . . . . . . . . . . . . . . 646 12.D Ausˆencia de Autovalores em um Problema Singular . . . . . . . . . . . . . . . . . . . . 647 12.E Demonstra¸ca˜o do Teorema 12.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 648 12.F Prova da Desigualdade (12.E.22) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 652 12.G Obtendo os Determinantes de Fredholm . . . . . . . . . . . . . . . . . . . . . . . . . . . 654 12.8 Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661

IV

Grupos

665

13 Grupos. Alguns Exemplos

666

13.1 O Grupo de Permuta¸co˜es

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667

13.1.1 Ciclos, Transposi¸co˜es e Transposi¸co˜es Elementares . . . . . . . . . . . . . . . . . 668 13.2 Alguns Grupos Matriciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673 13.2.1 Os Grupos GL(n) e SL(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673 13.2.2 O Grupo de Borel e o Grupo de Heisenberg . . . . . . . . . . . . . . . . . . . . 676 13.2.3 Grupos Associados a Formas Bilineares e Sesquilineares . . . . . . . . . . . . . . 682 13.2.4 Os Grupos Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684

9/1304

13.2.5 Os Grupos Unit´arios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 685 13.3 Os Grupos SO(2), SO(3), SU(2) e SL( , 2)

. . . . . . . . . . . . . . . . . . . . . . . . 686

13.3.1 Os Grupos SO(2), O(2), SO(1, 1) e O(1, 1) . . . . . . . . . . . . . . . . . . . . . 686 13.3.2 O Grupo SO(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 690 13.3.3 O Grupo SU(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 698 13.3.4 A Rela¸ca˜o entre SO(3) e SU(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . 701 13.3.5 O Grupo SL( , 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 704 13.4 Generalidades sobre os grupos SU(n) e SO(n) . . . . . . . . . . . . . . . . . . . . . . . 705 13.4.1 Os Grupos SU(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 706 13.4.2 O Grupo SU(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 709 13.4.3 Os Grupos SO(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 710 13.5 O Grupo Afim e o Grupo Euclidiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 715 13.6 O Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 719 13.6.1 O Espa¸co-Tempo, a No¸ca˜o de Intervalo e a Estrutura Causal . . . . . . . . . . . 720 13.6.2 A Invariˆancia do Intervalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 726 13.6.3 O Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 729 13.6.4 Alguns Sub-Grupos do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . 730 13.6.5 A Estrutura do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . 734 13.6.6 Os Geradores do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . 738 13.7 O Grupo de Poincar´e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 742 13.8 SL( , 2) e o Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 745 13.A Prova do Teorema 13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 754 13.B Um Isomorfismo entre SL( , 2)/{ , − } e L↑+ . . . . . . . . . . . . . . . . . . . . . . . 764 ´ 14 Grupos de Lie e Algebras de Lie. Uma Breve Introdu¸ c˜ ao

772

14.1 Variedades e Grupos de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 773 14.2 Breves Considera¸co˜es sobre Grupos Topol´ogicos . . . . . . . . . . . . . . . . . . . . . . 775 14.3 Grupos de Lie Matriciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 778 14.3.1 Uma Topologia M´etrica em GL( , n) . . . . . . . . . . . . . . . . . . . . . . . . 778 14.3.2 O Grupo de Lie GL( , n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779 14.3.3 Sub-Grupos Uniparam´etricos e seus Geradores . . . . . . . . . . . . . . . . . . . 782 ´ 14.3.4 Sub-Grupos Uniparam´etricos e Algebras de Lie . . . . . . . . . . . . . . . . . . 785 14.3.5 Subgrupos Fechados de GL( , n) . . . . . . . . . . . . . . . . . . . . . . . . . . 790 ´ 14.4 A Rela¸ca˜o entre Grupos de Lie Matriciais e suas Algebras de Lie . . . . . . . . . . . . . 794

10/1304

´ 14.4.1 Algebras de Lie Nilpotentes, Sol´ uveis, Simples e Semi-Simples . . . . . . . . . . 795 ´ 14.4.2 Quest˜oes sobre a Exponencia¸ca˜o de Algebras de Lie . . . . . . . . . . . . . . . . 799 14.4.3 Alguns Exemplos Especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 802 15 Uma Breve Introdu¸ c˜ ao ` a Teoria das Representa¸ co ˜es de Grupos

808

15.1 Representa¸co˜es de Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 808 15.2 Representa¸co˜es Irredut´ıveis de SO(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 815 15.3 A Medida de Haar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 819 15.4 Representa¸co˜es de Grupos Compactos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 821 15.5 O Teorema de Peter-Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 822

V

Topologia Geral, Teoria da Medida e Integra¸ c˜ ao

16 Espa¸ cos M´ etricos

828 829

16.1 M´etricas e Espa¸cos M´etricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 831 16.2 Topologia de Espa¸cos M´etricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 845 16.3 Pseudo-M´etricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 848 16.4 Espa¸cos de Banach e de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 850 16.4.1 Espa¸cos de Seq¨ uˆencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 852 16.A Algumas Desigualdades B´asicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 866 16.B N´ umeros reais e p-´adicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 868 16.C Aproxima¸co˜es para π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 875 17 O Teorema do Ponto Fixo de Banach e Algumas de Suas Conseq¨ uˆ encias

881

17.1 O Teorema de Ponto Fixo de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 882 17.1.1 Aplica¸ca˜o a Equa¸co˜es Num´ericas. O M´etodo de Newton . . . . . . . . . . . . . 884 17.1.2 Uma Generaliza¸ca˜o do Teorema de Ponto Fixo de Banach . . . . . . . . . . . . 888 17.2 As Equa¸co˜es Integrais de Fredholm e de Volterra

. . . . . . . . . . . . . . . . . . . . . 889

17.3 Aplica¸co˜es a` Teoria das Equa¸co˜es Diferenciais Ordin´arias . . . . . . . . . . . . . . . . . 897 17.3.1 O Teorema de Picard-Lindel¨of . . . . . . . . . . . . . . . . . . . . . . . . . . . . 897 17.3.2 Generalizando o Teorema de Picard-Lindel¨of. Solu¸co˜es Globais . . . . . . . . . . 902 17.3.3 Um Teorema de Compara¸ca˜o de Solu¸co˜es de EDO’s . . . . . . . . . . . . . . . . 903 17.4 O Teorema da Fun¸ca˜o Impl´ıcita e o Teorema da Fun¸ca˜o Inversa . . . . . . . . . . . . . 907 17.4.1 O Teorema da Fun¸ca˜o Impl´ıcita . . . . . . . . . . . . . . . . . . . . . . . . . . . 907

11/1304

17.4.2 O Teorema da Fun¸ca˜o Inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 912 17.A O Lema de Gr¨onwall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 913 18 Espa¸ cos Topol´ ogicos e Espa¸ cos Mensur´ aveis. Defini¸ co ˜es e Propriedades B´ asicas

914

18.1 Defini¸co˜es, Propriedades Elementares e Exemplos . . . . . . . . . . . . . . . . . . . . . 915 18.2 Algumas Constru¸co˜es Especiais e Exemplos

. . . . . . . . . . . . . . . . . . . . . . . . 920

18.2.1 Topologias e σ-´algebras Geradas . . . . . . . . . . . . . . . . . . . . . . . . . . . 920 18.2.2 Bases de Espa¸cos Topol´ogicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 924 18.2.3 Topologias e σ-´algebras Induzidas . . . . . . . . . . . . . . . . . . . . . . . . . . 930 18.2.4 Topologias e σ-´algebras Produto . . . . . . . . . . . . . . . . . . . . . . . . . . . 932 18.3 Interior e Fecho de Conjuntos em Espa¸cos Topol´ogicos . . . . . . . . . . . . . . . . . . 932 18.3.1 Fecho de Conjuntos em Espa¸cos M´etricos . . . . . . . . . . . . . . . . . . . . . . 936 19 Medidas

938

19.1 O Problema da Teoria da Medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 938 19.2 Medidas de Conjuntos. Defini¸ca˜o, Exemplos e Propriedades B´asicas . . . . . . . . . . . 941 19.3 Construindo Medidas. A Medida Exterior e o Teorema de Caratheodory . . . . . . . . 945 20 A Medida de Lebesgue

954

20.1 A Constru¸ca˜o da Medida de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . 954 20.1.1 A σ-´algebra de Borel em 

e a Medida de Borel-Lebesgue . . . . . . . . . . . . 957

20.1.2 A Medida Produto e a Medida de Lebesgue em

n 

. . . . . . . . . . . . . . . . 960

20.2 Conjuntos de Cantor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 961 20.3 Bases de Hamel e a Medida de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . 973 21 Convergˆ encia, Pontos Limite e Pontos de Acumula¸ c˜ ao em Espa¸ cos Topol´ ogicos

978

21.1 Primeiras Defini¸co˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 978 21.2 Espa¸cos Hausdorff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 980 21.3 O Limite do ´Infimo e o Limite do Supremo . . . . . . . . . . . . . . . . . . . . . . . . . 981 21.4 Redes e o Caso de Espa¸cos Topol´ogicos Gerais . . . . . . . . . . . . . . . . . . . . . . . 986 21.4.1 Redes em Espa¸cos M´etricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 988 22 Continuidade de Fun¸ co ˜es em Espa¸ cos Topol´ ogicos

990

22.1 Fun¸co˜es Cont´ınuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 990 22.2 Outras Caracteriza¸co˜es do Conceito de Continuidade em Espa¸cos Topol´ogicos . . . . . . 993

12/1304

22.2.1 Continuidade e Convergˆencia

. . . . . . . . . . . . . . . . . . . . . . . . . . . . 994

23 Elementos da Teoria da Integra¸ c˜ ao

997

23.1 Coment´arios Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 998 23.2 A Integra¸ca˜o no Sentido de Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1000 23.2.1 A Integral de Riemann Impr´opria . . . . . . . . . . . . . . . . . . . . . . . . . . 1009 23.2.2 Diferencia¸ca˜o e Integra¸ca˜o em Espa¸cos de Banach . . . . . . . . . . . . . . . . . 1011 23.3 A Integra¸ca˜o no Sentido de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1016 23.3.1 Fun¸co˜es Mensur´aveis e Fun¸co˜es Simples . . . . . . . . . . . . . . . . . . . . . . . 1017 23.3.2 A Integral de Lebesgue. Integra¸ca˜o em Espa¸cos Mensur´aveis . . . . . . . . . . . 1023 23.3.3 A Integral de Lebesgue e sua Rela¸ca˜o com a de Riemann . . . . . . . . . . . . . 1032 23.3.4 Teoremas B´asicos sobre Integra¸ca˜o e Convergˆencia . . . . . . . . . . . . . . . . . 1035 23.3.5 Alguns Resultados de Interesse . . . . . . . . . . . . . . . . . . . . . . . . . . . 1038 23.4 Os Espa¸cos Lp e Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1040 23.4.1 As Desigualdades de H¨older e de Minkowski . . . . . . . . . . . . . . . . . . . . 1043 23.4.2 O Teorema de Riesz-Fischer. Completeza . . . . . . . . . . . . . . . . . . . . . . 1047 23.A Demonstra¸ca˜o da Proposi¸ca˜o 23.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1048 23.B Caracteriza¸co˜es e Propriedades de Fun¸co˜es Mensur´aveis . . . . . . . . . . . . . . . . . . 1049 23.C Prova do Lema 23.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1055 23.D Demonstra¸ca˜o de (23.22) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1056 23.E A Equivalˆencia das Defini¸co˜es (23.23) e (23.24)

. . . . . . . . . . . . . . . . . . . . . . 1057

23.F Prova do Teorema da Convergˆencia Mon´otona . . . . . . . . . . . . . . . . . . . . . . . 1059 23.G Prova do Lema de Fatou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1060 23.H Prova do Teorema da Convergˆencia Dominada . . . . . . . . . . . . . . . . . . . . . . . 1061 23.I Prova dos Teoremas 23.2 e 23.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1062 23.J Prova das Desigualdades de H¨older e Minkowski . . . . . . . . . . . . . . . . . . . . . . 1065 23.K Prova do Teorema de Riesz-Fischer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1067 24 Alguns T´ opicos Especiais em Topologia e An´ alise

1070

24.1 Uma Coletˆanea de Defini¸co˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1070 24.2 A No¸ca˜o de Topologia Fraca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1076 24.3 A Topologia Produto de Espa¸cos Topol´ogicos

. . . . . . . . . . . . . . . . . . . . . . . 1077

24.4 O Teorema da Categoria de Baire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1079 24.5 Aproxima¸ca˜o de Fun¸co˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1080

13/1304

24.5.1 Aproxima¸ca˜o de Fun¸co˜es Cont´ınuas por Polinˆomios . . . . . . . . . . . . . . . . 1080

VI

An´ alise Funcional

1087

25 No¸ co ˜es B´ asicas Sobre Espa¸ cos de Hilbert

1088

25.1 Aspectos Topol´ogicos B´asicos de Espa¸cos de Hilbert . . . . . . . . . . . . . . . . . . . . 1088 25.2 Aspectos Geom´etricos B´asicos de Espa¸cos de Hilbert . . . . . . . . . . . . . . . . . . . 1090 25.2.1 Bases Ortonormais Completas em Espa¸cos de Hilbert . . . . . . . . . . . . . . . 1095 25.3 Funcionais Lineares e o Dual Topol´ogico de um Espa¸co de Hilbert . . . . . . . . . . . . 1109 25.3.1 O Teorema da Representa¸ca˜o de Riesz . . . . . . . . . . . . . . . . . . . . . . . 1110 26 Operadores Lineares Limitados em Espa¸ cos de Banach e de Hilbert

1113

26.1 Operadores Lineares em Espa¸cos Vetoriais Normados . . . . . . . . . . . . . . . . . . . 1115 26.1.1 Espa¸cos de Banach de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . 1119 26.1.2 O Dual Topol´ogico de um Espa¸co de Banach . . . . . . . . . . . . . . . . . . . . 1123 26.1.3 O Teorema de Hahn-Banach e Algumas Conseq¨ uˆencias do Mesmo . . . . . . . . 1127 26.1.4 O Teorema de Banach-Steinhaus ou Princ´ıpio de Limita¸ca˜o Uniforme . . . . . . 1133 26.1.5 O Teorema da Aplica¸ca˜o Aberta e o Teorema do Gr´afico Fechado . . . . . . . . 1134 26.2 Operadores Limitados em Espa¸cos de Hilbert

. . . . . . . . . . . . . . . . . . . . . . . 1142

26.2.1 O Adjunto de um Operador em um Espa¸co de Hilbert . . . . . . . . . . . . . . . 1144 ´ ´ 26.3 Algebras de Banach e Algebras C∗ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1152 ´ 26.3.1 Algebras de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1152 26.3.2 A Inversa de Operadores Limitados . . . . . . . . . . . . ´ 26.3.3 O Espectro de Operadores em Algebras de Banach . . . ´ 26.3.4 O Homomorfismo de Gelfand em Algebras C∗ . . . . . . ´ 26.3.5 Ra´ızes Quadradas de Operadores em Algebras de Banach

. . . . . . . . . . . . . 1155 . . . . . . . . . . . . . 1161 . . . . . . . . . . . . . 1171 . . . . . . . . . . . . . 1174

´ 26.3.6 Elementos Positivos de Algebras C∗ . . . . . . . . . . . . . . . . . . . . . . . . . 1175 26.3.7 O Lema da Raiz Quadrada em espa¸cos de Hilbert. A Decomposi¸ca˜o Polar . . . 1179 ´ 26.4 Um Pouco sobre Estados e Representa¸co˜es de Algebras C∗ . . . . . . . . . . . . . . . . 1183 26.5 O Espectro de Operadores em Espa¸cos de Banach . . . . . . . . . . . . . . . . . . . . . 1193 26.6 Operadores Compactos em Espa¸cos de Banach e de Hilbert . . . . . . . . . . . . . . . . 1202 26.6.1 O Teorema Espectral para Operadores Compactos Auto-adjuntos . . . . . . . . 1215 26.7 O Teorema Espectral para Operadores Limitados Auto-adjuntos em Espa¸cos de Hilbert 1223 26.7.1 O C´alculo Funcional Cont´ınuo e o Homomorfismo de Gelfand

. . . . . . . . . . 1223

14/1304

26.7.2 Generalizando o C´alculo Funcional Cont´ınuo. As Medidas Espectrais . . . . . . 1225 26.7.3 Medidas com Valores em Proje¸co˜es Ortogonais . . . . . . . . . . . . . . . . . . . 1235 26.7.4 Os Projetores Espectrais e o Teorema Espectral . . . . . . . . . . . . . . . . . . 1240 26.7.5 A Relevˆancia do Teorema Espectral para a F´ısica Quˆantica (um pouco de F´ısica, finalmente) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1244 26.A Prova do Teorema 26.18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1253 27 No¸ co ˜es de Estruturas Alg´ ebricas 1257 ´ 27.1 Algebras Universais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1258 ´ ´ 27.2 A¸ca˜o de Uma Algebra Universal sobre uma Outra Algebra Universal (*) . . . . . . . . 1265 ´ 28 O Limite Indutivo de Algebras

1270

15/1304

Pref´ acio inten¸ca˜o b´asica destas Notas ´e fornecer a estudantes de F´ısica no¸co˜es matem´aticas importantes para uma melhor compreens˜ao de desenvolvimentos modernos da F´ısica Te´orica e da Matem´atica. De modo geral o texto ´e de leitura auto-suficiente, mas vez por outra algum estudo complementar ´e sugerido. Estas Notas, por´em, n˜ao s˜ao substituto a` leitura dos bons livros sobre os assuntos aqui tratados. Entretanto, procuramos apresentar (muitas vezes em exerc´ıcios!) o maior n´ umero poss´ıvel de exemplos e contra-exemplos para as v´arias situa¸co˜es tratadas de modo a motivar melhor defini¸co˜es e resultados, o que ´e menos comum em textos com tratamentos mais sistem´aticos. Parte do material pode ser encontrada em diversas fontes, citadas na bibliografia, mas a apresenta¸ca˜o e sua ordem s˜ao pr´oprias. H´a tamb´em nestas Notas demonstra¸co˜es do pr´oprio autor de resultados conhecidos que s˜ao, por alguma raz˜ao, dificilmente encontradas na literatura. Fazemos notar que estas notas est˜ao ainda sendo trabalhadas e alguns cap´ıtulos e se¸co˜es podem vir a ser alterados, corrigidos ou acrescidos de material. Al´em disso, novos cap´ıtulos ser˜ao escritos. O material j´a presente ´e, por´em, u ´ til a todos aqueles que queiram iniciar-se nos assuntos aqui expostos. Vers˜oes atualizadas ser˜ao colocadas na “rede” (no endere¸co acima indicado) sempre que poss´ıvel. O autor agradece a todos os que apresentarem sugest˜oes. Fabulosas somas em dinheiro s˜ao oferecidas a todos aqueles que encontrarem erros no texto. Entre os j´a aquinhoados encontram-se os Srs. Matheus Grasselli, Alexandre T. Baraviera, Marcos V. Travaglia, Daniel Augusto Cortez, Djogo F. C. Patr˜ao, Cl´eber de Mico Muramoto, Kati´ uscia Nadyne Cassemiro, Urbano Lopes Fran¸ca Junior, Gustavo Barbagallo de Oliveira, Priscila Vieira Franco Gondeck, Darielder Jesus Ribeiro, Daniel Augusto Turolla Vanzella, Leonardo Fernandes Dias da Motta, Krishnamurti Jos´e de Andrade, Pedro Tavares Paes Lopes, Diego Cortegoso Assˆencio, Fleury Jos´e de Oliveira Filho, Paulo Henrique Reimberg, Fab´ıola Diacenco Xavier e M´arcio Andr´e Prieto Apar´ıcio Lopez aos quais somos muito gratos por corre¸co˜es e sugest˜oes. As Se¸co˜es 13.B, p´agina 764, e 17.3.1, p´agina 897, foram originalmente escritas por Daniel Augusto Cortez. A Se¸ca˜o 10.6, p´agina 571, foi originalmente escrita por Andr´e M. Timpanaro, Fleury J. Oliveira e Paulo H. Reimberg. A eles dedicamos agradecimentos especiais.

Jo˜ao Carlos Alves Barata

S˜ao Paulo, 29 de setembro de 2005. Departamento de F´ısica Matem´atica do IFUSP

16/1304

“O comportamento de um f´ısico em rela¸ca ˜o a ` Matem´ atica ´e similar a de um ladr˜ ao inteligente em rela¸ca ˜o ao c´ odigo penal: ele estuda apenas o suficiente para evitar puni¸co ˜es”. I. M. Gelfand (1913-).

“A mente n˜ ao ´e um vaso a ser repleto, mas uma tocha a ser acesa”. Plutarco (46?-120).

“Talvez eu n˜ ao tenha tido ˆexito em fazer as coisas dif´ıceis tornarem-se f´ aceis, mas pelo menos eu nunca fiz um assunto f´ acil tornar-se dif´ıcil”. F. G. Tricomi (1897-1978).

“In science, self-satisfaction is death. Personal self-satisfaction is the death of the scientist. Collective self-satisfaction is the death of the research. It is restlessness, anxiety, dissatisfaction, agony of mind that nourish science”. Jacques Lucien Monod (1910-1976), in New Scientist, 1976.

“N˜ ao existe nenhuma categoria da Ciˆencia a ` qual se possa dar o nome de Ciˆencia Aplicada. O que existe s˜ ao a Ciˆencia e as aplica¸co ˜es da Ciˆencia, intimamente ligadas, como frutos a ` a ´rvore que os gerou”. Louis Pasteur (1822-1895), in “Pourquoi la France n’a pas trouv´e d’hommes sup´erieurs au moment du p´eril”, Revue Scientifique (Paris, 1871).

17/1304

Nota¸c˜ ao e Advertˆ encias Para facilitar a consulta e a leitura, listamos aqui sem muitos coment´arios um pouco da nota¸ca˜o que empregaremos nestas Notas. Se z ´e um n´ umero complexo denotaremos seu complexo conjugado por z. A nota¸ca˜o z ∗ (mais comum em textos de F´ısica) pode ocorrer mais raramente. O s´ımbolo A := B ou B =: A denota que A ´e definido pela express˜ao B. O s´ımbolo A ≡ B indica que A e B s˜ao duas nota¸co˜es distintas para o mesmo objeto. Se x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) s˜ao vetores reais com n componentes (ou seja, elementos de n ) ent˜ao definimos hx, yi := x1 y1 + · · · + xn yn . 



Trata-se do produto escalar usual em

n



.

Se x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) s˜ao vetores complexos com n componentes (ou seja, elementos de n ) ent˜ao definimos hx, yi

:= x1 y1 + · · · + xn yn . 

n

Trata-se do produto escalar usual em

.

Se x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) s˜ao vetores complexos com n componentes (ou seja, elementos de n ) ent˜ao definimos hx, yi Trata-se de uma forma bilinear em

n



:= x1 y1 + · · · + xn yn .

.

Mat( , n) ou Mat(n, ) designa o conjunto de todas as matrizes reais n × n. Mat( , n) ou Mat(n, ) designa o conjunto de todas as matrizes complexas n × n. 



T Se A ´e um elemento de Mat( , n) ou de Mat( , n), ent˜ ao A designa a matriz transposta de T A, ou seja, a matriz cujos elementos de matriz ij s˜ao A ij = Aji . 

Se A ´e um operador linear em um espa¸co vetorial complexo (com um certo produto escalar), seu adjunto ´e denotado por A∗ . Em textos de F´ısica ´e mais comum denot´a-lo por A† , mas n˜ao usaremos isso aqui. Assim, se A ∈ Mat( , n), ent˜ao A∗ ser´a a adjunta de A (em rela¸ca˜o ao produto escalar usual, acima). O elemento de matriz ij de A∗ ser´a (A∗ )ij = Aji .

Denotaremos o operador identidade agindo em um espa¸co vetorial (a matriz identidade, agindo em um espa¸co vetorial de dimens˜ao finita) pelo s´ımbolo . Esse s´ımbolo tamb´em representar´a a unidade de uma a´lgebra.

18/1304

Designaremos um produto escalar entre dois vetores u e v sempre por hu, vi e nunca por (u, v), para n˜ao causar confus˜ao com a nota¸ca˜o para par ordenado. Outra nota¸ca˜o poss´ıvel ´e aquela empregada freq¨ uentemente em textos de Mecˆanica Quˆantica: hu | vi, mas faremos raramente uso dessa nota¸ca˜o. Ainda sobre produtos escalares, seguiremos sempre a conven¸ca˜o dos textos de F´ısica: um produto escalar em um espa¸co vetorial sobre os complexos ´e linear em rela¸ca˜o ao segundo argumento e antilinear em rela¸ca˜o ao primeiro. Assim, se α e β s˜ao n´ umeros complexos, teremos hαu, βvi = αβhu, vi. Textos de Matem´atica adotam por vezes a conven¸ca˜o oposta (ou mesmo ambas!). Sobre o emprego das palavras fun¸ca ˜o, aplica¸ca ˜o, mapeamento, mapa, funcional, operador, opera¸ca ˜o, produto e forma, que por vezes causam perplexidade em estudantes, remetemos ao coment´ario a` p´agina 23. Dado um conjunto X 6= ∅, denota-se por (X) a cole¸ca˜o de todos os sub-conjuntos de X. ´e denominado o conjunto das partes de X. A topologia usual da reta real A σ-´algebra de Borel de

(X)

ser´a denotada aqui por τ . 



ser´a (quase sempre) denotada aqui por M[τ ]. 



A σ-´algebra dos sub-conjuntos de aqui por MµL . 

mensur´aveis por Lebesgue ser´a (quase sempre) denotada

Para x ∈ , o s´ımbolo bxc designa o maior inteiro menor ou igual a x. O s´ımbolo dxe designa o menor inteiro maior ou igual a x. 

H´a ainda nestas Notas um problema n˜ao totalmente sanado quando ao conjunto dos n´ umeros naturais . Em algumas se¸co˜es adotou-se 0 ∈ , ou seja, = {0, 1, 2, 3, . . .} em outras, adotou-se 0 6∈ , ou seja, = {1, 2, 3, . . .}. Esperamos que isso seja definitivamente corrigido futuramente. Por ora, pedimos aten¸ca˜o ao leitor. 









O s´ımbolo 2 indica o fim de um enunciado. O s´ımbolo indica o fim de uma demonstra¸ca˜o. O s´ımbolo 6 indica o fim do enunciado de um exerc´ıcio. O s´ımbolo ◊ indica o fim do enunciado de um exemplo. B(X) designa o conjunto de operadores limitados agindo em um espa¸co de Banach X. B(H) designa o conjunto de operadores limitados agindo em um espa¸co de Hilbert H. C(L) designa o conjunto de todas as fun¸co˜es cont´ınuas (reais ou complexas, dependendo do caso), definidas em L (na topologia que se estiver considerando em L). B(L) designa a cole¸ca˜o de todos os conjuntos Borelianos de L (em rela¸ca˜o a` topologia que se estiver considerando em L). Bl (L) designa a cole¸ca˜o de todas as fun¸co˜es Borelianas (reais ou complexas, dependendo do caso), definidas em L. O dom´ınio de um operador T (agindo em um espa¸co de Banach ou de Hilbert) ser´a denotado por D(T ) ou por Dom(T ). A imagem (“range”) de T ser´a denotada por R(T ) ou por Ran (T ) ou, mais raramente, por Im (T ), mas essa u ´ ltima nota¸ca˜o pode causar confus˜ao com a da parte

19/1304

imagin´aria de um n´ umero complexo ou mesmo com a da parte imagin´aria de um operador agindo em um espa¸co de Hilbert: Im (T ) := 2i1 (T − T ∗ ). As no¸co˜es de propriedade v´ alida quase em toda parte e de propriedade gen´erica s˜ao definidas nas p´aginas 960 e 1072, respectivamente.

• Intervalos Ainda n˜ao introduzimos os n´ umeros reais nem a rela¸ca˜o de ordem entre eles mas, como essas no¸co˜es s˜ao conhecidas, vamos colocar aqui uma palavra sobre a nomenclatura usada para descrever intervalos da reta real. Para a < b ∈ o conjunto 

(a, b) = {x ∈ ´e dito ser um intervalo aberto. Para a ≤ b ∈

, com a < x < b}

o conjunto 

[a, b] = {x ∈ ´e dito ser um intervalo fechado. Para a < b ∈



, com a ≤ x ≤ b} 

os conjuntos 

[a, b) = {x ∈

, com a ≤ x < b} 

e (a, b] = {x ∈ 

, com a < x ≤ b}

s˜ao ditos ser intervalos semi-abertos (ou semi-fechados). ´ importante dizer que a nomenclatura “aberto” ou “fechado” acima ´e usada independentemente E da topologia usada em (a no¸ca˜o de topologia ser´a introduzida adiante). 

Parte I Cap´ıtulos Introdut´ orios

20

Cap´ıtulo 1 No¸co ˜es B´ asicas Conte´ udo 1.1

Conjuntos, Rela¸ co ˜es e Fun¸ co ˜es . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1

Rela¸co˜es e Fun¸co˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

1.1.2

Rela¸co˜es de Ordem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

1.1.3

Cardinalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´Infimos e Supremos de Fam´ılias de Conjuntos . . . . . . . . . . . . . . . . . .

37

1.1.4 1.2

1.3

22

Estruturas Alg´ ebricas B´ asicas

43

. . . . . . . . . . . . . . . . . . . . . . . . .

45

1.2.1

Semi-grupos, Mon´oides e Grupos . . . . . . . . . . . . . . . . . . . . . . . . .

46

1.2.2

Corpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

1.2.3

55

1.2.4

Espa¸cos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ An´eis, Algebras e M´odulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2.5

Mais sobre An´eis

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

1.2.6

A¸co˜es e Representa¸co˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

1.2.7

Morfismos, Homomorfismos, Epimorfismos, Isomorfismos, Monomorfismos, Endomorfismos e Automorfismos . . . . . . . . . . . . . . . . . . . . . . . . . .

65

Cosets, Sub-Grupos Normais e o Grupo Quociente. O Centro de um Grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

56

67

1.3.1

Cosets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

67

1.3.2

Subgrupos Normais e o Grupo Quociente . . . . . . . . . . . . . . . . . . . .

69

1.3.3

O Centro de um Grupo. Centralizadores e Normalizadores . . . . . . . . . . .

71

1.4

O Produto Direto e o Produto Semi-Direto de Grupos . . . . . . . . . . .

73

1.5

Somas Diretas e Produtos Tensoriais . . . . . . . . . . . . . . . . . . . . . .

76

1.6

1.5.1

Discuss˜ao Informal Preliminar

. . . . . . . . . . . . . . . . . . . . . . . . . .

76

1.5.2

Grupos Gerados por Conjuntos. Grupos Gerados por Rela¸co˜es . . . . . . . .

79

1.5.3

Somas Diretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

80

1.5.4

Produtos Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

81

1.5.5

Produtos Diretos e Somas Diretas Arbitr´arios . . . . . . . . . . . . . . . . . .

83

1.5.6

M´odulos e Deriva¸co˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

T´ opicos Especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

1.6.1

O Grupo de Grothendieck . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

1.6.2

Grup´oides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

87

1.6.3

Quat´ernions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

88

21

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

22/1304

ste cap´ıtulo introdut´orio pretende (re)apresentar ao leitor uma s´erie de no¸co˜es matem´aticas b´asicas abrangendo rudimentos da teoria dos conjuntos e algumas estruturas alg´ebricas. O objetivo n˜ao ´e um tratamento extensivo dos diversos assuntos, j´a que v´arios deles ser˜ao desenvolvidos em cap´ıtulos futuros. Trata-se quase de um guia de consulta onde s˜ao apresentadas, junto com exemplos simples, v´arias no¸co˜es e defini¸co˜es b´asicas que utilizaremos. O estudante deve retornar a este cap´ıtulo sempre que necess´ario.

1.1

Conjuntos, Rela¸ co ˜es e Fun¸ co ˜es

Partiremos do pressuposto de serem familiares as no¸co˜es b´asicas envolvendo conjuntos, como a no¸ca˜o de pertinˆencia x ∈ C, de uni˜ao de dois conjuntos A ∪ B e de interse¸ca˜o de dois conjuntos A ∩ B. Para A, B ⊂ X denotamos por A \ B a chamada diferen¸ca entre os conjuntos A e B, a saber A \ B := {x ∈ X tal que x ∈ A mas x 6∈ B}.

(1.1)

Por vezes usa-se a nota¸ca˜o A − B para A \ B. Para A ⊂ X denota-se por A c o chamado complemento de A em rela¸ca ˜o a X: Ac := X \ A. Note-se que ao usar-se o s´ımbolo Ac deve estar subentendido qual ´ f´acil ver que se A, B ⊂ X ent˜ao A \ B = B c ∩ A. o conjunto X ao qual o complemento se refere. E Dizemos que um conjunto B ⊂ A ´e um subconjunto pr´ oprio de A se A \ B 6= ∅, ou seja, se houver elementos em A que n˜ao est˜ao em B. Se A e B s˜ao conjuntos e A ∩ B = ∅ ent˜ao A ∪ B ´e dita ser uma uni˜ ao disjunta de A e B.

Se X ´e um conjunto denota-se por (X) a cole¸ca˜o de todos os subconjuntos de X. (X) ´e por vezes chamado de conjunto das partes de X. Por conven¸ca˜o adota-se sempre que ∅ ∈ (X). Assim, dizer que A ⊂ X equivale a dizer A ∈ (X). Por A4B denota-se a chamada diferen¸ca sim´etrica entre A e B: A4B := (A ∪ B) \ (A ∩ B). E. 1.1 Exerc´ıcio. Mostre que A4B = B4A e que (A4B)4C = A4(B4C).

(1.2) 6

• Pares Ordenados Um conceito b´asico importante em Matem´atica ´e o de par ordenado. O conceito de par ordenado (a, b) formado por dois elementos gen´ericos a, b ∈ X ´e intuitivo. A intui¸ca˜o ´e que entende-se como par ordenado uma lista de dois elementos sendo que um deles assume a posi¸ca˜o de “primeiro” elemento da lista (no caso, a) e o outro a de “segundo” (no caso, b). Formalmente define-se (a, b) como sendo o conjunto {a, {b}}. Esta defini¸ca˜o formal corresponde a` intui¸ca˜o pois, no conjunto C = {a, {b}}, h´a uma distin¸ca˜o entre o papel de a e de b, dado que a ´e um elemento do conjunto C, enquanto que b ´e um elemento de um subconjunto de C, a saber do conjunto C \ {a}. Apesar de existir a defini¸ca˜o formal acima, recomenda-se ao estudante fiar-se inicialmente na intui¸ca˜o por tr´as do conceito.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

23/1304

Dados dois conjuntos A e B definimos por A × B o conjunto de todos os pares ordenados (a, b) sendo a ∈ A e b ∈ B. O conjunto A × B ´e chamado de produto Cartesiano1 de A e B. Note que, em geral, A × B 6= B × A. Por quˆe? Mais adiante apresentaremos uma generaliza¸ca˜o da no¸ca˜o de produto Cartesiano de conjuntos.

1.1.1

Rela¸ co ˜es e Fun¸ co ˜es

• Rela¸ co ˜es Sejam A e B conjuntos e seja o produto Cartesiano A × B. Um subconjunto de A × B ´e dito ser uma rela¸ca˜o bin´aria, ou simplesmente rela¸ca˜o entre A e B. Exemplo. Seja A o conjunto de homens vivos e B o conjunto de mulheres vivas e seja R ⊂ A × B o conjunto R := {(a, b), a ´e irm˜ao de b}. R representa uma rela¸ca˜o (de irmandade) entre homens e mulheres. Outros exemplos vir˜ao abaixo. Dada uma rela¸ca˜o G ⊂ A × B entre conjuntos A e B h´a duas no¸co˜es importantes associadas: a de dom´ınio da rela¸ca˜o e a de imagem da rela¸ca˜o. Define-se por dom´ınio de G o conjunto Dom(G) := {a ∈ A tal que (a, b) ∈ G para algum b ∈ B}.

(1.3)

Define-se por imagem de G o conjunto Im(G) := {b ∈ B tal que (a, b) ∈ G para algum a ∈ A}.

(1.4)

Note-se que Dom(G) ⊂ A e que Im(G) ⊂ B. • Fun¸ co ˜es Este ´e talvez o mais importante exemplo de rela¸ca˜o. Sejam A e B conjuntos e F uma rela¸ca˜o entre A e B. Ent˜ao, a rela¸ca˜o F ´e dita ser uma fun¸ca˜o de A em B se Dom(F ) = A e se (a, b) ∈ F e (a, b0 ) ∈ F s´o for poss´ıvel caso b = b0 . Em outras palavras, a cada elemento a de A a fun¸ca˜o associa um e apenas um elemento b de B que faz o papel de segundo elemento do par ordenado (a, b). Este segundo elemento associado pela fun¸ca˜o F ao elemento a, ´e mais conveniente denot´a-lo por F (a). Assim, uma fun¸ca˜o ´e o conjunto de pares {(a, F (a)) ∈ A × B, a ∈ A}. Freq¨ uentemente denotamos uma fun¸ca˜o F de A em B por F : A → B. • Aplica¸ co ˜es, Mapeamentos, Mapas, Funcionais, Operadores, Opera¸ co ˜es, Produtos etc. Muito freq¨ uentemente usam-se as palavras aplica¸ca ˜o, mapeamento, mapa, funcional, operador, opera¸ca ˜o, produto, transforma¸ca ˜o, forma, e talvez ainda outras, para designar certos tipos de fun¸co˜es entre conjuntos. Essa abundˆancia de palavras causa freq¨ uentemente confus˜ao e mesmo perplexidade 1

Assim chamado em honra a Ren´e Descartes (1596-1650). O adjetivo Cartesiano provem da latiniza¸ca ˜o de seu nome como Cartesius.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

24/1304

em estudantes rec´em-iniciados mas, em essˆencia, todos esses objetos s˜ao fun¸co˜es, no sentido abstrato que definimos acima. O que difere seu uso ´e por vezes a tradi¸ca˜o de certas a´reas e os tipos de conjuntos que as fun¸co˜es tˆem como dom´ınio e imagem. A palavra “fun¸ca˜o”, propriamente, ´e mais freq¨ uentemente empregada quando se trata de fun¸co˜es num´ericas, por exemplo de em ou de em . A palavra “funcional” 2 ´e freq¨ uentemente empregada quando se trata de fun¸co˜es que levam vetores ou fun¸co˜es num´ericas em n´ umeros. Um exemplo deR funcional ´e a fun¸ca˜o que leva fun¸co˜es reais cont´ınuas f nas suas integrais 1 no intervalo [0, 1]: f 7→ 0 f (x)dx. A palavra “operador” tipicamente designa fun¸co˜es lineares entre espa¸cos vetoriais (como, por exemplo, as matrizes, que s˜ao fun¸co˜es lineares entre espa¸cos vetoriais de dimens˜ao finita). “Produtos” ou “opera¸co˜es” freq¨ uentemente designam fun¸co˜es de C × C em C, para um conjunto C n˜ao-vazio qualquer, ou seja, fun¸co˜es de duas vari´aveis em um conjunto C, assumindo valores no pr´oprio conjunto C. A palavra “forma” por vezez designa certas fun¸co˜es bi-lineares de V × V em ou , sendo V um espa¸co vetorial. As palavras “aplica¸ca˜o”, “mapa” e “mapeamento” s˜ao freq¨ uentemente empregadas para designar fun¸co˜es em a´reas como Topologia, Geometria Diferencial ou Sistemas Dinˆamicos. 





Certas palavras s˜ao empregadas para designar certas fun¸co˜es com propriedades especiais. Um “homeomorfismo”, por exemplo, ´e uma fun¸ca˜o bijetora entre dois espa¸cos topol´ogicos que seja cont´ınua e cuja inversa seja tamb´em cont´ınua. Um “difeomorfismo” ´e um homeomorfismo entre duas variedades diferenci´aveis que seja infinitamente diferenci´avel. H´a ainda v´arios outros “morfismos”, como discutido na Se¸ca˜o 1.2.7, a` p´agina 65. Em verdade, ´e conveniente dispormos por vezes de uma certa variedade de palavras diferentes simplesmente para evitarmos o emprego mon´otono e descolorido da palavra “fun¸ca˜o”. Com um pouco de ironia, lembremos por fim a defini¸ca˜o circular de Edward Teller: “An intelectual is someone who thinks the same things and uses the same words as other intelectuals”. • Imagens e pr´ e-imagens de fun¸ co ˜es Seja f : X → Y uma fun¸ca˜o. Se A ⊂ X, definimos f (A) := {y ∈ Y | y = f (x) para algum x ∈ A}. Se B ⊂ Y , definimos

f −1 (B) := {x ∈ X| f (x) ∈ B}.

f (A) ´e dita ser a imagem de A por f e f −1 (B) ´e dita ser a pr´e-imagem de B por f . O uso do s´ımbolo f −1 para designar pr´e-imagem f −1 (B) de um conjunto B ´e uma escolha infeliz (mas universalmente aceita), pois pode causar confus˜ao com a no¸ca˜o de fun¸ca˜o inversa de f , que pode n˜ao estar definida. O estudante deve estar atento. • Fun¸ co ˜es Sobrejetoras, Injetoras e Bijetoras Uma fun¸ca˜o F : A → B ´e dita ser sobrejetora se Im(F ) = B. Uma fun¸ca˜o F : A → B ´e dita ser injetora ou injetiva se a cada b ∈ Im(F ) existir um e somente um elemento a ∈ Dom(F ) tal que (a, b) ∈ F . Uma fun¸ca˜o que for sobrejetora e injetora ´e dita ser bijetora. 2

A palavra “funcional” foi empregada pela primeira vez na Matem´ atica por Jacques Salomon Hadamard (1865-1963).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

25/1304

Seja uma fun¸ca˜o bijetora F ⊂ A × B. Ent˜ao, a rela¸ca˜o F −1 ⊂ B × A dada por F −1 = {(b, a) tal que (a, b) ∈ F } ´ claro que (F −1 )−1 = F . ´e, em verdade, uma fun¸ca˜o denominada fun¸ca ˜o inversa de F . E • Fam´ılias de Conjuntos Seja X um conjunto n˜ao-vazio. Uma cole¸ca˜o F n˜ao-vazia de sub-conjuntos de X ´e por vezes dita ser uma fam´ılia de conjuntos (que s˜ao sub-conjuntos de algum X fica subentendito). Se F for uma fam´ılia de conjuntos e existirem um conjunto n˜ao-vazio I e uma fun¸ca˜o bijetora f : I → F, ent˜ao dizemos que a fam´ılia F ´e indexada por I e os elementos de I s˜ao denominados ´ındices. Se λ ´e um ´ındice, designaremos sua imagem pela fun¸ca˜o f simplesmente por Aλ ∈ F. Uma indexa¸ca˜o de uma cole¸ca˜o F n˜ao-vazia de sub-conjuntos de X sempre existe: podemos tomar I = F e f a fun¸ca˜o identidade. • Opera¸ co ˜es b´ asicas com fam´ılias de conjuntos Sejam X e I conjuntos arbitr´arios n˜ao-vazios e seja associado a cada α ∈ I um sub-conjunto A α de X. O conjunto I ser´a freq¨ uentemente denominado conjunto ou fam´ılia de ´ındices. Vamos introduzir alguma nota¸ca˜o a ser usada em todas estas Notas. Definimos [ Aα := {x ∈ X tal que x ∈ Aα para algum α ∈ I} (1.5) α∈I

e

\

α∈I

Aα := {x ∈ X tal que x ∈ Aα para todo α ∈ I}.

(1.6)

As defini¸co˜es acima implicam as importantes propriedades descritas na proposi¸ca˜o que segue, cuja demonstra¸ca˜o deixamos como exerc´ıcio. Proposi¸ c˜ ao 1.1 Sejam B ⊂ X, X n˜ ao-vazio, e {Aα ⊂ X, α ∈ I} uma cole¸ca ˜o arbitr´ aria de subconjuntos de X. Ent˜ ao valem as seguintes rela¸co ˜es: ! ! [ \ \ [ B\ Aα = (B \ Aα ) , B\ Aα = (B \ Aα ) , (1.7) α∈I

\



α∈I

B∪ B∪

α∈I

!

\B =

\



!

[



!

α∈I

α∈I

=

\

α∈I

(Aα \ B) ,

\

(B ∪ Aα ) ,

[

(B ∪ Aα ) ,

α∈I

=

α∈I

α∈I

[

α∈I

B∩ B∩



α∈I

!

[

\

\B =



!

=



!

=

α∈I

α∈I

[

α∈I

(Aα \ B) ,

(1.8)

[

(B ∩ Aα ) ,

(1.9)

\

(B ∩ Aα ) .

(1.10)

α∈I

α∈I

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

26/1304

As rela¸co ˜es, (1.7) implicam [

α∈I



!c

=

\

\

(Aα )c ,

α∈I

α∈I



!c

=

[

(Aα )c .

(1.11)

α∈I

2 • Propriedades elementares de fun¸ co ˜es As seguintes proposi¸co˜es s˜ao importantes e freq¨ uentemente usadas: Proposi¸ c˜ ao 1.2 Seja f : X → Y uma fun¸ca ˜o e seja Λ um conjunto de ´ındices. Se A λ ⊂ X para todo λ ∈ Λ, ent˜ ao ! [ [ Aλ = f (Aλ ) , (1.12) f λ∈Λ

mas

f

\

λ∈Λ



λ∈Λ

Se Bλ ⊂ Y para todo λ ∈ Λ, ent˜ ao f −1

[



λ∈Λ

e f −1

\

λ∈Λ



!



!

=

!

=

\

f (Aλ ) .

(1.13)

[

f −1 (Bλ ) ,

(1.14)

\

f −1 (Bλ ) .

(1.15)

λ∈Λ

λ∈Λ

λ∈Λ

2

A demonstra¸ca˜o ´e elementar e ´e deixada como exerc´ıcio.  T T EmT(1.13) n˜ao se pode provar a igualdade entre f A e λ∈Λ f (Aλ ) e a raz˜ao ´e a seguinte: λ λ∈Λ se y ∈ λ∈Λ f (Aλ ) ent˜ao y T ∈ f (Aλ ) para todo λ ∈ Λ. Assim, em cada Aλ existe um xλ com y = f (xλ ). Mas pode ocorrer que em λ∈Λ Aλ n˜ao exista nenhum elemento x com y = f (x). O seguinte exemplo ilustra isso. Seja f (x) = x2 definida em [−1, 1]. Tomemos A1 = [−1, 0], A2 = [0, 1]. Ent˜ao, f (A1 ) = [0, 1] e f (A2 ) = [0, 1]. Portanto, f (A1 ) ∩ f (A2 ) = [0, 1]. Por´em, f (A1 ∩ A2 ) = f ({0}) = {0}. apesar disso, vale o seguinte: Proposi¸ c˜ ao 1.3 Se f : X → Y ´e injetora ent˜ ao, se Aλ ⊂ X para todo λ ∈ Λ, vale ! \ \ f Aλ = f (Aλ ) . λ∈Λ

(1.16)

λ∈Λ

2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

27/1304

A demonstra¸ca˜o ´e elementar e ´e deixada como exerc´ıcio. Em rela¸ca˜o a`s opera¸co˜es de complemento e diferen¸ca de conjuntos temos o seguinte: Proposi¸ c˜ ao 1.4 Se f : X → Y ´e uma fun¸ca ˜o e B, C ⊂ Y , ent˜ ao  c f −1 (B c ) = f −1 (B) ,

f −1 (B \ C) = f −1 (B) \ f −1 (C) .

Aqui, B c = Y \ B. Fora isso, se f : X → Y ´e uma fun¸ca ˜o injetora e sobrejetora e A, B ⊂ X, ent˜ ao f (Ac ) = (f (A))c ,

Aqui, Ac = X \ A.

f (A \ B) = f (A) \ f (B) .

2

A demonstra¸ca˜o ´e elementar e ´e deixada como exerc´ıcio. • A Uni˜ ao Disjunta de uma Fam´ılia Arbitr´ aria de Conjuntos Sejam, como acima, um conjunto I (n˜ao necessariamente finito ou cont´avel) e Ai , i ∈ I, conjuntos indexados por elementos de I. Os conjuntos Ai podem eventualmente possuir elementos comuns, ou seja, pode haver elementos x que comparecem em v´arios conjuntos Ai . Por´em, quando formamos a S uni˜ao usual dos conjuntos Ai , ou seja, i∈I Ai , cada elemento x comparece apenas uma vez, mesmo que perten¸ca a v´arios Ai ’s. Por vezes estamos interessados em formar um outro tipo de uni˜ao de conjuntos onde essa poss´ıvel multiplicidade de cada elemento x possa ser levada em conta. A defini¸ca˜o abaixo ´e, para tal, das mais adequadas. G Definimos a uni˜ ao disjunta da fam´ılia de conjuntos Ai como sendo o conjunto, denotado por Ai , i∈I

dado pela uni˜ao de todos os pares ordenados (a, i) com i ∈ I, a ∈ Ai , ou seja, G [ [ Ai := (a, i) . i∈I

i∈I a∈Ai

Uni˜oes disjuntas desempenham um papel em v´arias a´reas da Matem´atica. Na Geometria Diferencial, por exemplo, o chamado fibrado tangente de uma variedade diferenci´avel ´e definido como a uni˜ao disjunta dos espa¸cos tangentes a` variedade. • Extens˜ oes de Fun¸ co ˜es Seja F : A → B uma fun¸ca˜o e suponha que A seja subconjunto de um outro conjunto A0 . Uma fun¸ca˜o G : A0 → B ´e dita ser uma extens˜ ao de F se F e G coincidirem na parte comum de seus dom´ınios, que vem a ser o conjunto A, ou seja, se G(a) = F (a) para todo a ∈ A.

Se lembrarmos que uma fun¸ca˜o F : A → B ´e um subconjunto de A×B e que uma fun¸ca˜o G : A0 → B ´e um subconjunto de A0 × B e se notarmos que A × B ⊂ A0 × B caso A ⊂ A0 , ent˜ao uma defini¸ca˜o alternativa de extens˜ao seria seguinte: uma fun¸ca˜o G ´e uma extens˜ao de uma fun¸ca˜o F se F ⊂ G, ambas entendidas como subconjuntos de A0 × B.

JCABarata. Curso de F´ısica-Matem´ atica

E. 1.2 Exerc´ıcio. 6

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

28/1304

Verifique a equivalˆencia dessas duas defini¸co˜es do conceito de extens˜ao de fun¸co˜es.

Como veremos, o conceito de extens˜ao de fun¸co˜es ´e freq¨ uentemente empregado na teoria dos operadores lineares em espa¸cos de Hilbert. • O Produto Cartesiano de uma Fam´ılia Arbitr´ aria de Conjuntos J´a discutimos o conceito de produto Cartesiano de dois conjuntos A e B: A × B e com ele introduzimos a no¸ca˜o de fun¸ca˜o. De posse dessa no¸ca˜o podemos, com vistas a uma generaliza¸ca˜o, apresentar uma outra vis˜ao do conceito de produto Cartesiano de dois conjuntos, a saber, podemos dizer que A×B ´e o conjunto de todas as fun¸co˜es f : {1, 2} → A ∪ B tais que f (1) ∈ A e f (2) ∈ B. A id´eia ´e dizer que cada par ordenado (a, b) com a ∈ A e b ∈ B ´e uma fun¸ca˜o onde o primeiro membro do par ´e a imagem de 1 (por ser o primeiro) e o segundo a imagem de 2 (por ser o segundo). Essa id´eia permite definir produtos Cartesianos de um n´ umero finito n de conjuntos A1 , A2 , . . . , An denotado por A1 × A2 × . . . × An n [ como sendo o conjunto de todas as fun¸co˜es f : {1, 2, . . . , n} → Aj satisfazendo f (j) ∈ Aj para todo j=1

j ∈ {1, . . . , n}. A fun¸ca˜o f tem, por assim dizer, o papel de ordenar os elementos de

n [

Aj tomando-se

j=1

sucessivamente um elemento de cada Ai por vez. O produto Cartesiano A1 × A2 × . . . × An ´e assim entendido como o conjunto formado por todas as ˆenuplas ordenadas (a1 , . . . , an ) com ai ∈ Ai .

Essa id´eia pode ser generalizada ainda mais. Sejam I um conjunto n˜ao-vazio (n˜ao necessariamente finito ou cont´avel) e Ai , i ∈ I, conjuntos n˜ao-vazios indexados por elementos de I. Definimos ent˜ao o produto Cartesiano da fam´ılia de conjuntos {Ai , i ∈ I}, denotado por Y Ai i∈I

como sendo o conjunto de todas as fun¸co˜es f : I →

[

j∈I

Aj tais que f (x) ∈ Ax para todo x ∈ I. O

Axioma da Escolha (p´ Qagina 28) consiste na afirma¸ca˜o (ou melhor dizendo, na suposi¸ca˜o, j´a que se trata de um axioma) que i∈I Ai ´e n˜ao-vazio.

Se por ventura todos os conjuntos Ai forem idˆenticos ent˜ao denota-se o produto Cartesiano acima por AI . Assim, AI denota o conjunto de todas as fun¸co˜es de I em A. × e Desta forma denotado simplesmente por 



{1, 2}





2

s˜ao duas nota¸co˜es distintas para o mesmo objeto, que tamb´em ´e , como se sabe. Genericamente d designa {1,...,d} para d ∈ , d > 0. 





• O Axioma da Escolha O Axioma da Escolha consiste na seguinte afirmativa: Seja As , s ∈ I, uma fam´ılia de conjuntos n˜ ao-vazios, onde I ´e um conjunto arbitr´ ario (n˜ ao-vazio) de ´ındices. Ent˜ ao, podemos construir um conjunto A tomando (“escolhendo”)[ um elemento a s de cada conjunto As . Em termos mais t´ecnicos, o axioma diz que h´ a fun¸co ˜es F : I → As tais que F (s) ∈ As s∈I

JCABarata. Curso de F´ısica-Matem´ atica

para todo s ∈ I, ou seja, o produto Cartesiano

Vers˜ ao de 29 de setembro de 2005.

Q

s∈I

Cap´ıtulo 1

29/1304

As ´e n˜ ao vazio3 .

A primeira vista esse axioma parece constituir-se de uma obviedade. Sucede, por´em, que, sobretudo pelo fato de o conjunto I de ´ındices ser arbitr´ario (podendo ser at´e um conjunto infinito e n˜ao-cont´avel), a afirmativa que o mesmo cont´em n˜ao pode ser derivada de princ´ıpios mais b´asicos. O axioma faz uma afirma¸ca˜o de existˆencia (de uma fun¸ca˜o como a F , ou de um conjunto como A formado por elementos escolhidos de cada As ) que, geralmente, n˜ao pode ser demonstrada construtivamente, ou seja, por exibi¸ca˜o expl´ıcita de uma tal fun¸ca˜o F ou de um conjunto A. Faremos uso expl´ıcito do Axioma da Escolha adiante quando exibirmos exemplos de conjuntos n˜aomensur´aveis. O Axioma da Escolha foi originalmente formulado por Zermelo4 em 1904 como parte da sua demonstra¸ca˜o do chamado Princ´ıpo do Bom-Ordenamento, Teorema 1.1, p´agina 35. Vide [52]. Uma t´ıpica situa¸ca˜o na qual se faz uso do Axioma da Escolha ocorre quando s˜ao dados um conjunto X e uma uma rela¸ca˜o de equivalˆencia E em X e constr´oi-se um conjunto A ⊂ X tomando-se um representante de cada classe de equivalˆencia de X por E. Nem sempre ´e poss´ıvel exibir explicitamente os elementos de A, mas assumimos (via Axioma da Escolha) que um tal conjunto existe. Para ter-se em mente um caso onde uma tal situa¸ca˜o ocorre, tome-se o exemplo dado em (1.18), p´agina 30. • Rela¸ co ˜es de Equivalˆ encia

Outro tipo importante de rela¸ca˜o ´e formado pelas chamadas rela¸co˜es de equivalˆencia. Uma rela¸ca˜o E ⊂ A × A ´e dita ser uma rela¸ca ˜o de equivalˆencia em um conjunto n˜ao-vazio A se os seguintes quesitos forem satisfeitos: 1. (a, a) ∈ E para todo a ∈ A. 2. (a, b) ∈ E implica que (b, a) ∈ E. 3. (a, b) ∈ E e (b, c) ∈ E implicam que (a, c) ∈ E. Se o par (a, b) pertence a uma rela¸ca˜o de equivalˆencia E ent˜ao a e b s˜ao ditos serem equivalentes E segundo E. Quase sempre usa-se a nota¸ca˜o a ∼ b, ou simplesmente a ∼ b, para indicar que dois elementos s˜ao equivalentes segundo uma rela¸ca˜o de equivalˆencia dada. Seja A um conjunto e E ⊂ A × A uma rela¸ca˜o de equivalˆencia em A. Para cada a ∈ A podemos definir o conjunto E(a) := {a0 ∈ A tal que (a, a0 ) ∈ E}. (1.17) Esse conjunto ´e chamado de classe de equivalˆencia de a (pela rela¸ca˜o de equivalˆencia E).

E. 1.3 Exerc´ıcio. Seja A um conjunto e E ⊂ A × A ´e uma rela¸c˜ao de equivalˆencia em A. Suponha que a, b ∈ A e que a ∼ b segundo E. Prove que E(a) = E(b). 6 E. 1.4 Exerc´ıcio importante. Prove que se A ´e um conjunto e E ⊂ A × A ´e uma rela¸c˜ao de equivalˆencia em A ent˜ao A ´e a uni˜ao disjunta de classes de equivalˆencia de seus elementos. 6 Q agina 28. Para a defini¸ca ˜o do produto Cartesiano s∈I As , vide p´ 4 Ernst Friedrich Ferdinand Zermelo (1871-1953). 3

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

E. 1.5 Exerc´ıcio. Seja o conjunto dos n´umeros reais W := {(x, y) ∈ onde



× 



Cap´ıtulo 1

e seja a rela¸c˜ao W ⊂

tal que x − y ∈



× 

30/1304

definida por

},

´e o conjunto dos n´umeros racionais. Prove que W ´e uma rela¸c˜ao de equivalˆencia.

(1.18) 6

• Rela¸ co ˜es de Compatibilidade Seja P um conjunto. Uma rela¸ca ˜o de compatibilidade em P ´e um conjunto C ⊂ P × P com as seguintes propriedades: 1. Se γ e γ 0 s˜ao tais que (γ, γ 0 ) ∈ C, ent˜ao (γ 0 , γ) ∈ C. 2. Para todo γ ∈ P vale (γ, γ) 6∈ C. Para uma dada rela¸ca˜o de compatibilidade C denotamos γ ∼C γ 0 caso (γ, γ 0 ) ∈ C e dizemos que γ e γ 0 s˜ao C-compat´ıveis. Caso contr´ario, denotamos γ 6∼C γ 0 se (γ, γ 0 ) 6∈ C e dizemos que γ e γ 0 s˜ao C-incompat´ıveis. Se uma dada rela¸ca˜o C ´e subentendida, denotamos simplesmente γ ∼ γ 0 caso (γ, γ 0 ) ∈ C e dizemos simplesmente que γ e γ 0 s˜ao compat´ıveis. Rela¸co˜es de compatibilidade s˜ao importantes na Mecˆanica Estat´ıstica, especialmente nas chamadas expans˜oes de pol´ımeros e de “clusters”. Exemplo. Seja X um conjunto n˜ao-vazio e P = (X) \ {∅}, a cole¸ca˜o de todos os subconjuntos n˜ao-vazios de X. Uma rela¸ca˜o de compatibilidade em P ´e a seguinte: A ∼ B ⇐⇒ A ∩ B = ∅. Verifique.

1.1.2

Rela¸ co ˜es de Ordem

Seja X um conjunto n˜ao-vazio. Uma rela¸ca˜o R ⊂ X × X ´e dita ser uma rela¸ca ˜o de ordem parcial em X, ou simplesmente uma rela¸ca ˜o de ordem em X, se as seguintes condi¸co˜es forem satisfeitas: 1. Para todo a ∈ X tem-se que (a, a) ∈ R. 2. Se (a, b) ∈ R e (b, a) ∈ R ent˜ao for¸cosamente a = b. 3. Se (a, b) ∈ R e (b, c) ∈ R ent˜ao (a, c) ∈ R. Se X possui uma ordem parcial R, X ´e chamado de conjunto parcialmente ordenado por R. Em textos matem´aticos em l´ıngua inglesa, conjuntos parcialmente ordenados s˜ao freq¨ uˆentemente denominados posets (de “partially ordered sets”). A no¸ca˜o de conjunto parcialmente ordenado foi introduzida por Hausdorff5 5

Felix Hausdorff (1868-1942). Hausdorff foi um dos criadores da Topologia e da moderna Teoria dos Conjuntos. Perseguido pelo nacional-socialismo, suicidou-se em 1942 para evitar ser enviado a um campo de concentra¸ca ˜o.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

31/1304

Exemplo. Seja X um conjunto e (X) a cole¸ca˜o de todos os sub-conjuntos de X. Podemos estabelecer em (X) uma rela¸ca˜o R do seguinte tipo: para A, B ⊂ X tem-se (A, B) ∈ R se A ⊂ B. Como exerc´ıcio deixamos ao estudante mostrar que esta ´e uma rela¸ca˜o de ordem parcial de acordo com a defini¸ca˜o acima. Este exemplo ilustra tamb´em por que chamar tal rela¸ca˜o de ordem de “parcial”. A raz˜ao ´e que nem todo par (A, B) ´e elemento de R pois, para dois conjuntos A e B arbitr´arios, nem sempre vale que A ⊂ B ou que B ⊂ A (por exemplo se A ∩ B = ∅). Em fun¸ca˜o da analogia com essa rela¸ca˜o de ordem usual dos n´ umeros reais ´e costume, dada uma rela¸ca˜o de ordem R qualquer, indicar que (a, b) ∈ R atrav´es da nota¸ca˜o a  b. Por vezes, o s´ımbolo ≤ ´e tamb´em usado, mas tentaremos empreg´a-lo apenas para denotar a rela¸ca˜o de ordem usual entre n´ umeros reais. • Rela¸ co ˜es de Ordem Total Outro conceito importante ´e o de rela¸ca˜o de ordem total. Uma ordem parcial R em um conjunto X ´e dita ser uma rela¸ca ˜o de ordem total se para todo a, b ∈ X tem-se que (a, b) ∈ R ou que (b, a) ∈ R. Se X possui uma rela¸ca˜o de ordem total R ent˜ao X ´e dito ser totalmente ordenado ou linearmente ordenado. Assim, se X ´e um conjunto dotado de uma rela¸ca˜o de ordem parcial, dizemos que um sub-conjunto A ⊂ X ´e linearmente ordenado se a  b ou b  a para todo a, b ∈ A. • Exemplos Exemplo. Seja o conjunto de n´ umeros reais e a rela¸ca˜o de ordem (x, y) ∈ R se x − y for um n´ umero negativo ou nulo (ou seja, se x ≤ y). Mostre que essa ´e uma rela¸ca˜o de ordem total em . 



Contra-exemplo. Seja C um conjunto n˜ao-vazio qualquer. Ent˜ao, (C) ´e ordenado pela inclus˜ao de conjuntos: A  B se e somente se A ⊂ B. Por´em (C) n˜ao ´e linearmente ordenado pois se A ∩ B = ∅ n˜ao podemos dizer que A  B nem que B  A. 2

E. 1.6 Exerc´ıcio. Vocˆe consegue construir uma rela¸c˜ao de ordem em ordem total? 

ou em

3 

? E uma rela¸c˜ao de 6

• Mais Exemplos Seja o conjunto dos n´ umeros naturais . Podemos estabelecer em a rela¸ca˜o de ordem usual onde dizemos que x ≤ y se x − y for um n´ umero negativo ou nulo. Esta rela¸ca˜o ´e uma rela¸ca˜o de ordem total. O leitor n˜ao deve pensar que essa ´e a u ´ nica rela¸ca˜o de ordem total existente em . Um outro exemplo ´e o seguinte. 





Vamos estabelecer uma rela¸ca˜o de ordem em que denotaremos pelo s´ımbolo p−i . Sejam a, b ∈ . Se a e b forem pares dizemos que a p−i b se a ≤ b. Se a e b forem ´ımpares dizemos que a p−i b se a ≤ b. Se a ´e par e b ´e ´ımpar ent˜ao dizemos sempre que a p−i b. 



E. 1.7 Exerc´ıcio. Mostre que a rela¸c˜ao p−i estabelece uma rela¸c˜ao de ordem total em 

.

6

Um exemplo an´alogo pode ser constru´ıdo em . Vamos estabelecer uma rela¸ca˜o de ordem em que denotaremos pelo s´ımbolo r−i . Sejam x, y ∈ . Se x e y forem racionais dizemos que x r−i y se 





JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

32/1304

x ≤ y. Se x e y forem irracionais dizemos que x r−i y se x ≤ y. Se x ´e racional e y ´e irracional ent˜ao dizemos sempre que x r−i y. E. 1.8 Exerc´ıcio. Mostre que a rela¸c˜ao r−i estabelece uma rela¸c˜ao de ordem total em 

.

6

• Ordem Lexicogr´ afica ´ poss´ıvel estabelecer uma rela¸ca˜o de ordem total em 2 da seguinte forma: dizemos que (x1 , x2 ) L E (y1 , y2 ) se x1 < y1 ou se x1 = y1 e x2 ≤ y2 . Essa rela¸ca˜o de ordem ´e denominada rela¸ca ˜o de ordem 2 lexicogr´ afica de . 



Essa defini¸ca˜o pode ser facilmente generalizada. Seja X um conjunto totalmente ordenado por uma rela¸ca˜o de ordem total X . Ent˜ao, X n pode ser totalmente ordenado dizendo-se (x1 , . . . , xn ) L (y1 , . . . , yn ) se houver um j ∈ {1, . . . , n}, tal que xi = yi para todo i < j e xj X yj .

S∞Seja nX um conjunto totalmente ordenado por uma rela¸ca˜o de ordem total X e seja Seja X = em denominada lexicogr´afica, da n=1 X . Podemos estabelecer em X uma ordem total X , tamb´ seguinte maneira. Sejam m, n ∈ e p = min{m, n}. Ent˜ao, dizemos (x1 , . . . , xm ) X (y1 , . . . , yn ) se (x1 , . . . , xp ) L (y1 , . . . , yp ) no sentido dado no par´agrafo anterior, ou se (x1 , . . . , xp ) = (y1 , . . . , yp ), mas m < n. 

E. 1.9 Exerc´ıcio. Por que essas rela¸co˜es de ordem s˜ao denominadas “lexicogr´aficas”? Pense na maneira como palavras (de tamanho arbitr´ario!) s˜ao ordenadas em um dicion´ario. 6 Podemos ainda estender a defini¸ca˜o de ordem lexicogr´afica. Seja X um conjunto totalmente ordenado por uma rela¸ca˜o de ordem total X e seja Y um conjunto totalmente ordenado por uma rela¸ca˜o de ordem total Y . Ent˜ao, X Y pode ser totalmente ordenado dizendo-se X Y 3 x L y ∈ X Y se houver um j ∈ Y , tal que x(i) = y(i) para todo i Y j e x(j) X y(j).

Exemplo. Sejam f, g, duas fun¸co˜es de em . Dizemos que f L g se existir y ∈ tal que f (x) = g(x) para todo x < y mas f (y) ≤ g(y). Lembrando que o conjunto de todas as fun¸co˜es de em ´e , vˆe-se que essa defini¸ca˜o coincide com a dada acima. 













• Conjuntos Dirigidos Um conjunto I ´e dito ser um conjunto dirigido (“directed set”) se for dotado de uma rela¸ca˜o de ordem parcial, que denotaremos por “”, e se for dotado da seguinte propriedade: para quaisquer dois elementos a e b de I existe pelo menos um terceiro elemento c ∈ I tal que a  c e b  c. Exemplo.

Exemplo.

´e um conjunto dirigido com a rela¸ca˜o de ordem usual.





´e um conjunto dirigido com a rela¸ca˜o de ordem r−i definida acima.

Exemplo. Seja o conjunto n , n = 1, 2, . . ., e seja I o conjunto de todos os abertos limitados de n (um conjunto ´e limitado se for subconjunto de alguma bola aberta de raio finito centrada na origem). Mostre que I ´e um conjunto dirigido pela rela¸ca˜o de ordem de inclus˜ao: A  B se A ⊂ B. Note que essa rela¸ca˜o de ordem n˜ao ´e uma rela¸ca˜o de ordem total. 



JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

33/1304

Contra-Exemplo. Seja X um conjunto n˜ao-vazio e seja I = (X) \ {X}, ou seja, I ´e a cole¸ca˜o de todos os subconjuntos de X, exceto o pr´oprio X. Podemos ter em I uma rela¸ca˜o de ordem (de inclus˜ao) dizendo que A  B se A ⊆ B. Notemos, por´em, que I n˜ao ´e um conjunto dirigido pois para A ∈ I, A 6= ∅ temos X \ A ∈ I mas n˜ao existe em I nenhum conjunto que contenha A e X \ A simultaneamente como subconjuntos. Exemplo. Causalidade de Einstein. Seja 4 o espa¸co-tempo quadri-dimensional de Minkowski e sejam E0 = (t0 , x0 , y0 , z0 ) e E1 = (t1 , x1 , y1 , z1 ) dois eventos em 4 . Dizemos que o evento E0 precede causalmente o evento E1 , (em nota¸ca˜o simb´olica E0 Einstein E1 ), se t0 ≤ t1 e se c2 (t1 − t0 )2 − (x1 − x0 )2 − (y1 − y0 )2 − (z1 − z0 )2 ≥ 0 , onde c ´e a velocidade da luz. E. 1.10 Exerc´ıcio. Mostre que Einstein ´e uma rela¸c˜ao de ordem em por essa rela¸c˜ao.

4

e que

4

´e um conjunto dirigido 6

• Redes e Seq¨ uˆ encias Seja I um conjunto dirigido com respeito a` uma rela¸ca˜o de ordem parcial . Se M ´e um conjunto n˜ao-vazio, uma fun¸ca˜o f : I → M ´e denominada uma rede em M baseada no conjunto dirigido I com respeito a  ou, simplesmente, uma rede6 em M .

Uma seq¨ uˆencia em M ´e uma rede baseada em , que ´e um conjunto dirigido com respeito a` ordem usual dos naturais, ou seja, ´e uma fun¸ca˜o f : → M . 



A no¸ca˜o de rede ´e importante, por exemplo, no estudo de fun¸co˜es cont´ınuas em espa¸cos topol´ogicos gerais e na defini¸ca˜o da no¸ca˜o de convergˆencia (vide Cap´ıtulo 21, p´agina 978). Se f : → M ´e uma seq¨ uˆencia em M , os elementos f (n) de sua imagem s˜ao freq¨ uentemente ´ denotados por uma nota¸ca˜o com ´ındices: fn . E tamb´em comum denotar-se a pr´opria seq¨ uˆencia por {fn , n ∈ } ou por {fn }n∈ , que, estritamente falando, representam a imagem de f em M . 





• M´ aximos e M´ınimos Se X ´e um conjunto dotado de uma rela¸ca˜o de ordem parcial (que denotamos por ) diz-se que um elemento z ∈ X ´e um m´ aximo de X se x  z para todo x ∈ X. Se z e z 0 s˜ao m´aximos de X ent˜ao, por hip´otese, valem ambas as rela¸co˜es z  z 0 e z 0  z, o que implica z = z 0 . Assim, se X possuir um m´aximo ele ´e u ´ nico, e ´e denotado por max(X). Se A ⊂ X, a rela¸ca˜o de ordem parcial em X induz uma rela¸ca˜o de ordem parcial em A. Com essa rela¸ca˜o, podemos definir max(A), se existir, como o elemento de A tal que a  max(A) para todo a ∈ A. Note que, por defini¸ca˜o, max A ∈ A.

Analogamente, um elemento a ´e dito ser um m´ınimo de X se a  x para todo x ∈ X. Se a e a0 s˜ao m´ınimos de X ent˜ao, por hip´otese, valem ambas as rela¸co˜es a  a0 e a0  a, o que implica a = a0 . Assim, se X possuir um m´ınimo ele ´e u ´ nico, e ´e denotado por min(X). 6

Alguns autores em l´ıngua portuguesa preferem usar a palavra reticulado em lugar de rede.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

34/1304

• Elementos Maximais e Minimais Seja X ´e um conjunto dotado de uma rela¸ca˜o de ordem parcial (que denotamos por ).

Um elemento z ∈ X ´e dito ser um elemento maximal se n˜ao existir x ∈ X, x 6= z tal que z  x. Um elemento a ∈ X ´e dito ser um elemento minimal se n˜ao existir x ∈ X, x 6= a tal que x  a.

Os elementos maximais e minimais de um conjunto parcialmente ordenado X, se exitirem, n˜ao s˜ao necessariamente u ´ nicos, como mostra o seguinte exemplo. E. 1.11 Exerc´ıcio-Exemplo. Considere no plano 2 o quadrado fechado Q = [0, 1] × [0, 1], ou seja, os elementos de Q s˜ao pares ordenados (x, y) ∈ 2 com 0 ≤ x ≤ 1 e 0 ≤ y ≤ 1. Estabelecemos em Q uma rela¸cao de ordem (parcial!) da seguinte forma: (x, y)  (x 0 , y 0 ) se x = x0 e se y ≤ y 0 . Em palavras, (x, y)  (x0 , y 0 ) se ambos os pontos estiverem em uma mesma linha vertical, mas (x, y) estiver mais baixo que (x0 , y 0 ). Cheque que isso ´e, de fato, uma rela¸c˜ao de ordem, mas que n˜ao ´e uma ordem total, pois n˜ao se pode comparar pontos que est˜ao em linhas verticais diferentes. 



Com essa defini¸c˜ao conven¸ca-se que todos os elementos da forma (x, 1) s˜ao maximais. Por´em, se x for diferente de x0 , n˜ao se pode nem dizer que (x, 1)  (x0 , 1) nem que (x0 , 1)  (x, 1). Igualmente, conven¸ca-se que todos os elementos da forma (x, 0) s˜ao minimais. Note tamb´em que para a existˆencia de elementos maximais ´e importante que Q contenha pontos na aresta de cima e (com coordenada y = 1), analogamente, para a existˆencia de elementos minimais ´e importante que Q contenha pontos aresta de baixo (com coordenada y = 0). Por exemplo, se vocˆe definir a mesma rela¸c˜ao de ordem no quadrado aberto (0, 1) × (0, 1) n˜ao h´a mais elementos maximais ou minimais. 6 Se um conjunto n˜ao-vazio e parcialmente ordenado X possuir um u ´ nico elemento maximal, este elemento ´e denominado o maior elemento de X. Reciprocamente, se um conjunto n˜ao-vazio e parcialmente ordenado X possuir um u ´ nico elemento minimal, este elemento ´e denominado o menor elemento de X. • Conjuntos Bem-Ordenados Um conjunto X dotado de uma rela¸ca˜o parcial de ordem  ´e dito ser um conjunto bem-ordenado se todo subconjunto A n˜ao vazio de X tem um elemento m´ınimo em A. E. 1.12 Exerc´ıcio. Mostre que todo conjunto bem-ordenado segundo uma rela¸c˜ao parcial de ordem ´e tamb´em totalmente ordenado segundo a mesma rela¸c˜ao. 6 E. 1.13 Exerc´ıcio. A rec´ıproca n˜ao ´e, entretanto, verdadeira. Mostre que ´e totalmente ordenado pela rela¸c˜ao usual de ordem entre n´umeros reais, mas n˜ao ´e um conjunto bem-ordenado. 6 

E. 1.14 Exerc´ıcio. Mostre que o conjunto dos n´umeros naturais 

´e bem-ordenado.

6

A importˆancia de conjuntos bem-ordenados ´e que a eles se aplica uma generaliza¸ca˜o do bemconhecido m´etodo de indu¸ca˜o matem´atica, muito empregado em demonstra¸co˜es de teoremas, denominada princ´ıpio de indu¸ca ˜o transfinita. O estudante interessado encontrar´a em [52] uma excelente

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

35/1304

referˆencia introdut´oria. Nesta mesma referˆencia o estudante interessado encontrar´a uma demonstra¸ca˜o do seguinte e importante resultado, devido a Zermelo7 : Teorema 1.1 (Teorema do Bom-Ordenamento) Se X ´e um conjunto n˜ ao-vazio ent˜ ao ´e poss´ıvel encontrar uma rela¸ca ˜o de ordem  em X tal que X ´e bem-ordenado por essa rela¸ca ˜o. 2 Incidentalmente, o Teorema 1.1 junto com a afirma¸ca˜o do Exerc´ıcio E. 1.12 informam que todo conjunto n˜ao-vazio possui ao menos uma rela¸ca˜o de ordem total. • Majorantes e Minorantes Seja X um conjunto dotado de uma ordem parcial denotada por  e seja A ⊂ X. Se existe t ∈ X tal que a  t para todo a ∈ A dizemos que t ´e um majorante de A, ou um limitante superior 8 de A.

Analogamente, se existe h ∈ X tal que h  a para todo a ∈ A dizemos que h ´e um minorante de A ou um limitante inferior9 de A. • Conjuntos Limitados Seja X um conjunto dotado de uma ordem parcial denotada por . Um conjunto A ⊂ X que tenha pelo menos um majorante ´e dito ser um conjunto limitado superiormente. Um conjunto A ⊂ X que tenha pelo menos um minorante ´e dito ser um conjunto limitado inferiormente. • ´Infimo e Supremo Seja X um conjunto dotado de uma ordem parcial denotada por  e seja A ⊂ X.

O m´ınimo do conjunto de majorantes de A, se existir, ´e dito ser o supremo de A e ´e indicado por sup(A). Note que o supremo de A, se existir, ´e u ´ nico, por ser o m´ınimo de um conjunto. Assim, s ∈ X ´e dito ser o supremo de A se for um majorante de A e se s  t para todo t que seja majorante de A. Note que o supremo de um conjunto A ⊂ X n˜ao ´e necessariamente um elemento de A, ao contr´ario do que ocorre com o m´aximo de A (caso exista). O m´aximo do conjunto dos minorantes de A, se existir, ´e dito ser o ´ınfimo de A e ´e indicado por inf(A). Note que o ´ınfimo de A, se existir, ´e u ´ nico, por ser o m´aximo de um conjunto. Assim, i ´e o ´ınfimo de A se for um minorante de A e se h  i para todo h que seja minorante de A. Note que o ´ınfimo de um conjunto A ⊂ X n˜ao ´e necessariamente um elemento de A, ao contr´ario do que ocorre com o m´ınimo de A (caso exista). ´ interessante notar o seguinte. Dado um conjunto X dotado de uma ordem parcial poder´ıamos nos E perguntar se todo subconjunto limitado superiormente de X possui um supremo ou, analogamente, se todo subconjunto de X limitado inferiormente possui um ´ınfimo. A validade ou n˜ao dessas propriedades depende de X e da rela¸ca˜o de ordem em quest˜ao. Por exemplo, para X = , o conjunto dos racionais 7

Ernst Friedrich Ferdinand Zermelo (1871-1953). A express˜ ao “limite superior” ´e tamb´em usada na literatura, mas deve ser evitada para n˜ ao causar confus˜ ao com a no¸ca ˜o de limite. 9 A express˜ ao “limite inferior” ´e tamb´em usada na literatura, mas deve ser evitada para n˜ ao causar confus˜ ao com a no¸ca ˜o de limite. 8

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

36/1304

com a rela¸ca˜o de ordem usual, verifica-se que a propriedade n˜ao ´e valida. Tomemos A = {x ∈ , x 2 < 2}. Claramente esse conjunto ´e limitado inferior e superiormente mas n˜ao possui nem supremo nem ´ınfimo (por quˆe?). Para X = e X ∈ (com as rela¸co˜es de ordem usuais) a propriedade ´e, por´em, v´alida. 



E. 1.15 Exerc´ıcio. Tome X = com a rela¸c˜ao de ordem usual. Mostre que inf((−1, 1)) = −1 e que sup((−1, 1)) = 1. Note que −1 e 1 n˜ao s˜ao elementos de (−1, 1). 6 

E. 1.16 Exerc´ıcio. Suponha que A e B sejam dois sub-conjuntos de um conjunto X dotado de uma ordem total e que inf(A) e inf(B) existam. Mostre ent˜ao que inf(A ∪ B) = min{inf(A), inf(B)}. 6 E. 1.17 Exerc´ıcio. Suponha que A e B sejam dois sub-conjuntos de um conjunto X dotado de uma ordem total e que sup(A) e sup(B) existam. Mostre ent˜ao que sup(A ∪ B) = max{sup(A), sup(B)}. 6 • O Lema de Zorn Uma das afirmativas fundamentais de toda a Matem´atica usual ´e o seguinte resultado, conhecido como lema de Zorn, em homenagem a um dos seus formuladores10 : Lema 1.1 (Lema de Kuratowski-Zorn) Seja X um conjunto n˜ ao-vazio e  uma rela¸ca ˜o de ordem parcial em X. Suponha que todo sub-conjunto linearmente ordenado de X tenha pelo menos um majorante em X. Ent˜ ao, todo sub-conjunto linearmente ordenado de X tem algum majorante em X que ´e tamb´em um elemento maximal de X. Implicitamente isso est´ a dizendo que, sob as hip´ oteses, X possui ao menos um elemento maximal. 2 Para uma demonstra¸ca˜o do Lema de Zorn, vide, por exemplo, [52]. E. 1.18 Exerc´ıcio. Verifique que se X = [0, 1] ´e ordenado pela rela¸c˜ao de ordem usual todo subconjunto de X tem um majorante em X e que 1 ´e um desses poss´ıveis majorantes. Verifique que 1 ´e um elemento maximal de X. 6 E. 1.19 Exerc´ıcio. Verifique que se X = [0, 1) ´e linearmente ordenado pela rela¸c˜ao de ordem usual e nem todo sub-conjunto de X tem um majorante em X (tente, por exemplo, sub-conjuntos do tipo [a, 1) com 0 ≤ a < 1). Verifique que X n˜ao tem um elemento maximal. 6

10 Max August Zorn (1906-1993). Em verdade, o Lema de Zorn foi primeiramente descoberto por Kazimierz Kuratowski (1896-1980). O trabalho de Kuratowski data de 1922 e o de Zorn de 1935.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

37/1304

E. 1.20 Exerc´ıcio. Cheque se as hip´oteses do Lema de Zorn s˜ao satisfeitas ou n˜ao nos quadrados abertor e fechados do Exemplo E. 1.11, p´agina 34. 6 O Lema de Zorn ´e “equivalente” ao chamado Axioma da Escolha (vide p´agina 28), ou seja, admitir um como verdadeiro leva a demonstrar a validade do segundo. Essa equivalˆencia n˜ao ser´a provada aqui (vide, por exemplo, [52]). Toda a Matem´atica usual ´e fundada na aceita¸ca˜o de um ou de outro como verdadeiro e, em princ´ıpio, uma nova Matem´atica pode ser constru´ıda (com resultados distintos dos da Matem´atica usual) se esses dois axiomas forem substitu´ıdos por um terceiro inequivalente. A relevˆancia de tais Matem´aticas em F´ısica ´e uma quest˜ao em aberto.

1.1.3

Cardinalidade

• A No¸ c˜ ao de Cardinalidade de Conjuntos Seja K uma cole¸ca˜o de conjuntos. Dados dois conjuntos A e B da cole¸ca˜o K, dizemos que A e B s˜ao equivalentes se houver uma fun¸ca˜o bijetora de A sobre B, ou seja, se houver uma fun¸ca˜o com dom´ınio igual a A e imagem igual a B tal que a cada elemento b ∈ B existe um u ´ nico elemento a ∈ A com f (a) = b. E. 1.21 Exerc´ıcio. Mostre que essa ´e uma rela¸c˜ao de equivalˆencia entre os conjuntos da cole¸c˜ao K. 6 Para dois conjuntos que s˜ao equivalentes no sentido acima diz-se tamb´em que os mesmos tˆem a mesma cardinalidade. Ou seja, dois conjuntos tˆem a mesma cardinalidade se e somente se houver uma fun¸ca˜o bijetora entre eles. Um conjunto A ´e dito ter n elementos (para um n´ umero natural n) se for equivalente ao conjunto {1, . . . , n}. Nota.

Esta u ´ltima defini¸ca ˜o pressup˜ oe que o conceito de n´ umero natural j´ a seja conhecido. Outra constru¸ca ˜o mais simples em termos de

pressupostos ´e feita de modo informal como segue: diz-se que um conjunto tem um elemento se for equivalente ao conjunto {∅}; que um conjunto tem dois elementos se for equivalente ao conjunto {∅, {∅}}; que tem trˆes elementos se for equivalente ao conjunto {∅, {∅, {∅}}} e assim por diante. Em verdade essa constru¸ca ˜o permite produzir uma defini¸ca ˜o do conceito de n´ umero natural: o n´ umero “um” ´e, grosseiramente falando, o nome dado a ` classe de equivalˆencia formada pelos conjuntos equivalentes ao conjunto {∅}; o n´ umero “dois” ´e o nome dado a ` classe de equivalˆencia do conjunto {∅, {∅}}; o n´ umero “trˆes” ´e nome dado a ` classe de equivalˆencia do conjunto {∅, {∅, {∅}}} e assim por diante. Ali´ as, o n´ umero “zero” ´e o nome dado a ` classe de equivalˆencia de ∅. O n´ umeros naturais seriam ent˜ ao o conjunto de todas as classes de

equivalˆencia constru´ıdas dessa forma. Esta defini¸ca ˜o11 do conceito de n´ umero natural, devida a von Neumann12 , pressup˜ oe apenas conhecidos conceitos primitivos como os de conjuntos, classes de equivalˆencia e de conjunto vazio. O leitor poder´ a encontrar uma discuss˜ ao extensa sobre a defini¸ca ˜o de n´ umeros naturais em [124, 93, 52].

Diz-se que um conjunto A ´e finito se tiver a cardinalidade de {1, . . . , n} para algum n ∈ dito ser infinito se n˜ao for finito. E. 1.22 Exerc´ıcio. 11



. A ´e

Seja A um conjunto finito com n elementos. Mostre que (A) tem 2 n elementos.

J. von Neumann “Zur Einf¨ uhrung transfiniten Zahlen”, Acta Szeged 1 (1923) 199-208. J´ anos von Neumann (1903-1957). Von Neumann tamb´em adotou os nomes de Johann von Neumann e John von Neumann. 12

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

38/1304

6 • Conjuntos Cont´ aveis Um conjunto A ´e dito ser cont´avel se for finito ou se tiver a cardinalidade do conjunto dos n´ umeros naturais, ou seja, se for finito ou se existir uma fun¸ca˜o bijetora f : → A cujo dom´ınio ´e e cuja imagem ´e todo A. 



Nota. Por vezes conjuntos cont´aveis que n˜ao s˜ao finitos s˜ao chamados de conjuntos enumer´aveis. N˜ao h´a, infelizmente, unidade nessa nomenclatura mas empreg´a-la-emos aqui se vier a ser necess´ario. Vamos agora provar alguns teoremas fundamentais sobre conjuntos cont´aveis (cuja importˆancia, apesar da aparente simplicidade dos enunciados, n˜ao pode ser subestimada pois seu alcance estende-se por toda a Matem´atica, em particular, por muito do que veremos no restante do curso). Precisamos da seguinte proposi¸ca˜o: Proposi¸ c˜ ao 1.5 Um conjunto ´e cont´ avel se e somente se for equivalente a um subconjunto de 

. 2

Prova. Por defini¸ca˜o todo conjunto cont´avel A (finito ou n˜ao) ´e equivalente a algum subconjunto de (no pior dos casos ao pr´oprio ). 



Provemos ent˜ao a rec´ıproca. Seja A equivalente a um subconjunto Z de . Se Z for finito A tamb´em o ser´a e portanto cont´avel. Suponhamos ent˜ao que Z n˜ao ´e finito. Vamos construir uma → Z. A mesma ´e definida da seguinte forma fun¸ca˜o bijetora F : 



F (1) = min Z, F (n) = min{Z \ {F (1), F (2), . . . , F (n − 1)}} para n = 2, 3, . . . . ´ f´acil ver que F ´e bijetora e que sua imagem ´e Z (fa¸ca isso). Assim, Z ´e enumer´avel e, portanto, A E tamb´em o ´e. Esta proposi¸ca˜o tem uma conseq¨ uˆencia simples: Proposi¸ c˜ ao 1.6 Se A ´e um conjunto cont´ avel e B ⊂ A ent˜ ao B ´e cont´ avel. Prova. Se A ´e cont´avel e B ⊂ A ent˜ao B ´e equivalente a um subconjunto de proposi¸ca˜o anterior, B ´e cont´avel. 

2 e, portanto, pela

Chegamos um importante teorema: Teorema 1.2 O produto Cartesiano

× 



´e cont´ avel.

2

Prova. Seja a fun¸ca˜o G : × → dada por G(a, b) = 2a 3b . A imagem dessa fun¸ca˜o ´e um subconjunto pr´oprio de mas essa fun¸ca˜o ´e bijetora: a cada elemento z de sua imagem h´a um e 







JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

39/1304

somente um par (a, b) de n´ umeros naturais tais que 2a 3b = z (por quˆe?). Assim, fica provado pela Proposi¸ca˜o 1.5 que × ´e cont´avel. 

Note que, como 



×



n˜ao ´e finito (por quˆe?) ´e um conjunto enumer´avel.

Esse u ´ ltimo teorema tem uma conseq¨ uˆencia de grande importˆancia: Teorema 1.3 O conjunto

+

dos n´ umeros racionais positivos ´e um conjunto cont´ avel.

2

Prova. Todo racional positivo ´e da forma p/q onde p e q ∈ s˜ao irredut´ıveis ou primos entre si (ou seja, n˜ao h´a “cancelamentos” que permitam escrever p/q = a/b com a < p e b < q). Assim, h´a uma correspondˆencia um-a-um entre + e o subconjunto de × formado por todos os pares (p, q) onde p e q s˜ao primos entre si. Como × ´e cont´avel, a Proposi¸ca˜o 1.6 diz ent˜ao que + ´e tamb´em cont´avel. 









E. 1.23 Exerc´ıcio. Prove que o conjunto dos n´umeros inteiros s˜ao conjuntos cont´aveis.

e o conjunto dos n´umeros racionais 6

Um fato tamb´em importante ´e que h´a conjuntos de n´ umeros que n˜ao s˜ao cont´aveis. O exemplo mais importante ´e o dos n´ umeros reais. Teorema 1.4 O conjunto dos n´ umeros reais n˜ ao ´e cont´ avel.

2

Prova. Para provar isso basta mostrar que h´a um subconjunto de que n˜ao ´e cont´avel. Considere o conjunto U de todos os n´ umeros reais do intervalo [0, 1) tais que apenas os d´ıgitos 0 ou 1 aparecem em sua representa¸ca˜o decimal. Por exemplo, n´ umeros como 0, 001101 ou 0, 1 ou 0 ou 0, 1011 ou 1/9 = 0, 11111 . . . s˜ao elementos de U . De modo mais preciso, U ´e o subconjunto do intervalo [0, 1) formado por todos os n´ umeros u que podem pode ser escritos da forma 

u =

∞ X dn (u) , n 10 n=1

onde dn (u) ∈ {0, 1} para todo n ≥ 1. dn (u) ´e o n-´esimo d´ıgito do n´ umero u na base decimal. Note que dois elementos u e v de U s˜ao iguais se e somente se dn (u) = dn (v) para todo n (prove isso!). Vamos provar que U n˜ao ´e um conjunto cont´avel. Para isso vamos supor o oposto, ou seja, que U ´e cont´avel e veremos que essa hip´otese leva a um absurdo. Vamos supor que haja uma fun¸ca˜o bijetora f: → U cuja imagem ´e U . Considere o n´ umero real a definido por 

a =

∞ X 1 − dn (f (n)) . n 10 n=1

Como 1 − dn (f (n)) ´e igual a 0 ou a 1 (por que?), segue obviamente que a ´e um elemento de U .

Entretanto, ´e f´acil ver que a n˜ao faz parte da imagem da fun¸ca˜o f . Para ver isso note que se a fosse um elemento da imagem de f haveria um inteiro m tal que f (m) = a. Mas isso significa ent˜ao que o

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

40/1304

m-´esimo d´ıgito de a seria dm (a) = dm (f (m)). Mas pela defini¸ca˜o do pr´oprio a, o seu m-´esimo d´ıgito ´e 1 − dm (f (m)). Assim, ter´ıamos que dm (f (m)) = 1 − dm (f (m)) o que n˜ao ´e poss´ıvel. Conclu´ımos ent˜ao que a ´e um elemento de U mas n˜ao pode ser um elemento da imagem da fun¸ca˜o f . Isso ´e uma contradi¸ca˜o, pois supomos justamente que a imagem da f era todo o conjunto U . Portanto, U n˜ao ´e cont´avel e, assim, tamb´em n˜ao o ´e. 

´ f´acil ver que, em verdade, poder´ıamos substituir a base decimal, usada na representa¸ca˜o do Nota. E conjunto U acima, por qualquer base b ∈ com b > 2. Ou seja, se considerarmos o conjunto U b de todos os reais u do intervalo [0, 1] represent´aveis na base b, b ∈ , b > 2, da forma 



u =

∞ X dn (u) . n b n=1

onde dn (u) ∈ {0, 1}, ent˜ao, repetindo o que fizemos acima, ver´ıamos que Ub n˜ao ´e cont´avel. Claramente U = U10 . ´ ltima nota pois nele n˜ao vale a unicidade da Nota. O caso da base bin´aria b = 2 foi exclu´ıdo da u representa¸ca˜o dos elementos de U2 na forma ∞ X dn (u) u = . 2n n=1

onde dn (u) ∈ {0, 1}. Para ver isso, fa¸ca o exerc´ıcio seguinte. E. 1.24 Exerc´ıcio. Mostre que na base bin´aria 0, 1 e 0, 01111111 . . . representam o mesmo n´umero, a saber, o n´umero 1/2. Sugest˜ao: use a f´ormula da progress˜ao geom´etrica infinita para calcular quanto vale 0, 01111111 . . .. 6 Nota. Os conjuntos Ub , b > 2, s˜ao exemplos de uma classe de conjuntos chamados de conjuntos de Cantor13 . Tornaremos a reencontrar tais conjuntos quando falarmos de Teoria da Medida (vide Cap´ıtulo 20, especialmente Se¸ca˜o 20.2, p´agina 961.). Ainda sobre os n´ umeros reais, tem-se tamb´em o seguinte fato, que para referˆencia futura formulamos como uma proposi¸ca˜o. Proposi¸ c˜ ao 1.7 

e

2 

tˆem a mesma cardinalidade.

2

´ suficiente mostrar que (0, 1) e (0, 1) × (0, 1) tˆem a mesma cardinalidade, pois a fun¸ca˜o Prova. E x → (1 + tanh(x))/2 ´e uma bije¸ca˜o de em (0, 1). Fixemos para cada x ∈ (0, 1) uma representa¸ca˜o decimal x = 0, d1 d2 d3 . . . com dn ∈ {0, . . . , 9}. Seja F : (0, 1) → (0, 1) × (0, 1) definida por 

F (0, d1 d2 d3 d4 . . .) := ( 0, d1 d3 d5 d7 . . . , F ´e bijetora e F −1 : (0, 1) × (0, 1) → (0, 1) ´e dada por

0, d2 d4 d6 d8 . . . ) .

F −1 (( 0, a1 a2 a3 a4 . . . , 0, b1 b2 b3 b4 . . . )) = 0, a1 b1 a2 b2 a3 b3 a4 b4 . . . .

13

Georg Ferdinand Ludwig Philipp Cantor (1845-1918).

JCABarata. Curso de F´ısica-Matem´ atica

Finalizamos com um outro teorema de grande importˆancia: Teorema 1.5 Se Ci , i ∈ 

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

, s˜ ao conjuntos cont´ aveis ent˜ ao C =

[

i∈

Ci tamb´em o ´e.



41/1304

2

Prova. Se cada Ci ´e cont´avel ent˜ao para cada i ∈ h´a uma fun¸ca˜o bijetora gi : → Ci cuja imagem ´e Ci . Defina-se ent˜ao a fun¸ca˜o G : ( × ) → C dada por G(a, b) = ga (b). Esta fun¸ca˜o n˜ao ´e, em geral, bijetora, pois podem existir elementos comuns entre conjuntos Ci e Cj com i 6= j e ter´ıamos gi (m) = gj (n) para algum n e m. Entretanto, a imagem de G ´e C. 







Considere ent˜ao em × a seguinte rela¸ca˜o de equivalˆencia: o par (a, b) ´e equivalente ao par (c, d) se e somente se ga (b) = gc (d). O conjunto × pode ser ent˜ao, como j´a observamos, escrito como a uni˜ao disjunta de suas classes de equivalˆencia pela rela¸ca˜o acima. Construamos ent˜ao um subconjunto K de × tomando-se um e somente um elemento de cada classe de equivalˆencia escolhido arbitrariamente (usamos aqui o Axioma da Escolha para afirmar que tal constru¸ca˜o ´e poss´ıvel). 











Defina ent˜ao agora a fun¸ca˜o H : K → C dada por H(a, b) = ga (b) para (a, b) ∈ K. Pela pr´opria constru¸ca˜o do conjunto K essa fun¸ca˜o H ´e bijetora e sua imagem ´e C. Como K ´e um subconjunto de × que ´e cont´avel, temos que K tamb´em o ´e e, portanto, C ´e cont´avel. 



• N´ umeros Reais Alg´ ebricos e Transcendentes Na reta real diz-se que um n´ umero x ´e um n´ umero alg´ebrico se x for raiz de um polinˆomio do tipo P (t) = a0 + a1 t + a2 t2 + · · · + an tn , para algum n ∈ , onde os coeficientes a0 , . . . , an s˜ao n´ umeros racionais. Um tal polinˆomio ´e dito ser um polinˆ omio racional. 

Todo n´ umero racional p/q ´e tamb´em alg´ebrico pois ´e raiz do polinˆomio √ racional p − qt. H´a tamb´em muitos n´ umeros irracionais que s˜ao alg´ebricos. Por exemplo, o n´ umero 2 ´e raiz do polinˆomio racional −2 + t2 e, portanto, ´e alg´ebrico. Os n´ umeros reais que n˜ao s˜ao alg´ebricos s˜ao chamados de n´ umeros transcendentes. E. 1.25 Exerc´ıcio. Prove que o conjunto de todos os n´umeros alg´ebricos da reta real ´e um conjunto cont´avel. Use para tal o fato de que os racionais formam um conjunto cont´avel. 6 O exerc´ıcio anterior pode ser usado para concluir que existem n´ umeros transcendentes (que n˜ao s˜ao raiz de nenhum polinˆomio racional) pois os reais, como sabemos, n˜ao s˜ao cont´aveis enquanto, segundo o exerc´ıcio, os alg´ebricos o s˜ao. Deve, portanto, haver uma cole¸ca˜o n˜ao-cont´avel de n´ umeros transcendentes na reta real. Historicamente, a existˆencia de n´ umeros transcendentes foi estabelecida (por outros argumentos) 14 por Liouville em 1851. Em 1874, Cantor15 demonstrou a afirma¸ca˜o do exerc´ıcio acima, provando que 14 15

Joseph Liouville (1809-1882). Georg Ferdinand Ludwig Philipp Cantor (1845-1918).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

42/1304

o conjunto de todos os n´ umeros alg´ebricos da reta real ´e um conjunto cont´avel. E. 1.26 Exerc´ıcio. Seja 0 = e 1 o conjunto dos n´umeros alg´ebricos, definidos como o conjunto de todos os zeros reais de polinˆomios com coeficientes racionais. Definimos 2 como o conjunto de todos os zeros reais de polinˆomios com coeficientes em 1 . Sucessivamente, definimos n , n ≥ S∞1 como o conjunto de todos os zeros reais de polinˆomios com coeficientes em n−1 . Seja tamb´em = n=0 n . Mostre que todos os n e s˜ao conjuntos cont´aveis e, portanto, subconjuntos pr´oprios de . 6 

• Os n´ umeros e e π s˜ ao irracionais e transcendentes Sabe-se que os n´ umeros e e π s˜ao irracionais e transcendentes. As provas de que e e e2 s˜ao irracionais foram primeiramente obtidas por Euler16 em 1737. Uma prova que e ´e irracional pode ser encontrada nestas Notas a` p´agina 836 ou, por exemplo, em [123] ou [55]. A prova de que π ´e irracional n˜ao ´e t˜ao simples quanto a de que e ´e irracional. A demonstra¸ca˜o de que π ´e irracional foi primeiramente obtida por Lambert17 em 1768 e consistiu em provar que se r ´e um n´ umero racional n˜ao-nulo ent˜ao nem er nem tan(r) podem ser racionais. Como tan(π/4) = 1, que ´e racional, segue que π/4 deve ser irracional. A demonstra¸ca˜o de que e ´e transcendente foi obtida pela primeira vez por Hermite 18 em 1873. A demonstra¸ca˜o de que π ´e transcendente foi obtida pela primeira vez por Lindemann19 em 1882. Um fato de grande interesse ´e que provar que π ´e alg´ebrico seria equivalente 20 a resolver o c´elebre problema da quadratura do c´ırculo, que consiste em achar um m´etodo atrav´es do qual, “apenas com r´egua e compasso” constr´oi-se um quadrado cuja a´rea ´e igual a de um c´ırculo de raio 1. √ Tal seria poss´ıvel caso houvessem meios de se construir um segmento de reta cujo comprimento seja π. Esse problema cl´assico da geometria Euclidiana ficou em aberto por cerca de dois mil anos (!), tendo sido resolvido negativamente em 1882 por Lindemann quando este provou, justamente, que π n˜ao ´e um n´ umero alg´ebrico, concluindo assim a impossibilidade da constru¸ca˜o proposta. Para provas de que e ´e transcendente vide, por exemplo, [123] ou [55]. Para provas que π ´e irracional e transcendente e para uma s´erie de outros resultados congˆeneres, vide [55]. • Produtos Cartesianos e Contabilidade ´ interessante notar que produtos Cartesianos cont´aveis de conjuntos cont´aveis n˜ E ao s˜ao, geralmente, conjuntos cont´aveis. Considere como exemplo o produto Cartesiano Y K := {0, 1} = {0, 1} , 

i∈

16



Leonhard Euler (1707-1783). Johann Heinrich Lambert (1728-1777). 18 Charles Hermite (1822-1901). A prova original da transcendˆencia de e encontra-se em Comptes rendus, 77 18-24 (1873). 19 Carl Louis Ferdinand von Lindemann (1852-1939). A prova original da transcendˆencia de π encontra-se em Math. Ann. 20, 213-225 (1882). 20 Para uma bela discuss˜ ao sobre isso, vide [29]. 17

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

43/1304

que ´e denominado espa¸co de Cantor21 . Podemos mostrar que K n˜ao ´e cont´avel. Cada elemento de K ´e uma fun¸ca˜o d : → {0, 1}. Podemos assim associar univocamente a cada d o n´ umero real 

∞ X d(n) n=1

10n

que ´e um elemento do conjunto U ⊂ definido acima. Por outro lado, todo elemento de U pode ser escrito assim para um u ´ nico d ∈ K. Assim, K e U tˆem a mesma cardinalidade e, portanto, K n˜ao ´e cont´avel pois U , como j´a vimos, n˜ao o ´e. 

E. 1.27 Exerc´ıcio. Mostre que todos os conjuntos Ub , definidos acima, com b > 2, tem a mesma cardinalidade de K (e, portanto, a mesma cardinalidade entre si). 6

1.1.4

´Infimos e Supremos de Fam´ılias de Conjuntos

Seja I um conjunto arbitr´ario de ´ındices e {Ai , i ∈ I}\ uma cole¸ca˜o de conjuntos indexados por elementos de I. Chama-se por vezes o conjunto inf Ai := Ai de ´ınfimo da cole¸ca˜o {Ai , i ∈ I} e o i∈I i∈I [ conjunto sup Ai := Ai de supremo da cole¸ca˜o {Ai , i ∈ I}. i∈I

i∈I

Essas no¸co˜es S coincidem com as no¸co˜es de ´ınfimo e supremo apresentadas a` p´agina 35 se considerarmos em X = i∈I Ai a rela¸ca˜o de ordem definida pela inclus˜ao de conjuntos: se A, B ⊂ X dizemos que A  B se A ⊂ B. E. 1.28 Exerc´ıcio. Mostre isso.

6

• Limites do ´Infimo e Limites do Supremo de Fam´ılias de Conjuntos Seja {An , n ∈ } uma cole¸ca˜o cont´avel de subconjuntos de um conjunto X. Define-se um conjunto chamado de limite do ´ınfimo da cole¸ca˜o, denotado por limAn , como sendo o conjunto dado por 

limAn :=

∞ \ ∞ [

Ak .

n=1 k=n

O chamado limite do supremo da cole¸ca˜o, denotado por limAn , ´e o conjunto definido por limAn :=

∞ [ ∞ \

Ak .

n=1 k=n

Se considerarmos a rela¸ca˜o de ordem entreTconjuntos definida pela inclus˜ao de conjuntos, ´e de se notar que a seq¨ uˆencia de conjuntos Bn := ∞ , est´a ordenada de forma crescente k=n Ak , n ∈ (ou seja, uˆencia de conjuntos S Bn  Bm se n ≤ m) e limAn ´e seu supremo. Analogamente, a seq¨ Cn := ∞ A , n ∈ , est´ a ordenada de forma decrescente (ou seja, C  C se n ≥ m) e limAn ´e k n m k=n seu ´ınfimo. 



21

Georg Ferdinand Ludwig Philipp Cantor (1845-1918).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

44/1304

E. 1.29 Exerc´ıcio. Justifique a seguinte afirmativa: limAn ´e o conjunto de todos os pontos x de X que pertencem a todos os conjuntos An exceto a no m´aximo um n´umero finito deles. Dizemos, nesse caso, que x pertence a quase todos os An ’s). 6 E. 1.30 Exerc´ıcio. Justifique a seguinte afirmativa: limAn ´e o conjunto de todos os pontos x de X que pertencem um n´umero infinito de conjuntos An . Dizemos, nesse caso, que x pertence freq¨ uentemente aos An ’s). 6 • Convergˆ encia de seq¨ uˆ encias de conjuntos Chegamos a uma defini¸ca˜o importante: dizemos que uma cole¸ca˜o cont´avel de conjuntos {A n , n ∈ converge a um conjunto A se limAn = limAn = A. 

}

Se uma cole¸ca˜o cont´avel de conjuntos {An , n ∈ } converge a um conjunto A, ent˜ao A ´e dito ser o n→∞ limite de An , e escrevemos, como usualmente, A = lim An , ou ainda An −→ A. 

n→∞

E. 1.31 Exerc´ıcio. Justifique a seguinte afirmativa: lim An s´o existe se n˜ao h´a pontos x ∈ X que, n→∞ simultaneamente, perten¸cam a infinitos conjuntos A n e n˜ao perten¸cam a infinitos conjuntos An . 6 E. 1.32 Exerc´ıcio. Seja a fam´ılia cont´avel de subconjuntos de dada por A n = [0, 10] se n for par e An = [0, 5] se n for ´ımpar. Determine limAn e limAn e limn→∞ An se este existir. 6 

E. 1.33 Exerc´ıcio. Seja a fam´ılia cont´avel de subconjuntos de dada por A n = [0, 1] se n for par e An = [2, 3] se n for ´ımpar. Determine limAn e limAn e lim An , se este existir. 6 

n→∞

E. 1.34 Exerc´ıcio. Seja a fam´ılia cont´avel de subconjuntos de dada por   1 1 An = − , 1+ n+1 n+1 

com n ∈

. Determine limAn , limAn e lim An , se este existir. 

6

n→∞

E. 1.35 Exerc´ıcio. Seja a fam´ılia cont´avel de subconjuntos de dada por   1 1 An = , 1− n+2 n+2 

com n ∈ 

. Determine limAn , limAn e lim An , se este existir.

6

n→∞

E. 1.36 Exerc´ıcio. Crie seus pr´oprios exemplos de fam´ılias cont´aveis A n de subconjuntos de seus limAn , limAn e lim An , se este existir. n→∞



e estude 6

JCABarata. Curso de F´ısica-Matem´ atica

1.2

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

45/1304

Estruturas Alg´ ebricas B´ asicas

Ainda atentos ao car´ater introdut´orio apresentaremos aqui defini¸co˜es e exemplos das estruturas alg´ebricas mais comuns. • Opera¸ co ˜es e Rela¸ co ˜es Sejam C e I dois conjuntos n˜ao-vazios e consideremos o produto Cartesiano C I (o conceito de produto Cartesiano de conjuntos foi definido a` p´agina 28). Uma fun¸ca˜o f : C I → C ´e por vezes dita ser uma opera¸ca ˜o sobre C. Se I ´e um conjunto finito, f ´e dita ser uma opera¸ca ˜o finit´ aria sobre C. Um conjunto R ⊂ C I ´e dito ser uma rela¸ca˜o em C. Se I ´e um conjunto finito, R ´e dito ser uma rela¸ca ˜o finit´ aria em C. • Fun¸ co ˜es Finit´ arias Sejam C e I dois conjuntos e consideremos fun¸co˜es f : C I → C. Se I ´e um conjunto finito f : C I → C ´e dita ser uma fun¸ca ˜o finit´ aria sobre C ou opera¸ca ˜o finit´ aria sobre C. Sem perda de n generalidade consideraremos aqui fun¸co˜es finit´arias do tipo f : C → C para algum n ∈ . Se f ´e uma fun¸ca˜o finit´aria para um dado n, f ´e dita ser uma fun¸ca˜o n-´aria sobre C. Um exemplo de uma fun¸ca˜o n˜ao finit´aria seria uma fun¸ca˜o do tipo f : C → C que a cada seq¨ uˆencia em C associa um elemento de C. 



Fun¸co˜es 2-´arias ser˜ao chamadas aqui de fun¸co ˜es bin´ arias e fun¸co˜es 1-´arias s˜ao chamadas de fun¸co ˜es un´ arias. Por vezes iremos falar tamb´em de fun¸co˜es 0-´arias sobre C, que consistem em fun¸co˜es f : {∅} → C. Uma tal fun¸ca˜o tem por imagem simplesmente um√elemento fixo de C. Exemplos de fun¸co˜es 0-´arias seriam f (∅) = 1 ou f (∅) = 0 ou f (∅) = 2. Freq¨ uentemente denotamos tais fun¸co˜es pelo sobre elemento de C por ela associado. Nos trˆes exemplos acima, poder´ıamos denotar as fun¸co˜es por 1, 0 ou √ 2, respectivamente. 

• Rela¸ co ˜es Finit´ arias H´a uma nomenclatura an´aloga para o caso de rela¸co˜es. Sejam C e I dois conjuntos e consideremos rela¸co˜es R ⊂ C I . Se I ´e um conjunto finito R ´e dita ser uma rela¸ca ˜o finit´ aria sobre C. Sem perda n de generalidade consideraremos aqui rela¸co˜es finit´arias do tipo R ⊂ C para algum n ∈ . Se R ´e uma rela¸ca˜o finit´aria para um dado n, R ´e dita ser uma rela¸ca˜o n-´aria sobre C. Para o caso n = 1 as rela¸co˜es s˜ao tamb´em chamadas de un´arias e para o caso n = 2 s˜ao ditas bin´arias. Rela¸co˜es bin´arias foram estudadas a` p´agina 23. 

• Estruturas Seja C um conjunto, F uma cole¸ca˜o de opera¸co˜es (n˜ao necessariamente finit´arias) sobre C e seja R uma cole¸ca˜o de rela¸co˜es (n˜ao necessariamente finit´arias) em C. A tripla hC, F, Ri ´e dita ser uma estrutura sobre C. Note-se que tanto F quanto R podem ser vazias. Dado que opera¸co˜es sobre um conjunto C tamb´em s˜ao rela¸co˜es sobre C, a defini¸ca˜o de estrutura

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

46/1304

´ por´em conveniente mantˆe-la como est´a, pois fun¸co˜es s˜ao de imacima poderia ser simplificada. E portˆancia especial. Uma estrutura hC, Fi ´e dita ser uma estrutura alg´ebrica e uma estrutura hC, Ri ´e dita ser uma estrutura relacional. • Tipos de Opera¸ co ˜es e de Rela¸ co ˜es Ainda um coment´ario sobre a nomenclatura. Sejam C e I conjuntos e seja α : C I → C uma opera¸ca˜o sobre o conjunto C. A cardinalidade de I ´e dita ser o tipo da opera¸ca ˜o α. Assim, uma fun¸ca˜o n-´aria ´e tamb´em dita ser de tipo n. Analogamente, se R ⊂ C I ´e uma rela¸ca˜o em C a cardinalidade de I ´e dita ser o tipo da rela¸ca˜o R. • Coment´ ario Sobre a Nota¸ c˜ ao Antes de prosseguirmos, fa¸camos uma observa¸ca˜o sobre a nota¸ca˜o que ´e costumeiramente adotada, especialmente quando se trata de fun¸co˜es bin´arias. Dado um conjunto C e uma fun¸ca˜o bin´aria denotada por um s´ımbolo φ, a imagem de um par ´ muito pr´atico, por vezes, usar uma outra nota¸ca˜o (a, b) ∈ C 2 ´e comummente denotada por φ(a, b). E e denotar φ(a, b) por a φ b. Essa nota¸ca˜o ´e denominada mesofixa. Um exemplo claro desse uso est´a umeros complexos. Denotamos +(z, w) na fun¸ca˜o soma, denotada pelo s´ımbolo + : 2 → de dois n´ por z + w. Outro exemplo est´a na fun¸ca˜o produto · : 2 → de dois n´ umeros complexos. Denotamos ·(z, w) por z · w. Essa nota¸ca˜o ser´a usada adiante para outras fun¸co˜es bin´arias al´em das fun¸co˜es soma e produto de n´ umeros ou matrizes.

Fun¸co˜es un´arias tamb´em tˆem por vezes uma nota¸ca˜o especial, freq¨ uentemente do tipo exponencial. Tal ´e o caso da opera¸ca˜o que associa a cada elemento de um grupo a` sua inversa, g 7→ g −1 , ou o caso da opera¸ca˜o que associa a cada conjunto o seu complementar A 7→ A c . Ou ainda o caso da transposi¸ca˜o de matrizes M 7→ M T , da conjuga¸ca˜o de n´ umeros complexos z 7→ z ∗ para o que usa-se tamb´em sabidamente a nota¸ca˜o z 7→ z.

1.2.1

Semi-grupos, Mon´ oides e Grupos

• Semi-grupos Um semi-grupo ´e um conjunto n˜ao-vazio S dotado de uma opera¸ca˜o bin´aria S × S → S denotada por “·” e denominada produto tal que a seguinte propriedade ´e satisfeita. 1. Associatividade. Para todos a, b e c ∈ S vale (a · b) · c = a · (b · c). • Mon´ oides

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

47/1304

Um mon´oide ´e um conjunto n˜ao-vazio M dotado de uma opera¸ca˜o bin´aria M × M → M denotada por “·” e denominada produto tal que as seguintes propriedades s˜ao satisfeitas. 1. Associatividade. Para todos a, b e c ∈ M vale (a · b) · c = a · (b · c). 2. Elemento neutro. Existe um (´ unico!) elemento e ∈ M , denominado elemento neutro, tal que g · e = e · g = g para todo g ∈ M . Observa¸ca ˜o A unicidade do elemento neutro ´e garantida pela observa¸ca˜o que se houvesse e 0 ∈ M tal que g · e0 = e0 · g = g para todo g ∈ M ter´ıamos e0 = e0 · e = e. • Grupos Uma das no¸co˜es mais fundamentais de toda a Matem´atica ´e a de grupo. Um grupo ´e um conjunto n˜ao-vazio G dotado de uma opera¸ca˜o bin´aria G × G → G denotada por “·” e denominada produto e de uma opera¸ca˜o un´aria G → G (bijetora) denominada inversa, denotada pelo expoente “ −1 ”, tais que as seguintes propriedades s˜ao satisfeitas. 1. Associatividade. Para todos a, b e c ∈ G vale (a · b) · c = a · (b · c). 2. Elemento neutro. Existe um (´ unico!) elemento e ∈ G, denominado elemento neutro, tal que g · e = e · g = g para todo g ∈ G. 3. Inversa. Para cada g ∈ G existe um (´ unico!) elemento h ∈ G tal que g · h = h · g = e. Esse elemento ´e denominado a inversa de g e denotado por g −1 . Observa¸co ˜es. 1. A unicidade do elemento neutro ´e garantida pela observa¸ca˜o que se houvesse e 0 tal que g · e0 = e0 · g = g para todo g ∈ G ter´ıamos e0 = e0 · e = e. 2. Analogamente se estabelece a unicidade da inversa, pois se g, h ∈ G s˜ao tais que h · g = g · h = e, teremos g −1 = g −1 · e = g −1 · (g · h) = (g −1 · g) · h = e · h = h. 3. A fun¸ca˜o G 3 g 7→ g −1 ∈ G, que associa cada elemento de G a` sua inversa, ´e um exemplo de uma fun¸ca˜o un´aria. 4. Como e · e = e segue que e−1 = e. 5. Para todo g ∈ G vale (g −1 )−1 = g pois, usando a associatividade, (g −1 )−1 = ( g −1 )−1 · e = (g −1 )−1 · (g −1 · g) = ((g −1 )−1 · g −1 ) · g = e · g = g . Um grupo ´e dito ser comutativo ou Abeliano22 se a · b = b · a para todos a, b ∈ G. Essa nomenclatura se aplica tamb´em a semi-grupos e mon´oides. ´ evidente que todo grupo ´e um mon´oide e que todo mon´oide ´e um semi-grupo. E 22

Niels Henrik Abel (1802-1829).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

48/1304

Existe uma constru¸ca˜o canˆonica devida a Grothendieck, que discutimos a` p´agina 85, que permite construir um grupo Abeliano a partir de um semi-grupo Abeliano dado. Essa constru¸ca˜o ´e importante em v´arias a´reas da Matem´atica. O leitor interessado poder´a passar sem perda a` discuss˜ao da p´agina 85. • Exemplos Simples 1. O conjunto S = {1, 2, 3, . . .} ´e um semi-grupo em rela¸ca˜o a` opera¸ca˜o de soma usual. O conjunto M = {0, 1, 2, 3, . . .} ´e um mon´oide em rela¸ca˜o a` opera¸ca˜o de soma usual, sendo o elemento neutro e = 0. O conjunto G = = {. . . , −2, −1, 0, 1, 2, . . .} ´e um grupo em rela¸ca˜o a` opera¸ca˜o de soma usual, sendo o elemento neutro e = 0 e a inversa n−1 = −n. 2.

dotado da opera¸ca˜o de multiplica¸ca˜o usual ´e um mon´oide onde o elemento neutro ´e o n´ umero 1. N˜ao ´e um grupo, pois 0 n˜ao tem inversa multiplicativa. 

3. O conjunto {x ∈ ´e um mon´oide. 

, x > 0} ´e um semi-grupo Abeliano em rela¸ca˜o a` opera¸ca˜o de soma, mas n˜ao

4. O conjunto + = {x ∈ n˜ao um grupo. 



, x ≥ 0} ´e um mon´oide Abeliano em rela¸ca˜o a` opera¸ca˜o de soma mas

5. O conjunto dos n´ umeros inteiros ´e um grupo Abeliano em rela¸ca˜o a` opera¸ca˜o usual de soma de n´ umeros inteiros. Esse grupo ´e comummente denotado por ( , +), para lembrar o conjunto considerado (no caso, ) e a opera¸ca˜o considerada nesse conjunto (no caso, +) . 6. O conjunto dos n´ umeros racionais ´e um grupo Abeliano em rela¸ca˜o a` opera¸ca˜o usual de soma de n´ umeros racionais. Esse grupo ´e comummente denotado por ( , +). 7. O conjunto \ {0} = {r ∈ , r 6= 0} ´e um grupo Abeliano em rela¸ca˜o a` opera¸ca˜o usual de produto de n´ umeros racionais. Esse grupo ´e comummente denotado por ( , ·). 8. O conjunto dos n´ umeros reais ´e um grupo Abeliano em rela¸ca˜o a` opera¸ca˜o usual de soma de n´ umeros reais. Esse grupo ´e comummente denotado por ( , +). 



9. O conjunto dos n´ umeros complexos ´e um grupo Abeliano em rela¸ca˜o a` opera¸ca˜o usual de soma de n´ umeros complexos. Esse grupo ´e comummente denotado por ( , +). 10. O conjunto \ {0} = {x ∈ , x 6= 0} ´e um grupo Abeliano em rela¸ca˜o a` opera¸ca˜o usual de produto de n´ umeros reais. Esse grupo ´e comummente denotado por ( , ·). 





11. O conjunto \ {0} = {z ∈ , z 6= 0} ´e um grupo Abeliano em rela¸ca˜o a` opera¸ca˜o usual de produto de n´ umeros complexos. Esse grupo ´e comummente denotado por ( , ·). 12. Mat( , n), o conjunto das matrizes complexas n × n com o produto usual de matrizes ´e apenas um mon´oide. 13. Mat( , n), o conjunto das matrizes complexas n × n ´e um grupo em rela¸ca˜o a` opera¸ca˜o de soma de matrizes.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

49/1304

14. O conjunto GL( , n) de todas as matrizes reais n × n com determinante n˜ao-nulo (e, portanto, invert´ıveis) ´e um grupo em rela¸ca˜o a opera¸ca˜o de produto usual de matrizes. GL( , n) ´e n˜aoAbeliano. 



15. O conjunto GL( , n) de todas as matrizes complexas n × n com determinante n˜ao-nulo (e, portanto, invert´ıveis) ´e um grupo em rela¸ca˜o a opera¸ca˜o de produto usual de matrizes. GL( , n) ´e n˜ao-Abeliano. 16. Seja X um conjunto n˜ao-vazio. Ent˜ao (X) ´e um grupo Abeliano em rela¸ca˜o a` opera¸ca˜o de diferen¸ca sim´etrica A4B, A, B ∈ X, definida em (1.2), p´agina 22. De fato, o Exerc´ıcio E. 1.1, p´agina 22, garante associatividade e comutatividade, o elemento neutro ´e o conjunto vazio ∅ e para todo A ∈ (X) tem-se A−1 = A. Verifique! 17. Outro exemplo importante ´e o seguinte. Seja C um conjunto n˜ao-vazio e tomemos S = C C , o conjunto de todas as fun¸co˜es de C em C. Ent˜ao, S ´e um mon´oide com o produto formado pela composi¸ca ˜o de fun¸co˜es: f ◦ g, e onde o elemento neutro ´e a fun¸ca˜o identidade id(s) = s, ∀s ∈ C. O sub-conjunto de C C formado pelas fun¸co˜es bijetoras ´e um grupo n˜ao-Abeliano, onde o produto ´e a composi¸ca˜o de fun¸co˜es, o elemento neutro ´e a fun¸ca˜o identidade e o elemento inverso de uma fun¸ca˜o f : C → C ´e a fun¸ca˜o inversa f −1 . Esse grupo ´e denominado grupo de permuta¸co ˜es do conjunto C e denotado por P erm(C). E. 1.37 Exerc´ıcio. Em caso de d´uvida, prove todas as afirma¸co˜es acima.

6

• Sub-grupos Seja G um grupo em rela¸ca˜o a uma opera¸ca˜o “·” e cujo elemento neutro seja e. Um subconjunto H de G ´e dito ser um sub-grupo de G se for tamb´em por si s´o um grupo em rela¸ca˜o a` mesma opera¸ca˜o, ou seja, se 1. e ∈ H, 2. h1 · h2 ∈ H para todos h1 ∈ H e h2 ∈ H, 3. h−1 ∈ H para todo h ∈ H. Todo grupo G sempre possui pelo menos dois sub-grupos: o pr´oprio G e o conjunto {e} formado apenas pelo elemento neutro de G. ´ f´acil ver que SL( , n), o ´ f´acil verificar que ( , +) e ( , +) s˜ao sub-grupos de ( , +). E E conjunto de todas as matrizes reais n × n com determinante igual a 1, ´e um sub-grupo de GL( , n). Idem para SL( , n) em rela¸ca˜o a GL( , n). 





• Os Grupos

n

O bem conhecido algoritmo de Euclides23 afirma que, dado n ∈ , n > 0, ent˜ao todo n´ umero inteiro z pode ser escrito de maneira u ´ nica na forma z = qn + r, onde q ∈ e r ∈ {0, 1, . . . , n − 1}. 

23

Euclides de Alexandria (≈ 325 A.C, ≈ 265 A.C.).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

50/1304

O n´ umero r ´e denominado resto da divis˜ ao de z por n e ´e tamb´em denotado por r = z mod n. Seja n um inteiro positivo maior ou igual a 2 e seja o conjunto {0, 1, . . . , n − 1}. Vamos definir uma opera¸ca˜o bin´aria em {0, 1, . . . , n − 1}, denominada soma e denotada pelo s´ımbolo “+”, da seguinte forma: α + β = [α + β] mod n para todos α, β ∈ {0, 1, . . . , n − 1}. Acima [α + β] representa a soma usual de n´ umeros inteiros em . E. 1.38 Exerc´ıcio. Prove que a opera¸c˜ao de soma definida acima ´e uma opera¸c˜ao bin´aria de {0, 1, . . . , n− 1} e mostre que a mesma ´e associativa, comutativa e tem 0 como elemento neutro. 6 E. 1.39 Exerc´ıcio. Para cada a ∈ {0, 1, . . . , n − 1}, defina a−1 = (n − a) mod n. Mostre que a−1 ∈ {0, 1, . . . , n − 1} e que a + a−1 = 0. 6 Os dois exerc´ıcios acima provam que {0, 1, . . . , n − 1} ´e um grupo Abeliano em rela¸ca˜o a` opera¸ca˜o de soma definida acima. Esse grupo ´e denominado grupo n . • 

+

estendido

O conjunto + = {x ∈ , x ≥ 0} ´e um semi-grupo Abeliano em rela¸ca˜o a` opera¸ca˜o de soma e em rela¸ca˜o a` opera¸ca˜o de produto e vale ainda a propriedade distributiva a(b + c) = ab + ac. + ´e tamb´em, sabidamente, um conjunto linearmente ordenado pela rela¸ca˜o de ordem usual. 





Vamos abaixo descrever um outro conjunto linearmente ordenado que cont´em + e ´e tamb´em um semi-grupo Abeliano em rela¸ca˜o a` opera¸ca˜o de soma e em rela¸ca˜o a` opera¸ca˜o de produto e vale ainda a propriedade distributiva. 

Definimos um conjunto, que denotaremos por R+ , juntando a + um conjunto formado por um elemento, elemento esse que denotaremos provisoriamente por ω, com ω 6∈ + , para o qual certas rela¸co˜es alg´ebricas ser˜ao definidas. Seja R+ = + ∪ {ω} e definimos as opera¸co˜es de soma e produto em R+ da seguinte forma: se a e b s˜ao elementos de + suas soma e produto s˜ao definidos como usualmente. Fora isso, valem 







1. a + ω = ω + a = ω, para todo a ∈ 

+.

2. ω + ω = ω. 3. aω = ωa = ω, para todo a ∈ 

+,

a 6= 0.

4. 0ω = ω0 = 0. 5. ωω = ω. E. 1.40 Exerc´ıcio. Verifique que R+ ´e um semi-grupo Abeliano em rela¸c˜ao `a opera¸c˜ao de soma e em rela¸c˜ao `a opera¸c˜ao de produto definidas acima e que vale ainda a propriedade distributiva. 6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

51/1304

R+ ´e linearmente ordenado tomando-se em + a rela¸ca˜o de ordem usual e fixando-se a < ω para todo a ∈ + . ´ bastante claro que na defini¸ca˜o abstrata acima o objeto representado pelo s´ımbolo ω desempenha o E papel formalmente desempenhado por um n´ umero infinito positivo. A constru¸ca˜o das rela¸co˜es alg´ebricas acima prescinde, por´em, dessa no¸ca˜o, pois ω pode ser qualquer objeto (fora de + ). 





Com um certo abuso de linguagem, ´e costume, substituir o s´ımbolo ω pelo s´ımbolo ∞, dando ´ comum tamb´em denotar-se a entender que ω representa algo como um n´ umero infinito positivo. E R+ = [0, ∞]. 

E. 1.41 Exerc´ıcio. Que problemas surgem quando se tenta estender a constru¸c˜ao acima para o conjunto de todos os reais? 6

1.2.2

Corpos

Um corpo24 ´e um conjunto n˜ao-vazio C dotado de duas opera¸co˜es bin´arias, denotadas por + e ·, denominadas soma e produto, respectivamente, satisfazendo o seguinte: para α, β e γ ∈ C quaisquer, valem 1. A opera¸ca˜o de soma tem as seguintes propriedades: (a) Comutatividade: α + β = β + α (b) Associatividade: α + (β + γ) = (α + β) + γ (c) Elemento neutro: existe um elemento 0 ∈ C, chamado de zero, tal que α + 0 = α para todo α ∈ C.

(d) Para cada α ∈ C existe um u ´ nico elemento denotado por β com a propriedade α + β = 0. Esse elemento ´e mais comummente denotado por −α. 2. A opera¸ca˜o de produto tem as seguintes propriedades: (a) Comutatividade: α · β = β · α

(b) Associatividade: α · (β · γ) = (α · β) · γ

(c) Elemento neutro: existe um elemento 1 ∈ C, chamado de unidade, tal que α · 1 = α para todo α ∈ C.

(d) Para cada α ∈ C, α 6= 0, existe um u ´ nico elemento denotado por β com a propriedade α · β = 1. Esse elemento ´e mais comummente denotado por α−1 . 3. O produto ´e distributivo em rela¸ca˜o a` adi¸ca˜o: α · (β + γ) = α · β + α · γ. Note-se que corpos s˜ao grupos comutativos em rela¸ca˜o a` opera¸ca˜o de soma e mon´oides comutativos em rela¸ca˜o a` opera¸ca˜o de produto. 24

Em inglˆes a palavra empregada ´e field. A express˜ ao em portuguˆes provavelmente provem do francˆes corp ou do alem˜ ao K¨ orper.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

52/1304

Os elementos de um corpo s˜ao por vezes denominados escalares. ´ f´acil verificar que , Exemplos. E e s˜ao corpos em rela¸ca˜o a`s opera¸co˜es usuais de soma e produto. O conjunto das matrizes n × n para qualquer n ≥ 2 com o produto usual de matrizes n˜ao ´e um corpo pois, entre outras raz˜oes, o produto n˜ao ´e comutativo. 

Em um corpo C sempre vale que α · 0 = 0 para todo α ∈ C. De fato, como 0 = 0 + 0, segue que α · 0 = α · (0 + 0) = α · 0 + α · 0. Somando-se a ambos os lados o elemento inverso −α · 0 teremos α · 0 + (−α · 0) = α · 0 + α · 0 + (−α · 0), ou seja, 0 = α · 0 + 0 = α · 0,

como quer´ıamos provar. Pela comutatividade do produto vale tamb´em 0 · α = 0 para todo α ∈ C. Vamos exibir outros exemplos menos triviais de corpos.

• Os Corpos

√ ( p), com p Primo

√ E. 1.42 Exerc´ıcio. Mostre que o conjunto de todos os n´umeros reais da forma a + b 2, com a e b racionais, ´e um corpo. 6 O corpo do exemplo acima ´e denotado por

√ ( 2).

E. 1.43 Exerc´ıcio. Seja p um n´umero primo. Mostre que o conjunto de todos os n´umeros reais da forma √ a + b p, com a e b racionais, ´e um corpo. 6 O corpo do exemplo acima ´e denotado por

√ ( p).

√ E. 1.44 Exerc´ıcio. Mostre que o conjunto de todos os n´umeros reais da forma a + b 2 com a e b inteiros n˜ ao ´e um corpo. 6 • Os Corpos

p,

com p Primo

O bem conhecido algoritmo de Euclides25 afirma que, dado n ∈ , n > 0, ent˜ao todo n´ umero inteiro z pode ser escrito de maneira u ´ nica na forma z = qn + r, onde q ∈ e r ∈ {0, 1, . . . , n − 1}. 

O n´ umero r ´e denominado resto da divis˜ ao de z por n e ´e tamb´em denotado por r = z mod n.

Seja n um inteiro positivo maior ou igual a 2 e seja n o conjunto {0, 1, . . . , n − 1}. Vamos definir opera¸co˜es de soma e produto em n da seguinte forma: α + β = [α + β] mod n

e

Acima [α + β] e [αβ] s˜ao a soma e o produto usuais em Temos o seguinte teorema: 25

Euclides de Alexandria (≈ 325 A.C, ≈ 265 B.C.).

α · β = [αβ] mod n. .

JCABarata. Curso de F´ısica-Matem´ atica

Teorema 1.6 O conjunto n´ umero primo.

n

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

53/1304

´e um corpo com as opera¸co ˜es acima definidas se e somente se n for um 2

Prova. As opera¸co˜es de soma e produto definidas acima s˜ao automaticamente comutativas, associativas e distributivas (por que?). Fora isso sempre vale que −α = n − α para todo α ∈ n . Resta-nos estudar a existˆencia de elementos inversos α−1 . Vamos supor que n seja um corpo. Ent˜ao, a ∈ {2, . . . , n − 1} tem uma inversa em n , ou seja, um n´ umero b ∈ {1, . . . , n − 1} tal que a · b = 1. Lembrando a defini¸ca˜o de produto em n , isso significa que existe um inteiro r tal que ab = rn + 1. Mas isso implica n 1 b− =r . a a

Como o lado esquerdo n˜ao ´e um n´ umero inteiro, o lado direito tamb´em n˜ao pode ser. Isso diz ent˜ao que n/a n˜ao pode ser inteiro para nenhum a ∈ {2, . . . , n − 1}, ou seja, n n˜ao tem divisores e ´e, portanto, um primo. Resta-nos mostrar que p ´e efetivamente um corpo quando p ´e primo, o que agora se reduz a mostrar que para todo a ∈ p existe um elemento inverso.

Para apresentar a demonstra¸ca˜o, recordemos trˆes conceitos da teoria de n´ umeros. 1. Sejam dois n´ umeros inteiros f e g, dizemos que f divide g se g/f ∈ . Se f divide g, denotamos esse fato por f |g. 2. Sejam dois n´ umeros inteiros f e g. O m´ aximo divisor comum de f e g, denotado mdc(f, g) ´e o maior inteiro m tal que m|f e m|g. 3. Dois n´ umeros inteiros f e g s˜ao ditos ser primos entre si se mdc(f, g) = 1. A demonstra¸ca˜o da existˆencia de inverso em demonstrar a seguinte afirmativa.

p

ser´a apresentada em partes. Vamos primeiro

Lema 1.2 Se f e g s˜ ao dois n´ umeros inteiros quaisquer ent˜ ao existem inteiros k 0 e l0 tais que mdc(f, g) = k 0 f + l0 g. 2 Prova. Seja m = mdc(f, g). Seja M o conjunto de todos os n´ umeros positivos que sejam da forma 0 kf + lg com k e l inteiros. Seja m o menor elemento de M . Note que como os elementos de M s˜ao positivos, esse menor elemento existe. Claramente m0 = k 0 f + l 0 g

(1.19)

para algum k 0 e l0 . Como, por defini¸ca˜o, m|f e m|g, segue que m|m0 , o que s´o ´e poss´ıvel se m0 ≥ m.

(1.20)

Vamos agora demonstrar por contradi¸ca˜o que m0 |f . Se isso n˜ao fosse verdade, existiriam (pelo algoritmo de Euclides) inteiros α e β com 0 < β < m0 (1.21) tal que f = αm0 + β.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

54/1304

Usando (1.19) isso diz que β = f − α(k 0 f + l0 g) = (1 − αk 0 )f + (−αl0 )g. Mas, como β > 0 isso diz que β ∈ M . Logo, β ≥ m0 , contradizendo (1.21). Logo m0 |f . De maneira totalmente an´aloga prova-se que m0 |g. Portanto m0 ≤ mdc(f, g) = m. Lembrando que hav´ıamos provado (1.20), segue que m = m0 e, portanto m = k 0 f + l0 g, demonstrando o Lema. Corol´ ario 1.1 Se f e g s˜ ao dois n´ umeros inteiros primos entre si ent˜ ao existem inteiros k 0 e l0 tais que 1 = k 0 f + l0 g. 2 Prova. Pela defini¸ca˜o, como f e g s˜ao dois n´ umeros inteiros primos entre si segue que mdc(f, g) = 1.

Para finalmente demonstrarmos a existˆencia de inverso em p , com p primo, seja a ∈ {1, . . . , p−1}. ´ E o´bvio que a e p s˜ao primos entre si (por que?). Assim, pelo corol´ario, existem inteiros r e s com 1 = sa − rp. Isso diz que sa = rp + 1. Logo, definindo b ∈

p

como sendo b = s mod p teremos

ba = (s mod p)a = (rp + 1) mod p = 1, ou seja, b = a−1 , completando a demonstra¸ca˜o.

• Caracter´ıstica de um Corpo Seja C um corpo e 1 sua unidade. Para um n´ umero natural n definimos n · 1 = 1| + ·{z · · + 1}. n vezes Define-se a caracter´ıstica de C como sendo o menor n´ umero natural n˜ao-nulo n tal que n · 1 = 0. Se um tal n´ umero n˜ao existir, diz-se que o corpo tem caracter´ıstica zero. √ Exemplos. , , , ( 2) tˆem caracter´ıstica zero. p , p primo, tem caracter´ıstica p. Mostre isso. 

E. 1.45 Exerc´ıcio. Mostre que a caracter´ıstica de um corpo ´e ou igual a zero ou ´e um n´umero primo. Sugest˜ao: Mostre primeiro que (nm) · 1 = (n · 1)(m · 1) para quaisquer n´umeros naturais n e m. Use ent˜ao o fato que todo natural pode ser decomposto em um produto de fatores primos e use o fato que, em um corpo, se a · b = 0 ent˜ao ou a ou b ou ambos s˜ao zero (ou seja, todo corpo ´e um anel de integridade: n˜ao tem divisores de zero). 6

JCABarata. Curso de F´ısica-Matem´ atica

1.2.3

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

55/1304

Espa¸ cos Vetoriais

Um espa¸co vetorial V sobre um corpo K ´e um conjunto de elementos chamados vetores dotado de uma opera¸ca˜o “+”: V × V → V denominada soma e tamb´em de um produto por escalares “·”: K × V → V com as seguintes propriedades: 1. A cada par u, v ∈ V de vetores ´e associado um elemento u + v ∈ V , denominado soma de u e v, com as seguintes propriedades: (a) A soma ´e comutativa: u+v =v+u para todos u, v ∈ V ,

(b) A soma ´e associativa: u + (v + w) = (u + v) + w para todos u, v, w ∈ V ,

(c) Existe um u ´ nico vetor denotado por 0, denominado vetor nulo, tal que u+0=u para todo u ∈ V ,

(d) A cada u ∈ V existe associado um u ´ nico vetor denotado por −u tal que u + (−u) = 0. 2. A cada par α ∈ K, u ∈ V existe associado um vetor denotado por α · u ∈ V , denominado produto de u por α, de forma que (a) O produto por escalares ´e associativo: α · (β · u) = (αβ) · u, para todos α, β ∈ K e u ∈ V , onde αβ ´e o produto de α por β em K,

(b) 1 · u = u para todo u ∈ V , onde 1 ´e a unidade de K,

(c) O produto por escalares ´e distributivo em rela¸ca˜o a` soma de vetores: α · (u + v) = α · u + α · v, para todo α ∈ K e todos u, v ∈ V ,

(d) O produto por escalares ´e distributivo em rela¸ca˜o a` soma de escalares: (α + β) · u = α · u + β · u, para todos α, β ∈ K e todo u ∈ V . Note-se que espa¸cos vetoriais s˜ao grupos comutativos em rela¸ca˜o a` opera¸ca˜o de soma.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

56/1304

E. 1.46 Exerc´ıcio. Mostre usando os postulados acima que 0·u = 0 para todo u ∈ V , onde, permitindonos um certo abuso de linguagem, o 0 do lado esquerdo representa o zero do corpo K e o do lado direito o vetor nulo de V . 6 Nomenclatura. Os elementos de um corpo sobre os quais um espa¸co vetorial se constitui s˜ao freq¨ uentemente denominados escalares. ´ freq¨ Nota¸ca ˜o. E uente omitir-se o s´ımbolo “·” de produto por escalares quando nenhuma confus˜ao ´e poss´ıvel. Anti-exemplo. Tomemos o conjunto dos reais com a opera¸ca˜o de soma usual, um corpo p com p primo e o produto p × → , α · x, α ∈ p e x ∈ dada pelo produto usual em . Essa estrutura n˜ ao forma um espa¸co vetorial. A regra distributiva 







(α + β) · x = α · x + β · x n˜ao ´e satisfeita para todo α, β ∈

p.

Acima, α · x ´e o produto usual em 

.

* ´ quase desnecess´ario mencionar o qu˜ao importantes espa¸cos vetoriais s˜ao no contexto da F´ısica, E onde, por´em, quase somente espa¸cos vetoriais sobre o corpo dos reais ou dos complexos aparecem. Discutiremos mais aspectos b´asicos da teoria dos espa¸cos vetoriais na Se¸ca˜o 2.1, p´agina 94. *

1.2.4

´ An´ eis, Algebras e M´ odulos

• An´ eis Um anel ´e um conjunto A dotado de duas opera¸co˜es bin´arias denotadas por “+” e “·” e denominadas soma e produto, respectivamente, tais que A ´e um grupo Abeliano em rela¸ca˜o a` opera¸ca˜o de soma e um semi-grupo em rela¸ca˜o a` opera¸ca˜o de produto. Por fim, a opera¸ca˜o de produto ´e distributiva em rela¸ca˜o a` soma: para quaisquer a, b e c ∈ A valem a · (b + c) = a · b + a · c e (a + b) · c = a · c + b · c. Como usual, denotamos por −a a inversa aditiva do elemento a de um anel.

Se 0 ´e o elemento neutro de um anel A em rela¸ca˜o a` opera¸ca˜o de soma, ent˜ao a · 0 = 0 pois, como 0 = 0 + 0, tem-se pela propriedade distributiva a · 0 = a · 0 + a · 0, que implica 0 = a · 0 − (a · 0) = a · 0 + a · 0 − (a · 0) = a · 0. ´ • Algebras Uma a´lgebra ´e um espa¸co vetorial V sobre um corpo K dotado de uma opera¸ca˜o de produto bin´aria “·” dita produto da a´lgebra, de modo que as seguintes propriedades s˜ao satisfeitas

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

57/1304

1. O produto da a´lgebra ´e distributivo em rela¸ca˜o a soma vetorial: para todos a, b e c ∈ V valem a · (b + c) = a · b + a · c e (a + b) · c = a · c + b · c. 2. O produto por escalares comuta com o produto da a´lgebra e ´e distributivo em rela¸ca˜o a ele: para todos a, b ∈ V e α ∈ K vale α(a · b) = (αa) · b = a · (αb). Uma a´lgebra V ´e dita ser uma a ´lgebra comutativa ou uma a ´lgebra Abeliana 26 se para todos a, b ∈ V tivermos a · b = b · a. Uma a´lgebra V ´e dita ser uma a ´lgebra associativa se para todos a, b e c ∈ V tivermos a · (b · c) = (a · b) · c. ´ Algebras associativas s˜ao an´eis. Nota¸ca ˜o. Se A ´e uma a´lgebra associativa, podemos sem ambig¨ uidade denotar o produto de dois de seus elementos a, b ∈ A simplesmente por por ab. Pela mesma raz˜ao, em uma a´lgebra associativa produtos triplos como a(bc) e (ab)c podem ser escritos sem ambig¨ uidade como abc. Devemos dizer que h´a muitas a´lgebras importantes encontradas na F´ısica que n˜ao s˜ao nem comutativas nem associativas. Por exemplo, a a´lgebras do produto vetorial em 3 n˜ao ´e nem comutativa nem associativa. 

´ • Algebras de Lie Uma classe especialmente importante de a´lgebras n˜ao-comutativas e n˜ao-associativas ´e formada pelas chamadas a ´lgebras de Lie. Uma a´lgebra L (sobre um corpo K) ´e dita ser uma a ´lgebra de Lie27 se seu produto, al´em das propriedades 1 e 2 da p´agina 56, satisfizer 1. Anti-comutatividade. Para todos a, b ∈ L vale a · b = −b · a. 2. Identidade de Jacobi28 . Para todos a, b e c ∈ L vale a · (b · c) + c · (a · b) + b · (c · a) = 0.

(1.22)

Por raz˜oes hist´oricas o produto de dois elementos de uma a´lgebra de Lie ´e denotado pelo s´ımbolo [a, b] em lugar de a · b. 26

Niels Henrik Abel (1802-1829). Marius Sophus Lie (1842-1899). 28 Carl Gustav Jacob Jacobi (1804-1851). 27

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

58/1304

Seja A uma a´lgebra associativa. Podemos associar a A uma a´lgebra de Lie definindo o produto [a, b] = ab − ba para a, b ∈ A. A anti-comutatividade ´e o´bvia e a identidade de Jacobi segue do fato que [a, [b, c]] + [c, [a, b]] + [b, [c, a]] = a(bc − cb) − (bc − cb)a + c(ab − ba) − (ab − ba)c + b(ca − ac) − (ca − ac)b = abc − acb − bca + cba + cab − cba − abc + bac + bca − bac − cab + acb = 0, como facilmente se constata. ´ • Exemplos B´ asicos de Algebras de Lie Todos os exemplos aqui exibidos s˜ao relevantes na teoria dos grupos de Lie. E. 1.47 Exerc´ıcio. Mostre que

3 

dotado do produto vetorial usual ´e uma ´algebra de Lie.

6

E. 1.48 Exerc´ıcio. Mostre que Mat ( , n) (ou Mat ( , n)), o conjunto de todas as matrizes n × n reais (complexas) ´e uma ´algebra de Lie com rela¸c˜ao ao produto [A, B] = AB − BA. 6 

E. 1.49 Exerc´ıcio. Mostre que o subconjunto de Mat ( , n) (ou de Mat ( , n)) formado pelas matrizes com tra¸co nulo ´e uma ´algebra de Lie com rela¸c˜ao ao produto [A, B] = AB − BA. 6 

E. 1.50 Exerc´ıcio. Mostre que o subconjunto de Mat ( , n) (ou de Mat ( , n)) formado pelas matrizes anti-sim´etricas, ou seja, tais que AT = −A, ´e uma ´algebra de Lie com rela¸c˜ao ao produto [A, B] = AB − BA. 6 

E. 1.51 Exerc´ıcio. Mostre que o subconjunto de Mat ( , n) formado pelas matrizes anti-autoadjuntas, ou seja, tais que A∗ = −A, ´e uma ´algebra de Lie (sobre o corpo dos reais!) com rela¸c˜ao ao produto [A, B] = AB − BA. 6 E. 1.52 Exerc´ıcio. Conclua igualmente que o subconjunto de Mat ( , n) formado pelas matrizes antiautoadjuntas, ou seja, tais que A∗ = −A, e de tra¸co nulo (Tr(A) = 0) ´e uma ´algebra de Lie (sobre o corpo dos reais!) com rela¸c˜ao ao produto [A, B] = AB − BA. 6 E. 1.53 Exerc´ıcio. Fixada uma matriz B ∈ Mat ( , n), mostre que o subconjunto de Mat ( , n) formado pelas matrizes A com a propriedade AB = −BAT ´e uma ´algebra de Lie real com rela¸c˜ao ao produto [A, B] = AB − BA. 6 



E. 1.54 Exerc´ıcio. Fixada uma matriz B ∈ Mat ( , n), mostre que o subconjunto de Mat ( , n) formado pelas matrizes A com a propriedade AB = −BA∗ ´e uma ´algebra de Lie real com rela¸c˜ao ao

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

59/1304

produto [A, B] = AB − BA.

6

Tratemos agora de exibir um exemplo b´asico de uma a´lgebra de Lie de dimens˜ao infinita. • Colchetes de Poisson Sejam f (p, q) e g(p, q), com f : 2 → e g : 2 → , duas fun¸co˜es reais, infinitamente diferenci´aveis, de duas vari´aveis reais p e q. Definimos os colchetes de Poisson 29 de f e g, denotados por {f, g}, por ∂f ∂g ∂f ∂g − . {f, g} := ∂p ∂q ∂q ∂p 







´ claro que {f, g} ´e igualmente uma fun¸ca˜o infinitamente diferenci´avel de p e q. E

Os colchetes de Poisson satisfazem as seguintes propriedades: para quaisquer fun¸co˜es f, g e h como acima, valem 1. Linearidade. {f, αg + βh} = α{f, g} + β{f, h} para quaisquer α, β ∈ {αf + βg, h} = α{f, h} + β{g, h}. 

. Analogamente

2. Anti-simetria. {f, g} = −{g, f }. 3. Identidade de Jacobi30 . {f, {g, h}} + {h, {f, g}} + {g, {h, f }} = 0. 4. Identidade de Leibniz31 . {f, gh} = {f, g}h + g{f, h}. E. 1.55 Exerc´ıcio importante. Verifique a validade das quatro propriedades acima.

6

As propriedades 1 e 2 e 3 indicam que o conjunto das fun¸co˜es 2 → infinitamente diferenci´aveis ´e uma a´lgebra de Lie com o produto definido pelos colchetes de Poisson. Trata-se de uma a´lgebra de Lie de dimens˜ao infinita. 



A defini¸ca˜o acima dos colchetes de Poisson pode ser facilmente generalizada para variedades diferenci´aveis de dimens˜ao par, mas n˜ao trataremos disso aqui por ora. Os colchetes de Poisson desempenham um papel importante na Mecˆanica Cl´assica. E. 1.56 Exerc´ıcio. Mostre que matrizes A, B, C de Mat ( , n) (ou de Mat ( , n)) tamb´em satisfazem uma identidade de Leibniz: [A, BC] = [A, B]C + B[A, C]. Em verdade, essa identidade ´e v´alida em qualquer ´algebra associativa. Mostre isso tamb´em (a prova ´e idˆentica ao caso de matrizes). 6 

• M´ odulos Seja A um anel. Um A-m´ odulo a ` esquerda ´e um grupo Abeliano M (cujo produto, seguindo a conven¸ca˜o, denotaremos por “+”) dotado de uma fun¸ca˜o A × M → M que a cada par a ∈ A, m ∈ M 29

Sim´eon Denis Poisson (1781-1840). Carl Gustav Jacob Jacobi (1804-1851). 31 Gottfried Wilhelm von Leibniz (1646-1716).

30

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

60/1304

associa um elemento de M denotado por a · m com as seguintes propriedades: para todos a, b ∈ A e todos m, n ∈ M 1. a · (m + n) = a · m + a · n, 2. (a + b) · m = a · m + b · m, 3. a · (b · m) = (ab) · m, 4. Se A possuir uma identidade e, ent˜ao e · m = m. Seja A um anel. Um A-m´ odulo a ` direita ´e um grupo Abeliano M dotado de uma fun¸ca˜o M ×A → M que a cada par a ∈ A, m ∈ M associa um elemento de M denotado por m · a com as seguintes propriedades: para todos a, b ∈ A e todos m, n ∈ M 1. (m + n) · a = m · a + n · a, 2. m · (a + b) = m · a + m · b, 3. (m · b) · a = m · (ba), 4. Se A possuir uma identidade e, ent˜ao m · e = m. Sejam A e B dois an´eis. Um bim´ odulo em rela¸ca˜o a A e B ´e um grupo Abeliano M dotado de duas fun¸co˜es A × M → M e M × B → M que a cada a ∈ A, b ∈ B e m ∈ M associam elementos de M denotados por a · m e m · b, respectivamente, de modo que M seja um A-m´odulo a` esquerda e um B-m´odulo a` direita e de modo que valha 1. a · (m · b) = (a · m) · b para todos a ∈ A, b ∈ B, m ∈ M .

1.2.5

Mais sobre An´ eis

Apresentaremos em seq¨ uˆencia uma s´erie de defini¸co˜es ap´os as quais discutiremos exemplos relevantes. • An´ eis com Unidade Um anel com unidade ´e um anel R com a propriedade de existir em R um elemento 1, chamado de unidade, com 1 6= 0, tal que a · 1 = 1 · a = a para todo a ∈ R. • An´ eis sem Divisores de Zero Dado um anel R um elemento n˜ao-nulo a ∈ R ´e dito ser um divisor de zero se existir pelo menos um b ∈ R com b 6= 0 tal que a · b = 0 ou b · a = 0.

Se em um dado anel a rela¸ca˜o a · b = 0 s´o for poss´ıvel se a = 0 ou b = 0 ou ambos, ent˜ao esse anel ´e dito ser um anel sem divisores de zero.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

61/1304

Exemplos. e s˜ao an´eis sem divisores de zero (com os produtos e somas usuais), mas os an´eis Mat(n, ), n > 1, tˆem divisores de zero (com o produto e soma usual), pois tem-se, por exemplo,      0 0 0 0 1 0 . = 0 0 0 1 0 0 

E. 1.57 Exerc´ıcio. divisores de zero?

Mostre que em

E. 1.58 Exerc´ıcio. Mostre que em

4

tem-se 2 · 2 = 0, ou seja, 2 ´e um divisor de zero. H´a outros 6

existem divisores de zero caso n n˜ao seja um n´umero primo. 6

n

• An´ eis de Integridade Um anel comutativo (ou seja, cujo produto ´e comutativo), com unidade e sem divisores de zero ´e dito ser um anel de integridade ou tamb´em um dom´ınio de integridade. Para a rela¸ca˜o entre an´eis de integridade e corpos, vide adiante. • An´ eis de Divis˜ ao Um anel R ´e dito ser um anel de divis˜ ao se possuir uma unidade multiplicativa 1, i.e., um elemento tal que para todo a ∈ R vale a · 1 = 1 · a = a e se para todo a ∈ R, a 6= 0, existir uma inversa multiplicativa em R, ou seja, um elemento denotado por a−1 tal que a · a−1 = a−1 · a = 1. E. 1.59 Exerc´ıcio importante. Mostre que um anel de divis˜ao n˜ao pode possuir divisores de zero. Portanto, todo anel de divis˜ao comutativo ´e tamb´em um anel de integridade. 6 Exemplos. Com as defini¸co˜es usuais , e s˜ao an´eis de divis˜ao mas n˜ao o ´e (falta a inversa). Mat(n, ) com n > 1 tamb´em n˜ao ´e um anel de divis˜ao com as defini¸co˜es usuais pois nem toda a matriz ´e invert´ıvel. 

Outro exemplo de anel de divis˜ao (n˜ao comutativo!) s˜ao os quat´ernions, que ser˜ao discutidos a` p´agina 88. ´ • Algebras de Divis˜ ao Uma a´lgebra A ´e dita ser uma a ´lgebra de divis˜ ao se possuir uma unidade multiplicativa 1, i.e., um elemento tal que para todo a ∈ A vale a · 1 = 1 · a = a e se para todo a ∈ A, a 6= 0, existir uma inversa multiplicativa em A, ou seja, um elemento denotado por a−1 tal que a · a−1 = a−1 · a = 1. • Corpos Todo anel de divis˜ao cujo produto “·” ´e comutativo ´e um corpo (verifique). • Corpos N˜ ao-comutativos

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

62/1304

Como a u ´ nica distin¸ca˜o entre as defini¸co˜es de corpos e de an´eis de divis˜ao ´e que para os primeiros a comutatividade do produto ´e requerida, diz-se tamb´em por vezes que an´eis de divis˜ao n˜ao-comutativos s˜ao corpos n˜ ao-comutativos. • Corpos e An´ eis de Integridade ´ bem claro pelas defini¸co˜es que todo corpo ´e tamb´em um anel de integridade. A reciproca ´e E parcialmente v´alida: Teorema 1.7 Todo anel de integridade finito ´e um corpo.

2

Prova. Se A ´e um anel de integridade, tudo que precisamos ´e mostrar que todo elemento n˜ao-nulo de A ´e invert´ıvel. Seja a um elemento de A \ {0}. Definamos a aplica¸ca˜o α : A \ {0} → A dada por α(y) = ay. Note que, como A ´e um anel de integridade o lado direito ´e n˜ao nulo pois nem a nem y o s˜ao. Assim, α ´e, em verdade, uma aplica¸ca˜o de A \ {0} em A \ {0} e, como tal, ´e injetora, pois se ay = az, segue que a(y − z) = 0, o que s´o ´e poss´ıvel se y = z, pois A ´e um anel de integridade e a 6= 0. Agora, uma aplica¸ca˜o injetora de um conjunto finito em si mesmo tem necessariamente que ser sobrejetora (por que?). Assim, α ´e uma bije¸ca˜o de A \ {0} sobre si mesmo. Como 1 ∈ A \ {0}, segue que existe y ∈ A \ {0} tal que ay = 1, ou seja, a tem uma inversa. Como a ´e um elemento arbitr´ario de A \ {0}, segue que todo elemento de A \ {0} tem inversa e, portanto, A ´e um corpo. An´eis de integridade infinitos n˜ao s˜ao necessariamente corpos: Anti-exemplo. Um exemplo de um anel de integridade que n˜ao ´e um corpo ´e o conjunto de todos os polinˆomios de em com o produto e soma usuais. Em verdade, os u ´ nicos polinˆomios que tˆem inverso multiplicativo s˜ao os polinˆomios constantes n˜ao-nulos.

1.2.6

A¸ co ˜es e Representa¸ co ˜es

• A¸ co ˜es Seja M um conjunto n˜ao-vazio e G um grupo. Uma fun¸ca˜o α : G × M → M ´e dita ser uma a¸ca ˜o a ` esquerda de G sobre M se as seguintes condi¸co˜es forem satisfeitas: 1. Para todo g ∈ G a fun¸ca˜o α(g, ·) : M → M ´e bijetora32 . 2. Se e ´e a identidade de G ent˜ao α(e, ·) : M → M ´e a fun¸ca˜o identidade: α(e, x) = x para todo x ∈ M.

32

Para g ∈ G fixo, α(g, ·) : M → M denota a fun¸ca ˜o M 3 m 7→ α(g, m) ∈ M , ou seja, a fun¸ca ˜o que a cada m ∈ M associa α(g, m) ∈ M .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

63/1304

3. Para todos g, h ∈ G e todo x ∈ M vale α(g, α(h, x)) = α(gh, x).

(1.23)

Uma fun¸ca˜o β : G × M → M ´e dita ser uma a¸ca ˜o a ` direita de G sobre M se as seguintes condi¸co˜es forem satisfeitas 1. Para todo g ∈ G a fun¸ca˜o β(g, ·) : M → M ´e bijetora. 2. Se e ´e a identidade de G ent˜ao β(e, ·) : M → M ´e a fun¸ca˜o identidade: β(e, x) = x para todo x ∈ M. 3. Para todos g, h ∈ G e todo x ∈ M vale β(g, β(h, x)) = β(hg, x).

(1.24)

Note-se que a distin¸ca˜o b´asica entre (1.23) e (1.24) ´e a ordem do produto no grupo. Se G ´e Abeliano n˜ao h´a distin¸ca˜o entre uma a¸ca˜o a` direita ou a` esquerda. E. 1.60 Exerc´ıcio. Seja α : G × M → M uma a¸c˜ao `a esquerda de um grupo G em um conjunto M . Mostre que β : G × M → M definida por β(g, x) = α(g −1 , x) ´e uma a¸c˜ao `a direita de G em M . 6

´ freq¨ E uente encontrar-se outras nota¸co˜es para designar a¸co˜es de grupos em conjuntos. Uma a¸ca˜o a` esquerda α(g, x) ´e freq¨ uentemente denotada por αg (x), de modo que a rela¸ca˜o (1.23) fica αg (αh (x)) = αgh (x). Para uma a¸ca˜o a` direita, (1.24) fica βg (βh (x)) = βhg (x). Talvez a nota¸ca˜o mais conveniente seja denotar uma a¸ca˜o a` esquerda α(g, x) simplesmente por g · x ou apenas gx. A rela¸ca˜o (1.23) fica g(hx) = (gh)x. Para uma a¸ca˜o a` direita β(g, x) a nota¸ca˜o fica x · g, ou apenas xg, de modo que (1.24) fica (xh)g = x(hg). Essa nota¸ca˜o justifica o uso da nomenclatura a ` direita ou a ` esquerda para classificar as a¸co˜es.

Seja F uma cole¸ca˜o de fun¸co˜es bijetoras de um conjunto M em si mesmo. Uma a¸ca˜o α : G×M → M ´e dita ser uma a¸ca ˜o de G em M pela fam´ılia F se para todo g ∈ G as fun¸co˜es α(g, ·) : M → M forem elementos do conjunto F. E. 1.61 Exerc´ıcio. Seja G = SO(n) o grupo de todas as matrizes reais n × n ortogonais (ou seja, tais que RT = R−1 , onde RT denota a transposta de R). Seja M o conjunto de todas as matrizes reais n × n sim´etricas (ou seja, tais que AT = A). Mostre que αR (A) := RART , com R ∈ SO(n) e A ∈ M, ´e uma a¸c˜ao `a esquerda de G em M . Com as mesmas defini¸co˜es, mostre que β R (A) := RT AR ´e uma a¸c˜ao `a direita de G em M. Sugest˜ ao. O u ´nico ponto que poderia ser dif´ıcil para alguns seria mostrar que, para cada R fixo, α R ´e bijetora, ou seja, ´e sobrejetora e injetora. Para mostrar que α R ´e sobrejetora, note que se A ´e uma matriz sim´etrica qualquer, podemos trivialmente escrever A = R(R T AR)RT , mostrando que A = αR (B), onde B = RT AR ´e sim´etrica. Para provar que αR ´e injetora note que, se RA1 RT = RA2 RT , segue facilmente, multiplicando-se por RT `a esquerda e por R `a direita, que A1 = A2 . 6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

64/1304

E. 1.62 Exerc´ıcio. Seja G = SU(n) o grupo de todas as matrizes complexas n × n unit´arias (ou seja, tais que U ∗ = U −1 , onde U ∗ denota a adjunta de U : U ∗ = U T ). Seja M o conjunto de todas as matrizes complexas n × n Hermitianas (ou seja, tais que A∗ = A). Mostre que αU (A) := U AU ∗ , com U ∈ SU(n) e A ∈ M, ´e uma a¸c˜ao `a esquerda de G em M. Com as mesmas defini¸co˜es, mostre que β U (A) := U ∗ AU ´e uma a¸c˜ao `a direita de G em M. 6 ´ • Orbita de uma a¸ c˜ ao Seja G um grupo e α : G × M → M uma a¸ca˜o (`a esquerda ou a` direita) de G sobre um conjunto n˜ao-vazio M . Para m ∈ M , definimos a o ´rbita de m pela a¸ca˜o α como sendo o conjunto Orb α (m) := {αg (m), g ∈ G} ⊂ M . Claro est´a que para todo m ∈ M vale m ∈ Orbα (m).

E. 1.63 Exerc´ıcio. Mostre que para todo m ∈ M vale a afirma¸c˜ao que para todo m 0 ∈ Orbα (m) tem-se Orbα (m0 ) = Orbα (m). 6 E. 1.64 Exerc´ıcio. Concl´ua que se existe m ∈ M tal que Orbα (m) = M , ent˜ao Orbα (m0 ) = M para todo m0 ∈ M . 6 • Transitividade e Espa¸ cos Homogˆ eneos O fato descrito no Exerc´ıcio E. 1.64 conduz naturalmente a`s seguintes defini¸co˜es. Seja G um grupo e α : G × M → M uma a¸ca˜o (`a esquerda ou a` direita) de G sobre um conjunto n˜ao-vazio M . Dizemos que α age transitivamente em M se existir m ∈ M tal que {α g (m), g ∈ G} = M . Em palavras, α age transitivamente em M se existir pelo menos um elemento de M cuja o´rbita ´e todo M . Pelo Exerc´ıcio E. 1.63, se um elemento de M possui essa propriedade, ent˜ao todos a possuem. Se uma a¸ca˜o α age transitivamente em M dizemos que M ´e um espa¸co homogˆeneo do grupo G pela a a¸ca˜o α, ou simplesmente um espa¸co homogˆeneo do grupo G. • Representa¸ co ˜es de Grupos Uma representa¸ca˜o de um grupo ´e uma a¸ca˜o a esquerda do mesmo em um espa¸co vetorial pela fam´ılia das aplica¸co˜es lineares invert´ıveis agindo nesse espa¸co vetorial. Sejam G um grupo e V um espa¸co vetorial sobre um corpo K. Uma representa¸ca˜o de G em V ´e uma fun¸ca˜o π : G × V → V tal que para todo g ∈ G as fun¸co˜es π(g, ·) : V → V sejam lineares e bijetivas e satisfazem π(e, v) = v e π(g, π(h, v)) = π(gh, v) para todos g, h ∈ G e todo v ∈ V . Devido a` linearidade ´e conveniente denotar π(g, v) por π(g)v. Uma representa¸ca˜o satisfaz assim:

1. Para todo g ∈ G, π(g) ´e uma aplica¸ca˜o linear bijetora de V em V : π(g)(αu + βv) = απ(g)u + βπ(g)v para todos α, β ∈ K e todos u, v ∈ V .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

65/1304

2. π(e) = , o operador identidade em V . 3. Para todos g, h ∈ G vale

π(g)π(h) = π(gh).

´ • Representa¸ co ˜es de Algebras Seja A uma a´lgebra sobre um corpo K e V um espa¸co vetorial sobre o mesmo corpo. Uma representa¸ca˜o de A em V ´e uma fam´ılia de fun¸co˜es lineares de V em V , {π(a), a ∈ A}, satisfazendo 1. Para todo a ∈ A, π(a) : V → V ´e uma aplica¸ca˜o linear, ou seja π(a)(αu + βv) = απ(a)u + βπ(a)v para todos α, β ∈ K e todos u, v ∈ V . 2. Para todos α, β ∈ K e todos a, b ∈ A vale π(αa + βb) = απ(a) + βπ(b). 3. Para todos a, b ∈ A

π(ab) = π(a)π(b).

Uma representa¸ca˜o π de uma a´lgebra A em um espa¸co vetorial V ´e dita ser uma representa¸ca ˜o fiel se π(a) = 0 s´o ocorrer para a = 0. Uma representa¸ca˜o π de uma a´lgebra A em um espa¸co vetorial V ´e dita ser uma representa¸ca ˜o n˜ ao-degenerada se π(a)v = 0 para todo a ∈ A s´o ocorrer para v = 0.

1.2.7

Morfismos, Homomorfismos, Epimorfismos, Isomorfismos, Monomorfismos, Endomorfismos e Automorfismos

Dos radicais gregos h´ omos: semelhante, igual; m´ onos: um, sozinho; epi: sobre; ´ısos: semelhante, igual; endon: para dentro, dentro; aut´ os: pr´ oprio, mesmo e morph´ e: forma.

Nesta se¸ca˜o nos limitaremos a listar algumas defini¸co˜es b´asicas que ser˜ao usadas e desenvolvidas no restante do texto, onde tamb´em exemplos ser˜ao apresentados. A pretens˜ao n˜ao ´e a de desenvolver os assuntos, mas de apresentar as defini¸co˜es para referˆencia futura. Em termos informais um morfismo entre duas estruturas de um mesmo tipo (dois grupos, dois espa¸cos vetoriais, duas a´lgebras, dois an´eis etc.) ´e uma fun¸ca˜o entre as mesmas que respeita as opera¸co˜es de produto l´a definidas. • Morfismos em Grupos Dados dois grupos G e H, com unidades eG e eH , respectivamente, uma fun¸ca˜o φ : G → H ´e dita ser um homomorfismo ou morfismo de grupos se φ(eG ) = eH e se φ(a · b) = φ(a) · φ(b) para todos a, b ∈ G.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

66/1304

Dados dois grupos G e H, com unidades eG e eH , respectivamente, uma fun¸ca˜o φ : G → H ´e dita ser um anti-homomorfismo se φ(eG ) = eH e se φ(a · b) = φ(b) · φ(a) para todos a, b ∈ G. Por exemplo, a aplica¸ca˜o φ : G → G tal que φ(g) = g −1 ´e um anti-homomorfismo (verifique). Um homomorfismo φ : G → H entre dois grupos ´e dito ser um monomorfismo se for injetivo. Um homomorfismo φ : G → H entre dois grupos ´e dito ser um epimorfismo se for sobrejetor.

Um homomorfismo φ : G → H entre dois grupos ´e dito ser um isomorfismo se for bijetor, em cujo caso a aplica¸ca˜o inversa φ−1 : H → G ´e tamb´em um homomorfismo.

Se dois grupos G e H forem tais que exista um isomorfismo φ entre ambos dizemos que G e H s˜ao isomorfos (por φ) e denotamos esse fato por G 'φ H, ou simplesmente por G ' H. E. 1.65 Exerc´ıcio importante. equivalˆencia.

Mostre que a rela¸c˜ao de isomorfia entre grupos ´e uma rela¸c˜ao de 6

Um homomorfismo ρ de um grupo G em si mesmo ρ : G → G ´e dito ser um endomorfismo de G. Um isomorfismo α de um grupo G em si mesmo α : G → G ´e dito ser um automorfismo de G.

Um exemplo b´asico de automorfismo ´e o seguinte: seja g ∈ G fixo. Definimos αg : G → G por αg (a) = g −1 ag para todo a ∈ G. E. 1.66 Exerc´ıcio. Mostre que para cada g ∈ G fixo, αg ´e um homomorfismo e que sua inversa ´e αg−1 . 6 Um automorfismo de um grupo G ´e dito ser um automorfismo interno se for da forma αg para algum g ∈ G. Muitas das defini¸co˜es apresentadas acima tˆem seus an´alogos em outras estruturas, como espa¸cos vetoriais, a´lgebras, an´eis, m´odulos etc. Trataremos de alguns casos. • Morfismos em Espa¸ cos Vetoriais Sejam U e V dois espa¸cos vetoriais sobre o mesmo corpo K. Uma fun¸ca˜o φ : U → V ´e dita ser um homomorfismo ou morfismo de espa¸cos vetoriais se φ(α1 u1 + α2 u2 ) = α1 φ(u1 ) + α2 φ(u2 ) para todos α1 , α2 ∈ K e todos u1 , u2 ∈ U . Sejam U e V dois espa¸cos vetoriais sobre o mesmo corpo K. Uma fun¸ca˜o φ : U → V ´e dita ser um isomorfismo de espa¸cos vetoriais se for um morfismo de espa¸cos vetoriais, e se for bijetora.

Se dois espa¸cos vetoriais U e V sobre o mesmo corpo forem tais que exista um isomorfismo φ entre ambos dizemos que U e V s˜ao isomorfos (por φ) e denotamos esse fato por U 'φ V , ou simplesmente por U ' V . E. 1.67 Exerc´ıcio importante. Mostre que a rela¸c˜ao de isomorfia entre espa¸cos vetoriais ´e uma rela¸c˜ao de equivalˆencia. 6 Em espa¸cos vetoriais os conceitos de mono-, endo- e e automorfismo n˜ao s˜ao muito empregados. Em verdade, morfismos de espa¸cos vetoriais s˜ao mais freq¨ uentemente denominados operadores lineares ou aplica¸co ˜es lineares, como matrizes, por exemplo.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

67/1304

No caso de espa¸cos vetoriais sobre o corpo dos complexos existem tamb´em os conceitos de antihomomorfismo, anti-isomorfismo etc. Sejam U e V dois espa¸cos vetoriais sobre . Uma fun¸ca˜o φ : U → V ´e dita ser um anti-homomorfismo ou anti-morfismo de espa¸cos vetoriais se φ(α 1 u1 + α2 u2 ) = α1 φ(u1 )+α2 φ(u2 ) para todos α1 , α2 ∈ e todos u1 , u2 ∈ U . O conceito de anti-isomorfismo ´e an´alogo. ´ • Morfismos em Algebras Sejam A e B duas a´lgebras (sobre o mesmo corpo K, como espa¸cos vetoriais). Uma fun¸ca˜o φ : A → B ´e dita ser um homomorfismo ou morfismo de a ´lgebras se for um morfismo de espa¸cos vetoriais (ou seja φ(α1 a1 + α2 a2 ) = α1 φ(a1 ) + α2 φ(a2 ) para todos α1 , α2 ∈ K e todos a1 , a2 ∈ A) e se φ(a1 · a2 ) = φ(a1 ) · φ(a2 ) para todos a1 , a2 ∈ A. Sejam A e B duas a´lgebras sobre o mesmo corpo K. Uma fun¸ca˜o φ : A → B ´e dita ser um isomorfismo de a ´lgebras se for um morfismo de a´lgebras e se for bijetora.

Se duas a´lgebras A e B sobre o mesmo corpo forem tais que exista um isomorfismo φ entre ambos dizemos que A e B s˜ao isomorfas (por φ) e denotamos esse fato por A 'φ B, ou simplesmente por A ' B. E. 1.68 Exerc´ıcio importante. equivalˆencia.

Mostre que a rela¸c˜ao de isomorfia entre ´algebras ´e uma rela¸c˜ao de 6

Um morfismo de a´lgebra ρ de uma a´lgebra A em si mesma ρ : A → A ´e dito ser um endomorfismo de A.

1.3 1.3.1

Cosets, Sub-Grupos Normais e o Grupo Quociente. O Centro de um Grupo Cosets

• Cosets ` a esquerda, ou “left cosets” Seja G um grupo e H um sub-grupo de G. Podemos definir em G uma rela¸ca˜o de equivalˆencia, que ındice “l” denotando “left”) dizendo que dois elementos x e y de G s˜ao denotaremos por ∼H l (o sub-´ −1 equivalentes se x y ∈ H. Representaremos por x ∼H l y o fato de x e y serem equivalentes no sentido acima. E. 1.69 Exerc´ıcio importante. equivalˆencia.

Verifique que a defini¸c˜ao acima corresponde de fato a uma rela¸c˜ao de 6

Denotemos por (G/H)l a cole¸ca˜o das classes de equivalˆencia de G pela rela¸ca˜o ∼H l . O conjunto (G/H)l ´e denominado coset a ` esquerda de G por H, ou left coset de G por H. Seja [·]l a aplica¸ca˜o G → (G/H)l que associa a cada elemento de G a classe de equivalˆencia a qual o elemento pertence. A aplica¸ca˜o [·]l ´e denominada aplica¸ca ˜o quociente a ` esquerda associada a H.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

68/1304

Note-se que [·]l ´e sobrejetora mas, em geral, n˜ao ´e injetora, pois se g 0 ∼H ao [g 0 ]l = [g]l . Com isso, l g ent˜ os elementos de (G/H)l poder˜ao ser denotados por [g]l com g ∈ G, o que freq¨ uentemente faremos. Podemos identificar [g]l com o conjunto gH = {gh, h ∈ H} ⊂ G. De fato, g 0 ∈ gH se e somente se 0 existe h ∈ H tal que g 0 = gh e, portanto, se e somente se g −1 g 0 ∈ H, ou seja, se e somente se g ∼H l g.

• Cosets ` a direita, ou “right cosets” Seja G um grupo e H um sub-grupo de G. Podemos definir em G uma rela¸ca˜o de equivalˆencia, que denotaremos por ∼H ındice “r” denotando “right”) dizendo que dois elementos x e y de G s˜ao r (o sub-´ equivalentes se xy −1 ∈ H. Representaremos por x ∼H r y o fato de x e y serem equivalentes no sentido acima. E. 1.70 Exerc´ıcio importante. equivalˆencia.

Verifique que a defini¸c˜ao acima corresponde de fato a uma rela¸c˜ao de 6

Denotemos por (G/H)r a cole¸ca˜o das classes de equivalˆencia de G pela rela¸ca˜o ∼H r . O conjunto (G/H)r ´e denominado coset a ` direita de G por H, ou right coset de G por H. Seja [·]r a aplica¸ca˜o G → (G/H)r que associa a cada elemento de G a classe de equivalˆencia a qual o elemento pertence. A aplica¸ca˜o [·]r ´e denominada aplica¸ca ˜o quociente a ` direita associada a H. Note-se 0 H que [·]r ´e sobrejetora mas, em geral, n˜ao ´e injetora, pois se g ∼r g ent˜ao [g 0 ]r = [g]r . Com isso, os elementos de (G/H)r poder˜ao ser denotados por [g]r com g ∈ G, o que freq¨ uentemente faremos. Podemos identificar [g]r com o conjunto Hg = {hg, h ∈ H} ⊂ G. De fato, g 0 ∈ Hg se e somente se existe h ∈ H tal que g 0 = hg e, portanto, se e somente se g 0 g −1 ∈ H, ou seja, se e somente se g 0 ∼H r g. H Doravante, denotaremos ∼H l simplesmente por ∼l e ∼r por ∼r , ficando o subgrupo H subentendido.

• A¸ c˜ ao ` a esquerda de G sobre (G/H)l ´ sempre poss´ıvel definir uma a¸ca˜o a` esquerda de G sobre o coset a` esquerda (G/H) l , a qual age E transitivamente em (G/H)l (vide defini¸ca˜o a` p´agina 64). Isso faz de (G/H)l um espa¸co homogˆeneo de G (vide defini¸ca˜o a` p´agina 64). Seja G um grupo, H um sub-grupo de G e seja o coset a` esquerda (G/H)l , definido acima. Defina α : G × (G/H)l → (G/H)l

tal que

G × (G/H)l 3 (g, [f ]l ) 7→ αg ([f ]l ) := [gf ]l ∈ (G/H)l .

Ent˜ao, α define uma a¸ca˜o a` esquerda de G sobre (G/H)l . De fato, tem-se que 1. Para cada g ∈ G, αg : (G/H)l → (G/H)l ´e bijetora, pois se existem f1 , f2 ∈ G tais que [gf1 ]l = [gf2 ]l , ent˜ao gf1 ∼l gf2 , ou seja, (gf1 )−1 (gf2 ) ∈ H, ou seja, (f1 )−1 f2 ∈ H. Isso estabelece que f1 ∼l f2 , ou seja, que [f1 ]l = [f2 ]l , provando que αg : (G/H)l → (G/H)l ´e injetora. Note-se que αg : (G/H)l → (G/H)l ´e sobrejetora, pois αg ([g −1 f ]l ) = [f ]l e variando f em G, [f ]l varre todo (G/H)l . 2. Para a identidade e ∈ G, αe ([f ]l ) = [ef ]l = [f ]l para todo f ∈ G, provando que αe : (G/H)l → (G/H)l ´e a aplica¸ca˜o identidade.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

69/1304

3. Para todos g, h ∈ G vale αg (αh ([f ]l )) = αg ([hf ]l ) = [ghf ]l = αgh ([f ]l ) para qualquer f ∈ G. Isso provou que α : G × (G/H)l → (G/H)l ´e uma a¸ca˜o a` esquerda de G em (G/H)l .

N˜ao ´e dif´ıcil ver que a a¸ca˜o α age transitivamente em (G/H)l . De fato, se e ´e a unidade de G, ent˜ao αg ([e]l ) = [g]l e variando g por todo G a imagem [g]l varre todo (G/H)l . • A¸ c˜ ao ` a direita de G sobre (G/H)r

´ sempre poss´ıvel definir uma a¸ca˜o a` direita de G sobre o coset a` direita (G/H) r , a qual age E transitivamente em (G/H)r (vide defini¸ca˜o a` p´agina 64). Isso faz de (G/H)r um espa¸co homogˆeneo de G (vide defini¸ca˜o a` p´agina 64). Seja G um grupo, H um sub-grupo de G e seja o coset a` direita (G/H)r , definido acima. Defina β : G × (G/H)r → (G/H)r

tal que

G × (G/H)r 3 (g, [f ]r ) 7→ βg ([f ]r ) := [f g]r ∈ (G/H)r .

Ent˜ao, β define uma a¸ca˜o a` direita de G sobre (G/H)r . De fato, tem-se que 1. Para cada g ∈ G, βg : (G/H)r → (G/H)r ´e bijetora, pois se existem f1 , f2 ∈ G tais que [f1 g]r = [f2 g]r , ent˜ao f1 g ∼r f2 g, ou seja, (f1 g)(f2 g)−1 ∈ H, ou seja, f1 (f2 )−1 ∈ H. Isso estabelece que f1 ∼r f2 , ou seja, que [f1 ]r = [f2 ]r , provando que βg : (G/H)r → (G/H)r ´e injetora. Note-se que βg : (G/H)r → (G/H)r ´e sobrejetora, pois βg (f [g −1 ]r ) = [f ]r e variando f em G, [f ]r varre todo (G/H)r . 2. Para a identidade e ∈ G, βe ([f ]r ) = [f e]r = [f ]r para todo f ∈ G, provando que βe : (G/H)r → (G/H)r ´e a aplica¸ca˜o identidade. 3. Para todos g, h ∈ G vale βg (βh ([f ]r )) = βg ([f h]r ) = [f hg]r = βhg ([f ]r ) para qualquer f ∈ G. Isso provou que β : G × (G/H)r → (G/H)r ´e uma a¸ca˜o a` direita de G em (G/H)r .

N˜ao ´e dif´ıcil ver que a a¸ca˜o β age transitivamente em (G/H)r . De fato, se e ´e a unidade de G, ent˜ao αg ([e]r ) = [g]r e variando g por todo G a imagem [g]r varre todo (G/H)r . * Os cosets (G/H)l e (G/H)r podem ser identificados e transformados em grupos se uma certa hip´otese for feita sobre o sub-grupo H e sua rela¸ca˜o com G. Esse ´e nosso assunto na Se¸ca˜o 1.3.2.

1.3.2

Subgrupos Normais e o Grupo Quociente

• Sub-Grupos Normais Seja G um grupo. Um subgrupo N de G ´e dito ser um subgrupo normal se gng −1 ∈ N para todo g ∈ G e todo n ∈ N . Se N ´e um sub-grupo normal de G denotamos esse fato escrevendo N  G. Observe que todo sub-grupo de um grupo Abeliano G ´e normal.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

70/1304

E. 1.71 Exerc´ıcio. Sejam G e H dois grupos e ϕ : G → H um homomorfismo. Mostre que Ran (ϕ) := {ϕ(g)| g ∈ G} ´e um sub-grupo de H. 6 E. 1.72 Exerc´ıcio importante. Sejam G e H dois grupos e ϕ : G → H um homomorfismo. Seja e H a unidade de H. Mostre que Ker (ϕ) := {g ∈ G| ϕ(g) = eH } ´e um sub-grupo normal de G. 6 Nota sobre a nomenclatura dos dois exerc´ıcios acima.

O s´ımbolo Ran prov´em da palavra inglesa “range” (“alcance”, em portuguˆes) e ´e

freq¨ uentemente empregado como sinˆ onimo da imagem de uma fun¸ca ˜o ou aplica¸ca ˜o. O s´ımbolo Ker provem do inglˆes “kernel” (“n´ ucleo” ou “caro¸co”, em portuguˆes).

• Cosets por subgrupos normais Nesse contexto, a seguinte proposi¸ca˜o ´e fundamental. Proposi¸ c˜ ao 1.8 Seja G um grupo e seja N um sub-grupo de G. Ent˜ ao, uma condi¸ca ˜o necess´ aria e suficiente para que possamos identificar (G/N )l com (G/N )r , ou seja, para que tenhamos [g]l = [g]r para todo g ∈ G, ´e que N  G, ou seja, que N seja um sub-grupo normal de G. 2 Prova. Por defini¸ca˜o, g 0 ∈ [g]l se e somente existe n ∈ N tal que g −1 g 0 = n, o que ´e verdade se e somente se g 0 g −1 = gng −1 . Mas g 0 ∈ [g]r se e somente se g 0 g −1 ∈ N . Assim [g]l = [g]r para todo g ∈ G se e somente se gng −1 ∈ N para todo g ∈ G e n ∈ N , o que ´e verdade se somente se N ´e um subgrupo normal de G. Com isso, caso N  G, definimos [g] := [g]l = [g]r para todo g ∈ G e definimos o coset de G por N por G/N := (G/N )l = (G/N )r , ou seja, G/N = {[g], g ∈ G}. Advertˆ encia. O leitor deve ser advertido aqui que, infelizmente, ´e comum na literatura denotar o coset a` esquerda (G/H)l por G/H, mesmo quando H n˜ao ´e normal (vide, por exemplo, [119] ou [57], entre outros). Evitaremos fazer isso, pois isso pode levar a uma confus˜ao de conceitos. • A¸ co ˜es ` a direita e ` a esquerda sobre o coset por um subgrupo normal Se H ´e um subgrupo qualquer de G, definimos p´aginas acima uma a¸ca˜o transitiva a` esquerda α : G × (G/H)l → (G/H)l e uma a¸ca˜o transitiva a` direita β : G × (G/H)r → (G/H)r . Fica claro pela Proposi¸ca˜o 1.8 que se N  G, podemos definir tanto α : G × (G/N ) → G/N

tal que

G × (G/N ) 3 (g, [f ]) 7→ αg ([f ]) := [gf ] ∈ G/N

como uma a¸ca˜o a` esquerda de G sobre G/N quanto β : G × (G/N ) → G/N

tal que

G × (G/N ) 3 (g, [f ]) 7→ βg ([f ]) := [f g] ∈ G/N

como uma a¸ca˜o a` direita de G sobre G/N . Ambas as a¸co˜es agem transitivamente. • O Grupo Quociente de G por N

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

71/1304

Sub-grupos normais s˜ao importantes, pois com eles podemos fazer da cole¸ca˜o de classes de equivalˆencia G/N um grupo, denominado grupo quociente de G por N . A constru¸ca˜o ´e a seguinte. ´ Seja N  G. Podemos fazer de G/N um grupo definindo o produto como [g]N [h]N = [gh]N . E muito f´acil ver que, se esta express˜ao est´a bem definida, ela de fato representa um produto associativo na cole¸ca˜o de classes de equivalˆencia G/N . O elemento neutro seria a classe [e] N , onde e ´e a identidade −1 de g. Por fim, [g]−1 ao trivial ´e mostrar que a defini¸ca˜o de produto como N = [g ]N . O ponto n˜ [g]N [h]N = [gh]N faz sentido, ou seja, ´e independente dos elementos tomados nas classes de g e h. Para isso precisaremos que N seja normal. O que temos de fazer ´e mostrar que se g 0 ∼N g e h0 ∼N h ent˜ao g 0 h0 ∼N gh, ou seja, precisamos mostrar que se g 0 g −1 ∈ N e h0 h−1 ∈ N ent˜ao g 0 h0 (gh)−1 ∈ N . Mas, de fato, tem-se que g 0 h0 (gh)−1 = g 0 h0 h−1 g −1 = (g 0 g −1 )[g(h0 h−1 )g −1 ]. Agora, por hip´otese, h0 h−1 ∈ N . Da´ı, como N ´e normal (´e aqui que essa hip´otese entra pela primeira vez), g(h0 h−1 )g −1 ∈ N . Como, tamb´em pela hip´otese, g 0 g −1 ∈ N e N ´e um sub-grupo, conclu´ımos que g 0 h0 (gh)−1 ∈ N , ou seja, g 0 h0 ∼N gh. Assim [g]N [h]N = [gh]N est´a bem definido e faz das classes G/N um grupo. Esse grupo ´e denominado de grupo quociente de G por N . A no¸ca˜o de grupo quociente ´e muito importante na teoria de grupos e iremos explorar algumas das aplica¸co˜es nessas notas. Adiante usarˆemo-la para construir a no¸ca˜o de produto tensorial e soma direta de v´arios objetos, tais como grupos, a´lgebras etc. A no¸ca˜o de grupo quociente ´e importante por permitir estudar a rela¸ca˜o de certos grupos entre si. Mais adiante, por exemplo, mostraremos que o grupo SO(3) ´e isomorfo ao grupo SU (2)/{ , − }, um resultado de direto interesse f´ısico na Mecˆanica Quˆantica. A no¸ca˜o de grupo quociente ´e tamb´em muito importante em problemas combinat´orios envolvendo grupos, mas n˜ao falaremos disso aqui. Para uma discuss˜ao mais ampla, vide [118], [119] ou [97].

1.3.3

O Centro de um Grupo. Centralizadores e Normalizadores

• O Centro de um Grupo Seja G um grupo. O conjunto dos elementos de G que tˆem a propriedade de comutarem com todos os elementos de G ´e denominado o centro do grupo G e ´e freq¨ uentemente denotado por 33 Z(G). Em s´ımbolos: Z(G) := {h ∈ G| hg = gh para todo g ∈ G} . Note que Z(G) nunca ´e um conjunto vazio, pois o elemento neutro de G sempre pertence e Z(G). Em alguns grupos, por´em, esse pode ser o u ´ nico elemento de Z(G). Esse ´e o caso, por exemplo, do grupo de permuta¸co˜es de n elementos (por que?). E. 1.73 Exerc´ıcio. Mostre que Z(G) ´e sempre um subgrupo Abeliano de G.

6

´ elementar constatar que para qualquer grupo G, seu centro Z(G) ´e um subgrupo normal de G. E ´ E igualmente elementar constatar que se G ´e Abeliano ent˜ao Z(G) = G. 33

O emprego da letra Z provavelmente provem da palavra alem˜ a “Zentrum”.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

72/1304

• Centralizadores e Normalizadores Seja G um grupo e F um sub-conjunto n˜ao vazio de G. Dado um elemento h ∈ G, denotamos por hF h−1 o conjunto de todos os elementos de G que sejam da forma hf h−1 para algum f ∈ F , ou seja, hF h−1 := {hf h−1 , f ∈ F }.

O chamado normalizador de F (em G), denotado por N (F, G) (ou simplesmente por N (F ), quando G ´e subentendido), ´e o conjunto de todos os elementos g ∈ G tais que gF g −1 = F . O chamado centralizador de F (em G), denotado por C(F, G) (ou simplesmente por C(F ), quando G ´e subentendido), ´e o conjunto de todos os elementos de G que comutam com todos os elementos de F: C(F, G) := {g ∈ G| gf = f g para todo f ∈ F }. E. 1.74 Exerc´ıcio. Mostre que o centralizador de F ⊂ G ´e um sub-grupo de G.

6

E. 1.75 Exerc´ıcio. Se F ⊂ G, mostre que o normalizador N (F ) ≡ N (F, G) de F em G ´e um sub-grupo de G. Mostre que se F ´e um subgrupo de G ent˜ao F ´e normal em rela¸c˜ao a N (F ) (ou seja, F  N (F )) e que se H ´e um subgrupo de G tal que F ´e normal em rela¸c˜ao a H (ou seja, F  H), ent˜ao H ⊂ N (F ) e, portanto, N (F ) ´e o maior subgrupo de G em rela¸c˜ao ao qual F ´e normal. 6 • O Centro de GL( , n) Como exerc´ıcio vamos determinar o centro de GL( , n). Se A ∈ Z(GL( , n)) ent˜ao AB = BA para toda B ∈ GL( , n). Tomemos, em particular, uma matriz B da forma B = + E a, b , onde E a, b , com a, b ∈ {1, . . . , n}, ´e a matriz cujo elemento ij ´e nulo a menos que i = a e que j = b, em cujo caso (E a, b )ij = 1. Em s´ımbolos, (E a, b )ij = δia δjb . (Antes de prosseguir, conven¸ca-se que + E a, b ∈ GL( , n), notando que det( + E a, b ) 6= 0). Agora, como AB = BA, segue que AE a, b = E a, b A. Pela regra de produto de matrizes, isso significa (AE a, b )ij =

n X k=1

Aik (E a, b )kj =

n X

Aik δka δjb = Aia δjb

k=1

q (E

a, b

A)ij

n n X X a, b = (E )ik Akj = δia δkb Akj = Abj δia . k=1

k=1

Assim, Aia δjb = Abj δia . Tomando-se j = b, conclu´ımos Aia = Abb δia . Como a e b s˜ao arbitr´arios, conclu´ımos dessa igualdade que Abb = λ, constante independente de b. Da´ı, Aia = λδia , o que significa que A = λ . Como det(A) 6= 0, devemos ter λ 6= 0. Para futura referˆencia expressamos nossas conclus˜oes na forma de uma proposi¸ca˜o:

Proposi¸ c˜ ao 1.9 O centro do grupo GL( , n), ou seja, Z(GL( , n)), coincide com o conjunto de todas as matrizes da forma λ , com λ 6= 0, ou seja, ´e o conjunto das matrizes n˜ ao-nulas que s˜ ao

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

73/1304

m´ ultiplos da unidade. Em s´ımbolos, Z(GL( , n)) = {λ , λ ∈ , λ 6= 0} . Como conseq¨ uˆencia podemos afirmar que se uma matriz A ∈ Mat ( , n) comuta com todas as demais matrizes de Mat ( , n) ent˜ ao A = λ para algum λ ∈ . 2 E. 1.76 Exerc´ıcio. Mostre que o centro de SL( , n) ´e o conjunto de todas as matrizes da forma λ , com λ ∈ satisfazendo λn = 1. Mostre que esse grupo ´e isomorfo ao grupo n . 6 E. 1.77 Exerc´ıcio. Mostre que o centro de SL( , n) ´e o conjunto de todas as matrizes da forma λ , com λ ∈ satisfazendo λn = 1. Esse grupo ´e { } quando n ´e ´ımpar e { , − } quando n ´e par. (Lembre-se que SL( , n) ´e formado apenas por matrizes reais). 6 





1.4

O Produto Direto e o Produto Semi-Direto de Grupos

Vamos aqui descrever dois procedimentos importantes que permitem construir um grupo a partir de dois outros grupos dados. ´ por vezes muito Sejam G e H dois grupos, cujas identidades s˜ao eG e eH , respectivamente. E importante fazer do produto Cartesiano G × H um grupo. • O Produto Direto de Grupos A maneira mais f´acil ´e definir o produto de dois pares ordenados (g1 , h1 ), (g2 , h2 ), com g1 , g2 ∈ G e h1 , h2 ∈ H, por (g1 , h1 ) · (g2 , h2 ) := (g1 g2 , h1 h2 ). O leitor pode facilmente se convencer que esse produto ´e associativo, que (e G , eH ) ´e o elemento neutro e que (g, h)−1 = (g −1 , h−1 ). Isso faz de G × H um grupo, denominado produto direto de G e H. Esse grupo ´e por vezes denotado por G ⊗ H. E. 1.78 Exerc´ıcio. Mostre que G ⊗ H e H ⊗ G s˜ao isomorfos.

6

A defini¸ca˜o acima pode ser amplamente generalizada. Seja Gs ,Qs ∈ Λ, uma cole¸ca˜o de grupos indexados por s ∈ Λ. ConsideremosSo produto Cartesiano G := s∈Λ Gs , definido como sendo a cole¸ca˜o de todasQas fun¸co˜es f :Q Λ → s∈Λ Gs , com f (s) ∈ Gs . Ent˜ao, podemos fazer de G um grupo definindo para s∈Λ f1 (s) , s∈Λ f2 (s) ∈ G o produto ! ! ! Y Y Y f1 (s) · f2 (s) = f1 (s)f2 (s) . s∈Λ

s∈Λ

s∈Λ

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

74/1304

Como facilmente se vˆe, esse produto faz de G um grupo, denominado produto direto da cole¸ca˜o de grupos Gs , s ∈ Λ. • O Produto Semi-Direto de Grupos Dados dois grupos G e H h´a uma outra maneira de fazer de G × H um grupo al´em do produto direto. Para tal ´e necess´ario que exista uma a¸ca˜o de G em H por automorfismos de H. Expliquemos melhor isso. Lembremos que um automorfismo α de um grupo H ´e um isomorfismo de H em si mesmo α : H → H. Uma a¸ca˜o (`a esquerda) de G sobre H por automorfismos ´e um fun¸ca˜o α : G × H → H tal que a cada par (g, h) ∈ G × H associa um elemento denotado por αg (h) de H de tal forma que as seguintes condi¸co˜es sejam satisfeitas: 1. Para todo g ∈ G, a fun¸ca˜o αg (·) : H → H ´e um automorfismo de H, ou seja, αg (h)αg (h0 ) = αg (hh0 ), sendo que αg (·) : H → H ´e bijetora com (αg )−1 = αg−1 . 2. Para todo h ∈ H vale αeG (h) = h. 3. Para todo h ∈ H vale αg (αg0 (h)) = αgg0 (h) para quaisquer g, g 0 ∈ G. Acima eG e eH s˜ao as unidades de G e H, respectivamente. E. 1.79 Exerc´ıcio-exemplo. Um exemplo importante ´e o seguinte. Seja N  G. Ent˜ao, com n ∈ N , αg (n) := gng −1 define uma a¸c˜ao (`a esquerda) de G sobre N por automorfismos. Verifique! 6 Pela defini¸ca˜o geral, tem-se pelas propriedades 1, 2 e 3 acima que para quaisquer g ∈ G e h ∈ H αg (eH )h = αg (eH )αg (αg−1 (h)) = αg (eH αg−1 (h)) = αg (αg−1 (h)) = h, o que implica αg (eH ) = eH para todo g ∈ G.

Se G e H s˜ao grupos e α : G × H → H ´e uma a¸ca˜o a` esquerda de G sobre H por automorfismos, ent˜ao podemos definir em G×H um produto de dois pares ordenados (g1 , h1 ), (g2 , h2 ), com g1 , g2 ∈ G e h1 , h2 ∈ H, por (g1 , h1 ) · (g2 , h2 ) := (g1 g2 , h1 αg1 (h2 )). E. 1.80 Exerc´ıcio importante. Mostre que esse produto ´e associativo, que (e G , eH ) ´e a unidade e que para quaisquer g ∈ G, h ∈ H tem-se (g, h)−1 = (g −1 , αg−1 (h−1 )). 6 Com isso G × H adquire a estrutura de um grupo, denominado produto semi-direto de G por H pelo automorfismo α : G × H → H, ou simplesmente produto semi-direto de G por H quando um automorfismo α : G × H → H espec´ıfico ´e subentendido. Na literatura o produto semi-direto de G por H ´e denotado de v´arias formas: por G ×α H, por G ⊗α H, por Gsα H, ou por por GsH quando um automorfismo α : G × H → H espec´ıfico ´e subentendido. Nestas notas adotaremos as duas u ´ ltimas formas. • Exemplos

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

75/1304

I. Seja G um grupo e N  G. Ent˜ao, para g1 , g2 ∈ G e n1 , n2 ∈ N o produto (g1 , n1 ) · (g2 , n2 ) := (g1 g2 , n1 g1 n2 g1−1 )

define o grupo GsN , produto semi-direto de um grupo G por um sub-grupo normal N atrav´es do automorfismo natural. II. Considere o grupo G, formado por todos os n´ umeros reais n˜ao-nulos com o produto dado pela multiplica¸ca˜o usual e o grupo H, formado por todos os reais com o produto dado pela soma: G = ( \ {0}, ·) e H = ( , +). 



Para todo a ∈ \ {0} e x ∈ definimos α : G × H → H por αa (x) := ax. Para cada a ∈ G, tem-se que αa ´e bijetora, com inversa dada por α1/a . Fora isso, αa (x) + αa (y) = ax + ay = a(x + y) = αa (x + y). Assim, αa ´e um automorfismo (condi¸ca˜o 1. da defini¸ca˜o acima). Fora isso, para todo x ∈ H, α 1 (x) = x (condi¸ca˜o 2.). Por fim, para todo x ∈ H, αa (αb (x)) = abx = αab (x), para quaisquer a, b ∈ G (condi¸ca˜o 3.). Conclu´ımos que α ´e uma a¸ca˜o a` esquerda de G sobre H por automorfismos. 



Assim, fazemos de G × H um grupo Gsα H com o produto (a, x) · (b, y) := (ab, x + ay) . O elemento neutro ´e o par (1, 0) e (a, x)−1 = (1/a, −x/a).

Para interpretar o que esse grupo Gsα H significa, vamos definir uma a¸ca˜o34 Γ de Gsα H sobre o conjunto da seguinte forma. Para (a, x) ∈ Gsα H e z ∈ , definimos 



Γ((a, x), z) := az + x. Para verificar que isso ´e uma a¸ca˜o notemos as seguintes propriedades: i. para cada (a, x) fixo Γ((a, x), z) ´e uma fun¸ca˜o bijetora de em (lembre-se que a 6= 0). ii. Para todo z ∈ , Γ((1, 0), z) = z. 

iii.





Γ((a, x), Γ((b, y), z)) = Γ((a, x), bz + y) = a(bz + y) + x = abz + (x + ay) = Γ((ab, x + ay), z) = Γ((a, x) · (b, y), z).

Isso mostrou que Γ ´e uma a¸ca˜o de Gsα H sobre o conjunto . Como vemos, a a¸ca˜o de um elemento (a, x) consiste em uma combina¸ca˜o de uma multiplica¸ca˜o por a 6= 0 seguida por uma transla¸ca˜o por x ∈ . Isso exibe o significado geom´etrico do grupo Gsα H. Vamos a um outro exemplo semelhante. 



III. Considere o conjunto de todas as opera¸co˜es do espa¸co tridimensional que envolvem rota¸co˜es e transla¸co˜es. Por exemplo, considere-se a opera¸ca˜o na qual cada vetor ~x ´e primeiramente rodado por uma matriz de rota¸ca˜o R ∈ SO(3) e em seguida ´e transladado por um vetor ~x0 : ~x 7→ R~x + ~x0 .

(1.25)

A composi¸ca˜o de duas de tais opera¸co˜es conduz a` transforma¸ca˜o ~x 7→ R 0 (R~x + ~x0 ) + ~x00 , ou seja, ~x 7→ (R0 R)~x + ~x00 + R0 ~x0 . 34

O conceito de a¸ca ˜o de um grupo em um conjunto foi definido a ` p´ agina 62.

(1.26)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

76/1304

O espa¸co vetorial 3 ´e naturalmente um grupo Abeliano em rela¸ca˜o a` adi¸ca˜o de vetores. Se R ∈ SO(3), αR (~x0 ) := R~x0 define uma a¸ca˜o por automorfismos de SO(3) sobre 3 . A express˜ao (1.26) inspira a defini¸ca˜o do produto semi-direto SO(3)sα 3 por 





(R0 , ~x00 ) · (R, ~x0 ) = (R0 R, ~x00 + R0~x0 ). E. 1.81 Exerc´ıcio. Verifique que a transforma¸c˜ao (1.25) define uma a¸c˜ao `a esquerda do grupo SO(3)s α 3 6 sobre o conjunto 3 . 



Defini¸ c˜ ao. Os grupos En := SO(n)sα

n 

s˜ao denominados grupos Euclidianos3536 .

IV. Seja V um espa¸co vetorial (e, como tal, um grupo Abeliano em rela¸ca˜o a` soma de vetores) e seja Aut(V ) a cole¸ca˜o de todas as aplica¸co˜es lineares bijetoras de V em V . Por exemplo V =

n 

e Aut(

n 

) ´e o conjunto de todas as matrizes reais n × n invert´ıveis.

Ent˜ao, fazemos de Aut(V ) × V um grupo, definindo

(A, v) · (B, u) := (AB, v + Au). Esse grupo ´e por vezes denominado grupo afim do espa¸co vetorial V . Observa¸ca ˜o. O caso V = 

corresponde exatamente ao exemplo II, acima.

Mencionamos, por fim, que o grupo de Poincar´e, introduzido a` p´agina 730, ´e tamb´em um exemplo de um grupo definido como um produto semi-direto de dois grupos, a saber, o produto semi-direto do grupo das transforma¸co˜es de Lorentz com grupo das transla¸co˜es no espa¸co-tempo.

1.5 1.5.1

Somas Diretas e Produtos Tensoriais Discuss˜ ao Informal Preliminar

Nesta se¸ca˜o apresentaremos duas maneiras distintas de construir grupos Abelianos a partir de dois grupos Abelianos dados, que s˜ao o chamado produto tensorial de dois grupos e a chamada soma direta de dois grupos. As constru¸co˜es precisas (especialmente a do produto tensorial) s˜ao um tanto elaboradas, mas as id´eias por tr´as delas s˜ao simples, de modo que tentaremos primeiramente apresent´a-las de modo elementar para depois (a partir da Se¸ca˜o 1.5.2) nos dedicarmos a` sua defini¸ca˜o precisa. Essas constru¸co˜es prestam-se tamb´em a definir o produto tensorial e a soma direta de espa¸cos vetoriais (sobre um mesmo corpo), o que tamb´em discutiremos. Na Se¸ca˜o 1.5.5 ser˜ao apresentadas mais generaliza¸co˜es envolvendo (uma cole¸ca˜o arbitr´aria) de grupos n˜ao necessariamente Abelianos. Um coment´ario pertinente (destinado aos estudantes mais avan¸cados) ´e que as constru¸co˜es de produto tensorial e soma direta de espa¸cos vetoriais que apresentaremos adiante correspondem a`s no¸co˜es 35 36

Euclides de Alexandria (≈ 325 A.C, ≈ 265 A.C.). Para alguns autores, os grupos Euclidianos s˜ ao os grupos O(n)sα

n

.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

77/1304

de produto tensorial e soma direta alg´ebricos. Isso significa que outras estruturas, como uma topologia, ou propriedades, como completeza, n˜ao s˜ao necessariamente herdadas pela constru¸ca˜o. Assim, por exemplo, o produto tensorial alg´ebrico de dois espa¸cos de Banach n˜ao ´e necessariamente um espa¸co de Banach. Para tal ´e necess´ario introduzir um completamento extra, que pode n˜ao ser u ´ nico. • A No¸ c˜ ao de Soma Direta de Dois Grupos Sejam A e B dois grupos Abelianos, com identidades eA e eB (e cujas opera¸co˜es de produto denotaremos ambas pelo mesmo s´ımbolo “+”). Desejamos encontrar uma maneira de fazer do produto Cartesiano A × B um grupo tamb´em. Uma maneira de fazer isso ´e definir a “soma” de dois pares ordenados (a, b), (a0 , b0 ) ∈ A × B por (a, b) + (a0 , b0 ) := (a + a0 , b + b0 ).

(1.27)

O leitor pode facilmente constatar que essa opera¸ca˜o ´e uma opera¸ca˜o bin´aria de A × B em si mesmo, que ela ´e associativa, que tem por elemento neutro o par (eA , eB ) e que para cada (a, b) ∈ A × B a inversa ´e (a, b)−1 = (−a, −b), onde −a ´e o elemento inverso de a em A, e analogamente para −b. Portanto, com esse produto, A × B ´e um grupo.

Com essa estrutura, facilmente se verifica que A × B torna-se um grupo Abeliano, denominado soma direta de A e B ou produto direto de A e B 37 e denotado pelo s´ımbolo A ⊕ B. Com essa estrutura de grupo em mente, os pares ordenados (a, b) s˜ao freq¨ uentemente denotados pelo s´ımbolo a ⊕ b. • A No¸ c˜ ao de Soma Direta de Dois Espa¸ cos Vetoriais Sejam U e V dois espa¸cos vetoriais em rela¸ca˜o a um mesmo corpo que, sem perda de generalidade, consideraremos doravante como sendo o corpo dos complexos. U e V s˜ao dois grupos Abelianos em rela¸ca˜o a`s respectivas opera¸co˜es de soma de vetores. Assim, pela constru¸ca˜o acima, podemos definir o grupo U ⊕ V . Esse objeto ainda n˜ao tem uma estrutura de espa¸co vetorial (sobre os complexos), pois n˜ao dissemos como definir o produto de um elemento de U ⊕ V por um escalar α ∈ . Isso ´e feito da seguinte forma, para u ∈ U , v ∈ V , define-se α(u ⊕ v) por α(u ⊕ v) := (αu) ⊕ (αv).

(1.28)

E. 1.82 Exerc´ıcio. Constate que, com essa defini¸c˜ao, U ⊕ V torna-se um espa¸co vetorial, ou seja, verifique que s˜ao v´alidos os postulados da defini¸c˜ao formal de espa¸co vetorial dados `a p´agina 55. 6 Esse espa¸co vetorial que denotaremos por U ⊕ V , ´e denominado soma direta dos espa¸cos U e V ou produto direto38 de U e V . 

• A No¸ c˜ ao de Produto Tensorial de Dois Grupos 37

A distin¸ca ˜o entre produto direto e soma direta s´ o se faz quando uma cole¸ca ˜o n˜ ao-finita de grupos ´e envolvida. Vide Se¸ca ˜o 1.5.5. 38 A distin¸ca ˜o entre produto direto e soma direta s´ o se faz quando uma cole¸ca ˜o n˜ ao-finita de espa¸cos vetoriais ´e envolvida. Vide Se¸ca ˜o 1.5.5.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

78/1304

A defini¸ca˜o de produto tensorial de dois grupos Abelianos A e B, que denotaremos por A ⊗ B, ´e distinta da de soma direta. A id´eia b´asica, por´em, ´e a mesma, ou seja, tentar fazer do produto Cartesiano A × B um grupo, mas a regra de produto ´e muito diferente daquela dada em (1.27). Em primeiro lugar, os elementos de A ⊗ B s˜ao somas formais finitas de pares ordenados de A × B como (a, b) + (a0 , b0 ),

mas n˜ao impomos a rela¸ca˜o (1.27). O que realmente entendemos por “soma formal” ser´a explicado adiante, quando definirmos o conceito de grupo Abeliano livremente gerado por um conjunto, uma no¸ca˜o muito simples. Por ora fiquemos apenas com a no¸ca˜o intuitiva. Para dar a A ⊗ B uma estrutura de grupo, desejamos impor algumas condi¸co˜es a`s somas formais acima. Primeiramente impomos que (a, b) + (a0 , b0 ) = (a0 , b0 ) + (a, b), para todos a, a0 ∈ A, b, b0 ∈ B. Em segundo lugar, impomos que (a + a0 , b) = (a, b) + (a0 , b)

e que (a, b + b0 ) = (a, b) + (a, b0 ) para todos a, a0 ∈ A, b, b0 ∈ B. O estudante deve notar que essas imposi¸co˜es s˜ao mais limitadas que aquelas de (1.27). Note tamb´em que as imposi¸co˜es acima s˜ao inspiradas na bem-conhecida propriedade de transitividade de produtos e somas de n´ umeros reais ou complexos: (x+x0 )y = xy +x0 y e x(y +y 0) = 0 xy + xy . E. 1.83 Exerc´ıcio. Mostre que com as regras de soma dadas acima todos os pares (e A , b) e (a, eB ) s˜ao identificados entre si e com o elemento neutro da opera¸c˜ao de soma de pares ordenados. Fora isso, o elemento inverso de um par (a, b) ´e (−a, b) = (a, −b). Mostre que, com isso, A ⊗ B ´e um grupo Abeliano, denominado Produto Tensorial dos Grupos Abelianos A e B. 6 Com essa estrutura de grupo em mente, os pares ordenados (a, b) s˜ao freq¨ uentemente denotados pelo s´ımbolo a ⊗ b. • A No¸ c˜ ao de Produto Tensorial de Dois Espa¸ cos Vetoriais Sejam U e V dois espa¸cos vetoriais em rela¸ca˜o a um mesmo corpo que, sem perda de generalidade, consideraremos doravante como sendo o corpo dos complexos. U e V s˜ao dois grupos Abelianos em rela¸ca˜o a`s respectivas opera¸co˜es de soma de vetores. Assim, pela constru¸ca˜o acima, podemos definir o grupo U ⊗ V . Esse objeto ainda n˜ao tem uma estrutura de espa¸co vetorial (sobre os complexos), pois n˜ao dissemos como definir o produto de um elemento de U ⊗ V por um escalar α ∈ . Isso ´e feito da seguinte forma, para u ∈ U , v ∈ V , define-se α(u ⊗ v) impondo α(u ⊗ v) := (αu) ⊗ (v) = (u) ⊗ (αv).

(1.29)

O estudante deve comparar essa regra de produto por escalares com a regra 1.28. Para elementos de U ⊗ V que sejam somas finitas, como por exemplo u ⊗ v + u0 ⊗ v 0 , impomos α (u ⊗ v + u0 ⊗ v 0 ) := α (u ⊗ v) + α (u0 ⊗ v 0 )

= (αu) ⊗ v + (αu0 ) ⊗ v 0 = u ⊗ (αv) + u0 ⊗ (αv 0 ).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

79/1304

E. 1.84 Exerc´ıcio. Constate que, com essa defini¸c˜ao, U ⊗ V torna-se um espa¸co vetorial, ou seja, verifique que s˜ao v´alidos os postulados da defini¸c˜ao formal de espa¸co vetorial dados `a p´agina 55. 6 Esse espa¸co vetorial que denotaremos por U ⊗ V , ´e denominado produto tensorial dos espa¸cos U e V. 

* Vamos agora tentar formalizar as no¸co˜es que apresentamos acima, apresentando suas defini¸co˜es matem´aticas precisas. O leitor que acredita ter entendido o que apresentamos acima pode dispensar-se de ler o restante da presente se¸ca˜o.

1.5.2

Grupos Gerados por Conjuntos. Grupos Gerados por Rela¸ co ˜es

• Suporte de uma fun¸ c˜ ao Seja f : X → G uma fun¸ca˜o de um conjunto n˜ao-vazio X em um grupo G. O suporte de f , denotado por supp (f ), ´e o conjunto de todos os pontos x ∈ X tais que f (x) 6= e, onde e ´e a unidade de G: supp (f ) := {x ∈ X| f (x) 6= e}. Uma fun¸ca ˜o f : X → G ´e dita ser de suporte finito se seu suporte for um conjunto finito. • Grupo Abeliano Livremente Gerado por um Conjunto Uma no¸ca˜o importante que usaremos adiante ´e a de grupo Abeliano livremente gerado por um conjunto X. Seja X um conjunto. Seja F (X) a cole¸ca˜o de todas as fun¸co˜es de suporte finito de X ´ f´acil ver que F (X) tem naturalmente uma estrutura de grupo Abeliano, definindo, para f , em . E 0 f ∈ F (X) o produto de f e f 0 como sendo o elemento f f 0 = (f + f 0 ) de F (X) dado por (f + f 0 )(x) = f (x) + f 0 (x).

(1.30)

´ claro que esse (f + f 0 ) tem suporte finito. O elemento neutro e de F (X) ´e para todo x ∈ X. E claramente a fun¸ca˜o identicamente nula. Pelo fato de F (X) ter essa estrutura natural de grupo F (X) ´e denominado grupo Abeliano livremente gerado pelo conjunto X. Para x ∈ X vamos denotar por δx a fun¸ca˜o caracter´ıstica de x:  1, se y = x δx (y) := . 0, se y 6= x

(1.31)

Claramente δx ∈ F (X). Dado que cada f ∈ F (X) tem suporte finito, pode-se escrevˆe-lo da forma f =

N X

a n δ xn ,

(1.32)

n=1

para valores de N e dos an ’s dependentes de f , com {x1 , . . . , xN } = supp f e com ai ∈ i = 1, . . . , N .

para

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

80/1304

Com um flagrante abuso de linguagem ´e costume escrever (1.32) da forma f =

N X

a n xn ,

(1.33)

n=1

onde fica, por assim dizer, subentendido que aqui os xn ’s representam n˜ao os elementos de X mas sim suas fun¸co˜es caracter´ısticas (X pode ser um conjunto qualquer, de modo que opera¸co˜es como soma de elementos de X ou multiplica¸ca˜o de elementos de X por um inteiro podem n˜ao serem sequer definidas). ´ f´acil verificar que F (X) ´e um grupo Abeliano livre (da´ı seu nome), o que quer dizer que n˜ao h´a em E F (X) nenhuma rela¸ca˜o n˜ao trivial entre seus elementos, a n˜ao ser aquela que lhe confere Abelianidade: f f 0 f −1 f 0 −1 = e. • Rela¸ co ˜es e Grupos Gerados M´ odulo Rela¸ co ˜es Vamos passar agora a uma constru¸ca˜o muito importante, a de grupo Abeliano livremente gerado por um conjunto m´odulo rela¸co˜es. Vamos apresentar essa constru¸ca˜o de forma bem geral. Seja J um conjunto (em princ´ıpio arbitr´ario) de ´ındices e sejam ent˜ao, para cada j ∈ J, elementos de F (X) dados por n(j) X αj, i xj, i (1.34) rj = i=1

onde, para cada j ∈ J, n(j) ∈ e, para todo j ∈ J e i ∈ {1, . . . , n(j)}, tem-se αj, i ∈ e xj, i ∈ X com xj, i 6= xj, i0 se i 6= i0 . Denotamos R := {rj , j ∈ J}. Os elementos de R ser˜ao chamados “rela¸co˜es”. 

Seja ent˜ao R o subgrupo de F (X) formado por todos os elementos de F (X) que s˜ao combina¸co˜es lineares finitas de rj ’s com coeficientes em :

para certos si ∈

em∈



s ∈ R ⇐⇒ s = s1 rj1 + · · · + sm rjm ,

(1.35)

, que dependem de s. R ´e dito ser o subgrupo de F (X) gerado pelos rj ’s.

Por ser um subgrupo de um grupo Abeliano, R ´e normal. Assim, podemos definir o grupo Abeliano livremente gerado por X, m´ odulo as rela¸co ˜es R como sendo o grupo F (X)/R. Note-se que [R] R = e, o que equivale a dizer que os elementos de R s˜ao identificados como zero (da´ı serem chamados de “rela¸co˜es”, pois refletem identidades que n˜ao existiam em F (X) e que est˜ao sendo agora impostas em F (X)/R). * Vamos ilustrar as defini¸co˜es e constru¸co˜es acima apresentando as defini¸co˜es de soma direta e produto tensorial de dois grupos Abelianos e, em seguida, de dois espa¸cos vetoriais. As defini¸co˜es de acima s˜ao particularmente relevantes para o conceito de produto tensorial.

1.5.3

Somas Diretas

• A Soma Direta de dois Grupos Abelianos

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

81/1304

Sejam A e B dois grupos Abelianos cujo produto de grupo denotaremos aditivamente: com o s´ımbolo +. Seja X = A × B. Seja em F (X) = F (A × B) o conjunto R de rela¸co˜es dado por R

:=

{r ∈ F (X)| r = (a + a0 , b + b0 ) − (a, b) − (a0 , b0 ), com a, a0 ∈ A e b, b0 ∈ B}. (1.36)

Seja R = R(A × B) o subgrupo de F (A × B) gerado por R. Chegamos assim a` defini¸ca˜o do grupo Abeliano A ⊕ B, a soma direta de A e B, que ´e definido como A ⊕ B := F (A × B)/R(A × B). Nota¸ca ˜o. Para a ∈ A e b ∈ B denotaremos por a ⊕ b o elemento de A ⊕ B que corresponde (na nota¸ca˜o discutida acima) a` fun¸ca˜o δ(a, b) . • A Soma Direta de dois Espa¸ cos Vetoriais Sejam U e V dois espa¸cos vetoriais (sobre ). Como U e V s˜ao dois grupos Abelianos, o grupo Abeliano U ⊕ V est´a definido pelo procedimento acima. Isso, entretanto, ainda n˜ao faz de U ⊕ V um espa¸co vetorial. Para isso ´e preciso definir o produto de um escalar por um elemento de U ⊕ V . Definimos ent˜ao o produto de um escalar α ∈ por um elemento u ⊕ v ∈ U ⊗ V como sendo o elemento (αu) ⊕ (αv), ou seja, α(u ⊕ v) := (αu) ⊕ (αv). ´ f´acil constatar que, com essa defini¸ca˜o, U ⊕ V torna-se um espa¸co vetorial (vide a defini¸ca˜o formal E de espa¸co vetorial a` p´agina 55), que denotaremos por U ⊕ V . O assim definido espa¸co vetorial U ⊕ V ´e denominado a soma direta dos espa¸cos vetoriais U e V sobre o corpo . 



1.5.4



Produtos Tensoriais

A defini¸ca˜o de produtos tensoriais ´e mais delicada e faz uso mais forte do conceito de grupo livremente gerado por um conjunto. • O Produto Tensorial de dois Grupos Abelianos Sejam A e B dois grupos Abelianos cujo produto de grupo denotaremos aditivamente: com o s´ımbolo +. Seja X = A × B. Seja em F (X) = F (A × B) o conjunto R de rela¸co˜es dado por R

:=

{r ∈ F (X)| r = (a + a0 , b) − (a, b) − (a0 , b) ou r = (a, b + b0 ) − (a, b) − (a, b0 ), com a, a0 ∈ A e b, b0 ∈ B}.

(1.37)

Seja R = R(A × B) o subgrupo de F (A × B) gerado por R. Chegamos assim a` defini¸ca˜o do grupo Abeliano A ⊗ B, o produto tensorial de A e B, que ´e definido como A ⊗ B := F (A × B)/R(A × B). Nota¸ca ˜o. Para a ∈ A e b ∈ B denotaremos por a ⊗ b o elemento de A ⊗ B que corresponde (na nota¸ca˜o discutida acima) a` fun¸ca˜o δ(a, b) . • O Produto Tensorial de dois Espa¸ cos Vetoriais

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

82/1304

Sejam U e V dois espa¸cos vetoriais (sobre ). Como U e V s˜ao dois grupos Abelianos, o grupo Abeliano U ⊗ V est´a definido pelo procedimento da u ´ ltima sub-se¸ca˜o. Isso, entretanto, ainda n˜ao faz de U ⊗ V um espa¸co vetorial. Para isso tomemos X = U ⊗ V e consideremos o sub-espa¸co de F (X) definido por R := {r ∈ F (U ⊗ V )| r = (αu) ⊗ v − u ⊗ (αv), com α ∈ , u ∈ U, v ∈ V }.

(1.38)

Como antes, seja R = R(U ⊗ V ) o subgrupo gerado por R. Definimos agora um novo grupo Abeliano U ⊗ V como U ⊗ V := F (U ⊗ V )/R(U ⊗ V ). 



U ⊗ V ´e por ora apenas mais um grupo Abeliano, mas podemos adicionar-lhe uma estrutura de espa¸co vetorial da seguinte forma. 

Primeiramente ´e preciso definir o produto de um escalar por um elemento de U ⊗ V . Para elementos da forma u ⊗ v com u ∈ U e v ∈ V , definimos ent˜ao o produto α(u ⊗ v), para α ∈ por 





α(u ⊗ v) := (αu) ⊗ v = u ⊗ (αv). 





Au ´ ltima igualdade segue da defini¸ca˜o de U ⊗ V . 

Os demais elementos de U ⊗ V s˜ao da forma de combina¸co˜es lineares finitas com coeficientes inteiros de elementos como u ⊗ v, ou seja, s˜ao da forma 



n X k=1

ck (uk ⊗ vk ) 

para algum n > 0 e ck ∈

. Para os mesmos definimos ! n n X X ck α (uk ⊗ vk ) α ck (uk ⊗ vk ) := 



k=1

k=1

=

n X k=1

ck (αuk ) ⊗ vk = 

n X k=1

ck uk ⊗ (αvk ). 

´ f´acil constatar que, com essa defini¸ca˜o, U ⊗ V torna-se um espa¸co vetorial (vide a defini¸ca˜o E formal de espa¸co vetorial a` p´agina 55), que tamb´em denotaremos por U ⊗ V . O assim definido espa¸co vetorial U ⊗ V ´e denominado produto tensorial dos espa¸cos vetoriais U e V sobre o corpo . 





´ • O Produto Tensorial de dois M´ odulos sobre uma Algebra Associativa Vamos aqui a uma defini¸ca˜o que nos ser´a importante. Sejam M e N dois bim´odulos sobre uma a´lgebra associativa A, ambos supostos serem espa¸cos vetoriais sobre o corpo dos complexos. Conforme a sub-se¸ca˜o anterior podemos definir o espa¸co vetorial M ⊗ N . Entretanto, em muitos casos ´e necess´ario definir um outro tipo de produto tensorial entre M e N . 

Para tal seja X = M ⊗ N e definamos em F (X) o conjunto de rela¸co˜es 

R := {r ∈ F (X)| r = (ma) ⊗ n − m ⊗ (an), com a ∈ A, m ∈ M, n ∈ N }. 



(1.39)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

83/1304

Definamos ent˜ao R = R(M ⊗ N ) como o subgrupo gerado por R e o produto tensorial 

M ⊗A N := F (M ⊗ N )/R(M ⊗ N ). 



(1.40)

Podemos fazer de M ⊗A N um m´odulo, digamos a` direita, sobre A tomando o produto a · (m ⊗A n) := (ma) ⊗A n = m ⊗A (an).

(1.41)

Faremos uso freq¨ uente desse produto tensorial adiante. O mais importante para n´os ser´a a identidade (ma) ⊗A n = m ⊗A (an) v´alida em todo M ⊗A N para todo a ∈ A.

1.5.5

Produtos Diretos e Somas Diretas Arbitr´ arios

Aqui apresentaremos as defini¸co˜es de produtos diretos e somas diretas de cole¸co˜es arbitr´arias de grupos (n˜ao necessariamente Abelianos) e de espa¸cos vetoriais. • Produto Direto e Soma Direta de Cole¸ co ˜es Arbitr´ arias de Grupos Seja J um conjunto arbitr´ario de ´ındices e G := {Gi , i ∈ J} uma cole¸ca˜o de grupos. Seja o produto Cartesiano := ×i∈J Gi . Podemos fazer de um grupo definindo o produto de dois elementos 3 g = ×a∈J ga , 3 h = ×b∈J hb como g · h = ×a∈J (ga ha ). Com essa estrutura ´e dito Y ser o produto direto dos grupos Gi , i ∈ J e ser´a denotado por p = Gi . i∈J

possui um subgrupo importante, aquele formado por elementos ×a∈J ga ∈ p onde apenas um n´ umero finito de ga ’s ´e distinto da identidade ea doM respectivo grupo Ga . Esse subgrupo ´e dito ser a soma direta dos Gi ’s , i ∈ J e ´e denotado por s = Gi . p

i∈J

• Soma Direta de Cole¸ co ˜es Arbitr´ arias de Espa¸ cos Vetoriais Se {Vi , i ∈ J} ´e uma cole¸ca˜o de espa¸cos vetoriais que, em particular, L s˜ao grupos Abelianos, cai definida, pelo apresentado na sub-se¸ca˜o anterior, a soma direta s := i∈J Vi , definida primeiramente como grupo Abeliano. s pode ser feito um espa¸co vetorial definindo-se, para um escalar gen´erico α ∈ , 



α · (×a∈J va ) := ×a∈J (αva ), para todo ×a∈J va ∈



(1.42)

s.

Um caso especial que ir´a nos interessar ´e o seguinte: seja M um bim´odulo sobre uma a´lgebra associativa A e tomemos J = e Vn = M ⊗A n ≡ M ⊗A · · · ⊗A M . O exposto acima permite definir a | {z } n vezes M soma direta M ⊗A n . 

n∈



JCABarata. Curso de F´ısica-Matem´ atica

1.5.6

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

84/1304

M´ odulos e Deriva¸ co ˜es

Seja A uma a´lgebra sobre com identidade e e seja M um bim´odulo sobre A. Uma aplica¸ca˜o linear δ : A → M ´e dita ser uma deriva¸ca ˜o de A em M se satisfaz a regra de Leibniz39 : δ(ab) = aδ(b) + δ(a)b,

(1.43)

para todos a, b ∈ A.

Vamos a alguns exemplos.

Exemplo 1. Seja A uma a´lgebra sobre de bim´odulo:

com unidade e e M = A ⊗ A com os seguintes produtos 

a · (b ⊗ c) := (ab) ⊗ c,

(1.44)

(b ⊗ c) · a := b ⊗ (ca).

(1.45)

Deixa-se ao leitor verificar a associatividade dos produtos de bim´odulo nesse caso. Defina-se δ(a) := a ⊗ e − e ⊗ a.

(1.46)

Deixa-se ao leitor verificar a validade da regra de Leibniz nesse exemplo. Note-se tamb´em que, por essa defini¸ca˜o, δ(e) = 0. Exemplo 2. Seja A uma a´lgebra sobre de bim´odulo:

com unidade e e M = A ⊗ A com os seguintes produtos 

a · (b ⊗ c) := (ab) ⊗ c,

(1.47)

(b ⊗ c) · a := b ⊗ (ca) − (bc) ⊗ a.

(1.48)

Deixa-se ao leitor verificar a associatividade dos produtos de bim´odulo nesse caso. Defina-se δ(a) := e ⊗ a.

(1.49)

Deixa-se ao leitor verificar a validade da regra de Leibniz nesse exemplo. Note-se tamb´em que, por essa defini¸ca˜o, δ(e) = e ⊗ e 6= 0.

Exemplo 3. Exemplo importante de deriva¸co˜es pode ser visto em a´lgebras de Lie. Seja A uma a´lgebra de Lie vista como um bim´odulo sobre si mesma. Seja z um elemento fixo da a´lgebra e seja a ´ f´acil verificar (fa¸ca!) usando a identidade de Jacobi aplica¸ca˜o dz : A → A dada por dz (a) = [z, a]. E (1.22) que dz ([a, b]) = [dz (a), b] + [a, dz (b)] para todo a, b ∈ A. Assim, tem-se que a cada z ∈ A ´e associada uma deriva¸ca˜o d z .

1.6

T´ opicos Especiais

Esta se¸ca˜o ´e formada por alguns assuntos independentes que, embora relevantes, n˜ao se enquadram na exposi¸ca˜o introdut´oria que pretend´ıamos ter nas se¸co˜es anteriores. 39

Gottfried Wilhelm von Leibniz (1646-1716).

JCABarata. Curso de F´ısica-Matem´ atica

1.6.1

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

85/1304

O Grupo de Grothendieck

Vamos agora descrever uma constru¸ca˜o que permite obter um grupo Abeliano a partir de um semi-grupo Abeliano dado. Um grupo constru´ıdo por esse procedimento ´e chamado de grupo de Grothendieck 40 associado ao semi-grupo Abeliano em quest˜ao. Grupos de Grothendieck desempenham um papel importante em v´arias a´reas da Matem´atica, como por exemplo na chamada K-teoria. Seja um semi-grupo Abeliano S (n˜ao necessariamente dotado de um elemento neutro) cujo produto denotamos pelo s´ımbolo +. Consideremos em primeiro lugar o produto Cartesiano S × S e vamos introduzir l´a uma rela¸ca˜o de equivalˆencia da seguinte forma: dois pares (a, b) e (a0 , b0 ) ∈ S × S s˜ao equivalentes, (a, b) ∼ (a0 , b0 ), se existir pelo menos um elemento p ∈ S tal que a + b0 + p = a0 + b + p.

(1.50)

Vamos mostrar que isso define de fato uma rela¸ca˜o de equivalˆencia. Em primeiro lugar ´e claro que (a, b) ∼ (a, b) para qualquer par (a, b) ∈ S 2 = S × S, dado que aqui, para verificar (1.50), basta tomar qualquer elemento p ∈ S. Em segundo lugar ´e evidente que se (a, b) ∼ (a0 , b0 ) ent˜ao (a0 , b0 ) ∼ (a, b). Finalmente, vamos mostrar que se (a, b) ∼ (c, d) e (c, d) ∼ (e, f ) ent˜ao (a, b) ∼ (e, f ). Por hip´otese existem p e p0 ∈ S tais que a+d+p=b+c+p

e

c + f + p 0 = d + e + p0 .

Daqui extra´ımos que (a + d + p) + (c + f + p0 ) = (b + c + p) + (d + e + p0 ), ou seja, que a + f + p00 = b + e + p00 , onde p00 = d + c + p + p0 . Essa rela¸ca˜o diz precisamente que (a, b) ∼ (e, f ), completando a prova de que temos assim uma rela¸ca˜o de equivalˆencia em S 2 . Vamos ent˜ao considerar agora o conjunto K(S) := S 2 / ∼ de todas as classes de equivalˆencia definidas acima. Vamos construir em K(S) uma estrutura de grupo Abeliano, cujo produto denotaremos por +. Dadas duas classes [(a, b)] e [(c, d)] definimos [(a, b)] + [(c, d)] := [(a + c, b + d)]. Note-se que por essa defini¸ca˜o tem-se (verifique!) [(a, b)] + [(c, d)] = [(c, d)] + [(a, b)] para todo a, b, c, d ∈ S.

A primeira coisa a fazer ´e mostrar que essa defini¸ca˜o independe dos elementos tomados nas classes. Para isto basta provar que se (a0 , b0 ) ∼ (a, b) ent˜ao (a + c, b + d) ∼ (a0 + c, b0 + d). Se (a0 , b0 ) ∼ (a, b) ent˜ao existe p ∈ S tal que a + b0 + p = a0 + b + p. 40

Alexander Grothendieck (1928-).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

86/1304

Somando-se c + d a ambos os lados tiramos (a + c) + (b0 + d) + p = (a0 + c) + (b + d) + p que ´e precisamente a afirmativa que (a + c, b + d) ∼ (a0 + c, b0 + d). ´ igualmente f´acil verificar que para quaisquer x, y ∈ S tem-se que (x, x) ∼ (y, y) e que, portanto, E [(x, x)] = [(y, y)]. Vamos provar que h´a em K(S) um elemento neutro. Este ´e precisamente a classe e := [(x, x)] com x ∈ S arbitr´ario. Note-se que, para qualquer par (a, b) ∈ S 2 teremos [(a, b)] + [(x, x)] = [(a + x, b + x)] = [(a, b)] , pois (a + x + b) + p = (b + x + a) + p para qualquer p ∈ S.

Falta-nos provar a associatividade do produto e a existˆencia de uma inversa para cada elemento de K(S). Para a associatividade, notemos que   [(a, b)] + [(c, d)] + [(e, f )] := [(a, b)] + [(c + e, d + f )] = [(a + c + e, b + d + f )] , 

 [(a, b)] + [(c, d)] + [(e, f )] := [(a + c, b + d)] + [(e, f )] = [(a + c + e, b + d + f )] .

Para provar a existˆencia de inversa notemos que para cada par (a, b) ∈ S 2 podemos tomar [(a, b)]−1 := [(b, a)] pois [(a, b)] + [(a, b)]−1 = [(a, b)] + [(b, a)] = [(a + b, a + b)] = e . Isso mostrou que K(S) tem uma estrutura de grupo Abeliano. Este ´e o chamado grupo de Grothendieck associado ao semi-grupo Abeliano S. Como de costume, denotaremos [(a, b)]−1 por −[(a, b)]. Assim, −[(a, b)] = [(b, a)]. E. 1.85 Exerc´ıcio. Seja o mon´oide Abeliano Mostre que K( ) ' .

dos n´umeros naturais contendo o 0 com a soma usual. 6 



O exerc´ıcio acima indica a possibilidade de se definir os n´ umeros inteiros a partir dos naturais. Os inteiros seriam, por defini¸ca˜o, o grupo de Grothendieck do mon´oide Abeliano dos naturais com a opera¸ca˜o de soma usual. E. 1.86 Exerc´ıcio. Seja o mon´oide Abeliano 1 dos n´umeros naturais maiores ou iguais a 1 com o produto dado pela multiplica¸c˜ao usual. Mostre que K( 1 ) ' + , o grupo dos racionais positivos (sem o zero) com o produto dado pela multiplica¸c˜ao usual. 6 



O exerc´ıcio acima indica a possibilidade de se definir os n´ umeros racionais positivos a partir dos naturais. Os racionais seriam, por defini¸ca˜o, o grupo de Grothendieck do mon´oide Abeliano dos naturais com a opera¸ca˜o de produto usual. Para cada elemento a de um mon´oide Abeliano M podemos associar um elemento de K(M ) por ´ f´acil ver que todo elemento [(a, b)] de K(M ) pode ser escrito da M 3 a 7→ [a] := [(a, 0)] ∈ K(M ). E forma [(a, b)] = [a]−[b] e que [a]−[b] = [a0 ]−[b0 ] se e somente se existir p ∈ M com a+b0 +p = a0 +b+p.

JCABarata. Curso de F´ısica-Matem´ atica

1.6.2

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

87/1304

Grup´ oides

´ dado um conjunto C e um subconjunto C0 ⊂ C, o qual Um grup´oide ´e definido da seguinte forma. E ´e a imagem de duas fun¸co˜es un´arias p e c (chamadas de “partida” e “chegada”), ou seja, p : C → C 0 , c : C → C0 . Os elementos de C0 s˜ao pontos fixos de p e de c, ou seja, c(α) = α

e

p(α) = α

para todo α ∈ C0 (aqui denotaremos os elementos de C por letras gregas).

Define-se em C × C um subconjunto (ou seja, uma rela¸ca˜o em C), que denotaremos por RC , da seguinte forma: RC := {(α, β) ∈ C 2 | p(α) = c(β)}.

´ tamb´em dada uma fun¸ca˜o bin´aria RC → C, que denotaremos por “·” e que denominaremos E “produto”, a qual satisfaz as seguintes hip´oteses: 1. Associatividade: α · (β · γ) = (α · β) · γ sempre que os produtos estejam definidos, ou seja, se (β, γ), (α, β · γ), (α, β) e (α · β, γ) forem todos elementos de RC 2. Para todo (α, β) ∈ RC temos p(α · β) = p(β). 3. Para todo (α, β) ∈ RC temos c(α · β) = c(α). 4. Para todo α ∈ C temos α · p(α) = α. 5. Para todo α ∈ C temos c(α) · α = α. Fora isso, existe para cada α ∈ C uma assim chamada inversa bilateral α −1 ∈ C a qual satisfaz α · α−1 = c(α) e α−1 · α = p(α). Note que, por essa defini¸ca˜o, tem-se que, para todo α0 ∈ C0 , α0 · α0−1 = α0−1 · α0 = α0 . Estes ingredientes definem um grup´oide. Note-se que um grup´oide n˜ao necessariamente contem um “elemento neutro” (vide exemplos).

Exemplo. Caminhos. Este exemplo ´e um prot´otipo da defini¸ca˜o de grup´oide acima, ou seja, aquela possivelmente foi criada tendo o mesmo como exemplo-guia. Seja I o intervalo fechado [0, 1] e vamos considerar o conjunto C de todas as fun¸co˜es cont´ınuas de I em um espa¸co topol´ogico Hausdorff qualquer (por exemplo 2 ). Um elemento γ de C ´e uma curva orientada cont´ınua em 2 que tem um ponto de partida γ(0) e um ponto de chegada γ(1). 



Podemos introduzir uma rela¸ca˜o de equivalˆencia em C da seguinte forma: duas curvas α e β ∈ C s˜ao equivalentes (α ∼ β) se existir uma bije¸ca˜o cont´ınua b : I → I com b(0) = 0, b(1) = 1, tal que α = β ◦ b. Vamos denominar por C as classes de equivalˆencia de C pela rela¸ca˜o de equivalˆencia acima: C := C/ ∼. O conjunto C0 ´e o subconjunto de C formado pelas classes de equivalˆencia de curvas constantes: [α] ∈ C0 ⇐⇒ α(t) = α(t0 ), ∀t, t0 ∈ I.

Definimos as fun¸co˜es un´arias p e c da seguinte forma: p([γ]) ´e a classe de equivalˆencia da curva constante que a todo t ∈ I associa o ponto γ(0) de 2 , o ponto de partida de γ; c([γ]) ´e a classe de equivalˆencia da curva constante que a todo t ∈ I associa o ponto γ(1) de 2 , o ponto de chegada de γ. 



JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

88/1304

Dados dois elementos em C queremos agora definir o seu produto. A id´eia a ser seguida ´e que o produto de duas curvas ´e definido apenas quando o ponto de chegada da primeira coincide com o ponto de partida da segunda e resulta em uma curva u ´ nica unindo o ponto de partida da primeira com o ponto de chegada da u ´ ltima. Matematicamente isso ´e feito definindo-se o produto [β] · [α] como sendo a classe de equivalˆencia da curva β ∗ α definida pela composi¸ca˜o  α(2t), para 0 ≤ t ≤ 1/2 β ∗ α(t) := . β(2t − 1), para 1/2 < t ≤ 1 Claramente β ∗ α s´o ´e um elemento de C (ou seja, uma curva cont´ınua) se α(1) = β(0).

Por fim a inversa bilateral de [α] ´e definida como sendo a classe [α −1 ], onde α−1 (t) = α(1 − t).

Deixamos para o leitor como exerc´ıcio mostrar que a estrutura definida acima ´e a de um grup´oide.

Notemos que para a composi¸ca˜o ∗ acima n˜ao vale a associatividade: (α ∗ β) ∗ γ 6= α ∗ (β ∗ γ), se ambos os lados estiverem definidos (por que?). No entanto, as curvas (α ∗ β) ∗ γ e α ∗ (β ∗ γ) s˜ao equivalentes no sentido da defini¸ca˜o acima e de tal forma que para o produto “·” definido nas classes C vale a associatividade [α] · ([β] · [γ]) = ([α] · [β]) · [γ], se ambos os lados estiverem definidos (por que?). Essa ´e a raz˜ao de termos feito a constru¸ca˜o nas classes C e n˜ao diretamente em C. Esse fato j´a deve ser familiar ao leitor que conhe¸ca o conceito de grupo de homotopia de espa¸cos topol´ogicos. O grup´oide apresentado acima e o grupo de homotopia s˜ao, ali´as, fortemente aparentados e ao leitor sugere-se pensar sobre qual a conex˜ao entre ambos. Exemplo. Rela¸co ˜es de equivalˆencia. Seja K um conjunto no qual haja uma rela¸ca˜o de equivalˆencia R ⊂ K × K. Tomamos C = R e C0 = {(x, x), x ∈ K} ⊂ R. Definimos 1. p((x, y)) := (x, x), ∀x, y ∈ K com x ∼ y. 2. c((x, y)) := (y, y), ∀x, y ∈ K com x ∼ y. 3. Produto: (x, y) · (y, z) := (x, z), ∀x, y, z ∈ K com x ∼ y ∼ z. 4. Inversa bilateral: (x, y)−1 := (y, x). ´ f´acil de se verificar (fa¸ca-o) que a estrutura assim definida ´e a de um grup´oide. E

1.6.3

Quat´ ernions

Vamos nesta se¸ca˜o tratar brevemente de um tipo de a´lgebra que possui algumas aplica¸co˜es interessantes na teoria de grupos e outros lugares, a chamada a´lgebra dos quat´ernions. Dado um espa¸co vetorial como 2 h´a v´arias maneiras de definir no mesmo um produto de modo a fazer do mesmo uma a´lgebra. Por exemplo, podemos definir em 2 o produto 



(x1 , x2 ) · (y1 , y2 ) = (x1 y1 , x2 y2 ),

(1.51)

que ´e associativo e comutativo, como tamb´em o produto (x1 , x2 ) · (y1 , y2 ) = (x1 y1 − x2 y2 , x1 y2 + x2 y2 ),

(1.52)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

89/1304

que ´e igualmente associativo e comutativo (Exerc´ıcio. Verifique). O produto (1.51) faz de 2 uma a´lgebra isomorfa a ⊗ , ou seja, a duas c´opias da a´lgebra usual dos n´ umeros reais. O produto (1.52) faz de 2 uma a´lgebra isomorfa a` dos n´ umeros complexos . (Em 2 com o produto (1.52)!). verdade, os n´ umeros complexos s˜ao definidos como sendo a a´lgebra 









Em

3 

podemos definir igualmente v´arios tipos de produtos, tais como o produto (x1 , x2 , x3 ) · (y1 , y2 , y3 ) = (x1 y1 , x2 y2 , x3 y3 ),

(1.53)

que ´e igualmente associativo e comutativo; o produto (x1 , x2 , x3 ) · (y1 , y2 , y3 ) = (x1 y1 , x2 y2 − x3 y3 , x2 y3 + x3 y2 ),

(1.54)

tamb´em associativo e comutativo ou ainda um produto como (x1 , x2 , x3 ) · (y1 , y2 , y3 ) = (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ),

(1.55)

que n˜ao ´e nem associativo nem comutativo. O produto (1.53) faz de 3 uma a´lgebra isomorfa a ⊗ ⊗ (trˆes c´opias da a´lgebra dos reais). O produto (1.54) faz de 3 uma a´lgebra isomorfa a ⊗ e o produto (1.55) ´e o bem conhecido produto vetorial. 











O que se pode ent˜ao fazer em 4 ? Naturalmente poder-se-ia definir em o que fizemos acima. Por exemplo, com o produto 

4 

v´arias a´lgebras imitando

(x1 , x2 , x3 , x4 ) · (y1 , y2 , y3 , y4 ) = (x1 y1 , x2 y2 , x3 y3 , x4 y4 ), 4

torna-se uma a´lgebra associativa e comutativa isomorfa a





⊗ 



⊗ 

(1.56)

. Com o produto 

(x1 , x2 , x3 , x4 ) · (y1 , y2 , y3 , y4 ) = (x1 y1 − x2 y2 , x1 y2 + x2 y1 , x3 y3 − x4 y4 , x3 y4 + x4 y3 ), 4 

torna-se uma a´lgebra associativa e comutativa isomorfa a

⊗ . Com o produto

(x1 , x2 , x3 , x4 ) · (y1 , y2 , y3 , y4 ) = (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 , x4 y4 ) 4

torna-se uma a´lgebra n˜ao-associativa e n˜ao-comutativa isomorfa a na componente 3 . 

(1.57)

3 

(1.58)

⊗ , com o produto vetorial 



H´a tamb´em outros produtos que s˜ao meras variantes das listadas acima (ache algumas). Existe, por´em, um outro produto n˜ao trivial, denominado produto quaterniˆ onico, que faz de 4 uma a´lgebra associativa mas n˜ao-comutativa e com unidade. Esse produto foi descoberto por W. R. Hamilton 41 . A hist´oria da descoberta desse produto em 4 , feita em 1843, ´e muito interessante e representou um ´ marco na hist´oria da Algebra. Esse produto ´e o seguinte 



(x0 , x1 , x2 , x3 ) · (y0 , y1 , y2 , y3 ) = (x0 y0 −x1 y1 −x2 y2 −x3 y3 , x0 y1 +y0 x1 +x2 y3 −x3 y2 , x0 y2 +y0 x2 +x3 y1 −x1 y3 , x0 y3 +y0 x3 +x1 y2 −x2 y1 ). (1.59) 41

William Rowan Hamilton (1805-1865). W. R. Hamilton foi tamb´em o inventor do chamado formalismo Hamiltoniano da Mecˆ anica Cl´ assica.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

90/1304

E. 1.87 Exerc´ıcio. Mostre que o produto acima ´e associativo.

6

´lgebra dos quat´ernions ou a ´lgebra O espa¸co vetorial 4 dotado do produto acima ´e denominado a quaterniˆ onica e ´e denotada freq¨ uentemente por . A a´lgebra ´e associativa mas n˜ao ´e comutativa. tem uma unidade, a saber, o vetor (1, 0, 0, 0) ∈ 4 . 



E. 1.88 Exerc´ıcio. Mostre que

n˜ao ´e uma ´algebra comutativa.

E. 1.89 Exerc´ıcio. Mostre que (1, 0, 0, 0) ´e a unidade de

6

.

6

H´a uma maneira melhor de representar o produto quaterniˆonico que a express˜ao (1.59). Vamos escrever os vetores da base canˆonica de 4 como 

e0 = (1, 0, 0, 0),

e1 = (0, 1, 0, 0),

e2 = (0, 0, 1, 0),

e3 = (0, 0, 0, 1),

de modo que todo x ∈ 4 pode ser escrito na forma x = x0 e0 + x1 e1 + x2 e2 + x3 e3 . O produto quaterniˆonico pode ent˜ao ser definido pelo produto dos elementos da base canˆonica, que segue as seguintes regras: 

1. e0 ´e a unidade da a´lgebra: x · e0 = e0 · x = x para todo x ∈

4 

.

2. (e1 )2 = (e2 )2 = (e3 )2 = −e0 . 3. ei ej = −ej ei para todo i 6= j com i, j = 1, 2, 3. 4. e1 e2 = e3 , e2 e3 = e1 e e3 e1 = e2 . E. 1.90 Exerc´ıcio. Verifique que essas regras reproduzem perfeitamente (1.59).

6

Al´em de ser de manipula¸ca˜o mais simples, essas regras permitem representar a a´lgebra quaterniˆonica de um modo talvez mais familiar, a saber, em termos de certas matrizes complexas 2 × 2. ´ • Quat´ ernions e Algebras de Matrizes 2 × 2 Sejam a e b dois n´ umeros complexos e seja M (a, b) a matriz   a b M (a, b) = , −b a ´ f´acil de se ver que o conjunto de todas as matrizes dessa onde z ´e o complexo conjugado de z ∈ . E forma ´e uma a´lgebra: M (a, b)M (c, d) = M (ac − bd, ad + bc). E. 1.91 Exerc´ıcio. Verifique!

6

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

91/1304

Existe um isomorfismo entre a a´lgebra dos quat´ernions e essa a´lgebra de matrizes 2 × 2. Basta associar (bijetivamente!) a cada qu´adrupla (x0 , x1 , x2 , x3 ) a matriz M (x0 + ix3 , x2 + ix1 ):   x0 + ix3 x2 + ix1 =: M (x). (1.60) x = (x0 , x1 , x2 , x3 ) ←→ −x2 + ix1 x0 − ix3 ´ f´acil verificar ent˜ao (fa¸ca!) que o produto quaterniˆonico ´e respeitado por essa associa¸ca˜o: E M (x)M (y) = M (x · y), 4

onde, acima, x · y ´e o produto quaterniˆonico de x e y ∈ 

.

Note-se que por essa associa¸ca˜o tem-se

M (x) = M (x0 e0 + x1 e1 + x2 e2 + x3 e3 ) = x0 M (e0 ) + x1 M (e1 ) + x2 M (e2 ) + x3 M (e3 ), com M (e0 ) =

,

M (e1 ) = iσ1 ,

M (e2 ) = iσ2 ,

onde



= e σ1 =



0 1 1 0



,

σ2 =



1 0 0 1

0 −i i 0

s˜ao as chamadas matrizes de Pauli42 , que satisfazem





e

σ3 =

M (e3 ) = iσ3 ,



1 0 0 −1



1. (σ1 )2 = (σ2 )2 = (σ3 )2 = , 2. σi σj = −σj σi para todo i 6= j e 3. σ1 σ2 = iσ3 , σ2 σ3 = iσ1 , σ3 σ1 = iσ2 . E. 1.92 Exerc´ıcio. Verifique essas propriedades.

6

• Sub-´ algebras Abelianas possui algumas sub-´algebras Abelianas. E. 1.93 Exerc´ıcio. Mostre que 1 := {x ∈ 4 , x = x0 e0 + x1 e1 = (x0 , x1 , 0, 0)} ´e uma sub-´algebra Abeliana de que ´e isomorfa `a ´algebra dos complexos. 6 

E. 1.94 Exerc´ıcio. Mostre o mesmo para 2 := {x ∈ 4 , x = x0 e0 + x3 e3 = (x0 , 0, 0, x3 )}. 3 := {x ∈ 

42

Wolfgang Pauli (1900-1958).

4 

, x = x0 e0 + x2 e2 = (x0 , 0, x2 , 0)} e 6

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 1

Vers˜ ao de 29 de setembro de 2005.

E. 1.95 Exerc´ıcio. Ser´a poss´ıvel fazer de 4 um espa¸co vetorial complexo? Seja α ∈ x ∈ 4 o produto do escalar α pelo vetor x definido por 

92/1304

e considere para



α · x = (Re(α)e0 + Im(α)e1 ) · x, onde o produto do lado direito ´e o o produto quaterniˆonico. Mostre que isso faz de 4 um espa¸co vetorial sobre o corpo dos complexos. Para isto verifique as propriedades definidoras de um espa¸co vetorial listadas `a p´agina 55. 6 

E. 1.96 Exerc´ıcio. considerados:

No exerc´ıcio anterior h´a outros produtos do escalar α pelo vetor x que podem ser α · x = (Re(α)e0 + Im(α)e2 ) · x,

ou α · x = (Re(α)e0 + Im(α)e3 ) · x, ou mesmo α · x = x · (Re(α)e0 + Im(α)e1 ) etc. Mostre que todos esses seis produtos de escalares α ∈ vetorial sobre o corpo dos complexos. •

por vetores x ∈

4 

fazem de

4 

um espa¸co 6

´ e um anel de divis˜ ao

´ f´acil ver que a a´lgebra dos quat´ernions ´e um anel de divis˜ao (vide p´agina 61), ou seja, todo E x ∈ 4 , x 6= 0, tem uma inversa em rela¸ca˜o ao produto quaterniˆonico. Do isomorfismo M definido em (1.60) acima vˆe-se que 

det(M (x)) = det (M (x0 + ix1 , x2 + ix3 )) = (x0 )2 + (x1 )2 + (x2 )2 + (x3 )2 e, portanto, M (x) tem uma matriz inversa sempre que x 6= 0.

De fato, definindo-se para x = x0 e0 + x1 e1 + x2 e2 + x3 e3 ∈

4 

o conjugado quaterniˆonico

x = x 0 e0 − x 1 e1 − x 2 e2 − x 3 e3 e do fato facilmente constat´avel que43 x · x = (x0 )2 + (x1 )2 + (x2 )2 + (x3 )2 ∈ ´e f´acil ver que para x 6= 0 tem-se x ou seja x−1 · x = x · x−1 = e0 .

−1

=



1 x·x



x



4 



,

E. 1.97 Exerc´ıcio. Verifique. 43

.

Com um abuso de linguagem identificamos aqui ((x0 )2 +(x1 )2 +(x2 )2 +(x3 )2 )e0 ∈

4

6

com (x0 )2 +(x1 )2 +(x2 )2 +(x3 )2 ∈

JCABarata. Curso de F´ısica-Matem´ atica

Note que por ou y = 0.

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 1

93/1304

n˜ao tem divisores de zero: x · y = 0 se e somente se x = 0

ser um anel de divis˜ao,

• Norma Quaterniˆ onica Em uma a´lgebra A uma fun¸ca˜o N : A → 

+

que satisfa¸ca

N (a · b) = N (a)N (b) para todo a, b ∈ A e N (a) = 0 ⇐⇒ a = 0 ´e dita ser uma norma alg´ebrica.

Em e tem-se a norma alg´ebrica N (z) = |z|, o m´odulo ou valor absoluto de z. uma norma alg´ebrica. Para x ∈ 4 a express˜ao 

tamb´em possui



N (x) = x · x define44 uma norma alg´ebrica em

.

E. 1.98 Exerc´ıcio. Verifique que a mesma satisfaz N (x · y) = N (x)N (y).

6

H´a um teorema devido a Hurwitz45 que afirma que h´a apenas quatro a´lgebras que s˜ao a´lgebras de divis˜ao46 e possuem uma norma alg´ebrica: , , e a chamada a´lgebra dos octˆonions, da qual n˜ao falaremos aqui. Esta u ´ ltima, por sinal, n˜ao ´e associativa. 

A a´lgebra possui v´arias outras propriedades interessantes, mas vamos encerrar aqui nossa exposi¸ca˜o introdut´oria. O leitor interessado poder´a encontrar mais sobre nos bons livros de a´lgebra, especialmente nos mais antigos.

44

Vide nota de rodap´e 43, p´ agina 92. Adolf Hurwitz (1859-1919). 46 Vide defini¸ca ˜o a ` p´ agina 61 45

Cap´ıtulo 2 Espa¸cos Vetoriais Conte´ udo 2.1

2.2

Espa¸ cos Vetoriais

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

94

2.1.1

Sub-Espa¸cos e Espa¸cos Quocientes . . . . . . . . . . . . . . . . . . . . . . . .

94

2.1.2

Bases Alg´ebricas de um Espa¸co Vetorial . . . . . . . . . . . . . . . . . . . . .

95

2.1.3

O Dual Alg´ebrico de um Espa¸co Vetorial

. . . . . . . . . . . . . . . . . . . . 101

Formas Lineares, Sesquilineares e Produtos Escalares em Espa¸ cos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 2.2.1

Formas Multilineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

2.2.2

Formas Sesquilineares e as Desigualdades de Cauchy-Schwarz e Minkowski . . 113

2.2.3

Produtos Escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

2.2.4

Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

2.3

Normas em Espa¸ cos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . 121

2.4

Formas Bilineares e Sesquilineares em Espa¸ cos de Dimens˜ ao Finita . . . 128

2.5

Estruturas Complexas sobre Espa¸ cos Vetoriais Reais . . . . . . . . . . . . 132

no¸ca˜o de espa¸co vetorial que introduzimos na Se¸ca˜o 1.2.3, p´agina 55, ´e da maior importˆancia na F´ısica e na Matem´atica. Neste cap´ıtulo vamos desenvolvˆe-la com mais detalhe. Particular aten¸ca˜o ser´a dada a`s no¸co˜es de forma multilinear, forma sesquilinear, produto escalar e norma em espa¸cos vetoriais.

2.1 2.1.1

Espa¸ cos Vetoriais Sub-Espa¸ cos e Espa¸ cos Quocientes

• Sub-espa¸ cos Seja V um espa¸co vetorial sobre um corpo K. Um subconjunto W de V ´e dito ser um sub-espa¸co ´ de V (sobre o mesmo corpo K) se para todo α, β ∈ K e todo u, v ∈ W valer que αu + βv ∈ W . E evidente que um sub-espa¸co de um espa¸co vetorial ´e por si s´o um espa¸co vetorial. • Quocientes Se W ´e um sub-espa¸co de um espa¸co vetorial V sobre um corpo K, ent˜ao ´e poss´ıvel definir em V uma rela¸ca˜o de equivalˆencia EW ⊂ V × V da seguinte forma: dizemos que (u, v) ∈ V × V pertence a EW se u − v ∈ W . 94

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

E. 2.1 Exerc´ıcio. Mostre que isso de fato define uma rela¸c˜ao de equivalˆencia em V .

95/1304

6

Seguindo a nota¸ca˜o usual denotaremos tamb´em essa rela¸ca˜o de equivalˆencia pelo s´ımbolo ∼ W : u ∼W v se u − v ∈ W . Denotemos por V /W o conjunto das classes de equivalˆencia de V pela rela¸ca˜o E W . Denotaremos por [u] ∈ V /W a classe de equivalˆencia que contem o vetor u ∈ V .

Com esses ingredientes podemos transformar V /W em um espa¸co vetorial sobre K. Isso se d´a definindo em V /W uma soma e um produto por escalares. O vetor nulo ser´a a classe de equivalˆencia [0] que cont´em o vetor 0. Como subconjunto de V , a classe [0], ali´as, vem a ser o conjunto W (por que?). Se [u] e [v] s˜ao as classes de equivalˆencia que contˆem os elementos u e v, respectivamente, de V , ent˜ao definimos [u] + [v] = [u + v].

E. 2.2 Exerc´ıcio. Mostre que essa defini¸c˜ao ´e coerente, no sentido que independe dos representantes (u e v) escolhidos nas classes. 6 E. 2.3 Exerc´ıcio. Mostre que essa opera¸c˜ao de soma ´e comutativa e associativa.

6

E. 2.4 Exerc´ıcio. Mostre que [u] + [0] = [u] para todo u ∈ V .

6

Analogamente, a opera¸ca˜o de multiplica¸ca˜o por escalares ´e definida por α[u] = [αu], para todo u ∈ V . E. 2.5 Exerc´ıcio. escolhido na classe.

Mostre que essa defini¸c˜ao ´e coerente, no sentido que independe do representante u 6

E. 2.6 Exerc´ıcio. Mostre que o conjunto V /W ´e, portanto, um espa¸co vetorial sobre o corpo K com as opera¸co˜es definidas acima. 6 O espa¸co vetorial V /W assim obtido ´e denominado espa¸co quociente de V por W .

2.1.2

Bases Alg´ ebricas de um Espa¸ co Vetorial

• Dependˆ encia Linear Um conjunto finito u1 , . . . , un ∈ V de vetores ´e dito ser linearmente dependente se existir um conjunto de escalares α1 , . . . , αn ∈ V , nem todos nulos, tais que α1 u1 + · · · + αn un = 0.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

96/1304

Um conjunto arbitr´ario de vetores ´e dito ser linearmente independente se n˜ao possuir nenhum subconjunto finito que seja linearmente dependente. • Combina¸ co ˜es Lineares Para um conjunto finito de vetores {u1 , . . . , un } ⊂ V e de escalares {α1 , . . . , αn } ⊂ K, uma express˜ao como α 1 u1 + · · · + α n un

´e dita ser uma combina¸ca ˜o linear dos vetores u1 , . . . , un . • Varredura Linear

Seja C ⊂ V um conjunto de vetores. A varredura linear (“linear span”) de C, denotado por span (C) ´e o conjunto de todos os vetores de V que podem ser escritos como uma combina¸ca˜o linear finita de elementos de C. • Bases Alg´ ebricas em Espa¸ cos Vetoriais Aqui I designa um conjunto arbitr´ario n˜ao-vazio de ´ındices. Uma base alg´ebrica1 em um espa¸co vetorial V ´e um conjunto B = {bi , i ∈ I} de vetores linearmente independentes tais que span (B) = V e tais que qualquer vetor u de V pode ser escrito de modo u ´ nico como uma combina¸ca˜o linear finita de elementos de B. Se B ´e uma base alg´ebrica, ent˜ao para cada u ∈ V existem univocamente definidos α1 , . . . , αn ∈ K e i1 , . . . , in ∈ I tais que: u = α 1 b i1 + · · · + α n b in . Os seguintes teoremas podem ser demonstrados com uso do Lema de Zorn (omitiremos as demonstra¸co˜es aqui. Vide, por exemplo, [61]). Teorema 2.1 Todo espa¸co vetorial V possui uma base alg´ebrica, exceto o espa¸co vetorial trivial V = {0}. 2 Teorema 2.2 Dado um espa¸co vetorial V (n˜ ao trivial), todas as bases alg´ebricas em V tˆem a mesma cardinalidade. 2 • Dimens˜ ao Alg´ ebrica Um espa¸co vetorial ´e dito ser de dimens˜ ao alg´ebrica finita se possuir uma base alg´ebrica finita. Se um espa¸co vetorial V tem dimens˜ao alg´ebrica finita, sua dimens˜ ao alg´ebrica, ou simplesmente dimens˜ ao ´e definida como sendo o n´ umero de elementos de sua base. Nem todo espa¸co vetorial tem uma base alg´ebrica finita (vide exemplos abaixo). De modo geral, se um espa¸co vetorial possui uma base alg´ebrica, sua dimens˜ao alg´ebrica ´e definida como sendo a 1

Tamb´em denominada “base de Hamel”. Georg Hamel (1877-1954)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 2

Vers˜ ao de 29 de setembro de 2005.

97/1304

cardinalidade de suas bases alg´ebricas (pelo Teorema 2.2 acima s˜ao todas iguais). Exemplo 1. V = n sobre o corpo dos complexos ou V = n sobre o corpo dos reais. Tais s˜ao bem conhecidos exemplos-prot´otipo de espa¸cos vetoriais de dimens˜ao finita (= n). 

P,

Seja P = conjunto de todos os polinˆomios de uma vari´avel real com coeficientes complexos: P n (t) ∈

com t ∈



Pn (t) = an tn + · · · + a1 t + a0

, ai ∈ , ´e dito ser um polinˆomio de grau n se an 6= 0.

Exemplo 2. V = P sobre o corpo dos complexos. Este ´e claramente um espa¸co vetorial de dimens˜ao infinita. V possui uma base alg´ebrica, a saber, o conjunto de todos os polinˆomios da forma b n = tn , n = 0, 1, 2, . . .. Exemplo 3. V = sobre o corpo dos reais. O conjunto dos reais sobre o corpo dos reais ´e tamb´em um espa¸co vetorial de dimens˜ao 1, a saber, uma poss´ıvel base ´e formada pelo elemento 1: B = {1}, j´a que, obviamente, qualquer elemento x ∈ pode ser escrito como x = x · 1, com x no corpo dos reais. 



Esse exemplo pode parecer banal, e de fato o ´e, mas leva a um anti-exemplo curioso que mostra que a dimens˜ao alg´ebrica de um espa¸co vetorial ´e tamb´em fortemente dependente do corpo de escalares utilizado. Exemplo 4. V = 

sobre o corpo dos racionais.

A surpresa aqui ´e que este n˜ ao ´e um espa¸co vetorial de dimens˜ao alg´ebrica finita: n˜ao existe um conjunto finito {x1 , . . . , xm } de n´ umeros reais tais que todo x ∈ possa ser escrito como 

x = r 1 x1 + · · · + r m xm , onde os n´ umeros ri s˜ao racionais. A raz˜ao ´e que, como ´e um conjunto cont´avel, a cole¸ca˜o de n´ umeros que se deixam escrever como o lado direito ´e uma cole¸ca˜o cont´avel (tem a mesma cardinalidade de m ). O conjunto , por´em, n˜ao ´e cont´avel. 

Um resultado um tanto surpreendente diz, por´em, que esse espa¸co vetorial possui uma base alg´ebrica, ou seja, existe um conjunto H ⊂ tal que para cada x ∈ existe um conjunto finito h1 , . . . , hn de elementos de H e um conjunto finito de racionais r1 , . . . , rn tais que x = r1 h1 + · · · + rn hn . A demonstra¸ca˜o da existˆencia de uma tal base faz uso do Lema de Zorn e pode ser encontrada em [17] ou [19]. Essa base ´e denominada base de Hamel de . 





Uma conseq¨ uˆencia curiosa da existˆencia de bases de Hamel em inicia a` p´agina 98. 

ser´a discutida no t´opico que se

Outros exemplos menos dram´aticos que mostram a dependˆencia da dimens˜ao com o corpo utilizado s˜ao os seguintes: sejam V1 = sobre o corpo dos complexos e V2 = sobre o corpo dos reais. V1 tem dimens˜ao 1, mas V2 tem dimens˜ao 2. Mais adiante faremos uso do seguinte resultado: Teorema 2.3 Se em um espa¸co vetorial V existir um conjunto {v1 , . . . , vn } de n vetores linearmente independentes, ent˜ ao a dimens˜ ao alg´ebrica de V ´e maior ou igual a n. 2 Prova. A demonstra¸ca˜o ´e feita por absurdo. Suponhamos que haja uma base B = {b 1 , . . . , bk } em V

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

98/1304

com k < n. Ent˜ao podemos escrever v 1 = α 1 b1 + · · · + α k bk . pois B ´e uma base. Nem todos os αi podem ser nulos. Supondo que αk seja um elemento n˜ao-nulo, podemos escrever bk = (αk )−1 (v1 − α1 b1 − · · · − αk−1 bk−1 ) (2.1) Analogamente, temos que

v 2 = β 1 b1 + · · · + β k bk e, usando (2.1), podemos escrever v2 = γ1 b1 + · · · + γk−1 bk−1 + λ1 v1 . Os γi n˜ao podem ser todos nulos, pois de outra forma ter´ıamos v2 = λ1 v1 , contrariando a hip´otese de os vi ’s serem linearmente independentes. Suponhamos que γk−1 seja o elemento n˜ao-nulo, podemos escrever bk−1 como uma combina¸ca˜o linear envolvendo {b1 , . . . , bk−2 } e os vetores v1 e v2 . Prosseguindo, concluiremos ap´os k passos que vk+1 = λ01 v1 + · · · + λ0k vk contrariando a hip´otese de que os vi ’s s˜ao linearmente independentes. • Automorfismos descont´ınuos do grupo ( , +) 

Nota para os estudantes mais avan¸cados. Neste t´opico usaremos as bases de Hamel da reta real para ilustrar uma patologia cuja existˆencia ´e por vezes mencionada na teoria de grupos, a saber, a existˆencia de automorfismos descont´ınuos do grupo ( , +). 

Considere-se a equa¸ca˜o f (x + y) = f (x) + f (y) para todo x, y ∈ . Podemos nos perguntar: ´ bastante claro que fun¸co˜es do tipo f (x) = cx, com que fun¸co˜es f : → podem satisfazˆe-la? E c constante real, satisfazem f (x + y) = f (x) + f (y) para todo x, y ∈ . Fora isso, f (x) = cx s˜ao cont´ınuas e s˜ao bije¸co˜es de em (a menos que c = 0). 











Ser˜ao essas as u ´ nicas fun¸co˜es com a propriedade f (x + y) = f (x) + f (y) para todo x, y ∈ ? Ser´a que h´a outras fun¸co˜es com essa propriedade e que n˜ao sejam cont´ınuas? Ser´a que h´a outras fun¸co˜es com essa propriedade, n˜ao-cont´ınuas, e que tamb´em sejam bije¸co˜es de em ? A resposta a essa u ´ ltima pergunta ´e muito curiosa e conduz a uma classe de fun¸co˜es cuja existˆencia ilustra algumas dificuldades encontradas na teoria de grupos. 





Provemos em primeiro lugar a seguinte afirma¸ca˜o: Proposi¸ c˜ ao 2.1 Se f : → satisfizer f (x + y) = f (x) + f (y) para todo x, y ∈ em toda reta real , ent˜ ao f ´e da forma f (x) = cx para algum c, constante real. 





Historicamente esse pequeno resultado ´e devido a Cauchy2 . 2

Augustin Louis Cauchy (1789-1857).



e f for cont´ınua 2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

99/1304

´ claro Prova. Seja f cont´ınua satisfazendo f (x + y) = f (x) + f (y) para todo x, y ∈ e f : → . E que, tomando x = y = 0 tem-se f (0) = f (0 + 0) = 2f (0) e, portanto f (0) = 0. Segue facilmente da´ı que 0 = f (0) = f (x + (−x)) = f (x) + f (−x) e, portanto f (−x) = −f (x) para todo x ∈ . 







Seja agora p inteiro positivo e x real, ambos arbitr´arios. Teremos que f (px) = f ((p − 1)x + x) = f ((p − 1)x) + f (x) = f ((p − 2)x) + 2f (x) etc. Repetindo p vezes esse proceder, conclu´ımos que f (px) = pf (x). Como f (−x) = −f (x), essa rela¸ca˜o vale para p negativo tamb´em. Seja agora q inteiro, n˜ao-nulo. Ent˜ao, pelo que acabamos de provar, f (1) = f (q/q) = qf (1/q) e conclu´ımos que f (1/q) = f (1)/q. Se ent˜ao tivermos um n´ umero racional r da forma r = p/q, com p inteiro e q inteiro n˜ao-nulo, teremos que f (r) = f (p/q) = pf (1/q) = (p/q)f (1) = rf (1). Finalizamos a prova evocando a continuidade de f e o fato que todo x real pode ser aproximado por um n´ umero racional: seja x ∈ e rn , n ∈ , uma seq¨ uˆencia de n´ umeros racionais que coverge a x, i.e., x = lim n→∞ rn . Ent˜ao f (x) = f (limn→∞ rn ) = limn→∞ f (rn ) = (limn→∞ rn ) f (1) = xf (1). Na segunda igualdade usamos a hip´otese (crucial!) que f ´e cont´ınua em toda parte. Denotando f (1) = c a afirma¸ca˜o est´a provada. 



Com esse resultado em m˜aos podemos nos perguntar: haver´a fun¸co˜es n˜ao-cont´ınuas que satisfazem f (x + y) = f (x) + f (y)? Talvez surpreendentemente, a resposta ´e positiva. N˜ao s´o h´a fun¸co˜es n˜ao em . Fun¸co˜es com tais cont´ınuas com essa propriedade, mas h´a dentre elas fun¸co˜es bijetoras de caracter´ısticas um tanto patol´ogicas podem ser constru´ıdas com o uso das assim chamadas bases de Hamel da reta real. Detalhemos. 



Seja o espa¸co vetorial V dos n´ umeros reais sob o corpo dos racionais. Como consideramos p´aginas acima, esse espa¸co vetorial tem dimens˜ao alg´ebrica infinita, mas existe uma base H ⊂ de V , n˜aocont´avel, denominada base de Hamel, tal que todo elemento x de pode ser escrito como combina¸ca˜o linear finita (´ unica!) por racionais de elementos de H, ou seja, para todo x ∈ existe um n (que depende de x), racionais r1 , . . . , rn (que dependem de x) e elementos h1 , . . . , hn de H (que tamb´em dependem de x) tais que x pode ser escrita (de forma u ´ nica!) como x = r1 h1 + · · · + rn hn . Denominaremos essa express˜ao a decomposi¸ca˜o de x em H. 





0 h0m s˜ao suas Notemos que se x e y s˜ao n´ umeros reais e x = r1 h1 + · · · + rn hn e y = r10 h01 + · · · + rm 0 decomposi¸co˜es em H, ent˜ao a decomposi¸ca˜o de x + y ´e r1 h1 + · · · + rn hn + r10 h01 + · · · + rm h0m .

Vamos definir uma fun¸ca˜o f : → , da seguinte forma. Primeiramente fixamos seus valores nos elementos de H tomando, para cada h ∈ H, f (h) := fh ∈ , onde os n´ umeros fh s˜ao escolhidos arbitrariamente. Em segundo lugar, para qualquer x ∈ , e cuja decomposi¸ca˜o em H seja x = r1 h1 + · · · + rn hn , definimos f (x) := r1 f (h1 ) + · · · + rn f (hn ) = r1 fh1 + · · · + rn fhn . Assim, se x e y s˜ao 0 n´ umeros reais e x = r1 h1 + · · · + rn hn e y = r10 h01 + · · · + rm h0m s˜ao suas decomposi¸co˜es em H, teremos 0 fh0m = f (x) + f (y). f (x + y) = r1 fh1 + · · · + rn fhn + r10 fh01 + · · · + rm 







O leitor pode convencer-se que h´a, para cada base de Hamel H, infinitas fun¸co˜es desse tipo (devido a` arbitrariedade da escolha dos fh ’s) e que todas s˜ao descont´ınuas, exceto se escolhermos fh = ch para todo h ∈ H, com uma constante c fixa. Espertamente, podemos tomar f como uma bije¸ca˜o de H em H, ou seja, podemos escolher3 fh ∈ H para todo h ∈ H e de modo que para todo h ∈ H exista um g ∈ H u ´ nico tal que fg = h. Uma situa¸ca˜o trivial dessas ´e aquela na qual f ´e a identidade quando restrita a H: fh = h para todo h ∈ H, mas outras escolhas s˜ao tamb´em poss´ıveis. Se f for uma bije¸ca˜o de H em H, ´e f´acil de se ver que imagem 3

Que tal ´e poss´ıvel ´e garantido pelo axioma da escolha −→ Exerc´ıcio.

JCABarata. Curso de F´ısica-Matem´ atica

de f no dom´ınio

´e toda a reta real 



Cap´ıtulo 2

Vers˜ ao de 29 de setembro de 2005.

100/1304

(mostre isso)!

Al´em disso, uma tal f , bijetora enquanto fun¸ca˜o de H em H, ´e igualmente bijetora como fun¸ca˜o em . Mostremos isso. Sejam x e y ∈ com decomposi¸co˜es x = r1 h1 + · · · + rn hn e y = de s1 g1 + · · · + sm gm com rj , sk ∈ e hj , gk ∈ H e suponhamos que f (x) = f (y). Isso significa que r1 fh1 + · · · + rn fhn = s1 fg1 + · · · + sm fgm . Como cada fhj e cada fgk ´e elemento de H, essa igualdade s´o ´e poss´ıvel se m = n, se fhj = fgπ(j) e se rj = sπ(j) para todo j = 1, . . . , n, onde π ´e um elemento do grupo de permuta¸co˜es de n elementos (ou seja, ´e uma bije¸ca˜o de {1, . . . , n} em si mesmo). Como f ´e uma bije¸ca˜o de H em si mesmo, segue que hj = gπ(j) para todo j = 1, . . . , n. Assim, 





x =

n X

r j hj =

j=1

e, portanto, f :





n X j=1

sπ(j) gπ(j) =

n X

sj gj = y,

j=1

´e bijetora. 

Uma fun¸ca˜o que satisfa¸ca f (x + y) = f (x) + f (y) para todo x, y ∈ e f : → representa um endomorfismo do grupo ( , +). O que aprendemos no u ´ ltimo par´agrafo pode ser expresso na linguagem da teoria de grupos como a afirma¸ca˜o que existem automorfismos de ( , +) que n˜ao s˜ao cont´ınuos. Esse fato ilustra algumas situa¸co˜es patol´ogicas que s˜ao por vezes encontradas ou mencionadas no estudo de grupos cont´ınuos. Com o uso de fun¸co˜es f desse tipo ´e poss´ıvel, por exemplo, construir sub-grupos uniparam´etricos n˜ao-cont´ınuos de um grupo de Lie dado ou representa¸co˜es n˜ao-cont´ınuas de tais sub-grupos. 









Assim, por exemplo, se A ´e uma matriz real n × n antisim´etrica, ent˜ao O(t) = exp(tA), t ∈ ´e um subgrupo uniparam´etrico cont´ınuo de SO(n), pois O(0) = e O(t)O(t0 ) = O(t+t0 ) para todos t, t0 ∈ , sendo os elementos de matriz de O(t) fun¸co˜es cont´ınuas de t. Se agora definirmos P (t) = exp(f (t)A), t ∈ , para uma fun¸ca˜o f : → , patol´ogica como acima (ou seja, satisfazendo f (x+y) = f (x)+f (y) para todo x, y ∈ , bijetora mas descont´ınua), ainda teremos P (0) = e P (t)P (t0 ) = P (t + t0 ) para todos t, t0 ∈ , mas os elementos de matriz de P (t) n˜ao s˜ao fun¸co˜es cont´ınuas de t. 













• Bases Topol´ ogicas em Espa¸ cos Vetoriais Nota para os estudantes mais avan¸cados. O conceito de base alg´ebrica n˜ao deve ser confundido com o de base topol´ ogica, conceito esse pertencente ao contexto dos espa¸cos vetoriais topol´ogicos: Uma base topol´ ogica em um espa¸co vetorial topol´ogico V ´e um conjunto B = {b i , i ∈ I} de vetores linearmente independentes tais que span (B) ´e um conjunto denso em V , ou seja, o fecho de span (B) ´e V . Uma base topol´ogica ´e dita ser base topol´ ogica completa se n˜ao possuir nenhum subconjunto pr´oprio que tamb´em seja uma base topol´ogica. A dimens˜ ao topol´ ogica de um espa¸co vetorial ´e ent˜ao definida como sendo a cardinalidade das bases topol´ogicas completas de V . Para ilustrar como os conceitos de base alg´ebrica e base topol´ogica s˜ao diferentes, consideremos novamente o seguinte Exemplo 4 acima: Exemplo 5. V = 

sobre o corpo dos racionais, com a topologia usual sobre 

, tem uma base

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

topol´ogica completa de dimens˜ao finita: B = {1}. De fato, o conjunto {r · 1, r ∈ Esse espa¸co vetorial possui ent˜ao uma dimens˜ao topol´ogica igual a um.

101/1304

} ´e denso em 

.

Defini¸ c˜ ao. Um espa¸co vetorial topol´ogico sobre o corpo dos reais ou dos complexos ´e dito ser separ´avel se possuir uma base topol´ogica cont´avel.

2.1.3

O Dual Alg´ ebrico de um Espa¸ co Vetorial

Seja V um espa¸co vetorial sobre um corpo K (por exemplo, o corpo definida sobre todo V , ´e dita ser um funcional linear se

). Uma aplica¸ca˜o l : V → K,

l(αx + βy) = αl(x) + βl(y) para todo x, y ∈ V e todo α, β ∈ K. E. 2.7 Exerc´ıcio. que l(0) = 0.

Mostre que, de acordo com a defini¸c˜ao acima, vale para qualquer funcional linear l 6

O conjunto de todos os funcionais lineares de V em K ´e denominado espa¸co dual alg´ebrico de V e denotado V 0 . O conjunto V 0 ´e feito um espa¸co vetorial (sobre K), atrav´es da seguinte rela¸ca˜o: (αl + βm)(x) := l(αx) + m(βx), para todo l e m ∈ V 0 ; α, β ∈ K e todo x ∈ V . O vetor nulo de V 0 ´e o funcional linear que associa trivialmente todo vetor de V a zero: l(x) = 0, ∀x ∈ V .

O seguinte teorema ´e verdadeiro e ser´a implicitamente usado v´arias vezes no que segue. Sua demonstra¸ca˜o ´e, como veremos, elementar mas instrutiva.

Teorema 2.4 Seja um espa¸co vetorial V sobre um corpo K. Se um vetor v tem a propriedade que l(v) = 0 para todo l ∈ V 0 ent˜ ao v = 0. 2 Prova. Seja B uma base alg´ebrica em V . Para cada elemento b ∈ B podemos associar um funcional linear lb , definido da seguinte forma. Como todo w ∈ V pode ser escrito como uma combina¸ca˜o linear finita de elementos de B, podemos sempre escrever w = wb b + w 0 , ´ claro que wb = 0 caso b onde w 0 ´e uma combina¸ca˜o linear finita de elementos de B \ {b} e wb ∈ K. (E n˜ao compare¸ca na decomposi¸ca˜o de w em uma soma finita de elementos de B). Definimos ent˜ao lb (w) = wb , ´ um exerc´ıcio simples mostrar que, para cada b ∈ B, a aplica¸ca˜o lb : V → K para todo vetor w ∈ V . E dada acima ´e um funcional linear. E. 2.8 Exerc´ıcio. Mostre isso.

6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

102/1304

Seja ent˜ao v um vetor como no enunciado do teorema. Se l(v) = 0 para todo l ∈ V 0 , vale obviamente que lb (v) = 0 para todo b ∈ B. Isso, por´em, trivialmente implica que v = 0, completando a demonstra¸ca˜o. Nota¸ca ˜o. Para x ∈ V e l ∈ V 0 ´e muito freq¨ uente, e graficamente conveniente, usar-se a nota¸ca˜o hl, xi em lugar de l(x). Se A e B s˜ao espa¸cos vetoriais e A ⊂ B ent˜ao B 0 ⊂ A0 . ´ltima afirmativa. E. 2.9 Exerc´ıcio. Justifique essa u

6

• O Dual Topol´ ogico de um Espa¸ co Vetorial Seja V um espa¸co vetorial topol´ogico. O conjunto de todos os funcionais lineares cont´ınuos sobre V ´e dito ser o dual topol´ ogico de V . O dual topol´ogico ser´a denotado nestas notas por V † . Note-se que V † ⊂ V 0. • Exemplos de Funcionais Lineares Exemplo 1. Seja V = n , sobre o corpo dos complexos. Seja a1 , . . . , an um conjunto fixo de n´ umeros complexos. Para qualquer vetor z = (z1 , . . . , zn ) ∈ n defina-se l(z) = a1 z1 + · · · + an zn . Ent˜ao l ´e um funcional linear em

n

.

E. 2.10 Exerc´ıcio. Verifique.

6

Em verdade, ´e poss´ıvel demonstrar a rec´ıproca: em n todo funcional linear ´e da forma acima para algum conjunto {a1 , . . . , an }. Essa afirmativa ´e um caso particular de um teorema importante conhecido como “Lema de Riesz”, que ser´a demonstrado no contexto mais geral dos chamados espa¸cos de Hilbert, dos quais n ´e um exemplo. Seja P o conjunto de todos os polinˆomios de uma vari´avel real com coeficientes complexos: P n (t) ∈ P, Pn (t) = an tn + · · · + a1 t + a0 com t ∈ , ai ∈ , ´e dito ser um polinˆomio de grau n se an 6= 0. O conjunto P ´e claramente um espa¸co vetorial sobre os complexos. 

Exemplo 2. Para cada t0 ∈ 

e p ∈ P, l(p) = p(t0 )

´e um funcional linear em P. E. 2.11 Exerc´ıcio. Verifique. Esse exemplo pode ser generalizado:

6

JCABarata. Curso de F´ısica-Matem´ atica

Exemplo 3. Sejam t1 , . . . , tn ∈ definamos 

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

103/1304

, distintos, e a1 , . . . , an n´ umeros complexos. Para todo p ∈ P,

l(p) = a1 p(t1 ) + · · · + an p(tn ). Ent˜ao l ´e um funcional linear em P. E. 2.12 Exerc´ıcio. Verifique.

6

Ou ´ ltimo exemplo pode ser fortemente generalizado nos dois exemplos que seguem. Exemplo 3. Seja (a, b) um intervalo finito de e h uma fun¸ca˜o complexa integr´avel nesse intervalo Rb (ou seja, a |h(t)|dt ≤ ∞). Ent˜ao, Z b h(t) p(t) dt l(p) = 

a

est´a definida para todo p ∈ P e define um funcional linear em P. E. 2.13 Exerc´ıcio. Justifique as duas u ´ltimas afirmativas. 2

Exemplo 4. Seja a fun¸ca˜o g(x) = e−x . Ent˜ao Z ∞ l(p) = g(t) p(t) dt.

6

−∞

est´a definida para todo p ∈ P e define um funcional linear em P. ´ltimas afirmativas. E. 2.14 Exerc´ıcio. Justifique as duas u

6

• A Rela¸ c˜ ao entre V e V 0 Vamos aqui discutir o fato que sempre existe uma maneira (n˜ao-canˆonica, vide abaixo) de associar vetores de um espa¸co vetorial V com elementos de seu dual alg´ebrico V 0 . Seja V um espa¸co vetorial sobre um corpo K e B ⊂ V uma base alg´ebrica em V . Seja FB a cole¸ca˜o de todas as fun¸co˜es de B em K. Afirmamos que existe uma bije¸ca˜o de FB sobre V 0 , ou seja, esses dois conjuntos podem ser identificados nesse sentido. Para tal, seja f ∈ FB . Definimos uma aplica¸ca˜o I : FB → V 0 da seguinte forma. Como todo x ∈ V pode ser escrito como uma combina¸ca˜o linear finita de elementos de B, digamos, x = α1 bi1 +· · ·+αn bin , escrevemos I(f )(x) = α1 f (bi1 ) + · · · + αn f (bin ). I(f ) ´e um funcional linear pois, se escrevemos y = αn+1 bin+1 + · · · + αn+m bin+m , teremos I(f )(x + y) = α1 f (bi1 ) + · · · + αn+m f (bin+m ) = α1 f (bi1 ) + · · · + αn f (bin ) + αn+1 f (bin+1 ) + · · · + αn+m f (bin+m ) = I(f )(x) + I(f )(y).

(2.2)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

104/1304

Isso ent˜ao mostrou que I(f ) ´e de fato um elemento de V 0 para cada f ∈ FB . Vamos mostrar o reverso: que a cada elemento l de V 0 h´a um elemento gl de FB associado e que I(gl ) = l. Seja novamente x = α1 bi1 + · · · + αn bin ∈ V e seja l um elemento de V 0 . Tem-se l(x) = α1 l(bi1 ) + · · · + αn l(bin ). Definimos ent˜ao gl : B → K por

gl (b) = l(b)

para todo b ∈ K. Pela defini¸ca˜o I(gl )(x) = α1 gl (bi1 ) + · · · + αn gl (bin ) = α1 l(bi1 ) + · · · + αn l(bin ) = l(x)

(2.3)

para todo x ∈ V . Logo I(gl ) = l como quer´ıamos.

A aplica¸ca˜o I : FB → V 0 ´e, portanto, uma bije¸ca˜o entre esses dois conjuntos. Notemos, por´em, que essa bije¸ca˜o n˜ao ´e canˆonica no sentido que a mesma depende da base adotada. Se trocarmos B por outra base a bije¸ca˜o altera-se. De posse desses fatos podemos entender a rela¸ca˜o entre V e V 0 da seguinte forma. Seja o subconjunto GB de FB formado por todas as fun¸co˜es que assumem valores n˜ao-nulos (no corpo K) apenas para um conjunto finito de B, ou seja, para g ∈ GB existe um conjunto finito Bg = {b1 , . . . , bn } ⊂ B tal que g ´e n˜ao-nula nos elementos de Bg , mas ´e nula em B \ Bg . Os conjuntos GB e V podem ser identificados no seguinte sentido. Afirmamos que existe uma bije¸ca˜o J : GB → V . Tal ´e f´acil de ver se lembrarmos que os elementos de V podem ser escritos como uma combina¸ca˜o linear finita de elementos de B. De fato, para g ∈ GB definimos J(g) = g(b1 )b1 + · · · + g(bn )bn ∈ V onde {b1 , . . . , bn } = Bg . Reciprocamente, se x ∈ V e x = α1 bi1 + · · · + αn bin , definimos gx ∈ GB por gx (bia ) = αa ,

a = 1, . . . , n

e gx (b) = 0, ´ f´acil ver ent˜ao que se b 6∈ {bi1 , . . . , bin }. E J(gx ) = g(bi1 )bi1 + · · · + g(bin )bin = α1 bi1 + · · · + αn bin = x ,

(2.4)

o que mostra que J ´e bijetora. Notemos novamente que essa bije¸ca˜o tamb´em n˜ao ´e canˆonica, no sentido que a mesma depende da base adotada. Se trocarmos B por outra base a bije¸ca˜o altera-se. E. 2.15 Exerc´ıcio importante. Mostre agora que J −1 : V → Gb ´e linear, ou seja, J −1 (αx + βy) = αJ −1 (x) + βJ −1 (y) para todos x, y ∈ V e todos α, β ∈ K. 6 Juntando o discutido acima, conclu´ımos que φ1 = I ◦ J −1 ´e uma aplica¸ca˜o linear injetora de V em V . A mesma, por´em, n˜ao ´e “natural”, pois depende da base alg´ebrica B escolhida. 0

Assim, fixada uma base B em V h´a uma maneira de associar todos os elementos de V com elementos do seu dual alg´ebrico. Notemos por´em que pode haver elementos de V 0 aos quais n˜ao correspondem tais

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

105/1304

identifica¸co˜es, ou seja, a imagem de φ1 = I ◦ J −1 ´e tipicamente (especialmente em dimens˜ao infinita) um subconjunto pr´oprio de V 0 . Exemplo. Seja P o espa¸co vetorial dos polinˆomios em definido acima. Seja T = {ti ∈ , i ∈ }, um conjunto cont´avel de pontos distintos da reta real e seja q(t) = q0 + q1 t + · · · + qn tn , polinˆomio. Definamos lq ∈ V 0 por lq (p) = q0 p(t0 ) + q1 p(t1 ) + · · · + qn p(tn ). 

E. 2.16 Exerc´ıcio. Mostre que a aplica¸c˜ao P 3 q → lq ∈ V 0 ´e linear e injetora.





6

E. 2.17 Exerc´ıcio. Ser´a que com o conjunto T fixado todo elemento de V 0 seria da forma lq para algum q?. Pense. Inspire-se nos exemplos 3 e 4 da p´agina 103. O que acontece para conjuntos T diferentes? 6 Coment´ ario. Mais interessante que a rela¸ca˜o entre V e V 0 , ´e a rela¸ca˜o de V com o dual alg´ebrico de 0 V , o chamado bi-dual alg´ebrico de V e denotado por (V 0 )0 , assunto que discutiremos agora. A raz˜ao ´e que, ao contr´ario do que tipicamente ocorre entre V e V 0 , h´a sempre uma aplica¸ca˜o linear injetora entre V e (V 0 )0 que ´e natural, ou seja, independente de escolhas de bases. Outro interesse na rela¸ca˜o entre V e (V 0 )0 reside no fato que a mesma revela-nos, como veremos, uma profunda distin¸ca˜o entre espa¸cos vetoriais de dimens˜ao finita e infinita. • O Bi-dual Alg´ ebrico de um Espa¸ co Vetorial Se V ´e um espa¸co vetorial sobre um corpo K j´a observamos que V 0 ´e tamb´em um espa¸co vetorial sobre o mesmo corpo. Assim, V 0 tem tamb´em seu dual alg´ebrico que ´e denominado bi-dual alg´ebrico de V . O bi-dual alg´ebrico de um espa¸co vetorial V ´e o espa¸co (V 0 )0 . Como vimos nas p´aginas anteriores, existe pelo menos uma aplica¸ca˜o linear injetiva de V em V 0 . Chamemos esta aplica¸ca˜o de φ1 . Analogamente, existe pelo menos uma aplica¸ca˜o linear injetiva φ2 de V 0 em (V 0 )0 . A composi¸ca˜o φ2 ◦ φ1 fornece uma aplica¸ca˜o linear injetiva de V em (V 0 )0 . Como φ1 e φ2 dependem de escolhas de base, a composi¸ca˜o φ2 ◦ φ1 tamb´em depende, n˜ao sendo, assim, natural.

Ao contr´ario do que ocorre na rela¸ca˜o entre V e V 0 , podemos sempre encontrar uma aplica¸ca˜o linear injetiva de V em (V 0 )0 que ´e natural: independente de base. Vamos denot´a-la por λ. Definimos λ : V → (V 0 )0 da seguinte forma: para x ∈ V , λ(x) ´e o elemento de (V 0 )0 que associa a cada l ∈ V 0 o valor l(x): λ(x)(l) = l(x). E. 2.18 Exerc´ıcio. Mostre que λ : V → (V 0 )0 ´e linear.

6

E. 2.19 Exerc´ıcio. Mostre que λ : V → (V 0 )0 ´e injetora. Sugest˜ao: use o Teorema 2.4, enunciado e demonstrado na p´agina 101. 6 ´ transparente pela defini¸ca˜o de λ que a mesma ´e independente de bases e, portanto, “natural”. A E rela¸ca˜o entre x ∈ V e um elemento de (V 0 )0 mostrada acima ´e t˜ao direta que quase poder´ıamos dizer que

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

106/1304

V ´e um subconjunto de (V 0 )0 : V ⊂ (V 0 )0 . Alguns autores, abusando um pouco da linguagem, chegam mesmo a escrever uma tal rela¸ca˜o de inclus˜ao. Mais correta, no entanto ´e a rela¸ca˜o λ(V ) ⊂ (V 0 )0 .

Poder´ıamos nesse momento nos perguntar: quando podemos eventualmente ter λ(V ) = (V 0 )0 ? Para o caso de espa¸cos vetoriais sobre o corpo dos reais ou dos complexos resposta ´e simples e um tanto surpreendente e se expressa no seguinte teorema. Teorema 2.5 Seja V um espa¸co vetorial sobre o corpo dos reais ou dos complexos. Ent˜ ao λ(V ) = (V 0 )0 se e somente se V ´e um espa¸co vetorial de dimens˜ ao finita. 2 Este teorema revela uma importante distin¸ca˜o entre espa¸cos de dimens˜ao finita e infinita. Em dimens˜ao finita todos os funcionais lineares do dual alg´ebrico de V 0 s˜ao da forma λ(x) para algum vetor x. Em dimens˜ao infinita, por´em, h´a certamente elementos em (V 0 )0 que n˜ao s˜ao dessa forma. Assim, ao tomarmos duais duplos em dimens˜ao infinita sempre obtemos espa¸cos vetoriais “maiores”, o que n˜ao ocorre em dimens˜ao finita. Prova. Seja V um espa¸co vetorial sobre um corpo K =

ou 

.

Caso de dimens˜ ao finita. Vamos em primeiro lugar supor que V ´e de dimens˜ao finita e denotemos ´ claro que o n´ por dim V sua dimens˜ao. Seja tamb´em B = {b1 , . . . , bn } uma base de V . E umero de elementos de B ´e n = dim V . ´ f´acil mostrar que o conjunto {λ(b1 ), . . . , λ(bn )} ´e linearmente independente em (V 0 )0 . De fato, se E existirem escalares αi tais que α1 λ(b1 ) + · · · + αn λ(bn ) = 0

ou seja,

ter´ıamos para todo l ∈ V 0

λ(α1 b1 + · · · + αn bn ) = 0 λ(w)(l) = l(w) = 0

onde w = α1 b1 + · · · + α1 bn . Isso, por´em, implica w = 0 (pelo Teorema 2.4, p´agina 101), o que implica α1 = · · · = αn = 0.

Isso claramente diz que dim (V 0 )0 ≥ dim V . Afirmamos que a igualdade s´o se d´a se λ(V ) = (V 0 )0 . De fato, se λ(V ) = (V 0 )0 ent˜ao todo elemento de (V 0 )0 ´e da forma λ(α1 b1 + · · · + αn bn ) = α1 λ(b1 ) + · · · + αn λ(bn )

e, portanto {λ(b1 ), . . . , λ(bn )} ´e uma base em (V 0 )0 e dim (V 0 )0 = dim V . Se, por outro lado, λ(V ) ´e um subconjunto pr´oprio de (V 0 )0 , existem elementos v 00 ∈ (V 0 )0 tais que v 00 − α1 λ(b1 ) − · · · − αn λ(bn ) 6= 0 para todos αi ∈ K. Portanto, {v 00 , λ(b1 ), . . . , λ(bn )} ´e um conjunto de n + 1 vetores linearmente independentes. Logo dim (V 0 )0 > n = dim V , pelo Teorema 2.3, p´agina 97. Vamos ent˜ao mostrar que obrigatoriamente tem-se que dim (V 0 )0 = dim V , provando o teorema. Como vimos quando discutimos a rela¸ca˜o entre V e V 0 a` p´agina 103, V 0 ´e equivalente ao conjunto FB de todas as fun¸co˜es de B em K, enquanto que V ´e equivalente ao conjunto GB formado por todas as fun¸co˜es que assumem valores n˜ao-nulos (no corpo K) apenas para um conjunto finito de B. Como B tem um n´ umero finito de elementos, sucede GB = FB (por que?). Logo V e V 0 s˜ao equivalentes: existe uma bije¸ca˜o linear ϕ1 entre ambos.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

107/1304

A aplica¸ca˜o ϕ1 leva a base B em uma base ϕ1 (B) em V 0 . Para ver isso, notemos que todo elemento l ∈ V 0 ´e da forma l = ϕ1 (v), para algum v ∈ V . Como todo v ∈ V ´e da forma v = α1 b1 +· · ·+αn bn , segue que todo elemento l ∈ V 0 ´e da forma α1 ϕ1 (b1 )+· · ·+αn ϕ1 (bn ). Como ϕ1 ´e bijetora, {ϕ1 (b1 ), . . . , ϕ1 (bn )} ´e um conjunto de vetores linearmente independentes pois se existirem escalares β1 , . . . , βn tais que β1 ϕ1 (b1 ) + · · · + βn ϕ1 (bn ) = 0

ter´ıamos ϕ1 (β1 b1 + · · · + βn bn ) = 0 o que implica β1 b1 + · · · + βn bn = 0, pois ϕ1 ´e bijetora. Isso por´em implica β1 = · · · = βn = 0, pois {b1 , . . . , bn } ´e uma base. Assim, ϕ1 (B) = {ϕ1 (b1 ), . . . , ϕ1 (bn )} ´e uma base em V 0 e, portanto, dim V 0 = n = dim V . Analogamente, tem-se que V 0 e (V 0 )0 s˜ao equivalentes e, portanto, existe uma bije¸ca˜o linear ϕ2 entre ambos que leva a base ϕ1 (B) em uma base ϕ2 ◦ ϕ1 (B) em (V 0 )0 . Portanto, dim V 0 = dim (V 0 )0 . Logo dim V = dim V 0 = dim (V 0 )0 , como quer´ıamos provar.

Caso de dimens˜ ao infinita. No caso de dimens˜ao infinita desejamos mostrar que sempre h´a elementos 0 0 em (V ) que n˜ao s˜ao da forma λ(x) para algum x ∈ V . Abaixo K ´e o corpo dos reais ou dos complexos.

Vamos primeiro delinear a estrat´egia a ser seguida. Seja B uma base em V (fixa daqui por diante). Como sabemos, existe uma aplica¸ca˜o linear bijetora φ : FB → V 0 . Uma fun¸ca˜o s : B → K, s ∈ FB ´e dita ser limitada se existir um M > 0 tal que |s(b)| < M para todo b ∈ B. Seja LB o conjunto de ´ claro que LB ⊂ FB . Vamos mostrar o seguinte: n˜ao existe todas as fun¸co˜es limitadas de B em K. E nenhum vetor n˜ao-nulo v ∈ V com a propriedade que λ(v)(β) = 0

para todo β ∈ φ(LB ). Seja v = α1 b1 + · · · + αm bm um tal vetor para o qual λ(v)(β) = 0. Isso significa que para todo β ∈ φ(LB ) 0 = λ(v)(β) = β(v) = α1 β(b1 ) + · · · + αm β(bm ).

Tomemos funcionais βi ’s da forma

βi (b) =



1, se b = bi 0, de outra forma

para i = 1, . . . , m. Como todo βi ´e um elemento de φ(LB ) (por que?), ter´ıamos 0 = βi (v) = αi para todo i, o que implica v = 0. A conclus˜ao ´e que nenhum elemento de (V 0 )0 que seja da forma λ(v) para algum v ∈ V n˜ao-nulo pode anular todos os elementos de φ(LB ) ⊂ V 0 . A estrat´egia que seguiremos ser´a a de exibir um elemento de (V 0 )0 que tem precisamente a propriedade de anular todos os elementos de φ(LB ). Um tal elemento n˜ao pode pertencer, portanto, a λ(V ), o que mostra que λ(V ) ´e um subconjunto pr´oprio de (V 0 )0 no caso de dimens˜ao infinita. Seja u ∈ V 0 \ φ(LB ) e U o sub-espa¸co de V 0 gerado por u. Todo elemento l ∈ V 0 pode ser escrito de modo u ´ nico na forma l = au + y ´ claro que α ∈ (V 0 )0 onde a ∈ K e y pertence ao sub-espa¸co complementar de U . Definamos α(l) = a. E e que α aniquila todo elemento de φ(LB ), pois estes pertencem ao sub-espa¸co complementar de U (por que?). Assim, α ∈ (V 0 )0 mas α 6∈ λ(V ).

JCABarata. Curso de F´ısica-Matem´ atica

2.2 2.2.1

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

108/1304

Formas Lineares, Sesquilineares e Produtos Escalares em Espa¸ cos Vetoriais Formas Multilineares

Seja V um espa¸co vetorial sobre um corpo K (por exemplo, os reais ou os complexos) e n um n´ umero 4 n inteiro positivo. Uma n-forma multilinear em V ´e uma fun¸ca˜o ω : V → K que seja linear em cada um dos seus argumentos, ou seja, para todo α, β ∈ K, todos v1 , . . . , vn ∈ V , vi0 ∈ V e todo i = 1, . . . , n vale ω (v1 , . . . , vi−1 , (αvi + βvi0 ), vi+1 , . . . , vn ) = αω (v1 , . . . , vi−1 , vi , vi+1 , . . . , vn ) + βω (v1 , . . . , vi−1 , vi0 , vi+1 , . . . , vn ) (2.5) O seguinte fato importante ´e conseq¨ uˆencia imediata da defini¸ca˜o acima: se ω ´e uma n-forma multilinear ent˜ao ω (v1 , . . . , vi−1 , 0, vi+1 , . . . , vn ) = 0 para todo i, ou seja, se um dos argumentos ´e o vetor nulo a forma se anula. E. 2.20 Exerc´ıcio. Prove isso. Sugest˜ao: o que acontece se escolhermos α = β = 0?

6

Um fato importante ´e o seguinte: o conjunto de todas as n-formas lineares em um espa¸co vetorial V sobre um corpo K ´e igualmente um espa¸co vetorial sobre K. Para tal procede-se da seguinte forma: para duas n-formas lineares ω1 e ω2 e dois escalares α1 , α2 ∈ K define-se a combina¸ca˜o linear α1 ω1 +α2 ω2 como sendo a n-forma linear que a toda n-upla de vetores v1 , . . . , vn ∈ V associa (α1 ω1 + α2 ω2 )(v1 , . . . , vn ) = α1 ω1 (v1 , . . . , vn ) + α2 ω2 (v1 , . . . , vn ). E. 2.21 Exerc´ıcio. Complete os detalhes da prova que o conjunto de todas as n-formas lineares em um espa¸co vetorial V sobre um corpo K forma um espa¸co vetorial sobre K. 6 • Formas Bilineares De particular interesse ´e o caso n = 2, em cujo caso as formas s˜ao denominadas formas bilineares: uma forma bilinear ´e uma fun¸ca˜o ω : V 2 → K que seja linear em cada um dos seus dois argumentos, ou seja, para todo α, β ∈ K, todos u, v, w ∈ V , valem ω(u, (αv + βw)) = αω(u, v) + βω(u, w), ω((αu + βv), w) = αω(u, w) + βω(v, w). 4

Tamb´em chamada n-forma linear ou simplesmente n-forma.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

109/1304

Um exemplo b´asico importante ´e o seguinte. Seja V = n o espa¸co vetorial (sobre o corpo dos reais) formado por n-uplas de n´ umeros reais: V = {x = (x1 , . . . , xn ), xi ∈ }. Uma forma bilinear em V ´e dada por n X xk y k . (2.6) hx, yi = 





k=1

Outro exemplo ´e ωA (x, y) = hx, Ayi , 

onde A ´e uma matriz n × n real qualquer. • Formas Bilineares N˜ ao-Degeneradas Uma forma bilinear ω ´e dita ser uma forma bilinear n˜ ao-degenerada se satisfizer a seguinte condi¸ca˜o: se para todo vetor v valer ω(v, u) = 0, ent˜ao u = 0. • Formas Bilineares N˜ ao-Singulares Seja V um espa¸co vetorial e ω uma forma bilinear em V . Para u ∈ V fixo a aplica¸ca˜o lu (v) = ω(u, v) ´e um funcional linear em V , ou seja, um elemento do espa¸co dual V 0 . Se a aplica¸ca˜o l : V → V 0 que associa cada u ∈ V ao funcional linear lu acima for um isomorfismo de espa¸cos vetoriais a forma bilinear ω ´e dita ser uma forma bilinear n˜ ao-singular. H´a v´arios outros tipos de formas multilineares que s˜ao importantes, como por exemplo as chamadas formas multilineares alternantes e, dentre estas as formas simpl´eticas. • Formas Alternantes Uma n-forma linear ω em um espa¸co vetorial V sobre um corpo K ´e dita ser uma forma alternante (ou uma forma anti-sim´etrica) se satisfizer ω (v1 , . . . , vi−1 , vi , vi+1 , vi+2 , . . . , vn ) = −ω (v1 , . . . , vi−1 , vi+1 , vi , vi+2 , . . . , vn )

(2.7)

para todos os vetores v1 , . . . , vn ∈ V e todo i = 1, . . . , n − 1. Em palavras, quando trocamos de lugar dois argumentos vizinhos quaisquer a forma troca de sinal. Deve ser bem claro que essa defini¸ca˜o equivale a` seguinte afirma¸ca˜o: se ω ´e uma n-forma linear alternante, ent˜ao para todo π ∈ Sn , o grupo de permuta¸co˜es de n elementos, vale  ω vπ(1) , . . . , vπ(n) = (sinalπ) ω (v1 , . . . , vn ) , (2.8)

para todos os vetores v1 , . . . , vn ∈ V , onde sinalπ ´e o sinal da permuta¸ca˜o π (definido a` p´agina 671). E. 2.22 Exerc´ıcio. Est´a claro?

6

Nomenclatura. Se ω ´e n-forma linear alternante, n ´e dito ser o grau de ω. O conjunto de todas as n-formas lineares alternantes em um espa¸co vetorial V sobre um corpo K ´e igualmente um espa¸co vetorial sobre K: para duas n-formas lineares alternantes ω1 e ω2 e dois escalares

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 2

Vers˜ ao de 29 de setembro de 2005.

110/1304

α1 , α2 ∈ K define-se a combina¸ca˜o linear α1 ω1 + α2 ω2 como sendo a n-forma linear que a toda n-upla de vetores v1 , . . . , vn ∈ V associa (α1 ω1 + α2 ω2 )(v1 , . . . , vn ) = α1 ω1 (v1 , . . . , vn ) + α2 ω2 (v1 , . . . , vn ). ´ f´acil constatar que a n-forma linear assim definida ´e tamb´em alternante. E E. 2.23 Exerc´ıcio. Complete os detalhes da prova que o conjunto de todas as n-formas lineares alternantes em um espa¸co vetorial V sobre um corpo K forma um espa¸co vetorial sobre K. 6 • Formas Simpl´ eticas Formas bilineares alternantes n˜ao-degeneradas s˜ao denominadas formas simpl´eticas 5. Formas simpl´eticas s˜ao importantes em algumas a´reas da F´ısica, como por exemplo na mecˆanica cl´assica e no estudo de m´etodos de quantiza¸ca˜o. Assim, uma forma simpl´etica em um espa¸co vetorial V sobre um corpo K ´e uma forma bilinear para a qual ω(u, v) = −ω(v, u) para todos os vetores u, v ∈ V e tal que se ω(u, v) = 0 para todo v, ent˜ao u = 0. Um exemplo b´asico importante no caso do espa¸co vetorial V = 2.4, ´e o caso geral ´e o seguinte: ωA (x, y) = hx, Ayi ,

n



e que, como veremos na Se¸ca˜o



onde A ´e uma matriz n × n real anti-sim´etrica, ou seja, que satisfaz AT = −A, o que equivale a dizer que seus elementos de matriz satisfazem Aij = −Aji . Fora isso, pela condi¸ca˜o de n˜ao-degenerescˆencia A tem que ser invert´ıvel, pois se hx, Ayi = 0 para todo y, ent˜ao hAT x, yi = 0 para todo y, o que s´o ´e poss´ıvel se AT x = 0. Isso implicaria que det(A) = det(AT ) = 0. Uma conseq¨ uˆencia do T fato de A ter de ser invert´ıvel ´e que n tem que ser par. De fato, a condi¸ca˜o A = −A diz que det(A) = det(−AT ) = (−1)n det(AT ) = (−1)n det(A). Portanto, se n ´e ´ımpar ter´ıamos det(A) = 0. 



• Algumas Propriedades B´ asicas de Formas Lineares Alternantes ´ evidente pela defini¸ca˜o que se ω ´e uma n-forma alternante ent˜ao ω (v1 , . . . , vn ) = 0 caso haja E vi = vj para algum par i 6= j. Em particular, para formas simpl´eticas ω(u, u) = 0 para todo u ∈ V . E. 2.24 Exerc´ıcio. A propriedade mencionada no u ´ltimo par´agrafo ´e equivalente `a defini¸c˜ao de forma linear alternante: se ω ´e uma n-forma linear e ω (v1 , . . . , vn ) = 0 sempre que vi = vj para algum par i 6= j, ent˜ao ω ´e alternante. Prove isso. Sugest˜ao: para i 6= j defina a forma bilinear ω ij (vi , vj ) := ω (v1 , . . . , vn ) onde todos os vetores v1 , . . . , vn est˜ao fixos exceto vi e vj . Usando agora que ωij (x + y, x + y) = 0, mostre que ωij (vi , vj ) = −ωij (vj , vi ) para todo vi e vj . A afirma¸c˜ao principal segue disso (por que?). 6 A seguinte proposi¸ca˜o sobre formas lineares alternantes ´e importante: 5

Do grego symplektik´ os: que serve para ligar, tran¸cado, enla¸cado.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

111/1304

Proposi¸ c˜ ao 2.2 Se ω ´e uma n-forma linear alternante e v1 , . . . , vn s˜ ao vetores linearmente dependentes, ent˜ ao ω (v1 , . . . , vn ) = 0. 2 E. 2.25 Exerc´ıcio. Prove isso.

6

• Formas Alternantes Maximais A Proposi¸ca˜o 2.2 tem uma conseq¨ uˆencia imediata: se V ´e um espa¸co vetorial de dimens˜ao n e ω ´e uma forma linear alternante de ordem m > n, ent˜ao ω = 0. E. 2.26 Exerc´ıcio. Por quˆe?

6

Assim, em um espa¸co de dimens˜ao n o grau m´aximo de uma forma alternante ´e n. Formas alternantes de grau m´aximo s˜ao ditas formas alternantes maximais. Vamos mais adiante estudar como s˜ao essas formas maximais, mas antes, precisamos discutir alguns fatos importantes sobre formas alternantes em espa¸cos de dimens˜ao finita. Em um espa¸co vetorial V de dimens˜ao n o espa¸co vetorial das formas alternantes maximais ´e unidimensional. Para ver isso notemos o seguinte. Seja {b1 , . . . , bn } uma base em V . Sejam agora ω1 e ω2 duas formas alternantes maximais em V e seja x1 , . . . , xn uma n-upla de vetores de V . Como {b1 , . . . , bn } ´e uma base, podemos sempre escrever xi =

n X

αij bj ,

j=1

para todo i = 1, . . . , n. Assim, ω1 (x1 , . . . , xn ) =

n X

···

n X

···

j1 =1

n X

α1j1 · · · αnjn ω1 (bj1 , . . . , bjn )

n X

α1j1 · · · αnjn ω2 (bj1 , . . . , bjn ).

jn =1

e, analogamente, ω2 (x1 , . . . , xn ) =

j1 =1

jn =1

Ocorre que ω1 (bj1 , . . . , bjn ) ´e zero caso ocorram dois ´ındices jk iguais. Por isso, podemos reescrever as express˜oes acima da seguinte forma: X ω1 (x1 , . . . , xn ) = α1j(1) · · · αnj(n) ω1 (bj(1) , . . . , bj(n) ) j∈Sn

e, analogamente, ω2 (x1 , . . . , xn ) =

X

j∈Sn

α1j(1) · · · αnj(n) ω2 (bj(1) , . . . , bj(n) ) ,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

112/1304

onde, acima, Sn ´e o conjunto de todas as bije¸co˜es de {1, . . . , n} em si mesmo (o chamado grupo de permuta¸co ˜es de n elementos). E. 2.27 Exerc´ıcio. Justifique.

6

Como ω1 ´e uma forma alternante maximal, tem-se que ω1 (bj(1) , . . . , bj(n) ) = sinal(j) ω1 (b1 , . . . , bn ). Assim, ω1 (x1 , . . . , xn ) =

!

X

α1j(1) · · · αnj(n) sinal(j) ω1 (b1 , . . . , bn )

j∈Sn

e, analogamente, ω2 (x1 , . . . , xn ) =

X

j∈Sn

!

α1j(1) · · · αnj(n) sinal(j) ω2 (b1 , . . . , bn ).

Como se vˆe nessas u ´ ltimas express˜oes, ω1 (x1 , . . . , xn ) e ω2 (x1 , . . . , xn ) diferem apenas pelos fatores ω1 (b1 , . . . , bn ) e ω2 (b1 , . . . , bn ), respectivamente. Como esses fatores s˜ao apenas n´ umeros (elementos do corpo K), s˜ao proporcionais um ao outro. Isso prova ent˜ao que ω1 (x1 , . . . , xn ) e ω2 (x1 , . . . , xn ) s˜ao proporcionais um ao outro para toda n-upla x1 , . . . , xn e isso era o que quer´ıamos provar. Com as observa¸co˜es acima chegamos ao importante conceito de forma determinante. • A Forma Determinante Como observamos acima, todas as n-formas lineares alternantes maximais de um espa¸co vetorial V de dimens˜ao n s˜ao proporcionais umas a`s outras. Assim, o conhecimento de uma forma alternante maximal determina todas as outras. A forma determinante6 ωdet em um espa¸co vetorial V de dimens˜ao n ´e a n-forma linear alternante maximal tal que ωdet (b1 , . . . , bn ) = 1 no caso em que {b1 , . . . , bn } ´e a base canˆonica de V :       1 0 0 0  1  0       0  0    b1 =   , b2 =   , . . . , bn =  ...  .  ..   ..    . . 0 0 0 1 Assim, ωdet (x1 , . . . , xn ) =

X

j∈Sn

α1j(1) · · · αnj(n) sinal(j),

onde αij ´e a j-´esima componente do vetor xi na base canˆonica. 6

Tamb´em chamada de forma volume, pois em vetores x1 , x2 , x3 .

3

, ωdet (x1 , x2 , x3 ) ´e igual ao volume do paralelep´ıpedo descrito pelos

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

113/1304

Como observamos, todas as outras n-formas lineares alternantes maximais de V s˜ao proporcionais a ωdet . • Determinante de Matrizes Sejam x1 , . . . , xn vetores, representados na base canˆonica por vetores-coluna   αi1  ..  xi =  .  . αin

hh ii Denotamos por x1 , . . . , xn a matriz n × n constru´ıda de forma que sua a-´esima coluna seja o vetor-coluna xa , ou seja   α · · · α 11 n1 hh ii  ..  . .. x1 , . . . , xn =  ... . .  α1n · · · αnn

hh ii ´ evidente que toda matriz M (n × n) pode ser escrita na forma M = x1 , . . . , xn para algum E conjunto de vetores x1 , . . . , xn que representam suas colunas. Define-se ent˜ao o determinante da matriz M como sendo det(M ) := ωdet (x1 , . . . , xn ). Cremos que o conceito de determinante de matrizes e suas propriedades b´asicas sejam bem conhecidos do estudante.

2.2.2

Formas Sesquilineares e as Desigualdades de Cauchy-Schwarz e Minkowski

• Formas Sesquilineares. Defini¸ co ˜es Seja V um espa¸co vetorial complexo. Uma forma sesquilinear7 ´e uma fun¸ca˜o ω : V × V → satisfaz as seguintes propriedades: 1. Linearidade em rela¸ca˜o a` segunda vari´avel: ω(u, αv + βw) = αω(u, v) + βω(u, w), para todos os vetores u, v e w e para todos os n´ umeros complexos α e β. 2. Anti-linearidade em rela¸ca˜o a` primeira vari´avel: ω(αu + βv, w) = αω(u, w) + βω(v, w), 7

Do radical grego sesqui: um e meio.

que

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

114/1304

para todos os vetores u, v e w e para todos os n´ umeros complexos α e β. ´ imediato pela defini¸ca˜o que toda forma sesquilinear ω se anula no vetor nulo, ou seja, E ω(u, 0) = ω(0, u) = 0, para todo vetor u. E. 2.28 Exerc´ıcio. Prove isso.

6

Uma forma sesquilinear ´e dita ser uma forma sesquilinear Hermitiana se satisfizer: 3. Simetria por conjuga¸ca˜o complexa: ω(u, v) = ω(v, u), para todos os vetores u e v. Uma forma sesquilinear ´e dita ser uma forma sesquilinear positiva se satisfizer 4. Positividade. Para todo u ∈ V ,

ω(u, u) ≥ 0.

Abaixo (Teorema 2.6, p´agina 114) provaremos que toda forma sesquilinear positiva ´e automaticamente Hermitiana. L´a provaremos tamb´em que se ω ´e uma forma sesquilinear positiva ent˜ao vale que |ω(u, v)|2 ≤ ω(u, u) ω(v, v) para todos os vetores u e v. Essa desigualdade ´e conhecida como Desigualdade de Cauchy-Schwarz. Uma forma sesquilinear ´e dita ser uma forma sesquilinear n˜ ao-degenerada se satisfizer: 5. N˜ao-degenerescˆencia. Se um vetor u ´e tal que vale ω(u, v) = 0 para todo vetor v, ent˜ao u = 0. Nomenclatura. Uma forma sesquilinear que n˜ao ´e n˜ao-degenerada ´e dita ser degenerada. • Formas sesquilineares n˜ ao-singulares Seja V um espa¸co vetorial e ω uma forma sesquilinear em V . Para u ∈ V fixo a aplica¸ca˜o l u (v) = ω(u, v) ´e um funcional linear em V , ou seja, um elemento do espa¸co dual V 0 . Se a aplica¸ca˜o anti-linear l : V → V 0 que associa cada u ∈ V ao funcional linear lu acima for um anti-isomorfismo8 de espa¸cos vetoriais a forma sesquilinear ω ´e dita ser uma forma sesquilinear n˜ ao-singular. • A Desigualdade de Cauchy-Schwarz De importˆancia fundamental na teoria das formas sesquilineares ´e o seguinte teorema, que apresentanos a importante desigualdade de Cauchy9 -Schwarz10 . Teorema 2.6 Se ω ´e uma forma sesquilinear positiva, ent˜ ao ´e tamb´em Hermitiana, ou seja, ω(u, v) = ω(v, u) , 8

Definido a ` p´ agina 67. Augustin Louis Cauchy (1789-1857). 10 Karl Herman Amandus Schwarz (1843-1921). 9

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

115/1304

para todos os vetores u e v. Fora isso vale a desigualdade de Cauchy-Schwarz: para todos os vetores u e v, |ω(u, v)|2 ≤ ω(u, u) ω(v, v). (2.9) Por fim, se ω ´e uma forma sesquilinear positiva e n˜ ao-degenerada ent˜ ao ω(u, u) = 0 se e somente se u = 0. 2 Prova. Faremos uso do fato que, para qualquer n´ umero complexo λ e quaisquer vetores u e v vale, pela hip´otese de positividade, ω(u + λv, u + λv) ≥ 0. Escrevendo-se explicitamente o lado esquerdo temos a desigualdade |λ|2 ω(v, v) + λ ω(u, v) + λ ω(v, u) + ω(u, u) ≥ 0. E. 2.29 Exerc´ıcio. Verifique isso.

6

Vamos agora escrever λ na forma λ = x + iy, onde x ´e a parte real de λ e y sua parte imagin´aria. Au ´ ltima express˜ao fica f (x, y) := (x2 + y 2 )ω(v, v) + (x + iy)ω(u, v) + (x − iy)ω(v, u) + ω(u, u) ≥ 0. E. 2.30 Exerc´ıcio. Verifique isso.

6

Vamos decompor ω(u, v) e ω(v, u) nas suas partes reais e imagin´arias, escrevendo ω(u, v) = α + iβ onde α, β, γ e δ ∈ 

e

ω(v, u) = γ + iδ,

(2.10)

. Ficamos com

f (x, y) = (x2 + y 2 )ω(v, v) + (xα − yβ) + i(xβ + yα) + (xγ + yδ) + i(xδ − yγ) + ω(u, u) ≥ 0. (2.11) Como f (x, y) tem que ser real (e ≥ 0) segue que a parte imagin´aria da express˜ao acima deve ser nula e, como ω(v, v) e ω(u, u) s˜ao reais, devemos ter 0 = (xβ + yα) + (xδ − yγ) = x(β + δ) + y(α − γ). Como isso deve valer para todos x, y ∈ diz que 

, segue que β = −δ e α = γ. Comparando com (2.10), isso ω(u, v) = ω(v, u),

provando que ω ´e Hermitiano. Com as rela¸co˜es β = −δ e α = γ a express˜ao (2.11) fica f (x, y) = (x2 + y 2 )ω(v, v) + 2(xα − yβ) + ω(u, u).

(2.12)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

116/1304

Vamos agora considerar dois casos: um onde ω(v, v) = 0 e outro onde ω(v, v) 6= 0. No primeiro f (x, y) = 2(xα − yβ) + ω(u, u). Assim, como ω(u, u) ≥ 0 pela positividade, a condi¸ca˜o f (x, y) ≥ 0 ´e poss´ıvel para todos x e y ∈ se e somente se α = β = 0, ou seja, se e somente se ω(u, v) = 0 para todo u. Aqui a desigualdade de Cauchy-Schwarz (2.9) ´e trivialmente satisfeita, pois ambos os lados s˜ao iguais a zero. 

Passemos ao caso ω(v, v) 6= 0. Resta-nos provar a desigualdade de Cauchy-Schwarz (2.9) para esse caso. Podemos reescrever o lado direito de (2.12) como " 2  2 #  2  α α + β2 β f (x, y) = ω(v, v) x + + ω(u, u) − . + y− ω(v, v) ω(v, v) ω(v, v) E. 2.31 Exerc´ıcio. Verifique.

6

Da´ı, constatamos que f (x, y) ≥ 0 para todos x e y ∈ se e somente se  2  α + β2 ≥ 0, ω(u, u) − ω(v, v) 

ou seja, se e somente se ω(u, u)ω(v, v) ≥ α2 + β 2 .

O lado direito ´e, por´em, |ω(u, v)|2 , e a u ´ ltima desigualdade significa |ω(u, v)|2 ≤ ω(u, u)ω(v, v), que ´e a desigualdade de Cauchy-Schwarz que quer´ıamos demonstrar. Finalmente, se ω ´e uma forma sesquilinear positiva e n˜ao-degenerada e um certo vetor u ´e tal que ω(u, u) = 0, segue pela desigualdade de Cauchy-Schwarz que ω(u, v) = 0 para todo v, o que implica u = 0, pois ω ´e n˜ao-degenerada.

• A Desigualdade de Minkowski A desigualdade de Cauchy-Schwarz tem uma conseq¨ uˆencia de certa importˆancia, a chamada Desigualdade de Minkowski: Se ω ´e uma forma sesquilinear positiva (em particular, se ω ´e um produto escalar) ent˜ao, para todos os vetores u e v, vale ω(u − v, u − v)1/2 ≤ ω(u, u)1/2 + ω(v, v)1/2 .

(2.13)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 2

Vers˜ ao de 29 de setembro de 2005.

117/1304

A demonstra¸ca˜o ´e simples: ω(u − v, u − v) = ω(u, u) − ω(u, v) − ω(v, u) + ω(v, v) = ω(u, u) − 2Re (ω(u, v)) + ω(v, v) ≤ ω(u, u) + 2 |ω(u, v)| + ω(v, v) ≤ ω(u, u) + 2ω(u, u)1/2 ω(v, v)1/2 + ω(v, v) =



ω(u, u)1/2 + ω(v, v)1/2

2

,

que ´e o que se queria demonstrar. Acima, na passagem da terceira para a quarta linha, usamos a desigualdade de Cauchy-Schwarz.

2.2.3

Produtos Escalares

• Produtos Internos ou Produtos Escalares Uma forma sesquilinear positiva ω ´e dita ser um produto escalar ou produto interno se satisfizer: 6. ω(u, u) = 0 se e somente se u = 0. A proposi¸ca˜o seguinte apresenta uma defini¸ca˜o alternativa de produto escalar. Proposi¸ c˜ ao 2.3 Uma forma sesquilinear positiva ´e um produto escalar se e somente se for n˜ aodegenerada. 2 Prova. Se ω ´e um produto escalar, ent˜ao se u ´e tal que ω(u, v) = 0 para todo v, vale em particular (tomando v = u) que ω(u, u) = 0 e, portanto, u = 0. Assim, todo o produto escalar ´e n˜ao-degenerado. Reciprocamente, pelo Teorema 2.6, p´agina 114, se ω ´e uma forma sesquilinear positiva e n˜ao-degenerada, ent˜ao vale automaticamente que ω(u, u) = 0 se e somente se u = 0

• Nota¸ co ˜es para produtos escalares Seguindo a conven¸ca˜o, denotaremos freq¨ uentemente produtos escalares de dois vetores u e v n˜ao ´ freq¨ por ω(u, v) mas por hu, vi. E uente tamb´em denotar um produto escalar de dois vetores u e v por (u, v). Essa nota¸ca˜o pode causar confus˜ao com a de par ordenado e por isso a evitamos. Em textos de F´ısica ´e comum encontrar tamb´em a chamada nota¸ca ˜o de Dirac para produtos escalares: hu|vi. Por diversas raz˜oes n˜ao compartilhamos do entusiasmo de alguns com essa nota¸ca˜o e tamb´em a evitamos. • Detalhando a defini¸ c˜ ao de produto escalar Como o conceito de produto escalar ´e muito importante, vamos detalh´a-lo um pouco mais antes de passarmos a exemplos.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

118/1304

Um produto escalar ou produto interno em um espa¸co vetorial V sobre o corpo dos complexos ´e uma fun¸ca˜o V × V → , denotada por hu, vi, para u, v ∈ V , com as seguintes propriedades: 1. O produto escalar ´e linear na segunda vari´avel: hu, αv + βwi = αhu, vi + βhu, wi para todos u, v e w ∈ V e todos α, β ∈ . 2. O produto escalar ´e anti-linear na primeira vari´avel: hαu + βv, wi = αhu, wi + βhv, wi para todos u, v e w ∈ V e todos α, β ∈ , onde α ´e o complexo conjugado de α ∈ . 3. Conjuga¸ca˜o complexa: para todos u, v ∈ V . 4. Para todo u ∈ V

hu, vi = hv, ui

h0, ui = hu, 0i = 0.

5. Positividade. Para todo vetor u n˜ao-nulo hu, ui > 0. Nota. Alguns postulados da defini¸ca˜o de produto escalar acima s˜ao redundantes, pois nem todos s˜ao independentes. N´os os listamos apenas para ressaltar sua relevˆancia individual. Por exemplo, o item 2 segue de 1 e 3 (por que?). O item 4 segue de 1 e 2 (por que?). Os itens 1, 2 e 5 implicam o item 3 (como veremos no Teorema 2.6). Independentes s˜ao apenas 1, 2 e 5 ou 1, 3 e 5. Para um produto escalar de dois vetores vale a seguinte e important´ıssima desigualdade, conhecida como Desigualdade de Cauchy-Schwarz: |hu, vi|2 ≤ |hu, ui||hv, vi|. A demonstra¸ca˜o (mais geral) ´e apresentada no Teorema 2.6, p´agina 114. Advertˆ encia. Em livros de Matem´atica defini¸ca˜o de produto escalar ´e por vezes apresentada de forma que se tenha linearidade na segunda vari´avel e anti-linearidade na primeira vari´avel acima. A conven¸ca˜o que adotamos ´e oposta e ´e seguida, felizmente, por 100% dos textos de F´ısica. • Formas Sesquilineares Positivas e Produtos Escalares Se V ´e um espa¸co vetorial dotado de uma forma sesquilinear positiva ω, existe uma maneira canˆonica de construir a partir de V e ω um outro espa¸co vetorial dotado de um produto escalar. Seja ω uma forma sesquilinear positiva em um espa¸co vetorial V . Ent˜ao, existe um espa¸co vetorial ˜ V , um produto escalar ω ˜ e uma aplica¸ca˜o linear sobrejetora E : V → V˜ tais que ω ˜ (E(u), E(v)) = ω(u, v)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

119/1304

e que E(u) = 0 em V˜ caso ω(u, u) = 0. Para a mencionada constru¸ca˜o, notemos em primeiro lugar que o conjunto de todos os vetores u com a propriedade que ω(u, u) = 0 formam um sub-espa¸co de V . De fato, se u e v s˜ao dois vetores desse tipo, teremos que ω(αu + βv, αu + βv) = |α|2 ω(u, u) + αβω(u, v) + αβω(v, u) + |β|2 ω(v, v) = 0, pois ω(u, u) = ω(v, v) = 0, por hip´otese, e pois ω(v, u) = ω(u, v) = 0 em fun¸ca˜o da condi¸ca˜o de ω ser positivo (pela desigualdade de Cauchy-Schwarz). Vamos denominar esse sub-espa¸co por Z. O espa¸co vetorial quociente V˜ = V /Z (vide a constru¸ca˜o da p´agina 94) tem as propriedades desejadas. A aplica¸ca˜o E : V → V˜ ´e a aplica¸ca˜o que associa cada elemento de v de V a` sua classe de equivalˆencia [v]: E : V 3 v 7→ [v] ∈ V˜ . Definimos ent˜ao ω ˜ por ω ˜ ([u], [v]) = ω(u, v). ´ um exerc´ıcio simples (fa¸ca) mostrar que essa defini¸ca˜o de fato independe dos representantes, no caso E u e v, tomados nas classes [u] e [v]. ˜ ´e de fato um produto escalar em V˜ . E. 2.32 Exerc´ıcio. Mostre que ω

6

• Produtos escalares e formas simpl´ eticas reais Seja V um espa¸co vetorial complexo dotado de um produto escalar h·, ·i. Ent˜ao, a express˜ao ω(u, v) := Im(hu, vi) u, v ∈ V , define uma forma simpl´etica real em V . As condi¸co˜es de antisimetria (ω(u, v) = −ω(v, u)) e de linearidade por combina¸co˜es lineares com escalares reais s˜ao elementares de se constatar. Que ω ´e n˜ao-degenerada, segue do fato que se ω(u, v) = 0 para todo u valeria, tomando u = −iv, 0 = Im(h − iv, vi) = hv, vi, o que implica v = 0. Na Se¸ca˜o 2.5, p´agina 132, veremos que, sob hip´oteses adequadas, toda forma simpl´etica real ´e a parte imagin´aria de um produto escalar em um espa¸co complexo.

2.2.4

Exemplos

Para ilustrar os conceitos apresentados acima, passemos a alguns exemplos. • Exemplos de Formas Sesquilineares e Produtos Escalares Exemplo 2.1 Seja V =

n

. Um exemplo de produto escalar ´e dado pelo produto escalar usual: ω(u, v) = hu, vi

onde u = (u1 , . . . , un ) e v = (v1 , . . . , vn ).



:=

n X

uk v k ,

(2.14)

k=1



JCABarata. Curso de F´ısica-Matem´ atica

Exemplo 2.2 Seja V =

n

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

120/1304

. Um exemplo de produto escalar ´e dado por ω(u, v) = hAu, Avi , 

onde u = (u1 , . . . , un ), v = (v1 , . . . , vn ) e onde A ´e uma matriz n × n invert´ıvel. Exemplo 2.3 Exemplo de uma forma sesquilinear Hermitiana que n˜ao ´e positiva. Seja V = ω dado por n X ω(u, v) = hu, Avi = uk Akl vl ,

n



e seja



k, l=1

onde A ´e uma matriz n × n auto-adjunta, ou seja, seus elementos de matriz satisfazem A kl = Alk . A assim definida ω ´e uma forma sesquilinear Hermitiana,  mas em  geral pode n˜ao ser positiva. Um 0 −i caso concreto ´e o seguinte. Tomemos V = 2 e A = . Ent˜ao, ´e f´acil ver que ω(u, u) = i 0 hu, Aui = i(u1 u2 − u1 u2 ) = −2Im(u1 u2 ), que pode ser negativo ou mesmo nulo. Assim, essa ω n˜ao ´e ´ f´acil ver, por´em, que essa ω ´e n˜ao-degenerada (mostre isso!). positiva. E ◊ 

Exemplo 2.4 Exemplo de uma forma sesquilinear que n˜ao ´e Hermitiana. Seja V = por n X ω(u, v) = hu, Avi = uk Akl vl ,

n

e seja dado



k, l=1

onde A ´e uma matriz n × n que n˜ao ´e auto-adjunta, ou seja, Akl 6= Alk para pelo menos um elemento de matriz Akl . A assim definida ω ´e uma forma sesquilinear,  mas em geral pode n˜ao ser Hermitiana. 0 1 Um caso concreto ´e o seguinte. Tomemos V = 2 e A = . Ent˜ao, ´e f´acil ver que 0 0 ω(u, v) = hu, Avi 

= u1 v2 ,

enquanto que ω(v, u) = v1 u2 . Logo, ω(u, v) e ω(v, u) podem ser distintos e ω n˜ao ´e Hermitiana. Fora isso, essa ω tamb´em n˜ao ´e positiva e ´e degenerada (mostre isso!). ◊

Exemplo 2.5 Exemplo de uma forma sesquilinear positiva mas que n˜ao ´e um produto escalar. Seja V = n e seja ω dado por ω(u, v) = hAu, Avi 

onde A ´e uma matriz n × n n˜ ao-invert´ıvel. Ent˜ao, existe u0 n˜ao-nulo tal que Au0 = 0. Da´ı, segue que ω(u0 , v) = hAu0 , Avi = 0 para todo v e, portanto, ω ´e degenerada e ω(u0 , u0 ) = 0.   1 0 2 eA= . Note que A n˜ao ´e invert´ıvel Um caso concreto ´e o seguinte. Tomemos V = 0 0   0 b (por que?). Aqui temos que ω(u, v) = u1 v1 . Note que todo vetor da forma u = ´e tal que u2 Aub = 0 e, portanto ω(ub , v) = 0 para todo v. ◊ 

Na Se¸ca˜o 2.4, p´agina 128, mostraremos como ´e a forma geral de formas bilineares, sesquilineares e produtos escalares nos espa¸cos de dimens˜ao finita n e n . Tratemos agora de dois exemplos em espa¸cos vetoriais de dimens˜ao infinita. 

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

121/1304

Exemplo 2.6 Seja V = C([a, b]) o espa¸co vetorial das fun¸co˜es cont´ınuas complexas de um intervalo fechado [a, b] da reta real (a < b). Seja p uma fun¸ca˜o cont´ınua estritamente positiva definida em [a, b], ou seja, p(x) > 0 para todo x ∈ [a, b]. Ent˜ao, a express˜ao ω(f, g) =

Z

b

f (x)g(x) p(x)dx , a

para fun¸co˜es f e g de V define um produto escalar em V (justifique!).



Exemplo 2.7 Seja V = C([0, 1]) o espa¸co vetorial das fun¸co˜es cont´ınuas complexas de um intervalo fechado [0, 1] da reta real. Seja p uma fun¸ca˜o tal que p ´e cont´ınua e estritamente positiva no intervalo [0, 1/2) e identicamente nula no intervalo [1/2, 1]. Ent˜ao, a express˜ao Z 1 f (x)g(x) p(x)dx , ω(f, g) = 0

para fun¸co˜es f e g de V define uma forma sesquilinear positiva em V , que n˜ao ´e um produto escalar (justifique!). ◊

Exemplo 2.8 Considere o espa¸co vetorial n e o produto escalar usual: ω(u, v) = hu, vi = Pn i=1 ui vi . A desigualdade de Cauchy-Schwarz implica 2 ! ! n n n X X X (2.15) |vk |2 . ui v i ≤ |uj |2 

j=1

i=1

k=1



E. 2.33 Exerc´ıcio. R Considere o espa¸co vetorial das fun¸co˜es cont´ınuas no intervalo [0, 1] e o produto 1 escalar ω(f, g) = 0 f (x)g(x) dx. Tomando as fun¸co˜es f (x) = x e g(x) = ex , use a desigualdade de √ Cauchy-Schwarz para mostrar que e ≥ 7. 6 E. 2.34 Exerc´ıcio. esse m´etodo.

2.3

Tente livremente obter outras desigualdades interessantes do mesmo estilo usando 6

Normas em Espa¸ cos Vetoriais

Aqui trataremos exclusivamente de espa¸cos vetoriais sobre o corpo dos complexos. • Normas Uma norma ´e uma fun¸ca˜o V → 

usualmente denotada por k · k, com as seguintes propriedades.

1. Para todo v ∈ V tem-se kvk ≥ 0. 2. kvk = 0 se e somente se v for o vetor nulo: v = 0.

JCABarata. Curso de F´ısica-Matem´ atica

3. Para qualquer α ∈

Cap´ıtulo 2

Vers˜ ao de 29 de setembro de 2005.

122/1304

e qualquer v ∈ V tem-se kαvk = |α|kvk.

4. Para quaisquer vetores u e v ∈ V tem-se ku + vk ≤ kuk + kvk. Por 3 e 4, vale que kαu + βvk ≤ |α|kuk + |β|kvk

e quaisquer vetores u e v ∈ V .

para quaisquer α, β ∈

Nota. As quatro condi¸co˜es acima, em verdade, n˜ao s˜ao logicamente independentes e listamo-as devido a` sua importˆancia individual. Assim, por exemplo, a condi¸ca˜o de positividade 1 segue das condi¸co˜es 4 e 3. Isso ser´a mostrado logo abaixo (p´agina 122) quando falarmos de semi-normas. Note tamb´em que, pelo item 3 acima, tem-se k0k = 0 (tome α = 0). Nota. A condi¸ca˜o 4, acima, ´e de particular importˆancia e ´e denominada desigualdade triangular. Um espa¸co vetorial pode ter v´arias normas. Vide exemplos abaixo. • Equivalˆ encia entre Normas Defini¸ c˜ ao. Duas normas k · k1 e k · k2 em um espa¸co vetorial V s˜ao ditas equivalentes se existirem duas constantes positivas c1 e c2 , com 0 < c1 ≤ c2 , tais que c1 kvk1 ≤ kvk2 ≤ c2 kvk1 para todo vetor v ∈ V . E. 2.35 Exerc´ıcio. 6

Mostre que a rela¸c˜ao de equivalˆencia entre normas ´e uma rela¸c˜ao de equivalˆencia.

Tem-se o seguinte teorema, cuja demonstra¸ca˜o pode ser encontrada, por exemplo, em [139]: Teorema 2.7 Em um espa¸co vetorial de dimens˜ ao finita sobre lentes.

ou 

todas as normas s˜ ao equiva2

A afirma¸ca˜o desse teorema ´e freq¨ uentemente falsa em espa¸cos de dimens˜ao infinita. A importˆancia da no¸ca˜o de equivalˆencia de normas se manifesta no fato que duas normas equivalentes geram a mesma topologia m´etrica. • Semi-Normas Uma semi-norma ´e uma fun¸ca˜o V → 

usualmente denotada por k·k, com as seguintes propriedades.

1. Para todo v ∈ V tem-se kvk ≥ 0. 2. Para qualquer α ∈

e qualquer v ∈ V tem-se kαvk = |α|kvk.

3. Para quaisquer vetores u e v ∈ V tem-se ku + vk ≤ kuk + kvk.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

123/1304

´ evidente pelas defini¸co˜es que Note-se que, pelo item 2, vale para uma semi-norma que k0k = 0. E toda norma ´e uma semi-norma. A diferen¸ca entre norma e semi-norma ´e que para uma semi-norma a rela¸ca˜o kvk = 0 n˜ao necessariamente implica v = 0. Para uma semi-norma (ou norma) vale a desigualdade kak ≥ ka − bk − kbk ,

(2.16)

para quaisquer a, b ∈ V . Como faremos uso da mesma no futuro, vamos apresentar sua demonstra¸ca˜o aqui, que ´e uma conseq¨ uˆencia direta da desigualdade triangular. A desigualdade triangular diz-nos que ka − bk ≤ kak + kbk

(2.17)

kbk = ka − (a − b)k ≤ kak + ka − bk.

(2.18)

e que De (2.17) segue que kak ≥ ka − bk − kbk e de (2.18) que kak ≥ −(ka − bk − kbk). Quando dois n´ umeros reais x e y s˜ao tais que x ≥ y e x ≥ −y ent˜ao x ≥ |y|. Assim, as duas u ´ ltimas desigualdades dizem que kak ≥ ka − bk − kbk , que ´e o que quer´ıamos provar.

Essa desigualdade diz, incidentalmente, que kak ≥ 0 para todo vetor de V . Isso mostra que o item 1 da defini¸ca˜o de semi-norma e de norma ´e sup´erfluo. Note-se tamb´em que se fizermos em (2.16) as substitui¸co˜es a → a − b, b → −b, obtemos kak − kbk ≤ ka − bk,

(2.19)

para quaisquer a, b ∈ V . Essa forma da desigualdade ser´a empregada algumas vezes nestas notas. • Equivalˆ encia entre Semi-Normas H´a uma no¸ca˜o de equivalˆencia entre semi-normas que ´e idˆentica a` de equivalˆencia entre normas. • A Norma Associada a um Produto Escalar por

Se ω ´e um produto escalar em um espa¸co vetorial V existe associada a ω uma norma k · k ω dada kvkω = ω(v, v)1/2 ,

v ∈V.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

124/1304

E. 2.36 Exerc´ıcio. Mostre que os postulados da defini¸c˜ao de norma s˜ao de fato satisfeitos.

6

• Invariˆ ancia de Normas Associadas a Produtos Escalares Se uma norma em um espa¸co vetorial V ´e produzida por um produto escalar, como acima, existe naturalmente um grupo de transforma¸co˜es lineares de V em V que mantem essa norma invariante. Esse grupo ´e discutido 682. Por exemplo, a chamada norma Euclidiana de n , pna Se¸ca˜o 13.2.3, p´agina n definida por kxk = hx, xi para x ∈ , ´e invariante pelo grupo O(n) das matrizes ortogonais, ou seja, das matrizes R, reais n × n, que satisfazem RT R = . Isso significa que kRxk = kxk para toda R ∈ O(n). O grupo O(n) e seus amigos s˜ao discutidos na Se¸ca˜o 13.2.4, p´agina 684 e seguintes. 





• A Desigualdade Triangular Talvez a principal importˆancia da desigualdade de Minkowski (2.13) seja a seguinte. Vamos supor que ω seja um produto escalar. Ent˜ao podemos definir11 uma m´etrica ou distˆ ancia entre dois vetores a e b por dω (a, b) := ka − bkω = ω(a − b, a − b)1/2 . ´ tamb´em Como ω ´e um produto escalar, segue que dω (a, b) = 0 se e somente se a = b (por que?). E claro que dω (a, b) = dω (b, a) (por que?). Fora isso, segue da desigualdade de Minkowski que para quaisquer vetores a, b e c vale dω (a, b) ≤ dω (a, c) + dω (c, b). Para ver isso, note que dω (a, b) = ω(a − b, a − b)1/2 = ω((a − c) − (b − c), (a − c) − (b − c))1/2 ≤ ω(a − c, a − c)1/2 + ω(b − c, b − c)1/2 = dω (a, c) + dω (c, b). Acima, na passagem da segunda a` terceira linha, usamos a desigualdade de Minkowski com u = a − b e v = b − c.

A desigualdade dω (a, b) ≤ dω (a, c) + dω (c, b) ´e importante no estudo de propriedades topol´ogicas de espa¸cos vetoriais e ´e denominada desigualdade triangular (pergunta ao estudante: de onde vem esse nome?).

Note que a desigualdade triangular vale tamb´em se ω n˜ao for um produto escalar, mas apenas uma forma sesquilinear positiva (por que?). Nesse caso ´e tamb´em verdade que d ω (a, b) = dω (b, a), por´em, n˜ao ´e mais verdade que dω (a, b) = 0 se e somente se a = b e, por isso, dω ´e dita ser uma pseudo-m´etrica. • Norma e Produto Escalar 11

As no¸co ˜es de m´etrica e de espa¸cos m´etricos ser˜ ao discutidas no Cap´ıtulo 16.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

125/1304

Se um espa¸co vetorial V possuir um produto escalar ent˜ao, como observamos, ´e poss´ıvel definir nele p uma norma da seguinte forma: kuk = hu, ui, u ∈ V .

A norma assim definida possui duas propriedades importantes que mencionamos aqui: a identidade do paralelogramo e a identidade de polariza¸ca ˜o. Identidade do paralelogramo: Para todos os vetores u, v ∈ V vale ku + vk2 + ku − vk2 = 2kuk2 + 2kvk2 .

(2.20)

Prova. Tem-se simplesmente pelas defini¸co˜es que ku + vk2 = kuk2 + hu, vi + hv, ui + kvk2 e ku − vk2 = kuk2 − hu, vi − hv, ui + kvk2 . Somando-se ambas tem-se o resultado. E. 2.37 Exerc´ıcio. Por que essa rela¸c˜ao ´e chamada “identidade do paralelogramo”?

6

Identidade de polariza¸ c˜ ao: Para todos os vetores u, v de um espa¸co vetorial complexo V vale 3

hu, vi =

1 X −n i ku + in vk2 , 4 n=0

(2.21)

3

1X n i ku + i−n vk2 , hu, vi = 4 n=0

(2.22)

ou seja, 4hu, vi = ku + vk2 − ku − vk2 − iku + ivk2 + iku − ivk2 . Prova. Exerc´ıcio. Expanda o lado direito e verifique a igualdade. E. 2.38 Exerc´ıcio. Por que essa rela¸c˜ao ´e chamada “identidade de polariza¸c˜ao”?

6

Notemos que, com a defini¸ca˜o dada acima de norma associada a um produto escalar, a desigualdade de Cauchy-Schwarz fica |hu, vi| ≤ kukkvk. • A Identidade de Polariza¸ c˜ ao A identidade de polariza¸ca˜o mencionada acima ´e um caso especial de uma outra ligeiramente mais geral, tamb´em denominada identidade de polariza¸ca˜o. Seja A um operador linear em um espa¸co vetorial

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

126/1304

V sobre os complexos e sejam u e v elementos de seu dom´ınio. Ent˜ao vale que 3

1 X −n hu, Avi = i h(u + in v), A(u + in v)i , 4 n=0

(2.23)

3

1X n hu, Avi = i h(u + i−n v), A(u + i−n v)i , 4 n=0 E. 2.39 Exerc´ıcio. igualdades.

(2.24)

Mostre isso. Sugest˜ao: expanda o lado direito das igualdades acima e constate as 6

Tomando-se A como o operador identidade reobtem-se as identidades (2.21)-(2.22). A rela¸ca˜o (2.23) mostra que se para um operador linear A conhecermos todas as quantidades hψ, Aψi para todos os vetores ψ ∈ V , ent˜ao conhecemos tamb´em todas as quantidades hu, Avi para todos u, v ∈ V . Para a f´ısica quˆantica a identidade de polariza¸ca˜o (2.23) diz que se A for um observ´avel (operador auto-adjunto), ent˜ao o conhecimento de todos os valores esperados de A, ou seja, das quantidades hψ, Aψi com kψk = 1 e dos produtos escalares hu, vi para vetores com kuk = kvk = 1, fixa todas as probabilidades de transi¸ca˜o |hu, Avi|2 , pois 3

1 X −n i hψn , Aψn i (2 + in hu, vi + i−n hv, ui), hu, Avi = 4 n=0 onde ψn =

(2.25)

1 1 n p (u + in v). (u + i v) = n n −n ku + i vk 2 + i hu, vi + i hv, ui

• Uma conseq¨ uˆ encia da identidade de polariza¸ c˜ ao A rela¸ca˜o (2.23) permite-nos facilmente provar a seguinte afirma¸ca˜o, freq¨ uentemente empregada: Proposi¸ c˜ ao 2.4 Se um operador linear A agindo em um espa¸co vetorial complexo V satisfaz hu, Aui = 0 para todo vetor u ∈ V ent˜ ao A = 0. 2 Para matrizes reais em espa¸cos vetoriais reais n˜ao vale uma afirmativa t˜ao forte. Por exemplo, se V = n P e A for uma matriz anti-sim´etrica, ou seja AT = −A, ent˜ao vale automaticamente que hx, Axi = na, b=1 xa Aab xb = 0, pois Aab = −Aba para todo x ∈ n . Por´em, A pode ser n˜ao-nula. 





Todavia, para matrizes sim´etricas vale o seguinte:

Proposi¸ c˜ ao 2.5 Seja M ∈ Mat ( , n) uma matriz sim´etrica (ou seja, tal que M T = M ) para a qual valha que hx, M xi = 0 para todo x ∈ n . Ent˜ ao M = 0. 2 





JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 2

Vers˜ ao de 29 de setembro de 2005.

Prova. Se M ´e uma matriz sim´etrica, ´e f´acil verificar que para quaisquer vetores u e v ∈ hu, M vi 

=

127/1304

n 

tem-se

1 [h(u + v), M (u + v)i − h(u − v), M (u − v)i ] . 4 



(Para provar isso expanda o lado direito e use que hu, M vi = hv, M ui , pois M ´e sim´etrica). Logo, da hip´otese sobre M , segue que hu, M vi = 0 para todos u e v ∈ n e, portanto, M = 0 







• Obtendo Produtos Escalares a Partir de Normas Nas u ´ ltimas p´aginas vimos que podemos obter uma norma a partir de um produto escalar. Podemos nos perguntar: se uma norma for dada em um espa¸co vetorial, seria poss´ıvel obter um produto escalar a partir dessa norma? A chave para responder isso ´e sugerida pelas identidades do paralelogramo e de polariza¸ca˜o, ambas v´alidas para normas definidas a partir de produtos escalares: Se uma norma satisfaz a identidade do paralelogramo, ou seja, se ku + vk2 + ku − vk2 = 2kuk2 + 2kvk2 . para todos os vetores u, v ∈ V , ent˜ao um produto escalar pode ser definido por 3

1 X −n hu, vi = i ku + in vk2 . 4 n=0 A demonstra¸ca˜o que o lado direito define de fato um produto escalar ´e engenhosa, a principal dificuldade consiste em demonstrar a linearidade do produto escalar (item 1 da defini¸ca˜o de produto escalar). Omitiremos a demonstra¸ca˜o aqui, que pode ser encontrada, por exemplo na se¸ca˜o 16.8 e seguintes da referˆencia [74]. Vide tamb´em [138]. Mencionemos por fim que nem toda norma satisfaz a identidade do paralelogramo e, portanto, nem sempre ´e poss´ıvel definir um produto escalar a partir de uma norma. E. 2.40 Exerc´ıcio. Seja o espa¸co vetorial V = C([0, 1], ) das fun¸co˜es cont´ınuas do intervalo [0, 1] assumindo valores complexos e seja a norma kf k∞ = supx∈[0, 1] |f (x)|. Mostre que a identidade do paralelogramo n˜ao ´e satisfeita para as fun¸co˜es f (x) = x e g(x) = 1, x ∈ [0, 1], que s˜ao elementos de V . 6 E. 2.41 Exerc´ıcio. Seja o espa¸co vetorial V = n , com n ≥ 2. Para a = (a1 , . . . , an ) ∈ n a express˜ao kakp := [|a1 |p + · · · + |an |p ]1/p , define uma norma em V = n , caso p ≥ 1. Mostre que essa norma viola a identidade do paralelogramo para todo p 6= 2. Para tal considere os vetores u = (1, 0, 0, . . . , 0) e v = (0, 1, 0, . . . , 0). A norma k · kp ser´a discutida com mais detalhe no Cap´ıtulo 16. 6

JCABarata. Curso de F´ısica-Matem´ atica

2.4

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

128/1304

Formas Bilineares e Sesquilineares em Espa¸ cos de Dimens˜ ao Finita

´ poss´ıvel estabelecer a forma geral de uma forma bilinear ou sesquilinear em certos espa¸cos vetoriais, E ´ o que discutiremos nesta se¸ca˜o. como os espa¸cos de dimens˜ao finita n ou n . E 

Faremos uso do chamado Teorema da Representa¸ca˜o de Riesz, que afirma o seguinte. Teorema 2.8 (Teorema da Representa¸ c˜ ao de Riesz) Seja l um funcional linear cont´ınuo em um espa¸co de Hilbert H (com um produto escalar h·, ·iH ). Ent˜ ao existe φ ∈ H, u ´nico, tal que l(x) = hφ, xiH ,

∀x ∈ H. 2

A demonstra¸ca˜o desse importante teorema pode ser encontrada na Se¸ca˜o 25.3.1, p´agina 1110. Notemos que esse teorema se aplica aos espa¸cos vetoriais n ou n , pois os mesmos s˜ao espa¸cos de Hilbert em rela¸ca˜o aos produtos escalares h·, ·i e h·, ·i , respectivamente, definidos em (2.6) e (2.14) (p´aginas 109 e 119). 





• Continuidade Vamos provar a seguinte afirma¸ca˜o: toda forma bilinear em n ´e cont´ınua (em ambas as vari´aveis), o mesmo valendo para formas bilineares ou sesquilineares em n . 

Vamos provar a afirma¸ca˜o para as formas sesquilineares em n . Os outros casos s˜ao idˆenticos. Seja ω uma forma sesquilinear em n . Para vetores x, y ∈ n , y 6= 0, escrevemos ω(x, y) = kyk ω(x, y/kyk),

(2.26)

p onde kyk = hy, yi . Notemos ent˜ao que se v ´e um vetor de norma igual a 1 e {b1 , . . . , bn } ´e uma base ortonormal em n ent˜ao v = v1 b1 + · · · + vn bn com |vj | ≤ 1. Assim, 

ω(x, v) = v1 ω(x, b1 ) + · · · + vn ω(x, bn ) e, portanto, |ω(x, v)| ≤ |ω(x, b1 )| + · · · + |ω(x, bn )| Para cada x fixo o lado direito ´e uma constante Kx e n˜ao depende de v. Aplicando isso a (2.26), teremos |ω(x, y)| ≤ kykKx . Isso mostra que lim |ω(x, y)| = 0

y→0

para todo x fixo. Como ω(x, y) ´e linear na segunda vari´avel, segue que lim ω(x, y) = ω(x, y0 )

y→y0

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 2

Vers˜ ao de 29 de setembro de 2005.

129/1304

para todo y0 ∈ n , provando a continuidade de ω na segunda vari´avel. A prova para a primeira vari´avel ´e idˆentica. Os casos em que ω ´e bilinear em n ou em n ´e an´alogo. 

• Formas Sesquilineares em

n

Seja ω uma forma sesquilinear em lx :

n n

. Ent˜ao, pelo que acabamos de ver, para cada x ∈ → ,

n

lx (y) = ω(x, y)

´e um funcional linear e cont´ınuo. Pelo Teorema da Representa¸ca˜o de Riesz existe um u ´ nico vetor n n ηx ∈ tal que lx (y) = hηx , yi para todo y ∈ , ou seja, 

ω(x, y) = hηx , yi . 

Seja A a fun¸ca˜o que a cada x ∈ Tem-se,

n

associa o (´ unico!) vetor ηx com a propriedade acima: A(x) = ηx . ω(x, y) = hA(x), yi .

(2.27)



Afirmamos que A ´e um operador linear, ou seja, A(α1 x1 + α2 x2 ) = α1 A(x1 ) + α2 A(x2 ) para todos os n´ umeros complexos α1 e α2 e todos os vetores x1 e x2 . De fato, por (2.27), hA(α1 x1 + α2 x2 ), yi 

= ω(α1 x1 + α2 x2 , y) = α1 ω(x1 , y) + α2 ω(x2 , y) = α1 hA(x1 ), yi + α2 hA(x2 ), yi 



= hα1 A(x1 ) + α2 A(x2 ), yi . 

n

Assim, para todo y ∈

tem-se

h [A(α1 x1 + α2 x2 ) − α1 A(x1 ) − α2 A(x2 )] , yi 

= 0,

o que implica A(α1 x1 + α2 x2 ) = α1 A(x1 ) + α2 A(x2 ), que ´e o que quer´ıamos provar. Assim, A ´e em verdade um operador linear. Resumimos esses fatos no seguinte teorema: Teorema 2.9 Para toda forma sesquilinear ω em

n

existe uma matriz n × n complexa Aω tal que

ω(x, y) = hAω x, yi para todos x, y ∈

n



.

2

Esse teorema estabelece assim a forma geral das formas sesquilineares em • Formas Bilineares em

n 

n

.

JCABarata. Curso de F´ısica-Matem´ atica

n

Seja ω uma forma bilinear em 

lx :

Vers˜ ao de 29 de setembro de 2005.

n

→ 

:

130/1304

n

. Ent˜ao, para cada x ∈ 

Cap´ıtulo 2



lx (y) = ω(x, y)

´e um funcional linear e cont´ınuo. Pelo Teorema da Representa¸ca˜o de Riesz existe um u ´ nico vetor n tal que lx (y) = hηx , yi , ou seja, ηx ∈ 



ω(x, y) = hηx , yi . 

Seja A a fun¸ca˜o que a cada x ∈ n associa o (´ unico!) vetor ηx com a propriedade acima: A(x) = ηx . De maneira an´aloga ao que fizemos acima podemos provar que A ´e um operador linear, ou seja, uma matriz n × n real e ω(x, y) = hAx, yi . 



Resumimos esses fatos no seguinte teorema:

Teorema 2.10 Para toda forma bilinear ω em

n 

existe uma matriz n × n real Aω tal que

ω(x, y) = hAω x, yi para todos x, y ∈

n 



.

2

Esse teorema estabelece assim a forma geral das formas bilineares em • Formas Bilineares em

n 

.

n

Seja ω uma forma bilinear em

n

. Ent˜ao ωs (x, y) = ω(x, y)

define uma forma sesquilinear em n , onde x = (x1 , . . . , xn ) para x = (x1 , . . . , xn ) ∈ provamos acima, portanto, existe uma matriz complexa Aω tal que

n

. Pelo que

ωs (x, y) = hAω x, yi . 

para todos x, y ∈

n

, ou seja, ω(x, y) = hAω x, yi , 

para todos x, y ∈

n

.

Note que isso tamb´em diz que ω(x, y) = hAω x, yi , 

onde Aω ´e o complexo conjugado da matriz Aω . Resumimos esses fatos no seguinte teorema: Teorema 2.11 Para toda forma bilinear ω em

n

existe uma matriz n × n complexa Aω tal que

ω(x, y) = hAω x, yi para todos x, y ∈

n

.



2

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 2

Vers˜ ao de 29 de setembro de 2005.

n

Esse teorema estabelece assim a forma geral das formas bilineares em

131/1304

.

• Formas Simpl´ eticas Se ω ´e uma forma bilinear alternante em n ou n , ou seja, ω ´e bilinear e ω(x, y) = −ω(y, x), ent˜ao ω ´e da forma ω(x, y) = hA x, yi onde A ´e uma matriz anti-sim´etrica, ou seja, AT = −A. De fato, como hx, yi = hy, xi e como ω(x, y) = −ω(y, x), segue que 







hA x, yi

= −hA y, xi 

Como isso vale para todo x, y ∈

n 

(ou

n

= −h y, AT xi 

= −hAT x, yi . 



), tem-se AT = −A.

Isso determina a forma geral de uma forma bilinear alternante em

n 

ou

n

.

Se ω ´e uma forma simpl´etica, ou seja, ω ´e uma forma bilinear alternante n˜ao-degenerada, ent˜ao A tem que ser tamb´em invert´ıvel. De fato, se hAx, yi = 0 para todo y, ent˜ao Ax = 0. Se A ´e invert´ıvel isso s´o ´e poss´ıvel se x = 0. 

Uma conseq¨ uˆencia do fato de A ter de ser invert´ıvel ´e que n tem que ser par. De fato, a condi¸ca˜o A = −A diz que det(A) = det(−AT ) = (−1)n det(AT ) = (−1)n det(A). Portanto, se n ´e ´ımpar ter´ıamos det(A) = 0. T

A conclus˜ao ´e que formas simpl´eticas s´o ocorrem nos espa¸cos de dimens˜ao finita n ou n se a dimens˜ao n for par, e nesse caso, tˆem a forma ω(x, y) = hAx, yi , onde A ´e invert´ıvel e satisfaz AT = −A. 



n

• Formas Sesquilineares Hermitianas em

n

Se ω ´e uma forma sesquilinear Hermitiana em que hAx, yi = ω(x, y), ent˜ao

, tem-se ω(x, y) = ω(y, x). Se A ´e a matriz tal



hAx, yi 

= hAy, xi 

= hx, Ayi 

= hA∗ x, yi , 

´ ltima rela¸ca˜o vale para todo x, y ∈ onde A∗ := AT ´e a adjunta de A. Como a u seja, A ´e uma matriz auto-adjunta. n

Portanto, a forma geral de uma forma sesquilinear Hermitiana em matriz auto-adjunta. • Produtos Escalares em

n

, tem-se A = A∗ , ou

´e hAx, yi , onde A ´e uma 

n

Se ω ´e um produto escalar em n , ω ´e sesquilinear Hermitiana e ω(x, x) > 0 se x 6= 0. Se A ´e a matriz tal que hAx, yi = ω(x, y), ent˜ao 

hAx, xi > 0

(2.28)



se x 6= 0. Uma conseq¨ uˆencia disso ´e o seguinte: se vi ´e um dos autovetores de A com autovalor λi , ent˜ao λi > 0. De fato, tomando x = vi em (2.28), teremos12 0 < hAvi , vi i = λi hvi , vi i , o que implica 

12

Lembre-se que os autovalores de uma matriz auto-adjunta s˜ ao sempre n´ umeros reais.



JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 2

Vers˜ ao de 29 de setembro de 2005.

132/1304

λi > 0. Esse fato, em particular, nos diz que A ´e invert´ıvel (pois o determinante de A ´e o produto de seus autovalores). ´ bem sabido que os autovetores vi de uma Outra conseq¨ uˆencia dessas observa¸co˜es ´e a seguinte. E matriz auto-adjunta A podem ser escolhidos de modo a formar uma √ base ortonormal (vide Teorema 3.12, p´agina 184). Vamos definir uma matriz B de modo que Bvi = λi vi para todos os autovetores vi de A. Isso define a a¸ca˜o de B nos vetores de uma base e, portanto, B fica definida em toda parte 13 . ´ f´acil provar que B assim definida ´e tamb´em auto-adjunta, B ∗ = B, e que B 2 = A. Claramente E B ´e tamb´em invert´ıvel e tem autovalores > 0. E. 2.42 Exerc´ıcio. Mostre esses fatos.

6

Disso conclu´ımos que ω(x, y) = hAx, yi Em resumo, se ω ´e um produto escalar em invert´ıvel e com autovalores > 0 tal que

n



= hBx, Byi .

ent˜ao existe uma (´ unica) matriz auto-adjunta Bω ,

ω(x, y) = hBω x, Bω yi para todo x, y ∈

2.5

n





.

Estruturas Complexas sobre Espa¸ cos Vetoriais Reais

Seja V um espa¸co vetorial real. Em V est´a, portanto, definido um produto por escalares reais: x v ∈ V , onde x ∈ e v ∈ V . Sob certas circunstˆancias ´e poss´ıvel transformar V em um espa¸co vetorial complexo definindo um produto por escalares complexos: z · v ∈ V para z ∈ e v ∈ V . Tamb´em sob hip´oteses, um produto escalar complexo pode ser definido em V . 

Suponha que exista um operador linear J : V → V , agindo em V , com a propriedade J 2 = − , onde denota o operador identidade. Se z ∈ ´e da forma z = x + iy com x, y ∈ , defina-se em V o produto por escalares complexos por 

(x + iy) · v := xv + yJv .

(2.29)

As seguintes propriedades poder ser facilmente verificadas como exerc´ıcio: 1. O produto por escalares complexos (2.29) ´e associativo: α · (β · u) = (αβ) · u , para todos α, β ∈

e u ∈ V , onde αβ ´e o produto de α por β em

,

2. 1 · u = u para todo u ∈ V . 13

Para o estudante mais avan¸cado: aqui poder´ıamos usar tamb´em o teorema espectral, Teorema 3.4.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

133/1304

3. O produto por escalares complexos (2.29) ´e distributivo em rela¸ca˜o a` soma de vetores: α · (u + v) = α · u + α · v , para todo α ∈

e todos u, v ∈ V .

4. O produto por escalares complexos (2.29) ´e distributivo em rela¸ca˜o a` soma de escalares: (α + β) · u = α · u + β · u , para todos α, β ∈

e todo u ∈ V .

Portanto, pela defini¸ca˜o da Se¸ca˜o 1.2.3, p´agina 55, V ´e um espa¸co vetorial complexo com o produto definido acima. Vamos denotar por VJ esse espa¸co vetorial complexo, para n˜ao confund´ı-lo com V , que ´e um espa¸co vetorial real. Note que os vetores de V e de VJ s˜ao os mesmos, mas V e VJ representam estruturas diferentes. VJ ´e dito ser uma estrutura complexa sobre o espa¸co vetorial real V . Uma quest˜ao de grande interesse, especialmente no contexto das chamadas a´lgebras CAR e CCR (vide [16]) que descrevem as a´lgebras de comuta¸ca˜o e anticomuta¸ca˜o canˆonicas da Mecˆanica Quˆantica e das Teorias Quˆanticas de Campos (que descrevem modelos fermiˆonicos14 e bosˆonicos15 ), ´e saber se ´e possivel introduzir um produto escalar complexo no espa¸co complexo VJ . Como veremos no que segue, tal ´e possivel se houver em V uma forma simpl´etica real ou um produto escalar real satisfazendo certas hip´oteses. Desenvolveremos primeiro as id´eias gerais e apresentaremos exemplos posteriormente, a` p´agina 136. • Formas simpl´ eticas reais e produtos escalares reais Para mostrar como construir produtos escalares complexos no espa¸co complexo V J precisamos do seguinte resultado preparat´orio, que tem interesse por si s´o, por estabelecer uma rela¸ca˜o entre formas simpl´eticas16 reais e produtos escalares reais. Lema 2.1 Seja V um espa¸co vetorial real e suponha que exista um operador linear J : V → V satisfazendo J 2 = − . Valem as seguintes afirma¸co ˜es I. Se ε : V × V → 

´e um produto escalar real em V satisfazendo ε(Ju, v) = −ε(u, Jv)

para todos u , v ∈ V , ent˜ ao σ : V × V → 

definida para todos u, v ∈ V por

σ(u, v) := ε(Ju, v) = −ε(u, Jv) ´e uma forma simpl´etica real e satisfaz (a) σ(Ju, v) = −σ(u, Jv) para todos u , v ∈ V , 14

Enrico Fermi (1901-1954). Satyendra Nath Bose (1894-1974). 16 Para a defini¸ca ˜o, vide p´ agina 110. 15

(2.30)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

134/1304

(b) σ(u, Ju) ≥ 0 para todo u ∈ V . II. Se σ : V × V → 

´e uma forma simpl´etica real em V satisfazendo

(a) σ(Ju, v) = −σ(u, Jv) para todos u , v ∈ V , (b) σ(u, Ju) ≥ 0 para todo u ∈ V ,

ent˜ ao ε : V × V → 

definida para todos u, v ∈ V por ε(u, v) := σ(u, Jv) = −σ(Ju, v)

(2.31)

´e um produto escalar real e satisfaz (a) ε(Ju, v) = −ε(u, Jv) para todos u , v ∈ V . 2 Prova da parte I. Pelas hip´oteses, ε ´e um produto escalar real e, portanto, ´e uma forma bilinear real, positiva, sim´etrica e n˜ao-degenerada. Que σ definida em (2.30) ´e uma forma bilinear ´e evidente. Para todos u, v ∈ V tem-se σ(u, v) = ε(Ju, v) = −ε(u, Jv)

simetria

=

−ε(Jv, u) = −σ(v, u) ,

provando que σ ´e uma forma alternante. Se σ(u, v) = 0 para todo v ∈ V , ent˜ao ε(Ju, v) = 0 para todo v ∈ V . Mas como ε ´e n˜ao-degenerada, segue que Ju = 0, o que implica u = 0, pois J 2 = − . Isso provou que σ ´e n˜ao degenerada e, portanto, ´e uma forma simpl´etica. Note-se agora que σ(u, Jv) = ε(Ju, Jv) = −ε(u, J 2 v) = ε(u, v) = −σ(Ju, v) . Por fim, σ(u, Ju) = ε(Ju, Ju) ≥ 0, pois ε ´e um produto escalar. Pelo mesmo motivo, ε(Ju, Ju) = 0 se e somente se Ju = 0. Como J 2 = − , isso implica u = 0. Isso provou as afirma¸co˜es da parte I. Prova da parte II. Pelas hip´oteses, σ ´e uma forma simpl´etica real e, portanto, ´e uma forma bilinear real, alternante e n˜ao-degenerada. Que ε definida em (2.31) ´e uma forma bilinear ´e evidente. Para todos u, v ∈ V tem-se ε(u, v) = σ(u, Jv) = −σ(Ju, v)

alternˆ ancia

=

σ(v, Ju) = ε(u, v) ,

provando que ε ´e uma forma sim´etrica. Se ε(u, v) = 0 para todo v ∈ V , ent˜ao σ(u, Jv) = 0 para todo v ∈ V . Mas como σ ´e n˜ao-degenerada, segue que u = 0, provando que ε ´e uma forma n˜ao-degenerada. Para todo u tem-se tamb´em ε(u, u) = σ(u, Ju) ≥ 0, por hip´otese, provando que ε ´e uma forma positiva. Assim, pela Proposi¸ca˜o 2.3, p´agina 117, ε ´e um produto escalar. Note-se agora que, por defini¸ca˜o, ε(u, v) = −σ(Ju, v) para todos u , v ∈ V . Disso segue que σ(u, v) = ε(Ju, v) e que ε(u, Jv) = −σ(Ju, Jv) = σ(u, J 2 v) = −σ(u, v) = −ε(Ju, v) . Isso provou as afirma¸co˜es da parte II.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

135/1304

• Produtos escalares complexos sobre estruturas complexas A proposi¸ca˜o que segue mostra como se pode construir em VJ um produto escalar complexo se for fornecida uma forma simpl´etica real ou um produto escalar real em V satisfazendo certas hip´oteses. Proposi¸ c˜ ao 2.6 Suponhamos que V seja um espa¸co vetorial real e que exista J : V → V , um operador linear em V , satisfazendo J 2 = − . Ent˜ ao valem as seguintes afirma¸co ˜es: A. Se existir uma forma simpl´etica real σ : V × V → 

satisfazendo

(a) σ(Ju, v) = −σ(u, Jv) para todos u , v ∈ V , (b) σ(u, Ju) ≥ 0 para todo u ∈ V 17 ,

ent˜ ao, V × V 3 (u, v) 7→ hu, viJ, σ ∈

definida por

hu, viJ, σ := σ(u, Jv) + iσ(u, v) para todos u, v ∈ V , ´e um produto escalar complexo sobre a estrutura complexa V J . B. Se existir um produto escalar real ε : V × V →

satisfazendo 

(a) ε(Ju, v) = −ε(u, Jv) para todos u , v ∈ V , ent˜ ao, V × V 3 (u, v) 7→ hu, viJ, ε ∈

definida por

hu, viJ, ε := ε(u, v) + iε(Ju, v) para todos u, v ∈ V , ´e um produto escalar complexo sobre a estrutura complexa V J . 2 Prova. Mostremos em primeiro lugar que as hip´oteses das partes A e B s˜ao equivalentes. Pelo Lema 2.1, p´agina 133, a existˆencia de uma forma simpl´etica real σ satisfazendo as hip´oteses da parte A implica a existˆencia de um produto escalar real ε dado por ε(u, v) := σ(u, Jv) = −σ(Ju, v) satisfazendo as hip´oteses da parte B, sendo que, por essa defini¸ca˜o de ε, σ(u, Jv) + iσ(u, v) = ε(u, v) + iε(Ju, v) .

(2.32)

Reciprocamente, tamb´em pelo Lema 2.1, p´agina 133, a existˆencia de um produto escalar real ε satisfazendo as hip´oteses da parte B implica a existˆencia de uma forma simpl´etica real σ dada por σ(u, v) := ε(Ju, v) = −ε(u, Jv) satisfazendo as hip´oteses da parte A, sendo que, por essa defini¸ca˜o de σ, a igualdade (2.32) ´e tamb´em v´alida. Assim, ´e suficiente provarmos, digamos, a parte A. ´ evidente que para quaisquer u, v, w ∈ V valem Prova da parte A. E h(u + v), wiJ, σ = hu, wiJ, σ + hv, wiJ, σ , 17

hu, (v + w)iJ, σ = hu, viJ, σ + hu, wiJ, σ .

Em [16] essa u ´ltima condi¸ca ˜o n˜ ao ´e mencionada, mas ela ´e necess´ aria.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

136/1304

Al´em disso, hv, uiJ, σ = σ(v, Ju) + iσ(v, u) = −σ(Ju, v) − iσ(u, v) = σ(u, Jv) − iσ(u, v) = hu, viJ, σ . (2.33) Para x, y ∈ tem-se tamb´em 

hu, (x + iy) · viJ, σ

=

hu, xv + yJviJ, σ

=

hu, xviJ, σ + hu, yJviJ, σ

=

σ(u, xJv) + iσ(u, xv) + σ(u, yJ 2 v) + iσ(u, yJv)

J 2 =−

=

= =

σ(u, xJv) + iσ(u, xv) + σ(u, −yv) + iσ(u, yJv)     x σ(u, Jv) + iσ(u, v) + iy σ(u, Jv) + iσ(u, v)

(x + iy)hu, viJ, σ .

Pela propriedade (2.33), isso implica tamb´em h(x + iy) · u, viJ, σ = (x − iy)hu, viJ, σ , mostrando que h·, ·iJ, σ ´e uma forma sesquilinear.

Pelas hip´oteses, tem-se hu, uiJ, σ = σ(u, Ju) ≥ 0, mostrando que h·, ·iJ, σ ´e positiva. Se 0 = hu, viJ, σ = σ(u, Jv) + iσ(u, v) para todo u, segue que σ(u, v) = 0 para todo u, o que implica que v = 0, pois σ ´e n˜ao-degenerada (pela nossa defini¸ca˜o de forma simpl´etica). Isso mostrou que h·, ·i J, σ ´e n˜ao-degenerada. Assim, h·, ·iJ, σ ´e uma forma sesquilinear positiva e n˜ao-degenerada e pelo Teorema 2.6, p´agina 114, segue que hu, uiJ, σ = 0 se e somente se u = 0. Isso mostrou que h·, ·iJ, σ ´e um produto escalar complexo em VJ . • Exemplos Vamos primeiramente estudar o caso de espa¸cos de dimens˜ao finita. Vale a seguinte proposi¸ca˜o: Proposi¸ c˜ ao 2.7 Um espa¸co vetorial real V de dimens˜ ao finita admite uma estrutura complexa (n˜ ao necessariamente u ´nica) se e somente se tiver dimens˜ ao par. 2 Prova. Se J ´e um operador linear agindo no espa¸co vetorial real de dimens˜ao finita V , podemos represent´a-lo como uma matriz. Se J 2 = − ent˜ao, tomando-se o determinante de ambos os lados, temos (det(J))2 = (−1)n , onde n ´e a dimens˜ao de V . Como o lado esquerdo ´e positivo, n tem que ser par. Reciprocamente, vamos supor que V tenha dimens˜ao par, digamos 2m. Desejamos mostrar que existe um operador linear agindo em V satisfazendo J 2 = − . Uma poss´ıvel escolha ´e a seguinte. Como V tem dimens˜ao par podemos encontrar dois subespa¸cos V1 e V2 , ambos de dimens˜ao m, com V = V1 ⊕ V2 . Como V1 e V2 tˆem a mesma dimens˜ao, s˜ao isomorfos, e existe um operador linear A : V1 → V2 que ´e bijetivo (o Exemplo 2.9, abaixo, deixar´a isso mais claro. Um tal operador n˜ao ´e necessariamente u ´ nico, mas isso n˜ao representa um problema). Todo elemento v ∈ V pode ser escrito ´ da forma v = v1 ⊕ v2 com v1 ∈ V1 e v2 ∈ V2 . Podemos definir Jv = J(v1 ⊕ v2 ) := (−Av2 ) ⊕ (Av1 ). E 2 trivial, ent˜ao, verificar que J = − , como desejado.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 2

Vers˜ ao de 29 de setembro de 2005.

137/1304

Exemplo 2.9 Seja V um espa¸co vetorial real de dimens˜ao 2m. Em alguma base, podemos representar v ∈ V na forma de um vetor-coluna:     −vm+1 v1  ..   ..   .   .       −v2m   vm  (2.34) Defina-se, ent˜ao, Jv :=  v =   ,  .  v1  vm+1   .   .   ..   ..  vm v2m

ou seja, em forma matricial, na mesma base,

J = sendo

m

e

m



m m



m m



´ elementar verificar que J 2 = − matrizes m × m. E

2m ,

como desejado.

A escolha de J indicada acima dependeu de uma particular decomposi¸ca˜o de V em dois subespa¸cos de dimens˜ao m. H´a v´arias outras decomposi¸co˜es poss´ıveis, que fornecem outros operadores J e, portanto, outras estruturas complexas. Permanecendo no exemplo acima, ´e f´acil ver que, se x, y ∈ , ent˜ao o produto por escalares complexos fica       v1 v1 xv1 − yvm+1 ..  ..   ..    .  .   .           vm   vm   xvm − yv2m  (x + iy) ·  (2.35)  := (x + yJ)   =   . vm+1  vm+1  xvm+1 + yv1   .   .    ..  ..   ..    . v2m v2m xv2m + yvm 

Seguindo ainda o exemplo de (2.34) e (2.35) para V = 2m , vamos ilustrar a Proposi¸ca˜o 2.6 e produto escalar complexo para ( 2m )J . Adotemos para ε o produto escalar usual: 



ε(u, v) :=

2m X k=1

Temos que

uk vk = u1 v1 + · · · + u2m v2m .

ε(Ju, v) = −um+1 v1 − · · · − u2m vm + u1 vm+1 + · · · + um v2m

e que

ε(u, Jv) = −u1 vm+1 − · · · − um v2m + um v1 + · · · + u2m vm

Logo ε(Ju, v) = −ε(u, Jv) e podemos aplicar a Proposi¸ca˜o 2.6, obtendo em ( hu, viJ, ε = ε(u, v) + iε(Ju, v) =







2m



)J o produto escalar

u1 v1 + · · · + u2m v2m + i − um+1 v1 − · · · − u2m vm + u1 vm+1 + · · · + um v2m



= u1 (v1 + ivm+1 ) + · · · + um (vm + iv2m ) + um+1 (vm+1 − iv1 ) + · · · u2m (v2m − ivm ) = (u1 + ium+1 )(v1 + ivm+1 ) + · · · + (um + iu2m )(vm + iv2m ) .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

138/1304

E. 2.43 Exerc´ıcio. Verifique que hu, λ · viJ, ε = λhu, viJ, ε para todo λ ∈ .

6

Entendemos, assim, que a estrutura complexa que estudamos consiste nesse caso em identificar bijetivamente 2m e m por     v1 v1 + ivm+1  ..     .         v  .. 2m 3  m  ←→   ∈ m .   vm+1   .     ..  vm + iv2m v2m 



e adotar em

m

o produto escalar complexo h·, ·i usual (definido a` p´agina 17). 



Vejamos como as id´eias de acima podem ser generalizadas e de modo a incluir espa¸cos de dimens˜ao infinita.

Exemplo 2.10 Se V ´e um espa¸co vetorial real de (dimens˜ao finita ou n˜ao) ´e sempre poss´ıvel encontrar um operador linear J satisfazendo J 2 = − se V possuir dois subespa¸cos V1 e V2 com V = V1 ⊕ V2 e tais que existe A : V1 → V2 , linear e bijetora (em dimens˜ao finita isso requer que V1 e V2 tenham a mesma dimens˜ao e, portanto, que V tenha dimens˜ao par, como mencionado na Proposi¸ca˜o 2.7). De fato, para v ∈ V da forma v = v1 ⊕ v2 com v1 ∈ V1 e v2 ∈ V2 , definindo Jv := (−A−1 v2 ) ⊕ (Av1 ) ´e f´acil constatar que J 2 = − .

Para um tal J o produto por um escalar complexo λ = x + iy, com x, y ∈ , fica definido por  λ·(v1 ⊕v2 ) := (x+yJ)(v1 ⊕v2 ) = x(v1 ⊕v2 )+y (−A−1 v2 ) ⊕ (Av1 ) = (xv1 −yA−1 v2 )⊕(xv2 +yAv1 ) . 

Se V ´e um espa¸co de Hilbert real separ´avel com uma base {φk , k ∈ }, podemos tomar V1 e V2 como os espa¸co gerados por {φk , k ∈ , k par} e {φk , k ∈ , k ´ımpar}, respectivamente. Uma poss´ıvel escolha para a bije¸ca˜o linear A : V1 → V2 seria ! ∞ ∞ X X A a2m φ2m = a2m φ2m+1 , 





m=0

para a qual

A

−1

∞ X

m=0

a2m+1 φ2m+1

m=0

!

=

∞ X

a2m+1 φ2m ,

m=0

ou seja, em termos de elementos da base, Aφ2m = φ2m+1 e A−1 φ2m+1 = φ2m para todo m ≥ 0. Com essa defini¸ca˜o, ter´ıamos " ∞ ! !# " ! !# ∞ ∞ ∞ X X X X J a2m φ2m ⊕ a2m+1 φ2m+1 a2m+1 φ2m ⊕ = − a2m φ2m+1 . m=0

m=0

m=0

m=0

O produto com escalares complexos λ = x + iy, com x, y ∈ , fica definido por ! ! ∞ ∞ ∞ X X X (x + iy) · a m φm = (xa2m − ya2m+1 )φ2m ⊕ (xa2m+1 + ya2m )φ2m+1 . 

m=0

m=0

m=0

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 2

Vers˜ ao de 29 de setembro de 2005.

139/1304

Para um tal J o produto por um escalar complexo λ = x + iy com x, y ∈ fica definido por  λ·(v1 ⊕v2 ) := (x+yJ)(v1 ⊕v2 ) = x(v1 ⊕v2 )+y (−A−1 v2 ) ⊕ (Av1 ) = (xv1 −yA−1 v2 )⊕(xv2 +yAv1 ) . 

Para α, β ∈ V da forma α = real usual, constatamos que ε(α, Jβ) = −

∞ X

m=0

α2m β2m+1 +

∞ X

α m φm , β =

m=0

∞ X

∞ X

βm φm e ε(α, β) :=

m=0

α2m+1 β2m

e que

m=0

∞ X

αm βm , o produto escalar

m=0

ε(Jα, β) = −

∞ X

α2m+1 β2m +

m=0

∞ X

α2m β2m+1 .

m=0

Assim, ε(α, Jβ) = −ε(Jα, β) e pela parte B da Proposi¸ca˜o 2.6, p´agina 135, hα, βiJ, ε := ε(α, β) + iε(Jα, β) ´e um produto escalar complexo. Explicitamente, tem-se hα, βiJ, ε =

∞ X

(α2m + iα2m+1 )(β2m + iβ2m+1 ) .

m=0

E. 2.44 Exerc´ıcio. Verifique! Verifique tamb´em que hα, λ · βiJ, ε = λhα, βiJ, ε para todo λ ∈ .

6

A forma simpl´etica real associada a ε pela parte I do Lema 2.1, p´agina 133, ´e σ(α, β) = −ε(α, Jβ) =

∞ X

m=0

α2m β2m+1 −

∞ X

α2m+1 β2m .

m=0



Exemplo 2.11 Uma situa¸ca˜o que n˜ao se deve deixar de comentar ´e a seguinte. Se V ´e um espa¸co vetorial complexo com um produto escalar complexo h·, ·i, V ´e naturalmente tamb´em um espa¸co vetorial real, sendo que, como comentamos a` p´agina 119, σ(u, v) := Im(hu, vi) u, v ∈ V , define uma forma simpl´etica real em V . Definindo em V o operador linear Ju = iu, tem-se J 2 = − . A multiplica¸ca˜o por escalares complexos n˜ao apresenta novidades: para x, y ∈ e u ∈ V vale, pela defini¸ca˜o, (x + iy) · u = xu + yJu = (x + iy)u. ´ f´acil constatar que σ(u, Jv) = Im(hu, ivi) = −Im(hiu, vi) = −σ(Ju, v) e que σ(u, Ju) = E Im(hu, iui) = hu, ui ≥ 0. Assim, pela parte A da Proposi¸ca˜o 2.6, p´agina 135, hu, viJ, σ := σ(u, Jv) + iσ(u, v) ´e um produto escalar complexo em V . No entanto, ´e facil ver que nesse caso hu, vi J, σ = Im(hu, ivi) + iIm(hu, vi) = Re(hu, vi) + iIm(hu, vi) = hu, vi. 

O produto escalar real ε associado a σ pela parte II do Lema 2.1, p´agina 133, ´e ε(u, v) = σ(u, Jv) = Im(hu, ivi) = Re(hu, vi) .

´ interessante notar tamb´em que se tiv´essemos adotado Ju = −iu, u ∈ V , ter´ıamos ainda para E σ(u, v) = Im(hu, vi) que σ(u, Jv) = −σ(Ju, v). Por´em, σ(u, Ju) = −hu, ui ≤ 0, violando a condi¸ca˜o de positividade. ◊

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 2

140/1304

Exemplo 2.12 Uma situa¸ca˜o um pouco diferente ´e a seguinte. Seja V um espa¸co vetorial complexo dotado de um produto escalar complexo h·, ·i. Sejam V1 e V2 dois sub-espa¸cos ortogonais de V (ortogonais segundo o produto escalar h·, ·i). Encarando V como um espa¸co real, definamos o operador ´ claro que J 2 = − . A linear J : V → V por J(v1 ⊕ v2 ) = i(v1 ⊕ (−v2 )), onde v1 ∈ V1 e v2 ∈ V2 . E multiplica¸ca˜o por escalares complexos x + iy, com x, y ∈ , fica 

(x + iy) · (v1 ⊕ v2 ) = x(v1 ⊕ v2 ) + yJ(v1 ⊕ v2 ) = ((x + iy)v1 ) ⊕ ((x − iy)v2 ) , ou seja, λ · (v1 ⊕ v2 ) = (λv1 ) ⊕ (λv2 ), para todos λ ∈ , v1 ∈ V1 e v2 ∈ V2 . ´ tamb´em f´acil constatar que para o produto escalar real ε(u, v) = Re(hu, vi) vale a rela¸ca˜o E ε(u, Jv) = −ε(Ju, v) (para isso ´e essencial que V1 e V2 sejam ortogonais segundo h·, ·i).

O forma simpl´etica real σ associada a ε pela parte I do Lema 2.1, p´agina 133, ´e, tomando u = u 1 ⊕u2 , v = v1 ⊕ v2 , com u1 , v1 ∈ V1 e u2 , v2 ∈ V2 , σ(u, v) := ε(Ju, v) = Im (hu1 , v1 i) − Im (hu2 , v2 i) , como facilmente se verifica. Pela parte B da Proposi¸ca˜o 2.6, p´agina 135, hu, viJ, ε := ε(u, v) + iε(Ju, v) ´e um produto escalar complexo. Por essa defini¸ca˜o, tem-se, tomando u = u1 ⊕ u2 , v = v1 ⊕ v2 , com u1 , v1 ∈ V1 e u2 , v2 ∈ V2 , hu, viJ, ε = h(u1 ⊕ u2 ), (v1 ⊕ v2 )iJ, ε = Re(hu1 , v1 i) + Re(hu2 , v2 i) + i (Re(hiu1 , v1 i) + Re(h − iu2 , v2 i)) = Re(hu1 , v1 i) + Re(hu2 , v2 i) + iIm(hu1 , v1 i) − iIm(hu2 , v2 i) = hu1 , v1 i + hu2 , v2 i . E. 2.45 Exerc´ıcio. Verifique tamb´em que hu, λ · viJ, ε = λhu, viJ, ε para todo λ ∈ .

6 ◊

Parte II ´ T´ opicos de Algebra Linear

141

Cap´ıtulo 3 ´ T´ opicos de Algebra Linear I Conte´ udo 3.1

Rudimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

3.2

No¸ co ˜es B´ asicas sobre o Espectro de uma Matriz . . . . . . . . . . . . . . . 147 3.2.1

3.3

Polinˆ omios de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 3.3.1

3.4

O Teorema de Hamilton-Cayley . . . . . . . . . . . . . . . . . . . . . . . . . . 157

Matrizes Diagonaliz´ aveis e o Teorema Espectral . . . . . . . . . . . . . . . 162 3.4.1

3.5

O Tra¸co de uma Matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

Diagonaliza¸ca˜o Simultˆanea de Matrizes . . . . . . . . . . . . . . . . . . . . . 176

Matrizes Auto-adjuntas, Normais e Unit´ arias . . . . . . . . . . . . . . . . 180 3.5.1

Matrizes Positivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

3.6

Matrizes Triangulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190

3.7

O Teorema de Decomposi¸ ca ˜o de Jordan e a Forma Canˆ onica de Matrizes 191

3.8

3.9

3.7.1

Resultados Preparat´orios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

3.7.2

O Teorema da Decomposi¸ca˜o de Jordan . . . . . . . . . . . . . . . . . . . . . 198

3.7.3

Matrizes Nilpotentes e sua Representa¸ca˜o Canˆonica . . . . . . . . . . . . . . 201

3.7.4

A Forma Canˆonica de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . 205

Algumas Representa¸ co ˜es Especiais de Matrizes . . . . . . . . . . . . . . . 207 3.8.1

A Decomposi¸ca˜o Polar de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . 207

3.8.2

O Teorema da Triangulariza¸ca˜o de Schur . . . . . . . . . . . . . . . . . . . . 210

3.8.3

A Decomposi¸ca˜o QR e a Decomposi¸ca˜o de Iwasawa (“KAN”) . . . . . . . . . 212

Propriedades Especiais de Determinantes . . . . . . . . . . . . . . . . . . . 215 3.9.1

Expans˜ao do Polinˆomio Caracter´ıstico . . . . . . . . . . . . . . . . . . . . . . 215

3.9.2

A Desigualdade de Hadamard . . . . . . . . . . . . . . . . . . . . . . . . . . . 216

3.10 Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

principal objetivo deste cap´ıtulo ´e apresentar a demonstra¸ca˜o do Teorema Espectral para matrizes diagonaliz´aveis, em particular, para matrizes auto-adjuntas (resultado de grande relevˆancia para a Mecˆanica Quˆantica) e a demonstra¸ca˜o do Teorema de Decomposi¸ca˜o de Jordan para matrizes gerais. Sempre trabalharemos no contexto de espa¸cos vetoriais de dimens˜ao finita n sobre o corpo dos complexos. A leitura deste cap´ıtulo pressup˜oe serem conhecidos ´ do leitor alguns conceitos b´asicos de Algebra Linear, tais como o conceito de matriz, de determinante de uma matriz, suas propriedades e m´etodos de c´alculo. Este cap´ıtulo ser´a continuado no Cap´ıtulo 4, p´agina 222, onde outros aspectos de a´lgebras de matrizes ser˜ao explorados. 142

JCABarata. Curso de F´ısica-Matem´ atica

3.1

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

143/1304

Rudimentos

• Alguma Nota¸ c˜ ao O conjunto de todas as matrizes m×n com entradas complexas ser´a denotado aqui por Mat ( , m, n). O conjunto de todas as matrizes quadradas n × n com entradas complexas ser´a denotado simplesmente por Mat ( , n). Dado um conjunto de n n´ umeros complexos α1 , . . . , αn , denotaremos por diag (α1 , . . . , αn ) a matriz A ∈ Mat ( , n) cujos elementos Aij s˜ao definidos da seguinte forma:  αi , se i = j . Aij = 0, se i 6= j Uma tal matriz ´e dita ser diagonal pois apenas os elementos de sua diagonal principal s˜ao eventualmente n˜ao-nulos. Na representa¸ca˜o usual   α1 · · · 0   A =  ... . . . ...  . 0 · · · αn A mais popular dentre as matrizes diagonais ´e a matriz identidade, que denotaremos por   1 ··· 0   = diag (1, . . . , 1) =  ... . . . ...  . 0 ··· 1

nestas notas:

Denotaremos por a, b a matriz a × b cujos elementos de matriz s˜ao todos nulos. Denotaremos por a matriz identidade l × l. Por vezes, quando n˜ao houver perigo de confus˜ao, poderemos omitir os l sub-´ındices e escrever a, b simplesmente como e l simplesmente como .

Sejam x1 , . . . , xn vetores, representados na base canˆonica por vetores-coluna   xa1   xa =  ...  . xan hh ii Denotaremos por x1 , . . . , xn a matriz n × n constru´ıda de forma que sua a-´esima coluna seja o vetor-coluna xa , ou seja   n 1 · · · x x 1 1 hh ii   (3.1) x1 , . . . , xn =  ... . . . ...  . 1 n xn · · · x n

Consideranto os vetores da base canˆonica     1 0 0  1          e 1 = 0  , e 2 = 0  ,  ..   ..  . . 0 0

...,

en

  0 0     =  ...  ,   0 1

(3.2)

JCABarata. Curso de F´ısica-Matem´ atica

´e tamb´em evidente que =

hh

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

144/1304

ii e1 , . . . , en .

(3.3)

A nota¸ca˜o acima ´e u ´ til por permitir a seguinte observa¸ca˜o. Seja B uma matriz qualquer. Ent˜ao, ii ii hh hh 1 n 1 n (3.4) = Bx , . . . , Bx . B x , ..., x

Essa hh rela¸ca˜o ´eii provada observando-se a regra de multiplica¸ca˜o de matrizes: a a-´esima coluna de B x1 , . . . , xn ´e B11 xa1 + · · · + B1n xan .. .

Bn1 xa1

+···+

,

(3.5)

Bnn xan

que vem a ser as componentes de Bxa , representado como vetor-coluna na base canˆonica. Ainda sobre essa nota¸ca˜o, vale a seguinte identidade u ´ til, cuja demonstra¸ca˜o (elementar) deixamos como exerc´ıcio: se D = diag (d1 , . . . , dn ) ´e uma matriz diagonal, ent˜ao hh ii hh ii (3.6) x1 , . . . , x n D = d 1 x1 , . . . , d n xn . Seja V um espa¸co vetorial dotado de um produto escalar h·, ·i. Dizemos que dois vetores u e v s˜ao perpendiculares (em rela¸ca˜o ao produto escalar h·, ·i) se hu, vi = 0.

Se v1 , . . . , vk s˜ao vetores em um espa¸co vetorial V , denotamos por [v1 , . . . , vk ] o sub-espa¸co gerado pelos vetores v1 , . . . , vk , ou seja, a cole¸ca˜o de todos os vetores que s˜ao combina¸co˜es lineares dos vetores v1 , . . . , vk : [v1 , . . . , vk ] = {α1 v1 + · · · + αk vk , α1 , . . . , αk ∈ }. Denotamos por [v1 , . . . , vk ]⊥ o subespa¸co de todos os vetores perpendiculares a todos os vetores de [v1 , . . . , vk ]: [v1 , . . . , vk ]⊥ = { w ∈ V | hw, (α1 v1 + · · · + αk vk )i = 0 para todos α1 , . . . , αk ∈ }. • Menores de uma matriz, a matriz dos cofatores e a regra de Laplace Se A ∈ Mat ( , n), n > 1, a matriz Men(A), chamada de matriz dos menores de A, ´e a matriz de Mat ( , n) construida da seguinte forma: cada elemento de matriz Men(A)ij ´e determinante da matriz (n − 1) × (n − 1) obtida eliminando-se a i-´esima linha e a j-´esima coluna de A. Se n = 1, convenciona-se definir Men(A) = 1. Se A ∈ Mat ( , n), n ≥ 1, a matriz Cof(A), chamada de matriz dos cofatores de A, ´e a matriz de Mat ( , n) cujos elementos de matriz Cof(A)ij s˜ao dados por Cof(A)ij = (−1)i+j Men(A)ij para cada i, j. Assim, cada elemento de matriz Cof(A)ij ´e dado por (−1)i+j vezes o determinante da matriz (n − 1) × (n − 1) obtida eliminando-se a i-´esima linha e a j-´esima coluna de A.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

145/1304

E. 3.1 Exerc´ıcio. Seja Σ ∈ Mat ( , n) a matriz diagonal cujos elementos s˜ao, alternadamente +1 e −1: Σ = diag (+1, −1, +1, . . . , (−1)n+1 ), ou seja, os elementos de matriz de Σ s˜ao Σij = (−1)i+1 δij . Mostre que Cof(A) = ΣMen(A)Σ−1 para toda matriz A ∈ Mat ( , n).

6

Para uma matriz M ∈ Mat ( , n), a transforma¸ca˜o de similaridade M 7→ ΣM Σ−1 ´e denominada “chessboard transformation”, pois com ela os sinais s˜ao trocados em M como em um tabuleiro de xadrez. A bem-conhecida regra de Laplace1 afirma que, se A possui uma inversa, ent˜ao T 1 A−1 = Cof(A) , det(A)

ou seja,

A−1



ij

(3.7)

(−1)i+j 1 Cof(A)ji = Men(A)ji . det(A) det(A)

=

(3.8)

Em (3.91), p´agina 216, apresentaremos outra f´ormula expl´ıcita para o cˆomputo da inversa de matrizes baseada no Teorema de Hamilton-Cayley (Teorema 3.2, p´agina 158). Igualmente u ´ teis s˜ao as expans˜ oes do determinante em cofatores: para todo i = 1, . . . , n vale det(A) =

n X

Aij Cof(A)ij

j=1

e para todo j = 1, . . . , n vale det(A) =

n X

n X = (−1)i+j Aij Men(A)ij

Aij Cof(A)ij =

i=1

(3.9)

j=1

n X

(−1)i+j Aij Men(A)ij .

(3.10)

i=1

Omitiremos as demonstra¸co˜es, pois as mesmas podem ser encontradas em livros elementares sobre a´lgebra linear. E. 3.2 Exerc´ıcio. Usando a regra de Laplace (3.7), mostre que para toda matriz A ∈ Mat ( , n) valem as rela¸co˜es Men(ΣAΣ−1 ) = ΣMen(A)Σ−1 , Cof(ΣAΣ−1 ) = ΣCof(A)Σ−1 , Cof(A) = Men(ΣAΣ−1 ) ,

Men(A) = Cof(ΣAΣ−1 ) .

Se A ∈ Mat ( , n) ´e invert´ıvel, segue da regra de Laplace (3.7) que det(A−1 ) = e, portanto, det(Cof(A)) = det(A)n−1 .

1 det(A)n

6 det(Cof(A)) (3.11)

Do Exerc´ıcio E. 3.2, conclui-se tamb´em que det(Men(A)) = det(A)n−1 . 1

Pierre-Simon Laplace (1749-1827).

(3.12)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

146/1304

E. 3.3 Exerc´ıcio. Mostre que para toda matriz A ∈ Mat ( , n) vale  n−2 Cof Cof(A) = det(A) A.

Do Exerc´ıcio E. 3.2, obtem-se tamb´em

Men Men(A) Assim, para toda matriz A ∈ Mat ( , n) vale



=

det(A)

n−2

A.

  Cof Cof(A) = Men Men(A) .   Portanto, se det(A) = 1, vale Cof Cof(A) = Men Men(A) = A.

6

• Um resultado u ´til Mais abaixo usaremos o seguinte fato: Proposi¸ c˜ ao 3.1 Seja M ∈ Mat ( , n) uma matriz da seguinte forma   A k, n−k  , M =  B C

onde A ´e uma matriz k × k, B ´e uma matriz (n − k) × k e C ´e uma matriz (n − k) × (n − k). Ent˜ ao det(M ) = det(A) det(C) . 2 Prova. O primeiro ingrediente da prova ´e a constata¸ca˜o que     A A k, n−k k, n−k k  =   M =  B C B n−k n−k, k 

= 

A n−k, k

k, n−k

n−k

 

k

B

k, n−k

C

 

k, n−k

n−k

 

k

k, n−k

C

n−k, k



 .

E. 3.4 Exerc´ıcio. Verifique! Com isso, temos pela regra do determinante de um produto de matrizes que      A k, n−k k k, n−k k  det   det  det(M ) = det  B n−k, k n−k n−k n−k, k

6 k, n−k

C



 .

JCABarata. Curso de F´ısica-Matem´ atica

e

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

147/1304

Agora, pelas regras (3.9)-(3.10) de c´alculo de determinantes, ´e f´acil constatar (fa¸ca-o!) que     A k, n−k k k, n−k  = det(A),  = det(C) . det  det  C n−k, k n−k n−k, k 

Isso completa a prova.

3.2

det 

k

k, n−k

B

n−k



 = 1.

No¸ co ˜es B´ asicas sobre o Espectro de uma Matriz

• O Espectro de uma Matriz Seja A ∈ Mat ( , n) uma matriz n × n com entradas complexas. No estudo das propriedades de A ´e de grande importˆancia saber para quais n´ umeros complexos λ a matriz λ − A ´e invert´ıvel e para quais n˜ao ´e. Chegamos a`s seguintes importantes defini¸co˜es. Defini¸ c˜ ao. Um n´ umero complexo λ ´e dito ser um elemento do espectro de A ∈ Mat ( , n) se a matriz λ − A n˜ao possuir uma inversa. Defini¸ c˜ ao. Um n´ umero complexo λ ´e dito ser um elemento do conjunto resolvente de A ∈ Mat ( , n) se a matriz λ − A possuir uma inversa. Em outras palavras, o espectro de A ∈ Mat ( , n), denotado por σ(A), ´e o conjunto de todos os λ ∈ para os quais a matriz λ − A n˜ao tem inversa.

O conjunto resolvente de A ∈ Mat ( , n), denotado por ρ(A), ´e o conjunto de todos os λ ∈ para os quais a matriz λ − A tem inversa. ´ evidente que σ(A) e ρ(A) s˜ao conjuntos complementares, ou seja, σ(A) ∩ ρ(A) = ∅ mas σ(A) ∪ E ρ(A) = . Um fato importante ´e que λ −A ´e n˜ao-invert´ıvel se e somente se det(λ −A) = 0. Assim, um n´ umero complexo λ ´e um elemento do espectro de uma matriz A se e somente se for tal que det(λ − A) = 0. Chegamos ao importante conceito de polinˆomio caracter´ıstico de uma matriz.

• O Polinˆ omio Caracter´ıstico de uma Matriz

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Seja A ∈ Mat ( , n) uma matriz cujos elementos de matriz  λ − A11 −A12  −A21 λ − A22  det(λ − A) = det  .. ..  . . −An1 ···

Cap´ıtulo 3

s˜ao Aij . Para λ ∈  ··· −A1n ··· −A2n    .. ..  . . · · · λ − Ann

148/1304

a express˜ao

define, como facilmente se constata pelos m´etodos usuais e bem conhecidos de c´alculo de determinantes, um polinˆomio de grau n na vari´avel λ, com coeficientes complexos, os quais dependem dos elementos de matriz Aij de A. Esse polinˆomio ´e denominado polinˆ omio caracter´ıstico de A e desempenha um papel muito importante no estudo de propriedades de matrizes. O leitor poder´a encontrar na Se¸ca˜o 3.9.1, p´agina 215, uma express˜ao mais expl´ıcita para o polinˆomio caracter´ıstico em termos dos elementos de matriz Aij de A (vide (3.90), p´agina 216), mas por ora n˜ao precisaremos de maiores detalhes sobre esse polinˆomio. Denotaremos por vezes por pA o polinˆomio caracter´ıstico de uma matriz A ∈ Mat ( , n). Como todo polinˆomio complexo de grau n, pA possui n ra´ızes, n˜ao necessariamente distintas no plano complexo (teorema fundamental da a´lgebra). As ra´ızes do polinˆomio caracter´ıstico p A s˜ao denominadas autovalores da matriz A. Assim, o espectro de uma matriz A coincide com o conjunto de seus auto´ valores. O estudo de autovalores de matrizes ´e de grande importˆancia na Algebra Linear e em suas aplica¸co˜es a` Teoria das Equa¸co˜es Diferenciais, a` Geometria, a` Teoria dos Sistemas Dinˆamicos e a` F´ısica, especialmente a` F´ısica Quˆantica. Seja A ∈ Mat ( , n) uma matriz e sejam α1 , . . . , αr , 1 ≤ r ≤ n, seus autovalores distintos, cada qual com multiplicidade a1 , . . . , ar , respectivamente, ou seja, cada αi ´e uma raiz de ordem ai ∈ do polinˆomio caracter´ıstico de A: 

q(λ) = det(λ − A) =

r Y i=1

(λ − αi )ai .

A quantidade ai ´e um n´ umero inteiro positivo e ´e denominado multiplicidade alg´ebrica do autovalor α i . Note-se que como o n´ umero de ra´ızes de pA (contando as multiplicidades) ´e exatamente igual a seu grau, segue facilmente que a seguinte rela¸ca˜o ´e v´alida: r X

ai = n ,

(3.13)

i=1

ou seja, a soma das multiplicidades alg´ebricas dos autovalores de uma matriz A ∈ Mat ( , n) ´e n. Uma conseq¨ uˆencia elementar disso ´e a seguinte proposi¸ca˜o u ´ til:

Proposi¸ c˜ ao 3.2 Seja A ∈ Mat ( , n) uma matriz e sejam α1 , . . . , αr , 1 ≤ r ≤ n, seus autovalores distintos, cada qual com multiplicidade alg´ebrica a1 , . . . , ar , respectivamente. Ent˜ ao det(A) =

r Y

(αk )ak .

(3.14)

k=1

2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

149/1304

Qr ak Prova. Por defini¸ca˜o, o polinˆomio caracter´ıstico de A ´e q(λ) = det(λ −A) = k=1 (λ−αk ) . Tomando Q r n ak λ = 0 e usando (3.13), teremos que det(−A) = (−1) em, det(−A) = (−1)n det(A) e k=1 (αk ) . Por´ a proposi¸ca˜o est´a demonstrada. Essa proposi¸ca˜o diz que o determinante de uma matriz ´e o produto de seus autovalores, incluindo a multiplicidade alg´ebrica. • Matrizes Similares. Transforma¸ co ˜es de Similaridade Duas matrizes A ∈ Mat ( , n) e B ∈ Mat ( , n) s˜ao ditas matrizes similares se existir uma matriz invert´ıvel P ∈ Mat ( , n) tal que P −1 AP = B.

Para uma matriz invert´ıvel P ∈ Mat ( , n) fixa, a transforma¸ca˜o que leva cada matriz A ∈ Mat ( , n) a` matriz P −1 AP ´e denominada transforma¸ca ˜o de similaridade. Sabemos que o determinante ´e invariante por transforma¸co˜es de similaridade, pois para toda matriz A vale det(A) = det(P −1 AP ). O determinante n˜ao ´e o u ´ nico objeto associado a uma matriz que ´e invariante por transforma¸co˜es de similaridade. O polinˆomio caracter´ıstico e, portanto, o conjunto de seus autovalores (incluindo as multiplicidades), tamb´em o ´e. Isso pode ser visto da seguinte forma.

Sejam A e B duas matrizes similares com B = P −1 AP para algum P . O polinˆomio caracter´ıstico de A ´e pA (λ) = det(λ − A) e o de B ´e pB (λ) = det(λ − B). Pela invariˆancia do determinante vale pA (λ) = det(λ −A) = det(P −1 (λ −A)P ) = det(λ −P −1 AP ) = det(λ −B) = pB (λ) . (3.15) Assim, A e B tˆem o mesmo polinˆomio caracter´ıstico e, portanto, seus autovalores s˜ao iguais, incluindo suas multiplicidades. • Coment´ ario sobre Matrizes Bijetoras Em parte do que segue estaremos implicitamente usando a seguinte proposi¸ca˜o: Proposi¸ c˜ ao 3.3 Uma matriz A ∈ Mat ( , n) ´e bijetora (ou seja, ´e invert´ıvel) se e somente se Av = 0 valer apenas para v = 0. 2 Prova. Se A ´e bijetora, ent˜ao existe A−1 . Logo, aplicando-se A−1 a` esquerda na igualdade Av = 0, obtem-se v = 0. Vamos agora provar a rec´ıproca: vamos supor que Av = 0 vale apenas para v = 0 e provar que A ´e injetora e sobrejetora e, portanto, bijetora. Prova-se que A ´e injetora por absurdo. Se A n˜ao ´e injetora, ent˜ao, existem vetores x e y com x 6= y mas com Ax = Ay. Como A ´e linear, isso implica A(x − y) = 0. Pela hip´otese que Av = 0 vale apenas para v = 0, segue que x = y, uma contradi¸ca˜o. Para provarmos que A ´e sobrejetora procedemos da seguinte forma. Seja {e 1 , . . . , en } uma base em n . Vamos primeiramente mostrar que {Ae1 , . . . , Aen } ´e um conjunto linearmente independente de vetores em n (e, portanto, uma base em n ). Suponhamos que assim n˜ao o seja e que existam n´ umeros complexos α1 , . . . , αn , n˜ao todos nulos, tais que α1 Ae1 + · · · + αn Aen = 0. Pela linearidade

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

150/1304

de A, segue que A (α1 e1 + · · · + αn en ) = 0. Novamente, pela hip´otese que Av = 0 vale apenas para v = 0, segue que α1 e1 + · · · + αn en = 0. Isso, por´em, diz que os vetores {e1 , . . . , en } s˜ao linearmente dependentes, o que ´e absurdo. Logo, {Ae1 , . . . , Aen } ´e um conjunto de n vetores linearmente independente em n e, portanto, ´e uma base nesse espa¸co. Assim, qualquer x ∈ n pode ser escrito como uma combina¸ca˜o linear tal como x = β1 Ae1 + · · · + βn Aen = A (β1 e1 + · · · + βn en ). Isso mostra que x est´a na imagem de A. Como x ´e arbitr´ario, segue que A ´e sobrejetora. Um corol´ario evidente ´e o seguinte: Corol´ ario 3.1 Se uma matriz A ∈ Mat ( , n) n˜ ao ´e bijetora (ou seja, se n˜ ao possui inversa), ent˜ ao existe um vetor n˜ ao-nulo v tal que Av = 0. 2 • Autovetores Seja λ0 um autovalor de uma matriz A. Ent˜ao λ0 − A n˜ao tem inversa. Logo, como V = n ´e um espa¸co vetorial de dimens˜ao finita, existe pelo Corol´ario 3.1 acima pelo menos um vetor n˜ao-nulo v tal que (λ0 − A)v = 0, ou seja, Av = λ0 v. Chegamos a mais uma importante defini¸ca˜o: Defini¸ c˜ ao. Um vetor n˜ao-nulo v ´e dito ser um autovetor de uma matriz A se houver λ 0 ∈

tal que

Av = λ0 v . Note-se que se um tal λ0 satisfaz a rela¸ca˜o acima para algum v = 6 0 ent˜ao λ0 − A n˜ao tem inversa. λ0 ´e ent˜ao um elemento do espectro de A, ou seja, um autovalor. λ0 ´e dito ser o autovalor associado ao autovetor v. Uma observa¸ca˜o importante ´e a seguinte. Sejam v1 e v2 dois autovetores aos quais est´a associado o mesmo autovalor, ou seja, Av1 = λ0 v1 e Av2 = λ0 v2 . Ent˜ao, para quaisquer n´ umeros complexos c1 e c2 o vetor v = c1 v1 + c2 v2 tamb´em satisfaz Av = λ0 v. De fato, Av = A(c1 v1 + c2 v2 ) = c1 Av1 + c2 Av2 = c1 λ0 v1 + c2 λ0 v2 = λ0 (c1 v1 + c2 v2 ) = λ0 v . A conclus˜ao a que se chega ´e que, para cada autovalor αi de uma matriz A, a cole¸ca˜o formada pelo vetor nulo e todos os autovetores de A com autovalor αi ´e um subespa¸co vetorial. Vamos denotar esse subespa¸co por E(αi ) ou simplesmente Ei . Se αi e αj s˜ao autovalores distintos de A ent˜ao os sub-espa¸cos de autovetores E(α i ) e E(αj ) tˆem em comum apenas o vetor nulo, ou seja, E(αi ) ∩ E(αj ) = {0}. Isso ´e f´acil de provar, pois se w ´e tal que Aw = αi w e Aw = αj w ent˜ao, subtraindo-se uma rela¸ca˜o da outra ter´ıamos 0 = (αi − αj )w, que implica w = 0, j´a que αi 6= αj . Essas considera¸co˜es nos levam a mais um conceito importante: o de multiplicidade geom´etrica de um autovalor. • A Multiplicidade Geom´ etrica de um Autovalor

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

151/1304

Al´em do conceito de multiplicidade alg´ebrica de um autovalor, h´a tamb´em o conceito de multiplicidade geom´etrica de um autovalor, do qual trataremos agora. Como antes seja A ∈ Mat ( , n) uma matriz e sejam α1 , . . . , αr , 1 ≤ r ≤ n, seus autovalores distintos, cada qual com multiplicidade alg´ebrica a1 , . . . , ar , respectivamente. Acima introduzimos os sub-espa¸cos Ei = E(αi ), definidos como sendo os sub-espa¸cos gerados por todos os autovetores que tˆem αi como autovalor. A multiplicidade geom´etrica de um autovalor αi ´e definida como sendo a dimens˜ao do subespa¸co Ei , ou seja, como sendo o n´ umero m´aximo de autovetores linearmente independentes com autovalor αi . ´ importante advertir de imediato o leitor do fato que a multiplicidade alg´ebrica e multiplicidade E geom´etrica de autovalores nem sempre coincidem. Isso ´e bem ilustrado no seguinte exemplo simples. Seja   0 1 A = . 0 0 Seu polinˆomio caracter´ıstico ´e



λ −1 pa (λ) = det(λ − A) = det 0 λ



= λ2 .

Assim, seu (´ unico) autovalor ´e 0 com multiplicidade alg´ebrica 2. Quais os seus autovetores? S˜ao aqueles vetores que satisfazem Av = 0. Denotando v como um vetor coluna   a , v = b a rela¸ca˜o Av = 0 significa



0 1 0 0

    a b = = 0. b 0

Logo b = 0 e todos os autovetores s˜ao da forma

  a v = , 0 ´ evidente que o subespa¸co gerado pelos autovetores com autovalor zero tem dimens˜ao 1. a ∈ . E Assim, a multiplicidade alg´ebrica do autovalor zero ´e 2 mas a sua multiplicidade geom´etrica ´e 1. • A Multiplicidade Alg´ ebrica e a Multiplicidade Geom´ etrica Apesar de a multiplicidade alg´ebrica e a multiplicidade geom´etrica de um autovalor nem sempre coincidirem, h´a uma rela¸ca˜o de ordem entre eles. A saber, ´e poss´ıvel mostrar que a multiplicidade geom´etrica de um autovalor ´e sempre menor ou igual a` sua multiplicidade alg´ebrica. Isso segue das seguintes considera¸co˜es. Seja λ0 um autovalor de A ∈ Mat ( , n) e E(λ0 ) o subespa¸co gerado pelos autovetores com autovalor λ0 , e cuja dimens˜ao denotaremos por d. Vamos escolher uma base v1 , . . . , vd , vd+1 , . . . , vn onde os primeiros d vetores s˜ao elementos de E(λ0 ). Nessa base a matriz A tem a forma   D d, n−d , A3 A4

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.



Cap´ıtulo 3

152/1304



onde D ´e uma matriz d × d diagonal D = diag λ0 , . . . , λ0 , A4 ´e uma matriz (n − d) × (n − d) e | {z } d vezes A3 ´e uma matriz (n − d) × d. Alguns segundos (minutos?) de medita¸ca˜o, usando pela Proposi¸ca˜o 3.1 da p´agina 146, nos levam a concluir que o polinˆomio caracter´ıstico de A ´e dado por det(λ − A) = (λ − λ0 )d det(λ − A4 ) . Isso mostra que a multiplicidade alg´ebrica de λ0 ´e pelo menos igual a d, sua multiplicidade geom´etrica. E. 3.5 Exerc´ıcio. Realize a medita¸c˜ao sugerida acima.

6

• Matrizes Simples O que foi exposto acima leva-nos naturalmente ao conceito de matriz simples que, como veremos mais adiante, est´a intimamente ligado ao problema da diagonalizabilidade de matrizes. Defini¸ c˜ ao. Uma matriz A ∈ Mat ( , n) ´e dita ser uma matriz simples se cada autovalor de A tiver uma multiplicidade alg´ebrica igual a` sua multiplicidade geom´etrica. Deixamos para o leitor provar o seguinte fato: toda matriz diagonal ´e simples. E. 3.6 Exerc´ıcio. Prove isso.

6

Adiante faremos uso da seguinte proposi¸ca˜o. Proposi¸ c˜ ao 3.4 Se A ∈ Mat ( , n) ´e uma matriz simples e P ∈ Mat ( , n) ´e invert´ıvel ent˜ ao P −1 AP ´e tamb´em simples. 2 Prova. J´a vimos (p´agina 149) que A e P −1 AP tˆem o mesmo polinˆomio caracter´ıstico e, portanto, os mesmos autovalores, incluindo suas multiplicidades alg´ebricas. Seja λ0 um desses autovalores com multiplicidade alg´ebrica d e sejam v1 , . . . , vd um conjunto de d autovetores linearmente independentes de A. Os vetores P −1 v1 , . . . , P −1 vd s˜ao autovetores de P −1 AP com autovalor λ0 . De fato, (P −1 AP ) P −1 vi = P −1 Avi = λ0 P −1 vi . Fora isso os d vetores P −1 v1 , . . . , P −1 vd s˜ao tamb´em linearmente independentes. Para ver isso, suponha houvesse constantes c1 , . . . , cd tais que c1 P −1 v1 + · · · + cd P −1 vd = 0 . Multiplicando-se a` esquerda por P ter´ıamos c1 v1 + · · · + cd vd = 0. Como v1 , . . . , vd s˜ao linearmente independentes as constantes ci tˆem que ser todas nulas, provando que os vetores P −1 v1 , . . . , P −1 vd s˜ao tamb´em linearmente independentes. Isso prova que a multiplicidade geom´etrica do autovalor λ0 ´e pelo menos igual a d. Como ela n˜ao pode ser maior que d (p´agina 151), conclui-se que ´e igual a d provando a proposi¸ca˜o. A seguinte proposi¸ca˜o elementar ´e por vezes u ´ til para verificar se uma matriz ´e simples. Proposi¸ c˜ ao 3.5 Se todos os n autovalores de uma matriz A ∈ Mat ( , n) forem distintos ent˜ ao A ´e simples. 2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

153/1304

Prova. Se os autovalores de A s˜ao α1 , . . . , αn , todos distintos, ent˜ao cada um tem multiplicidade alg´ebrica igual a 1. For¸cosamente, sua multiplicidade geom´etrica ´e tamb´em igual a 1, j´a que a multiplicidade geom´etrica n˜ao pode ser maior que a alg´ebrica. Ressaltemos que a rec´ıproca da proposi¸ca˜o acima n˜ao ´e verdadeira: uma matriz pode ser simples e possuir autovalores com multiplicidade alg´ebrica maior que 1.

3.2.1

O Tra¸ co de uma Matriz

• O Tra¸ co de uma Matriz Seja A ∈ Mat ( , n), cujos elementos de matriz s˜ao Aij , i, j = 1, . . . n. Sejam λ1 , . . . , λn seus n autovalores (n˜ao necessariamente distintos e repetidos conforme sua multiplicidade). Definimos o tra¸co de A como sendo a soma de seus n autovalores: Tr(A) :=

n X

λa .

a=1

Uma conclus˜ao que se tira dessa defini¸ca˜o ´e que se duas matrizes s˜ao similares, ent˜ao ambas tˆem o mesmo tra¸co, ou seja, para qualquer matriz invert´ıvel P e qualquer matriz A vale  Tr P −1 AP = Tr(A) . (3.16)

A raz˜ao reside na observa¸ca˜o feita acima que duas matrizes similares tˆem o mesmo conjunto de autovalores e, portanto, o mesmo tra¸co. Temos a seguinte e importante proposi¸ca˜o:

Proposi¸ c˜ ao 3.6 O tra¸co de uma matriz A ∈ Mat ( , n) ´e igual a soma dos elementos de sua diagonal principal, ou seja, n n X X Tr(A) := λa = Aaa . (3.17) a=1

a=1

2

Prova. A demonstra¸ca˜o consistir´a em se calcular o coeficiente de λn−1 no polinˆomio caracter´ıstico p(λ) de A de dois modos diferentes. O polinˆomio caracter´ıstico de A ´e   λ − A11 −A12 · · · −A1n  −A21 λ − A22 · · · −A2n    p(λ) = det(λ − A) = det   . . .. .. . .. ..   . . −An1 ··· · · · λ − Ann

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

154/1304

P As t´ecnicas de c´alculo de determinantes nos dizem que o coeficiente de λn−1 ´e − ni=1 Aii . Por exemplo, para o caso n = 2   λ − A11 −A12 p(λ) = det = λ2 − λ(A11 + A22 ) + A11 A22 − A12 A21 . −A21 λ − A22 E. 3.7 Exerc´ıcio. Conven¸ca-se da veracidade da afirmativa acima para o caso de n arbitr´ario. Sugest˜ao: use a expans˜ao em cofatores (3.9)-(3.10) ou leia a Se¸c˜ao 3.9.1, p´agina 215. 6 Por outro lado, os autovalores de A, λ1 , . . . , λn , s˜ao por defini¸ca˜o as ra´ızes do polinˆomio caracter´ıstico. Logo, p(λ) = (λ − λ1 )(λ − λ2 ) · · · (λ − λn ) .

Expandindo-se essa express˜ao, conclui-se que o coeficiente de λn−1 ´e −(λ1 + · · · + λn ) = −Tr(A) . E. 3.8 Exerc´ıcio. Certo?

Do exposto acima, conclui-se que o coeficiente de λn−1 no polinˆomio caracter´ıstico de A ´e −

n X i=1

6

Aii = −(λ1 + · · · + λn ) = −Tr(A) ,

o que termina a prova. Essa proposi¸ca˜o leva a duas outras propriedades igualmente importantes: a linearidade do tra¸co e a chamada propriedade c´ıclica do tra¸co. ao Proposi¸ c˜ ao 3.7 (A Linearidade do Tra¸ co) Sejam A, B ∈ Mat ( , n) e α, β ∈ . Ent˜ Tr(αA + βB) = αTr(A) + βTr(B) . 2 Prova. A prova ´e imediata por (3.17). ´ curioso notar que a linearidade do tra¸co vista acima ´e evidente por (3.17), mas n˜ao ´e nem E um pouco evidente pela defini¸ca˜o do tra¸co de uma matriz como soma de seus autovalores, pois os autovalores individuais de αA + βB n˜ ao s˜ao em geral combina¸co˜es lineares dos autovalores de A e de B, especialmente no caso em que A e B n˜ao comutam. Proposi¸ c˜ ao 3.8 (A Propriedade C´ıclica do Tra¸ co) Sejam A, B ∈ Mat ( , n). Ent˜ ao Tr(AB) = Tr(BA) . 2

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

155/1304

Prova. Pelo que vimos acima, tem-se Tr(AB) =

n X

(AB)ii =

i=1

n n X X i=1

Aij Bji

j=1

!

=

n n X X j=1

Bji Aij

i=1

!

=

n X

(BA)jj = Tr(BA) .

j=1

Na segunda e quarta igualdades usamos a regra de produto de matrizes. Na terceira igualdade apenas trocamos a ordem das somas. Novamente vale aqui o coment´ario que a propriedade c´ıclica expressa na Proposi¸ca˜o 3.8 n˜ao ´e nada evidente pela defini¸ca˜o do tra¸co de uma matriz como soma de seus autovalores. Os autovalores individuais de produto de matrizes AB n˜ ao s˜ao em geral iguais aos do produto BA. Mais adiante, demonstraremos uma outra propriedade importante do tra¸co que o relaciona com o determinante, a saber, provaremos que para qualquer matriz A, real ou complexa, n × n, tem-se  A Tr(A) det e = e . Vide Proposi¸ca˜o 4.7, p´agina 234.

3.3

Polinˆ omios de Matrizes

• Polinˆ omios de Matrizes Seja p um polinˆomio de grau m: p(x) = am xm + · · · + a1 x + a0 com x ∈ por

, aj ∈

e am 6= 0. Para uma matriz A ∈ Mat ( , n) definimos o polinˆ omio matricial p(A) p(A) = am Am + · · · + a1 A + a0 .

Obviamente p(A) ´e tamb´em uma matriz n × n com entradas complexas.

Se as ra´ızes do polinˆomio p forem α1 , . . . , αr , com multiplicidades m1 , . . . , mr , respectivamente, ent˜ao r Y p(x) = am (x − αj )mj , j=1

´ f´acil provar, ent˜ao, que para todo x ∈ . E

p(A) = am

r Y j=1

(A − αj )mj .

E. 3.9 Exerc´ıcio. Justifique isso.

6

E. 3.10 Exerc´ıcio. Mostre que se D = diag (d1 , . . . , dn ) e q ´e um polinˆomio ent˜ao q(D) = diag (q(d1 ), . . . , q(dn )) . 6

JCABarata. Curso de F´ısica-Matem´ atica

E. 3.11 Exerc´ıcio. mostre que

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

156/1304

Suponha que A = P −1 DP , onde D = diag (d1 , . . . , dn ). Se q ´e um polinˆomio q(A) = P −1 q(D)P = P −1 diag (q(d1 ), . . . , q(dn )) P . 6

• O Polinˆ omio M´ınimo Vamos mostrar que para cada matriz A ∈ Mat ( , n) sempre existe pelo menos um polinˆomio p com a propriedade que p(A) = . Para tal notemos primeiramente que Mat ( , n) ´e um espa¸co vetorial complexo de dimens˜ao n 2 . De fato toda a matriz A ∈ Mat ( , n), cujos elementos de matriz s˜ao Aij ∈ pode ser trivialmente escrita na forma n X n X A = Aab E ab a=1 b=1

onde E ab ∈ Mat ( , n) s˜ao matrizes cujos elementos de matriz s˜ao (E ab )ij = δi,a δj,b , ou seja, todos os elementos de matriz de E ab s˜ao nulos, exceto o elemento a, b, que vale 1. E. 3.12 Exerc´ıcio. Certo?

6

Assim, vemos que as matrizes {E ab , a = 1, . . . , n, b = 1, . . . , n} formam uma base em Mat ( , n), mostrando que Mat ( , n) ´e um espa¸co vetorial de dimens˜ao n2 . Isto posto, temos que concluir que qualquer conjunto de mais de n2 matrizes n˜ao-nulas em Mat ( , n) ´e linearmente dependente. Se uma das matrizes Ak , k = 1, . . . , n2 , for nula, digamos Aq = , ent˜ao p(x) = xq , tem a propriedade que p(A) = 0, que ´e o que desejamos provar. Se, por outro lado, as matrizes A k , 2 k = 1, . . . , n2 , s˜ao todas n˜ao-nulas, ent˜ao conjunto { , A, A2 , . . . , An } ´e linearmente dependente, pois possui n2 + 1 elementos. Portanto, existem constantes c0 , . . . , cn2 , nem todas nulas, tais que 2

c 0 + c 1 A + c 2 A 2 + · · · + c n2 A n =

.

Como o lado esquerdo ´e um polinˆomio em A, fica provada nossa afirma¸ca˜o que toda matriz possui um polinˆomio que a anula. Chegamos a`s seguintes defini¸co˜es: Defini¸ c˜ ao. Polinˆ omio Mˆ onico. Um polinˆomio p : → de grau n ´e dito ser um polinˆ omio mˆ onico se for da forma p(x) = xn + an−1 xn−1 + · · · + a1 x + a0 , 

ou seja, se o coeficiente do monˆomio de maior grau (no caso, xn ) for igual a 1. Note-se que polinˆomios mˆonicos nunca s˜ao identicamente nulos.

Defini¸ c˜ ao. Polinˆ omio M´ınimo de uma Matriz. Dada uma matriz A ∈ Mat ( , n), o polinˆ omio m´ınimo de A ´e o polinˆomio mˆonico de menor grau que ´e anulado em A, ou seja, ´e o polinˆomio n˜ao-nulo de menor grau da forma M (x) = xm + am−1 xm−1 + · · · + a1 x + a0 para o qual M (A) = .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

157/1304

As considera¸co˜es acima mostram que um tal polinˆomio sempre existe e que tem grau no m´aximo igual a n2 . Essa ´e, no entanto, uma estimativa exagerada para o grau do polinˆomio m´ınimo de uma matriz A ∈ Mat ( , n) pois, como veremos abaixo, o polinˆomio m´ınimo de uma matriz A ∈ Mat ( , n) tem, na verdade, grau menor ou igual a n. Isso ´e um corol´ario de um teorema conhecido como Teorema de Hamilton-Cayley , que demonstraremos abaixo (Teorema 3.2, p´agina 158). Finalizamos com um teorema b´asico que garante a unicidade do polinˆomio m´ınimo e estabelece sua rela¸ca˜o com outros polinˆomios que anulam A. ´nico. Fora isso se P ´e um Teorema 3.1 O polinˆ omio m´ınimo M de uma matriz A ∈ Mat ( , n) ´e u polinˆ omio n˜ ao-identicamente nulo que tamb´em se anula em A, ou seja, P (A) = , ent˜ ao P ´e divis´ıvel por M , ou seja, existe um polinˆ omio F tal que P (x) = F (x)M (x) para todo x ∈ . 2 Demonstra¸c˜ao. Dada uma matriz A ∈ Mat ( , n), o polinˆomio m´ınimo de A ´e o polinˆomio de menor grau da forma M (x) = xm + am−1 xm−1 + · · · + a1 x + a0 para o qual M (A) = . Vamos supor que haja outro polinˆomio N da forma N (x) = xm + bm−1 xm−1 + · · · + b1 x + b0 para o qual N (A) = . Subtraindo um do outro ter´ıamos o polinˆomio (M − N )(x) = (am−1 − bm−1 )xm−1 + · · · + (a1 − b1 )x + (a0 − b0 ) , que tem grau menor ou igual a m − 1 e para o qual vale (M − N )(A) = M (A) − N (A) = − = . Como, por hip´otese, n˜ao h´a polinˆomios n˜ao-nulos com grau menor que o de M que anulam A, isso ´e uma contradi¸ca˜o, a menos que M = N . Isso prova a unicidade. Seja P um polinˆomio n˜ao identicamente nulo para o qual valha P (A) = . Se p ´e o grau de P , deve-se ter p ≥ m, onde m ´e o grau do polinˆomio m´ınimo de A. Logo, pelos bem conhecidos fatos sobre divis˜ao de polinˆomios, podemos encontrar dois polinˆomios F e R, cujos graus s˜ao, respectivamente p − m e r com 0 ≤ r < m, tais que P (x) = F (x)M (x) + R(x) , para todo x ∈ . Ora, isso diz que P (A) = F (A)M (A) + R(A) . Como P (A) = e M (A) = , isso implica R(A) = . Como, por´em, o grau de R ´e menor que m, tem-se que R deve ser identicamente nulo. Isso completa a prova.

3.3.1

O Teorema de Hamilton-Cayley

Vamos aqui demonstrar um teorema sobre matrizes que ser´a usado mais adiante de v´arias formas, em particular no Teorema Espectral, o chamado Teorema de Hamilton2 -Cayley3 . Esse teorema fornece 2 3

Sir William Rowan Hamilton (1805-1865). Arthur Cayley (1821-1895).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

158/1304

tamb´em, como veremos, um m´etodo eficiente para o c´alculo da inversa de matrizes. Cayley e Hamilton demonstraram casos particulares do teorema para matrizes 2 × 2, 3 × 3 (Cayley) e 4 × 4 (Hamilton). A primeira demonstra¸ca˜o geral ´e devida a Frobenius4 . Cayley, Hamilton e Sylvester5 est˜ao entre os fundadores modernos da teoria das matrizes6 . Teorema 3.2 (Teorema de Hamilton-Cayley) Seja A ∈ Mat ( , n) e seja q(x) = det(x − A) o polinˆ omio caracter´ıstico de A (e que tem grau n). Ent˜ ao q(A) = . 2 Prova. Desejamos mostrar que para todo vetor y ∈ n vale q(A)y = 0. Se y = 0 isso ´e trivial. Se y 6= 0 mas com Ay = 0 ent˜ao q(A)y = (−1)n λ1 · · · λn y ,

onde λ1 , · · · , λn s˜ao os autovalores de A. Mas a pr´opria rela¸ca˜o Ay = 0 indica que um dos autovalores ´e igual a zero. Logo q(A)y = 0. Mais genericamente, se y 6= 0 e {y, Ay} n˜ao for um conjunto de vetores linearmente independentes, ent˜ao Ay e y s˜ao proporcionais, ou seja, existe um autovalor, digamos, λ n tal que Ay = λn y. Nesse caso tamb´em tem-se ! n−1 Y (A − λi ) (A − λn )y = 0 , q(A)y = i=1

pois (A − λn )y = Ay − λn y = 0.

Seja ent˜ao y daqui por diante um vetor fixado, n˜ao-nulo e tal que {y, Ay} ´e um conjunto de dois vetores n˜ao-nulos e linearmente independentes. Como o espa¸co

n

tem dimens˜ao n, nem todos os conjuntos de vetores da forma {y, Ay, A2 y, . . . , Aj y}

s˜ao formados por vetores n˜ao-nulos linearmente independentes. Por exemplo, se j ≥ n, o conjunto {y, Ay, A2 y, . . . , Aj y} n˜ao pode ser formado por vetores n˜ao-nulos linearmente independentes pois seu n´ umero excede a dimens˜ao do espa¸co. Seja k o maior n´ umero tal que {y, Ay, A2 y, . . . Ak−1 y} ´e um conjunto de vetores n˜ao-nulos e ´ claro que 1 < k ≤ n. linearmente independentes. E ´ claro tamb´em, pela defini¸ca˜o de k, que E Ak y = hk y + hk−1 Ay + · · · + h1 Ak−1 y ,

(3.18)

para constantes h1 , . . . , hk . Vamos denominar z1 = Ak−1 y, z2 = Ak−2 y, . . . , zk = y, ou seja, zj = Ak−j y, j = 1, . . . , k, todos n˜ao-nulos por hip´otese. Caso k < n, escolhamos ainda vetores zk+1 , . . . , zn de modo que o conjunto {z1 , . . . , zn } forme uma base em n .

Coloquemo-nos agora a seguinte quest˜ao: qual ´e a forma da matriz A nessa base? No sub-espa¸co gerado pelos vetores {z1 , . . . , zk } tem-se o seguinte: para i = 2, . . . , k vale Azi = zi−1 . Al´em disso, por 4

Ferdinand Georg Frobenius (1849-1917) James Joseph Sylvester (1814-1897). 6 Muitos certamente se surpreender˜ ao em saber que Cayley e Sylvester eram originalmente advogados.

5

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

159/1304

(3.18), Az1 = h1 z1 + h2 z2 + · · · + hk zk . Isso mostra que o subespa¸co gerado pelos vetores {z1 , . . . , zk } ´e invariante pela a¸ca˜o de A e o operador linear A, no mesmo subespa¸co, tem a forma   h1 1 0 . . . 0 0   .. . 0 0  h2 0 1  . .. . . . . . . ..   .. . . . . .   . (3.19)   . . hk−2 0 0  . 1 0   hk−1 0 0 . . . 0 1 hk 0 0 . . . 0 0 E. 3.13 Exerc´ıcio. Justifique isso.

6

Se designarmos por P o operador que realiza essa mudan¸ca de base, o operador linear A na base {z1 , . . . , zn } tem, portanto, a forma A0 = P −1 AP , onde   A1 k, n−k 0 A = , A2 A3 onde A1 ´e a matriz k×k definida em (3.19), A2 ´e uma matriz (n−k)×k e A3 ´e uma matriz (n−k)×(n−k). N˜ao nos ser´a necess´ario especificar os elementos das matrizes A2 e A3 . Outros segundos (minutos?) de medita¸ca˜o, usando a Proposi¸ca˜o 3.1 da p´agina 146, nos levam a concluir que o polinˆomio caracter´ıstico q pode ser escrito como q(x) = det(x − A0 ) = det(x − A1 ) det(x − A3 ) . (O estudante deve recordar-se que as matrizes A e A0 , por serem similares, tˆem o mesmo polinˆomio caracter´ıstico). Vamos denominar qk (x) = det(x − A1 ) e rk (x) = det(x − A3 ). Claramente, q(x) = qk (x)rk (x). N˜ao ser´a necess´ario, no que segue, calcular rk , mas precisaremos calcular qk . Como esse pequeno resultado tem interesse independente, vamos formul´a-lo como um lema, para futura referˆencia. Lema 3.1 Para h1 , . . . , hk ∈ , tem-se   x − h1 −1 0 . . . 0 0   .  −h2 x −1 . . 0 0  . ..  .. .. ..  .. . . . .   = xk − (h1 xk−1 + · · · + hk−1 x + hk ) .  qk (x) := det   . . . −1 0   −hk−2 0 0    −hk−1 0 0 . . . x −1 −hk 0 0 ... 0 x

Prova. A prova ´e feita por indu¸ca˜o. Para k = 2 vale   x − h1 −1 = x2 − h1 x − h2 . q2 (x) = det −h2 x

(3.20)

2

JCABarata. Curso de F´ısica-Matem´ atica

Para k > 2, tem-se, pelas  x − h1   −h2  qk (x) = x det  ...   −hk−2 −hk−1

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

bem conhecidas regras de c´alculo de determinantes,   −1 0 0 x − h1 −1 ..   . 0 x 0 x  −h2   . .. .. + 1 det  ..  . .    −hk−2 0 0 x −1 0

...

0

x



(k−1)×(k−1)

−1

 x  k−1+1 = xqk−1 (x) + (−1) (−hk ) det    0 0

−hk

0

 ... 0 0  . −1 . . 0 0 .  .. .. .. . . . ..    .. . −1 0  0 0 . . . x −1 (k−2)×(k−2)

0 ..

160/1304

0



 0 0  .. ..  . .  x −1 ... 0 0 (k−1)×(k−1) .

0

= xqk−1 (x) + (−1)k+1 hk (−1)k−2 = xqk−1 (x) − hk .

(3.21)

E. 3.14 Exerc´ıcio. Complete os detalhes.

6

Assim, se pela hip´otese indutiva qk−1 ´e da forma qk−1 (x) = xk−1 − (h1 xk−2 + · · · + hk−2 x + hk−1 ) , segue de (3.21) que qk (x) = x(xk−1 − (h1 xk−2 + · · · + hk−2 x + hk−1 )) − hk = xk − (h1 xk−1 + · · · + hk−2 x2 + hk−1 x + hk ) ,

(3.22)

como quer´ıamos provar. Retomando, temos que q(A)y = qk (A)rk (A)y = rk (A)qk (A)y. Sucede, por´em, que qk (A)y = 0. De fato, pelo cˆomputo acima, qk (A)y = Ak y − h1 Ak−1 y − · · · − hk−2 A2 y − hk−1 Ay − hk y , que ´e igual a zero por (3.18). Logo q(A)y = 0. Como y foi escolhido arbitr´ario, segue que q(A) = , demonstrando o Teorema de Hamilton-Cayley, Teorema 3.2.

• O Teorema de Hamilton-Cayley e a Inversa de Matrizes

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

161/1304

O Teorema de Hamilton-Cayley fornece-nos um m´etodo de calcular a inversa de matrizes n˜aosingulares. De fato, se q(x) = xn + an−1 xn−1 + · · · + a1 x + a0 ´e o polinˆomio caracter´ıstico de uma matriz n˜ao-singular A, ent˜ao o Teorema de Hamilton-Cayley afirma que An + an−1 An−1 + · · · + a1 A + a0 ou seja, Isso tem por implica¸ca˜o

A An−1 + an−1 An−2 + · · · + a2 A + a1 A−1 = −

= 

,

= −a0 .

 1 An−1 + an−1 An−2 + · · · + a2 A + a1 . a0

(3.23)

Vide (3.91), p´agina 216, para uma express˜ao mais expl´ıcita.

Nota. Usando a defini¸ca˜o de polinˆomio caracter´ıstico q(x) = det(x − A), ´e evidente (tomando-se x = 0) que a0 = (−1)n det(A). Assim, a0 6= 0 se e somente se A for n˜ao-singular.

Em muitos casos a f´ormula (3.23) ´e bastante eficiente para calcular A−1 , pois a mesma envolve poucas opera¸co˜es alg´ebricas em compara¸ca˜o com outros m´etodos, o que ´e uma vantagem para valores grandes de n. Compare, por exemplo, com a regra de Laplace, express˜ao (3.8), p´agina 145, para o c´alculo de A−1 , que envolve o cˆomputo de n2 + 1 determinantes de sub-matrizes de ordem n − 1 de A.

E. 3.15 Exerc´ıcio. 6

Use esse m´etodo para calcular a inversa das suas matrizes n˜ao-singulares favoritas.

• De volta ao polinˆ omio m´ınimo O Teorema 3.1, p´agina 157, e o Teorema de Hamilton-Cayley, juntos, permitem-nos precisar algo a respeito da forma geral do polinˆomio m´ınimo de uma matriz. Se A ∈ Mat ( , n) tem r autovalores distintos α1 , . . . , αr , cada qual com multiplicidade alg´ebrica a1 , . . . , ar , respectivamente, ent˜ao seu polinˆomio caracter´ıstico q ´e da forma q(x) =

r Y

k=1

(x − αk )ak .

Pelo Teorema de Hamilton-Cayley, q(A) = 0 e, portanto, pelo Teorema 3.1, M , o polinˆomio m´ınimo de A, divide q. Logo, M deve ser da forma M (x) =

s Y l=1

(x − αkl )bl ,

(3.24)

onde s ≤ r, {αk1 , . . . , αks } ⊂ {α1 , . . . , αr } e onde 0 < bl ≤ akl para todo 1 ≤ l ≤ s. Seja agora, por´em, vm 6= 0 um autovetor de A com autovalor αm Segue do fato que M (A) = 0 que 0 = M (A)vm =

s Y l=1

bl

(A − αkl ) vm =

s Y l=1

(αm − αkl )bl vm .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

162/1304

Q Logo, sl=1 (αm − αkl )bl = 0 e isso implica que αm ∈ {αk1 , . . . , αks }. Como isso vale para todo 1 ≤ m ≤ r, segue que {α1 , . . . , αr } ⊂ {αk1 , . . . , αks } e, portanto, {α1 , . . . , αr } = {αk1 , . . . , αks }. Nossa conclus˜ao ´e resumida no seguinte: Proposi¸ c˜ ao 3.9 Seja A ∈ Mat ( , n) com r autovalores distintos α1 , . . . , αr ∈ , cada qual com multiplicidade alg´ebrica a1 , , . . . , ar , sendo 1 ≤ r ≤ n. Ent˜ ao M , o polinˆ omio m´ınimo de A, ´e da forma r Y M (x) = (x − αk )bk , (3.25) k=1

∀x ∈ , onde 0 < bl ≤ al para todo 1 ≤ l ≤ r. Em particular, se A ∈ Mat ( , n) tiver exatamente n autovalores distintos, teremos que bl = al = 1 para todo 1 ≤ l ≤ n, e M (x) = q(x) =

n Y

k=1

(x − αk ) ,

∀x ∈ .

3.4

2

Matrizes Diagonaliz´ aveis e o Teorema Espectral

• Matrizes Diagonaliz´ aveis Vamos agora apresentar uma no¸ca˜o intimamente ligada a` de matriz simples introduzida acima (p´agina 152), mas de importˆancia maior. Defini¸ c˜ ao. Uma matriz A ∈ Mat ( , n) ´e dita ser uma matriz diagonaliz´ avel se existir uma matriz −1 invert´ıvel P ∈ Mat ( , n) tal que P AP ´e uma matriz diagonal, ou seja,   d1 · · · 0   P −1 AP = D = diag (d1 , . . . , dn ) =  ... . . . ...  . 0 · · · dn ´ f´acil de se ver que os elementos da diagonal de D s˜ao os autovalores de A. De fato, se A ´e E diagonaliz´avel por P , vale para seu polinˆomio caracter´ıstico p(λ) = det(λ − A) = det(P −1 (λ − A)P ) = det(λ − P −1 AP ) = det(λ − D)   λ − d1 · · · 0  ..  = (λ − d ) · · · (λ − d ) , .. = det  ... . 1 n .  0 · · · λ − dn

o que mostra que os di s˜ao as ra´ızes do polinˆomio caracter´ıstico de A e, portanto, seus autovalores. E. 3.16 Exerc´ıcio. Justifique todas as passagens acima.

6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

163/1304

• Diagonaliza¸ c˜ ao de Matrizes O pr´oximo teorema ´e fundamental no estudo de matrizes diagonaliz´aveis. Teorema 3.3 Uma matriz A ∈ Mat ( , n) ´e diagonaliz´ avel se e somente se possuir um conjunto de n autovetores linearmente independentes, ou seja, se e somente se o sub-espa¸co gerado pela cole¸ca ˜o de todos os autovetores de A possuir dimens˜ ao n. 2 Prova. Vamos primeiro provar que se A ∈ Mat ( , n) possui um conjunto de n autovetores linearmente independentes ent˜ao A ´e diagonaliz´avel. Para tal vamos construir a matriz P que diagonaliza A. Seja {v 1 , . . . , v n } um conjunto de n autovetores linearmente independentes de A, cujos autovalores s˜ao {d1 , . . . , dn }, respectivamente. Vamos denotar as componentes de v i na base canˆonica por vji , ii hh j = 1, . . . , n. Seja a matriz P definida por P = v 1 , . . . , v n , ou seja, 

 v11 · · · v1n   P =  ... . . . ...  . vn1 · · · vnn

Como se vˆe pela constru¸ca˜o, a a-´esima coluna de P ´e formada pelas componentes do vetor v a . Por (3.4), segue que hh ii hh ii AP = Av 1 , . . . , Av n = d1 v 1 , . . . , dn v n . Por (3.6) vale, por´em, que hh

d1 v 1 , . . . , dn v n

E. 3.17 Exerc´ıcio. Verifique.

ii



  v11 · · · v1n d1 · · · 0    =  ... . . . ...   ... . . . ...  = P D . vn1 · · · vnn 0 · · · dn 6

Portanto, AP = P D. Como, por hip´otese, as colunas de P s˜ao formadas por vetores linearmente independentes, tem-se que det(P ) 6= 0 (por que?). Logo, P ´e invert´ıvel e, portanto, P −1 AP = D, como quer´ıamos demonstrar. Vamos provar agora a afirma¸ca˜o rec´ıproca que se A ´e diagonaliz´avel, ent˜ao possui n autovetores linearmente independentes. Suponha que exista P tal que   d1 · · · 0   P −1 AP = D =  ... . . . ...  . 0 · · · dn

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

´ evidente que os vetores da base canˆonica E     1 0 0  1          e 1 = 0  , e 2 = 0  ,  ..   ..  . . 0 0

...,

en

164/1304

  0 0      =  ...    0  1

s˜ao autovetores de D com Dea = da ea . Logo, v a = P ea s˜ao autovetores de A, pois Av a = AP ea = P Dea = P (da ea ) = da P ea = da v a .

Provar que os vetores v a s˜ao linearmente independentes ´e f´acil. Suponha que existam n´ umeros complexos α1 , . . . , αn tais que α1 v 1 + · · · + α n v n = 0 .

Multiplicando-se a` esquerda por P −1 ter´ıamos

α1 e 1 + · · · + α n e n = 0 . Como os ea s˜ao obviamente linearmente independentes, segue que α1 = · · · = αn = 0, provando que os v a s˜ao linearmente independentes.

• Matrizes Diagonaliz´ aveis e Matrizes Simples Vamos agora discutir a rela¸ca˜o entre os conceitos de matriz diagonaliz´avel e o de matriz simples, conceito esse introduzido a` p´agina 152. Tem-se a saber o seguinte fato: Proposi¸ c˜ ao 3.10 Uma matriz A ∈ Mat ( , n) ´e diagonaliz´ avel se e somente se for simples, ou seja, se e somente se a multiplicidade alg´ebrica de cada um dos seus autovalores coincidir com sua multiplicidade geom´etrica. 2 Prova. Se A ´e diagonaliz´avel existe P tal que P −1 AP = D, diagonal. Como toda matriz diagonal, D ´e simples. Escrevamos D na forma   D = diag α1 , . . . , α1 , . . . , αr , . . . , αr ,  . | {z } | {z } a1 vezes ar vezes

Um conjunto de n-autovetores de D linearmente independentes ´e canˆonica:     1 0 0  1          e 1 = 0  , e 2 = 0  , . . . , e n =  ..   ..  . . 0 0

fornecido pelos vetores da base   0 0     ..  . .   0  1

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

165/1304

Os vetores e1 , . . . , ea1 geram o subespa¸co de autovetores com autovalor α1 de D etc. Para a matriz A, os vetores P e1 , . . . , P ea1 geram o subespa¸co de autovetores com autovalor α1 etc. ´ claro que a dimens˜ao desse subespa¸co ´e a1 , pois P e1 , . . . , P ea1 s˜ao linearmente independentes, j´a E que os vetores da base canˆonica e1 , . . . , ea1 o s˜ao. Como isso tamb´em vale para os demais autovalores conclu´ımos que A ´e simples. Resta-nos agora mostrar que se A ∈ Mat ( , n) ´e simples ent˜ao A ´e diagonaliz´avel. Como antes, sejam α1 , . . . , αr , 1 ≤ r ≤ n, seus autovalores distintos, cada qual com multiplicidade alg´ebrica a1 , . . . , ar , respectivamente, e seja E(αi ) o subespa¸co gerado pelos autovetores com autovalor αi . Como A ´e simples, tem-se que a dimens˜ao de E(αi ) ´e ai . J´a observamos (p´agina 150) que sub-espa¸cos E(αi ) associados a autovalores distintos tˆem em comum apenas o vetor nulo. Pr Assim, se em cada E(α i ) escolhermos ai vetores independentes, teremos ao todo um conjunto de i=1 ai = n autovetores (vide (3.13)) linearmente independentes de A. Pelo Teorema 3.3, A ´e diagonaliz´avel, completando a prova.

• Projetores Uma matriz E ∈ Mat ( , n) ´e dita ser um projetor se satisfizer E2 = E . Discutiremos v´arias propriedades importantes de projetores adiante, especialmente de uma classe especial de projetores denominados projetores ortogonais. Por ora, vamos mostrar duas propriedades que usaremos logo abaixo quando discutirmos o teorema espectral. A primeira propriedade ´e a afirma¸ca˜o que se λ ´e um autovalor de um projetor E ent˜ao ou λ ´e igual a zero ou a um. De fato se v ´e um autovetor associado a um autovalor λ de E, tem-se que Ev = λv e E 2 v = λ2 v. Como E 2 = E, segue que λ2 v = λv. Logo λ(λ − 1) = 0 e, portanto, λ = 0 ou λ = 1.

A segunda propriedade ´e uma conseq¨ uˆencia da primeira: o tra¸co de um projetor E ∈ Mat ( , n) ´e um n´ umero inteiro positivo ou nulo, mas menor ou igual a n. De fato, pela defini¸ca˜o, o tra¸co de um projetor E ´e a soma de seus autovalores. Como os mesmos valem zero ou um a soma ´e um inteiro positivo ou nulo. Como h´a no m´aximo n autovalores a soma n˜ao pode exceder n. Na verdade, o u ´ nico ´ nico projetor cujo tra¸co vale exatamente 0 projetor cujo tra¸co vale exatamente n ´e a identidade e o u ´e a matriz nula (por que?). Essas observa¸co˜es tˆem a seguinte conseq¨ uˆencia que usaremos adiante. Se E 1 , . . . , Er s˜ao r projetores n˜ao-nulos com a propriedade que r X = Ea a=1

ent˜ao r ≤ n. Para ver isso, basta tomar o tra¸co de ambos os lados dessa express˜ao: Tr( ) =

r X

Tr(Ea ) .

(3.26)

a=1

O lado esquerdo vale n enquanto que o lado direito ´e uma soma de r inteiros positivos. Obviamente isso s´o ´e poss´ıvel se r ≤ n.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

166/1304

Uma outra observa¸ca˜o u ´ til ´e a seguinte: se E e E 0 s˜ao dois projetores satisfazendo EE 0 = E 0 E = , 0 ent˜ao E + E ´e igualmente um projetor, como facilmente se constata. • O Teorema Espectral ´ O chamado Teorema Espectral ´e um dos mais importantes teoremas de toda a Algebra Linear e, em verdade, de toda An´alise Funcional, j´a que o mesmo possui generaliza¸co˜es para operadores limitados e n˜ao-limitados (auto-adjuntos) agindo em espa¸cos de Hilbert. Dessas generaliza¸co˜es trataremos na Se¸ca˜o 26.6.1, p´agina 1215, para o caso dos chamados operadores compactos e na Se¸ca˜o 26.7, p´agina 1223, para o caso geral de operadores limitados auto-adjuntos. Nessa vers˜ao mais geral o teorema espectral ´e de importˆancia fundamental para a interpreta¸ca˜o probabil´ıstica da F´ısica Quˆantica. Vide discuss˜ao da Se¸ca˜o 26.7.5, p´agina 1244. Teorema 3.4 (O Teorema Espectral para Matrizes) Uma matriz A ∈ Mat ( , n) ´e diagonaliz´ avel se e somente se existirem r ∈ , 1 ≤ r ≤ n, escalares distintos α 1 , . . . , αr e projetores n˜ ao-nulos distintos E1 , . . . , Er ∈ Mat ( , n) tais que 

A =

r X

αa E a ,

(3.27)

a=1

=

r X

Ea

(3.28)

a=1

e

Ei Ej = δi, j Ej . Os escalares α1 , . . . , αr vˆem a ser os autovalores distintos de A.

2

Adiante demonstraremos uma vers˜ao um pouco mais detalhada desse importante teorema (Teorema 3.6, abaixo). Os projetores Ea que surgem em (3.27) s˜ao denominados projetores espectrais de A. A decomposi¸ca˜o (3.27) ´e freq¨ uentemente denominada decomposi¸ca ˜o espectral de A. Na Proposi¸ca˜o 3.11, p´agina 169 mostraremos como os projetores espectrais Ea de A podem ser expressos em termos de polinˆomios em A. Na Proposi¸ca˜o 3.12, p´agina 169, provaremos a unicidade da decomposi¸ca˜o espectral de uma matriz diagonaliz´avel. Prova do Teorema 3.4. Se A ∈ Mat ( , n) ´e diagonaliz´avel existe P ∈ Mat ( , n) tal que P −1 AP = D = diag (λ1 , . . . , λn ), onde λ1 , . . . , λn s˜ao os autovalores de A. Como pode haver autovalores repetidos, vamos denotar por {α1 , . . . , αr }, 1 ≤ r ≤ n, o conjunto de autovalores distintos de A. ´ bem claro que podemos escrever E D =

r X

α a Ka ,

a=1

onde as matrizes Ka s˜ao todas matrizes diagonais, cujos elementos diagonais s˜ao ou 0 ou 1 e tais que r X a=1

Ka =

.

(3.29)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

167/1304

As matrizes Ka s˜ao simplesmente definidas de modo a terem elementos de matriz iguais a 1 nas posi¸co˜es da diagonal ocupadas pelo autovalor αa em D e zero nos demais. Formalmente,   1, se i = j e (D)ii = αa 0, se i = j e (D)ii 6= αa . (Ka )ij =  0, se i 6= j Por exemplo, se

teremos





2 0 D =  0 0

1 0 D = 2 0 0

0 0 0 0

0 0 1 0

  0 0   0 0 +3   0 0 0 0

0 3 0 0

0 0 2 0

0 1 0 0

0 0 0 0

 0 0  0 4

  0 0   0 0 +4   0 0 0 0

´ f´acil constatar que as matrizes Ka tˆem a seguinte propriedade: E

0 0 0 0

0 0 0 0

 0 0  . 0 1

Ka Kb = δa, b Ka .

(3.30)

De fato, ´e evidente que (Ka )2 = Ka para todo a, pois Ka ´e diagonal com zeros ou uns na diagonal. Analogamente, se a 6= b Ka Kb = 0, pois os zeros ou uns aparecem em lugares distintos das diagonais das duas matrizes. Como A = P DP −1 , tem-se que A =

r X

αa E a ,

a=1

´ f´acil agora provar que onde Ea := P Ka P −1 . E

=

r X

Ea

a=1

e que

Ei Ej = δi, j Ej . De fato, por (3.29), r X a=1

Ea =

r X a=1

P Ka P −1 = P

r X a=1

Ka

!

P −1 = P P −1 =

.

Analogamente, tem-se por (3.30), Ea Eb = P Ka P −1 P Kb P −1 = P Ka Kb P −1 = δa, b P Ka P −1 = δa, b Ea . Vamos agora provar a rec´ıproca. Vamos supor que A possua a representa¸ca˜o (3.27), onde os E a ’s satisfazem as propriedades enunciadas.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

168/1304

Notemos primeiramente que para todo vetor x, os vetores Ek x ou s˜ao nulos ou s˜ao autovetores de A. De fato, por (3.27) r X AEk x = αj E j E k x = α k E k x . j=1

Logo ou Ek x = 0 ou Ek x ´e autovetor de A.

Como h´a no m´aximo n autovetores, o espa¸co por eles gerado tem dimens˜ao menor ou igual a n. Por (3.28), por´em, vale para todo vetor x que x =

x =

r X

Ek x .

k=1

Para x n˜ao-nulo, alguns dos Ek x, acima, devem ser n˜ao-nulos e, portanto, autovetores de A. Assim, todo vetor x pode ser escrito como uma combina¸ca˜o linear de autovetores de A, o que significa que o espa¸co gerado por esses autovetores tem dimens˜ao exatamente igual a n. Pelo teorema 3.3, A ´e diagonaliz´avel. Isso completa a demonstra¸ca˜o. No Teorema 3.6, p´agina 171, apresentaremos uma segunda demonstra¸ca˜o do Teorema Espectral para Matrizes, a qual lan¸ca luz sobre outras condi¸co˜es de diagonalizabilidade de matrizes. Antes, exploremos algumas das conseq¨ uˆencias do Teorema Espectral. • O C´ alculo Funcional para Matrizes Diagonaliz´ aveis O Teorema Espectral tem o seguinte corol´ario, muitas vezes conhecido como c´ alculo funcional. avel e seja Teorema 3.5 (C´ alculo Funcional) Seja A ∈ Mat ( , n) uma matriz diagonaliz´ r X

A =

αa E a .

a=1

sua decomposi¸ca ˜o espectral, de acordo com o Teorema Espectral, o Teorema 3.4. Ent˜ ao para qualquer polinˆ omio p vale r X p(A) = p(αa )Ea . (3.31) a=1

2

Prova. Tem-se, pelas propriedades dos Ea ’s, 2

A =

r X

αa αb E a E b =

a, b=1

r X

a, b=1

Analogamente, mostra-se que A

m

r X = (αa )m Ea , a=1

para qualquer m ∈ 

αa αb δa, b Ea =

. O resto da prova ´e trivial.

r X a=1

(αa )2 Ea .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

169/1304

E. 3.18 Exerc´ıcio. Usando (3.31) demonstre novamente o Teorema de Hamilton-Cayley (Teorema 3.2, p´agina 158), agora apenas para matrizes diagonaliz´aveis. 6 • Obtendo os projetores espectrais O C´alculo Funcional para matrizes, Teorema 3.5, tem diversas conseq¨ uˆencias pr´aticas, uma delas sendo a seguinte proposi¸ca˜o, que permite expressar os projetores espectrais de uma matriz A diretamente em termos de A. Proposi¸ c˜ ao 3.11 Seja A ∈ Mat ( , n), diagonaliz´ avel, e seja A = α1 E1 + · · · + αr Er , com os αk ’s distintos, sua representa¸ca ˜o espectral, descrita no Teorema 3.4. Sejam os polinˆ omios p j , j = 1, . . . , r, definidos por  r  Y x − αl pj (x) := . (3.32) αj − α l l=1 l6=j

Ent˜ ao, ∀ j = 1, . . . , r .

Ej = pj (A) ,

(3.33) 2

Prova. Pela defini¸ca˜o dos polinˆomios pj , ´e evidente que pj (αk ) = δj, k . Logo, pelo C´alculo Funcional para matrizes, r X pj (A) = pj (αk )Ek = Ej . k=1

• O Teorema Espectral para matrizes. Unicidade Proposi¸ c˜ ao 3.12 A representa¸ca ˜o espectral de uma matriz diagonaliz´ avel A ∈ Mat ( , n) descrita no Teorema 3.4 ´e u ´nica. 2 Demonstra¸c˜ao. Seja A ∈ Mat ( , n) diagonaliz´avel e seja A =

r X

αk Ek a representa¸ca˜o espectral de A

k=1

descrita no Teorema 3.4, onde αk , k = 1, . . . , r, com 1 ≤ r ≤ n s˜ao os autovalores distintos de A, Seja r0 X A= αk0 Ek0 uma segunda representa¸ca˜o espectral para A, onde os αk0 ’s s˜ao distintos e onde os Ek0 ’s k=1

0

s˜ao n˜ao-nulos e satisfazem

Ej0 El0

=

δj, l El0

e

=

r X

Ek0 . Por essa u ´ ltima propriedade segue que para

k=1 P0 um dado vetor x 6= 0 vale x = rk=1 Ek0 x, de modo que nem todos os vetores Ek0 x s˜ao nulos. Seja Ek0 0 x P0 um desses vetores n˜ao-nulos. Tem-se que AEk0 0 x = rk=1 αk0 Ek0 Ek0 0 x = αk0 0 Ek0 0 x. Isso mostra que αk0 0 ´e

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

170/1304

um dos autovalores de A e, portanto, {α10 , . . . , αr0 0 } ⊂ {α1 , . . . , αr }. Isso, em particular ensina-nos que r 0 ≤ r. Podemos sem perda de generalidade considerar que os dois conjuntos sejam ordenados de modo que αk0 = αk para todo 1 ≤ k ≤ r 0 . Assim, A =

r X

0

r X

αk E k =

k=1

αk Ek0 .

(3.34)

k=1

Sejam agora os polinˆomios pj , j = 1, . . . , r, definidos em (3.32), os quais satisfazem pj (αj ) = 1 e pj (αk ) = 0 para todo k 6= j. Pelo C´alculo Funcional descrito acima, segue de (3.34) que, com 1 ≤ j ≤ r 0 , pj (A) =

r X

0

pj (αk )Ek =

|k=1 {z

=Ej

r X

pj (αk )Ek0 ,

|k=1 {z

}



Ej = Ej0 .

}

=Ej0

P0 (A igualdade pj (A) = rk=1 pj (αk )Ek0 segue do fato que os Ek0 ’s satisfazem as mesmas rela¸co˜es alg´ebricas que os Ek ’s e, portanto, para a representa¸ca˜o espectral de A em termos dos Ek0 ’s vale tamb´em o C´alculo Funcional). Lembrando que a igualdade Ej = Ej0 vale para todo 1 ≤ j ≤ r 0 , segue que =

r X k=1

0

Ek =

r X

Ek .

k=1

P A u ´ ltima igualdade implica rk=r0 +1 Ek = . Multiplicando por El com r 0 + 1 ≤ l ≤ r, segue que El = para todo r 0 + 1 ≤ l ≤ r. Isso s´o ´e poss´ıvel se r = r 0 , pois os E 0 k’s s˜ao n˜ao-nulos. Isso completa a demonstra¸ca˜o.

• O Teorema Espectral para matrizes. Uma segunda visita O Teorema Espectral, Teorema 3.4, pode ser formulado de um modo mais detalhado (Teorema 3.6). A principal utilidade dessa outra formula¸ca˜o ´e a de fornecer mais informa¸co˜es sobre os projetores espectrais Ea (vide express˜ao (3.37), abaixo). Obtem-se tamb´em nessa nova formula¸ca˜o mais condi¸co˜es necess´arias e suficientes a` diagonalizabilidade e que podem ser u ´ teis, como veremos, por exemplo, no Teorema 3.14 provado adiante (p´agina 175). Teorema 3.6 (Teorema Espectral para Matrizes. Vers˜ ao Detalhada) Seja A ∈ Mat ( , n). S˜ ao equivalentes as seguintes afirma¸co ˜es: 1. A possui n autovetores linearmente independentes, ou seja, o sub-espa¸co gerado pelos autovetores de A tem dimens˜ ao n. 2. A ´e diagonaliz´ avel, ou seja, existe uma matriz P ∈ Mat ( , n) invert´ıvel tal que P −1 AP ´e uma matriz diagonal diag (d1 , . . . , dn ), onde os di ’s s˜ ao autovalores de A. 3. Para todo vetor x ∈

n

e todo escalar λ ∈

tais que (A − λ )2 x = 0, vale que (A − λ )x = 0.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

4. Se x ´e um vetor n˜ ao-nulo tal que (A − λ )x = 0 para algum λ ∈ vetor y com a propriedade que (A − λ )y = x.

171/1304

ent˜ ao n˜ ao existe nenhum

5. Todas as ra´ızes do polinˆ omio m´ınimo de A tˆem multiplicidade 1. 6. Existem r ∈ , escalares distintos α1 , . . . , αr e projetores distintos E1 , . . . , Er ∈ Mat ( , n), denominados projetores espectrais de A, tais que 

A =

r X

αa E a .

a=1

Al´em disso, as matrizes Ea satisfazem =

r X

Ea

(3.35)

a=1

e

Ei Ej = δi, j Ej .

(3.36)

Os projetores espectrais Ek do item 6, acima, podem ser expressos em termos de polinˆ omios da matriz A: 1 Ek = mk (A) , (3.37) mk (αk ) para todo k, 1 ≤ k ≤ r, onde os polinˆ omios mk s˜ ao definidos por M (x) = (x − αk )mk (x) , M sendo o polinˆ omio m´ınimo de A.

2

Demonstra¸c˜ao. A prova da equivalˆencia ser´a feita demonstrando-se sucessivamente as seguintes implica¸co˜es: 1 → 2, 2 → 3, 3 → 4, 4 → 5, 5 → 6, 6 → 1. Que 1 implica 2 j´a foi demonstrado no Teorema 3.3, p´agina 163. 2 → 3. Seja D = P −1 AP diagonal. D = diag (d1 , . . . , dn ). Seja (A − λ )2 x = 0. Segue que P −1 (A − λ )2 P y = 0 onde y = P −1 x. Logo, (D − λ )2 y = 0 , ou seja, (d1 − λ)2 y1 = 0 .. . (dn − λ)2 yn = 0,

JCABarata. Curso de F´ısica-Matem´ atica

onde yj s˜ao as componentes de y:

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

172/1304

  y1  ..  y =  . . yn

Agora, ´e evidente que se (da − λ)2 ya = 0 ent˜ao (da − λ)ya = 0. Logo (D − λ )y = 0 . Usando-se y = P −1 x e multiplicando-se a` direita por P , conclu´ımos que 0 = P (D − λ )P −1 x = (P DP −1 − λ )x = (A − λ )x , que ´e o que quer´ıamos provar. 3 → 4. A prova ´e feita por contradi¸ca˜o. Vamos supor que para algum vetor x 6= 0 exista λ ∈ tal que (A − λ )x = 0. Suponhamos tamb´em que exista vetor y tal que (A − λ )y = x. Ter´ıamos (A − λ )2 y = (A − λ )x = 0 . Pelo item 3 isso implica (A − λ )y = 0. Mas isso diz que x = 0, uma contradi¸ca˜o. 4 → 5. Seja M o polinˆomio m´ınimo de A, ou seja, o polinˆomio mˆonico7 de menor grau tal que M (A) = 0. Vamos mostrar que todas as ra´ızes de M tˆem multiplicidade 1. Vamos, por contradi¸ca˜o, supor que haja uma raiz, λ0 , com multiplicidade maior ou igual a 2. Ter´ıamos, para x ∈ , M (x) = p(x)(x − λ0 )2 . Assim, M (A) = p(A)(A − λ0 )2 = 0. Como M ´e, por defini¸ca˜o, o polinˆomio de menor grau que zera em A, segue que p(A)(A − λ0 ) 6= 0 . Assim, existe pelo menos um vetor z tal que p(A)(A − λ0 )z 6= 0. Vamos definir um vetor x por x := p(A)(A − λ0 )z. Ent˜ao (A − λ0 )x = (A − λ0 )p(A)(A − λ0 )z = p(A)(A − λ0 )2 z = M (A)z = 0 , pois M (A) = 0. Agora, pela defini¸ca˜o, x = (A − λ0 )y , onde y = p(A)z. Pelo item 4, por´em, isso ´e imposs´ıvel. 5 → 6. Pela hip´otese que as ra´ızes de M s˜ao simples segue da express˜ao (3.25) da Proposi¸ca˜o 3.9, p´agina 162, que para x ∈ , r Y M (x) = (x − αj ) , j=1

7

A defini¸ca ˜o de polinˆ omio mˆ onico est´ aa ` p´ agina 156.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

173/1304

onde αj s˜ao as ra´ızes de M e que coincidem com os r autovalores distintos de A. Para k = 1, . . . , r defina-se os polinˆomios mk por M (x) =: (x − αk )mk (x) , ou seja, mk (x) :=

r Y j=1 j6=k

(x − αj ) .

´ claro que mk (αj ) = 0 ⇐⇒ j 6= k (por que?). E

Vamos agora definir mais um polinˆomio, g, da seguinte forma: g(x) = 1 −

r X k=1

1 mk (x) . mk (αk )

Como os polinˆomios mk tˆem grau r − 1, o polinˆomio g tem grau menor ou igual a r − 1. Por´em, observe-se que, para todos os αj , j = 1, . . . , r, vale g(αj ) = 1 −

r X k=1

mj (αj ) 1 mk (αj ) = 1 − = 0. mk (αk ) mj (αj )

Assim, g tem pelo menos r ra´ızes distintas! O u ´ nico polinˆomio de grau menor ou igual a r − 1 que tem r ra´ızes distintas ´e o polinˆomio nulo. Logo, conclu´ımos que g(x) = 1 −

r X k=1

1 mk (x) ≡ 0 mk (αk )

para todo x ∈ . Isso significa que todos os coeficientes de g s˜ao nulos. Assim, para qualquer matriz B tem-se g(B) = 0. Para a matriz A isso diz que =

r X k=1

Definindo-se Ek :=

1 mk (A) . mk (αk )

1 mk (A) , mk (αk )

conclu´ımos que =

r X

Ek .

(3.38)

(3.39)

k=1

Para todo k vale 0 = M (A) = (A − αk )mk (A), ou seja, Amk (A) = αk mk (A). Pela defini¸ca˜o de Ek isso significa AEk = αk Ek . Assim, multiplicando-se ambos os lados de (3.39) por A, segue que A =

r X k=1

αk E k .

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

174/1304

Para completar a demonstra¸ca˜o de 6, resta-nos provar que Ei Ej = δi, j Ej . Para i 6= j tem-se pela defini¸ca˜o dos Ek ’s que 1 mi (A)mj (A) mi (αi )mj (αj )    r r 1 Y  Y  =  (A − αk )  (A − αl ) mi (αi )mj (αj ) k=1 l=1

Ei Ej =

k6=i



1  =  mi (αi )mj (αj ) =



r Y

k=1 k6=i, k6=j



1   mi (αi )mj (αj )

l6=j

r Y

l=1



k=1 k6=i, k6=j

= 0,

# " r  Y (A − αk ) (A − αl )  (A − αk ) M (A)

pois M (A) = 0. Resta-nos provar que Ej2 = Ej para todo j. Multiplicando-se ambos os lados de (3.39) por Ej teremos r X Ej = Ej Ek = E j Ej , k=1

j´a que Ej Ek = 0 quando j 6= k. Isso completa a demonstra¸ca˜o do item 6.

6 → 1. Notemos primeiramente que para todo vetor x, os vetores Ek x ou s˜ao nulos ou s˜ao autovetores de A. De fato, por 6, r X AEk x = αj E j E k x = α k E k x . j=1

Logo, ou Ek x = 0 ou Ek x ´e autovetor de A. O espa¸co gerado pelos autovetores de A obviamente tem dimens˜ao menor ou igual a n. Por (3.39), por´em, vale para todo vetor x que x =

x =

r X

Ek x .

k=1

Assim, todo vetor x pode ser escrito como uma combina¸ca˜o linear de autovetores de A, o que significa que o espa¸co gerado pelos autovetores tem dimens˜ao exatamente igual a n. Isso completa a demonstra¸ca˜o do Teorema 3.6. Destacamos ao leitor o fato de que a express˜ao (3.37) permite representar os projetores espectrais diretamente em termos da matriz diagonaliz´avel A.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

175/1304

• Diagonalizabilidade de Projetores A proposi¸ca˜o abaixo ´e uma aplica¸ca˜o simples do Teorema 3.6 a projetores. A mesma ser´a usada abaixo quando falarmos de diagonaliza¸ca˜o simultˆanea de matrizes. Proposi¸ c˜ ao 3.13 Seja E ∈ Mat ( , n) um projetor, ou seja, tal que E 2 = E. Ent˜ ao E ´e diagonaliz´ avel. 2 Prova. Seja E ∈ Mat ( , n) um projetor. Definamos E1 = E e E2 = projetor, pois (E2 )2 = ( − E)2 =

− 2E + E 2 =

− 2E + E =

− E. Ent˜ao E2 ´e tamb´em um − E = E2 .

Tem-se tamb´em que E1 E2 = 0, pois E1 E2 = E( − E) = E − E 2 = E − E = 0 . Fora isso, ´e o´bvio que = E1 + E2 e que E = α1 E1 + α2 E2 , com α1 = 1 e α2 = 0. Ora, isso tudo diz que E satisfaz precisamente todas as condi¸co˜es do item 6 do Teorema 3.6. Portanto, pelo mesmo teorema, E ´e diagonaliz´avel.

• Uma Condi¸ c˜ ao Suficiente para Diagonalizabilidade At´e agora estudamos condi¸co˜es necess´arias e suficientes para que uma matriz seja diagonaliz´avel. Vimos que uma matriz A ∈ Mat ( , n) ´e diagonaliz´avel se e somente se for simples ou se e somente se tiver n autovetores linearmente independentes ou se e somente se puder ser representada na forma espectral, como em (3.27). Nem sempre, por´em, ´e imediato verificar essas hip´oteses, de modo que ´e u ´ til saber de condi¸co˜es mais facilmente verific´aveis e que sejam pelo menos suficientes para garantir diagonalizabilidade. Veremos abaixo que ´e, por exemplo, suficiente que uma matriz seja auto-adjunta ou normal para garantir que ela seja diagonaliz´avel. Uma outra condi¸ca˜o u ´ til ´e aquela contida na seguinte proposi¸ca˜o. Proposi¸ c˜ ao 3.14 Se A ∈ Mat ( , n) tem n autovalores distintos ent˜ ao A ´e diagonaliz´ avel.

2

Prova. Isso ´e imediato pelas Proposi¸co˜es 3.5 e 3.10, das p´aginas 152 e 164, respectivamente. Observa¸ca ˜o. A condi¸ca˜o mencionada na u ´ ltima proposi¸ca˜o ´e apenas suficiente, pois h´a obviamente matrizes diagonaliz´aveis que n˜ao tˆem autovalores todos distintos. Outra forma de provar a Proposi¸ca˜o 3.14 ´e a seguinte. Seja {λ1 , . . . , λn } o conjunto dos n autovalores de A, todos distintos. O polinˆomio caracter´ıstico de A ´e q(x) = (x − λ 1 ) · · · (x − λn ). Como as ra´ızes de q tˆem, nesse caso, multiplicidade 1, segue pela Proposi¸ca˜o 3.9, p´agina 162, que o polinˆomio m´ınimo de A, M , coincide com o polinˆomio caracter´ıstico de A: q(x) = M (x), ∀x ∈ . Logo, o polinˆomio m´ınimo M de A tem tamb´em ra´ızes com multiplicidade 1. Assim, pelo item 5 do Teorema 3.6, p´agina 171, A ´e diagonaliz´avel.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

176/1304

E. 3.19 Exerc´ıcio. Demonstre a seguinte afirma¸c˜ao: se os autovalores de uma matriz A s˜ao todos iguais, ent˜ao A ´e diagonaliz´avel se e somente se for um m´ultiplo de . Sugest˜ao: use o Teorema Espectral ou a forma geral do polinˆomio m´ınimo (3.25). 6 Segue da afirmativa desse exerc´ıcio que matrizes triangulares superiores com diagonal principal constante, ou seja, da forma   α A12 . . . A1(n−1) A1n  0 α . . . A2(n−1) A2n     ..  . . . . , A = . . .    0 0 . . .  α A(n−1)n 0 0 ... 0 α

s´o s˜ao diagonaliz´aveis se todos os elementos acima da diagonal principal forem nulos, ou seja, se A ij = 0, ∀j > i. Naturalmente, a mesma afirmativa ´e v´alida para matrizes da forma AT , triangulares inferiores com diagonal principal constante.

3.4.1

Diagonaliza¸ c˜ ao Simultˆ anea de Matrizes

Uma matriz A ∈ Mat ( , n) ´e dita ser diagonalizada por uma matriz P ∈ Mat ( , n) se P −1 AP for uma matriz diagonal. Uma quest˜ao muito importante ´e saber quando duas matrizes diagonaliz´aveis podem ser diagonalizadas por uma mesma matriz P . A resposta ´e fornecida no pr´oximo teorema. Teorema 3.7 (Diagonaliza¸ c˜ ao Simultˆ anea de Matrizes) Duas matrizes diagonaliz´ aveis A e B ∈ Mat ( , n) podem ser diagonalizadas pela mesma matriz P ∈ Mat ( , n) se e somente se AB = BA, ou seja, se e somente se comutarem entre si. 2 Prova. A parte f´acil da demonstra¸ca˜o ´e provar que se A e B podem ser diagonalizadas pela mesma matriz P ent˜ao A e B comutam entre si. De fato P −1 (AB − BA)P = (P −1 AP )(P −1 BP ) − (P −1 BP )(P −1 AP ) = 0 , pois P −1 AP e P −1 BP s˜ao ambas diagonais e matrizes diagonais sempre comutam entre si (por que?). Assim, P −1 (AB − BA)P = 0 e, portanto, AB = BA.

Vamos agora passar a mostrar que se AB = BA ent˜ao ambas s˜ao diagonaliz´aveis por uma mesma matriz P . Sejam α1 , . . . , αr os r autovalores distintos de A e β1 , . . . , βs os s autovalores distintos de B.

Evocando o teorema espectral, A e B podem ser escritos de acordo com suas decomposi¸co˜es espectrais como r X A = αi EiA i=1

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

e B =

s X

177/1304

βj EjB ,

j=1

onde, de acordo com (3.37), −1     r r  Y Y A (αi − αk ) Ei =  (A − αk     k=1 k=1

 ) ,

k6=i

k6=i

e



−1    s  Y  (βj − βk ) =  (B − βk ) ,     k=1 k=1   s Y

EjB

i = 1, . . . , r

(3.40)

j = 1, . . . , s .

(3.41)

k6=j

k6=j

Como A e B comutam entre si e como EiA e EjB , dados em (3.40)-(3.41), s˜ao polinˆomios em A e B, respectivamente, segue que EiA e EjB tamb´em comutam entre si para todo i e todo j. Com isso, vamos definir Qi, j = EiA EjB = EjB EiA para i = 1, . . . , r e j = 1, . . . , s. Note-se que os Qi, j ’s s˜ao projetores pois Q2i, j = (EiA EjB )(EiA EjB ) = (EiA )2 (EjB )2 = EiA EjB = Qi, j . Fora isso, ´e f´acil ver que, Qi, j Qk, l = δi, k δj, l Qi, j .

(3.42)

E. 3.20 Exerc´ıcio. Mostre isso.

6

Note-se tamb´em que =

r X s X

Qi, j ,

(3.43)

i=1 j=1

pois r X s X i=1 j=1

Qi, j =

r X s X

EiA EjB =

i=1 j=1

r X i=1

EiA

!

s X j=1

EjB

!

=

=

.

Afirmamos que podemos escrever A =

r X s X

γi,A j Qi, j

(3.44)

γi,B j Qi, j ,

(3.45)

i=1 j=1

e B =

r X s X i=1 j=1

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

178/1304

onde γi,A j = αi e γi,B j = βj . De fato, com essas defini¸co˜es, r X s X

γi,A j Qi, j =

i=1 j=1

r X s X

r X

αi EiA EjB =

αi EiA

i=1

i=1 j=1

!

s X j=1

EjB

!

= A

= A.

Para B a demonstra¸ca˜o ´e an´aloga. Nas rela¸co˜es (3.44) e (3.45) ´e poss´ıvel fazer simplifica¸co˜es em fun¸ca˜o do fato de que nem todos os projetores Qi, j s˜ao n˜ao-nulos. Seja Q1 . . . , Qt a lista dos projetores Qi, j n˜ao-nulos, ou seja, {Q1 . . . , Qt } = {Qi, j | Qi, j 6= 0, i = 1, . . . , r e j = 1, . . . , s} . ´ evidente por (3.42) que os Qk ’s s˜ao projetores e que E Qk Ql = δk, l Qk . Por (3.43), tem-se =

t X

Qk

(3.46)

χA k Qk

(3.47)

χB k Qk

(3.48)

k=1

e por (3.44) e (3.45) A =

t X k=1

B =

t X k=1

B onde as constantes χA ao relacionadas de modo o´bvio com γi,A j e γi,B j , respectivamente. k e χk est˜

Em (3.47) e (3.48) vemos que A e B, por serem diagonaliz´aveis e por comutarem entre si, tˆem decomposi¸co˜es espectrais com os mesmos projetores espectrais. Note-se tamb´em que, pela observa¸ca˜o feita no t´opico Projetores, a` p´agina 165 (vide equa¸ca˜o (3.26)), tem-se 1 ≤ t ≤ n.

Vamos agora completar a demonstra¸ca˜o que A e B podem ser diagonalizados por uma mesma matriz invert´ıvel P . Seja Ek o subespa¸co dos autovetores de Qk com autovalor 1. Sub-espa¸cos Ek ’s diferentes tˆem em comum apenas o vetor nulo. De fato, se k 6= l e w ´e um vetor tal que Qk w = w e Ql w = w ent˜ao, como Qk Ql = 0 segue que 0 = (Qk Ql )w = Qk (Ql w) = Qk w = w . Seja dk a dimens˜ao do subespa¸co Ek e seja u1k , . . . , udkk um conjunto de dk vetores linearmente independentes em Ek . Notemos que dk coincide com a multiplicidade alg´ebrica do autovalor 1 de Qk , pois, conforme diz a Proposi¸ca˜o 3.13, o projetor Qk ´e diagonaliz´avel e, portanto, ´e uma matriz simples (Proposi¸ca˜o 3.10).

JCABarata. Curso de F´ısica-Matem´ atica

Como

=

Pt

k=1

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

Qk , tem-se, tomando-se o tra¸co, que n =

Pelas defini¸co˜es, temos que Ql uak = δk, l uak ,

Pt

k=1

179/1304

dk . (3.49)

pois Qk uak = uak e, portanto, Ql uak = Ql (Qk uak ) = (Ql Qk )uak = 0 para k 6= l. Afirmamos que o conjunto de vetores

u11 , . . . , ud11 , u12 , . . . , ud22 , . . . u1t , . . . , udt t

(3.50)

´e um conjunto de n vetores linearmente independentes. De fato, suponha que existam constantes c k, j tais que dk t X X ck, j ujk = 0 . k=i j=1

Aplicando-se a` direita Ql ter´ıamos

dl X

cl, j ujl = 0 ,

j=1

o que s´o ´e poss´ıvel se cl, j = 0 para todo j pois u1l , . . . , udl l , foram escolhidos linearmente independentes. Como l ´e arbitr´ario, conclu´ımos que cl, j = 0 para todo l e todo j, o que mostra que o conjunto de vetores em (3.50) ´e linearmente independente. Seja ent˜ao a matriz P ∈ Mat ( , n) definida por ii hh P = u11 , . . . , ud11 , u12 , . . . , ud22 , . . . u1t , . . . , udt t .

P ´e invert´ıvel pois o conjunto (3.50) ´e linearmente independente (e, portanto, det(P ) 6= 0). Tem-se,

hh ii AP = Au11 , . . . , Aud11 , Au12 , . . . , Aud22 , . . . , Au1t , . . . , Audt t . P Escrevendo A = tl=1 χA l Ql (3.47) e usando (3.49), temos Auak

=

t X

a A a χA l Q l uk = χ k uk .

l=1

Assim, AP = onde

Portanto,

hh

A dt A 1 A d1 A 1 A d1 1 χA 1 u1 , . . . , χ 1 u1 , χ 2 u1 , . . . , χ 2 u1 , . . . , χ t ut , . . . , χ t ut



ii



= P DA ,

A A A A DA = diag χA , . . . , χA . 1 , χ2 , . . . , χ2 , . . . , χt , . . . , χt | 1 {z } | {z } {z } | d1 vezes d2 vezes dt vezes

P −1 AP = DA .

JCABarata. Curso de F´ısica-Matem´ atica

Analogamente, BP = Escrevendo B = BP = onde

Portanto,

Pt

l=1

hh

hh

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

180/1304

ii Bu11 , . . . , Bud11 , Bu12 , . . . , Bud22 , . . . Bu1t , . . . , Budt t .

χB l Ql (3.48) temos,

1 B d1 B 1 B d2 B 1 B dt χB 1 u1 , . . . , χ 1 u1 , χ 2 u2 , . . . , χ 2 u2 , . . . , χ t ut , . . . , χ t ut

ii

= P DB ,





B B B B DB = diag χB . , . . . , χB 1 , χ2 , . . . , χ2 , . . . , χt , . . . , χt | | 1 {z } | {z } {z } d1 vezes d2 vezes dt vezes

P −1 BP = DB .

Isso provou que A e B s˜ao diagonaliz´aveis pela mesma matriz invert´ıvel P . A demonstra¸ca˜o do Teorema 3.7 est´a completa.

3.5

Matrizes Auto-adjuntas, Normais e Unit´ arias

• A Adjunta de uma Matriz Seja V um espa¸co vetorial dotado de um produto escalar h·, ·i e seja A : V → V um operador linear. Um operador linear A∗ que para todos u, v ∈ V satisfa¸ca hu, Avi = hA∗ u, vi

´e dito ser o operador adjunto de A. Em espa¸cos vetoriais gerais n˜ao ´e o´bvio (e nem sempre verdadeiro!) que sempre exista o adjunto de um operador linear A dado. H´a muitos casos, por´em, nos quais isso pode ser garantido8 . Aqui trataremos do caso dos espa¸cos V = n com o produto escalar usual. Sejam u = (u1 , . . . , un ) e v = (v1 , . . . , vn ) dois vetores de escalar usual n X hu, vi = uk v k .

n

para os quais define-se o produto

k=1

Um operador linear A ´e representado (na base canˆonica) por uma matriz cujos elementos de matriz s˜ao Aij , com i, j ∈ {1, . . . , n}. ´ um exerc´ıcio simples (fa¸ca!) verificar que o operador adjunto A∗ de A ´e representado (na base E canˆonica) por uma matriz cujos elementos de matriz s˜ao (A∗ )ij = Aji , com i, j ∈ {1, . . . , n}. Ou seja, a matriz adjunta de A ´e obtida (na base canˆonica!) transpondo-se A e tomando-se o complexo conjugado de seus elementos. Os seguintes fatos s˜ao importantes: 8

Tal ´e o caso dos chamados operadores lineares limitados agindo em espa¸cos de Hilbert, para os quais sempre ´e poss´ıvel garantir a existˆencia do adjunto.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

Proposi¸ c˜ ao 3.15 Se A e B s˜ ao dois operadores lineares agindo em

n

181/1304

ent˜ ao

(αA + βB)∗ = αA∗ + βB ∗ para todos α, β ∈ . Fora isso,

(AB)∗ = B ∗ A∗ .

Por fim, vale para todo A que (A∗ )∗ = A.

2

Deixamos a demonstra¸ca˜o como exerc´ıcio para o leitor. A opera¸ca˜o Mat ( , n) 3 A 7→ A∗ ∈ Mat ( , n) ´e demoninada opera¸ca ˜o de adjun¸ca ˜o de matrizes. Como vimos na Proposi¸ca˜o 3.15, a opera¸ca˜o de adjun¸ca˜o ´e anti-linear e ´e um anti-homomorfismo alg´ebrico. • Os espectro e a opera¸ c˜ ao de adjun¸ c˜ ao Seja A ∈ Mat ( , n). Como j´a vimos, o espectro de A, σ(A), ´e o conjunto de ra´ızes de seu polinˆomio caracter´ıstico, definido por pA (z) = det(z − A), z ∈ . Como para toda B ∈ Mat ( , n) vale det(B ∗ ) = det(B) (por quˆe?), segue que pA (z) = det(z − A) = det(z − A∗ ) = pA∗ (z), ou seja, pA∗ (z) = pA (z). Com isso, provamos a seguinte afirma¸ca˜o: Proposi¸ c˜ ao 3.16 Seja A ∈ Mat ( , n). Ent˜ ao, λ ∈ σ(A) se e somente se λ ∈ σ(A∗ ), ou seja, λ ´e um autovalor de A se e somente se λ ´e um um autovalor de A∗ . Em s´ımbolos, as afirma¸co˜es acima s˜ao expressas pela igualdade σ(A) = σ(A∗ ). • Matrizes Hermitianas, Normais e Unit´ arias Vamos agora a algumas defini¸co˜es muito importantes. Defini¸ c˜ ao. Um operador linear em n ´e dito ser sim´etrico, Hermitiano ou auto-adjunto se A = A∗ , ou seja, se para todos u, v ∈ V satisfizer hu, Avi = hAu, vi . Advertˆ encia. Em espa¸cos vetoriais de dimens˜ao finita as no¸co˜es de operador sim´etrico, Hermitiano ou auto-adjunto s˜ao sinˆonimas. Em espa¸cos vetoriais de dimens˜ao infinita, por´em, h´a uma distin¸ca˜o entre essas no¸co˜es relativa a problemas com o dom´ınio de defini¸ca˜o de operadores. Defini¸ c˜ ao. Um operador linear em com seu adjunto.

n

´e dito ser normal se AA∗ = A∗ A. Ou seja, A ´e normal se comuta

´ claro que todo ario se A∗ A = AA∗ = . E Defini¸ c˜ ao. Um operador linear em n ´e dito ser unit´ n ∗ operador unit´ario ´e normal e que um operador ´e unit´ario em se e somente se A = A−1 . Note que se A ´e unit´ario ent˜ao, para todos u, v ∈ V , tem-se hAu, Avi = hu, vi .

JCABarata. Curso de F´ısica-Matem´ atica

Defini¸ c˜ ao. Se A ´e um operador linear em

n

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

182/1304

define-se a parte real de A por

1 Re (A) = (A + A∗ ) 2 e a parte imagin´ aria de A por

1 (A − A∗ ). 2i ´ E claro que essas defini¸co˜es foram inspiradas nas rela¸co˜es an´alogas para n´ umeros complexos. Note tamb´em que A = Re (A) + iIm (A) . Im (A) =

E. 3.21 Exerc´ıcio. Por quˆe?

6

´ importante notar que para qualquer operador linear A em n sua parte real e imagin´aria s˜ao E ambas operadores Hermitianos: (Re (A))∗ = Re (A) e (Im (A))∗ = Im (A). E. 3.22 Exerc´ıcio. Mostre isso.

6

Para operadores normais tem-se a seguinte proposi¸ca˜o, que ser´a u ´ til adiante e serve como caracteriza¸ca˜o alternativa do conceito de operador normal. Proposi¸ c˜ ao 3.17 Um operador linear agindo em com sua parte imagin´ aria.

n

´e normal se e somente se sua parte real comuta 2

Deixamos a demonstra¸ca˜o (elementar) como exerc´ıcio para o leitor. A importˆancia das defini¸co˜es acima reside no seguinte fato, que demonstraremos adiante: matrizes Hermitianas e matrizes normais s˜ao diagonaliz´aveis. Antes de tratarmos disso, vamos discutir algumas propriedades do espectro de matrizes Hermitianas e de matrizes unit´arias. • Os Autovalores de Matrizes Hermitianas e de Matrizes Unit´ arias Os seguintes teoremas tˆem importˆancia fundamental para o estudo de propriedades de matrizes Hermitianas e de matrizes unit´arias. Teorema 3.8 Os autovalores de uma matriz Hermitiana s˜ ao sempre n´ umeros reais.

2

Prova. Seja A Hermitiana, λ um autovalor de A e v 6= 0 um autovetor de A com autovalor λ. Como A ´e Hermitiana tem-se hv, Avi = hAv, vi . Como v ´e um autovetor, o lado esquerdo vale λhv, vi e o lado direito vale λhv, vi. Logo, (λ−λ)hv, vi = 0. Como v 6= 0 isso implica λ = λ, ou seja, λ ´e real. Note-se que a rec´ıproca desse teorema ´e falsa. A matriz n˜ao ´e Hermitiana.



2 1 0 3



tem autovalores reais (2 e 3) mas

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

183/1304

Para matrizes unit´arias temos Teorema 3.9 Os autovalores de uma matriz unit´ aria s˜ ao sempre n´ umeros complexos de m´ odulo 1. 2 Prova. Seja A unit´aria, λ um autovalor de A e v 6= 0 um autovetor de A com autovalor λ. Como A ´e unit´aria tem-se hAv, Avi = hv, vi .

Como v ´e um autovetor, o lado esquerdo vale λλhv, vi. Assim, (|λ|2 − 1)hv, vi = 0. Como v 6= 0 isso implica |λ| = 1. • Operadores Sim´ etricos e Unit´ arios. Ortogonalidade de Autovetores

Teorema 3.10 Os autovetores associados a autovalores distintos de uma matriz sim´etrica s˜ ao ortogonais entre si. 2 Prova. Seja A sim´etrica e λ1 , λ2 dois de seus autovalores, que suporemos distintos. Seja v1 autovetor de A com autovalor λ1 e v2 autovetor de A com autovalor λ2 . Temos, por A ser sim´etrico, hv1 , Av2 i = hAv1 , v2 i . O lado esquerdo vale λ2 hv1 , v2 i e o lado direito λ1 hv1 , v2 i (lembre-se que λ1 ´e real). Assim (λ2 − λ1 )hv1 , v2 i = 0 . Como λ2 6= λ1 , segue que hv1 , v2 i = 0, que ´e o que se queria provar. Teorema 3.11 Os autovetores associados a autovalores distintos de uma matriz unit´ aria s˜ ao ortogonais entre si. 2 Prova. Seja U unit´aria e sejam λ1 , λ2 dois de seus autovalores, sendo que suporemos λ1 6= λ2 . Seja v1 autovetor de U com autovalor λ1 e v2 autovetor de U com autovalor λ2 . Temos, por U ser unit´ario, hU v1 , U v2 i = hv1 , U ∗ U v2 i = hv1 , v2 i . O lado esquerdo vale λ2 λ1 hv1 , v2 i = λλ21 (lembre-se que λ1 ´e um n´ umero complexo de m´odulo 1 e, −1 portanto λ1 = λ1 ). Assim   λ2 − 1 hv1 , v2 i = 0 . λ1 Como λ2 6= λ1 , segue que hv1 , v2 i = 0, que ´e o que se queria provar.

• Projetores Ortogonais

JCABarata. Curso de F´ısica-Matem´ atica

Um operador linear E agindo em

n

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

184/1304

´e dito ser um projetor ortogonal se E 2 = E e se E ∗ = E.

Projetores ortogonais s˜ao importantes na decomposi¸ca˜o espectral de matrizes auto-adjuntas, como veremos. Note-se que nem todo projetor ´e ortogonal. Por exemplo   1 0 E = 1 0 ´e um projetor (E 2 = E) mas n˜ao ´e ortogonal (E ∗ = 6 E). O mesmo vale para   1 0 . E = 2 0 Um exemplo importante de projetor ortogonal ´e representado por projetores sobre sub-espa¸cos unidimensionais gerados por vetores. Seja v um vetor cuja norma assumiremos ser 1, ou seja, kvk = p hv, vi = 1. Definimos o projetor Pv sobre o sub-espa¸co gerado por v por Pv u := hv, ui v ,

(3.51)

para todo vetor u. Provemos que Pv ´e um projetor ortogonal. Por um lado, tem-se Pv2 u = hv, ui Pv v = hv, ui hv, vi v = hv, ui v = Pv u , o que mostra que Pv2 = Pv . Por outro lado, para quaisquer vetores a e b, usando as propriedades de linearidade, anti-linearidade e conjuga¸ca˜o complexa do produto escalar, tem-se ha, Pv bi = ha, hv, bi vi = hv, bi ha, vi = hha, vi v, bi = hhv, ai v, bi = hPv a, bi , provando que Pv∗ = Pv . Isso mostra que Pv ´e um projetor ortogonal. Um fato crucial sobre projetores como Pv ´e o seguinte. Se u e v s˜ao dois vetores ortogonais, ou seja, se hu, vi = 0 ent˜ao Pu Pv = Pv Pu = 0. Para provar isso notemos que para qualquer vetor a vale Pu (Pv a) = Pu (hv, ai v) = hv, ai Pu v = hv, ai hu, vi u = 0 . O mesmo se passa para Pv (Pu a). • Matrizes Auto-adjuntas e Diagonalizabilidade Vamos aqui demonstrar a seguinte afirma¸ca˜o importante: toda matriz auto-adjunta ´e diagonaliz´avel. Uma outra demonstra¸ca˜o (eventualmente mais simples) dessa afirma¸ca˜o pode ser encontrada na Se¸ca˜o 3.8.2, p´agina 210. Vide Teorema 3.23, p´agina 212. Teorema 3.12 Se A ∈ Mat ( , n) ´e auto-adjunta, ent˜ ao A possui n autovetores mutuamente ortonormais v1 , . . . , vn , com autovalores λ1 , . . . , λn , respectivamente, e pode ser representada na forma espectral A = λ 1 Pv 1 + · · · + λ n Pv n . (3.52) Portanto, se A ´e auto-adjunta, ent˜ ao A ´e diagonaliz´ avel, sendo que ´e poss´ıvel encontrar uma matriz −1 unit´ aria P que diagonaliza A, ou seja, tal que P AP ´e diagonal e P −1 = P ∗ . 2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

185/1304

Note-se que se α1 , . . . , αr com 1 ≤ r ≤ n s˜ao os autovalores distintos de A, ent˜ao (3.52) pode ser reescrita como A = α1 P1 + · · · + αr Pr , onde cada Pk ´e o projetore ortogonal dado pela soma dos Pvj ’s de mesmo autovalor αk . A Proposi¸ca˜o 3.12, p´agina 169, garante a unicidade dessa representa¸ca˜o para A. Prova do Teorema 3.12. A demonstra¸ca˜o que A ´e diagonaliz´avel ser´a feita construindo-se a representa¸ca˜o espectral (3.52) para A. Seja λ1 um autovalor de A e v1 um autovetor de A com autovalor λ1 normalizado de tal forma que kv1 k = 1. Vamos definir um operador A1 por A 1 = A − λ 1 Pv 1 . Como A e Pv1 s˜ao auto-adjuntos e λ1 ´e real, segue que A1 ´e igualmente auto-adjunto. Afirmamos que A1 v1 = 0 e que [v1 ]⊥ ´e um sub-espa¸co invariante por A1 . De fato, A1 v1 = Av1 − λ1 Pv1 v1 = λ1 v1 − λ1 v1 = 0 . Fora isso, se w ∈ [v1 ]⊥ tem-se

hA1 w, v1 i = hw, A1 v1 i = 0 ,

mostrando que A1 w ´e tamb´em elemento de [v1 ]⊥ .

O operador A1 restrito a [v1 ]⊥ ´e tamb´em auto-adjunto (por que?). Seja λ2 um de seus autovalores com autovetor v2 ∈ [v1 ]⊥ , que escolhemos com norma 1. Seja A 2 = A 1 − λ 2 Pv 2 = A − λ 1 Pv 1 − λ 2 Pv 2 . Como λ2 tamb´em ´e real A2 ´e igualmente auto-adjunto. Fora isso afirmamos que A2 anula os vetores do sub-espa¸co [v1 , v2 ] e mantem [v1 , v2 ]⊥ invariante. De fato, A2 v1 = Av1 − λ1 Pv1 v1 − λ2 Pv2 v1 = λ1 v1 − λ1 v1 − λ2 hv2 , v1 iv2 = 0 , pois hv2 , v1 i = 0. Analogamente, A 2 v 2 = A 1 v 2 − λ 2 Pv 2 v 2 = λ 2 v 2 − λ 2 v 2 = 0 . Por fim, para quaisquer α, β ∈

e w ∈ [v1 , v2 ]⊥ tem-se

hA2 w, (αv1 + βv2 )i = hw, A2 (αv1 + βv2 )i = 0 , que ´e o que quer´ıamos provar. Prosseguindo indutivamente, construiremos um conjunto de vetores v1 , . . . , vn , todos com norma 1 e com va ∈ [v1 , . . . , va−1 ]⊥ e um conjunto de n´ umeros reais λ1 , . . . , λn tais que A n = A − λ 1 Pv 1 − · · · − λ n Pv n anula-se no sub-espa¸co [v1 , . . . , vn ]. Ora, como estamos em um espa¸co de dimens˜ao n e os vetores vk s˜ao mutuamente ortogonais, segue que [v1 , . . . , vn ] deve ser o espa¸co todo, ou seja, An = 0. Provamos ent˜ao que (3.53) A = λ 1 Pv 1 + · · · + λ n Pv n .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

186/1304

Vamos provar agora que essa ´e a representa¸ca˜o espectral de A. Como os v k ’s s˜ao mutuamente ortogonais, ´e evidente que Pvk Pvl = δk, l Pvk . Resta-nos provar que Pv1 + · · · + Pvn = . Como v1 , . . . , vn formam uma base, todo vetor x pode ser escrito como uma combina¸ca˜o linear x = α 1 v1 + · · · + α n vn .

(3.54)

Tomando-se o produto escalar com va , e usando o fato que os vk ’s s˜ao mutuamente ortogonais, tem-se αa = hva , xi . E. 3.23 Exerc´ıcio. Verifique.

6

Assim, (3.54) pode ser escrita como x = hv1 , xiv1 + · · · + hvn , xivn = Pv1 x + · · · + Pvn x = (Pv1 + · · · + Pvn ) x . Como isso vale para todo vetor x, segue que Pv 1 + · · · + P v n =

.

Assim, A possui uma representa¸ca˜o espectral como (3.27). Pelo Teorema Espectral 3.4, A ´e diagonaliz´avel. Por (3.53), vemos que Ava = λa va (verifique!). Logo os λa ’s s˜ao autovalores de A e os va ’s seus autovetores. Assim, se A ´e auto-adjunto, podemos escontrar n autovetores de A mutuamente ortogonais, mesmo que sejam autovetores com o mesmo autovalor. Isso generaliza o Teorema 3.10. hh ii ´ Pelo que j´a vimos A ´e diagonalizada por P −1 AP , onde podemos escolher P = v 1 , . . . , v n . E f´acil verificar, por´em, que P ´e unit´aria. De fato, ´e um exerc´ıcio simples (fa¸ca!) mostrar que   hv1 , v1 i · · · hv1 , vn i   .. .. .. P ∗P =   . . . . hvn , v1 i · · · hvn , vn i

Como hva , vb i = δa, b , a matriz do lado direito ´e igual a , mostrando que P ∗ P = P P ∗ = portanto, P ´e unit´aria.

e que,

Para concluir essa discuss˜ao, temos: Proposi¸ c˜ ao 3.18 Uma matriz A ∈ Mat ( , n) ´e auto-adjunta, se e somente se for diagonaliz´ avel por uma transforma¸ca ˜o de similaridade unit´ aria e se seus autovalores forem reais. 2 Prova. Se A ∈ Mat ( , n) ´e diagonaliz´avel por uma transforma¸ca˜o de similaridade unit´aria e seus autovalores s˜ao reais, ou seja, existe P unit´aria e D diagonal real com P ∗ AP = D, ent˜ao A = P DP ∗ e A∗ = P D ∗ P ∗ . Como D ´e diagonal e real, vale D ∗ = D e, portanto, A∗ = P DP ∗ = A, provando que A ´e auto-adjunta. A rec´ıproca j´a foi provada acima.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

187/1304

• Matrizes Normais e Diagonalizabilidade O teorema que afirma que toda matriz sim´etrica ´e diagonaliz´avel tem a seguinte conseq¨ uˆencia: Teorema 3.13 Se A ∈ Mat ( , n) ´e normal ent˜ ao A ´e diagonaliz´ avel.

2

Prova. J´a vimos que toda matriz A pode ser escrita na forma A = Re (A) + iIm (A) onde Re (A) e Im (A) s˜ao auto-adjuntas. Vimos tamb´em que se A ´e normal Re (A) e Im (A) comutam entre si (Proposi¸ca˜o 3.17). Pelo Teorema 3.7, Re (A) e Im (A) podem ser simultaneamente diagonalizados. Observa¸ c˜ ao. Como no caso auto-adjunto, o operador que faz a diagonaliza¸ca˜o pode ser escolhido unit´ario. De fato, vale uma afirmativa ainda mais forte. Teorema 3.14 Uma matriz A ∈ Mat ( , n) ´e normal se e somente se for diagonaliz´ avel por um operador unit´ ario. 2 Prova. Resta provar apenas que se A ´e diagonaliz´avel por um operador unit´ario P ent˜ao A ´e normal. Seja D = P ∗ AP . Tem-se D ∗ = P ∗ A∗ P (por que?). Assim, A∗ A − AA∗ = P D ∗ P ∗ P DP ∗ − P DP ∗ P D ∗ P ∗ = P (D ∗ D − DD ∗ )P ∗ = 0 , j´a que D ∗ e D comutam por serem diagonais (duas matrizes diagonais quaisquer sempre comutam. Por quˆe?). Isso completa a prova que A ´e normal. Uma outra demonstra¸ca˜o (eventualmente mais simples) dessa afirma¸ca˜o pode ser encontrada na Se¸ca˜o 3.8.2, p´agina 210. Vide Teorema 3.24, p´agina 212.

3.5.1

Matrizes Positivas

Uma matriz A ∈ Mat ( , n) ´e dita ser uma matriz positiva se hw, Awi ≥ 0 para todo vetor w ∈ A seguinte proposi¸ca˜o ´e relevante9 :

n

.

ao A ´e Hermitiana e tem autovalores n˜ aoProposi¸ c˜ ao 3.19 Se A ∈ Mat ( , n) ´e positiva, ent˜ negativos. Reciprocamente, se A ´e Hermitiana e tem autovalores n˜ ao-negativos, ent˜ ao A ´e positiva. 2 Prova. A express˜ao ω(u, v) := hu, Avi, u, v ∈ n , define uma forma sesquilinear que, por hip´otese, ´e positiva, ou seja, satisfaz ω(u, u) ≥ 0 para todo u ∈ n . Pelo Teorema 2.6, p´agina 114, ω ´e Hermitiana, ou seja, ω(u, v) = ω(v, u) , para todos os vetores u e v. Mas isso significa que hu, Avi = hv, Aui, ou seja, hu, Avi = hAu, vi para todos os vetores u e v e assim provou-se que A = A ∗ . Uma outra forma de demonstrar isso usa a desigualdade de polariza¸ca˜o. Se A ´e positiva ent˜ao, para quaisquer vetores u, v ∈ n vale h(u + in v), A(u + in v)i ≥ 0 para todo n ∈ e, portanto, h(u + in v), A(u + in v)i ´e um 9

V´ arios dos resultados que seguem podem ser generalizados para operadores lineares positivos agindo em espa¸cos de Hilbert. Vide Teorema 26.21, p´ agina 1179.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

188/1304

n´ umero real. Usando a identidade de polariza¸ca˜o, eqs. (2.23)-(2.24), p´agina 126, vale, para quaisquer vetores u, v ∈ n , hAv, ui = hu, Avi

3

3

=

1 X −n 1X n i h(u + in v), A(u + in v)i = i h(u + in v), A(u + in v)i 4 n=0 4 n=0

=

1 X −n n n i i i h(u + in v), A(u + in v)i 4 n=0

(2.23)

3

3

=

1 X −n −n i hi (u + in v), Ain (u + in v)i 4 n=0

=

1 X −n i h(v + i−n u), A((−1)n v + in u)i 4 n=0

=

1X (−1)n i−n h(v + i−n u), A(v + i−n u)i 4 n=0

=

1X n i h(v + i−n u), A(v + i−n u)i 4 n=0

sesquilin.

3

3

3

(2.24)

=

hv, Aui .

Assim, hAv, ui = hv, Aui para todos u, v ∈ n , o que significa que A ´e Hermitiana. Portanto, por (3.52), podemos escrever A = λ1 Pv1 + · · · + λn Pvn , onde v1 , . . . , vn s˜ao autovetores mutuamente ortonormais de A com autovalores λ1 , . . . , λn , respectivamente. Disso segue que hvj , Avj i = λj para todo j = 1, . . . , n. Como o lado esquerdo ´e ≥ 0, por hip´otese, segue que λj ≥ 0 para todo j = 1, . . . , n. Se, reciprocamente, A for auto-adjunta com autovalores n˜ao-negativos, segue de (3.52) e da defini¸ca˜o n X de Pvj em (3.51) que hw, Awi = λj |hw, vj i|2 ≥ 0, para todo w ∈ n , provando que A ´e positiva. j=1

O seguinte corol´ario ´e imediato. Corol´ ario 3.2 Uma matriz A ∈ Mat ( , n) positiva se somente se existe uma matriz positiva B (un´ıvoca!) tal que A = B 2 . As matrizes A e B comutam: AB = BA. 2 Demonstra¸c˜ao. Se A = B 2 com B positiva, ent˜ao, como B ´e auto-adjunta (pela Proposi¸ca˜o 3.19), segue que para todo w ∈ n vale hw, Awi = hw, B 2 wi = hBw, Bwi = kBwk2 ≥ 0, provando que A ´e positiva. Provemos agora a rec´ıproca. Se A ´e positiva ent˜ao, como comentamos na demonstra¸ca˜o da Proposi¸ca˜o 3.19, A ´e autoadjunta com representa¸ca˜o espectral A = λ1 Pv1 + · · · + λn Pvn , onde v1 , . . . , vn s˜ao autovetores mutuamente ortonormais de A com autovalores λ1 , . . . , λn , respectivamente, todos n˜ao-negativos. Defina-se a matriz p p (3.55) B := λ1 P v 1 + · · · + λ n P v n .

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

189/1304

Como, pela ortonormalizade dos vj ’s, vale Pvj Pvk = δj, k Pvj , ´e f´acil ver que B 2 = λ1 Pv1 +· · ·+λn Pvn = A. A unicidade de B segue da unicidade da decomposi¸ca˜o espectral, Proposi¸ca˜o 3.12, p´agina 169. A igualdade (B 2 )B = B(B)2 significa AB = BA, provando que A e B comutam. Defini¸ c˜ ao. Se A ´e uma matriz positiva, a (´ unica!) matriz positiva B satisfazendo B 2 = A ´e freq¨ uen√ √ √ temente denotada por A e denominada ra´ız quadrada da matriz A. Como vimos, A A = AA. Lema ao √ Se A ∈ Mat ( , n) ´e uma matriz positiva e C ∈ Mat ( , n) satisfaz CA = AC ent˜ √ 3.2 C A = AC. 2 Prova. Se C comuta com A, ent˜ao A comuta com qualquer polinˆomio em A. Vimos na Proposi¸ca˜o 3.11, p´agina 169, que os projetores espectrais de A podem ser √ escritos como polinˆomios em A. Assim, C comuta com os projetores espectrais de A e, portanto, com A, devido a (3.55). Uma conseq¨ uˆencia interessante das considera¸co˜es acima ´e a seguinte proposi¸ca˜o: Proposi¸ c˜ ao 3.20 Toda matriz Hermitiana pode ser escrita como combina¸ca ˜o linear de at´e duas matrizes unit´ arias. Toda matriz pode ser escrita como combina¸ca ˜o linear de at´e quatro matrizes unit´ arias. 2 Demonstra¸c˜ao. Seja A ∈ Mat ( , n). Se A ´e Hermitiana (vamos supor que A 6= , pois de outra umero forma n˜ao h´a o que se provar), ent˜ao, para todo w ∈ n , o produto escalar hw A2 wi ´e um n´ 2 2 2 2 real e, pela desigualdade de Cauchy-Schwarz, |hw A wi| ≤ kA k kwk n . Assim, −kA k kwk2 n ≤ hw, ( − A2 /kA2 k)wi = kwk2 n − hw, A2 wi ≤ kA2 k kwk2 n Logo, a matriz − A2 /kA2 k ´e positiva, pois p hw, A2 wi/kA2 k ≥ kwk2 n − kwk2 n = 0. Conseq¨ − A2 /kA2 k existe e ´e positiva e uentemente, Hermitiana. Trivialmente, podemos escrever s s ! p ! p 2 2 2 kA k kA k A A A A2 p p A = − + − . (3.56) +i −i 2 kA2 k 2 kA2 k kA2 k kA2 k 











Agora, as matrizes √ A 2 ± i kA k

e que

q



A p +i kA2 k A

p +i kA2 k

A2 kA2 k

s

s

s˜ao unit´arias. Para ver isso, notemos que



A2 kA2 k

A2 − kA2 k

!∗

!

A p −i kA2 k

=

A

p −i kA2 k

s

s

A2 − kA2 k

A2 − kA2 k

!

=

!

.

Para provar a u ´ ltima igualdade basta expandir o produto e notar que, pelo Lema 3.2, A e comutam, j´a que A e



A2 kA2 k

comutam.

q



A2 kA2 k

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

190/1304

Assim, vemos de (3.56) que uma matriz Hermitiana A ´e combina¸ca˜o linear de at´e duas unit´arias, provando a primeira parte da Proposi¸ca˜o 3.20. Para provar a segunda parte, basta notar que se M ∈ Mat ( , n) ´e uma matriz qualquer, podemos escrever     M + M∗ M − M∗ M = +i . 2 2i Ambas as matrizes entre parˆenteses s˜ao Hermitianas e, portanto, podem cada uma ser escritas como combina¸ca˜o linear de at´e duas unit´arias, totalizando at´e quatro unit´arias para M .

3.6

Matrizes Triangulares

Uma matriz S ∈ Mat ( , n) ´e dita ser uma matriz triangular superior se forem nulos os elementos abaixo da diagonal principal, ou seja, se Sij = 0 sempre que i > j. Note que esses n˜ao precisam ser necessariamente os u ´ nicos elementos nulos de S. Uma matriz I ∈ Mat ( , n) ´e dita ser uma matriz triangular inferior se forem nulos os elementos acima da diagonal principal, ou seja, se Iij = 0 sempre que i < j. Note que esses n˜ao precisam ser necessariamente os u ´ nicos elementos nulos de I. Proposi¸ c˜ ao 3.21 Matrizes triangulares superiores possuem as seguintes propriedades: 1. A matriz identidade

´e uma matriz triangular superior.

2. O produto de duas matrizes triangulares superiores ´e novamente uma matriz triangular superior. 3. O determinante de uma matriz triangular superior ´e o produto dos elementos da sua diagonal. Assim, uma matriz triangular superior ´e invert´ıvel se e somente se n˜ ao tiver zeros na diagonal. 4. Se uma matriz triangular superior ´e invert´ıvel, sua inversa ´e novamente uma matriz triangular superior. As afirma¸co ˜es acima permanecem verdadeiras trocando “matriz triangular superior” por “matriz triangular inferior”. 2 Prova. Os trˆes primeiros itens s˜ao elementares. Para provar o item 4, usa-se a regra de Laplace, express˜ao (3.8), p´agina 145. Como ´e f´acil de se ver, Cof(S)ji = 0 se i > j. Logo, S −1 ´e triangular superior, se existir. As propriedades acima atestam que o conjunto das matrizes n × n triangulares superiores invert´ıveis forma um grupo, denominado por alguns autores Grupo de Borel10 de ordem n e denotado por GBn ( ). O seguinte resultado sobre matrizes triangulares superiores ser´a usado diversas vezes adiante. 10

Armand Borel (1923-2003).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

191/1304

Lema 3.3 Uma matriz triangular superior S ∈ Mat ( , n) ´e normal (ou seja, satisfaz SS ∗ = S ∗ S) se e somente se for diagonal. 2 Prova. Se S ´e diagonal, S ´e obviamente normal pois S ∗ ´e tamb´em diagonal e matrizes diagonais sempre comutam entre si. Provaremos a rec´ıproca, o que ser´a feito por indu¸ca˜o. Para n = 1 n˜ao h´a o que provar. Se n = 2, S ´e da forma S = ( a0 cb ), com a, b, c ∈ . A condi¸ca˜o SS ∗ = S ∗ S significa  2   2  |a| + |b|2 bc |a| ba = , cb |c|2 ab |b|2 + |c|2 o que implica b = 0, provando que S ´e diagonal. Procedemos agora por indu¸ca˜o, supondo n > 2 e que o lema seja v´alido para matrizes (n − 1) × (n − 1) triangulares superiores normais. Se S ∈ Mat ( , n) ´e triangular superior, S ´e da forma     b 0   1 a bT  ..   ..  S= , sendo a ∈ , b =  .  , = . , C 0 bn−1 ambas b e com n − 1 linhas, sendo C uma matriz (n − 1) × (n − 1) triangular superior. A condi¸ca˜o SS ∗ = S ∗ S significa  2    2 abT |a| |a| + bT b bT C ∗ , = ab B + C ∗ C CC ∗ Cb

sendo B a matriz cujos elementos s˜ao Bij = bi bj . Disso extra´ımos que bT b = 0, ou seja, |b1 |2 + · · · + |bn−1 |2 = 0 e, portanto, b = . Com isso, ficamos com CC ∗ = C ∗ C, ou seja, C ´e normal. Como C ´e triangular superior ent˜ao, pela hip´otese indutiva, C ´e diagonal. Isso, mais o fato provado que b ´e nulo, implica que S ´e diagonal, provando o lema.

3.7

O Teorema de Decomposi¸ c˜ ao de Jordan e a Forma Canˆ onica de Matrizes

Nas se¸co˜es anteriores demonstramos condi¸co˜es que permitem diagonalizar certas matrizes. Nem todas as matrizes, por´em, podem ser diagonalizadas. Podemos nos perguntar, no entanto, qu˜ao pr´oximo podemos chegar de uma matriz diagonal. Mostraremos nesta se¸ca˜o que toda matriz A pode ser levada (por uma transforma¸ca˜o de similaridade) a` uma forma pr´oxima a` diagonal, denominada forma canˆ onica de Jordan 11 . Resumidamente (a afirma¸ca˜o precisa ser´a apresentada mais adiante), mostraremos que existe uma matriz P tal que 11

Marie Ennemond Camille Jordan (1838-1922). A forma canˆ onica de matrizes foi originalmente descoberta por Weierstrass (Karl Theodor Wilhelm Weierstrass (1815-1897)) e redescoberta por Jordan em 1870.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

192/1304

P −1 AP tem a seguinte forma: 

λ1 γ 1 0 0  0 λ2 γ2 0   0 0 λ 3 γ3    0 0 0 λ4 . .. .. ..  .. . . .  0 0 0 0 0 0 0 0

onde λ1 , . . . , λn s˜ao os autovalores de A e onde diagonal  λ1 0 0 0  0 λ2 0 0   0 0 λ3 0    0 0 0 λ4 . .. .. ..  .. . . .  0 0 0 0 0 0 0 0 e a matriz supra-diagonal

comutam entre si.



0 γ1 0 0 0 0 γ 2 0  0 0 0 γ 3   0 0 0 0 . . . .  .. .. .. ..  0 0 0 0 0 0 0 0

 ··· 0 0 ··· 0 0   ··· 0 0   ..  . 0 0 , ..  .. .. . . .   · · · λn−1 γn−1  ··· 0 λn

(3.57)

 ··· 0 0 ··· 0 0  ··· 0 0  ..  . 0 0 , ..  .. .. . . .  · · · λn−1 0  ··· 0 λn

(3.58)

os γi valem 1 ou 0, mas que forma que a matriz

··· ··· ··· .. . .. . ··· ···

0 0 0

0 0 0



     0 0  , ..  .. . .   0 γn−1  0 0

(3.59)

O resultado central que provaremos, e do qual as afirmativas feitas acima seguir˜ao, diz que toda matriz A pode ser levada por uma transforma¸ca˜o do tipo P −1 AP a uma matriz da forma D + N , onde D ´e diagonal e N ´e nilpotente (ou seja, tal que N q = 0 para algum q) e tais que D e N comutam: DN = N D. Essa ´e a afirmativa principal do c´elebre “Teorema da Decomposi¸ca˜o de Jordan”, que demonstraremos nas p´aginas que seguem. Esse Teorema da Decomposi¸ca˜o de Jordan generaliza os teoremas sobre diagonalizabilidade de matrizes: para matrizes diagonaliz´aveis tem-se simplesmente N = 0 para um P conveniente. Antes de nos dedicarmos a` demonstra¸ca˜o desses fatos precisaremos de alguma prepara¸ca˜o.

3.7.1

Resultados Preparat´ orios

• Somas Diretas de Sub-Espa¸ cos

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

193/1304

Seja V um espa¸co vetorial e V1 e V2 dois de seus sub-espa¸cos. Dizemos que V ´e a soma direta de V1 e V2 se todo vetor v de V puder ser escrito de modo u ´ nico da forma v = v1 + v2 com v1 ∈ V1 e v2 ∈ V2 . Se V ´e a soma direta de V1 e V2 escrevemos V = V1 ⊕ V2 .

• Sub-espa¸ cos Invariantes Um subespa¸co E de

n

´e dito ser invariante pela a¸ca ˜o de uma matriz A, se Av ∈ E para todo v ∈ E.

Se V = V1 ⊕ V2 e tanto V1 quanto V2 s˜ao invariantes pela a¸ca˜o de A, escrevemos A = A1 ⊕ A2 onde Ai ´e A restrita a Vi . Se escolhermos uma base em V da forma {v1 , . . . , vm , vm+1 , . . . , vn }, onde {v1 , . . . , vm } ´e uma base em V1 e {vm+1 , . . . , vn } ´e uma base em V2 , ent˜ao nessa base A ter´a a forma   A1 m, n−m . (3.60) A = A2 n−m, m onde A1 ∈ Mat ( , m) e A2 ∈ Mat ( , n − m). E. 3.24 Exerc´ıcio. Justifique a forma (3.60).

6

A representa¸ca˜o (3.60) ´e dita ser uma representa¸ca ˜o em blocos diagonais de A, os blocos sendo as sub-matrizes A1 e A2 . Um fato relevante que decorre imediatamente de (3.60) e da Proposi¸ca˜o 3.1, p´agina 146, e que usaremos freq¨ uentemente adiante, ´e que se A = A1 ⊕ A2 ent˜ao det(A) = det(A1 ) det(A2 ) . • Operadores Nilpotentes Seja V um espa¸co vetorial e N : V → V um operador linear agindo em V . O operador N ´e dito ser um operador nilpotente se existir um inteiro positivo q tal que N q = 0. O menor q para o qual N q = 0 ´e dito ser o ´ındice de N . Vamos a alguns exemplos.

´e uma matriz nilpotente de ´ındice 3.



 0 1 0 N = 0 0 1 0 0 0

E. 3.25 Exerc´ıcio. Verifique.

6 

 0 a c N = 0 0 b  0 0 0

com a 6= 0 e b 6= 0 ´e uma matriz nilpotente de ´ındice 3.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

E. 3.26 Exerc´ıcio. Verifique.

194/1304

6 

 0 0 0 N =  0 0 1 0 0 0

e

s˜ao matrizes nilpotentes de ´ındice 2.



 0 1 0 N =  0 0 0 0 0 0

E. 3.27 Exerc´ıcio. Verifique.

6

O seguinte fato sobre os autovalores de operadores nilpotentes ser´a usado adiante. Proposi¸ c˜ ao 3.22 Se N ∈ Mat ( , n) ´e nilpotente ent˜ ao seus autovalores s˜ ao todos nulos. Isso implica n que seu polinˆ omio caracter´ıstico ´e qN (x) = x , x ∈ . Se o ´ındice de N ´e q ent˜ ao o polinˆ omio m´ınimo de N ´e mN (x) = xq , x ∈ . 2 No Corol´ario 3.3, p´agina 200, demonstraremos que uma matriz ´e nilpotente se e somente se seus autovalores forem todos nulos. Prova da Proposi¸c˜ao 3.22. Se N = 0 o ´ındice ´e q = 1 e tudo ´e trivial. Seja N 6= 0 com ´ındice q > 1. Seja v 6= 0 um autovetor de N com autovalor λ: N v = λv. Isso diz que 0 = N q v = λq v. Logo λq = 0 ´ claro ent˜ao que qN (x) = xn . Que o polinˆomio m´ınimo ´e mN (x) = xq segue e, obviamente, λ = 0. E do fato que mN (x) deve ser um divisor de qn (x) (isso segue do Teorema 3.1 junto com o Teorema de Hamilton-Cayley, Teorema 3.2), p´agina 158). Logo mN (x) ´e da forma xk para algum k ≤ n. Mas o menor k tal que mN (N ) = N k = 0 ´e, por defini¸ca˜o, igual a q. Isso completa a prova. Mais sobre matrizes nilpotentes ser´a estudado na Se¸ca˜o 3.7.3 onde, em particular, discutiremos a chamada forma canˆ onica de matrizes nilpotentes. • O N´ ucleo e a Imagem de um Operador Linear Seja V um espa¸co vetorial e A : V → V um operador linear agindo em V .

O n´ ucleo de A ´e definido como o conjunto de todos os vetores que s˜ao anulados por A: N(A) = {x ∈ V | Ax = 0} .

A imagem de A ´e definida por R(A) = {x ∈ V | ∃ y ∈ V tal que x = Ay} . Afirmamos que N(A) e R(A) s˜ao dois sub-espa¸cos de V . Note-se primeiramente que 0 ∈ N(A) e 0 ∈ R(A) (por que?). Fora isso, se x e y ∈ N(A) ent˜ao, para quaisquer escalares α e β, A(αx + βy) = αAx + βAy = 0 ,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

195/1304

provando que combina¸co˜es lineares αx+βx0 tamb´em pertencem a N(A). Analogamente se x e x0 ∈ R(A) ent˜ao existem y e y 0 ∈ V com x = Ay, x0 = Ay 0 . Logo αx + βx0 = A(αy + βy 0 ) , provando que combina¸co˜es lineares αx + βy tamb´em pertencem a R(A). Para um operador A fixado, e k ∈ 

, vamos definir Nk = N(Ak )

e Rk = R(Ak ) . Esses sub-espa¸cos Nk e Rk s˜ao invariantes por A. De fato, se x ∈ Nk , ent˜ao Ak (Ax) = A(Ak x) = A0 = 0, mostrando que Ax ∈ Nk . Analogamente, se x ∈ Rk ent˜ao x = Ak y para algum vetor y. Logo, Ax = A(Ak y) = Ak (Ay), mostrando que Ax ∈ Rk . Afirmamos que

e que

Nk ⊂ Nk+1

(3.61)

Rk ⊃ Rk+1 .

As demonstra¸co˜es dessas afirmativas s˜ao quase banais. Se x ∈ Nk ent˜ao Ak x = 0. Isso obviamente implica Ak+1 x = 0. Logo x ∈ Nk+1 e, portanto, Nk ⊂ Nk+1 . Analogamente, se x ∈ Rk+1 ent˜ao existe y tal que x = Ak+1 y. Logo x = Ak (Ay), o que diz que x ∈ Rk . Portanto Rk+1 ⊂ Rk . Isso diz que os conjuntos Nk formam uma cadeia crescente de conjuntos: {0} ⊂ N1 ⊂ N2 ⊂ · · · ⊂ Nk ⊂ · · · ⊂ V ,

(3.62)

e os Rk formam uma cadeia decrescente de conjuntos: V ⊃ R1 ⊃ R2 ⊃ · · · ⊃ Rk ⊃ · · · ⊃ {0} .

(3.63)

Consideremos a cadeia crescente (3.62). Como os conjuntos Nk s˜ao sub-espa¸cos de V , ´e claro que a cadeia n˜ao pode ser estritamente crescente se V for um espa¸co de dimens˜ao finita, ou seja, deve haver um inteiro positivo p tal que Np = Np+1 . Seja p o menor n´ umero inteiro para o qual isso acontece. Afirmamos que para todo k ≥ 1 vale Np = Np+k .

Vamos provar isso. Se x ∈ Np+k ent˜ao Ap+k x = 0, ou seja, Ap+1 (Ak−1 x) = 0. Logo, Ak−1 x ∈ Np+1 . Dado que Np = Np+1 , isso diz que Ak−1 x ∈ Np , ou seja, Ap (Ak−1 x) = 0. Isso, por sua vez, afirma que x ∈ Np+k−1 . O que fizemos ent˜ao foi partir de x ∈ Np+k e concluir que x ∈ Np+k−1 . Se repetirmos a argumenta¸ca˜o k vezes concluiremos que x ∈ Np . Logo, Np+k ⊂ Np . Por (3.61) tem-se, por´em, que Np ⊂ Np+k e, assim, Np+k = Np . Assim, a cadeia (3.62) tem, no caso de V ter dimens˜ao finita, a forma

{0} ⊂ N1 ⊂ N2 ⊂ · · · ⊂ Np = Np+1 = · · · = Np+k = · · · ⊂ V .

(3.64)

Como dissemos, p ser´a daqui por diante o menor inteiro para o qual Np = Np+1 . O lema e o teorema que seguem tˆem grande importˆancia na demonstra¸ca˜o do Teorema de Decomposi¸ca˜o de Jordan.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

196/1304

Lema 3.4 Com as defini¸co ˜es acima, Np ∩ Rp = {0}, ou seja, os sub-espa¸cos Np e Rp tˆem em comum apenas o vetor nulo. 2 Demonstra¸c˜ao. Seja x tal que x ∈ Np e x ∈ Rp . Isso significa que Ap x = 0 e que existe y tal que x = Ap y. Logo, A2p y = Ap x = 0, ou seja, y ∈ N2p . Pela defini¸ca˜o de p tem-se que N2p = Np . Assim, y ∈ Np . Logo Ap y = 0. Mas, pela pr´opria defini¸ca˜o de y valia que Ap y = x. Logo x = 0. Esse lema tem a seguinte conseq¨ uˆencia importante. Teorema 3.15 Com as defini¸co ˜es acima vale que V = Np ⊕ Rp , ou seja, cada x ∈ V pode ser escrito de modo u ´nico na forma x = xn + xr , onde xn ∈ Np e xr ∈ Rp . 2 Demonstra¸c˜ao. Seja m a dimens˜ao de Np e seja {u1 , . . . , um } uma base em Np . Vamos estender essa base, incluindo vetores {vm+1 , . . . , vn } de modo que {u1 , . . . , um , vm+1 , . . . , vn } seja uma base em V . Afirmamos que {Ap vm+1 , . . . , Ap vn } ´e uma base em Rp . Seja x ∈ Rp e seja y ∈ V tal que x = Ap y. Como todo vetor de V , y pode ser escrito como combina¸ca˜o linear de elementos da base {u1 , . . . , um , vm+1 , . . . , vn }: n m X X α i ui + αi v i . y = i=m+1

i=1

Logo,

x =

m X

n X

p

α i A ui +

p

αi A v i =

i=m+1

i=1

n X

αi A p v i .

(3.65)

i=m+1

Os vetores {Ap vm+1 , . . . , Ap vn } s˜ao linearmente independentes. Isso se mostra com o seguinte argumento. Se existirem escalares βm+1 , . . . , βn tais que n X

βi A p v i = 0 ,

i=m+1

ent˜ao ter´ıamos

n X

Ap

βi v i

i=m+1

ou seja,

n X

i=m+1

!

= 0,

βi v i ∈ N p .

Isso implica que existem constantes γ1 , . . . , γm tais que n X

i=m+1

βi v i =

m X

γ i ui ,

i=1

pois os vetores {u1 , . . . , um } s˜ao uma base em Np . Ora, como {u1 , . . . , um , vm+1 , . . . , vn } s˜ao linearmente independentes, segue que os βi ’s e os γj ’s s˜ao todos nulos. Isso prova que {Ap vm+1 , . . . , Ap vn } s˜ao linearmente independentes e, portanto, por (3.65), formam uma base em Rp .

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

197/1304

Isso incidentalmente provou que a dimens˜ao de Rp ´e n − m. Temos, portanto, que dim (Np ) + dim (Rp ) = dim (V ) . Para i = m + 1, . . . , n defina-se ui = Ap vi . Afirmamos que o conjunto de vetores {u1 , . . . , um , um+1 , . . . , un } = {u1 , . . . , um , Ap vm+1 , . . . , Ap vn } ´e tamb´em linearmente independente e, portanto, forma uma base em V . Suponhamos que haja constantes escalares α1 , . . . , αn tais que ! n m n X X X 0 = α i ui = α i ui + A p αi v i . i=1

i=1

i=m+1

Isso implica, obviamente,

m X i=1

αi ui = −Ap

n X

αi v i

i=m+1

!

.

O lado esquerdo dessa igualdade ´e um elemento de Np (pois u1 , . . . , um s˜ao uma base em Np ), enquanto que o lado esquerdo ´e obviamente um elemento da imagem de Ap , ou seja, de Rp . Contudo, j´a vimos (Lema 3.4) que o u ´ nico vetor que Np e Rp tˆem em comum ´e o vetor nulo. Logo, m X

α i ui = 0

(3.66)

i=1

e

n X

αi A p v i = 0 .

(3.67)

i=m+1

A rela¸ca˜o (3.66) implica α1 = · · · = αm = 0, pois {u1 , . . . , um } ´e uma base em Np . A rela¸ca˜o (3.67) implica αm+1 = · · · = αn = 0, pois {Ap v1 , . . . , Ap vm } ´e uma base em Rp . Assim, todos os αi ’s s˜ao nulos, provando que {u1 , . . . , um , um+1 , . . . , un } = {u1 , . . . , um , Ap vm+1 , . . . , Ap vn } ´e um conjunto de n vetores linearmente independentes. Conseq¨ uentemente, todo x ∈ V pode ser escrito na forma x =

n X i=1

α i ui =

m X

α i ui + A p

i=1

| {z } xn ∈Np

|

n X

i=m+1

{z

xr ∈Rp

αi v i

!

.

}

Provar a unicidade dessa decomposi¸ca˜o fica como exerc´ıcio. Isso completa a demonstra¸ca˜o. Uma das coisas que o teorema que acabamos de demonstrar diz ´e que, dado um operador A, o espa¸co V pode ser decomposto em uma soma direta de dois sub-espa¸cos, invariantes por A: um onde A ´e nilpotente, Np , e outro onde A ´e invert´ıvel, Rp . A ´e nilpotente em Np pois Ap x = 0 para todo elemento x de Np . A ´e invert´ıvel em Rp pois se x ∈ Rp ´e tal que Ax = 0 isso implica x ∈ N1 ⊂ Np . Mas x s´o pode pertencer a Np e a Rp se for nulo. Logo, em Rp , Ax = 0 se e somente se x = 0, provando que A ´e invert´ıvel12 . Para referˆencia futura formulemos essa afirmativa na forma de um teorema: 12

Lembre-se que esse argumento s´ o funciona em espa¸cos vetoriais V que tenham dimens˜ ao finita, o que estamos supondo aqui.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

198/1304

ao ´e Teorema 3.16 Se A ´e um operador linear n˜ ao-nulo agindo em um espa¸co vetorial V = n ent˜ poss´ıvel decompor V em dois sub-espa¸cos invariantes por A, V = S ⊕ T, de forma que A restrito a S ´e nilpotente, enquanto que A restrito a T ´e invert´ıvel. 2 Esse ser´a o teorema b´asico do qual extrairemos a demonstra¸ca˜o do Teorema de Decomposi¸ca˜o de Jordan.

3.7.2

O Teorema da Decomposi¸ c˜ ao de Jordan

Chegamos agora ao resultado mais importante desta se¸ca˜o, o Teorema da Decomposi¸ca˜o de Jordan 13 , um importante teorema estrutural sobre matrizes de importˆancia em v´arios campos, por exemplo na teoria das equa¸co˜es diferenciais ordin´arias. Para tais aplica¸co˜es, vide Cap´ıtulo 7, p´agina 306. O Teorema da Decomposi¸ca˜o de Jordan tamb´em tem certa relevˆancia na Teoria de Grupos, e o usaremos para provar que toda matriz n × n complexa invert´ıvel (ou seja, todo elemento do grupo GL( , n)) pode ser escrita como exponencial de outra matriz (Proposi¸ca˜o 4.11, p´agina 236). No Cap´ıtulo 4 usaremos o Teorema da Decomposi¸ca˜o de Jordan para provar a identidade u ´ til det(e A ) = eTr(A) , v´alida para qualquer matrix n × n real ou complexa. (Proposi¸ca˜o 4.7, p´agina 234). • Enunciado e Demonstra¸ c˜ ao do Teorema da Decomposi¸ c˜ ao de Jordan Teorema 3.17 (Teorema da Decomposi¸ c˜ ao de Jordan) Seja A um operador linear agindo no ao existem r espa¸co V = n e seja {α1 , . . . , αr } o conjunto de seus autovalores distintos. Ent˜ sub-espa¸cos S1 , . . . , Sr tais que V = S1 ⊕ . . . ⊕ Sr e tais que cada Si ´e invariante por A. Ou seja, A = A1 ⊕ . . . ⊕ Ar , onde Ai ´e A restrita a Si . Fora isso, cada Ai , ´e da forma Ai = αi i + Ni , onde i ´e a matriz identidade em Si e onde Ni ´e nilpotente. Por fim, a dimens˜ ao si de cada subespa¸co Si ´e igual a ` multiplicidade alg´ebrica do autovalor αi . 2 Demonstra¸c˜ao. Seja {α1 , . . . , αr } o conjunto dos autovalores distintos de A e seja ni a multiplicidade alg´ebrica do autovalor αi . Seja A1 = A − α1 . Pelo Teorema 3.16, p´agina 198, V pode ser escrito como V = S1 ⊕ T1 , onde S1 e T1 s˜ao invariantes por A1 , sendo A1 nilpotente em S1 e invert´ıvel em T1 . Assim, A1 ´e da forma A1 = N1 ⊕ M1 com N1 nilpotente e M1 invert´ıvel. Logo A = α1 + A1 = (α1

S1

+ N1 ) ⊕ (α1

T1

+ M1 ) ,

(3.68)

onde S1 ´e a matriz identidade em S1 etc. Vamos mostrar que a dimens˜ao de S1 ´e igual a` multiplicidade alg´ebrica de α1 . Por (3.68) o polinˆomio caracter´ıstico de A ´e qA (λ) = det(λ − A) = det((λ − α1 )

S1

− N1 ) det((λ − α1 )

T1

− M1 ) .

Se qN1 denota o polinˆomio caracter´ıstico de N1 , tem-se det((λ − α1 ) 13

S1

− N1 ) = qN1 (λ − α1 ) = (λ − α1 )s1 ,

Marie Ennemond Camille Jordan (1838-1922). A forma canˆ onica de matrizes (que ser´ a discutida mais adiante) foi originalmente descoberta por Weierstrass (Karl Theodor Wilhelm Weierstrass (1815-1897)) e redescoberta por Jordan em 1870.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

199/1304

onde, na u ´ ltima igualdade, usamos a Proposi¸ca˜o 3.22, p´agina 194, sobre a forma do polinˆomio caracter´ıstico de uma matriz nilpotente. Da´ı, segue que qA (λ) = (λ − α1 )s1 qM1 (λ − α1 ) , sendo qM1 o polinˆomio caracter´ıstico de M1 . Como M1 ´e invert´ıvel, M1 n˜ao tem o zero como autovalor. Logo, qM1 (0) 6= 0. Portanto s1 ´e igual a` multiplicidade de α1 como raiz de qA , ou seja, ´e igual a n1 , a multiplicidade alg´ebrica de α1 . A id´eia agora ´e prosseguir decompondo agora o operador α1 mesma maneira como fizermos acima com A. Seja A0 = α1 A − α 2 T1 . 0

T1

T1

+ M1 que aparece em (3.68) da

+ M1 e que age em T1 , que ´e um espa¸co de dimens˜ao n − n1 . Definimos A2 =

Evocando novamente o Teorema 3.16, p´agina 198, T1 pode ser escrito como T1 = S2 ⊕ T2 , onde S2 e T2 s˜ao invariantes por A2 , sendo A2 nilpotente em S2 e invert´ıvel em T2 . Assim, V = S1 ⊕ S2 ⊕ T2 . Agindo em T1 = S2 ⊕ T2 , A2 ´e da forma A2 = N2 ⊕ M2 com N2 nilpotente e M2 invert´ıvel. Logo A0 = α 2

T1

+ A2 = (α2

S2

+ N2 ) ⊕ (α2

T2

+ M2 ) .

(3.69)

Vamos, como acima, mostrar que a dimens˜ao de S2 ´e igual a` multiplicidade alg´ebrica de α2 . Pela defini¸ca˜o, A = (α1

S1

+ N1 ) ⊕ A0 = (α1

S1

+ N1 ) ⊕ (α2

S2

+ N2 ) ⊕ (α2

T2

+ M2 ) .

Logo, qA (λ) = det ((λ − α1 )

S1

− N1 ) det ((λ − α2 )

Portanto, pelos mesmos argumentos usados acima,

S2

− N2 ) det ((λ − α2 )

T2

− M2 ) .

qA (λ) = (λ − α1 )n1 (λ − α2 )s2 qM2 (λ − α2 ) . Como M2 ´e invert´ıvel, M2 n˜ao tem autovalor zero e, assim, qM2 (0) 6= 0. Logo, s2 = n2 . T2 ´e assim um sub-espa¸co de dimens˜ao n − n1 − n2 .

Prosseguindo nas mesmas linhas, ap´os r passos chegaremos a um sub-espa¸co Tr de dimens˜ao n − n1 − · · · − nr = 0 (por (3.13), p´agina 148). A´ı, teremos V = S1 ⊕ · · · ⊕ Sr , onde cada Si tem dimens˜ao ni e A = (α1 S1 + N1 ) ⊕ · · · ⊕ (αr Sr + Nr ) , onde os Ni ’s s˜ao todos nilpotentes. Isso completa a demonstra¸ca˜o.

Um corol´ario importante do Teorema de Decomposi¸ca˜o de Jordan ´e o seguinte: Teorema 3.18 Para toda matriz A ∈ Mat ( , n) existe uma matriz invert´ıvel P ∈ Mat ( , n) tal que P −1 AP = D + N , onde D ´e uma matriz diagonal formada pelos autovalores de A e N ´e uma matriz nilpotente e de tal forma que D e N comutam: DN = N D. Conseq¨ uentemente, toda matriz A ∈ Mat ( , n) pode ser escrita na forma A = A d + An com Ad An = An Ad , sendo Ad diagonaliz´ avel e An nilpotente, a saber, Ad = P DP −1 e An = P N P −1 , com D e N dados acima. 2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

200/1304

Demonstra¸c˜ao do Teorema 3.18. O Teorema 3.17 est´a dizendo que, numa base conveniente, A tem a forma de blocos diagonais   α1 s 1 + N 1 0 ··· 0       A1 0 · · · 0   0 α 2 s2 + N 2 · · · 0  0 A2 · · · 0        (3.70) A =  ..  , .. . . ..  =     . . .  .. .. .. . . .   . . . .   0 0 · · · Ar   0 0 · · · α r sr + N r

ou seja,

A = D+N , onde

e



 α1 s 1 0 ··· 0    0  α · · · 0 2 s2   D =  .. . . , α1 , . . . , αr , . . . , αr  .. ..  = diag |α1 , .{z . . } | {z }  . . . .  s1 vezes sr vezes 0 0 · · · α r sr 

 N1 0 · · · 0  0 N2 · · · 0    N =  .. .. . . ..  .  . . .  . 0 0 · · · Nr

(3.71)

Acima si ´e a dimens˜ao do sub-espa¸co Si . ´ f´acil de se ver que N ´e uma matriz nilpotente, pois se o ki ´e o ´ındice de Ni (ou seja, ki ´e o menor E inteiro positivo para o qual Niki = 0), ent˜ao para k := max (k1 , . . . , kr ) tem-se   (N1 )k 0 ··· 0  0 (N2 )k · · · 0    k N =  .. ..  = 0 . .. . .  . . .  . 0 0 · · · (Nr )k Em verdade, k = max (k1 , . . . , kr ) ´e o ´ındice de N (por que?). Por fim, como cada Ni comuta com αi tra¸ca˜o.

si ,

fica claro que D e N comutam. Isso completa a demons-

Corol´ ario 3.3 Uma matriz M ∈ Mat ( , n) ´e nilpotente se e somente se todos os seus autovalores forem nulos. 2 Prova. A Proposi¸ca˜o 3.22, p´agina 194, afirma que se M ´e nilpotente todos os seus autovalores s˜ao nulos. O Teorema 3.18, p´agina 199, afirma que se os autovalores de M s˜ao nulos, ent˜ao existe P tal que P −1 M P = N , nilpotente. Isso implica que M ´e nilpotente.

JCABarata. Curso de F´ısica-Matem´ atica

3.7.3

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

201/1304

Matrizes Nilpotentes e sua Representa¸ c˜ ao Canˆ onica

Os teoremas que estudamos acima nesta se¸ca˜o revelam a importˆancia de matrizes nilpotentes. Um fato relevante ´e que elas podem ser representadas de uma forma especial, denominada forma canˆonica, da qual traremos logo abaixo. Antes, alguma prepara¸ca˜o se faz necess´aria. Seja N ∈ Mat ( , n) uma matriz nilpotente de ´ındice q, ou seja, N q = 0, mas N q−1 6= 0. Para uso futuro, provemos o seguinte lema: Lema 3.5 Seja N uma matriz nilpotente de ´ındice q. Est˜ ao existe um vetor v 6= 0 tal que os q vetores v,

N v,

N 2 v,

...,

N q−1 v ,

(3.72)

s˜ ao linearmente independentes. Fora isso, o subespa¸co q-dimensional J v, q := hv, N v, N 2 v, . . . , N q−1 vi de V gerado por esses q vetores ´e invariante por N . 2 Prova. Se q = 1, ent˜ao N = 0 e n˜ao h´a nada a provar, pois a afirma¸ca˜o ´e trivialmente verdadeira para qualquer v 6= 0. Seja ent˜ao q > 1 (em cujo caso N 6= 0, trivialmente). Sabemos, por hip´otese, que a matriz N q−1 ´e n˜ao-nula. Isso significa que existe pelo menos um vetor v 6= 0 tal que N q−1 v 6= 0. ´ imediato que os vetores N v, N 2 v, . . . , N q−1 v s˜ao todos n˜ao-nulos pois, Fixemos um tal vetor. E se tiv´essemos N j v = 0 para algum 1 ≤ j < q − 1, ent˜ao, aplicando-se N q−1−j a` esquerda, ter´ıamos N q−1 v = 0, uma contradi¸ca˜o. Sejam agora α1 , . . . , αq escalares tais que α1 v + α2 N v + α3 N 2 v + · · · + αq N q−1 v = 0 .

(3.73)

Aplicando-se N q−1 nessa igualdade e lembrando que N q = 0, conclu´ımos que α1 N q−1 v = 0. Como N q−1 v 6= 0, segue que α1 = 0 e, com isso, (3.73) fica α2 N v + α3 N 2 v + · · · + αq N q−1 v = 0 .

(3.74)

Aplicando agora N q−2 nessa igualdade conclu´ımos que α2 = 0. Prosseguindo, conclu´ımos depois de q passos que todos os escalares αj s˜ao nulos. Isso prova que os q vetores de (3.72) s˜ao linearmente independentes. Que o subespa¸co Jv, q definido acima ´e invariante por N ´e evidente pois, para quaisquer escalares β1 , . . . , βq , tem-se  N β1 v + β2 N v + · · · + βq N q−1 v = β1 N v + β2 N 2 v + · · · + βq−1 N q−1 v ∈ Jv, q . O seguinte teorema ´e central para o que segue. Teorema 3.19 Se N ´e uma matriz nilpotente de ´ındice q agindo em V e v um vetor com a propriedade que N q−1 v 6= 0, ent˜ ao existe um subespa¸co K de V tal que Jv, q ∩ K = {0}, tal que V = Jv, q ⊕ K e tal que K ´e tamb´em invariante por N . 2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

202/1304

Prova.14 A prova ´e feita por indu¸ca˜o em q. Note-se que se q = 1, ent˜ao N = 0 e a afirmativa ´e trivial, pois podemos tomar como v qualquer vetor n˜ao-nulo, Jv, q seria o subespa¸co gerado por esse v e K o subespa¸co complementar a v, que ´e trivialmente invariante por N , pois N = 0. Vamos supor ent˜ao que a afirma¸ca˜o seja v´alida para matrizes nilpotentes de ´ındice q − 1 e provar que a mesma ´e v´alida para matrizes nilpotentes de ´ındice q. O que desejamos ´e construir um subespa¸co K com as propriedades desejadas, ou seja, tal que V = Jv, q ⊕ K, sendo K invariante por N .

Seja V0 = R(N ) o conjunto imagem de N . Sabemos que V0 ´e um subespa¸co de V e que ´e invariante por N . Fora isso, N ´e nilpotente de ´ındice q − 1 agindo em V0 (por que?) ´ claro que N q−2 v0 = N q−1 v 6= 0. Assim, pelo Lema 3.72, o subespa¸co Seja v0 = N v ∈ V0 . E (q − 1)-dimensional Jv0 , q−1 = hv0 , N v0 , . . . , N q−2 v0 i = hN v, N 2 v, . . . , N q−1 vi = JN v, q−1 , que ´e um sub-espa¸co de V0 , ´e invariante por N e, da hip´otese indutiva, conclu´ımos que existe um subespa¸co K0 de V0 que ´e invariante por N tal que JN v, q−1 ∩ K0 = {0} e tal que V0 = JN v, q−1 ⊕ K0 . Seja agora K1 := {x ∈ V | N x ∈ K0 }. Vamos provar a seguinte afirma¸ca˜o:

I. Todo vetor x de V pode ser escrito na forma x = y + z onde y ∈ Jv, q e z ∈ K1 .

Para provar isso, notemos que para qualquer x ∈ V vale certamente que N x ∈ V0 . Portanto, como pela hip´otese indutiva V0 = JN v, q−1 ⊕ K0 , podemos escrever N x = y 0 + z 0 , com y 0 ∈ JN v, q−1 e z 0 ∈ K0 . Como y 0 ∈ JN v, q−1 , y 0 ´e da forma de uma combina¸ca˜o linear y 0 = α1 N v + · · · + αq−1 N q−1 v = N y, onde y := α1 v + α2 N v + · · · + αq−1 N q−2 v ´e um elemento de Jv, q . Logo, z 0 = N (x − y). Como z 0 ∈ K0 , segue que z := x − y ∈ K1 . Assim, x = y + z, com y ∈ Jv, q e z ∈ K1 . Isso provou I.

Note que a afirma¸ca˜o feita em I n˜ao significa que V = Jv, q ⊕ K1 , pois os sub-espa¸cos Jv, q e K1 podem ter uma intersec¸ca˜o n˜ao-trivial. Tem-se, por´em, o seguinte: II. Jv, q ∩ K0 = {0}.

Provemos essa afirma¸ca˜o. Seja x ∈ Jv, q ∩ K0 . Como x ∈ Jv, q , x ´e da forma x = α1 v + α2 N v + · · · + αq N q−1 v. Logo N x = α1 N v + α2 N 2 v + · · · + αq−1 N q−1 v ∈ JN v, q−1 . Agora, como x ∈ K0 e, por hip´otese, K0 ´e invariante por N , segue que N x ∈ K0 . Logo, N x ∈ JN v, q−1 ∩ K0 . Todavia, mencionamos acima que JN v, q−1 ∩ K0 = {0}. Logo, N x = 0, ou seja, 0 = N x = α1 N v + α2 N 2 v + · · · + αq−1 N q−1 v. Como os vetores N v, . . . , N q−1 v s˜ao linearmente independentes, conclu´ımos que α1 = · · · αq−1 = 0. Logo, x = αq N q−1 v. Isso significa que x ∈ JN v, q−1 . Demonstramos, ent˜ao, que se x ∈ Jv, q ∩ K0 ent˜ao x ∈ JN v, q−1 ∩ K0 mas, como JN v, q−1 ∩ K0 = {0}, segue que x = 0. Isso conclui a prova de II.

III. K0 e Jv, q ∩ K1 , s˜ao dois sub-espa¸cos disjuntos de K1 . ´ evidente que Jv, q ∩ K1 ´e subespa¸co de K1 . Como K0 ´e A demonstra¸ca˜o ´e muito simples. E invariante pela a¸ca˜o de N , segue que se x ∈ K0 ent˜ao N x ∈ K0 . Pela defini¸ca˜o, isso diz que x ∈ K1 e conclu´ımos que K0 ´e um subespa¸co e K1 . 14

Extra´ıda, com modifica¸co ˜es, de [54].

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

203/1304

Que K0 e Jv, q ∩ K1 s˜ao sub-espa¸cos disjuntos, segue do fato que II

K0 ∩ (Jv, q ∩ K1 ) = K1 ∩ (Jv, q ∩ K0 ) = K1 ∩ {0} = {0} . A afirma¸ca˜o III implica que K1 = (Jv, q ∩ K1 ) ⊕ K0 ⊕ K00 para algum subespa¸co K00 de K1 (n˜ao necessariamente u ´ nico). Seja agora K := K0 ⊕ K00 . Note que K1 = (Jv, q ∩ K1 ) ⊕ K e, portanto, (Jv, q ∩ K1 ) ∩ K = {0} .

(3.75)

Provaremos que esse K possui as propriedades desejadas, ou seja, que V = Jv, q ⊕K, sendo K invariante por N . Isso ´e feito em trˆes passos. 1. Jv, q e K s˜ao sub-espa¸cos disjuntos, ou seja, Jv, q ∩ K = {0}, pois, como K ⊂ K1 , segue que K = K ∩ K1 e, portanto, Jv, q ∩ K = Jv, q ∩ (K ∩ K1 ) = (Jv, q ∩ K1 ) ∩ K

(3.75)

=

{0} .

2. Jv, q ⊕K contem os vetores de Jv, q e de (Jv, q ∩K1 )⊕K = K1 . Por I, isso implica que Jv, q ⊕K = V . 3. K ´e invariante por N , pois o fato que K ⊂ K1 , implica, pela defini¸ca˜o de K1 , que N K ⊂ N K1 ⊂ K0 ⊂ K. A prova do Teorema 3.19 est´a completa A principal conseq¨ uˆencia do Teorema 3.19 ´e a seguinte. ao existem Proposi¸ c˜ ao 3.23 Seja N ∈ Mat ( , n) uma matriz nilpotente de ´ındice q. Ent˜ 1. um inteiro positivo r, com 1 ≤ r ≤ n, 2. r n´ umeros inteiros positivos n ≥ q1 ≥ q2 ≥ · · · ≥ qr ≥ 1, com q1 + · · · + qr = n, 3. r vetores v1 , . . . , vr satisfazendo N qj vj = 0 mas N qj −1 vj 6= 0, j = 1, . . . , r, tais que V = J v1 , q1 ⊕ · · · ⊕ J vr , qr . 2 Prova. Se q = 1 ent˜ao N = 0. Basta tomar r = n e escolher v1 , . . . , vn uma base qualquer em V . Os qj ’s s˜ao todos iguais a 1. Consideremos ent˜ao q > 1 com N 6= 0. Tomemos q1 = q. Pelo Teorema 3.19, existem um vetor v1 6= 0 e um subespa¸co K 1 , invariante por N tais que V = J v1 , q1 ⊕ K 1 .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

204/1304

Como K 1 ´e invariante por N , podemos tamb´em dizer que a matriz N ´e nilpotente quando restrita ´ claro a K 1 (j´a que ´e nilpotente em todo V ). Denotemos por q2 o ´ındice de N quando restrita a K 1 . E que q2 ≤ q = q1 .

Assim, podemos aplicar o Teorema 3.19 para a matriz N restrita a K 1 e concluir que existe v2 6= 0 em K 1 e um subespa¸co K 2 de K 1 , invariante por N , tais que K 1 = Jv2 , q2 ⊕ K 2 . Note que N q2 v2 = 0, pois v2 ∈ K 1 . Com isso, temos

V = J v1 , q1 ⊕ J v2 , q2 ⊕ K 2 .

Novamente K 2 ´e invariante por N e, como K 2 ´e um sub-espa¸co de K 1 . O ´ındice de N em K 2 ser´a q3 ≤ q 2 ≤ q 1 . O espa¸co V tem dimens˜ao finita. Assim, a prova se conclu´ı repetindo o procedimento acima um n´ umero finito r de vezes. Note que N qj vj = 0, pois N q1 v1 = 0, e vj ∈ K j−1 para todo j = 2, . . . , r. Pela constru¸ca˜o acima, ´e claro que q1 + · · · + qr = n, a dimens˜ao de V , e que os n vetores v1 , N v1 , . . . , N q1 −1 v1 , v2 , N v2 , . . . , N q2 −1 v2 , . . . , vr , N vr , . . . , N qr −1 vr s˜ao linearmente independentes e formam uma base em V . Vamos denot´a-los (na ordem em que aparecem acima) por b1 , . . . , bn . Note agora que, pela constru¸ca˜o, N bj = bj+1 , para j em cada um dos conjuntos {1, . . . , q1 − 1},

{1 + q1 , . . . , q1 + q2 − 1}, ...

{1 + q1 + q2 , . . . , q1 + q2 + q3 − 1} , {1 + q1 + · · · + qr−1 , . . . , q1 + · · · + qr − 1} , (3.76)

com l = 0, . . . , r − 1, sendo que N bj = 0 para todo j na forma q1 + · · · + ql , l = 1, . . . , r. ´ltimas afirma¸co˜es. E. 3.28 Exerc´ıcio impotante para compreender o que segue. Justifique as u

6

Isso significa que na base b1 , . . . , bn os elementos de matriz de N s˜ao todos nulos exceto aqueles na forma Nj, j+1 com j em algum dos conjuntos listados em (3.76), em cujo caso Nj, j+1 = 1. Pictoriamente, isso diz-nos que na base b1 , . . . , bn a matriz N assume uma forma genericamente ilustrada na Figura 3.1. Essa ´e a denominada forma canˆ onica da matriz nilpotente N ou representa¸ca ˜o canˆ onica da matriz nilpotente N , que descrevemos mais detalhadamente no que segue. Os elementos da diagonal principal s˜ao todos nulos. Os u ´ nicos elementos n˜ao-nulos da matriz podem estar localizados apenas na diagonal imediatamente acima da principal, ou seja, aquela diagonal formada por elementos de matriz do tipo Nj, j+1 com j = 1, . . . , n − 1. Chamaremos essa diagonal de primeira supra-diagonal. Os elementos da primeira supra-diagonal podem ser 0 ou 1, da forma seguinte: a primeira supra-diagonal possuir´a r fileiras. As primeiras r − 1 fileiras s˜ao formadas por q j elementos, j = 1, . . . , n − 1, sendo os primeiros qj − 1 elementos iguais a 1 e o u ´ ltimo igual a 0. A u ´ ltima fileira ter´a qr − 1 elementos iguais a 1. Assim, se qr = 1, o u ´ ltimo elemento da primeira supra-diagonal ser´a nulo, proveniente da (r − 1)-´esima fileira (essa ´e a u ´ nica forma de aparecer um zero no u ´ ltimo elemento da primeira supra-diagonal).

JCABarata. Curso de F´ısica-Matem´ atica

205/1304

(q − 1) vezes

1

}

0

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

0

1

0

(q − 1) vezes

}

1

1

2

1

0

N = 0

1 1

0

0

(q − 1) vezes r

1

}

0

1

0

Figura 3.1: Forma canˆonica t´ıpica de uma matriz nilpotente N . Os elementos da primeira supradiagonal podem valer 0 ou 1. Todos os demais elementos de matriz s˜ao nulos.

Note que zeros consecutivos podem ocorrer, se tivermos alguns qj ’s iguais a 1. Note tamb´em que os elementos da primeira supra-diagonal podem ser todos nulos (o que valer´a se r = n, em cujo caso q1 = · · · = rn = 1. Isso s´o pode ocorrer se N = 0 e, nesse caso, q = 1) ou todos iguais a 1 (o que valer´a se r = 1, em cujo caso q1 = n).

3.7.4

A Forma Canˆ onica de Matrizes

Finalizamos esta se¸ca˜o e nossa discuss˜ao sobre o Teorema da Decomposi¸ca˜o de Jordan e suas conseq¨ uˆencias reunindo o que descobrimos at´e aqui. Se A ∈ Mat ( , n) o Teorema 3.17, p´agina 198 ensinou-nos que numa base conveniente (ou seja,

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

por uma transforma¸ca˜o de similaridade P0−1 AP0 ), toda matriz A tem  α1 n1 + N 1 0     A1 0 · · · 0  0 α 2 n2 + N 2   0 A2 · · · 0     −1 P0 AP0 =  .. .  =  .. . .   . . ..  .. .. .  . .  0 0 · · · Ar  0 0

206/1304

a forma de blocos diagonais:  ··· 0    ··· 0   (3.77)  ,  .. ..  . .   · · · α r nr + N r

sendo α1 , . . . , αr os autovalores distintos de A. O j-´esimo bloco ´e de tamanho nj × nj , sendo que nj ´e a multiplicidade alg´ebrica do autovalor αj . As matrizes Nj s˜ao nilpotentes.

Cada matriz Nj pode ser levada a` sua forma canˆonica Njc (tal como explicado em (3.1) e no que se lhe segue) em uma base conveniente, ou seja, por uma transforma¸ca˜o de similaridade Pj−1 Nj Pj . Assim, definindo   P1 0 · · · 0  0 P2 · · · 0    P =  .. (3.78) .. . . ..  , . . . . 0 0 · · · Pr vemos que P −1 (P0−1 AP0 )P = (P0 P )−1 A(P0 P ), sendo que, por (3.77),  −1 0 P1 (α1 n1 + N1 ) P1    0 P2−1 (α2 n2 + N2 ) P1   P −1 (P0−1 AP0 )P =   .. ..  . .   0 0 

     =     

α1

n1

+ N1c

0

···

0

+ N2c · · ·

0

0 α2

n2

.. .

.. .

..

0

0

· · · αr

E. 3.29 Exerc´ıcio. Complete os detalhes.

.. .

. nr

+ Nrc

···

0

···

0

..

.. .

.

· · · Pr−1 (αr



      .    

nr



+ N r ) Pr

         

(3.79)

6

A matriz final de (3.79) ´e denominada forma canˆ onica da matriz A, ou forma canˆ onica de Jordan da matriz A. Como dissemos, toda matriz A assume essa forma numa certa base. Devido ao fato de todos as sub-matrizes nilpotentes Njc terem a forma canˆonica, os u ´ nicos elementos n˜ao-nulos da forma canˆonica da matriz A podem estar ou na diagonal principal (sendo estes os autovalores de A, cada

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

207/1304

um aparecendo em uma fileira de nj elementos), ou na primeira supra-diagonal, sendo que estes valem apenas 0 ou 1 e seguem as regras descritas acima. Isso ´e ilustrado na Figura 3.2, A Figura 3.2, mostra a forma canˆonica de uma matriz que possui 4 autovalores distintos α 1 , α2 , α3 e α4 . A primeira supra-diagonal ´e formada pela seq¨ uˆencia de n´ umeros γ11 , . . . , γ1a , 0, γ11 , . . . , γ1b , 0, γ11 , . . . , γ1c , 0, γ11 , . . . , γ1d ,

(3.80)

sendo que os γij assumem apenas os valores 0 ou 1, de acordo com as regras explicadas acima quando discutimos a forma canˆonica de matrizes nilpotentes. Todos os elementos fora da diagonal principal e da primeira supradiagonal s˜ao nulos. O primeiro bloco ´e de dimens˜ao (a + 1) × (a + 1), o segundo bloco ´e de dimens˜ao (b + 1) × (b + 1) etc., sendo a + 1 a multiplicidade alg´ebrica de α1 , b + 1 a multiplicidade alg´ebrica de α2 etc. ´ interessante notar que na primeira supra-diagonal, sempre ocorrem zeros nos pontos localizados E fora dos blocos, ou seja, nos pontos onde ocorrem transi¸co˜es entre dois autovalores distintos (indicados por setas na Figura 3.2). Esses s˜ao os zeros que ocorrem explicitamente na lista (3.80). Por fim, comentamos que a forma canˆonica n˜ao ´e exatamente u ´ nica, pois ´e poss´ıvel ainda fazer transforma¸co˜es de similaridade que permutem os blocos de Jordan da matriz. Al´em disso, dentro de cada sub-espa¸co invariante (onde cada bloco age) ´e poss´ıvel fazer certas permuta¸co˜es dos elementos da base, de modo a preservar a diagonal e permutar os γi ’s da primeira supradiagonal.

3.8

Algumas Representa¸ co ˜es Especiais de Matrizes

Nas se¸co˜es anteriores apresentamos algumas formas especiais de representar matrizes com determinadas caracter´ısticas, como aquelas expressas no Teorema Espectral e no Teorema de Jordan. Nesta se¸ca˜o apresentaremos outras representa¸co˜es, relevantes em certos contextos, como a decomposi¸ca˜o polar.

3.8.1

A Decomposi¸ c˜ ao Polar de Matrizes

´ bem conhecido o fato de que todo n´ E z pode ser escrito na forma polar z = |z|e iθ , onde √ umeroiθ complexo −1 |z| ≥ 0 e θ ∈ . Tem-se que |z| = zz e e = z|z| . H´a uma afirma¸ca˜o an´aloga v´alida para matrizes A ∈ Mat ( , n), a qual ´e muito u ´ til, e da qual trataremos nesta se¸ca˜o. Antes de enunciarmos esse resultado de forma mais precisa (o Teorema da Decomposi¸ca˜o Polar, Teorema 3.20, abaixo), fa¸camos algumas observa¸co˜es preliminares. 

Seja A ∈ Mat ( , n) e seja a matriz A∗ A. Notemos primeiramente que (A∗ A)∗ = A∗ A∗∗ = A∗ A, ou seja, A∗ A e auto-adjunta. Pelo Teorema 3.12, p´agina 184, ´e poss´ıvel encontrar um conjunto ortonormal {vk , k = 1, . . . , n} de autovetores de A∗ A, com autovalores dk , k = 1, . . . , n, respectivamente, sendo que a matriz hh ii P := v1 , . . . , vn (3.81) (para a nota¸ca˜o, vide (3.1)) ´e unit´aria e diagonaliza A∗ A, ou seja, P ∗ (A∗ A)P = D, sendo D a matriz diagonal D := diag (d1 , . . . , dn ), cujos elementos da diagonal s˜ao os autovalores de A∗ A. Os autovalores dk s˜ao todos maiores ou iguais a zero. De fato, se vk 6= 0 ´e um autovetor de A∗ A com autovalor dk ,

JCABarata. Curso de F´ısica-Matem´ atica

teremos dk kvk k2 = dk hvk , vk i dk = kAvk k2 /kvk k2 ≥ 0.



= hvk , Bvk i

= hvk , A∗ Avk i 

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.



= hAvk , Avk i 

208/1304

= kAvk k2 . Logo,

Com esses fatos a` m˜ao, vamos definir uma matriz diagonal, que denotaremos sugestivamente por 2 √ √ D , por D 1/2 := diag ( d1 , . . . , dn ). Tem-se que D 1/2 = D, uma propriedade o´bvia15 . Note-se ∗ √ tamb´em que D 1/2 = D 1/2 , pois cada dk ´e real. √ Definamos agora a matriz A∗ A, por √ A∗ A := P D 1/2 P ∗ . (3.82) √ ∗ √ √ ∗ ∗ ∗ A A = P D 1/2 P ∗ = P D 1/2 P ∗ = A∗ A. Observemos Essa matriz A A ´e auto-adjunta, pois 2 √ A∗ A = P (D 1/2 )2 P ∗ = P DP ∗ = A∗ A. Disso segue que que 1/2



det

√

A∗ A

2

= det





√

A∗ A

2 

= det(A∗ A) = det(A∗ ) det(A) = det(A) det(A) = | det(A)|2 .

 √ A∗ A = | det(A)| e, portanto, A∗ A ´e invert´ıvel se e somente se A o for. √ Alguns autores denotam a matriz A∗ A por |A|, por analogia com o m´odulo de um n´ umero complexo. Podemos agora formular e demonstrar o resultado que procuramos:

Provamos assim que det

ao existe uma maTeorema 3.20 (Teorema da Decomposi¸ c˜ ao Polar) Seja A ∈ Mat ( , n). Ent˜ triz unit´ aria U ∈ Mat ( , n) tal que √ A = U A∗ A . (3.83) Se A ´e invert´ıvel, ent˜ ao U ´e univocamente determinada. A representa¸ca ˜o (3.83) ´e denominada representa¸ca˜o polar de A. 2 Prova. Sejam, como acima, dk , k = 1, . . . , n os autovalores de A∗ A com autovetores respectivos vk , k = 1, . . . , n. Sabemos pelo Teorema 3.12, p´agina 184 que podemos escolher os vk ’s de forma que hvk , vl i = δk l . 

Como vimos acima, os autovalores dk satisfazem dk ≥ 0. Sem perda de generalidade, vamos supˆo-los ordenados de forma que dk > 0 para todo k = 1, . . . , r e dk = 0 para todo k = r + 1, . . . , n. Com essa escolha, tem-se que Avk = 0 para todo k = r + 1, . . . , n , (3.84) pois de A∗ Avk = 0, segue que 0 = hvk , A∗ Avk i = hAvk , Avk i = kAvk k2 . 



Para k = 1, . . . , r, sejam wk os vetores definidos da seguinte forma: 1 wk := √ Avk , dk

k = 1, . . . , r .

(3.85)

√ √ Essa n˜ ao ´e a u ´nica matriz com essa propriedades, pois qualquer matriz do tipo diag (± d1 , . . . , ± dn ), com os sinais ± escolhidos independentemente uns dos outros, tamb´em tem como quadrado a matriz D. 15

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

209/1304

´ f´acil ver que E hwk , wl i 

= √

1 hAvk , Avl i dk dl 

= √

1 hA∗ Avk , vl i dk dl 

dk = √ hvk , vl i dk dl 

dk = √ δk l = δ k l , dk dl

para todos k, l = 1, . . . , r. Assim, o conjunto de vetores {wk , k = 1, . . . , r} forma um conjunto ortonormal. A eles podemos acrescentar um novo conjunto {wk , k = r + 1, . . . , n}, escolhido arbitr´ariamente, de vetores ortonormais pertenentes ao complemento ortogonal do sub-espa¸co gerado por {wk , k = 1, . . . , r} e construir assim, um conjunto ortonormal {wk , k = 1, . . . , n}. Sejam agora a matriz P , definida em (3.81) e as seguintes matrizes de Mat ( , n): hh ii Q := w1 , . . . , wn , U := QP ∗

(para a nota¸ca˜o, vide (3.1)). Como {vk , k = 1, . . . , n} e {wk , k = 1, . . . , n} s˜ao dois conjuntos ortonormais, segue que P e Q s˜ao matrizes unit´arias (por quˆe?) e, portanto, U tamb´em ´e unit´aria. √  √ ´ f´acil ver que AP = QD 1/2 , onde D 1/2 = diag d1 , . . . , dn , De fato, E AP

(3.81)

=

hh ii A v1 , . . . , vn

(3.4)

=

(3.84)

=

(3.85)

=

(3.6)

=

hh

Av1 , . . . , Avn

ii

hh

Av1 , . . . , Avr 0, . . . , 0

ii

hh

ii w1 , . . . , wn D 1/2 = QD 1/2 .

hhp ii p d1 w1 , . . . , dr wr 0, . . . , 0

√ (3.82) Agora, de AP = QD 1/2 , segue que A = QD 1/2 P ∗ = U P D 1/2 P ∗ = U A∗ A, que ´e o que quer´ıamos provar. Para mostrar determinado se A for √ invert´ıvel, suponhamos que exista U 0 √ √ que U ´e univocamente 0 ∗ ∗ tal que A = U A A = U A A. Como comentamos A∗ A ´e invert´ıvel se e somente se A acima, √ √ o for. Logo, se A ´e invert´ıvel, a igualdade U A∗ A = U 0 A∗ A implica U = U 0 , estabelecendo a unicidade. Caso A n˜ao seja invert´ıvel a arbitrariedade de U reside na escolha dos vetores ortogonais {wk , k = r + 1, . . . , n}. O seguinte corol´ario ´e elementar: Teorema 3.21 Seja A ∈ Mat ( , n). Ent˜ ao existe uma matriz unit´ aria V ∈ Mat ( , n) tal que √ A = AA∗ V . (3.86) Se A ´e invert´ıvel, ent˜ ao V ´e univocamente determinada.

2

p √ ∗ ∗ ∗ )∗ A ∗ = U (A AA∗ para alguma matriz Prova. Para a matriz A , (3.83) diz-nos que A = U 0 0 √ √ unit´aria U0 . Como AA∗ ´e auto-adjunta, segue que A = AA∗ U0∗ . Identificando V = U0∗ , obtemos o que desejamos.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

210/1304

O Teorema da Decomposi¸ca˜o Polar pode ser generalizado para abranger operadores limitados agindo em espa¸cos de Hilbert (vide Teorema 26.22, p´agina 1182) e mesmo para abranger operadores n˜aolimitados agindo em espa¸cos de Hilbert (vide [103]).

3.8.2

O Teorema da Triangulariza¸ c˜ ao de Schur

O teorema que apresentamos abaixo, devido a Schur16 , ´e semelhante, mas n˜ao idˆentico, ao Teorema de Jordan: toda matriz de Mat ( , n) pode ser levada por uma transforma¸ca˜o de similaridade induzida por uma matriz unit´aria a uma matriz triangular superior (para a defini¸ca˜o, vide Se¸ca˜o 3.6, p´agina 190). Esse teorema ´e alternativamente denominado Teorema da Triangulariza¸ca ˜o de Schur ou Teorema da Decomposi¸ca ˜o de Schur. Como veremos, esse teorema pode ser usado para fornecer uma outra demonstra¸ca˜o (eventualmente mais simples) da diagonalizabilidade de matrizes auto-adjuntas e de matrizes normais por matrizes unit´arias. Teorema 3.22 (Teorema da Decomposi¸ c˜ ao de Schur) Seja A ∈ Mat ( , n). Ent˜ ao existe U ∈ ∗ Mat ( , n), unit´ aria, e S ∈ Mat ( , n), triangular superior, tais que A = U SU . Os elementos da diagonal de S s˜ ao os autovalores de A. 2 Antes de provarmos esse teorema, mencionemos um corol´ario evidente: ao existe V ∈ Mat ( , n), unit´ aria, e I ∈ Mat ( , n), Corol´ ario 3.4 Seja A ∈ Mat ( , n). Ent˜ ∗ triangular inferior, tais que A = V IV . Os elementos da diagonal de I s˜ ao os autovalores de A. 2 Prova do Corol´ario 3.4. Pelo Teorema 3.22, a matriz A∗ pode ser escrita da forma A∗ = V ∗ SV , com V unit´aria e S triangular superior. Logo, A = V ∗ S ∗ V . Por´em, S ∗ ≡ I ´e triangular inferior.

Tamb´em pelo Teorema 3.22, os autovalores de A∗ s˜ao os elementos diagonais de S, que s˜ao o complexo conjugado dos elementos diagonais de S ∗ ≡ I. Mas os autovalores de A s˜ao o complexo conjugado dos autovalores de A∗ (pela Proposi¸ca˜o 3.16, p´agina 181) e, portanto, s˜ao os elementos diagonais de I.

Prova do Teorema 3.22. Comecemos observando que se A = U ∗ SU com U unit´ario, ent˜ao A e S tˆem o mesmo polinˆomio caracter´ıstico e, portanto, os mesmos autovalores, incluindo a multiplicidade (vide a discuss˜ ao em torno de (3.15), p´agina 149). Mas o polinˆomio caracter´ıstico de S ´e p S (x) = det(x −S) = Qn (x − Skk ), pois S ´e triangular superior e, portanto, os autovalores de S s˜ao os elementos de sua k=1 diagonal. Passemos a` demonstra¸ca˜o da afirmativa principal, ou seja, que A = U ∗ SU com U unit´ario e S triangular superior. 16

Issai Schur (1875-1941).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

211/1304

Seja n ≥ 2hhe v1 um autovetor de A com autovalor λ1 e kv1 k = 1. Seja U (1) uma matriz unit´aria da ii (1) (1) (1) forma U (1) = u1 , . . . , un com u1 = v1 , ou seja, cuja primeira coluna ´e o vetor v1 . Ent˜ao, AU

(1)



λ1  h h i i h h i i 0 (3.4) (1) (1) (1) = Au1 , . . . , Au(1) = λ1 u1 , Au2 , . . . , Au(1) = U (1)  n n  .. . 0

(1)

(1)

··· ··· .. .

b1 (1) a11 .. .

(1)

(1)

a(n−1)1 · · · a(n−1)(n−1)

(1)

para certos bk e akl , k, l = 1, . . . , n − 1, onde (1)

Auk

(1) (1)

= b k u1 +

n−1 X

(1) (1)

alk ul+1 ,

(1)

bn−1 (1) a1(n−1) .. .

k = 2, . . . , n .



   ,  

(3.87)

l=1

(

Para simplificar a nota¸ca˜o, definimos  (1)    b1 0  ..   ..  (1) b =  .  , n−1 =  .  , (1) 0 bn−1 n−1



 (1) (1) a11 ··· a1(n−1)   .. .. =  ...  , . . (1) (1) a(n−1)1 · · · a(n−1)(n−1)

A(1)

tendo n − 1 linhas) e escrevemos a identidade (3.87) como  T λ1 b(1) (1) ∗ (1) . U AU = (1) n−1 A

(3.88)

Para n = 2 isso demonstra o teorema, pois afirma que U

(1) ∗

(1)

λ1 b 1 (1) 0 a11

AU (1) =

!

,

sendo o lado direito uma matriz triangular superior. Para n > 2 procedemos por indu¸ca˜o. Supondo a afirma¸ca˜o v´alida para matrizes (n − 1) × (n − 1), ent˜ao existe uma matriz unit´aria V ∈ Mat ( , n − 1) tal que V ∗ A(1) V = S (1) ,sendo S (1) triangular superior. Assim, definindo a matriz unit´aria U (2) ∈ T 1 n−1 Mat ( , n) por U (2) := , teremos por (3.88), V n−1 ∗ ∗ ∗ U (1) U (2) AU (1) U (2) = U (2) U (1) AU (1) U (2) =

=

=



1

n−1



λ1



λ1

n−1

n−1

T n−1 ∗

V



λ1 n−1

T  V T b(1) V ∗ A(1) V V T b(1) S (1)

T 

,

T

b(1) A(1)

1

T n−1

n−1

V



JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

212/1304

que ´e triangular superior, pois S (1) o ´e. Como U (1) U (2) ´e unit´aria (pois U (1) e U (2) o s˜ao), o teorema est´a provado. Coment´ ario. Toda matriz triangular superior S pode ser escrita na forma D + N , sendo D a matriz diagonal formada pela diagonal de S (ou seja, Dii = Sii para todo i = 1, . . . , n) e N ´e nilpotente (pois ´e triangular superior, mas com diagonal nula). Assim, o Teorema 3.22 afirma que toda matriz A pode ser levada a` forma D + N por uma transforma¸ca˜o de similaridade unit´aria. Por´em, o Teorema 3.22 n˜ao garante (nem ´e verdade, em geral) que D e N comutem. Assim, o Teorema 3.22 ´e distinto do Teorema de Jordan, Teorema 3.18, p´agina 199. O Teorema 3.22 tem por corol´ario o seguinte teorema, j´a provado anteriormente por outros meios (Teorema 3.12, p´agina 184, e Proposi¸ca˜o 3.18, p´agina 186). Teorema 3.23 Uma matriz A ∈ Mat ( , n) ´e auto-adjunta, se e somente se for diagonaliz´ avel por uma transforma¸ca ˜o de similaridade unit´ aria e se seus autovalores forem reais. 2 Prova. Pelo Teorema 3.22, existe uma matriz unit´aria U tal que U ∗ AU = S, sendo S triangular superior cujos elementos diagonais s˜ao os autovalores de A. Assim, se A = A∗ , segue que S ∗ = (U ∗ AU )∗ = U ∗ A∗ U = U ∗ AU = S. Mas para uma matriz triangular superior S, a igualdade S = S ∗ implica que S ´e diagonal e os elementos da diagonal s˜ao reais. Reciprocamente, se A ∈ Mat ( , n) ´e diagonaliz´avel por uma transforma¸ca˜o de similaridade unit´aria e seus autovalores s˜ao reais, ou seja, existe U unit´aria e D diagonal real com U ∗ AU = D, ent˜ao A = U DU ∗ e A∗ = U D ∗ U ∗ . Como D ´e diagonal e real, vale D ∗ = D e, portanto, A∗ = U DU ∗ = A, provando que A ´e auto-adjunta. Pelo Teorema 3.22, se A ∈ Mat ( , n) ´e uma matriz normal e U ∗ AU = S, com U unit´aria e S triangular superior, ent˜ao S ´e normal (justifique!). Assim, junto com o Lema 3.3, p´agina 191, provamos o seguinte: Teorema 3.24 Uma matriz A ∈ Mat ( , n) ´e normal se e somente se for diagonaliz´ avel por uma transforma¸ca ˜o de similaridade unit´ aria. 2 Essas afirma¸co˜es foram demonstradas por outros meios no Teorema 3.14, p´agina 187.

3.8.3

A Decomposi¸ c˜ ao QR e a Decomposi¸ c˜ ao de Iwasawa (“KAN”)

O prop´osito desta se¸ca˜o ´e apresentar a chamada decomposi¸ca ˜o de Iwasawa 17 , ou decomposi¸ca ˜o KAN 18 , de matrizes invert´ıveis, Teorema 3.26. Esse teorema tem rela¸ca˜o com a teoria dos grupos de Lie, como 17

Kenkichi Iwasawa (1917-1998). Infelizmente n˜ ao h´ a uniformidade na literatura quanto a ` denomina¸ca ˜o dessa decomposi¸ca ˜o. Vamos cham´ a-la de “decomposi¸ca ˜o de Iwasawa” pois a mesma ´e um caso particular (para o grupo GL( , n) das matrizes complexas n × n invert´ıveis) de um teorema mais geral da teoria dos grupos de Lie, denominado Teorema da Decomposi¸ca ˜o de Iwasawa, que afirma que todo elemento g de um grupo de Lie semi-simples pode ser escrito como produto de um elemento k de um sub-grupo compacto maximal, por um elemento a de um subgrupo Abeliano (real) e por um elemento n de um sub-grupo nilpotente (ou seja, cuja a ´lgebra de Lie ´e nilpotente): g = kan. Em Alem˜ ao, as palavras compacto, Abeliano e 18

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

213/1304

discutiremos brevemente ao final. Os dois primeiros resultados preparat´orios abaixo, Proposi¸ca˜o 3.24 e Teorema 3.25 (Decomposi¸ca˜o QR), tˆem interesse por si s´o. Proposi¸ c˜ ao 3.24 Seja R ∈ Mat ( , n) uma matriz triangular superior cujos elementos diagonais s˜ ao n˜ ao-nulos (i.e., R ´e invert´ıvel). Ent˜ ao, podemos escrever R = AN , onde A ∈ Mat ( , n) ´e a matriz diagonal formada com a diagonal de R: A = diag (R11 , . . . , Rnn ), e N ∈ Mat ( , n) ´e uma matriz triangular superior cujos elementos diagonais s˜ ao iguais a 1. 2 ´ f´acil constatar que (abaixo m ≡ n − 1) Prova. E

  R12   1 R11 · · · R11 0 · · · · · · 0 R11 R12 · · · · · · R1n     .. . . .  0 R22 . .  0 R22 . . 0  0 1 R2n      .  . . . .. .. .. .. .. .. . ... ...  ..  ..  R =  . . . . . .   ..  ..  =  ..     .. .. ..  0  0 . Rmm 0  0 . Rmm Rmn  . 0 ··· ··· 0 Rnn 0 ··· ··· 0 Rnn 0 ··· ··· | {z }| {z 

A

N

··· .. 1 0

.

R1n R11 R2n R22



  ..  .   .  Rmn 

Rmm

1

}

O estudante deve comparar as afirma¸co˜es do teorema a seguir com o Teorema da Decomposi¸ca˜o Polar, Teorema 3.20, p´agina 208, e com o Teorema da Decomposi¸ca˜o de Schur, Teorema 3.22, p´agina 210. Teorema 3.25 (Teorema da Decomposi¸ c˜ ao QR) Seja M ∈ Mat ( , n) uma matriz invert´ıvel. Ent˜ ao M pode ser escrita na forma M = QR, onde Q ∈ Mat ( , n) ´e unit´ aria e R ∈ Mat ( , n) ´e triangular superior, sendo que os elementos diagonais de R s˜ ao estritamente positivos.   Prova do Teorema 3.25. Seja M = m1 , . . . , mn . Como M ´e invert´ıvel, os vetores mk , k = 1, . . . , n, s˜ao linearmente independentes, ou seja, formam uma base em n . Podemos, portanto, usar o procedimento de ortogonaliza¸ca˜o de Gram19 -Schmidt20 e construir uma nova base ortonormal de vetores qj , j = 1, . . . , n, a partir dos vetores ml , l = 1, . . . , n. Tais vetores s˜ao definidos por

m1 q1 = , km1 k

mj −

j−1 X

hql , mj i ql 

l=1

, qj = j−1

X

hql , mj i ql

m j −

j = 2, . . . , n .



l=1

nilpotente s˜ ao “Kompakt”, “Abelsch” e “Nilpotent”, da´ı a denomina¸ca ˜o “decomposi¸ca ˜o KAN ” para essa decomposi¸ca ˜o, denomina¸ca ˜o essa encontrada em alguns textos. 19 Jørgen Pedersen Gram (1850-1916). 20 Erhard Schmidt (1876-1959).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 3

Vers˜ ao de 29 de setembro de 2005.

214/1304

Como ´e f´acil verificar, tem-se hqi , qj i = δi j para todos i, j = 1, . . . , n. As rela¸co˜es acima implicam trivialmente

j−1

j−1

X X

j = 2, . . . , n , m1 = q1 km1 k , m j = q j m j − hql , mj i ql + ql hql , mj i ,







l=1

l=1

rela¸co˜es estas que podem ser escritas em forma matricial como  R11 hq1 , m2 i     0 R22   hh ii hh ii  . .. m1 , . . . , mn = q1 , . . . , qn R , onde R :=  .  ..     0   0 ··· com R11 = km1 k ,

Rjj

j−1

X

hql , mj i ql , = m j −





··· ..

···

.

···

..

.

..

..

. R(n−1)(n−1)

···

.

0



hq1 , mn i



   hq2 , mn i     ..  , .     hqn−1 , mn i    Rnn (3.89) 



j = 2, . . . , n .

l=1

E. 3.30 Exerc´ıcio. Conven¸ca-se da validade da rela¸c˜ao (3.89).

6

  Definindo Q := q1 , . . . , qn , a rela¸ca˜o (3.89) diz-nos que M = QR, sendo R triangular superior (como se vˆe) e Q unit´aria (pois os vetores ql , l = 1, . . . , n, s˜ao ortonormais). Isso completa a prova do Teorema 3.25. Chegamos assim ao importante Teorema da Decomposi¸ca˜o de Iwasawa para matrizes invert´ıveis: Teorema 3.26 (Teorema da Decomposi¸ c˜ ao de Iwasawa, ou Decomposi¸ c˜ ao KAN ) Seja M ∈ Mat ( , n) uma matriz invert´ıvel. Ent˜ ao M pode ser escrita de modo u ´nico na forma M = KAN , onde K ∈ Mat ( , n) ´e uma matriz unit´ aria, A ∈ Mat ( , n) ´e a uma matriz diagonal, tendo elementos diagonais estritamente positivos, e N ∈ Mat ( , n) ´e uma matriz triangular superior cujos elementos diagonais s˜ ao iguais a 1. 2 Prova. A afirma¸ca˜o que M pode ser escrita na forma M = KAN , com K, A e N com as propriedades acima segue imediatamente da Proposi¸ca˜o 3.24 e do Teorema 3.25, dispensando demonstra¸ca˜o. O u ´ nico ponto a se demonstrar ´e a unicidade dessa decomposi¸ca˜o. Vamos ent˜ao supor que para algum M ∈ Mat ( , n) existam K, K0 ∈ Mat ( , n), matrizes unit´arias, A, A0 ∈ Mat ( , n), matrizes diagonais, tendo elementos diagonais estritamente positivos, e N, N0 ∈ Mat ( , n) matrizes triangulares superiores cujos elementos diagonais s˜ao iguais a 1, tais que M = KAN = K0 A0 N0 .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 3

215/1304

Segue imediatamente disso que K0−1 K = A0 N0 N −1 A−1 . O lado esquerdo dessa igualdade ´e uma matriz unit´aria e, portanto, normal. O lado direito ´e uma matriz triangular superior (pela Proposi¸ca˜o 3.21, p´agina 190). Pelo Lema 3.3, p´agina 191, A0 N0 N −1 A−1 deve ser uma matriz diagonal D. Assim, temos que K0−1 K = D e A0 N0 N −1 A−1 = D. A primeira dessas rela¸co˜es diz-nos que D ´e unit´aria. −1 A segunda diz-nos que N0 N −1 = A−1 e diagonal (por 0 DA, ou seja, N0 = D0 N , onde D0 := A0 DA ´ ser o produto de trˆes matrizes diagonais). Agora, N e N0 s˜ao matrizes triangulares superiores cujos elementos diagonais s˜ao iguais a 1. Portanto, a rela¸ca˜o N0 = D0 N com D0 diagonal s´o ´e poss´ıvel se D0 = (de outra forma haveria elementos na diagonal de N ou de N0 diferentes de 1), estabelecendo que N = N0 . −1 Provamos, assim, que A−1 ao diagonais, tendo na 0 DA = , ou seja, D = A0 A . Agora, A e A0 s˜ diagonal n´ umeros reais positivos. Logo, D tamb´em ´e diagonal e tem na diagonal n´ umeros reais positivos ∗ e, portanto, D = D . Como D ´e unit´aria (como observado linhas acima), segue que D 2 = . Logo, os elementos Dkk da diagonal de D satisfazem Dkk = ±1, para todo k = 1, . . . , n (os sinais podendo ser distintos para k’s distintos). Agora, como A0 = DA e como A e A0 tˆem na diagonal n´ umeros reais uentemente, K = K0 positivos, n˜ao podemos ter Dkk = −1 para algum k e, portanto, D = . Conseq¨ e A = A0 , estabelecendo a unicidade desejada.

Note o leitor que o conjunto das matrizes unit´arias de Mat ( , n) forma um sub-grupo de GL( , n) (o grupo das matrizes complexas n × n invert´ıveis). O conjunto das matrizes diagonais de Mat ( , n) tendo elementos diagonais estritamente positivos ´e igualmente um sub-grupo de GL( , n). Por fim, o conjunto das matrizes triangulares superiores de Mat ( , n) cujos elementos diagonais s˜ao iguais a 1 ´e tamb´em um sub-grupo de GL( , n). Assim, o Teorema 3.26 afirma que cada elemento de GL( , n) pode ser escrito de modo u ´ nico como produto de elementos de cada um desses trˆes subgrupos. Esse ´e um caso particular de um teorema da teoria dos grupos de Lie conhecido como Teorema da Decomposi¸ca ˜o de Iwasawa.

3.9 3.9.1

Propriedades Especiais de Determinantes Expans˜ ao do Polinˆ omio Caracter´ıstico

P Seja A ∈ Mat ( , n) e seja pA (λ) = det(λ − A) = nm=0 cm λm , λ ∈ , seu polinˆomio caracter´ıstico. Desejamos obter uma f´ormula explicita para os coeficientes cm em termos de determinantes de submatrizes de A (vide abaixo). Vamos designar por ak a k-´esima coluna de A, de sorte que, pela nota¸ca˜o introduzida em (3.1), p´agina 143, vale A = a1 , . . ., an . Recordando as defini¸  ca˜o de base canˆonica (3.2) e (3.3), p´agina 143, fica claro que pA (λ) = det λe1 − a1 , . . . , λen − an . Usando a propriedade de multilinearidade do determinante (linearidade em rela¸ca˜o a cada coluna), segue que ! n ii hh X X + (−1)n det(A) , pA (λ) = (−1)n−m λm det a1 , . . . , ej1 . . . , ejm . . . , an m=1

1≤j1 0 a1 +b1 >0

···

X

ak , bk ≥0 ak +bk >0

(−1)k l!(k + 1)(b1 + · · · + bk + 1)

k Y i=1

1 ai !bi !

!

× ad[A]a1 ad[B]b1 · · · ad[A]ak ad[B]bk ad[A]l (B). (4.46) Os primeiros termos de (4.46) s˜ ao 1 1 1 A ∗ B = A + B + [A, B] + [A, [A, B]] + [B, [B, A]] + · · · 2 12 12

(4.47) 2

Coment´ ario. A express˜ao (4.46) ´e a c´elebre f´ormula de Baker10 , Campbell11 e Hausdorff12 , que desempenha um papel importante no estudo de grupos de Lie e outras a´reas. Advertimos que, devido a` sua complexidade e devido a` restri¸ca˜o quanto a` norma das matrizes A e B, a f´ormula de Baker-CampbellHausdorff tem um escopo de aplica¸co˜es relativamente limitado no que concerne a cˆomputos de produtos de exponenciais. A mesma f´ormula, por´em, presta-se a` demonstra¸ca˜o de v´arios teoremas, especialmente na teoria dos grupos de Lie. Uma situa¸ca˜o interessante na qual a f´ormula de Baker-Campbell-Hausdorff pode ser empregada ´e aquela na qual comutadores de ordem suficientemente grande das matrizes A e B se anulam, pois a´ı o lado direito de (4.46) ou (4.47) tem um n´ umero finito de termos. Tal ocorre nas chamadas a ´lgebras de Lie nilpotentes. O leitor que procura um exemplo simples do uso de (4.47) pode interessar-se em ler sobre o chamado grupo de Heisenberg na Se¸ca˜o 13.2.2, p´agina 676. Prova do Teorema 4.1. A estrat´egia que empregaremos para provar a f´ormula de Baker, Campbell e Hausdorff ´e muito semelhante a`quela empregada na demonstra¸ca˜o da Proposi¸ca˜o 4.14. Seja, para A, B ∈ Mat ( , n) fixas tais que kAk < ln(2)/2 e kBk < ln(2)/2, a matriz13 



G(t) := ln (exp(A) exp(tB)) ,

(4.48)

para t ∈ [−1, 1]. Vamos identificar uma equa¸ca˜o diferencial satisfeita por G(t), e em seguida resolvˆe-la.

Comecemos procurando calcular a derivada de G(t) em rela¸ca˜o a t. Isso ´e uma tarefa mais dif´ıcil do ´ conveniente calcular primeiro a derivada de exp(G(t)). que parece e procederemos de modo indireto. E Por um lado temos que exp(G(t)) = exp(A) exp(tB) 10

Henry Frederick Baker (1866-1956). John Edward Campbell (1862-1924). 12 Felix Hausdorff (1868-1942). 13 A condi¸ca ˜o kAk < ln(2)/2 e kBk < ln(2)/2 garante que k exp(A) exp(tB) − k < 1 para todo t ∈ [−1, 1]. Assim, o logaritmo de exp(A) exp(tB) em (4.48) est´ a definido. 11

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 4

250/1304

e, portanto,

d d exp(G(t)) = exp(A) exp(tB) = exp(A) exp(tB)B. dt dt Por outro tem-se, pela defini¸ca˜o da aplica¸ca˜o dexp, que d exp(G(t)) = dexp[G(t)](G0 (t)). dt Portanto, dexp[G(t)](G0 (t)) = exp(A) exp(tB)B. Usando a Proposi¸ca˜o 4.14 essa u ´ ltima igualdade pode ser escrita como exp(G(t)) Φ[G(t)](G0 (t)) = exp(A) exp(tB)B, o que implica que Φ[G(t)](G0 (t)) = exp(−G(t)) exp(A) exp(tB)B = exp(−tB) exp(−A) exp(A) exp(tB)B = B. Resumindo, tem-se Φ[G(t)](G0 (t)) = B.

(4.49) 0

A id´eia que agora perseguiremos ´e tentar inverter essa express˜ao de modo a obter G (t) (que aparece no argumento de Φ no lado esquerdo). Para isso faremos uso do seguinte lema: Lema 4.2 Sejam as fun¸co ˜es complexas φ(z) :=

1 − e−z , z

z∈ ,

j´ a definida em (4.43) e ψ(z) := Ent˜ ao vale

z ln(z) , z−1

|z − 1| < 1.

ψ(ez )φ(z) = 1 para todo z tal que |z| < ln 2.

2

Prova. Usando a expans˜ao em s´erie de Taylor da fun¸ca˜o ln, podemos escrever ∞

X (−1)k−1 ln(1 + (z − 1)) ln(z) = z = z (z − 1)k−1 . ψ(z) := z z−1 z−1 k k=1 Isso mostra que ψ(z) ´e anal´ıtica na regi˜ao |z − 1| < 1.

∞ X 1 m z e Agora, se |z| < ln 2, tem-se que |e − 1| < 1, pois e − 1 = m! m=1 z

z

∞ ∞ X X 1 m 1 |e − 1| ≤ |z| < (ln 2)m = eln 2 − 1 = 1. m! m! m=1 m=1 z

(4.50)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 4

251/1304

Assim, ez est´a dentro da regi˜ao onde ψ ´e anal´ıtica, onde vale que  z   e z 1 − e−z z ψ(e )φ(z) = = 1, ez − 1 z que ´e o que quer´ıamos provar. O uso que faremos desse lema ´e o seguinte. Seja X ∈ Mat ( , n) qualquer. Por analogia com a defini¸ca˜o de Φ[X] em (4.44), definimos Ψ[X] := ψ(Exp[ad[X]]) = ψ(Ad[exp(X)]) Assim, Ψ[X]Φ[X] := ψ(Exp[ad[X]])φ(ad[X]) = id, onde id ´e a aplica¸ca˜o identidade: id(A) := A, para toda A ∈ Mat ( , n). Portanto, aplicando Ψ[G(t)] a (4.49), teremos G0 (t) = Ψ[G(t)](B). Essa ´e a equa¸ca˜o diferencial procurada e que ´e satisfeita por G(t), com a condi¸ca˜o inicial G(0) = A. Para prosseguir devemos escrevˆe-la de forma mais conveniente. Pela defini¸ca˜o da aplica¸ca˜o Ad, ´e bem f´acil ver que Ad[eX eY ] = Ad[eX ]Ad[eY ]. E. 4.19 Exerc´ıcio. Verifique.

6

Assim, Ψ[G(t)] = ψ (Ad[exp(G(t)))]) = ψ (Ad[exp(A) exp(tB))]) = ψ (Ad[exp(A)] Ad[exp(tB))]) = ψ (Exp[ad[A]] Exp[ad[tB]]) . A equa¸ca˜o diferencial para G(t) assume, portanto, a forma G0 (t) = ψ (Exp[ad[A]] Exp[ad[tB]]) (B),

(4.51)

com G(0) = A. Antes de passarmos a` resolu¸ca˜o dessa equa¸ca˜o, comentemos brevemente que o lado direito de (4.51) est´a bem definido desde que a norma de Exp[ad[A]] Exp[ad[tB]] seja menor que ln(2), devido a` defini¸ca˜o de ψ. Uma conta simples, mas que omitiremos aqui, garante que isso se d´a desde que kAk e kBk √  1 2 sejam ambas menores que 2 ln 2 − 2 ≈ 0, 12844 . . .. 



Isto posto, nossa tarefa agora ´e resolver (4.51), o que pode ser feito por uma simples integra¸ca˜o. Teremos, portanto, Z t Z t 0 ψ (Exp[ad[A]] Exp[ad[sB]]) (B) ds. G (s) ds = G(t) − G(0) = 0

0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 4

252/1304

Tomando-se t = 1 teremos A B

ln e e



= A+

Z

1

ψ (Exp[ad[A]] Exp[ad[sB]]) (B) ds.

(4.52)

0

Estando j´a na reta final, resta-nos calcular a integral do lado direito, o que pode ser feito com o uso ´ o que faremos. da expans˜ao em s´erie de ψ dada em (4.50) e um pouco de paciˆencia. E Por (4.50), teremos ψ (Exp[ad[A]] Exp[ad[sB]]) (B) = (Exp[ad[A]] Exp[ad[sB]])

∞ X (−1)k−1 k=1

=

"

∞ X (−1)k−1 k=1

k

=

k

(Exp[ad[A]] Exp[ad[sB]] − id)k−1 (B) #

(Exp[ad[A]] Exp[ad[sB]] − id)k−1 Exp[ad[A]] Exp[ad[sB]](B) "

∞ X (−1)k−1 k=1

k

(Exp[ad[A]] Exp[ad[sB]] − id)

k−1

#

Exp[ad[A]](B), (4.53)

onde, na u ´ ltima passagem usamos o fato o´bvio que Exp[ad[sB]](B) = Ad[exp(sB)](B) = exp(sB)B[exp(−sB) = B. Desejamos escrever esta u ´ ltima express˜ao diretamente em termos das aplica¸co˜es ad[A]] e ad[sB]. Ou ´ ltimo fator, Exp[ad[A]], ´e simplesmente ∞ X 1 ad[A]l . Exp[ad[A]] = l! l=0

(4.54)

Fora isso, ∞ X ∞ X X 1 1 Exp[ad[A]] Exp[ad[sB]] − id = ad[A]a ad[sB]b − id = sb ad[A]a ad[B]b . a!b! a!b! a, b≥0 a=0 b=0 a+b>0

Com isso, (Exp[ad[A]] Exp[ad[sB]] − id)k−1 =

X

a1 , b1 ≥0 a1 +b1 >0

···

X

ak−1 , bk−1 ≥0 ak−1 +bk−1 >0

sb1 +···+sk−1 ad[A]a1 ad[B]b1 · · · ad[A]ak−1 ad[B]bk−1 . (4.55) a1 !b1 ! · · · ak−1 !bk−1 !

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 4

Vers˜ ao de 29 de setembro de 2005.

253/1304

Inserindo-se (4.54) e (4.55) em (4.53) tem-se Z

1

ψ (Exp[ad[A]] Exp[ad[sB]]) (B) ds 0

=

Z

0

∞ X ∞ 1X k=1 l=0

X

a1 , b1 ≥0 a1 +b1 >0

···

X

(−1)

ak−1 , bk−1 ≥0 ak−1 +bk−1 >0

k−1 Y

k−1 b1 +···+bk−1

s l!k

i=1

1 ai !bi !

!

× ad[A]a1 ad[B]b1 · · · ad[A]ak−1 ad[B]bk−1 ad[A]l (B) ds. (4.56) Trocando-se a integral pelas somas Z

1

ψ (Exp[ad[A]] Exp[ad[sB]]) (B) ds 0 ∞ X ∞ X X

=

k=1 l=0

a1

a1 , b1 ≥0 a1 +b1 >0

···

b1

× ad[A] ad[B] · · · ad[A] =

∞ X ∞ X X k=1 l=0

a1 , b1 ≥0 a1 +b1 >0

···

X

X

ak−1 , bk−1 ≥0 ak−1 +bk−1 >0

ak−1

ak−1 , bk−1 ≥0 ak−1 +bk−1 >0

ad[B]

(−1)k−1 l!k

bk−1

l

k−1 Y i=1

ad[A] (B)

Z

1 ai !bi !

!

1

sb1 +···+bk−1 ds 0

(−1)k−1 l!k(b1 + · · · + bk−1 + 1)

k−1 Y i=1

1 ai !bi !

!

1 ai !bi !

!

× ad[A]a1 ad[B]b1 · · · ad[A]ak−1 ad[B]bk−1 ad[A]l (B) =

∞ X ∞ X X k=0 l=0

a1 , b1 ≥0 a1 +b1 >0

···

X

ak , bk ≥0 ak +bk >0

(−1)k l!(k + 1)(b1 + · · · + bk + 1)

k Y i=1

× ad[A]a1 ad[B]b1 · · · ad[A]ak ad[B]bk ad[A]l (B). (4.57) Na u ´ ltima igualdade fizemos apenas a mudan¸ca de vari´aveis k → k + 1.  Retornando a (4.52), temos ent˜ao ln eA eB = A ∗ B, onde A∗B = A+

∞ X ∞ X X k=0 l=0

a1 , b1 ≥0 a1 +b1 >0

···

X

ak , bk ≥0 ak +bk >0

(−1)k l!(k + 1)(b1 + · · · + bk + 1)

k Y i=1

1 ai !bi !

!

× ad[A]a1 ad[B]b1 · · · ad[A]ak ad[B]bk ad[A]l (B) (4.58)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 4

254/1304

´ f´acil ver que o termo com k = l = 0 nas somas do lado direito ´e igual a B. Com essa identifica¸ca˜o, E finalmente chega-se a (4.46). Como j´a comentamos a convergˆencia ´e garantida se kAk e kBk forem  √  ambas menores que 12 ln 2 − 22 ≈ 0, 12844 . . .. 



E. 4.20 Exerc´ıcio importante. Colecionando os termos com a1 + b1 + · · · + ak + bk + l ≤ 2 em (4.46), mostre que os primeiros termos de A ∗ B s˜ao aqueles dados em (4.47), p´agina 249. 6 * Coment´ ario. Um coment´ario que adiantamos ´e que, como discutiremos melhor no Cap´ıtulo 14, o produto “∗” expresso em (4.46), define uma estrutura de grupo em sub-´algebras de Lie nilpotentes de Mat ( , n). De fato, ´e poss´ıvel provar que “∗” ´e um produto associativo (pois o produto de exponenciais de matrizes ´e associativo) e ´e f´acil ver que A ∗ 0 = A e que A ∗ (−A) = 0 para toda matriz A. Com isso, a matriz nula ´e o elemento neutro do grupo e −A ´e a inversa de A. Isso tamb´em mostra que ´e por vezes poss´ıvel construir um produto associativo a partir de outro n˜ao-associativo, como o comutador de matrizes.

4.6

A F´ ormula de Duhamel e Algumas de suas Conseq¨ uˆ encias

Nesta se¸ca˜o demonstraremos a F´ ormula de Duhamel14 : Z 1   exp(A + B) = exp(A) + exp (1 − s)(A + B) B exp sA ds ,

(4.59)

0

uˆencias. A v´alida para quaisquer matrizes A, B ∈ Mat ( . n), e estudaremos algumas de suas conseq¨ demonstra¸ca˜o ´e simples. Diferenciando-se es(A+B) e−sA em rela¸ca˜o a s, tem-se       d −sA d d s(A+B) −sA s(A+B) s(A+B) −sA e e +e e e e = ds ds ds     s(A+B) −sA s(A+B) −sA = e (A + B) e +e (−A) e = es(A+B) B e−sA . Integrando-se ambos os lados entre 0 e t, obtem-se Z t t(A+B) −tA e e − = es(A+B) B e−sA ds , 0

de onde segue que e 14

t(A+B)

= e

Jean Marie Constant Duhamel (1797-1872).

tA

+

Z

t

es(A+B) B e−(s−t)A ds , 0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 4

255/1304

A mudan¸ca de vari´avel de integra¸ca˜o s → t − s conduz a Z t t(A+B) tA e(t−s)(A+B) B esA ds . e = e +

(4.60)

0

Para t = 1, isso reduz-se a (4.59), que ´e o que quer´ıamos provar. De (4.60) podem ser extra´ıdas v´arias rela¸co˜es u ´ teis, que trataremos agora. • Derivada de uma exponencial em rela¸ c˜ ao a um parˆ ametro

Uma das conseq¨ uˆencias mais u ´ teis da f´ormula de Duhamel ´e uma rela¸ca˜o para a derivada da exponencial de uma matriz que depende de um parˆametro. Seja A(λ) ∈ Mat ( . n) uma matriz que depende cont´ınua e diferenciavelmente de um parˆametro λ. Ent˜ao vale   Z 1 d A(λ)  d (1−s)A(λ) A(λ) esA(λ) ds . (4.61) e e = dλ dλ 0

Essa rela¸ca˜o tem aplica¸co˜es em equa¸co˜es diferenciais e na Mecˆanica Estat´ıstica, dentro e fora do equil´ıbrio. Alguns autores tamb´em denominam-na f´ ormula de Duhamel. O leitor deve compar´a-la a` express˜ao alternativa (4.42). Passemos a` demonstra¸ca˜o. Sendo A(λ) diferenci´avel, vale, para todo  suficientemente pequeno, A(λ + ) = A(λ) +  onde

1 lim R(λ, ) = 0 . →0 

Tem-se, ent˜ao, d exp(A(λ)) dλ

d A(λ) + R(λ, ), dλ

def.

=

(4.62)

=

(4.59)

=

=

  1 lim exp(A(λ + )) − exp(A(λ)) →0      1 d lim exp A(λ) +  A(λ) + R(λ, ) − exp (A(λ)) →0  dλ

lim

→0

Z

→0

(4.63)

=

(4.63)

    Z 1 1 A(λ) dA (1−s)(A(λ)+ dA (λ)+R(λ, )) sA(λ) A(λ) dλ lim e + e ds − e  (λ) + R(λ, ) e →0  dλ 0

+ lim

=

(4.62)

Z

Z

1

e

(λ)+R(λ, )) (1−s)(A(λ)+ dA dλ

0

Z

1

e

  dA sA(λ) (λ) e ds dλ

(1−s)(A(λ)+ dA (λ)+R(λ, )) dλ

0

1

e

(1−s)A(λ)

e

(1−s)A(λ)

0 1 0









  1 sA(λ) R(λ, ) e ds 

 Z 1    1 dA sA(λ) sA(λ) (1−s)A(λ) (λ) e ds + ds e lim R(λ, ) e →0  dλ 0  dA (λ) esA(λ) ds , dλ

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 4

Vers˜ ao de 29 de setembro de 2005.

256/1304

como quer´ıamos demonstrar. • Iterando a f´ ormula de Duhamel Na express˜ao (4.60) exponenciais do tipo eλ(A+B) aparecem em ambos os lados. Isso sugere que podemos inserir iterativamente (4.60) dentro de si mesma de modo a obter outras express˜oes recorrentes, como apresentado nas passagens auto-explicativas abaixo. Partindo de (4.60) e repetindo a itera¸ca˜o duas vezes, tem-se Z t t(A+B) tA e = e + e(t−s1 )(A+B) B es1 A ds1 0

= e

tA

+

Z t

e

(t−s1 )A

+

0

= e

= e

tA

tA

+

+

Z tZ 0

= e

tA

+

Z

Z

Z tZ 0

e

e

(t−s1 −s2 )(A+B)

(t−s1 )A

Be

Be

s2 A

ds2

0

s1 A

ds1 +

Z tZ 0

0

t−s1



B es1 A ds1

e(t−s1 −s2 )(A+B) B es2 A B es1 A ds2 ds1

0

t

e(t−s1 )A B es1 A ds1 + 0



0

+

t−s1

t

t−s1

Z

Z

e

(t−s1 −s2 )A

+

Z

t−s1 −s2

e

Be

s1 A

ds1 +

0

0

Z tZ 0

t−s1 Z

t−s1 −s2

Be

0

t (t−s1 )A

e

(t−s1 −s2 −s3 )(A+B)

t−s1

s3 A

ds3



B es2 A B es1 A ds2 ds1

e(t−s1 −s2 )A B es2 A B es1 A ds2 ds1

0

e(t−s1 −s2 −s3 )(A+B) B es3 A B es2 A B es1 A ds3 ds2 ds1 .

0

Repetindo-se N vezes o procedimento, teremos " Z t t(A+B) tA e = e + e−s1 A B es1 A ds1 0

+

N Z tZ X

m=2

+

Z tZ 0

0

t−s1

···

0

t−s1 0

···

Z

Z

t−s1 −···−sm−1 0

t−s1 −···−sm 0

e−(s1 +···+sm )A

m−1 Y k=0

e(t−s1 −···−sm+1 )(A+B)

m Y

k=0

B esm−k

 A

dsm · · · ds1

#

 B esm+1−k A dsm+1 · · · ds1 ,(4.64)

, N ≥ 2, sendo que convencionamos definir a produt´oria de matrizes da esquerda L Y para a direita, ou seja, na forma Mk = M1 · · · ML (´e necess´ario fixar uma conven¸ca˜o devido a` para todo N ∈



k=1

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 4

Vers˜ ao de 29 de setembro de 2005.

257/1304

n˜ao-comutatividade do produto de matrizes). Com as mudan¸cas de vari´aveis = t − s1 = t − (s1 + s2 ) .. .

t1 t2

= t − t1 = t1 − t2 .. .

s1 s2

,

,

sm = tm−1 − tm

tm = t − (s1 + · · · + sm )

podemos reescrever as integrais entre colchetes acima na forma " # Z t Z tm−1 m−1 N Z t Z t1 X Y  + et(A+B) = etm−k A B e−tm−k A dtm · · · dt1 etA et1 A B e−t1 A dt1 + ··· 0

+

Z tZ 0

m=2

t−s1

···

0

Z

t−s1 −···−sm

e

0

0

0

k=0

(t−s1 −···−sm+1 )(A+B)

0

m Y

k=0

 B esm+1−k A dsm+1 · · · ds1 .

(4.65)

E. 4.21 Exerc´ıcio. Verifique!

6

Substituindo A → A∗ e B → B ∗ na express˜ao acima, tomando a adjunta da express˜ao resultante e usando o fato que, para qualquer matriz M ∈ Mat ( , n), vale (exp (M ∗ ))∗ = exp(M ), obtem-se # " Z tm−1 Y Z t m N Z t Z t1 X  e−tk A B etk A dtm · · · dt1 ··· e−t1 A B et1 A dt1 + et(A+B) = etA + 0

+

Z tZ 0

t−s1

···

0

0

m=2

Z

t−s1 −···−sm 0

"m+1 Y

0

esk A B

k=1

0



#

k=1

e(t−s1 −···−sm+1 )(A+B) dsm+1 · · · ds1 .

E. 4.22 Exerc´ıcio. Verifique!

(4.66)

6

Para matrizes ou elementos de uma a´lgebra-∗ de Banach ´e poss´ıvel tomar o limite N → ∞ nas express˜oes (4.64)-(4.66), como na proposi¸ca˜o que segue. Proposi¸ c˜ ao 4.15 Sejam matrizes A, B ∈ Mat ( , n). Ent˜ ao, e

t(A+B)

= e

tA

"

+

+

Z

t

e−s1 A B es1 A ds1 0

∞ Z tZ X

m=2

0

t−s1 0

···

Z

t−s1 −···−sm−1 0

k=0

ou, equivalentemente, " Z t ∞ Z tZ X t(A+B) tA −t1 A t1 A e = e + e B e dt1 + 0

e−(s1 +···+sm )A

m−1 Y

m=2

0

t1 0

···

Z

0

m tm−1 Y

k=1

B esm−k

 A

e−tk A B etk

#

dsm · · · ds1 , (4.67)

 A

#

dtm · · · dt1 , (4.68)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 4

Vers˜ ao de 29 de setembro de 2005.

258/1304

para todo t ∈ , a convergˆencia sendo uniforme para t em compactos. As expans˜ oes em s´erie acima s˜ ao denominadas s´eries de Duhamel. 2 

Prova. A prova consiste em mostrar que o limite N → ∞ de (4.64) ou (4.66) existe. Tomemos provisoriamente t ∈ [−T, T ] para algum T > 0. Para τ ∈ [−T, T ], tem-se keτ A k ≤ e|τ |kAk ≤ eT kAk .  Seja M := max eT kAk , eT kA+Bk . Tem-se

Z Z Z tm−1 Y m

t t1 

−tk A tk A dtm · · · dt1 e Be ···

0 0 0 k=1

≤ M

2m

kBk

m

Z tZ 0

t1 0

···

Z

m

tm−1 0

dtm · · · dt1 =

(M 2 kBk|t|) m!

e, analogamente,

Z Z Z t−s1 −···−sm m

t t−s1 Y  (M kBk|t|)m+1

sm+1−k A t−(s1 +···+sm+1 )(A+B) Be dsm+1 · · · ds1 ≤ M . ··· e

0 0 (m + 1)! 0 k=0

As duas desigualdades provam a convergˆencia uniforme para t ∈ [−T, T ]. Como T ´e arbitr´ario, a convergˆencia se d´a para todo t ∈ . 

Na Se¸ca˜o 7.4, p´agina 327, apresentamos uma generaliza¸ca˜o da express˜ao (4.68), a chamada s´erie de Dyson para da teoria de perturba¸co˜es (vide, em particular, a express˜ao (7.26)). • Outros resultados an´ alogos O m´etodo de demonstra¸ca˜o da f´ormula de Duhamel apresentado acima pode ser empregado na obten¸ca˜o de outros resultados. Sejam novamente matrizes A, B ∈ Mat ( , n). Ent˜ao, vale Z t tB [A, e ] = e(t−s)B [A, B]esB ds . (4.69) 0

Para a prova, observamos que lados de 0 a t, obtem-se

d ds

e

e−sB Ae

−tB

Ae

tB

 sB

= e−sB [A, B]esB (justifique!). Integrando-se ambos os

−A =

Z

t

e−sB [A, B]esB ds .

(4.70)

0

Multiplicando-se a` esquerda por etB chega-se a` express˜ao (4.69). Express˜oes como (4.69) s˜ao empregadas na teoria de perturba¸co˜es na Mecˆanica Quˆantica.

Parte III Equa¸co ˜es Diferenciais

259

Cap´ıtulo 5 Equa¸co ˜es Diferenciais Ordin´ arias. Uma Introdu¸c˜ ao Conte´ udo 5.1

Defini¸ ca ˜o e Alguns Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . 261 5.1.1

Equa¸co˜es Diferenciais Ordin´arias Lineares . . . . . . . . . . . . . . . . . . . . 263

5.1.2

Equa¸co˜es Ordin´arias de Segunda Ordem. Exemplos de Interesse . . . . . . . 267

5.2

Sistemas de Equa¸ co ˜es Diferenciais Ordin´ arias . . . . . . . . . . . . . . . . 269

5.3

Discuss˜ ao sobre Problemas de Valor Inicial . . . . . . . . . . . . . . . . . . 274 5.3.1

Problemas de Valor Inicial. Patologias e Exemplos a se Ter em Mente . . . . 276

5.3.2

Teoremas de Existˆencia e Unicidade de Solu¸co˜es . . . . . . . . . . . . . . . . 280

5.3.3

Solu¸co˜es Globais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

5.3.4

Dependˆencia Cont´ınua de Condi¸co˜es Iniciais e de Parˆametros . . . . . . . . . 284

este cap´ıtulo apresentaremos uma breve introdu¸ca˜o a` teoria das equa¸co˜es diferenciais ordin´arias, abordando v´arios assuntos que ser˜ao aprofundados em outros cap´ıtulos. Na F´ısica, equa¸co˜es diferenciais s˜ao representa¸co˜es matem´aticas diretas ou indiretas de leis naturais e n˜ao ´e de surpreender, portanto, o papel central que as mesmas nela desempenham. Pode-se, sem medo de exagero, afirmar que o desenvolvimento da F´ısica moderna p´os-Newtoniana s´o se tornou poss´ıvel quando se compreendeu a importˆancia de se expressar as leis b´asicas da natureza em termos de equa¸co˜es diferenciais e quando se desenvolveram m´etodos de resolu¸ca˜o das mesmas. Desde o s´eculo XVIII as equa¸co˜es diferenciais tornaram-se n˜ao apenas um dos principais instrumentos te´oricos de trabalho dos f´ısicos, mas a linguagem mesma pela qual as leis da F´ısica se expressam. Um exemplo b´asico ´e segunda lei de Newton da Mecˆanica Cl´assica, que popularmente consiste na afirma¸ca˜o que para uma part´ıcula de massa m (movendo-se em, digamos, em uma dimens˜ao, do ponto de vista de um referencial inercial) o produto de sua massa por sua acelera¸ca˜o ´e igual a` for¸ca que age sobre ela. Se y(t) ´e a posi¸ca˜o da part´ıcula (em um sistema de referˆencia inercial) e a for¸ca F que age sobre ela em um instante de tempo t depender apenas do tempo t, da posi¸ca˜o y(t) no instante t e da velocidade y(t) ˙ no mesmo instante t, ent˜ao a segunda lei de Newton assume a forma da equa¸ca˜o diferencial ordin´aria de segunda ordem m¨ y (t) = F (t, y(t), y(t)) ˙ . A F´ısica apresenta outros exemplos de leis que se expressam em termos de equa¸co˜es diferenciais (parciais), tais como as leis do Eletromagnetismo (equa¸co˜es de Maxwell), da Mecˆanica dos Fluidos (equa¸co˜es de Euler e de Navier-Stokes), da Mecˆanica Quˆantica (equa¸co˜es de Schr¨odinger, de Klein-Gordon e de Dirac), na Teoria da Relatividade Geral (equa¸ca˜o de Einstein) etc. Atualmente, o estudo das equa¸co˜es diferenciais e suas aplica¸co˜es estende-se a outras sub-´areas da F´ısica, tais como a qu´ımica, a biologia, a economia, finan¸cas etc. , Para excelentes introdu¸co˜es, leg´ıveis profundas e abrangentes, a` teoria das equa¸co˜es diferenciais ordin´arias, recomendamos [5] e [65]. 260

JCABarata. Curso de F´ısica-Matem´ atica

5.1

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

261/1304

Defini¸ c˜ ao e Alguns Exemplos

Vamos iniciar nossa discuss˜ao tentando, de um modo geral e abstrato, definir o que se entende por uma equa¸ca˜o diferencial ordin´aria (que, seguindo a praxe, abreviaremos por EDO). • Defini¸ c˜ ao geral de EDOs Seja n ≥ 1 um n´ umero natural e seja G(x1 , . . . xn+2 ) uma fun¸ca˜o (real ou complexa) de n + 2 vari´aveis (reais ou complexas). Entende-se por uma equa¸ca ˜o diferencial ordin´ aria de ordem n de uma fun¸ca˜o (inc´ognita) y de uma vari´avel t associada a` fun¸ca˜o G a equa¸ca˜o G(t, y(t), y 0 (t), . . . , y (n) (t)) = 0 .

(5.1)

Assim sendo, o n´ umero n ´e dito ser a ordem da equa¸ca ˜o. Um exemplo (escolhido arbitrariamente, sem aplica¸ca˜o pr´atica conhecida) seria o caso da fun¸ca˜o de trˆes vari´aveis G(x1 , x2 , x3 ) = x21 + sen (x2 ) − 3x1 cos(x3 ) . (5.2)

A equa¸ca˜o diferencial ordin´aria de primeira ordem associada a essa fun¸ca˜o seria t2 + sen (y(t)) − 3t cos(y 0 (t)) = 0 .

(5.3)

´ evidente que s´o faz sentido associar uma equa¸ca˜o diferencial a uma fun¸ca˜o G de n + 2 vari´aveis, E como acima, se a mesma possuir zeros, ou seja, se a equa¸ca˜o alg´ebrica G(x 1 , . . . , xn+2 ) = 0 possuir solu¸co˜es (reais ou complexas, dependendo do interesse). Por exemplo, se G(x1 , x2 , x3 ) ´e uma fun¸ca˜o de trˆes vari´aveis reais ou complexas da forma G(x1 , x2 , x3 ) = |x1 |2 + |x2 |2 + |x3 |2 + 1 ent˜ao n˜ao h´a nenhuma equa¸ca˜o diferencial associada a` mesma, j´a que n˜ao h´a n´ umeros reais ou complexos tais que G(x1 , x2 , x3 ) = 0 e, portanto, a equa¸ca˜o |t|2 + |y(t)|2 + |y 0 (t)|2 + 1 = 0, ainda que possa ser escrita, trivialmente n˜ao possui qualquer solu¸ca˜o. Em muitos casos a equa¸ca˜o alg´ebrica G(x1 , . . . xn+2 ) = 0 permite escrever de modo u ´ nico (ao menos em uma regi˜ao finita) a vari´avel xn+2 em termos das demais: xn+2 = F (x1 , . . . xn+1 ) ,

(5.4)

onde F ´e alguma fun¸ca˜o de n+1 vari´aveis. Condi¸co˜es para isso s˜ao garantidas pelo importante Teorema da Fun¸ca ˜o Impl´ıcita (vide Se¸ca˜o 17.4, p´agina 907, ou qualquer bom livro-texto sobre fun¸co˜es de v´arias vari´aveis). Nesses casos felizes, a equa¸ca˜o diferencial para G equivale (ao menos localmente) a` equa¸ca˜o y (n) (t) = F (t, y(t), . . . , y (n−1) (t)) .

(5.5)

Nos casos em que G ´e tal que n˜ao permite a separa¸ca˜o global da dependˆencia de x n+2 como em (5.4) a equa¸ca˜o diferencial ´e dita ser uma equa¸ca ˜o diferencial impl´ıcita. Equa¸co˜es impl´ıcitas s˜ao por vezes dif´ıceis de lidar. Trataremos da solu¸ca˜o de algumas delas no Cap´ıtulo 6, p´agina 286. Um exemplo de uma equa¸ca˜o impl´ıcita foi apresentado em (5.2)-(5.3). Outro exemplo ´e a equa¸ca˜o diferencial (associada a` conserva¸ca˜o de energia mecˆanica de uma part´ıcula de massa m se movendo em uma dimens˜ao sob a a¸ca˜o de um potencial U ): m 2 (y(t)) ˙ + U (y(t)) = E , 2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

262/1304

onde E ´e uma constante. Daqui por diante estaremos mais freq¨ uentemente interessados em equa¸co˜es diferenciais de ordem n da forma (5.5) para alguma fun¸ca˜o de n + 1 vari´aveis F . Para ilustrar equa¸co˜es do tipo (5.5), apresentemos mais alguns exemplos. Exemplo 5.1 Sejam m, ρ e k constantes positivas e f uma fun¸ca˜o de uma vari´avel. Seja G a fun¸ca˜o de quatro vari´aveis G(x1 , x2 , x3 , x4 ) = mx4 + kx2 + ρx3 − f (x1 ) . ´ evidente que para a equa¸ca˜o alg´ebrica G(x1 , x2 , x3 , x4 ) = 0 podemos escrever E x4 = F (x1 , x2 , x3 ) , onde F (x1 , x2 , x3 ) = −

1 (kx2 + ρx3 − f (x1 )) . m

A equa¸ca˜o diferencial (de segunda ordem) associada a essa fun¸ca˜o F ´e y¨(t) = F (t, y(t) y(t)), ˙ ou seja m¨ y (t) + ρy(t) ˙ + ky(t) = f (t) . O estudante pode imediatamente reconhecer que se trata da equa¸ca˜o do oscilador harmˆonico amortecido submetido a uma for¸ca dependente do tempo f (t). ◊ Vamos a outros exemplos escritos diretamente em termos da fun¸ca˜o F .

Exemplo 5.2 Sejam g e l duas constantes positivas e seja F a fun¸ca˜o F (x1 , x2 , x3 ) = −

g sen (x2 ) . l

A equa¸ca˜o diferencial (de segunda ordem) associada a essa fun¸ca˜o F ´e y¨(t) = −

g sen (y(t)) . l

O estudante pode imediatamente reconhecer que se trata da equa¸ca˜o do pˆendulo simples. Exemplo 5.3 (Equa¸ca˜o de van der Pol) Sejam µ e k constantes e



F (x1 , x2 , x3 ) = −µx3 (x22 − 1) − kx2 . A equa¸ca˜o diferencial (de segunda ordem) associada a essa fun¸ca˜o F ´e y 00 (t) + µy 0 (t)(y(t)2 − 1) + ky(t) = 0 . Esta equa¸ca˜o ´e conhecida como equa¸ca ˜o de van der Pol 1 , em honra ao engenheiro que a propˆos como a equa¸ca˜o b´asica para o triodo (uma esp´ecie de “avˆo” do transistor). ◊ 1

Balthazar van der Pol (1889-1959). Os trabalhos originais de van der Pol sobre a equa¸ca ˜o que leva seu nome s˜ ao: B. van der Pol, Radio Rev. 1, 704-754, (1920) e B. van der Pol, “Forced oscillations in a circuit with non-linear resistance (reception with reactive triode)”, Phil. Mag. 3, 65-80, (1927).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

263/1304

Exemplo 5.4 Sejam α e β constantes e F (x1 , x2 ) = −αx2 + βx22 . A equa¸ca˜o diferencial (de primeira ordem) associada a essa fun¸ca˜o F ´e y 0 (t) = −αy(t) + βy(t)2 . Essa equa¸ca˜o aparece em v´arios problemas, por exemplo no estudo da evolu¸ca˜o de popula¸co˜es. V´arios outros exemplos ser˜ao apresentados adiante.

5.1.1



Equa¸ co ˜es Diferenciais Ordin´ arias Lineares

No estudo das equa¸co˜es diferenciais ´e muito u ´ til classificar equa¸co˜es que possuam certas propriedades comuns. Uma classifica¸ca˜o muito importante ´e aquela que separa as equa¸co˜es diferenciais em lineares e n˜ ao-lineares e as primeiras em homogˆeneas e n˜ ao-homogˆeneas. • Equa¸ co ˜es diferenciais ordin´ arias lineares Seja a equa¸ca˜o diferencial ordin´aria de ordem n y (n) (t) = F (t, y(t), . . . , y (n−1) (t)) .

(5.6)

Se a fun¸ca˜o F (x1 , . . . xn+1 ) for uma fun¸ca˜o linear das vari´aveis x2 , . . . xn+1 , ent˜ao (5.6) ´e dita ser linear. Em um tal caso, F (x1 , . . . xn+1 ) ´e da forma F (x1 , . . . xn+1 ) = f1 (x1 ) + f2 (x1 )x2 + · · · + fn+1 (x1 )xn+1 , para certas fun¸co˜es de uma vari´avel f1 , . . . , fn+1 . ´ f´acil constatar que toda equa¸ca˜o diferencial ordin´aria e linear de ordem n ´e da forma E y (n) (t) + an−1 (t)y (n−1) (t) + · · · + a1 (t)y 0 (t) + a0 (t)y(t) = f (t) ,

(5.7)

para fun¸co˜es reais ou complexas a0 , . . . , an−1 e f . Veremos in´ umeros exemplos adiante (vide Se¸ca˜o 5.1.2). Equa¸co˜es que n˜ao s˜ao lineares s˜ao (obviamente) ditas ser n˜ ao-lineares. Exemplos s˜ao a equa¸ca˜o do pˆendulo simples x¨(t) + sen (x(t)) = 0 e a de van der Pol 2 y¨(t) + µy(t)(y(t) ˙ − 1) + ky(t) = 0 .

Equa¸co˜es n˜ao-lineares s˜ao em muitos sentidos mais “complexas” que equa¸co˜es lineares e tˆem sido objeto de intenso estudo nas u ´ ltimas d´ecadas, especialmente no que concerne ao comportamento “ca´otico” observado em muitas delas. Nos cap´ıtulos que seguem, nossa ˆenfase ser´a o desenvolvimento de m´etodos

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 5

Vers˜ ao de 29 de setembro de 2005.

264/1304

de resolu¸ca˜o de equa¸co˜es lineares, mas trataremos de m´etodos de resolu¸ca˜o de algumas equa¸co˜es n˜aolineares no Cap´ıtulo 6, p´agina 286, e tamb´em no Cap´ıtulo 17 quando desenvolvermos m´etodos recursivos no tratamento das equa¸co˜es integrais de Fredholm e de Volterra. • Equa¸ co ˜es diferenciais ordin´ arias lineares a coeficientes constantes Caso as fun¸co˜es a0 , . . . , an−1 em (5.7) sejam constantes, a equa¸ca˜o (5.7) ´e dita ser a equa¸ca ˜o a coeficientes constantes. Como discutiremos, h´a um m´etodo geral para obter solu¸co˜es de equa¸co˜es diferenciais ordin´arias lineares a coeficientes constantes (para qualquer ordem n). • Equa¸ co ˜es lineares homogˆ eneas e n˜ ao-homogˆ eneas Caso a fun¸ca˜o f seja identicamente nula, a equa¸ca˜o (5.7) ´e dita ser uma equa¸ca ˜o diferencial homogˆenea. De outra forma, se f n˜ao for identicamente nula, equa¸ca˜o (5.7) ´e dita ser uma equa¸ca ˜o diferencial n˜ ao-homogˆenea. Equa¸co˜es lineares e homogˆeneas tˆem uma propriedade de grande importˆancia, o chamado princ´ıpio de sobreposi¸ca ˜o, do qual trataremos agora. • O princ´ıpio de sobreposi¸ c˜ ao para equa¸ co ˜es lineares homogˆ eneas Seja uma equa¸ca˜o diferencial ordin´aria linear e homogˆenea de ordem n y (n) (t) + an−1 (t)y (n−1) (t) + · · · + a1 (t)y 0 (t) + a0 (t)y(t) = 0 .

(5.8)

O chamado princ´ıpio de sobreposi¸ca ˜o ´e a afirmativa que se y a e yb s˜ao duas solu¸co˜es de (5.8) ent˜ao combina¸co˜es lineares arbitr´arias αya + βyb s˜ao tamb´em solu¸co˜es de (5.8). Aqui α e β s˜ao n´ umeros reais (k) (k) ou complexos arbitr´arios. A prova ´e simples. A k-´esima derivada de αya + βyb ´e αya + βyb . Assim, substituindo-se y por αya + βyb no lado esquerdo de (5.8), teremos (αya + βyb )(n) + an−1 (t)(αya + βyb )(n−1) + · · · + a1 (t)(αya + βyb )0 + a0 (t)(αya + βyb ) = (n−1)

(n)

(αya(n) + βyb ) + an−1 (t)(αya(n−1) + βyb 

) + · · · + a1 (t)(αya0 + βyb0 ) + a0 (t)(αya + βyb ) = 

α ya(n) + an−1 (t)ya(n−1) + · · · + a1 (t)ya0 + a0 (t)ya  | {z } =0



(n)

(n−1)

+ β yb + an−1 (t)yb |



+ · · · + a1 (t)yb0 + a0 (t)yb  = 0 . {z } =0

Uma conclus˜ao importante que se extrai do princ´ıpio de sobreposi¸ca˜o ´e que o conjunto de todas as solu¸co˜es de uma equa¸ca˜o diferencial ordin´aria linear e homogˆenea ´e um espa¸co vetorial, real ou complexo, dependendo do caso.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

265/1304

Como o estudante facilmente percebe, o princ´ıpio de sobreposi¸ca˜o vale tamb´em para sistemas de equa¸co˜es diferenciais ordin´arias lineares e homogˆeneas, assim como para equa¸co˜es diferenciais parciais lineares e homogˆeneas, tais como as equa¸co˜es de difus˜ao, de onda, de Laplace, as equa¸co˜es de Maxwell no v´acuo, a equa¸ca˜o de Schr¨odinger e muitas outras equa¸co˜es da F´ısica. Nelas o princ´ıpio de sobreposi¸ca˜o ´e amplamente empregado. Historicamente, o princ´ıpio de sobreposi¸ca˜o era conhecido desde os primeiros estudos sobre equa¸co˜es diferenciais no s´eculo XVIII, mas foi atrav´es dos trabalhos de Helmholtz2 sobre ac´ ustica que sua importˆancia foi inteiramente percebida na resolu¸ca˜o de equa¸co˜es diferenciais (ordin´arias e parciais) lineares de interesse f´ısico. A influˆencia de Helmholtz n˜ao pode ser subestimada, mesmo no que concerne a aplica¸co˜es pr´aticas: a leitura de Helmholtz, que tamb´em inventara um dispositivo eletromecˆanico para a produ¸ca˜o artificial do som de vogais, inspirou Bell3 a realizar experiˆencias de transmiss˜ao simultˆanea de m´ ultiplos sinais de c´odigo Morse4 em uma u ´ nica linha telegr´afica, empregando freq¨ uˆencias distintas para cada mensagem. Tais experiˆencias conduziram Bell em 1876 a` inven¸ca˜o do telefone. • O caso de equa¸ co ˜es lineares n˜ ao-homogˆ eneas Vamos colocar a seguinte quest˜ao. Vale o princ´ıpio de sobreposi¸ca˜o para equa¸co˜es diferenciais ordin´arias lineares n˜ao-homogˆeneas? Para tentar responder isso, considere-se a equa¸ca˜o n˜ao-homogˆenea y (n) (t) + an−1 (t)y (n−1) (t) + · · · + a1 (t)y 0 (t) + a0 (t)y(t) = f (t)

(5.9)

e sejam ya e yb duas solu¸co˜es. Como acima, consideremos uma combina¸ca˜o linear αya + βyb e tentemos repetir o que fizemos no caso homogˆeneo. Assim, substituindo-se y por αya + βyb no lado esquerdo de (5.9), teremos (αya + βyb )(n) + an−1 (t)(αya + βyb )(n−1) + · · · + a1 (t)(αya + βyb )0 + a0 (t)(αya + βyb ) = (n−1)

(n)

(αya(n) + βyb ) + an−1 (t)(αya(n−1) + βyb 

) + · · · + a1 (t)(αya0 + βyb0 ) + a0 (t)(αya + βyb ) = 

  α ya(n) + an−1 (t)ya(n−1) + · · · + a1 (t)ya0 + a0 (t)ya  | {z } = f (t)





 (n)  (n−1) + · · · + a1 (t)yb0 + a0 (t)yb  = (α + β)f (t) . + β yb + an−1 (t)yb | {z } = f (t)

O que conclu´ımos ´e que αya + βyb somente ´e uma nova solu¸ca˜o de (5.9) se α + β = 1. Portanto, se ya e yb s˜ao solu¸co˜es de (5.9) ent˜ao αya + (1 − α)yb ´e tamb´em solu¸ca˜o de (5.9) para qualquer α.

Vimos que o princ´ıpio de sobreposi¸ca˜o para equa¸co˜es n˜ao-homogˆeneas n˜ao se d´a para α e β arbitr´arios. N˜ao se pode mais, portanto, dizer que o conjunto de solu¸co˜es de uma equa¸ca˜o n˜ao-homogˆenea como (5.9) ´e um espa¸co vetorial, mas sim um espa¸co convexo. 2

Hermann Ludwig Ferdinand von Helmholtz (1821-1894). Alexander Graham Bell (1847-1922). 4 Samuel Finley Breese Morse (1791-1872).

3

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

266/1304

H´a ainda uma outra propriedade importante satisfeita pelas solu¸co˜es de equa¸co˜es n˜ao-homogˆeneas. Seja ynh uma solu¸ca˜o particular da equa¸ca˜o n˜ao-homogˆenea (5.9) e yh solu¸ca˜o particular da equa¸ca˜o homogˆenea (5.8), a qual difere de (5.9) apenas pelo fato de ter-se f (t) = 0. Ent˜ao tem-se que y = αyh + ynh

(5.10)

´e tamb´em solu¸ca˜o da equa¸ca˜o n˜ao-homogˆenea (5.9) para qualquer constante α. Para ver isso, inserimos y = αyh + ynh no lado esquerdo de (5.9) e teremos (αya + ynh )(n) + an−1 (t)(αyh + ynh )(n−1) + · · · + a1 (t)(αyh + ynh )0 + a0 (t)(αyh + ynh ) = (n)

(n)

(n−1)

(αyh + ynh ) + an−1 (t)(αyh 

(n−1)

+ ynh

(n)

0 ) + · · · + a1 (t)(αyh0 + ynh ) + a0 (t)(αyh + ynh ) =

(n−1)

α yh + an−1 (t)yh | 



+ · · · + a1 (t)yh0 + a0 (t)yh  {z } =0



 (n)  (n−1) 0 + ynh + an−1 (t)ynh + · · · + a1 (t)ynh + a0 (t)ynh  = f (t) . | {z } = f (t)

O que aprendemos com isso ´e que se tivermos uma solu¸ca˜o particular de uma equa¸ca˜o linear n˜aohomogˆenea obtemos uma outra solu¸ca˜o mais geral adicionando a esta uma solu¸ca˜o da equa¸ca˜o linear homogˆenea associada. Essa propriedade ´e muito u ´ til na solu¸ca˜o de equa¸co˜es n˜ao-homogˆeneas. • Equa¸ co ˜es diferenciais ordin´ arias com retardo Apenas por curiosidade informamos que n˜ao apenas equa¸co˜es diferenciais do tipo (5.1) ou (5.5) s˜ao objeto de interesse e de pesquisa. Um outro tipo s˜ao as chamadas equa¸co ˜es com retardo, as quais existem em diversas formas. Uma dessas forma ´e a seguinte. Sejam T0 , . . . , Tn1 constantes positivas. Uma equa¸ca˜o com retardo (fixo) ´e uma equa¸ca˜o da forma y (n) (t) = F (t, y(t − T0 ), . . . , y (n−1) (t − Tn−1 )).

(5.11)

A diferen¸ca com rela¸ca˜o a (5.5) ´e que aqui y (n) no instante t n˜ao depende de y, . . . , y n−1 no mesmo instante t, mas em instantes anteriores. Um exemplo interessante ´e o seguinte. Suponha que y(t) designe a popula¸ca˜o de uma esp´ecie de seres vivos vivendo em um certo habitat. O n´ umero de falecimentos por causas naturais (como doen¸cas) no intervalo t e t+dt ´e tipicamente proporcional a y(t) (justifique!). Assim, se a esp´ecie n˜ao se reproduz, a varia¸ca˜o dy da popula¸ca˜o no intervalo t e t + dt ser´a dy = −αy(t)dt para uma certa constante α, ou seja, y satisfar´a a equa¸ca˜o diferencial y 0 (t) = −αy(t), que ´e uma equa¸ca˜o de primeira ordem sem retardo. Agora, admitamos que a esp´ecie se reproduz. O n´ umero de cruzamentos entre elementos da esp´ecie no intervalo t e t + dt ´e tipicamente proporcional a y(t)2 (justifique!). Se admitirmos que o n´ umero de nascimentos no intervalo entre t e t + dt ´e proporcional ao de cruzamentos ocorridos em

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

267/1304

t − T0 (descontando assim o tempo de gesta¸ca˜o T0 ) a equa¸ca˜o diferencial para y ter´a que ser modificada para y 0 (t) = −αy(t) + β(y(t − T0 ))2 para uma certa constante β. Esta ´e uma equa¸ca˜o de primeira ordem com retardo. H´a v´arios outros tipos de equa¸co˜es com retardo, por exemplo, aquelas onde os tempos de retardo Ti n˜ao s˜ao fixos, mas dependem de t ou mesmo de y. Tais equa¸co˜es aparecem no Eletromagnetismo, onde o retardo ´e devido a` finitude da velocidade da luz. O estudo de equa¸co˜es com retardo requer outros m´etodos que n˜ao aqueles que discutiremos aqui e ´e atualmente assunto ativo de pesquisa, encontrando aplica¸co˜es mesmo fora da F´ısica, em a´reas tais como a Epidemiologia - como o exemplo acima ilustra - onde os retardos s˜ao tipicamente conseq¨ uˆencia quer de tempos de gesta¸ca˜o quer de tempos de latˆencia (de doen¸cas).

5.1.2

Equa¸ co ˜es Ordin´ arias de Segunda Ordem. Exemplos de Interesse

Para futura referˆencia vamos aqui listar uma s´erie de equa¸co˜es diferenciais lineares de segunda ordem de particular interesse. 1. A Equa¸ca ˜o linear de segunda ordem e homogˆenea (forma geral): a(t)¨ y + b(t)y˙ + c(t)y = 0 , com a(t) n˜ao-identicamente nula. 2. Equa¸ca ˜o linear de segunda ordem n˜ ao-homogˆenea (forma geral): a(t)¨ y (t) + b(t)y(t) ˙ + c(t)y(t) = f (t) , com a(t) e f (t) n˜ao-identicamente nulas. 3. A Equa¸ca ˜o de Euler5 : t2 y¨(t) + at y(t) ˙ + by(t) = 0 , onde a e b s˜ao constantes. 4. A Equa¸ca ˜o de Hill6 : y¨(t) + (λ + P (t))y(t) = 0 , onde P (t) ´e uma fun¸ca˜o peri´odica e λ constante. Um caso particular importante ´e o da equa¸ca˜o de Mathieu: 5. A Equa¸ca ˜o de Mathieu7 : y¨(t) + (a + b cos(ωt))y(t) = 0 , com a, b e ω constantes. 5

Leonhard Euler (1707-1783). George William Hill (1838-1914). 7 Emile-L´eonard Mathieu (1835-1890). 6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

6. A Equa¸ca ˜o de Bessel8 : ν∈

x2 y 00 (x) + xy 0 (x) + (x2 − ν 2 )y(x) = 0 ,

. 

7. A Equa¸ca ˜o de Legendre9 : (1 − x2 )y 00 (x) − 2xy 0 (x) + λ(λ + 1)y(x) = 0 , λ∈

, e a equa¸ca ˜o de Legendre associada 

(1 − x2 )y 00 (x) − 2xy 0 (x) + λ(λ + 1)y(x) − λ, µ ∈ 

µ2 y(x) = 0 , 1 − x2

.

8. A Equa¸ca ˜o de Hermite10 : λ∈

y 00 (x) − 2xy 0 (x) + λy(x) = 0 ,

. 

9. A Equa¸ca ˜o de Airy11 : y 00 (x) − xy(x) = 0 . 10. A Equa¸ca ˜o de Laguerre12 : xy 00 (x) + (1 − x)y 0 (x) + λy(x) = 0 , λ∈

, e a Equa¸ca ˜o de Laguerre associada 

xy 00 + (m + 1 − x)y 0 + (n − m)y = 0 , m, n constantes. 11. A Equa¸ca ˜o de Chebyshev13 : (1 − x2 )y 00 (x) − xy 0 (x) + λ2 y(x) = 0 , λ∈ 

.

12. A Equa¸ca ˜o Hipergeom´etrica14 , ou Equa¸ca ˜o de Gauss15 : z(1 − z)y 00 (z) + [c − (1 + a + b)z]y 0 (z) − aby(z) = 0 , a, b, c constantes. 8

Friedrich Wilhelm Bessel (1784-1846). Adrien-Marie Legendre (1752-1833). 10 Charles Hermite (1822-1901). 11 George Biddell Airy (1801-1892). 12 Edmond Nicolas Laguerre (1834-1886). 13 Pafnuty Lvovich Chebyshev (1821-1894). 14 Assim denominada pois uma de suas solu¸ca ˜o envolve uma generaliza¸ca ˜o da s´erie geom´etrica. 15 Carl Friedrich Gauß (1777-1855). 9

268/1304

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

269/1304

13. A Equa¸ca ˜o Hipergeom´etrica Confluente, ou Equa¸ca ˜o de Kummer 16 : zy 00 (z) + [c − z]y 0 (z) − ay(z) = 0 , a, c constantes. O leitor interessado poder´a encontrar no Cap´ıtulo 10, p´agina 544, problemas f´ısicos dos quais emergem algumas das equa¸co˜es listadas acima.

5.2

Sistemas de Equa¸ co ˜es Diferenciais Ordin´ arias

Um sistema de equa¸co˜es diferenciais ordin´arias envolvendo m fun¸co˜es desconhecidas y 1 , . . . , ym de uma vari´avel ´e um conjunto de equa¸co˜es do tipo (n )

y1 1 (t) (n ) y2 2 (t)

(n −1)

(n −1)

0 = F1 (t; y1 , y10 , . . . , y1 1 ; . . . ; ym , ym , . . . , ym m ) , (n −1) (n −1) 0 = F2 (t; y1 , y10 , . . . , y1 1 ; . . . ; ym , ym , . . . , ym m ) , .. . (n1 −1)

(n )

ym m (t) = Fm (t; y1 , y10 , . . . , y1

(n −1)

0 ; . . . ; ym , ym , . . . , ym m

(5.12)

),

onde cada Fi ´e uma fun¸ca˜o de um certo n´ umero de vari´aveis e nk s˜ao n´ umeros inteiros maiores ou iguais a 1. Para cada yj tem-se, portanto, uma equa¸ca˜o de ordem nj , na qual comparecem tamb´em as demais fun¸co˜es yk e suas derivadas de ordem at´e nk − 1. Sistemas de equa¸co˜es diferenciais ordin´arias s˜ao muito freq¨ uentes em F´ısica. Considere-se, por exemplo, um sistema isolado de m part´ıculas de massas Mi e coordenadas x~i , i = 1, . . . , m, interagindo de forma que a part´ıcula j exerce sobre a part´ıcula i uma for¸ca F~ij (x~i − x~j ). A segunda lei de Newton fica X Mi x~¨i (t) = F~ij (x~i (t) − x~j (t)) , j6=i

i = 1, . . . , m, que ´e um sistema de equa¸co˜es diferenciais ordin´arias. • O sistema de Lotka-Volterra

Um outro exemplo de sistema de equa¸co˜es diferenciais ´e o chamado sistema de ca¸ca-presa de Lotka 17 e Volterra18 , empregado no estudo de evolu¸ca˜o de popula¸co˜es19 . Esse sistema ´e da forma p˙ 1 (t) = −α1 p1 (t) + β1 p1 (t)p2 (t) , p˙ 2 (t) = +α2 p2 (t) − β2 p1 (t)p2 (t) 16

(5.13)

Ernst Eduard Kummer (1810-1893). Alfred James Lotka (1880-1949). 18 Vito Volterra (1860-1940). 19 O modelo foi proposto em 1920 por Lotka para o estudo de certas rea¸co ˜es qu´ımicas e em 1926 por Volterra, em uma tentativa de modelar a evolu¸ca ˜o de popula¸co ˜es de peixes e tubar˜ oes do mar Adri´ atico. Para uma referˆencia hist´ orica, vide V. Volterra “Le¸cons sur la Th´eorie Math´ematique de la Lutte pour la Vie”. Gauthier-Villars et Cie., Paris, 1931. 17

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

270/1304

onde αi e βi , i = 1, 2 s˜ao constantes positivas. O sistema de Lotka-Volterra descreve a evolu¸ca˜o de duas popula¸co˜es de acordo com um modelo de intera¸ca˜o entre ca¸ca (a popula¸ca˜o p 1 ) e presa (a popula¸ca˜o p2 ). A id´eia do modelo ´e a seguinte: p1 representa uma popula¸ca˜o que se alimenta da popula¸ca˜o p2 . Esta, alimenta-se de recursos do habitat. Tenha-se em mente, por exemplo, a situa¸ca˜o onde p 1 representa uma popula¸ca˜o de raposas que se alimentam de coelhos, representados por p2 . Estes, sendo herb´ıvoros, alimentam-se de plantas de seu habitat. Se as duas popula¸co˜es est˜ao isoladas, p1 tende a desaparecer (por falta de alimento) exponencialmente com uma taxa α1 . J´a p2 cresce exponencialmente com uma taxa α2 , por n˜ao ter inimigos naturais. Assim, quando as duas popula¸co˜es est˜ao isoladas, suas evolu¸co˜es s˜ao descritas pelo sistema p˙ 1 (t) = −α1 p1 (t) . (5.14) p˙ 2 (t) = +α2 p2 (t) Postas em contato, as popula¸co˜es come¸cam a interagir, e de modo que p1 tem uma chance de sobrevivˆencia por se alimentar de p2 , que ganha agora um predador. As chances de sobrevivˆencia de p1 s˜ao proporcionais ao n´ umero de encontros entre elementos de p1 e de p2 no habitat, pois em um encontros um elemento de p1 pode eventualmente matar um elemento de p2 e, assim, alimentar-se. Esse n´ umero de encontros ´e grosseiramente proporcional ao produto das duas popula¸co˜es p 1 p2 (por que?). Assim, a taxa de sobrevivˆencia de p1 deve ser acrescida de um termo como β1 p1 (t)p2 (t), enquanto que a taxa de sobrevivˆencia de p2 deve ser subtra´ıda de um termo como β2 p1 (t)p2 (t). Esses termos levam ao sistema de Lotka-Volterra acima. O resultado da evolu¸ca˜o de um tal sistema ´e ilustrado na Figura 5.1.

Figura 5.1: A evolu¸ca˜o do sistema de Lotka-Volterra para trˆes condi¸co˜es iniciais distintas. O eixo horizontal ´e a popula¸ca˜o p1 e o vertical p2 . Note que a evolu¸ca˜o se d´a em ciclos peri´odicos fechados, uma caracter´ıstica especial do sistema de Lotka-Volterra. Tamb´em estudado em modelos de ecologia ´e o modelo de competi¸ca ˜o de Lotka-Volterra, descrito

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

271/1304

pelo sistema p˙ 1 (t) = α1 p1 (t) − β1 p1 (t)2 − γ1 p1 (t)p2 (t) . (5.15) p˙ 2 (t) = α2 p2 (t) − β2 p2 (t)2 − γ2 p1 (t)p2 (t) Acima βi e γi s˜ao positivos, mas αi podem ser positivos ou negativos. Na primeira equa¸ca˜o, o termo +α1 p1 (t) descreve o crescimento (ou decrescimento) da popula¸ca˜o p1 por consumir recursos de seu habitat (supostamente ilimitados), se reproduzir e morrer. O termo −β1 p1 (t)2 descreve, por exemplo, a taxa de propaga¸ca˜o de doen¸cas fatais entre elementos da popula¸ca˜o p 1 , que ´e proporcional ao n´ umero de encontros de elementos da esp´ecie p1 com elementos da esp´ecie p1 . Esse n´ umero ´e grosseiramente proporcional a p21 (por que?). O termo −γ1 p1 (t)p2 (t) descreve a competi¸ca˜o entre as duas esp´ecies cujas popula¸co˜es s˜ao p1 e p2 . Tamb´em muito estudados20 s˜ao os modelos do tipo Lotka-Volterra com n esp´ecies, caracterizados pelo sistema de equa¸co˜es n X p˙j (t) = αj pj (t) + βjk pj (t) pk (t) , j = 1, . . . , n . k=1

Mais generalidades sobre o modelo de Lotka-Volterra e sobre outras aplica¸co˜es de equa¸co˜es diferenciais em modelos ecol´ogicos e epidemiol´ogicos podem ser encontradas, por exemplo, em [10] e [2]. Para outra referˆencia sobre o modelo de Lotka-Volterra e assuntos correlatos, vide [68]. Comparados a` realidade dos sistemas biol´ogicos os modelos apresentados acima s˜ao bastante simplificados, deixando de lado v´arios efeitos possivelmente relevantes, tais como reprodu¸ca˜o sexuada (machos s´o se reproduzem com fˆemeas, n˜ao com outros machos, fˆemeas idem), imunidade ou n˜ao a doen¸cas por parte das popula¸co˜es, tempos de gesta¸ca˜o, ausˆencia de reprodu¸ca˜o durante a gesta¸ca˜o, tempos de latˆencia de doen¸cas, limita¸ca˜o dos recursos do habitat, surgimento aleat´orio de muta¸co˜es e v´arios outros fatores. H´a toda uma a´rea de pesquisa voltada a` modelagem realista de sistemas biol´ogicos e eco-sistemas. Alguns modelos estudados chegam a ser extremamente complexos, envolvendo dezenas de equa¸co˜es e de inc´ognitas. Para uma referˆencia atualizada sobre modelagem de sistemas biol´ogicos, vide [10] ou [68]. • Sistemas de primeira ordem O sistema de equa¸co˜es diferenciais ordin´arias mais b´asico ´e o de primeira ordem: y˙1 (t) y˙2 (t)

= F1 (t, y1 , . . . , ym ) , = F2 (t, y1 , . . . , ym ) , .. .

(5.16)

y˙m (t) = Fm (t, y1 , . . . , ym ) , ´ conveniente simplificarmos um pouco a express˜ao onde cada Fi ´e uma fun¸ca˜o de m + 1 vari´aveis. E (5.16). Introduzindo os vetores de m componentes   y1  ..  Y =  .  ∈ m ym 

20

Para um trabalho recente, vide P. Duarte R. L. Fernandez e W. M. Oliva “Dynamics on the attractor of the LotkaVolterra equations”. J. Diff. Equations 149, 143-189 (1998) e referˆencias l´ a citadas.

JCABarata. Curso de F´ısica-Matem´ atica

e as fun¸co˜es F :

m+1 

a express˜ao (5.16) fica



Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

272/1304

m 

   F1 (t, Y ) F1 (t, y1 , . . . , ym )     .. .. F (t, Y ) =    =  . . Fm (t, Y ) Fm (t, y1 , . . . , ym ) 

Y˙ (t) = F (t, Y (t)) .

(5.17)

Como veremos logo adiante, todo sistema de equa¸co˜es diferenciais ordin´arias pode ser escrito como um sistema equa¸co˜es diferenciais ordin´arias de primeira ordem, escrito quer na forma (5.16), quer na forma (5.17), para algum m e para alguma fun¸ca˜o F : m+1 → m . 



• Sistemas lineares de primeira ordem Muito importantes s˜ao os sistemas de m equa¸co˜es diferenciais ordin´arias lineares de primeira ordem, os quais tˆem a forma y˙ 1 (t) y˙ 2 (t)

= a11 (t)y1 (t) + · · · + a1m (t)ym (t) + b1 (t) , = a21 (t)y1 (t) + · · · + a2m (t)ym (t) + b2 (t) , .. .

(5.18)

y˙ m (t) = am1 (t)y1 (t) + · · · + amm (t)ym (t) + bm (t) , para certas fun¸co˜es aij e bj de t. No casos em que as fun¸co˜es bj acima s˜ao identicamente nulas o sistema ´e dito ser homogˆeneo. Caso contr´ario, ´e dito ser n˜ ao-homogˆeneo. • Representa¸ c˜ ao matricial de sistemas lineares Como veremos, ´e muito conveniente escrever o sistema linear (5.18) acima em nota¸ca ˜o matricial. De fato, definindo,       y1 (t) a11 (t) · · · a1m (t) b1 (t)      ..  , .. Y (t) =  ...  , A(t) :=  ... B(t) =  ...  , . .  ym (t) am1 (t) · · · amm (t) bm (t)

podemos escrever o sistema (5.18) como

Y˙ (t) = A(t)Y (t) + B(t) , como facilmente se vˆe. Sistemas lineares de primeira ordem ser˜ao estudados em detalhe no Cap´ıtulo 7 onde, em particular, faremos uso abundante da nota¸ca˜o matricial acima. • Equivalˆ encia entre equa¸ co ˜es de ordem n e sistemas de EDOs

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 5

Vers˜ ao de 29 de setembro de 2005.

273/1304

Provaremos agora um fato simples, mas de grande relevˆancia, tanto te´orica quanto em aplica¸co˜es (anal´ıticas ou num´ericas), a saber, que toda equa¸ca˜o diferencial ordin´aria de ordem n ´e equivalente a um sistema de n equa¸co˜es de primeira ordem. Seja a equa¸ca˜o diferencial ordin´aria de ordem n y (n) (t) = F (t, y(t), . . . , y (n−1) (t)) .

(5.19)

Definindo yk (t) := y (k−1) (t), para todo k = 1, . . . , n, teremos y1 (t) = y(t) e y˙ 1 (t) y˙ 2 (t)

= y2 (t) , = y3 (t) , .. .

(5.20)

y˙ n−1 (t) = yn (t) , y˙ n (t) = F (t, y1 (t), . . . , yn (t)) . E. 5.1 Exerc´ıcio. Verifique!

6

Este ´e um sistema como (5.16), onde, aqui, F1 (t, y1 , . . . , yn ) F2 (t, y1 , . . . , yn )

= y2 , = y3 , .. .

Fn−1 (t, y1 , . . . , yn ) = yn , Fn (t, y1 , . . . , yn ) = F (t, y1 (t), . . . , yn (t)) . Isso mostra que toda equa¸ca˜o diferencial ordin´aria de ordem n, como (5.19), equivale a um sistema de n equa¸co˜es de primeira ordem, como (5.20). E. 5.2 Exerc´ıcio importante. Seja a equa¸c˜ao diferencial ordin´aria linear de ordem n y (n) (t) + an−1 (t)y (n−1) (t) + · · · + a1 (t)y 0 (t) + a0 (t)y(t) = f (t) . Determine o sistema linear de n equa¸co˜es de primeira ordem equivalente e mostre que o mesmo pode ser escrito na forma matricial Y˙ (t) = A(t)Y (t) + B(t) , onde



y(t) y 0 (t) .. .



      Y (t) :=   ,  (n−2)  y (t) (n−1) y (t)



0 0 .. .



      B(t) :=      0  f (t)

JCABarata. Curso de F´ısica-Matem´ atica

e A(t) ´e a matriz n × n

A(t)

:=

                  

0

1

Cap´ıtulo 5

Vers˜ ao de 29 de setembro de 2005.

0

0

0

1

.. .

.. .

..

0

0

0

0

0 0

···

0

···

0 .. .

..

.

..

0

..

.

1

0

0

···

0

1

.

−a0 (t) −a1 (t) −a2 (t)

···

.

−an−2 (t) −an−1 (t)

Equa¸c˜ao matriciais como a de acima ser˜ao estudadas com mais detalhe no Cap´ıtulo 7.

274/1304



          .         6

E. 5.3 Exerc´ıcio. Mostre que todo sistema de equa¸co˜es diferenciais ordin´arias como (5.12) equivale a um sistema de equa¸co˜es de primeira ordem. Sugest˜ ao: use a mesma id´eia de acima, dando nomes `as (nj )

derivadas yi

5.3

que aparecem no lado direito de (5.12).

6

Discuss˜ ao sobre Problemas de Valor Inicial

• Problemas de valor inicial Como ´e bem sabido, a solu¸ca˜o da equa¸ca˜o diferencial y(t) ˙ = y(t) ´e dada por y(t) = cet, onde c ´e uma constante, a qual pode ser fixada, por exemplo, prescrevendo-se o valor da fun¸ca˜o y em t = 0: y(0). H´a outros exemplos simples em que a necessidade de fixa¸ca˜o de certos valores para a fun¸ca˜o y pode ser vista de modo expl´ıcito. Considere-se a equa¸ca˜o do oscilador harmˆonico simples x¨ +ω 02 x = 0. A solu¸ca˜o geral dessa equa¸ca˜o ´e x(t) = A cos(ω0 t) + B sen (ω0 t), onde A e B s˜ao duas constantes arbitr´arias. Para determin´a-las ´e preciso fornecer duas informa¸co˜es extra sobre a fun¸ca˜o, por exemplo, sua posi¸ca˜o e sua velocidade em um instante de tempo. Se x0 e v0 forem a posi¸ca˜o e velocidade no instante t = 0, ent˜ao ´e f´acil constatar que A = x0 e B = v0 /ω0 . Outro par de informa¸co˜es ´e tamb´em eventualmente poss´ıvel. Por exemplo, podemos fornecer posi¸ca˜o e velocidade em outro instante de tempo que n˜ao t = 0, ou em dois instantes de tempo distintos, um para a posi¸ca˜o, outro para a velocidade. Em muitos casos ´e poss´ıvel fixar a solu¸ca˜o desejada informando apenas a posi¸ca˜o em dois instantes de tempo distintos ou as velocidades em dois instantes de tempo distintos. De modo geral, para a determina¸ca˜o completa da solu¸ca˜o de uma equa¸ca˜o diferencial ordin´aria de ordem n ´e preciso fornecer n informa¸co˜es sobre o valor da fun¸ca˜o e/ou suas derivadas em certos instantes21 . 21 Uma exce¸ca ˜o not´ avel ´e a equa¸ca ˜o de Clairaut, discutida na Se¸ca ˜o 6.8, p´ agina 301, que possui uma solu¸ca ˜o, dita solu¸ca ˜o singular, n˜ ao depende de nenhum parˆ ametro livre.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

275/1304

O tipo de situa¸ca˜o mais comum para a determina¸ca˜o completa da solu¸ca˜o de uma equa¸ca˜o diferencial ordin´aria de ordem n, especialmente em problemas da Mecˆanica, ´e aquele na qual s˜ao fornecidas informa¸co˜es sobre a fun¸ca˜o e suas n − 1 primeiras derivadas em um u ´ nico instante de tempo, digamos t = 0. Tais problemas s˜ao conhecidos como problemas de valor inicial, ou problemas de Cauchy 22 . O exemplo do oscilador harmˆonico acima ´e um t´ıpico problema de valor inicial: qual ´e a fun¸ca˜o que satisfaz a equa¸ca˜o diferencial x¨ + ω02 x = 0 e satisfaz x(0) = x0 e v(0) = v0 , para certos n´ umeros x0 e v0 dados? Resposta: x(t) = x0 cos(ω0 t) + (v0 /ω0 ) sen (ω0 t). Assim, o problema de valor inicial associado a` equa¸ca˜o de ordem n y (n) (t) = F (t, y(t), . . . , y (n−1) (t)) . consiste em determinar a solu¸ca˜o dessa equa¸ca˜o que satisfa¸ca y(0) = y1 ,

y(0) ˙ = y2 ,

y¨(0) = y3 , . . . , y (n−1) (0) = yn ,

para certos n´ umeros dados y1 , . . . , yn , os quais s˜ao denominados condi¸co ˜es iniciais ou dados iniciais. Ap´os definirmos o que se entende por problema de valor inicial, uma s´erie de quest˜oes se coloca. 1. Todo problema de valor inicial tem solu¸ca˜o? 2. Se tiver, ´e u ´ nica? 3. H´a condi¸co˜es suficientes para garantir que uma solu¸ca˜o exista? 4. E para que seja u ´ nica? 5. E se existir solu¸ca˜o, ser´a ela v´alida para todo t? 6. H´a condi¸co˜es suficientes para garantir que uma solu¸ca˜o exista para todo t? 7. H´a condi¸co˜es suficientes para garantir continuidade da solu¸ca˜o em rela¸ca˜o a`s condi¸co˜es iniciais? 8. H´a condi¸co˜es suficientes para garantir continuidade da solu¸ca˜o em rela¸ca˜o aos parˆametros que ocorrem na equa¸ca˜o? Por v´arias raz˜oes as quest˜oes acima s˜ao muito importantes. Naturalmente, a melhor maneira de mostrar que um problema de valor inicial tem solu¸ca˜o ´e exibindo a solu¸ca˜o. Isso, por´em, nem sempre ´e fact´ıvel, pois muitas equa¸co˜es s˜ao dif´ıceis, ou mesmo imposs´ıveis, de se resolver de modo expl´ıcito. Por exemplo, a equa¸ca˜o do pˆendulo simples θ¨ + gl sen (θ) = 0 tem solu¸ca˜o para quaisquer condi¸co˜es iniciais, mas essa solu¸ca˜o n˜ao pode ser apresentada de forma fechada em termos de fun¸co˜es elementares conhecidas, apenas em termos de expans˜oes ou das chamadas fun¸co˜es el´ıpticas. Vide, por exemplo, [78]. (Para um tratamento da equa¸ca˜o do pˆendulo em termos de equa¸co˜es integrais, vide Se¸ca˜o 17.2, p´agina 889, destas Notas). Da´ı a importˆancia da quest˜ao 3: ´e muitas vezes necess´ario saber a priori se uma solu¸ca˜o existe antes de tentar encontr´a-la. Saber a priori se um problema de valor inicial tem solu¸ca˜o e se essa solu¸ca˜o ´e u ´ nica pode ser importante para justificar m´etodos de solu¸ca˜o. Muitas vezes, ao encontrarmos a solu¸ca˜o de um problema de valor inicial perguntamo-nos se a solu¸ca˜o encontrada ´e u ´ nica. Por exemplo, pode-se facilmente constatar que as fun¸co˜es x(t) = x0 cos(ω0 t) + (v0 /ω0 ) sen (ω0 t) s˜ao solu¸co˜es da equa¸ca˜o do oscilador harmˆonico simples x¨ + ω02 x = 0 com as condi¸co˜es iniciais x(0) = x0 e v(0) = v0 . O que, por´em, garante que n˜ao h´a outras fun¸co˜es que tamb´em sejam solu¸ca˜o dessa equa¸ca˜o para essas condi¸co˜es iniciais? Nisso reside a importˆancia da quest˜ao 4: em se sabendo a priori que a solu¸ca˜o ´e u ´ nica (esse ´e o caso para a equa¸ca˜o do oscilador harmˆonico simples) n˜ao ´e necess´ario procurar outras solu¸co˜es. Equa¸co˜es diferenciais de interesse em F´ısica tipicamente dependem de certos parˆametros. Por exemplo, a equa¸ca˜o do oscilador harmˆonico simples, acima, depende do parˆametro ω 0 , a equa¸ca˜o do pˆendulo simples depende de g/l. Saber se a dependˆencia de uma solu¸ca˜o depende continuamente 22

Augustin Louis Cauchy (1789-1857).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

276/1304

de condi¸co˜es iniciais ou de parˆametros ´e importante em aplica¸co˜es, por exemplo em F´ısica, pois em problemas reais tais dados s˜ao freq¨ uentemente fornecidos com imprecis˜oes e ´e, portanto, importante poder garantir que erros pequenos no conhecimento dessas grandezas tˆem efeitos igualmente pequenos nas solu¸co˜es (ao menos para tempos n˜ao muito afastados do instante inicial). Comecemos por dizer que a resposta a`s quest˜oes 1 e 2 ´e negativa. Veremos exemplos logo adiante. Uma resposta a`s quest˜oes 3 e 4 ser´a apresentada na forma de dois teoremas importantes, o de Peano (Teorema 5.1, p´agina 280), que fornece condi¸co˜es suficientes para garantir existˆencia de solu¸co˜es, e o de Picard-Lindel¨of (Teorema 5.2, p´agina 281. Vide tamb´em sua generaliza¸ca˜o para espa¸cos de Banach, Teorema 17.3, p´agina 898), que fornece condi¸co˜es suficientes para garantir existˆencia e unicidade de solu¸co˜es. Mostraremos em exemplos que a resposta a` quest˜ao 5 ´e tamb´em negativa. Uma resposta parcial a` quest˜ao 6 (que ´e chamado de problema da existˆencia de solu¸co˜es globais) ser´a discutida na Se¸ca˜o 5.3.3, p´agina 282, e as demonstra¸co˜es dos resultados l´a apresentados encontram-se na Se¸ca˜o 17.3.2, p´agina 902. As quest˜oes 7 e 8 s˜ao discutidas a` p´agina 284 e, com mais detalhe, na Se¸ca˜o 17.3.3, p´agina 903. Vide Teorema 17.6, p´agina 904, sua demonstra¸ca˜o e os coment´arios que se lhe seguem. Referˆencias para v´arias dessas quest˜oes s˜ao [1], [39], [23], [11] e [62]. • Problemas bem-postos Um coment´ario sobre nomenclatura. Na literatura sobre a teoria das equa¸co˜es diferenciais (ordin´arias ou parciais), um problema no qual se possa garantir existˆencia, unicidade e continuidade de solu¸co˜es em rela¸ca˜o a condi¸co˜es iniciais e de contorno em alguma topologia (estabilidade) ´e dito ser um problema bem-posto23 . • Outros problemas que n˜ ao de valor inicial Como j´a mencionamos acima, h´a outros problemas que n˜ao o de valor inicial. Pode-se querer fixar a fun¸ca˜o em dois pontos, por exemplo. Problemas desse tipo s˜ao muito comuns em equa¸co˜es ordin´arias obtidas pelo m´etodo de separa¸ca˜o de vari´aveis em problemas de equa¸co˜es diferenciais parciais com certas condi¸co˜es de contorno. Trataremos abundantemente desse tipo de problema quando discutirmos o Problema de Sturm-Liouville no Cap´ıtulo 12, p´agina 606. Outros problemas envolvem outros tipos de exigˆencia sobre a solu¸ca˜o. Por exemplo, que ela seja finita em certos pontos, ou de quadrado integr´avel. Esse u ´ ltimo caso ´e comummente encontrado na Mecˆanica Quˆantica.

5.3.1

Problemas de Valor Inicial. Patologias e Exemplos a se Ter em Mente

Nesta se¸ca˜o listaremos alguns exemplos instrutivos de problemas de valor inicial que exibem comportamento patol´ogico, como inexistˆencia ou n˜ao-unicidade de solu¸ca˜o ou inexistˆencia de solu¸ca˜o global, ´ instrutivo ter alguns desses exemplos em ou seja, inexistˆencia de solu¸ca˜o v´alida em toda a reta real. E 23

A no¸ca ˜o de prolema bem-posto foi introduzida por Jacques Salomon Hadamard (1865-1963) ao listar propriedades que modelos matem´ aticos de sistemas f´ısicos devem idealmente possuir. Jaques Hadamard: “Sur les probl`emes aux d´eriv´ees partielles et leur signification physique”. Princeton University Bulletin, 49–52 (1902).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

277/1304

mente. Na Se¸ca˜o 5.3.2, p´agina 280, e na Se¸ca˜o 5.3.3, p´agina 282, apresentaremos condi¸co˜es suficientes para evitar essas patologias. • Inexistˆ encia de solu¸ c˜ ao Exemplo 5.5 (Inexistˆencia de solu¸ca˜o) Considere-se o problema de valor inicial no qual procura-se a solu¸ca˜o da equa¸ca˜o 1 y(t) ˙ = t que satisfa¸ca a condi¸ca˜o inicial y(0) = 0. Esse problema n˜ao possui nenhuma solu¸ca˜o. ◊ E. 5.4 Exerc´ıcio. Mostre isso.

6

Exemplo 5.6 (Inexistˆencia de solu¸ca˜o) Considere-se o problema de valor inicial no qual procura-se a solu¸ca˜o da equa¸ca˜o 1 y(t) ˙ = − y(t) que satisfa¸ca a condi¸ca˜o inicial y(0) = 0. Esse problema n˜ao possui nenhuma solu¸ca˜o que seja real para t > 0. ◊ E. 5.5 Exerc´ıcio. Mostre isso.

6

Exemplo 5.7 (Inexistˆencia de solu¸ca˜o) Considere-se o problema de valor inicial no qual procura-se a solu¸ca˜o da equa¸ca˜o p y(t) ˙ = 1 − y(t)2

que satisfa¸ca a condi¸ca˜o inicial y(0) = 2. Esse problema n˜ao possui nenhuma solu¸ca˜o real. E. 5.6 Exerc´ıcio. Mostre isso.



6

Exemplo 5.8 (Inexistˆencia de solu¸ca˜o) (De [65]) Considere-se o problema de valor inicial no qual procura-se a solu¸ca˜o da equa¸ca˜o y(t) ˙ = H(y(t)) , onde H(y) :=



1, y < 0 , −1, y ≥ 0

com a condi¸ca˜o inicial y(0) = 0. Esse problema n˜ao possui nenhuma solu¸ca˜o. Para entender por que, observe que se y(0) = 0 ent˜ao, pela equa¸ca˜o diferencial, y 0 (0) = −1, o que implica y(t) ´e decrescente para t pr´oximo de 0, tornando-se negativa para t positivo pr´oximo de 0. Mas para y negativo y(t) ˙ vale 1 e y ´e crescente, uma contradi¸ca˜o. ◊ E. 5.7 Exerc´ıcio. Certo?

6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

278/1304

Exemplo 5.9 (Inexistˆencia de solu¸ca˜o) Considere-se o problema de valor inicial no qual procura-se a solu¸ca˜o da equa¸ca˜o y(t) ˙ = 2(y(t))3/2 que satisfa¸ca a condi¸ca˜o inicial y(0) = 1. Esse problema n˜ao possui nenhuma solu¸ca˜o real. E. 5.8 Exerc´ıcio. Mostre isso.

◊ 6

• N˜ ao-unicidade de solu¸ co ˜es Exemplo 5.10 (N˜ao-unicidade de solu¸co˜es) Considere-se o problema de valor inicial no qual procurase a solu¸ca˜o da equa¸ca˜o y(t) ˙ = 3(y(t))2/3 que satisfa¸ca a condi¸ca˜o inicial y(0) = 0. Esse problema n˜ao tem solu¸ca˜o u ´ nica. Por exemplo, as fun¸co˜es y1 (t) ≡ 0 e y2 (t) = t3 ambas satisfazem a equa¸ca˜o diferencial e y1 (0) = y2 (0) = 0. E. 5.9 Exerc´ıcio. Verifique!

◊ 6

O Exemplo 5.10, acima, foi encontrado por Peano em 1890. H´a v´arias outras solu¸co˜es, como vemos na seguinte generaliza¸ca˜o. Exemplo 5.11 (N˜ao-unicidade de solu¸co˜es) Seja 0 < β < 1. Considere-se o problema de valor inicial no qual procura-se a solu¸ca˜o da equa¸ca˜o y(t) ˙ =

1 |y(t)|β 1−β

que satisfa¸ca a condi¸ca˜o inicial y(0) = 0. Esse problema n˜ao tem solu¸ca˜o u ´ nica: a fun¸ca˜o y(t) ≡ 0, ∀t ∈ , assim como, para todos c1 ≤ 0, c2 ≥ 0, as fun¸co˜es  1  −(c1 − t) 1−β , t ≤ c1      0, c1 < t < c 2 , yc1 , c2 (t) = (5.21)      1  (t − c ) 1−β , t ≥ c2 2   1 t < c2  −(c1 − t) 1−β , t ≤ c1  0, yc1 (t) = , yc2 (t) = (5.22) 1   1−β 0, t > c1 (t − c2 ) , t ≥ c2 

satisfazem a equa¸ca˜o diferencial e anulam-se em t = 0.



E. 5.10 Exerc´ıcio. Verifique! Desenhe gr´aficos de v´arias fun¸co˜es y c1 , c2 (t), yc1 (t) e yc2 (t) para v´arios valores de c1 ≤ 0, c2 ≥ 0. 6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

279/1304

• Inexistˆ encia de solu¸ co ˜es globais Exemplo 5.12 (Solu¸ca˜o que s´o existe em um intervalo finito) A equa¸ca˜o diferencial ´e aquela apresentada no Exemplo 5.8, acima, com condi¸ca˜o inicial y(0) = y0 > 0. Para −∞ < t < y0 a solu¸ca˜o ´e y(t) = y0 − t mas para t ≥ y0 surge a contradi¸ca˜o discutida no Exemplo 5.8 e a equa¸ca˜o diferencial n˜ao mais possui solu¸ca˜o. ◊ Exemplo 5.13 (Solu¸ca˜o que diverge em tempo finito) Considere-se o problema de valor inicial no qual procura-se a solu¸ca˜o real da equa¸ca˜o y(t) ˙ = y(t)2 , t∈

, que satisfa¸ca a condi¸ca˜o inicial y(0) = y0 ∈ 



y(t) =

, y0 6= 0. A solu¸ca˜o ´e 1 y0

1 −t

a qual diverge para t = 1/y0 . Exemplo 5.14 (Solu¸ca˜o que diverge em tempo finito) Considere-se a equa¸ca˜o diferencial

(5.23) ◊

y(t) ˙ = 1 + y(t)2 , t ∈ . Sua solu¸ca˜o ´e y(t) = tan(t + k), onde k ´e fixada por uma condi¸ca˜o inicial. Se, por exemplo, tomarmos y(0) = y0 , ent˜ao k = arctan(y0 ). Essa solu¸ca˜o, por´em, existe apenas no intervalo aberto (−k − π2 , −k + π2 ), pois tan(t + k) diverge nos extremos. ◊ 

Exemplo 5.15 (Solu¸ca˜o que diverge em tempo finito) Considere-se uma part´ıcula de massa m que se move em uma dimens˜ao sob a a¸ca˜o de um potencial repulsivo U (x) = − k4 x4 , com k > 0, com condi¸ca˜o inicial x(0) = 0, x(0) ˙ = v0 > 0. Sua equa¸ca˜o de movimento (a segunda lei de Newton) ´e x¨(t) − k 0 x(t)3 = 0 , onde k 0 = k/m. Qual o tempo que essa part´ıcula leva para, partindo de x(0) = 0, chegar ao infinito? A resposta ´e Z ∞ dx q T0→∞ = , 2 k 4 0 E + x m 4 mv02 2

> 0 ´e a energia mecˆanica da part´ıcula.



E. 5.11 Exerc´ıcio. Justifique a express˜ao dada acima para T 0→∞ .

6

onde E =

Para E > 0 a integral acima ´e finita (Justifique!). Logo, a part´ıcula leva um tempo finito para chegar ao infinito, ou seja, x(t) diverge em tempo finito. Isso mostra que a solu¸ca˜o da equa¸ca˜o diferencial x¨(t) − k 0 x(t)3 = 0, com k 0 > 0 e v0 > 0, existe apenas em um intervalo finito de valores de t. E. 5.12 Exerc´ıcio. Mostre que o mesmo se passa com as equa¸co˜es diferenciais x¨(t) − k 0 x(t)d = 0, para todo d > 1, desde que k 0 > 0. O que acontece se k 0 < 0? O que acontece se k 0 > 0 mas d ≥ 1? 6

JCABarata. Curso de F´ısica-Matem´ atica

5.3.2

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

280/1304

Teoremas de Existˆ encia e Unicidade de Solu¸ co ˜es

Os v´arios exemplos dados acima n˜ao devem causar uma impress˜ao negativa sobre problemas de valor inicial pois, em verdade, os mesmos refletem patologias nem sempre encontradas na “pr´atica” (entendase, na F´ısica). No caso da Mecˆanica, por exemplo, assim como em outras a´reas da F´ısica, pode-se garantir existˆencia e unicidade de solu¸ca˜o da “maioria” dos problemas de valor inicial. Os exemplos de acima advertem-nos, por´em, da necessidade de alguns teoremas gerais que forne¸cam pelo menos condi¸co˜es suficientes para garantir existˆencia e/ou unicidade de problemas de valor inicial. Na teoria das equa¸co˜es diferenciais ordin´arias os mais importantes desses teoremas s˜ao os de Peano 24 e de Picard25 Lindel¨of26 , os quais enunciaremos agora. Teorema 5.1 Teorema de Peano (Existˆ encia de Solu¸ co ˜es). Seja a equa¸ca ˜o diferencial ordin´ aria real de primeira ordem y(t) ˙ = F (t, y(t)) (5.24) (F sendo n˜ ao-identicamente nula) com a condi¸ca ˜o inicial y(t0 ) = y0 . com y0 ∈ 

. Seja F :

2 

→ 

(5.25)

cont´ınua no retˆ angulo fechado

R = { (t, y) : |t − t0 | ≤ a, |y − y0 | ≤ b } ,

(5.26)

com a, b > 0, sendo, portanto, limitada em R. Seja M := max |F (t, y)| . (t, y)∈R

(5.27)

Ent˜ ao, o problema de valor inicial descrito pelas rela¸co ˜es (5.24) e (5.25) apresenta pelo menos uma solu¸ca ˜o. Al´em disso, essa solu¸ca ˜o existe pelo menos no intervalo fechado [t 0 − β, t0 + β], onde   b β := min a, . (5.28) M 2 Em essˆencia, o que esse teorema afirma ´e que se pode garantir a existˆencia de solu¸co˜es do problema de valor inicial descrito pelas rela¸co˜es (5.24) e (5.25) se pelo menos a fun¸ca˜o F for cont´ınua em um retˆangulo centrado na condi¸ca˜o inicial. A prova desse teorema, que ´e baseada no importante teorema de Ascoli-Arzel`a, n˜ao ser´a apresentada aqui e remetemos os estudantes aos bons livros (por exemplo, [39], [1], [23], [11] ou [62]). O estudante pode (deve) verificar que os Exemplos 5.5 a 5.9, p´agina 277, n˜ao satisfazem as condi¸co˜es do Teorema de Peano, da´ı n˜ao haver solu¸ca˜o naqueles casos. 24

Giuseppe Peano (1858-1932). O Teorema de Peano data de 1886. ´ Charles Emile Picard (1856-1941). 26 Ernst Leonard Lindel¨ of (1870-1946). Seus trabalhos sobre existˆencia e unicidade de solu¸co ˜es de equa¸co ˜es diferenciais ordin´ arias datam de 1890. 25

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

281/1304

O teorema de Peano garante condi¸co˜es suficientes para existˆencia, mas n˜ao para unicidade de solu¸ca˜o. O estudante tamb´em pode (deve) verificar que os Exemplos 5.10 e 5.11, p´agina 278 acima, ´ preciso requerer satisfazem as condi¸co˜es do teorema de Peano, mas para eles n˜ao vale a unicidade. E mais da fun¸ca˜o F para ter-se unicidade da solu¸ca˜o. Isso ´e obtido com o pr´oximo teorema. Teorema 5.2 Teorema de Picard-Lindel¨ of (Existˆ encia e Unicidade de Solu¸ co ˜es). Seja a equa¸ca ˜o diferencial ordin´ aria real de primeira ordem y(t) ˙ = F (t, y(t)) (F :

2 

→ 

(5.29)

sendo n˜ ao-identicamente nula) com a condi¸ca ˜o inicial y(t0 ) = y0 ,

com y0 ∈ 

. Seja F :

2 

→ 

(5.30)

cont´ınua no retˆ angulo fechado

R = { (t, y) : |t − t0 | ≤ a, |y − y0 | ≤ b } ,

(5.31)

com a, b > 0, sendo, portanto, limitada em R. Seja M := max |F (t, y)| .

(5.32)

(t, y)∈R

˜o ao seu segundo argumento, ou seja, Suponha ainda que F seja Lipschitz cont´ınua em R com rela¸ca existe uma constante k (denominada constante de Lipschitz) tal que para todos (t, y), (t, v) ∈ R valha |F (t, y) − F (t, v)| ≤ k |y − v| .

(5.33)

Ent˜ ao, o problema de valor inicial descrito pelas rela¸co ˜es (5.29) e (5.30) apresenta uma u ´nica solu¸ca ˜o. Al´em disso, essa solu¸ca ˜o existe pelo menos no intervalo fechado [t 0 − β, t0 + β], onde   b β := min a, . (5.34) M Uma condi¸ca ˜o suficiente para que a condi¸ca ˜o de Lipschitz acima se cumpra ´e que ∂ y f (t, y) exista e seja limitada em todo R , em cujo caso a constante de Lipschitz seria dada por k := sup |∂y f (t, y)|. (t, y)∈R

2 A prova do Teorema de Picard-Lindel¨of ser´a apresentada com bastante generalidade no Cap´ıtulo 17, p´agina 881. Vide Teorema 17.3, p´agina 898. ´ importante notar que a condi¸ca˜o de F ser Lipschitz27 cont´ınua em R com rela¸ca˜o ao seu segundo E argumento pode ser obtida de uma condi¸ca˜o mais forte, a saber, que a derivada parcial ∂ y F (t, y) de F em rela¸ca˜o ao segundo argumento seja cont´ınua em R. De fato, da rela¸ca˜o Z v F (t, v) − F (t, u) = ∂y F (t, y) dy , u

27

Rudolf Otto Sigismund Lipschitz (1832-1903).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

282/1304

segue facilmente que F (t, v) − F (t, u) ≤ k|v − u|, onde k := max |∂y F (t, y)|, que ´e uma constante (t, y)∈R

finita se ∂y F (t, y) for cont´ınua em R. Assim, em essˆencia, o que o Teorema de Picard-Lindel¨of afirma ´e que se pode garantir a existˆencia e a unicidade de solu¸co˜es do problema de valor inicial descrito pelas rela¸co˜es (5.29) e (5.30) se pelo menos a fun¸ca˜o F e sua derivada parcial ∂ y F (t, y) forem cont´ınuas em um retˆangulo centrado na condi¸ca˜o inicial. Como coment´ario final, afirmamos que os teoremas de Peano e Picard-Lindel¨of podem ser facilmente estendidos para sistemas de equa¸co˜es diferenciais de primeira ordem (em verdade, o Teorema 17.3, p´agina 898, j´a ´e enunciado com essa generalidade). Como toda equa¸ca˜o diferencial de ordem n ´e equivalente a um tal sistema, essas generaliza¸co˜es garantem condi¸co˜es suficientes para existˆencia ou unicidade de solu¸ca˜o de equa¸co˜es diferenciais ordin´arias de qualquer ordem. No caso de equa¸co˜es diferenciais parciais n˜ao existem teoremas t˜ao fortes relativos a` existˆencia e unicidade de problemas de valor inicial como h´a no caso de equa¸co˜es diferenciais ordin´arias. Um dos resultados mais importantes nessa dire¸ca˜o, por´em, ´e o Teorema de Cauchy-Kovalevskaya 28 . Seu enunciado e sua demonstra¸ca˜o podem ser encontrados, por exemplo, em [27, 28].

5.3.3

Solu¸ co ˜es Globais

Vimos nos Exemplos 5.12 a 5.15 (p´agina 279) que h´a equa¸co˜es diferencias cujas solu¸co˜es, ainda que existam e sejam eventualmente u ´ nicas, n˜ao s˜ao globais, ou seja, n˜ao podem ser definidas em toda reta real. A quest˜ao que naturalmente se coloca ´e a de encontrar condi¸co˜es suficientes para garantir a existˆencia de solu¸co˜es globais. Essa ´e uma vasta quest˜ao e nos limitaremos aqui a apresentar o resultado mais simples, o Teorema 5.3, abaixo. Igualmente importante ´e a quest˜ao de se demonstrar que uma determinada equa¸ca˜o diferencial n˜ao possui solu¸co˜es globais (se tal puder ser o caso). Um dos principais resultados da Teoria da Relatividade Geral e da Cosmologia, a existˆencia do chamado “big bang” em uma classe bastante grande de modelos para o universo, foi tratado como um problema de n˜ao-existˆencia de solu¸co˜es globais de determinadas equa¸co˜es diferenciais. Vide [56]. O seguinte teorema, cuja demonstra¸ca˜o ´e apresentada com mais generalidade na Se¸ca˜o 17.3.2, p´agina 902, apresenta condi¸co˜es suficientes para a existˆencia de solu¸co˜es globais. Teorema 5.3 (Existˆ encia e unicidade de solu¸ co ˜es globais) Seja F : 2 → cont´ınua em todo 2 . Suponhamos tamb´em que para todo a > 0, a fun¸ca ˜o F seja Lipschitz cont´ınua em rela¸ca ˜o ao seu segundo argumento na faixa  Fa, t0 = (t, y) ∈ 2 : |t − t0 | ≤ a , y ∈ arbitr´ ario , 









ou seja, para cada a > 0 existe uma constante ka (eventualmente dependente de a e denominada constante de Lipschitz) tal que para todos (t, y), (t, v) ∈ Fa, t0 vale |F (t, y) − F (t, v)| ≤ ka |y − v|. Ent˜ ao, para qualquer x0 ∈ , o problema de valor inicial x(t) ˙ = F (t, x(t)) com x(t0 ) = x0 apresenta uma solu¸ca ˜o u ´nica v´ alida para todo t ∈ . 



Uma condi¸ca ˜o suficiente para que a condi¸ca ˜o de Lipschitz acima se cumpra ´e que ∂ y F (t, y) exista em todo 2 e seja limitada em cada faixa Fa, t0 , em cujo caso as constantes de Lipschitz podem ser escolhidas como ka := sup |∂y F (t, y)|. 2 

(t, y)∈Fa, t0

28

Sofia Vasilyevna Kovalevskaya (1850-1891).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

283/1304

E. 5.13 Exerc´ıcio. Mostre que a equa¸c˜ao diferencial n˜ao-linear x˙ = cos(x) satisfaz as condi¸co˜es do Teorema 5.3 e, portanto, possui solu¸co˜es globais. Mostre explicitamente, por integra¸c˜ao, que as solu¸co˜es s˜ao dadas por x(t) = arctan ( senh (t + c)), onde c ´e uma constante a ser fixada pela condi¸c˜ao inicial. Por 6 essa express˜ao expl´ıcita contata-se claramente que as solu¸co˜es existem para todo t ∈ . 

E. 5.14 Exerc´ıcio(de [22]). Mostre que a equa¸c˜ao diferencial n˜ao-linear x˙ =

x3 e t + t2 cos(x) 1 + x2

satisfaz as condi¸co˜es do Teorema 5.3. Sugest˜ao: mostre que para esse caso (y 4 + 3y 2 ) t ∂F (t, y) = e − t2 sen (y) e, portanto, em cada faixa Fa, t0 , 2 ∂y (1 + y ) e podemos adotar ka = 3ea + a2 para cada a > 0.

∂F ≤ 3ea + a2 , (t, y) ∂y

6

E. 5.15 Exerc´ıcio. A equa¸c˜ao diferencial n˜ao-linear x˙ = x 2 n˜ao satisfaz as condi¸co˜es do Teorema 5.3, pois a condi¸c˜ao de Lipschitz requerida n˜ao ´e satisfeita em nenhuma faixa F a, t0 . Mostre isso. Com efeito, vimos no Exemplo 5.13, da p´agina 279 que essa equa¸c˜ao n˜ao possui solu¸co˜es globais. Vide tamb´em os coment´arios da p´agina 284 sobre esse problema. 6 E. 5.16 Exerc´ıcio. Fa¸ca o mesmo para o Exemplo 5.14, p´agina 279.

6

• Coment´ arios sobre solu¸ co ˜es globais. O Exemplo 5.10 Analisemos agora o Exemplo 5.10, p´agina 278 sob a luz dos Teoremas de Peano e de Picard-Lindel¨of. Aqui, F (t, y) = 3y 2/3 , t0 = 0, y0 = 0. Tomando-se um retˆangulo fechado centrado em (t0 , y0 ) = (0, 0), ou seja, R = { (t, y) : |t| ≤ a, |y| ≤ b }, constata-se elementarmente que F ´e cont´ınua e que M := max |F (t, y)| = (t, y)∈R

max 3y 2/3 = 3b2/3 .

y∈[−b, b]

Assim, o Teorema de Peano n garante o a existˆencia de solu¸ca˜o para o intervalo fechado [−β, β], onde  b b1/3 β := min a, M = min a, 3 (vide (5.28)). Os valores de a e de b podem ser escolhidos arbitrariamente grandes, sem violar a condi¸ca˜o de continuidade de F . Conclui-se disso que podemos tomar β arbitrariamente grande. Assim, nesse particular exemplo, o Teorema de Peano garante-nos a existˆencia de uma solu¸ca˜o global, para todo t. Isso condiz com a observa¸ca˜o que a solu¸ca˜o identicamente nula, bem como as solu¸co˜es (5.21) e (5.22) existem para todo t. Por fim, ´e f´acil verificar que a fun¸ca˜o F (t, y) = 3y 2/3 n˜ao satisfaz a condi¸ca˜o de Lipschitz |F (t, y) − F (t, v)| ≤ k|y − v| para nenhum k em nenhum retˆangulo centrado em (0, 0). Para isso observe que se tom´assemos v = 0 e y ≥ 0, a condi¸ca˜o de Lipschitz diria que 3y 2/3 ≤ ky, ou seja, 3y −1/3 ≤ k. Mas uma tal desigualdade ´e imposs´ıvel, pois para y → 0 o lado esquerdo diverge!

Isso justifica por que n˜ao se pode aplicar Picard-Lindel¨of nesse caso (e a solu¸ca˜o, de fato, n˜ao ´e u ´ nica).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

284/1304

• Coment´ arios sobre solu¸ co ˜es globais. O Exemplo 5.13 O fato de o Teorema de Peano em princ´ıpio garantir apenas uma regi˜ao conservadora de validade de solu¸ca˜o, a saber o intervalo [t0 − β, t0 + β], onde β ´e dado pela express˜ao (5.28), n˜ao est´a em desacordo com os exemplos: h´a sistemas satisfazendo as condi¸co˜es do Teorema de Peano para os quais n˜ao h´a solu¸co˜es globais, ou seja, solu¸co˜es que existem para todo t ∈ . O Exemplo 5.13, p´agina 279, ´e um tal caso. Vamos reanalis´a-lo sob a luz dos Teoremas de Peano e Picard-Lindel¨of, estudando particularmente o que o Teorema de Peano nos diz sobre a regi˜ao de existˆencia de solu¸ca˜o. ´ bastante claro que no Exemplo 5.13 tem-se F (t, y) = y 2 , e t0 = 0 com y0 > 0. Tomando-se E um retˆangulo fechado centrado em (t0 , y0 ) = (0, y0 ), ou seja, R = { (t, y) : |t| ≤ a , |y − y0 | ≤ b }, constata-se elementarmente que F ´e cont´ınua e que 

M := max |F (t, y)| = (t, y)∈R

max

y∈[y0 −b, y0 +b]

y 2 = (y0 + b)2 .

O Teorema de Peano n garante ao existˆencia de solu¸ca˜o para o intervalo fechado [−β, β], onde β :=  b b min a, M = min a, (y0 +b) . O valor de a pode ser escolhido arbitrariamente grande, sem alterar 2 o valor de M e sem violar a condi¸ca˜o de continuidade de F . Conclui-se disso que podemos tomar β =

b . (y0 + b)2

´ um exerc´ıcio f´acil (fa¸ca-o!) mostrar Para qual escolha de b a constante β assume seu maior valor? E que o lado direito da u ´ ltima express˜ao assume seu m´aximo em b = y0 , em cujo caso β =

1 . 4y0

Assim, o Teorema de Peano garante existˆencia de solu¸ca˜o no intervalo [− 4y10 , 4y10 ]. Sabemos, por´em que a solu¸ca˜o (5.23) existe em um intervalo maior (e que contenha t = t0 = 0), a saber (−∞, y10 ). O que se aprende disso ´e que o intervalo de solu¸ca˜o obtido pela estimativa (5.28) nem sempre ´e maximal, mas nem por isso contradiz-se o fato de nesse caso n˜ao haver solu¸ca˜o v´alida para todo t. Para sabermos se a solu¸ca˜o ´e u ´ nica, devemos estudar as condi¸co˜es do Teorema de Picard-Lindel¨of. Sabemos que F (t, y) − F (t, v) = y 2 − v 2 = (y + v)(y − v) . Logo, |F (t, y) − F (t, v)| = |y + v| |y − v| e, para y e v no intervalo [y0 − b, y0 + b], tem-se |y + v| ≤ 2(y0 + b). Assim, adotando-se k = 2(y0 + b), vale a condi¸ca˜o de Lipschitz |F (t, y) − F (t, v)| ≤ k|y − v| para todos (t, y), (t, v) ∈ R. Assim, a solu¸ca˜o do problema do Exemplo 5.13 ser´a u ´ nica para quaisquer a e b que se tome.

5.3.4

Dependˆ encia Cont´ınua de Condi¸ co ˜es Iniciais e de Parˆ ametros

Conforme mencionamos na p´agina 275, ´e importante determinarmos condi¸co˜es sob as quais a solu¸ca˜o de um problema de valor inicial ´e cont´ınua em rela¸ca˜o a`s condi¸co˜es iniciais e a parˆametros que ocorram na equa¸ca˜o diferencial. Essas quest˜oes s˜ao respondidas com bastante generalidade e detalhe na Se¸ca˜o

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 5

285/1304

17.3.3, p´agina 903. Vide Teorema 17.6, p´agina 904, sua demonstra¸ca˜o e coment´arios que se lhe seguem. Os resultados encontram-se resumidos nos dois teoremas abaixo, os quais valem tamb´em para sistemas de equa¸co˜es diferenciais ordin´arias. Teorema 5.4 Seja a equa¸ca ˜o diferencial ordin´ aria real de primeira ordem y(t) ˙ = F (t, y(t)) (F : 2 ao-identicamente nula) com a condi¸ca ˜o inicial y(t0 ) = y0 , com y0 ∈ , e suponhamos → sendo n˜ que sejam satisfeitas as condi¸co ˜es descritas no Teorema 5.2, p´ agina 281, de modo que se garanta a existˆencia de uma solu¸ca ˜o u ´nica y(t, y0 ) do problema de valor inicial em um intervalo [t0 − β, t0 + β]. Ent˜ ao, existe uma vizinhan¸ca J de y0 ∈ onde a solu¸ca ˜o y(t, y0 ) depende continuamente de y0 . Mais precisamente, existe uma constante κ > 0 e uma vizinhan¸ca T de t0 contida em [t0 − β, t0 + β] tal que vale |y(t, y0 ) − y(t, y00 )| ≤ κ|y0 − y00 |eκ|t−t0 | para todo y00 ∈ J e todo t ∈ T . 2 







Teorema 5.5 Seja a equa¸ca ˜o diferencial ordin´ aria real de primeira ordem e dependente de um parˆ ametro p: y(t) ˙ = F (t, y(t), p) (F : 2 → sendo n˜ ao-identicamente nula) com a condi¸ca ˜o inicial y(t0 ) = y0 , com y0 ∈ , e suponhamos que sejam satisfeitas as condi¸co ˜es descritas no Teorema 5.2, p´ agina 281, de modo que se garanta a existˆencia de uma solu¸ca ˜o u ´nica y(t, p) do problema de valor inicial em um intervalo [t0 − β, t0 + β]. Suponhamos tamb´em que F seja cont´ınua e continuamente diferenci´ avel em rela¸ca ˜o a p em alguma vizinhan¸ca. Ent˜ ao, y(t, p) depende continuamente de p nessa vizinhan¸ca. 2 





Cap´ıtulo 6 Alguns M´ etodos de Resolu¸c˜ ao de Equa¸co ˜es Diferenciais Ordin´ arias Conte´ udo 6.1

Solu¸ ca ˜o de Equa¸ co ˜es Ordin´ arias Lineares de Primeira Ordem . . . . . . . 286

6.2

As Equa¸ co ˜es de Bernoulli e de Riccati . . . . . . . . . . . . . . . . . . . . . 287

6.3

Integra¸ ca ˜o de Equa¸ co ˜es Separ´ aveis . . . . . . . . . . . . . . . . . . . . . . . 290

6.4

O M´ etodo de Varia¸ ca ˜o de Constantes . . . . . . . . . . . . . . . . . . . . . 291

6.5

O M´ etodo de Substitui¸ ca ˜o de Pr¨ ufer . . . . . . . . . . . . . . . . . . . . . . 293

6.6

O M´ etodo de Invers˜ ao

6.7

Solu¸ ca ˜o de Equa¸ co ˜es Exatas e o M´ etodo dos Fatores Integrantes . . . . . 296

6.8

Solu¸ co ˜es das Equa¸ co ˜es de D’Alembert-Lagrange e Clairaut . . . . . . . . 301

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295

problema de encontrar de m´etodos de resolu¸ca˜o de equa¸co˜es diferenciais ordin´arias tem cativado a imagina¸ca˜o e instigado a engenhosidade de gera¸co˜es de cientistas e matem´aticos. Muitas informa¸co˜es sobre o comportamento de solu¸co˜es de equa¸co˜es diferenciais ordin´arias podem ser obtidas sem que essas solu¸co˜es sejam conhecidas explicitamente, mas esse conhecimento expl´ıcito ´e muitas vezes desej´avel, pois assim o poder de previs˜ao de teorias e modelos torna-se evidentemente maior. Neste cap´ıtulo apresentaremos algumas das diversas situa¸co˜es felizes nas quais m´etodos de resolu¸ca˜o de equa¸co˜es diferenciais ordin´arias foram encontrados. Todos os m´etodos apresentados tˆem sua validade e sua efic´acia limitadas a certas classes de equa¸co˜es. No Cap´ıtulo 8, p´agina 394, desenvolveremos com bastante detalhe m´etodos de solu¸ca˜o de equa¸co˜es lineares baseados em expans˜oes, a saber, o m´etodo de expans˜ao em s´eries de potˆencias e o m´etodo de Frobenius, v´alidos para equa¸co˜es diferenciais lineares gozando de certas propriedades de analiticidade. Com o prop´osito de centrar a discuss˜ao nos m´etodos de solu¸ca˜o, n˜ao trataremos aqui de quest˜oes relativas a` continuidade de solu¸co˜es em rela¸ca˜o a parˆametros e condi¸co˜es iniciais e ao dom´ınio de validade de solu¸co˜es. Essas quest˜oes s˜ao discutidas na Se¸ca˜o 5.3, p´agina 274. M´etodos iterativos, perturbativos ou num´ericos tamb´em n˜ao ser˜ao discutidos aqui. Dada a profus˜ao de m´etodos de solu¸ca˜o de equa¸co˜es diferenciais (uma ciˆencia que se desenvolve j´a h´a mais de trezentos anos!), nossa apresenta¸ca˜o ser´a, reconhecidamente, limitada. Para um texto introdut´orio sobre equa¸co˜es diferenciais ordin´arias centrado em m´etodos de solu¸ca˜o, vide [14].

6.1

Solu¸ c˜ ao de Equa¸ co ˜es Ordin´ arias Lineares de Primeira Ordem

Equa¸co˜es diferenciais ordin´arias lineares de primeira ordem s˜ao particularmente interessantes pois, sob hip´oteses simples, ´e poss´ıvel apresentar solu¸co˜es gerais para as mesmas e de modo relativamente f´acil. 286

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 6

Vers˜ ao de 29 de setembro de 2005.

287/1304

Infelizmente a mesma facilidade n˜ao ´e encontrada para o caso das equa¸co˜es diferenciais lineares de ordem dois ou maior. Considere-se a equa¸ca˜o diferencial ordin´aria linear de primeira ordem y(t) ˙ + a(t)y(t) = b(t) , para fun¸co˜es a e b : defina-se 



(6.1)

, cont´ınuas. Vamos mostrar como resolver uma tal equa¸ca˜o. Para tal,  Z t a(τ )dτ . p(t) := exp 0

Multiplicando-se (6.1) por p(t) e usando o fato que p(t) ˙ = a(t)p(t), teremos d [p(t)y(t)] = p(t)b(t) , dt donde conclui-se que 1 y(t) = p(t)



y(0) +

Z

t

p(s)b(s) ds 0



−1

= p(t) y(0) +

Z

t 0

 p(t)−1 p(s) b(s) ds .

E. 6.1 Exerc´ıcio. Complete os detalhes.

(6.2)

6

Essa express˜ao representa a solu¸ca˜o geral de (6.1), a qual depende do valor de y(0), a ser especificado (condi¸ca˜o inicial). E. 6.2 Exerc´ıcio. A solu¸c˜ao (6.2) ´e daR forma (5.10), pois p(t) −1 ´e solu¸c˜ao da equa¸c˜ao homogˆenea t y(t) ˙ + a(t)y(t) = 0 enquanto que p(t)−1 0 b(τ )p(τ ) dτ ´e solu¸c˜ao particular da equa¸c˜ao n˜ao-homogˆenea (6.1). Verifique essas afirma¸co˜es. 6

Rt Naturalmente, para o c´alculo expl´ıcito de y ´e necess´ario calcular a integral 0 a(τ )dτ que aparece Rt na defini¸ca˜o de p, assim como, numa segunda etapa, a integral 0 b(τ )p(τ )dτ . Como essas fun¸co˜es s˜ao conhecidas, isso pode ser poss´ıvel, em princ´ıpio, mas nem sempre obtem-se f´ormulas expl´ıcitas para as mencionadas integrais. Ainda assim, (6.2) representa a solu¸ca˜o completa do problema. Na pior das hip´oteses as integrais mencionadas podem ser calculadas numericamente de modo aproximado.

A solu¸ca˜o (6.2) de (6.1) pode ser reobtida com o m´etodo dos fatores integrantes, tal como descrito no Exemplo 6.3, p´agina 299.

6.2

As Equa¸ co ˜es de Bernoulli e de Riccati

• A equa¸ c˜ ao de Bernoulli Para a e b : primeira ordem 



, ambas cont´ınuas, a equa¸ca˜o diferencial ordin´aria n˜ao-linear homogˆenea de y(t) ˙ + a(t)y(t) + b(t)y(t)2 = 0

(6.3)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 6

Vers˜ ao de 29 de setembro de 2005.

288/1304

´e denominada equa¸ca ˜o de Bernoulli1 . Apesar desta equa¸ca˜o ser um dos representantes mais simples da classe das equa¸co˜es diferenciais n˜ao-lineares, a n˜ao-linearidade da mesma n˜ao acrescenta nenhuma barreira a` sua solubilidade, pois a simples substitui¸ca˜o y(t) = 1/v(t) conduz a` equa¸ca˜o v(t) ˙ − a(t)v(t) − b(t) = 0 que ´e linear e tem por solu¸ca˜o (vide acima) 1 v(t) = p(t) onde



v(0) +

Z

t

b(τ )p(τ ) dτ 0



,

 Z t  p(t) := exp − a(τ ) dτ . 0

Portanto, a solu¸ca˜o geral de (6.3) ´e

y(t) = 

v(0) +

Z

p(t) t

b(τ )p(τ ) dτ 0

.

E. 6.3 Exerc´ıcio. Complete os detalhes.

6

E. 6.4 Exerc´ıcio. Determine a solu¸c˜ao geral da equa¸c˜ao de Bernoulli generalizada y(t) ˙ + a(t)y(t) + b(t)y(t)n = 0 , 1

n 6= 1. Sugest˜ao: Defina v por y(t) = v(t) 1−n e proceda como acima.

6

As equa¸co˜es de Bernoulli s˜ao um caso particular de uma classe maior de equa¸co˜es diferenciais ordin´arias n˜ao-lineares, as chamadas equa¸co ˜es de Riccati generalizadas. • A equa¸ c˜ ao de Riccati generalizada Para a, b e c : primeira ordem 



, cont´ınuas, a equa¸ca˜o diferencial ordin´aria n˜ao-linear n˜ao-homogˆenea de y(t) ˙ + a(t)y(t) + b(t)y(t)2 + c(t) = 0

(6.4)

´e denominada equa¸ca˜o de Riccati2 . Ao contr´ario da equa¸ca˜o de Bernoulli, a equa¸ca˜o de Riccati generalizada n˜ao ´e, em geral, sol´ uvel. Apenas em casos particulares h´a solu¸co˜es mais ou menos expl´ıcitas para as mesmas, normalmente em termos de expans˜oes em s´erie, como expans˜oes em s´erie de potˆencias. Apesar de sua n˜ao-solubilidade gen´erica (em contraposi¸ca˜o com a equa¸ca˜o de Bernoulli, que ´e tamb´em n˜ao-linear mas sol´ uvel), ´e poss´ıvel obter a solu¸ca˜o geral de (6.4) se uma solu¸ca˜o particular sua 1 2

Jacob Bernoulli (1654-1705). Vide nota hist´ orica a ` p´ agina 289. Jacopo Francesco Riccati (1676-1754).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 6

Vers˜ ao de 29 de setembro de 2005.

289/1304

for conhecida. De fato, se u ´e uma solu¸ca˜o particular conhecida de (6.4) ent˜ao a solu¸ca˜o geral ´e da forma y(t) = u(t) + v(t) , onde v obedece a` equa¸ca˜o de Bernoulli v(t) ˙ + [a(t) + 2b(t)u(t)]v(t) + b(t)v(t)2 = 0 . E. 6.5 Exerc´ıcio. de (6.4).

Verifique isso, substituindo y = u + v em (6.4) e usando a hip´otese que u ´e solu¸c˜ao 6

Assim, conhecida a fun¸ca˜o u, a solu¸ca˜o geral da equa¸ca˜o de Riccati generalizada ´e y(t) = u(t) + w0 −

Z

p1 (t) t

,

b(τ )p1 (τ ) dτ 0

onde w0 = 1/(y(0) − u(0)), para y(0) 6= u(0), ´e uma constante e onde Z t  p1 (t) := exp [a(τ ) + 2b(τ )u(τ )] dτ . 0

E. 6.6 Exerc´ıcio. Complete os detalhes.

6

Observemos que qualquer equa¸ca˜o diferencial ordin´aria linear homogˆenea de segunda ordem associase naturalmente a uma equa¸ca˜o de Riccati generalizada. De fato, dada a equa¸ca˜o

com a e b : 



w(t) ¨ + a(t)w(t) ˙ + b(t)w(t) = 0 , Z t  cont´ınuas, o Ansatz w(t) = exp y(τ )dτ conduz a 0

y(t) ˙ + a(t)y(t) + y(t)2 + b(t) = 0 , que ´e uma equa¸ca˜o de Riccati generalizada. E. 6.7 Exerc´ıcio. Complete os detalhes.

6

• Nota Hist´ orica A equa¸ca˜o de Riccati generalizada deve seu nome ao matem´atico e conde veneziano Iacopo Francesco Riccati (1676-1754), que estudou a equa¸ca˜o diferencial  y 0 (x) = α y 2 (x) + xn , (6.5) com α constante e n ∈



, em monografia publicada em 1724 sem, no entanto, resolvˆe-la. A equa¸ca˜o y 0 (x) = y 2 (x) + x2

(6.6)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 6

290/1304

fora previamente estudada por Johann Bernoulli (1667-1748) em trabalho de 1694, sem que este apresentasse solu¸ca˜o para a mesma. Jacob Bernoulli (1654-1705), que honrou com seu nome a equa¸ca˜o (6.3), resolvida por ele em 1696, tamb´em estudara (6.6) e encontrara em 1703 uma solu¸ca˜o para a mesma em termos de uma raz˜ao de s´erie de potˆencias, que ent˜ao expressou como uma s´erie de potˆencias simples. Somente em 1841 Joseph Liouville (1809-1882) demonstrou que a solu¸ca˜o de (6.6) n˜ao pode ser expressa em termos de fun¸co˜es elementares. Em nota¸ca˜o moderna a solu¸ca˜o geral de (6.6) ´e  2   2  x x + J AJ 3/4 −3/4  2 2   2   2 , y(x) = x   x x  J−1/4 − AJ1/4 2 2

onde A ´e uma constante e Jν s˜ao fun¸co˜es de Bessel de primeiro tipo e ordem ν.

Equa¸co˜es do tipo (6.5) s˜ao hoje denominadas simplesmente equa¸co ˜es de Riccati. A associa¸ca˜o do nome de Riccati a tais equa¸co˜es (e n˜ao dos nomes de Johann Bernoulli ou Jacob Bernoulli) ´e parcialmente devida ao fato de (6.5) ser ligeiramente mais geral que (6.6) e a`s referˆencias ao trabalho de Riccati feitas por outro Bernoulli, Daniel Bernoulli (1700-1782), que estudou as equa¸co˜es (6.5) em trabalho datado de 1725. Daniel Bernoulli menciona que solu¸co˜es de equa¸co˜es como (6.5) foram obtidas anteriormente por Johann Bernoulli, Nicolaus Bernoulli e Nicolaus Bernoulli II. A desconsidera¸ca˜o de Daniel Bernoulli pela contribui¸ca˜o pr´evia de seu tio Jacob Bernoulli deve-se talvez a` rivalidade deste com seu irm˜ao Johann Bernoulli, pai de Daniel Bernoulli, mas talvez seja meramente conseq¨ uˆencia do fato de sua ´epoca n˜ao estar ainda preparada para aceitar solu¸co˜es de equa¸co˜es diferenciais em termos de s´eries infinitas. De fato, em seu trabalho, Daniel Bernoulli preocupou-se em apontar casos em que (6.5) pode ser resolvida por s´eries finitas, a saber, quando n ´e a forma −4m/(2m ± 1), com m inteiro. O m´etodo acima descrito de obter a solu¸ca˜o geral da equa¸ca˜o de Riccati generalizada a partir de uma solu¸ca˜o particular ´e devido a Leonhard Euler (1707-1783) e publicado em 1764.

Para mais notas hist´oricas sobre as equa¸co˜es (6.5) e (6.6) e sua rela¸ca˜o com as fun¸co˜es de Bessel, vide por exemplo [131], Cap´ıtulo I.

6.3

Integra¸ c˜ ao de Equa¸ co ˜es Separ´ aveis

Entre as equa¸co˜es diferenciais de resolu¸ca˜o mais simples encontram-se as chamadas equa¸co˜es separ´aveis. Uma equa¸ca˜o diferencial ordin´aria de primeira ordem ´e dita ser uma equa¸ca ˜o separ´ avel 3 se for da forma y 0 (x) = f (x)g(y(x)) ,

(6.7)

para fun¸co˜es f e g convenientes. Consideremos a condi¸ca˜o inicial y(x0 ) = y0 para algum x0 . Definindo, Z x Z x 1 A(x) := ds e B(x) := f (s)ds , x0 g(s) x0 3

H´ a tamb´em uma no¸ca ˜o de equa¸ca ˜o separ´ avel na teoria das equa¸co ˜es diferenciais parciais (vide Se¸ca ˜o 11.2, p´ agina 587), mas trata-se de outra coisa.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 6

291/1304

caso as integrais existam, teremos, 1 d A(y(x)) = A0 (y(x))y 0 (x) = y 0 (x) dx g(y(x))

e

B 0 (x) = f (x) .

d A(y(x)) = B 0 (x) e A(y(x)) = B(x) + c, c sendo uma constante. Como B(x0 ) = 0, segue que Logo, dx c = A(y0 ). Se a fun¸ca˜o A possuir uma inversa em algum aberto em torno de y0 , teremos

y(x) = A−1 (B(x) + A(y0 )) como solu¸ca˜o de (6.7) em um aberto em torno de x0 . ´ interessante notar que, pelo Teorema da Fun¸ca˜o Inversa4 , A ´e invert´ıvel em um aberto torno de E y0 se A for cont´ınua e A0 (y0 ) 6= 0. Assim, a condi¸ca˜o g(y10 ) 6= 0 garante a existˆencia da solu¸ca˜o y dada acima em uma vizinhan¸ca de x0 . E. 6.8 Exerc´ıcio. Determine a solu¸c˜ao de y 0 (x) =

3x7 − 5x2 − 1 , 1 + y2

com y(0) = 0.

6

E. 6.9 Exerc´ıcio. Determine a solu¸c˜ao de y 0 (x) =

(1 + x2 ) , cos(y(x))

com y(0) = y0 . Estude os v´arios casos.

6.4

6

O M´ etodo de Varia¸ c˜ ao de Constantes

Seja a equa¸ca˜o linear n˜ao-homogˆenea y 00 (x) + a(x)y 0 (x) + b(x)y(x) = f (x) ,

(6.8)

definida em um certo intervalo aberto I ⊂ , com f cont´ınua por partes, e vamos supor que sejam conhecidas duas solu¸co˜es independentes y1 e y2 da equa¸ca˜o homogˆenea y 00 (x)+a(x)y 0 (x)+b(x)y(x) = 0. O m´etodo de varia¸ca ˜o de constantes consiste em determinar fun¸co˜es v 1 e v2 tais que a combina¸ca˜o 

yv (x) = v1 (x)y1 + v2 (x)y2 (x) ,

(6.9)

seja solu¸ca˜o da equa¸ca˜o n˜ao-homogˆenea (6.8). A denomina¸ca˜o do m´etodo como de “varia¸ca˜o de constantes”, uma contradi¸ca˜o em termos, provem do fato de que, como ´e bem sabido, a solu¸ca˜o geral da equa¸ca˜o homogˆenea ´e v1 y1 (x) + v2 y2 (x) para v1 e v2 constantes. Substituindo (6.9) em (6.8), e usando as hip´oteses que y100 + ay10 + by1 = 0 e y200 + ay20 + by2 = 0, obtem-se [v10 y1 + v20 y2 ]0 + a[v10 y1 + v20 y2 ] + [v10 y10 + v20 y20 ] = f . (6.10) 4

Vide Se¸ca ˜o 17.4, p´ agina 907, ou qualquer bom livro de C´ alculo de fun¸co ˜es de v´ arias vari´ aveis, por exemplo, [26, 87, 88].

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 6

Vers˜ ao de 29 de setembro de 2005.

292/1304

E. 6.10 Exerc´ıcio. Complete os detalhes que levam `a u ´ltima express˜ao.

6

Para determinar as duas fun¸co˜es v1 e v2 ´e preciso acrescentar mais uma equa¸ca˜o diferencial envolvendo ambas as fun¸co˜es. A escolha dessa equa¸ca˜o extra ´e essencialmente arbitr´aria, mas uma an´alise de (6.10) mostra ser muito conveniente impor a rela¸ca˜o v10 y1 + v20 y2 = 0 pois a express˜ao v10 y1 + v20 y2 aparece nos dois primeiros termos. Com isso, chegamos ao sistema de equa¸co˜es v10 y1 + v20 y2 = 0 , v10 y10 + v20 y20 = f , que s˜ao equa¸co˜es alg´ebricas para v10 e v20 , fornecendo v10 = −

y1 f , − y10 y2

v20 = +

y1 y20

cujas solu¸co˜es s˜ao Z x y2 (s)f (s) v1 (x) = − ds + c1 , 0 0 x0 y1 (s)y2 (s) − y1 (s)y2 (s)

y2 f , − y10 y2

y1 y20

v2 (x) = +

Z

x x0

y1 (s)f (s) ds 0 y1 (s)y2 (s) − y10 (s)y2 (s)

+ c2 ,

sendo x0 ∈ I e c1 , c2 duas constantes de integra¸ca˜o. A express˜ao Wy1 , y2 (x) := y1 (x)y20 (x) − y10 (x)y2 (x) ´e denominada determinante Wronskiano5 e n˜ao se anula pois, por hip´otese, y1 e y2 s˜ao independentes. Assim, a solu¸ca˜o procurada yv (x) = v1 (x)y1 (x) + v2 (x)y2 (x) tem a forma  Z x y1 (s)y2 (x) − y1 (x)y2 (s) yv (x) = [c1 y1 (x) + c2 y2 (x)] + f (s) ds y1 (s)y20 (s) − y10 (s)y2 (s) x0 = [c1 y1 (x) + c2 y2 (x)] +

Z

x x0



y1 (s)y2 (x) − y1 (x)y2 (s) Wy1 , y2 (s)



f (s) ds ,

para um ponto x0 ∈ I arbitr´ario e constantes arbitr´arias c1 e c2 a serem fixadas por condi¸co˜es iniciais em x0 . O estudante deve observar que o termo [· · · ] da u ´ ltima express˜ao acima ´e uma solu¸ca˜o da equa¸ca˜o homogˆenea e o u ´ ltimo ´e uma solu¸ca˜o particular da equa¸ca˜o n˜ao-homogˆenea. Uma observa¸ca˜o simples permite reescrever a u ´ ltima express˜ao de uma forma por vezes mais conveniente. Se a ´e cont´ınua por partes, ´e f´acil constatar que d ds =

 "

Wy1 , y2 (s) exp

h

y200 (s)

+

Z

s

a(τ ) dτ x0

a(s)y20 (s)

 i

+ b(s)y2 (s) y1 (s) −

h

y100 (s)

+

a(s)y10 (s)

i

#

+ b(s)y1 (s) y2 (s) exp

Z

s

a(τ ) dτ x0



= 0, 5

Conde Josef Ho¨en´e de Wronski (1778-1853).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 6

293/1304

pois y1 e y2 s˜ao solu¸co˜es da equa¸ca˜o homogˆenea. Com isso, conclu´ımos que  Z s  Wy1 , y2 (s) = Wy1 , y2 (x0 ) exp − a(τ ) dτ . x0

Sempre podemos escolher as fun¸co˜es y1 e y2 de forma que satisfa¸cam y1 (x0 ) = 1, y10 (x0 ) = 0, y2 (x0 ) = 0, y20 (x0 ) = 1. Nesse caso Wy1 , y2 (x0 ) = 1 e conclu´ımos que Z s  Z x  yv (x) = [c1 y1 (x) + c2 y2 (x)] + exp a(τ ) dτ y1 (s)y2 (x) − y1 (x)y2 (s) f (s) ds . x0

x0

Com essas escolhas, ´e f´acil ver que yv (x0 ) = c1 e yv0 (x0 ) = c2 . No Cap´ıtulo 7, p´agina 306, o m´etodo de varia¸ca˜o de constantes ser´a reencontrado por outros caminhos e ser´a tratado com mais generalidade, de modo a tamb´em incluir equa¸co˜es de ordem n e n˜ao apenas de segunda ordem, como fizemos acima.

6.5

O M´ etodo de Substitui¸ c˜ ao de Pr¨ ufer

Esse elegante m´etodo aplica-se a` solu¸ca˜o de certas equa¸co˜es diferenciais ordin´arias e lineares e homogˆeneas de segunda ordem da forma  0 p(x)y 0 (x) + q(x)y(x) = 0 , (6.11)

para x ∈ [a, b] ⊂ , sendo p cont´ınua e diferenci´avel, p(x) > 0 e q cont´ınua. O chamado m´etodo de substitui¸ca ˜o de Pr¨ ufer6 consiste em definir duas novas fun¸co˜es ρ e θ por 

y(x) = ρ(x) sen (θ(x)) ,

p(x)y 0 (x) = ρ(x) cos(θ(x))

(6.12)

e transformar o problema de resolver a equa¸ca˜o diferencial de segunda ordem para y no problema de resolver um sistema de duas equa¸co˜es diferenciais de primeira ordem para ρ e θ. Como o leitor pode perceber, a mudan¸ca acima pode ser interpretada como a passagem a coordenadas polares no espa¸co de fase bidimensional definido por (y(x), p(x)y 0 (x)). Obtemos o sistema equa¸co˜es para ρ e θ da seguinte forma. Em primeiro lugar, observamos que diferenciando a equa¸ca˜o do lado esquerdo de (6.12), tem-se y 0 (x) = ρ0 (x) sen (θ(x)) + ρ(x) cos(θ(x))θ 0 (x) . Multiplicando-se por p e usando a equa¸ca˜o do lado direito de (6.12), obtemos ρ0 (x)p(x) sen (θ(x)) + ρ(x)p(x) cos(θ(x))θ 0 (x) = ρ(x) cos(θ(x)) . Em segundo lugar, inserindo-se a equa¸ca˜o do lado direito de (6.12) em (6.11), tem-se ρ0 (x) cos(θ(x)) − ρ(x) sen (θ(x))θ 0 (x) = −q(x)ρ(x) sen (θ(x)) . 6

Ernst Paul Heinz Pr¨ ufer (1896-1934). A referˆencia para trabalho de Pr¨ ufer ´e H. Pr¨ ufer, “Neue Herleitung der Sturm-Liouvilleschen Reihenentwicklung stetiger Funktionen”. Math. Ann., 95, 499-518 (1926).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 6

Dessas duas u ´ ltimas igualdades podemos facilmente obter ρ0 e θ 0 :  2 2 1  0 θ (x) = q(x) sen (θ(x)) + cos(θ(x)) , p(x)   1 ρ(x) 0 − q(x) sen (2θ(x)) , ρ (x) = 2 p(x) E. 6.11 Exerc´ıcio. Verifique!

294/1304

(6.13)

(6.14) 6

Esse ´e o sistema de equa¸co˜es procurado. Um aspecto not´avel do mesmo ´e que a primeira equa¸ca˜o envolve apenas θ. Se for poss´ıvel resolver essa equa¸ca˜o, obtendo a fun¸ca˜o θ(x), a solu¸ca˜o da segunda equa¸ca˜o seria    Z x 1 1 − q(y) sen (2θ(y)) dy , (6.15) ρ(x) = ρ(a) exp 2 a p(y) e, pela pela primeira equa¸ca˜o de (6.12), ter´ıamos a solu¸ca˜o    Z x 1 1 − q(y) sen (2θ(y)) dy sen (θ(x)) . y(x) = ρ(a) exp 2 a p(y) Uma feliz situa¸ca˜o particular na qual a equa¸ca˜o para θ pode ser resolvida facilmente ´e aquela na 1 qual p(x) = q(x), em cujo caso ficamos com θ 0 (x) = q(x), ρ0 (x) = 0, ou seja, Z x θ(x) = θ(a) + q(y) dy ρ(x) = ρ(a) . a

Assim, ter´ıamos pela primeira equa¸ca˜o de (6.12) a solu¸ca˜o geral Z x  y(x) = c1 sen q(y) dy + c2 , a

para duas constantes c1 e c2 (aqui, c1 ≡ ρ(a) e c2 ≡ θ(a)). E. 6.12 Exerc´ıcio. Resolva a equa¸c˜ao do oscilador harmˆonico simples x¨ + ω 02 x = 0 usando o m´etodo acima. Sugest˜ao: reescreva a equa¸c˜ao tomando p(x) = ω 0−1 e q(x) = ω0 . 6 E. 6.13 Exerc´ıcio. Obtenha a solu¸c˜ao da equa¸c˜ao  0 x−α y 0 (x) + xα y(x) = 0 ,

α∈



, em um intervalo (a, b).

6

• Zeros de solu¸ co ˜es Outro aspecto interessante do m´etodo de substitui¸ca˜o de Pr¨ ufer reside no fato de que com a representa¸ca˜o de Pr¨ ufer y(x) = ρ(x) sen (θ(x)), pode-se realizar um estudo mais detalhado do zeros de y. Algumas propriedades desses zeros s˜ao relevantes para o estudo de solu¸co˜es certas equa¸co˜es diferenciais de interesse.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Proposi¸ c˜ ao 6.1 Seja a equa¸ca ˜o diferencial  0 p(x)y 0 (x) + q(x)y(x) = 0 ,

Cap´ıtulo 6

295/1304

(6.16)

avel, p(x) > 0 e q cont´ınua. Seja y uma para x ∈ [a, b] ⊂ , sendo p e q reais, p cont´ınua e diferenci´ solu¸ca ˜o n˜ ao-identicamente nula dessa equa¸ca ˜o e y(x) = ρ(x) sen (θ(x)) sua representa¸ca ˜o de Pr¨ ufer. Ent˜ ao, um ponto ξ ∈ [a, b] ´e um zero de y se e somente se θ(ξ) = nπ para algum n ∈ . Al´em disso, se y tem um zero em ξ ∈ [a, b] esse zero ´e simples. 2 

Prova. Claro ´e que se θ(ξ) = nπ, ent˜ao y(ξ) = ρ(ξ) sen (θ(ξ)) = 0. Reciprocamente, se y(ξ) = 0 ent˜ao, como ρ(ξ) > 0 (por (6.15)), segue que sen (θ(ξ)) = 0, o que s´o ´e poss´ıvel se θ(ξ) = nπ para algum n∈ .

Se ξ ´e um zero de y, segue por (6.12) que y 0 (ξ) = ρ(ξ) cos(θ(ξ))/p(ξ) = (−1)n ρ(ξ)/p(ξ) provando que y 0 (ξ) 6= 0. Isso estabelece que ξ ´e um zero simples de y.

6.6

O M´ etodo de Invers˜ ao

Esse m´etodo pode ser aplicado quando a solu¸ca˜o y de uma equa¸ca˜o diferencial ordin´aria for uma fun¸ca˜o invert´ıvel em algum aberto do seu dom´ınio de defini¸ca˜o. A id´eia ´e transformar a equa¸ca˜o para y em uma equa¸ca˜o para a inversa de y, que pode eventualmente ser de resolu¸ca˜o mais simples. Se f ´e invert´ıvel em um aberto A e f −1 ´e sua inversa, ent˜ao f (f −1 (z)) = z. Supondo ambas diferenci´aveis, a regra da cadeia diz-nos que f 0 (f −1 (z))(f −1 )0 (z) = 1 e, portanto, f 0 (f −1 (z)) = 1/(f −1 )0 (z). diferenciando-se mais uma vez tem-se f 00 (f −1 (z)) = −(f −1 )00 (z)/[(f −1 )0 (z)]3 . Prosseguindo assim, ´e poss´ıvel sucessivamente expressar todas as derivadas de f em fun¸ca˜o de derivadas de f −1 . Com essas rela¸co˜es, vemos que uma equa¸ca˜o diferencial de primeira ordem F (x, y(x), y 0 (x)) = 0 transforma-se na equa¸ca˜o   1 −1 F y (z), z, −1 0 = 0. (y ) (z)

e uma equa¸ca˜o diferencial de segunda ordem F (x, y(x), y 0 (x), y 00 (x)) = 0 transforma-se na equa¸ca˜o   1 (y −1 )00 (z) −1 F y (z), z, −1 0 , − −1 0 = 0, (y ) (z) [(y ) (z)]3

e assim analogamente para equa¸co˜es de ordem superior. Em alguns casos tais equa¸co˜es transformadas podem ser mais f´aceis de resolver que a original e a solu¸ca˜o y pode ser obtida – ao menos localmente – invertendo a solu¸ca˜o y −1 . Ilustraremos o m´etodo em dois exemplos. Exemplo 6.1 Seja a equa¸ca˜o diferencial de primeira ordem y 0 (x) =

1 , a(y(x)) x + b(y(x)) xα

JCABarata. Curso de F´ısica-Matem´ atica

onde a e b s˜ao duas fun¸co˜es cont´ınuas e α ∈ 1 (y −1 )0 (z)

=

a(z) y −1 (z)

1 , + b(z) (y −1 (z))α



Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 6

296/1304

. Pela transforma¸ca˜o acima, essa equa¸ca˜o equivale a ou seja,

(y −1 )0 (z) = a(z) y −1 (z) + b(z) (y −1 (z))α ,

que se trata de uma equa¸ca˜o de Bernoulli generalizada para y −1 . A solu¸ca˜o de equa¸co˜es de Bernoulli foi apresentada na Se¸ca˜o 6.2, p´agina 287. ◊

Exemplo 6.2 Considere a equa¸ca˜o de segunda ordem y 00 (x) + xy(x)(y 0 (x))3 = 0. Pela transforma¸ca˜o de acima, essa equa¸ca˜o equivale a 3  1 (y −1 )00 (z) −1 = 0 ou seja, (y −1 )00 (z) − zy −1 (z) = 0 , + y (z) z − −1 0 [(y ) (z)]3 (y −1 )0 (z) que se trata da equa¸ca˜o de Airy para y −1 . A solu¸ca˜o da equa¸ca˜o de Airy pode ser obtida pelo m´etodo de expans˜ao em s´erie de potˆencias. Vide Se¸ca˜o 8.1.4, p´agina 404. ◊

6.7

Solu¸ c˜ ao de Equa¸ co ˜es Exatas e o M´ etodo dos Fatores Integrantes

• Equa¸ co ˜es exatas de primeira ordem Seja D ⊂ 2 ´e um dom´ınio aberto e simplesmente conexo e sejam definidas em D duas fun¸co˜es diferenci´aveis A1 (x1 , x2 ) e A2 (x1 , x2 ). A equa¸ca˜o diferencial 

A1 (x, y(y)) + A2 (x, y(x))y 0 (x) = 0

(6.17)

∂A1 ∂A2 (x1 , x2 ) − (x1 , x2 ) = 0 ∂x2 ∂x1

(6.18)

´e dita ser uma equa¸ca ˜o exata se

para todo (x1 , x2 ) ∈ D. Uma equa¸ca˜o exata pode ser resolvida em termos de uma equa¸ca˜o impl´ıcita pelo m´etodo que segue. ~ = (A1 , A2 ) ´e irrotacional. Como D ´e A condi¸ca˜o (6.18) diz-nos que o campo bidimensional A ~ simplesmente conexo, A pode ser escrito como o gradiente de uma fun¸ca˜o U . Essa situa¸ca˜o ´e an´aloga ao que ocorre na Mecˆanica Cl´assica quando se lida com for¸cas conservativas, as quais podem ser expressas como o gradiente de um potencial. De fato, sejam (a, b), (x1 , x2 ) ∈ D e seja C uma curva diferenci´avel orientada de (a, b) a (x1 , x2 ) inteiramente contida em D: C = {(w1 (s), w2 (s)) ∈ D, s ∈ [0, 1]}, onde as fun¸co˜es w1 (s) e w2 (s) s˜ao cont´ınuas e diferenci´aveis e satisfazem (w1 (0), w2 (0)) = (a, b), (w1 (1), w2 (1)) = (x1 , x2 ). Defina-se a ~ ao longo de C do ponto (a, b) ao ponto fun¸ca˜o U : D → como sendo a integral de linha do campo A 

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 6

297/1304

(x1 , x2 ): U (x1 , x2 ) :=

=

Z Z

(x1 , x2 ) (a, b) C 1 0



~ w) A( ~ · dw ~ =

Z

(x1 , x2 ) (a, b) C



A1 (w1 , w2 )dw1 + A2 (w1 , w2 )dw2

dw1 dw2  A1 (w1 (s), w2 (s)) + A2 (w1 (s), w2 (s)) ds . ds ds

 (6.19)

Como D ´e simplesmente conexa, o Teorema de Green e a condi¸ca˜o (6.18) implicam que essa integral n˜ao depende da particular curva C adotada, mas apenas dos pontos extremos (a, b) e (x 1 , x2 ). Pela defini¸ca˜o de U ´e imediato que ∂U (x1 , x2 ) = A1 (x1 , x2 ) ∂x1

e

∂U (x1 , x2 ) = A2 (x1 , x2 ) ∂x2

(6.20)

em todo D. Assim, a equa¸ca˜o (6.17) pode ser escrita como ∂U ∂U (x, y(x)) + (x, y(x))y 0 (x) = 0, ∂x1 ∂x2

ou seja,

d U (x, y(x)) = 0 . dx

Dessa forma, conclu´ımos que a solu¸ca˜o da equa¸ca˜o (6.17) ´e a solu¸ca˜o da equa¸ca˜o impl´ıcita U (x, y(x)) = U0 , caso essa exista. Aqui U0 ´e uma constante. Se estivermos interessados na condi¸ca˜o inicial y(x0 ) = y0 , para (x0 , y0 ) ∈ D, teremos U0 = U (x0 , y0 ). Pelo Teorema da Fun¸ca˜o Impl´ıcita7 , a equa¸ca˜o U (x, y(x)) = U (x0 , y0 ) ter´a uma solu¸ca˜o y(x) em uma vizinhan¸ca de x0 satisfazendo y(x0 ) = y0 se U ∂U for cont´ınua e diferenci´avel em torno de (x0 , y0 ) e se ∂x (x0 , y0 ) 6= 0, ou seja, se A2 (x0 , y0 ) 6= 0. 2 E. 6.14 Exerc´ıcio. Mostre que a equa¸c˜ao diferencial (3x2 − y(x)2 − 7) − (ey(x) + 2xy(x) + 1)y 0 (x) = 0 ´e exata e mostre que suas solu¸co˜es s˜ao solu¸co˜es da equa¸c˜ao impl´ıcita y(x) − y(x)2 + ey(x) + 7x − x3 = constante. 6 • M´ etodo dos Fatores Integrantes Dada uma equa¸ca˜o diferencial como B1 (x, y(x)) + B2 (x, y(x))y 0 (x) = 0 ,

(6.21)

com B1 (x1 , x2 ) e B2 (x1 , x2 ) definidas em um dom´ınio D ⊂ 2 , aberto e simplesmente conexo, nem 1 2 sempre ocorre de a condi¸ca˜o de exatid˜ao ∂B (x1 , x2 ) − ∂B (x1 , x2 ) = 0 ser satisfeita. Em alguns casos, ∂x2 ∂x1 

7

Vide Se¸ca ˜o 17.4, p´ agina 907, ou qualquer bom livro de C´ alculo de fun¸co ˜es de v´ arias vari´ aveis, por exemplo, [26, 87, 88].

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 6

Vers˜ ao de 29 de setembro de 2005.

298/1304

por´em, ao multiplicarmos a equa¸ca˜o (6.21) por uma fator ω(x, y(x)) convenientemente escolhido, a equa¸ca˜o pode transformar-se em uma equa¸ca˜o exata, a qual pode, ent˜ao, ser resolvida pelo m´etodo descrito acima. Um tal ω, se existir, ser´a denominado fator integrante da equa¸ca˜o (6.21). Definindo A1 (x1 , x2 ) := ω(x1 , x2 )B1 (x1 , x2 ) A2 (x1 , x2 ) := ω(x1 , x2 )B2 (x1 , x2 ), desejamos determinar quais fun¸co˜es ω tornam v´alida a condi¸ca˜o (6.18), ou seja, desejamos determinar a solu¸ca˜o ω da equa¸ca˜o diferencial parcial linear de primeira ordem   ∂ω ∂ω ∂B1 ∂B2 B1 (x1 , x2 ) (x1 , x2 ) − B2 (x1 , x2 ) (x1 , x2 ) + ω(x1 , x2 ) (x1 , x2 ) − (x1 , x2 ) = 0 . ∂x2 ∂x1 ∂x2 ∂x1 (6.22) Resolver essa equa¸ca˜o pode n˜ao ser poss´ıvel, ou pode ser uma tarefa ainda mais dif´ıcil que resolver a equa¸ca˜o original (6.21) por outros meios. Em certos casos ela pode ser resolvida pelo m´etodo das caracter´ısticas, do qual falaremos adiante, mas h´a duas situa¸co˜es especiais que tornam a solu¸ca˜o simples: 1 I. B2 (x1 , x2 )



∂B2 ∂B1 (x1 , x2 ) − (x1 , x2 ) ∂x2 ∂x1

Nesse caso, (6.22) fica



= α(x1 ), uma fun¸ca˜o apenas da vari´avel x1 .

∂ω B1 (x1 , x2 ) ∂ω (x1 , x2 ) − (x1 , x2 ) + ω(x1 , x2 )α(x1 ) = 0 . B2 (x1 , x2 ) ∂x2 ∂x1 Escolhendo ω(x1 , x2 ) = ω(x1 ), uma fun¸ca˜o apenas da vari´avel x1 , essa equa¸ca˜o simplifica-se para ω 0 (x1 ) − ω(x1 )α(x1 ) = 0 , cuja solu¸ca˜o ´e

 Z ω(x1 ) = c exp +

x1

α(ξ)dξ a



sendo a e c arbitr´arios (sem perda, podemos escolher c = 1).   1 ∂B1 ∂B2 II. (x1 , x2 ) − (x1 , x2 ) = β(x2 ), uma fun¸ca˜o apenas da vari´avel x2 . B1 (x1 , x2 ) ∂x2 ∂x1 Nesse caso, (6.22) fica

B2 (x1 , x2 ) ∂ω ∂ω (x1 , x2 ) − (x1 , x2 ) + ω(x1 , x2 )β(x2 ) = 0 . ∂x2 B1 (x1 , x2 ) ∂x1 Escolhendo ω(x1 , x2 ) = ω(x2 ), uma fun¸ca˜o apenas da vari´avel x2 , essa equa¸ca˜o simplifica-se para ω 0 (x2 ) + ω(x2 )β(x2 ) = 0 , cuja solu¸ca˜o ´e

 Z ω(x2 ) = d exp −

x2

β(ξ)dξ b

sendo b e d arbitr´arios (sem perda, podemos escolher d = 1).



JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 6

Vers˜ ao de 29 de setembro de 2005.

299/1304

Exemplo 6.3 Revisitando a equa¸ca ˜o (6.1) e reencontrando sua solu¸ca ˜o (6.2). A equa¸ca˜o y 0 (x)+a(x)y(x) = b(x) pode serescrita na forma (6.21) comB1 (x1 , x2 ) = a(x1 )x2 −b(x1 ) 1 2 (x1 , x2 ) − ∂B (x1 , x2 ) = a(x1 ) e vale, portanto, a e B2 (x1 , x2 ) = 1. Tem-se aqui que B2 (x11 , x2 ) ∂B ∂x2 ∂x1 condi¸ca˜o do item I, acima, sendo o fator integrante dado por   Z x1 a(ξ)dξ ω(x1 ) = exp x0

com x0 arbitr´ario. Assim,  Z x1   A1 (x1 , x2 ) = exp a(ξ)dξ a(x1 )x2 − b(x1 )

e

A2 (x1 , x2 ) = exp

x0

Com

U (x1 , x2 ) = x2 exp constata-se que A1 (x1 , x2 ) =

Z



x1 x0

a(ξ)dξ −

∂U (x1 , x2 ) ∂x1

Z



x1

b(χ) exp x0

e

Z

A2 (x1 , x2 ) =

χ

a(ξ)dξ x0



Z

x1

a(ξ)dξ x0



.



∂U (x1 , x2 ) . ∂x2

E. 6.15 Exerc´ıcio. Obtenha U calculando a integral em (6.19) para alguma curva C conveniente.

6

Pelo que vimos, a solu¸ca˜o da equa¸ca˜o diferencial satisfaz a equa¸ca˜o impl´ıcita U (x, y(x)) = U 0 , sendo U0 uma constante. Para uma condi¸ca˜o inicial y(x0 ) = y0 , tem-se U0 = U (x0 , y0 ) = y0 e a equa¸ca˜o impl´ıcita U (x, y(x)) = y0 fica   Z χ  Z x Z x a(ξ)dξ dχ = y0 , b(χ) exp a(ξ)dξ − y(x) exp x0

x0

x0

cuja solu¸ca˜o ´e  Z y(x) = exp −

x x0

 Z a(ξ)dξ y0 +

x

b(χ) exp x0

Z

χ

a(ξ)dξ x0





dχ ,

que ´e precisamente a solu¸ca˜o dada em (6.2), como facilmente se constata.



• Equa¸ co ˜es exatas de ordem n Veremos agora como as id´eias de acima podem ser generalizadas para equa¸co˜es de ordem n. Seja F (x, x0 , x1 , . . . , xn ) uma fun¸ca˜o de n + 2 vari´aveis que define uma equa¸ca˜o diferencial ordin´aria de ordem n:   0 (n) F x, y(x), y (x), . . . , y (x) = 0 . (6.23)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 6

300/1304

Essa equa¸ca˜o ´e dita ser uma equa¸ca ˜o diferencial exata se existir uma fun¸ca˜o diferenci´avel U (x, x 0 , x1 , . . . , xn− de n + 1 vari´aveis tal que F (x, x0 , x1 , . . . , xn ) = ∂U ∂U ∂U (x, x0 , x1 , . . . , xn−1 ) + x1 (x, x0 , x1 , . . . , xn−1 ) + · · · + xn (x, x0 , x1 , . . . , xn−1 ) , ∂x ∂x0 ∂xn−1 (6.24) ent˜ao a equa¸ca˜o (6.23) torna-se   ∂U  ∂U  x, y(x), y 0 (x), . . . , y (n−1) (x) + y 0 (x) x, y(x), y 0 (x), . . . , y (n−1) (x) ∂x ∂x0 + · · · + y (n) (x) ou seja,

 ∂U  x, y(x), y 0 (x), . . . , y (n−1) (x) = 0 , ∂xn−1

 d  U x, y(x), y 0 (x), . . . , y (n−1) (x) = 0 e, portanto, vale dx   U x, y(x), y 0 (x), . . . , y (n−1) (x) = U0 ,

(6.25)

onde U0 ´e uma constante, fixada pelos n “valores iniciais” y(x0 ), y 0 (x0 ), . . . , y (n−1) (x0 ), para algum   ponto x0 : U0 = U x0 , y(x0 ), y 0 (x0 ), . . . , y (n−1) (x0 ) .

A express˜ao (6.25) ´e uma nova equa¸ca˜o diferencial para y, mas de ordem no m´aximo igual a n − 1. Assim, toda equa¸ca˜o exata de ordem n pode ser transformada em uma equa¸ca˜o de ordem menor, a qual poder´a eventualmente ser resolvida por algum dos m´etodos dispon´ıveis. Claro ´e por (6.24) que a equa¸ca˜o (6.23) ´e da forma     A1 x, y(x), y 0 (x), . . . , y (n−1) (x) + A2 x, y(x), y 0 (x), . . . , y (n−1) (x) y (n) (x) = 0 ,

(6.26)

onde

A1 (x, x0 , x1 , . . . , xn−1 ) =

∂U ∂U (x, x0 , x1 , . . . , xn−1 ) + x1 (x, x0 , x1 , . . . , xn−1 ) (6.27) ∂x ∂x0 + · · · + xn−1

A2 (x, x0 , x1 , . . . , xn−1 ) =

∂U (x, x0 , x1 , . . . , xn−1 ) , ∂xn−2

∂U (x, x0 , x1 , . . . , xn−1 ) . ∂xn−1

(6.28)

As express˜oes (6.26)-(6.28) generalizam (6.17)-(6.20), do caso de equa¸co˜es exatas de ordem n = 1. Naquele caso sab´ıamos que a rela¸ca˜o (6.18) ´e necess´aria e suficiente (caso D seja simplesmente conexo) para garantir exatid˜ao, ou seja, a existˆencia de uma fun¸ca˜o U com as propriedades desejadas. No caso n > 1, infelizmente n˜ao h´a modo simples de expressar as condi¸co˜es necess´arias e suficientes para que A1 e A2 tenham a forma dada em (6.27) e (6.28), respectivamente.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 6

301/1304

Exemplo 6.4 Seja V diferenci´avel e f = −V 0 . A equa¸ca˜o diferencial de segunda ordem my 00 (x) − f (y(x)) = 0 n˜ao ´e exata, mas multiplicando-a por y 0 (x), ficamos com y 0 (x)(my 00 (x) − f (y(x))) = 0, que pode ser escrita como F (x, y(x), y 0 (x), y 00 (x)) = 0 para F (x, x0 , x1 , x2 ) = x1 (mx2 − f (x0 )) e para essa F , podemos encontrar uma fun¸ca˜o U (x, x0 , x1 ) tal que a condi¸ca˜o de exatid˜ao (6.24) ´e satisfeita. De fato, essa fun¸ca˜o ´e U (x, x0 , x1 ) = m2 x21 + V (x0 ) (verifique!). A nova equa¸ca˜o (6.25) fica nesse caso m 0 (y (x))2 + V (y(x)) = U0 = constante. 2 O estudante pode reconhecer nisso a equa¸ ca˜o da conserva¸ca˜o da energia em uma dimens˜ao. Podeq 0 mos ent˜ao, localmente, escrever y (x) = ± m2 (U0 − V (y(x))), cuja solu¸ca˜o, ap´os integra¸ca˜o, ´e obtida invertendo localmente Z dy x = ± q + constante. 2 (U − V (y)) 0 m



E. 6.16 Exerc´ıcio. Use o procedimento descrito acima para resolver a equa¸c˜ao do oscilador harmˆonico simples my 00 (x) + ky(x) = 0, m > 0, k > 0 6

6.8

Solu¸ co ˜es das Equa¸ co ˜es de D’Alembert-Lagrange e Clairaut

Uma equa¸ca˜o diferencial de primeira ordem da forma xA(y 0 (x)) + B(y 0 (x)) − y(x) = 0 ,

(6.29)

com A e B cont´ınuas e diferenci´aveis, ´e denominada equa¸ca ˜o de D’Alembert 8 ou equa¸ca ˜o de Lagrange9 . 10 No caso em que A(z) ≡ z, a equa¸ca˜o ´e conhecida como equa¸ca ˜o de Clairaut :   xy 0 (x) − y(x) + B(y 0 (x)) = 0 . (6.30)

Diferenciando a equa¸ca˜o (6.29) em rela¸ca˜o a x, obtem-se   0 0 0 0 0 A(y (x)) + xA (y (x)) + B (y (x)) y 00 (x) − y 0 (x) = 0 .

Definindo v(x) = y 0 (x), isso diz que

  A(v(x)) − v(x) + xA0 (v(x)) + B 0 (v(x)) v 0 (x) = 0 .

(6.31)

No que segue apresentaremos solu¸co˜es das equa¸co˜es de acima, come¸cando com a equa¸ca˜o de Clairaut (6.30) e depois tratando da equa¸ca˜o de D’Alembert-Lagrange (6.29). 8

Jean Le Rond d’Alembert (1717-1783). Joseph-Louis Lagrange (1736-1813). 10 Alexis Claude Clairaut (1713-1765). 9

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 6

302/1304

• Solu¸ co ˜es da equa¸ c˜ ao de Clairaut. A solu¸ c˜ ao singular No caso em que A(z) ≡ z (equa¸ca˜o de Clairaut) a equa¸ca˜o (6.31) reduz-se a  x + B 0 (v(x)) v 0 (x) = 0 .

(6.32)

H´a duas formas de satisfazer essa equa¸ca˜o: a. impondo v 0 (x) = 0 ou, b. impondo x + B 0 (v(x)) = 0. a. Impondo-se v 0 (x) = 0, tem-se y(x) = c0 x + c1 , com c0 e c1 constantes. Essas constantes, por´em, n˜ao s˜ao independentes, pois (6.30) tem que ser satisfeita. Inserindo y(x) = c0 x + c1 em (6.30) obtem-se c1 = B(c0 ). Assim, uma solu¸ca˜o de (6.30) ´e y1 (x) ≡ y1 (x, c0 ) = c0 x + B(c0 ) , que depende de um parˆametro livre c0 . b. Aqui impomos x + B 0 (v(x)) = 0, obtendo localmente v(x) = (B 0 )−1 (−x). Lembramos, por´em, que (6.30) imp˜oe uma rela¸ca˜o entre y e v: y(x) = xv(x) + B(v(x)). Assim, uma segunda solu¸ca˜o de (6.30) ´e dada (localmente) por y2 (x) = x(B 0 )−1 (−x) + B((B 0 )−1 (−x)) . O fato not´avel sobre a solu¸ca˜o y2 ´e que a mesma n˜ao depende de nenhum parˆametro livre (que poderia ser fixado, eventualmente, por uma condi¸ca˜o inicial). Solu¸co˜es desse tipo s˜ao denominadas solu¸co ˜es 11 singulares de equa¸co˜es diferenciais. Tecnicamente, a defini¸ca˜o de solu¸ca ˜o singular ´e a seguinte. Uma solu¸ca˜o ys de uma equa¸ca˜o diferencial ordin´aria de primeira ordem ´e dita ser uma solu¸ca ˜o singular se for tangente a cada solu¸ca˜o geral yg dessa equa¸ca˜o, ou seja, se para todo x no dom´ınio de defini¸ca˜o da equa¸ca˜o houver uma solu¸ca˜o geral yg tal que ys (x) = yg (x) e ys0 (x) = yg0 (x). E. 6.17 Exerc´ıcio. Mostre que a solu¸c˜ao y2 (x) = x(B 0 )−1 (−x) + B((B 0 )−1 (−x)) ´e tangente `as solu¸co˜es y1 (x) = c0 x + B(c0 ). Sugest˜ao: use o fato (e prove-o!) que x(B 0 )−1 (−x) + B((B 0 )−1 (−x)) ´e uma primitiva de (B 0 )−1 (−x). 6 Geometricamente, uma solu¸ca˜o singular pode ser visualizada da seguinte forma. Desenha-se no plano (x, y) a fam´ılia de todas as curvas (x, yg (x)), x ∈ , para todas as solu¸co˜es gerais yg . A solu¸ca˜o singular corresponde a` curva envolt´ oria dessa fam´ılia de curvas. 

A equa¸ca˜o de Clairaut, com sua solu¸ca˜o singular, foi resolvida pelo mesmo em 1734. Uma terceira solu¸ca˜o de (6.31) poderia ser obtida procedendo de modo ligeiramente distinto do que foi feito na segunda solu¸ca˜o. Resolvendo localmente em v a equa¸ca˜o x + B 0 (v(x)) = 0, obtem-se v(x) = (B 0 )−1 (−x). Como v(x) = y 0 (x), obtem-se aparentemente uma terceira solu¸ca˜o por integra¸ca˜o: y3 (x) = C(x) + c2 , c2 sendo uma constante e C(x) sendo uma primitiva de (B 0 )−1 (−x), ou seja, tal que C 0 (x) = (B 0 )−1 (−x). Essa solu¸ca˜o aparenta ter um parˆametro livre e aparenta ser distinta da solu¸ca˜o ´ preciso ainda impor que y3 satisfa¸ca (6.30), ou seja, devemos impor que y2 , mas isso n˜ao ´e verdade. E x(B 0 )−1 (−x) − C(x) − c2 + B((B 0 )−1 (−x)) = 0 . 11

Trata-se de uma nomenclatura infeliz, pois o a express˜ ao “singular” ´e usada com v´ arios outros significados na literatura das equa¸co ˜es diferenciais.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 6

303/1304

0 −1 0 −1 0 −1 (O leitor  deve observar que x(B ) (−x)  + B((B ) (−x)) ´e tamb´em uma primitiva de (B ) (−x), d pois dx x(B 0 )−1 (−x) + B((B 0 )−1 (−x)) = (B 0 )−1 (−x) como facilmente se verifica). Da´ı, devemos ter

c2 = C(x) − (x(B 0 )−1 (−x) + B((B 0 )−1 (−x))) e, portanto, y3 (x) = x(B 0 )−1 (−x) + B((B 0 )−1 (−x)), que coincide com a solu¸ca˜o y2 . Exemplo 6.5 Considere a equa¸ca˜o de Clairaut xy 0 (x) − y(x) + (y 0 (x))2 = 0 .

(6.33)

Nesse caso, B(z) = z 2 , B 0 (z) = 2z e (B 0 )−1 (w) = w/2. Assim, as duas solu¸co˜es encontradas acima s˜ao y1 (x) ≡ y1 (x, c0 ) = c0 x + (c0 )2 e y2 (x) = −x2 /4, como facilmente se constata. ◊ E. 6.18 Exerc´ıcio. Verifique que as solu¸co˜es y1 (x, c0 ) e y2 (x) dadas no exemplo acima s˜ao de fato solu¸co˜es de (6.33). Mostre explicitamente que y2 (x) = −x2 /4 ´e uma solu¸c˜ao singular no sentido da defini¸c˜ao dada acima, ou seja, para todo x existe c0 tal que y2 (x) = y1 (x, c0 ) e y20 (x) = y10 (x, c0 ). Desenhe v´arias das curvas (x, y1 (x, c0 )), x ∈ , para v´arios valores de c0 ∈ e visualize a curva envolt´oria dessa 6 fam´ılia de curvas, a qual corresponder´a `a curva (x, y 2 (x)), x ∈ , da solu¸c˜ao singular. 





E. 6.19 Exerc´ıcio. Determine as solu¸co˜es y1 e y2 da equa¸c˜ao de Clairaut xy 0 (x) − y(x) + (y 0 (x))4 = 0 , e resolva as mesmas quest˜oes propostas no Exerc´ıcio E. 6.18.

6

• Solu¸ co ˜es da equa¸ c˜ ao de D’Alembert-Lagrange Daqui por diante suporemos que A(z) 6≡ z. Como veremos, a equa¸ca˜o (6.31) pode ser resolvida com o uso do m´etodo dos fatores integrantes para obter uma equa¸ca˜o exata e depois resolvˆe-la como tal. Assim como (6.29), a equa¸ca˜o (6.31) ´e uma equa¸ca˜o de primeira ordem, mas a dependˆencia em v 0 ´e muito mais simples. Em verdade, identificando B1 (x, v(x)) = A(v(x)) − v(x)

e

B2 (x, v(x)) = xA0 (v(x)) + B 0 (v(x)) ,

e

B2 (x1 , x2 ) = x1 A0 (x2 ) + B 0 (x2 ) ,

ou seja, para, B1 (x1 , x2 ) = A(x2 ) − x2

a equa¸ca˜o (6.31) tem a forma (6.21). A condi¸ca˜o de exatid˜ao (6.18) n˜ao ´e satisfeita (verifique!) e ´ f´acil ver que nesse caso desejamos saber se um fator integrante pode ser encontrado. E   ∂B1 ∂B2 1 1 (x1 , x2 ) − (x1 , x2 ) = =: β(x2 ) , B1 (x1 , x2 ) ∂x2 ∂x1 A(x2 ) − x2 uma fun¸ca˜o apenas da vari´avel x2 . Vale, assim, o caso II da p´agina 298, e o fator integrante ´e  Z x2  1 ω(x2 ) = exp dξ . (A(ξ) − ξ) b

JCABarata. Curso de F´ısica-Matem´ atica

Assim, definindo

Cap´ıtulo 6

Vers˜ ao de 29 de setembro de 2005.

304/1304

 1 dξ A1 (x1 , x2 ) := ω(x2 )B1 (x1 , x2 ) = (A(x2 ) − x2 ) exp (A(ξ) − ξ) b  Z x2  1 0 0 A2 (x1 , x2 ) := ω(x2 )B2 (x1 , x2 ) = (x1 A (x2 ) + B (x2 )) exp dξ (A(ξ) − ξ) b Z

x2

´ a equa¸ca˜o A1 (x, v(x)) + A1 (x, v(x))v 0 (x) = 0, obtida multiplicando (6.31) por ω(v(x)), ´e exata. E f´acil verificar que nesse caso  Z x2  Z x2 Z χ  1 1 0 U (x1 , x2 ) = x1 (A(x2 ) − x2 ) exp dξ + B (χ) exp dξ dχ . (A(ξ) − ξ) b b (A(ξ) − ξ) b (6.34) E. 6.20 Exerc´ıcio. Prove isso!

6

Assim, a solu¸ca˜o para (6.31) ´e dada por U (x, v(x)) = c0 , c0 sendo uma constante. Agora, para a obten¸ca˜o das solu¸co˜es desejadas de (6.29) h´a dois procedimentos: a. Observa-se que a equa¸ca˜o (6.29) pode ser lida como xA(v(x)) + B(v(x)) = y(x), que relaciona v e y. Ao menos em princ´ıpio, podemos resolver essa equa¸ca˜o para v e obter v(x) = I(x, y(x)). Inserindo isso em U (x, v(x)) = c0 , obtemos U (x, I(x, y(x))) = c0 . Essa equa¸ca˜o pode ser, ao menos em princ´ıpio, resolvida em y para fornecer uma solu¸ca˜o y1 (x), dependente de um parˆametro livre c0 . b. Resolve-se localmente a equa¸ca˜o U (x, v(x)) = c0 para v, obtendo-se v(x) = H(x, c0 ) para alguma fun¸ca˜o H. Observa-se que a equa¸ca˜o (6.29) pode ser lida como y(x) = xA(v(x)) + B(v(x)), que fornece y se v ´e dado. Assim, y2 (x) = xA(H(x, c0 )) + B(H(x, c0 )) ´e uma segunda solu¸ca˜o de ´ de se notar que a solu¸ca˜o y2 depende de um parˆametro livre c0 . (6.29). E Um terceiro procedimento seria resolver localmente a equa¸ca˜Ro U (x, v(x)) = c 0 para v, obtendo v(x) = H(x, c0 ) para alguma fun¸ca˜o H, donde se extrai y3 (x) = H(x, c0 )dx + c1 , c1 sendo uma nova constante. Para que se tenha uma solu¸ca˜o de (6.29) ´e preciso inserir essa solu¸ca˜o naquela equa¸ca˜o, o que implica y3 (x) = xA(H(x, c0 )) + B(H(x, c0 )), mostrando que essa terceira solu¸ca˜o ´e idˆentica a` y2 . 0 Exemplo 6.6 A equa¸ca˜o diferencial (2x + √ 1)y (x) − y(x) = 0 pode ser facilmente resolvida por integra¸ca˜o, fornecendo a solu¸ca˜o y0 (x) = k 2x + 1, k sendo uma constante. Para ilustrar o m´etodo de solu¸ca˜o desenvolvido acima, escrevemos essa equa¸ca˜o diferencial na forma de uma equa¸ca˜o de D’Alembert-Lagrange: 2xy 0 (x) − y(x) + y 0 (x) = 0 . (6.35)

Aqui temos A(z) = 2z, B(z) = z, B 0 (z) = 1. Para a fun¸ca˜o U tem-se por (6.34) (tomamos aqui b = 1, sem perda de generalidade) Z χ  Z x2  Z x2 1 1 exp dξ + dξ dχ U (x1 , x2 ) = x1 x2 exp ξ 1 ξ 1 1   Z x2 1 1 2 = x 1 x2 + χ dχ = x1 + x22 − . 2 2 1

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 6

Vers˜ ao de 29 de setembro de 2005.

2

c00

305/1304 q

c00

c0

0 A equa¸ca˜o U (x, v(x)) = c0 fica, ent˜ao, (2x + 1)v(x) = (com = 2c0 + 1). Assim, v(x) = ± 2x+1 . q 0 p c0 Assim, H(x, c00 ) = ± 2x+1 e a solu¸ca˜o y2 fica y2 (x) = ± c00 (2x + 1), que coincide em forma com a solu¸ca˜o y0 .

Para a solu¸ca˜o y1 come¸camos por notar que (6.35) diz-nos que y(x) = (2x + 1)v(x) e, portanto, v(x) = I(x, y(x)) = p y(x)/(2x + 1). A equa¸ca˜o U (x, I(x, y(x))) = c0 fica y(x)2 /(2x + 1) − 1 = c0 , cuja solu¸ca˜o ´e y1 (x) = ± c00 (2x + 1), tamb´em idˆentica em forma a` solu¸ca˜o y0 . O fato de as solu¸co˜es y1 e y2 coincidirem decorre de (6.35) ser uma equa¸ca˜o linear, apresentando apenas uma solu¸ca˜o, dependente de um parˆametro (vide Se¸ca˜o 6.1, p´agina 286). ◊ Exemplo 6.7 Considere a equa¸ca˜o diferencial

2xy 0 (x) − y(x) −

α 0 (y (x))3 = 0 , 3

(6.36)

α 6= 0 sendo uma constante. Essa ´e uma equa¸ca˜o de D’Alembert-Lagrange com A(z) = 2z, B(z) = − α3 z 3 , B 0 (z) = −αz 2 . Para a fun¸ca˜o U tem-se, por (6.34) (tomamos aqui b = 1, sem perda de generalidade),  Z x2  Z χ  Z x2 1 1 2 dξ − α χ exp dξ dχ U (x1 , x2 ) = x1 x2 exp ξ 1 ξ 1 1 Z x2 α 2 = x 1 x2 − α χ3 dχ = x1 x22 − (x42 − 1) . 4 1 A equa¸ca˜o U (x, v(x)) = c0 fica v(x)4 − 4x v(x)2 − c00 = 0 (com c00 = − 4cα0 − 1) cujas quatro solu¸co˜es s˜ao α v(x) = ±

s

2x ± α

r

x2 + (c00 )2 . α2

 Por (6.36), y(x) = v(x) 2x − α3 v(x)2 e, assim, obtem-se quatro solu¸co˜es y2 (x) = ±

4x (−α) ± 3 3

r

4x2 α2

+ (c00 )2

!s

2x ± α

r

4x2 + (c00 )2 , α2

(6.37)

sendo que os dois u ´ ltimos sinais ± devem ser escolhidos iguais.

Para obter as solu¸co˜es y1 ´e preciso primeiro resolver em v a equa¸ca˜o de terceiro grau y(x) = 2xv(x) − α3 v(x)3 . Para solu¸co˜es de equa¸co˜es de terceiro grau, vide, por exemplo, [123]. ◊ E. 6.21 Exerc´ıcio. Verifique que (6.37) ´e, de fato, uma solu¸c˜ao de (6.36).

6

Cap´ıtulo 7 Sistemas de Equa¸co ˜es Diferenciais Ordin´ arias Lineares Conte´ udo 7.1

Introdu¸ ca ˜o

7.2

Unicidade e Existˆ encia de Solu¸ co ˜es . . . . . . . . . . . . . . . . . . . . . . . 308

7.3

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307

7.2.1

Unicidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308

7.2.2

Existˆencia. A S´erie de Dyson . . . . . . . . . . . . . . . . . . . . . . . . . . . 311

7.2.3

Propriedades de D(s, t) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316

Equa¸ co ˜es com Coeficientes Constantes . . . . . . . . . . . . . . . . . . . . . 320 7.3.1

Alguns Exemplos e Aplica¸co˜es

. . . . . . . . . . . . . . . . . . . . . . . . . . 322

7.4

Teoria de Perturba¸ co ˜es de Sistemas Lineares . . . . . . . . . . . . . . . . . 327

7.5

Mais sobre a S´ erie de Dyson. Produtos de Tempo Ordenado . . . . . . . 330

7.6

Sistemas de Equa¸ co ˜es Diferenciais Lineares no Plano Complexo . . . . . 333

7.7

7.8

7.9

7.6.1

O Caso Anal´ıtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334

7.6.2

Resolu¸ca˜o por S´eries de Potˆencias

7.6.3

Sistemas com Pontos Singulares. Monodromia . . . . . . . . . . . . . . . . . 342

7.6.4

Sistemas com Pontos Singulares Simples . . . . . . . . . . . . . . . . . . . . . 352

. . . . . . . . . . . . . . . . . . . . . . . . 340

Sistemas Provenientes de EDOs de Ordem m

. . . . . . . . . . . . . . . . 357

7.7.1

Pontos Singulares Simples em EDO’s de Ordem m . . . . . . . . . . . . . . . 358

7.7.2

Singularidades no Infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362

7.7.3

Alguns Exemplos de Interesse . . . . . . . . . . . . . . . . . . . . . . . . . . . 364

Equa¸ co ˜es Fuchsianas. S´ımbolos de Riemann . . . . . . . . . . . . . . . . . 370 7.8.1

Equa¸co˜es Fuchsianas de Primeira Ordem

. . . . . . . . . . . . . . . . . . . . 370

7.8.2

Equa¸co˜es Fuchsianas de Segunda Ordem . . . . . . . . . . . . . . . . . . . . . 375

7.8.3

S´ımbolos de Riemann. Simetrias de Equa¸co˜es Fuchsianas de Segunda Ordem

382

Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389

remos neste cap´ıtulo estudar sistemas de equa¸co˜es diferenciais lineares ordin´arias, com particular aten¸ca˜o a sistemas de equa¸co˜es diferenciais lineares associados a equa¸co˜es diferenciais lineares de ordem n. Demonstraremos alguns teoremas b´asicos e apresentaremos m´etodos de solu¸ca˜o, com particular destaque para a s´erie de Dyson. Alguns exemplos de interesse f´ısico ser˜ao discutidos com certo detalhe. Inicialmente trataremos sistemas dependentes de uma vari´avel real e mais adiante generalizaremos nossos resultados para sistemas dependentes de uma vari´avel complexa. Tal generaliza¸ca˜o ´e particularmente importante para o tratamento de sistemas de equa¸co˜es diferenciais 306

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

307/1304

provenientes de equa¸co˜es diferenciais ordin´arias lineares de ordem n, j´a que m´etodos de resolu¸ca˜o de tais equa¸co˜es, como o m´etodo de Frobenius, est˜ao intimamente relacionados a propriedades anal´ıticas dos coeficientes da equa¸ca˜o. O presente cap´ıtulo ser´a continuado no Cap´ıtulo 8, onde discutiremos a solu¸ca˜o de equa¸co˜es diferenciais ordin´arias lineares de ordem 2 utilizando o m´etodo de expans˜oes em s´erie, e utilizando o m´etodo de Frobenius. Em seguida, no Cap´ıtulo 9, estudaremos propriedades de algumas das solu¸co˜es de maior interesse em F´ısica.

7.1

Introdu¸ c˜ ao

Seja t uma vari´avel real, A(t) uma matriz m × m cujos elementos Aij (t), i, j = 1, . . . , m, s˜ao fun¸co˜es cont´ınuas (reais ou complexas) dadas de t e seja F (t) um vetor coluna   f1 (t)   F (t) =  ...  fm (t) onde fi (t), i = 1, . . . , m s˜ao igualmente fun¸co˜es cont´ınuas (reais ou complexas) dadas de t. Se Y (t) ´e um vetor coluna

a equa¸ca˜o diferencial

 y1 (t)   Y (t) =  ...  ym (t) 

Y˙ (t) = A(t)Y (t) + F (t)

(7.1)

´e denominada um sistema linear de equa¸co ˜es diferenciais de primeira ordem, cujas inc´ognitas s˜ao as m fun¸co˜es y1 (t), . . . , ym (t). Caso F for identicamente nula o sistema ´e dito ser um sistema homogˆeneo e, caso contr´ario, ´e dito ser um sistema n˜ ao-homogˆeneo. Estaremos aqui interessados em estudar esses sistemas de equa¸co˜es diferenciais quando uma condi¸ca ˜o inicial ´e fornecida, ou seja, quando o valor de Y (t) em um ponto t0 ´e especificado, tipicamente o valor de Y (t) em t = 0: Y (0) = Y0 , com   y10   Y0 =  ...  , 0 ym 0 y10 , . . . ym sendo constantes (reais ou complexas).

JCABarata. Curso de F´ısica-Matem´ atica

7.2 7.2.1

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

308/1304

Unicidade e Existˆ encia de Solu¸ co ˜es Unicidade

Iremos mais adiante mostrar que, sob as hip´oteses acima, o sistema (7.1), submetido a uma condi¸ca˜o inicial Y (0) = Y0 , sempre possui solu¸ca˜o. Iremos em verdade exibir um m´etodo aproximativo para o c´alculo da solu¸ca˜o. Para preparar essa discuss˜ao devemos primeiramente demonstrar a unicidade da solu¸ca˜o, ou seja, precisamos mostrar que se houver uma fun¸ca˜o Y (t) satisfazendo Y˙ (t) = A(t)Y (t) + F (t) e Y (0) = Y0 , ent˜ao n˜ao h´a outra fun¸ca˜o distinta de Y com essas propriedades. O fato de a solu¸ca˜o ser u ´ nica ser´a de importˆancia quando discutirmos um m´etodo para calcular a solu¸ca˜o. Vamos considerar primeiro o caso mais simples onde a equa¸ca˜o ´e homogˆenea Y˙ (t) = A(t)Y (t) e a condi¸ca˜o inicial ´e Y (0) = 0. Partiremos desse caso mais simples para poder tratar melhor depois o caso geral. Integrando-se ambos os lados da igualdade Y˙ (t) = A(t)Y (t) entre 0 e t e usando que Y (0) = 0, tem-se Z t Y (t) = A(t1 )Y (t1 ) dt1 . (7.2) 0

Essa rela¸ca˜o ´e uma identidade a ser satisfeita pela fun¸ca˜o Y (t) que eventualmente ´e solu¸ca˜o da equa¸ca˜o Y˙ (t) = A(t)Y (t) com a condi¸ca˜o inicial Y (0) = 0. Observemos que a fun¸ca˜o Y aparece no lado esquerdo e tamb´em dentro da integral. Como a identidade acima vale para todo t, tem-se tamb´em que Z t1 Y (t1 ) = A(t2 )Y (t2 ) dt2 . 0

Inserindo-se isso na pen´ ultima identidade, tem-se Z t Z Y (t) = A(t1 ) 0

ou seja, Y (t) =

Z tZ 0

t1

A(t2 )Y (t2 ) dt2 dt1 , 0

t1

A(t1 )A(t2 ) Y (t2 ) dt2 dt1 . 0

Repetindo-se esse procedimento n vezes chega-se a` seguinte identidade: Z t Z t1 Z tn−1 Y (t) = ··· A(t1 )A(t2 ) · · · A(tn ) Y (tn ) dtn dtn−1 · · · dt1 . 0

0

(7.3)

0

Lembrando que Y (t) ´e um vetor cujas componentes s˜ao fun¸co˜es yi (t) essa u ´ ltima identidade significa para a a-´esima componente ya (t) =

m Z tZ X b=1

0

t1 0

···

Z

tn−1 0

(A(t1 )A(t2 ) · · · A(tn ))ab yb (tn ) dtn dtn−1 · · · dt1 .

(7.4)

Acima, (A(t1 )A(t2 ) · · · A(tn ))ab ´e o elemento ab da matriz A(t1 )A(t2 ) · · · A(tn ), formada pelo produto de n matrizes.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

309/1304

De acordo com a regra de produto de matrizes, (A(t1 )A(t2 ) · · · A(tn ))ab ´e dado por (A(t1 )A(t2 ) · · · A(tn ))ab =

m X m X

k1 =1 k2 =1

···

m X

kn−1 =1

Aak1 (t1 )Ak1 k2 (t2 ) · · · Akn−1 b (tn ).

A rela¸ca˜o (7.4) fica ent˜ao ya (t) =

m X m X m X

···

b=1 k1 =1 k2 =1

Z tZ m X

kn−1 =1

0

t1 0

···

Z

tn−1 0

Aak1 (t1 )Ak1 k2 (t2 ) · · · Akn−1 b (tn ) yb (tn ) dtn dtn−1 · · · dt1 .

Essa rela¸ca˜o implica a seguinte desigualdade Z t Z t1 Z tn−1 m m X m X m X X ··· |Aak1 (t1 )| |Ak1 k2 (t2 )| · · · |Akn−1 b (tn )||yb (tn )|dtn dtn−1 · · · dt1 . ··· |ya (t)| ≤ kn−1 =1

b=1 k1 =1 k2 =1

0

0

0

(7.5)

Vamos agora supor (provisoriamente) que t ´e limitado a um intervalo [0, T ] para algum T > 0 finito. Vamos definir α = max max |Aij (t)| (7.6) t∈[0, T ] i, j∈{1, ..., m}

e M = max

max

t∈[0, T ] i∈{1, ..., m}

|yi (t)|,

ou seja α ´e o m´aximo valor alcan¸cado pelo m´odulo dos elementos de matriz A ij (t) quando t varia no intervalo [0, T ] e M ´e o m´aximo valor alcan¸cado pelo m´odulo de todas as componentes y i (t) de Y quando t varia no intervalo [0, T ]. Note-se que as mencionadas fun¸co˜es s˜ao limitadas pois, por hip´otese, s˜ao cont´ınuas, e o intervalo [0, T ] ´e finito. Retornando a (7.5), como todos os |Aij (tk )| s˜ao menores ou iguais a α e todos os |yb (tn )| s˜ao menores ou iguais a M , tem-se que Z t Z t1 Z tn−1 m X m X m m X X |ya (t)| ≤ ··· ··· αn M dtn dtn−1 · · · dt1 . (7.7) b=1 k1 =1 k2 =1

kn−1 =1

0

0

0

O fator αn deve-se ao fato que

Claramente, vale que Z tZ m X m m X X ··· b=1 k1 =1

kn−1 =1

0

· · α} = αn . |Aak1 (t1 )| |Ak1 k2 (t2 )| · · · |Akn−1 b (tn )| ≤ α | ·{z n vezes t1 0

···

Z

tn−1 0

n

n

α M dtn · · · dt1 = α M

m X m X

b=1 k1 =1

···

Z tZ m X

kn−1 =1

pois α e M s˜ao constantes. Fora isso, ´e bem f´acil constatar que Z t Z t1 Z tn−1 tn ··· dtn dtn−1 · · · dt1 = . n! 0 0 0

0

t1 0

···

Z

tn−1 0

dtn · · · dt1 ,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

310/1304

E. 7.1 Exerc´ıcio importante. A u ´ltima igualdade pode ser facilmente provada por indu¸c˜ao. Fa¸ca-o. 6 Assim, a desigualdade (7.7) fica m

m

m

X tn X X ··· 1. |ya (t)| ≤ α M n! b=1 k =1 k =1 n

1

´ evidente, agora, que E

m X m X

b=1 k1 =1

···

m X

n−1

1 = mn

kn−1 =1

pois h´a n somas sucessivas, em cada uma o ´ındice assume m valores e o somando ´e sempre constante (n˜ao depende dos ´ındices). Conclu´ımos que |ya (t)| ≤ M

(αmt)n . n!

(7.8)

Essa desigualdade deve ser satisfeita para t ∈ [0, T ] pela a-´esima componente da solu¸ca˜o Y da ´ importante notar, por´em, que o lado esquerdo equa¸ca˜o Y˙ = A(t)Y (t) com condi¸ca˜o inicial Y (0) = 0. E n˜ao depende de n, que ´e simplesmente o n´ umero de vezes que repetimos a identidade (7.2) para obter ´ bem sabido que para qualquer x ≥ 0 fixo tem-se (7.3). O que ocorre, por´em, se tomarmos n → ∞? E xn = 0. n→∞ n! lim

Assim, tomando-se em (7.8) o limite n → ∞ em ambos os lados, conclui-se que ya (t) = 0 para todo a e todo t ∈ [0, T ]. Como T foi escolhido arbitr´ario, segue que ya (t) = 0 para todo t e todo a. Em resumo, conclu´ımos que se Y ´e solu¸ca˜o da equa¸ca˜o Y˙ = A(t)Y (t) com condi¸ca˜o inicial Y (0) = 0 ent˜ao Y (t) = 0 para todo t. N˜ao h´a, portanto, outra solu¸ca˜o que n˜ao a fun¸ca˜o nula para a equa¸ca˜o homogˆenea Y˙ = A(t)Y (t) com condi¸ca˜o inicial Y (0) = 0. O que podemos dizer do caso geral da equa¸ca˜o Y˙ = A(t)Y (t) + F (t) com uma condi¸ca˜o inicial Y (0) = Y0 ? Vamos supor que Y e X s˜ao duas solu¸co˜es satisfazendo a mesma condi¸ca˜o inicial, ou seja, Y (0) = X(0) = Y0 . Definindo Z(t) = Y (t) − X(t) tem-se Z(0) = Y (0) − X(0) = Y0 − Y0 = 0 e ˙ ˙ Z(t) = Y˙ (t) − X(t) = A(t)Y (t) + F (t) − (A(t)X(t) + F (t)) = A(t)(Y (t) − X(t)) = A(t)Z(t). ˙ Assim, Z ´e solu¸ca˜o da equa¸ca˜o homogˆenea Z(t) = A(t)Z(t) com a condi¸ca˜o inicial Z(0) = 0. Pelo que acabamos de ver, Z ´e identicamente nula, o que prova que Y = X. Isso provou ent˜ao que a equa¸ca˜o Y˙ = A(t)Y (t) + F (t) com uma condi¸ca˜o inicial Y (0) = Y0 tem tamb´em solu¸ca˜o u ´ nica, se houver. Provaremos adiante que h´a uma solu¸ca˜o e mostraremos como calcul´ala. Finalmente, observamos que todas as conclus˜oes apresentadas acima permanecem se a condi¸ca˜o inicial for fixada n˜ao em t = 0 mas num ponto t0 qualquer. • Uma propriedade da solu¸ c˜ ao das equa¸ co ˜es homogˆ eneas

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

311/1304

As demonstra¸co˜es que apresentamos acima tˆem mais uma conseq¨ uˆencia para as solu¸co˜es das equa¸co˜es homogˆeneas Y˙ (t) = A(t)Y (t), conseq¨ uˆencia essa da qual faremos uso mais adiante. Tem-se, a saber, o seguinte: a solu¸ca˜o Y (t) de uma equa¸ca˜o homogˆenea Y˙ (t) = A(t)Y (t) anula-se em um ponto t0 , Y (t0 ) = 0 se e somente se Y (t) for nula para todo t. A prova disso segue da seguinte observa¸ca˜o. Se Y (t0 ) = 0 ent˜ao Z t Y (t) = A(t1 )Y (t1 ) dt1 . t0

Como em (7.3), conclu´ımos que Z Z t Z t1 ··· Y (t) = t0

t0

tn−1

A(t1 )A(t2 ) · · · A(tn ) Y (tn ) dtn dtn−1 · · · dt1 .

t0

Prosseguindo como antes, concluiremos que |ya (t)| ≤ M

(αm|t − t0 |)n , n!

(7.9)

onde α = max

max

t∈[0, T ] i, j∈{1, ..., m}

|Aij (t)|

e M = max

max

t∈[0, T ] i∈{1, ..., m}

|yi (t)|

o intervalo [0, T ] sendo escolhido grande o suficiente para conter t e t0 . Tomando o limite n → ∞ em (7.9), conclu´ımos que ya (t) = 0. Como isso vale para um t arbitr´ario, segue que Y (t) ´e identicamente nula, que ´e o que quer´ıamos provar.

7.2.2

Existˆ encia. A S´ erie de Dyson

Uma vez demonstrada a unicidade da eventual solu¸ca˜o de uma equa¸ca˜o como Y˙ = A(t)Y (t) + F (t) com condi¸ca˜o inicial Y (0) = Y0 precisamos demonstrar que a solu¸ca˜o existe. E a melhor maneira de demonstrar a existˆencia de solu¸ca˜o de uma equa¸ca˜o diferencial ´e exibindo uma. Para s e t reais, seja D(t, s) a matriz m × m definida por D(t, s) :=

+

∞ Z tZ X s

n=1

t1 s

···

Z

tn−1 s

A(t1 )A(t2 ) · · · A(tn ) dtn dtn−1 · · · dt1 .

(7.10)

Seja tamb´em D(t) definida por D(t) = D(t, 0), ou seja, D(t) =

+

∞ Z tZ X n=1

0

t1 0

···

Z

tn−1 0

A(t1 )A(t2 ) · · · A(tn ) dtn dtn−1 · · · dt1 .

(7.11)

Algumas p´aginas adiante (p´agina 319) provaremos que vale entre D(t, s) e D(t) a seguinte rela¸ca˜o: D(t, s) = D(t)D(s)−1 .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

312/1304

A s´erie do lado direito de (7.10) e (7.11) ´e freq¨ uentemente denominada s´erie de Dyson 1 , denomina¸ca˜o esta empregada especialmente em textos sobre Mecˆanica Quˆantica e Teoria Quˆantica da Campos. Afirmamos que a equa¸ca˜o Y˙ = A(t)Y (t) + F (t) com uma condi¸ca˜o inicial Y (0) = Y0 tem solu¸ca˜o, a qual ´e dada por Z t

Y (t) = D(t)Y0 +

D(t, s)F (s) ds .

(7.12)

0

A demonstra¸ca˜o ser´a feita provando-se que o lado direito satisfaz a equa¸ca˜o diferencial e a condi¸ca˜o inicial. Como a solu¸ca˜o ´e u ´ nica (pelo provado acima), infere-se que n˜ao pode haver outra que n˜ao (7.12). Note-se, em particular, que pelo dito acima, a equa¸ca˜o homogˆenea Y˙ = A(t)Y (t) com condi¸ca˜o inicial Y (0) = Y0 tem por solu¸ca˜o Y (t) = D(t)Y0 . O estudante deve ter em mente que a express˜ao (7.12) generaliza o m´etodo de varia¸ca˜o de constantes apresentado na Se¸ca˜o 6.4, p´agina 291. De fato, como veremos adiante, D(t, s) ´e idˆentica a` matriz Wronskiana das solu¸co˜es linearmente independentes da equa¸ca˜o homogˆenea.

Comecemos por mostrar que as s´eries que aparecem em (7.10) e (7.11) s˜ao convergentes, sem o que ambas as express˜oes n˜ao fariam sentido. Denotando por Dab (t, s) o elemento ab da matriz D(t, s), temos Z tn−1 ∞ Z t Z t1 X Dab (t, s) = ab + ··· (A(t1 )A(t2 ) · · · A(tn ))ab dtn dtn−1 · · · dt1 n=1

= δa b +

s

s

∞ X m X m X

n=1 k1 =1 k2 =1

s

···

Z tZ m X

kn−1 =1

s

t1 s

···

Z

tn−1 s

Aak1 (t1 )Ak1 k2 (t2 ) · · · Akn−1 b (tn ) dtn · · · dt1 .

Limitando provisoriamente t e s a um intervalo finito [0, T ] e usando a defini¸ca˜o de α dada em (7.6), 1

Freeman J. Dyson (1923-). Denominamos a s´erie de (7.10) e (7.11) s´erie de Dyson, pois essa nomenclatura ´e comummente empregada na Mecˆ anica Quˆ antica e na Teoria Quˆ antica de Campos. Dyson chegou a essa s´erie estudando problemas de teoria de perturba¸co ˜es na Teoria Quˆ antica de Campos. Sua origem, por´em, remonta pelo menos a trabalhos de Volterra de 1890. Em Teoria Quˆ antica de Campos aquelas s´eries s˜ ao tamb´em denominadas “exponenciais de tempo ordenado”.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

313/1304

temos |Dab (t, s)| ≤ 1 +

∞ X m X

n=1 k1 =1

≤ 1+

∞ X

≤ 1+

∞ X

≤ 1+

∞ X

= 1+

α

n

n=1

···

m X

k1 =1

αn

n=1

Z tZ m X

kn−1 =1

···

s

n=1

s

···

Z tZ m X

kn−1 =1

s

Z

tn−1 s

t1 s

···

Z

|Aak1 (t1 )| |Ak1 k2 (t2 )| · · · Akn−1 b (tn ) dtn · · · dt1

tn−1 s

dtn · · · dt1

m m X |t − s|n X ··· 1 n! k =1 k =1 1

αn

t1

n−1

|t − s|n n−1 m n!

 1 αm|t−s| e −1 m

Isso mostra que, para cada elemento de matriz ab, a s´erie do lado direito de (7.10) ´e absolutamente convergente, e isso para todo s e t. Para mostrar que (7.12) representa de fato a solu¸ca˜o procurada, vamos mostrar que

Isso, em particular, diz que

∂ D(t, s) = A(t)D(t, s). ∂t

(7.13)

d D(t) = A(t)D(t). dt

(7.14)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

314/1304

De fato, ∂ ∂ D(t, s) = ∂t ∂t

(

d = dt

(

+

∞ Z tZ X s

n=1

+

+

Z

A(t1 ) dt1 + s

Z tZ

= A(t)



+

+

Z

tn−1

A(t1 )A(t2 ) · · · A(tn ) dtn dtn−1 · · · dt1 .

s

Z tZ s

= 0 + A(t) +

= A(t)

···

s

t

s



t1

Z

Z Z

t1 s

Z

t1

A(t1 )A(t2 ) dt2 dt1 s

t2

A(t1 )A(t2 )A(t3 ) dt3 dt2 dt1 + · · ·

s

t

A(t)A(t2 ) dt2 + s

Z tZ s

t

A(t2 ) dt2 +

Z tZ s

s t

A(t1 ) dt1 +

Z tZ s

s

)

)

t2 s

A(t)A(t2 )A(t3 ) dt3 dt2 + · · ·

t2

A(t2 )A(t3 ) dt3 dt2 + · · ·

s t1 s

A(t1 )A(t2 ) dt2 dt1 + · · ·

 

= A(t)D(t, s), como quer´ıamos provar. Acima, na passagem da quarta para a quinta linha, fizemos uma s´erie de mudan¸cas de nomes das vari´aveis de integra¸ca˜o, chamando t2 de t1 , t3 de t2 etc. De maneira an´aloga prova-se tamb´em que ∂ D(t, s) = −D(t, s)A(s). ∂s E. 7.2 Exerc´ıcio. Fa¸ca isso.

6

´ tamb´em evidente pela defini¸ca˜o (7.10) que para todo t vale D(t, t) = . Analogamente, vale E D(0) = . Retornando a` equa¸ca˜o (7.12), notemos que calculando o lado direito em t = 0 temos Z 0 Y (0) = D(0)Y0 + D(0, s)F (s) ds = Y0 + 0 = Y0 0

mostrando que o lado direito de (7.12) satisfaz a condi¸ca˜o inicial Y (0) = Y0 . Derivando o lado direito

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

315/1304

de (7.12) em rela¸ca˜o a t, tem-se Y˙ (t) =

d d D(t)Y0 + dt dt

Z

t

D(t, s)F (s) ds 0

= A(t)D(t)Y0 + D(t, t)F (t) +

= A(t)D(t)Y0 + F (t) + 

= A(t) D(t)Y0 +

Z

t

Z

Z

t 0

∂ D(t, s)F (s) ds ∂t

t

A(t)D(t, s)F (s) ds 0



D(t, s)F (s) ds + F (t). 0

= A(t)Y (t) + F (t), provando que lado direito de (7.12) satisfaz a equa¸ca˜o diferencial. Como a solu¸ca˜o ´e u ´ nica, ela deve ser aquela dada em (7.12). • Observa¸ co ˜es A s´erie de Dyson em (7.10) e (7.11) fornece a solu¸ca˜o do sistema de equa¸co˜es Y˙ (t) = A(t)Y (t)+F (t) atrav´es de (7.12). Devemos fazer notar, por´em, que a s´erie de Dyson n˜ao ´e o u ´ nico meio de obter solu¸co˜es dessas equa¸co˜es. Em alguns casos particulares outros m´etodos podem ser mais eficazes, especialmente se estivermos interessados em obter solu¸co˜es em termos de fun¸co˜es conhecidas ou de expans˜oes em s´erie. Tal ´e o caso, por exemplo, se os elementos de matriz de A(t) e F (t) s˜ao fun¸co˜es anal´ıticas de t ou possuem singularidades “fracas”, quando o chamado m´etodo de expans˜ ao em s´erie de potˆencias ou o m´etodo de Frobenius podem ser empregados (vide para tal o Cap´ıtulo 8, p´agina 394,). Em muitos casos a s´erie de Dyson n˜ao ´e u ´ til quando se pretende obter solu¸co˜es expl´ıcitas, devido a` complexidade de se calcular explicitamente os produtos de matrizes A(t1 ) · · · A(tn ) e suas integrais. A s´erie de Dyson ´e, por´em, bastante eficiente quando o interesse ´e obter solu¸co˜es por m´etodos num´ericos, j´a que a mesma ´e rapidamente convergente. A s´erie de Dyson ´e tamb´em muito u ´ til quando se tem pela frente problemas de teoria de perturba¸co˜es. Isso ser´a discutido com mais detalhe na Se¸ca˜o 7.4. Foi, ali´as, estudando problemas de teoria de perturba¸co˜es na Teoria Quˆantica de Campos que Dyson chegou a`quela s´erie, inspirado provavelmente nos m´etodos iterativos de solu¸ca˜o da equa¸ca˜o integral de Volterra (o leitor interessado pode estudar o tratamento da equa¸ca˜o integral de Volterra feito na Se¸ca˜o 17.2, p´agina 889, mas isso ´e dispens´avel para o que segue).

A s´erie de Dyson possui generaliza¸co˜es para espa¸cos de Hilbert e de Banach e mesmo quando A(t) ´e uma fam´ılia de operadores n˜ao-limitados. O leitor interessado poder´a estud´a-las em [104]. Um caso particular importante da solu¸ca˜o via s´erie de Dyson ´e aquele no qual a matriz A(t) ´e constante, ou seja, n˜ao depende da vari´avel t. Trataremos disso na Se¸ca˜o 7.3. Outras representa¸co˜es e propriedades da s´erie de Dyson s˜ao apresentadas no Apˆendice 7.5, p´agina 330. • Equa¸ co ˜es Matriciais

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

316/1304

At´e agora estudamos equa¸co˜es da forma Y˙ (t) = A(t)Y (t) + F (t), com condi¸ca˜o inicial Y (0) = Y0 , onde A(t) ´e uma matriz m × m e onde Y e F s˜ao vetores coluna com m componentes:     y1 (t) f1 (t)     Y (t) =  ...  , F (t) =  ...  . ym (t) fm (t) ˙ Consideremos agora a equa¸ca˜o M(t) = A(t)M(t)+G(t), com condi¸ca˜o inicial M(0) = M0 , onde A(t), G(t) e M(t) s˜ao matrizes m × m, a inc´ognita sendo a matriz M(t). Veremos facilmente que podemos tratar esse problema com os mesmos m´etodos do anterior, onde a inc´ognita era um vetor coluna Y de m componentes e n˜ao uma matriz quadrada. De fato, como toda matriz m × m, as matrizes M(t) e G(t) s˜ao da forma (para nota¸ca˜o, vide p´agina 143) hh ii hh ii M(t) = M1 (t), . . . , Mm (t) , G(t) = G1 (t), . . . , Gm (t) ,

onde Mi (t) e Gi (t) s˜ao vetores coluna com m componentes, representando a i-´esima coluna das matrizes M(t) e G(t), respectivamente. ˙ Nessa nota¸ca˜o a equa¸ca˜o diferencial M(t) = A(t)M(t) + G(t) fica hh ii hh ii hh ii M˙ 1 (t), . . . , M˙m (t) = A(t)M1 (t), . . . , A(t)Mm (t) + G1 (t), . . . , Gm (t) ,

ou seja, tem-se um conjunto de m sistemas de equa¸co˜es independentes M˙ i (t) = A(t)Mi (t) + Gi (t),

i = 1, . . . , m

(7.15)

do tipo que tratamos acima, onde as inc´ognitas s˜ao vetores coluna. Para cada uma dessas equa¸co˜es vale o teorema de unicidade de solu¸co˜es que provamos acima. Assim ˙ conclu´ımos que a equa¸ca˜o matricial M(t) = A(t)M(t) + G(t), com condi¸ca˜o inicial M(0) = M0 tem solu¸ca˜o u ´ nica. A solu¸ca˜o de cada equa¸ca˜o (7.15) ´e Mi (t) = D(t)Mi (0) +

Z

t

D(t, s)Gi (s) ds,

i = 1, . . . , m.

0

Reunindo as colunas Mi novamente na matriz M, temos Z t M(t) = D(t)M0 + D(t, s)G(s) ds 0

˙ como solu¸ca˜o u ´ nica de M(t) = A(t)M(t) + G(t), com condi¸ca˜o inicial M(0) = M0 .

7.2.3

Propriedades de D(s, t)

Consideremos novamente a equa¸ca˜o homogˆenea Y˙ (t) = A(t)Y (t) com a condi¸ca˜o inicial Y (0) = Y0 . Sabemos que sua solu¸ca˜o ´e dada por Y (t) = D(t)Y0 , onde D(t) ´e dada em (7.11).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

Sejam ek os vetores da base canˆonica     1 0 0  1          e 1 = 0  , e 2 = 0  ,  ..   ..  . . 0 0

...,

em

317/1304

  0 0      =  ...  .   0  1

Definimos Y k (t) = D(t)ek para k = 1, . . . , m. Cada Y k (t) ´e solu¸ca˜o da equa¸ca˜o homogˆenea Y˙ (t) = A(t)Y (t) com a condi¸ca˜o inicial Y (0) = ek . Um vetor Y0 representando uma condi¸ca˜o inicial gen´erica   y10  ..  Y0 =  . 

(7.16)

0 ym

pode ser escrita na base canˆonica como

Y0 =

m X

yk0 ek .

k=1

Assim, se Y (t) ´e solu¸ca˜o da equa¸ca˜o homogˆenea Y˙ (t) = A(t)Y (t) com a condi¸ca˜o inicial Y (0) = Y0 temos que m m X X 0 k Y (t) = D(t)Y0 = yk D(t)e = yk0 Y k (t). (7.17) k=1

k=1

Em resumo, todas as solu¸co˜es da equa¸ca˜o homogˆenea Y˙ (t) = A(t)Y (t) podem ser escritas como combina¸co˜es lineares das fun¸co˜es Y 1 (t), . . . , Y m (t), os coeficientes sendo as componentes yk0 do vetor Y0 na base canˆonica. Em virtude dessas e de outras propriedades que ainda estudaremos ´e importante estudar as fun¸co˜es Y (t). O conjunto de fun¸co˜es {Y 1 (t), . . . , Y m (t)} ´e denominado sistema fundamental ou sistema integral ou ainda base integral de solu¸co˜es da equa¸ca˜o Y˙ (t) = A(t)Y (t). O conceito de sistema fundamental de solu¸co˜es foi introduzido por Fuchs2 em 1866. k

Importante nesse contexto ´e a matriz cujas colunas s˜ao formadas pelos vetores coluna Y k . Defina-se (para a nota¸ca˜o vide apˆendice 3.1, p´agina 143) hh ii W (t) = Y 1 (t), . . . , Y m (t) . Essa matriz ´e denominada matriz Wronskiana3 ou matriz fundamental. 2 3

Lazarus Immanuel Fuchs (1833-1902). Conde Josef Ho¨en´e de Wronski (1778-1853).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

Tem-se, por´em, o seguinte. Pela defini¸ca˜o Y k (t) = D(t)ek . Portanto, hh ii hh ii hh ii Y 1 (t), . . . , Y m (t) = D(t)e1 , . . . , D(t)em = D(t) e1 , . . . , em = D(t)

hh ii pois e1 , . . . , em = . O fato que

D(t) =

hh

1

m

Y (t), . . . , Y (t)

ii

318/1304

= D(t) ,

(7.18)

mostra que a matriz de Dyson (7.11) ´e idˆentica a` matriz Wronskiana e, portanto, podemos determinar D(t) calculando-se os vetores Y 1 (t), . . . , Y m (t). Esse procedimento para determinar D(t) pode ser mais f´acil que calcular a s´erie de Dyson do lado direito de (7.11). A identidade (7.18) ser´a tamb´em usada para outros prop´ositos, um deles ser´a mostrar que D(t) ´e uma matriz invert´ıvel. Vamos, de fato, mostrar que para todo t o conjunto {Y 1 (t), . . . , Y m (t)} ´e um conjunto de vetores linearmente independente. Suponhamos o oposto, ou seja, que haja constantes α1 , . . . , αm nem todas nulas, tais que α1 Y 1 (t0 ) + · · · + αm Y m (t0 ) = 0 para algum t0 . Sabemos por (7.16)-(7.17) que a fun¸ca˜o Y (t) = α1 Y 1 (t) + · · · + αm Y m (t) ´e solu¸ca˜o de Y˙ (t) = A(t)Y (t) com a condi¸ca˜o inicial  α1   Y (0) = Y0 =  ...  . αm 

Pela hip´otese, Y (t0 ) = 0. Pelo observado no t´opico “Uma propriedade da solu¸ca˜o das equa¸co˜es homogˆeneas” da p´agina 311, isso implica que Y (t) = 0 para todo t. Logo α1 = · · · = αm = 0, uma contradi¸ca˜o que prova que os vetores {Y 1 (t), . . . , Y m (t)} devem ser linearmente independentes para todo t. Se os vetores {Y 1 (t),hh . . . , Y m (t)} s˜ao linearmente independentes para todo t, ent˜ao o determinante ii da matriz Wronskiana Y 1 (t), . . . , Y m (t) nunca se anula. O determinante

hh ii W(t) = det Y 1 (t), . . . , Y m (t)

´e dito ser o Wronskiano do sistema linear homogˆeneo Y˙ (t) = A(t)Y (t). Como acabamos de ver W(t) 6= 0 para todo t. Como a matriz Wronskiana ´e idˆentica a` matriz de Dyson (7.11), conclu´ımos que o determinante daquela matriz nunca se anula. Isso significa que a matriz inversa D(t)−1 existe para todo t. • A rela¸ c˜ ao entre D(t, s) e D(t)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

319/1304

Com o fato em m˜aos que existem as inversas D(t)−1 para todo t, vamos demonstrar agora a seguinte identidade importante: para todo s e todo t vale D(t, s) = D(t)D(s)−1 .

(7.19)

A prova ´e simples. Seja s fixo daqui por diante. Sejam A(t) = D(t, s) e B(t) = D(t)D(s)−1 . Queremos provar que A(t) = B(t) para todo t. Observemos que A(s) = D(s, s) = e que B(s) = D(s)D(s)−1 = . Logo, A e B s˜ao iguais no ponto t = s. Fora isso, d ∂ A(t) = D(t, s) dt ∂t e

d B(t) = dt



(7.13)

 d D(t) D(s)−1 dt

=

A(t)D(t, s) = A(t)A(t)

(7.14)

A(t)D(t)D(s)−1 = A(t)B(t).

=

Assim, A e B s˜ao iguais no ponto t = s e satisfazem a mesma equa¸ca˜o homogˆenea M˙ (t) = A(t)M (t). Pelos teoremas de unicidade que estabelecemos, segue que A(t) = B(t) para todo t, que ´e o que quer´ıamos provar. Com isso, podemos escrever a solu¸ca˜o (7.12) de Y˙ (t) = A(t)Y (t) + F (t), com a condi¸ca˜o inicial Y (0) = Y0 , como Z t Y (t) = D(t)Y0 + D(t)D(s)−1 F (s) ds 0



= D(t) Y0 +

Z

t −1



D(s) F (s) ds . 0

Outro fato que se pode agora provar ´e o seguinte. Se Y (t) ´e solu¸ca˜o da equa¸ca˜o homogˆenea ˙ Y (t) = A(t)Y (t) com a condi¸ca˜o inicial Y (0) = Y0 , ent˜ao para todo s e todo t Y (t) = D(t, s)Y (s). De fato, Y (s) = D(s)Y0 . Portanto, D(t, s)Y (s) = D(t)D(s)−1 D(s)Y0 = D(t)Y0 = Y (t). • A regra de composi¸ c˜ ao para D(t, s) A rela¸ca˜o (7.19) tem a seguinte conseq¨ uˆencia, cuja prova ´e agora elementar: para todos r, s e t vale D(t, s) = D(t, r)D(r, s).

(7.20)

Essa express˜ao ´e denominada regra de composi¸ca ˜o para as matrizes de Dyson D(t, s). Note que ´e muito mais dif´ıcil prov´a-la usando apenas a defini¸ca˜o (7.10)! E. 7.3 Exerc´ıcio para masoquistas. Prove (7.20) usando apenas (7.10). • Solu¸ c˜ ao para condi¸ c˜ ao inicial em instante arbitr´ ario

6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

320/1304

Uma conseq¨ uˆencia das u ´ ltimas observa¸co˜es ´e que se para a equa¸ca˜o Y˙ (t) = A(t)Y (t) + F (t) for dada uma “condi¸ca˜o inicial” n˜ao em t = 0, mas em t = t0 , Y (t0 ) = Yt0 , a solu¸ca˜o ´e ent˜ao dada por Z t Y (t) = D(t, t0 )Yt0 + D(t, s)F (s) ds. (7.21) t0

E. 7.4 Exerc´ıcio. Verifique!

6

Mais propriedades da s´erie de Dyson s˜ao discutidas no Apˆendice 7.5, p´agina 330.

7.3

Equa¸ co ˜es com Coeficientes Constantes

Vamos aqui estudar sistemas de equa¸co˜es lineares de primeira ordem com coeficientes constantes como Y˙ (t) = AY (t) + F (t), com condi¸ca˜o inicial Y (0) = Y0 , onde A ´e uma matriz constante, ou seja, seus elementos de matriz n˜ao dependem da vari´avel t. Esse ´e um caso particular do que vimos acima. A s´erie de Dyson nesse caso fica D(t, s) =

+

∞ Z tZ X n=1

=

+

∞ X

s

A

n

+

···

s

Z tZ s

n=1

=

t1

∞ X (t − s)n

n!

n=1

Z

tn−1 s

t1

···

s

Z

An dtn dtn−1 · · · dt1

tn−1 s

dtn dtn−1 · · · dt1

An .

Por analogia com a bem conhecida s´erie de Taylor da fun¸ca˜o exponencial, define-se, para uma matriz A, exp(A) = e

A

∞ X 1 n + A . n! n=1

=

Assim,

(7.22)

D(t, s) = eA(t−s) e D(t) = eAt . A convergˆencia de (7.22) j´a foi provada quando tratamos da convergˆencia da s´erie de Dyson no caso geral. Assim, a solu¸ca˜o de Y˙ (t) = AY (t) + F (t), com a condi¸ca˜o inicial Y (0) = Y0 , ´e dada, segundo (7.12), por Z t

At

eA(t−s) F (s)ds.

Y (t) = e Y0 +

0

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

321/1304

O que se pode dizer sobre a dependˆencia em t dos elementos de matriz de eAt ? H´a dois casos b´asicos a considerar. O primeiro ´e o caso em que A ´e diagonaliz´avel; o segundo caso em que A n˜ao ´e diagonaliz´avel. • Caso diagonaliz´ avel Se A ´e diagonaliz´avel ent˜ao existe uma matriz P tal que P −1 AP = D onde D ´e uma matriz diagonal, tendo na diagonal os autovalores de A. Assim, e

At

=

+

∞ X tn n=1

= P

= P

= P

(

+

n!

An

∞ n X t n=1

(

+

∞ n X t n=1

(

+

n!

n!

∞ n X t n=1

n!

P −1 An P

)

(P −1 AP )n

Dn

)

P −1

)

P −1

P −1

= P eDt P −1 . ´ claro pela igualdade Agora, se D = diag (λ1 , . . . , λm ), ent˜ao eDt = diag (eλ1 t , . . . , eλm t ). E At Dt −1 At e = P e P que os elementos de matriz de e ser˜ao da forma eAt



ab

=

m X

ckab eλk t ,

k=1

ou seja, ser˜ao combina¸co˜es lineares de exponenciais do produto de autovalores de A com t. Os coeficientes ckab s˜ao constantes e dados em fun¸ca˜o dos elementos de matriz de P e P −1 . • Caso n˜ ao-diagonaliz´ avel Caso A n˜ao seja diagonaliz´avel, o Teorema da Decomposi¸ca˜o de Jordan (na forma do Teorema 3.18, p´agina 199) nos garante que existe uma matriz P tal que P −1 AP = D + N , onde: 1) D ´e uma matriz diagonal, cujos elementos da diagonal s˜ao os autovalores de A; 2) N ´e uma matriz nilpotente com ´ındice, digamos, q; 3) D e N comutam. Portanto, como D e N comutam, exp(At) = P exp(P −1 AP t)P −1 = P exp(Dt + N t)P −1 = P exp(Dt) exp(N t)P −1 , onde aqui usamos a Proposi¸ca˜o 4.6, da p´agina 232. Agora, exp(Dt) = diag (eλ1 t , . . . , eλm t )

JCABarata. Curso de F´ısica-Matem´ atica

e exp(N t) =

∞ n X t

+

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

n=1

n!

N

n

=

+

q−1 n X t n=1

n!

322/1304

N n.

Observe-se que a s´erie do lado direito ´e truncada em n = q pois N q = 0, j´a que N ´e nilpotente com ´ındice q. Assim, eN t ´e uma matriz cujos elementos s˜ao polinˆomios em t de grau menor que q. Fica claro, fazendo-se o produto eDt eN t , que os elementos de matriz de eAt ser˜ao agora da forma e

At



ab

=

m X

ckab (t) eλk t ,

k=1

ou seja, ser˜ao combina¸co˜es lineares de exponenciais do produto de autovalores de A com t. H´a, por´em, uma diferen¸ca em rela¸ca˜o ao caso diagonaliz´avel, a saber, os coeficientes c kab (t) n˜ao s˜ao mais constantes, mas s˜ao agora polinˆomios em t de grau menor que q e s˜ao dados em fun¸ca˜o dos elementos de matriz de P e P −1 .

7.3.1

Alguns Exemplos e Aplica¸ co ˜es

Vamos aqui tratar um exemplo simples e bem conhecido proveniente da Mecˆanica Cl´assica e que ilustra bem conceitos que introduzimos nas se¸co˜es anteriores. Trata-se do problema do oscilador harmˆonico amortecido for¸cado. Como ´e bem sabido, esse sistema ´e descrito pela equa¸ca˜o diferencial linear de segunda ordem m¨ x(t) = −kx(t) − γ x(t) ˙ + f (t) que nada mais ´e que a segunda lei de Newton para uma part´ıcula de massa m ligada a uma mola de constante k e se movendo em um meio (viscoso) que exerce sobre a part´ıcula uma for¸ca do tipo −γv(t) (v(t) ´e a velocidade da part´ıcula no instante t). Fora isso age sobre a part´ıcula mais uma for¸ca externa que depende apenas do tempo: f (t). Acima m > 0, k ≥ 0 e γ ≥ 0. Dividindo a equa¸ca˜o acima por m, podemos escrevˆe-la como

x¨(t) = −ω02 x(t) − ρx(t) ˙ + g(t) onde ω0 =

r

k , m

ρ =

γ , m

g(t) =

1 f (t). m

Podemos, por um m´etodo comummente usado, transformar essa equa¸ca˜o de segunda ordem em um sistema de duas equa¸co˜es de primeira ordem. Definindo v(t) = x(t), ˙ ficamos com x(t) ˙ = v(t) v(t) ˙ = −ω02 x(t) − ρv(t) + g(t) Isso pode ser escrito na seguinte forma matricial: Y˙ (t) = AY (t) + F (t),

(7.23)

JCABarata. Curso de F´ısica-Matem´ atica

onde Y (t) =



 x(t) , v(t)

A =

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.



 0 1 , −ω02 −ρ

F (t) =



323/1304

 0 . g(t)

A matriz A tem coeficientes constantes. Aprendemos nas se¸co˜es anteriores que a solu¸ca˜o dessa equa¸ca˜o, com uma condi¸ca˜o inicial que fixa a posi¸ca˜o e a velocidade da part´ıcula em t = 0     x(0) x0 Y (0) = = , v(0) v0 ´e dada por At

Y (t) = e Y0 +

Z

t

eA(t−s) F (s) ds.

(7.24)

0

Como se vˆe, precisamos calcular agora eAt para a matriz A dada acima. A primeira quest˜ao que devemos nos colocar ´e se a matriz A ´e diagonaliz´avel ou n˜ao. Seus autovalores s˜ao p p −ρ + ρ2 − 4ω02 −ρ − ρ2 − 4ω02 λ1 = e λ2 = . 2 2 E. 7.5 Exerc´ıcio. Verifique!

6

Os autovetores associados podem ser escolhidos na forma p p     −ρ − ρ2 − 4ω02 −ρ + ρ2 − 4ω02     2ω02 2ω02 , .  v1 =  v = 2     1 1 E. 7.6 Exerc´ıcio. Verifique!

6

p Como facilmente se vˆe, caso ρ2 − 4ω02 6= 0, ou seja, caso ρ 6= 2ω0 , a matriz A tem dois autovalores distintos e ´e, portanto, diagonaliz´avel. Se, por´em, ρ = 2ω0 , tem-se v1 = v2 e a matriz A n˜ao ´e mais simples e, portanto, n˜ao ´e diagonaliz´avel. Vamos tratar esses dois casos separadamente. O leitor ´e convidado a fazer como exerc´ıcio todos os c´alculos que forem deixados indicados. • O caso ρ 6= 2ω0

hh

ii

Nesse caso A ´e diagonaliz´avel pela matriz P = v1 , v2 , ou seja

P −1 AP = D =



λ1 0 0 λ2





= 

−ρ+



ρ2 −4ω02 2

0

−ρ−

√0 2

ρ −4ω02 2



,

JCABarata. Curso de F´ısica-Matem´ atica

onde P =

hh

v1 , v2

Calculando-se a inversa, tem-se

P −1

Da´ı, segue que eAt = P eDt P −1 = P



e

λ1 t

0

ii



 =   

−ρ −

Vers˜ ao de 29 de setembro de 2005.

p ρ2 − 4ω02 2ω02 1

ω02

− p 2  ρ − 4ω02  =    ω2 p 0 ρ2 − 4ω02

−ρ +

Cap´ıtulo 7

324/1304

p  ρ2 − 4ω02  2ω02 .  1

p  −ρ + ρ2 − 4ω02 p  2 ρ2 − 4ω02   . p  ρ + ρ2 − 4ω02  p 2 ρ2 − 4ω02 



−λ2 eλ1 t + λ1 eλ2 t

1 0  P −1 = p  2 e λ2 t ρ − 4ω02 ω02 −eλ1 t + eλ2 t

e λ1 t − e λ2 t λ1 e

λ1 t

− λ2 e

λ2 t



.

(7.25) Alternativamente, usando as express˜oes (3.32)-(3.33), obtemos para A a representa¸ca˜o espectral A = λ1 E1 + λ2 E2 com     1 1 −λ2 1 −λ1 1 E1 = , E2 = , λ1 − λ2 −ω02 λ1 λ2 − λ1 −ω02 λ2 de onde, usando eAt = eλ1 t E1 + = eλ2 t E2 , obtem-se novamente a express˜ao (7.25). E. 7.7 Exerc´ıcio. Verifique as afirma¸co˜es acima. Em particular, verifique que E 1 e E2 s˜ao projetores e satisfazem E1 E2 = e E1 + E2 = . 6 O leitor ´e convidado agora a escrever as f´ormulas expl´ıcitas para x(t) e v(t) que advˆem de (7.24) e (7.25). Para x(t), por exemplo, obtem-se   Z t 1 ρx0 + 2v0 −ρt/2 sen (ω1 t) + e−ρ(t−s)/2 sen (ω1 (t − s))f (s) ds, x(t) = e x0 cos(ω1 t) + 2ω1 mω1 0 onde ω1 =

r

ω02 −

ρ2 . 4

Essa express˜ao vale tanto para ω0 > ρ/2 quanto para ω0 < ρ/2. Nesse segundo caso ω1 torna-se um n´ umero imagin´ario puro: ω1 = iω2 , onde ω2 =

r

ρ2 − ω02 4

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

325/1304

´e real. A solu¸ca˜o para x(t) fica   Z t ρx0 + 2v0 1 −ρt/2 x0 cosh(ω2 t) + x(t) = e e−ρ(t−s)/2 senh (ω2 (t − s))f (s) ds. senh (ω2 t) + 2ω2 mω2 0 • O caso ρ = 2ω0 > 0 Nesse caso a matriz A fica



A =

 0 1 2 . − ρ4 −ρ

A pode ser levada a` sua forma de Jordan (vide Se¸ca˜o 3.7.4, p´agina 205 e antecedentes) J = P −1 AP , onde    ρ    ρ 4 0 − 2 1 − 1  ρ   2    2   −1 , ,  J =  P = P =  .       ρ ρ2 2 0 − − 0 1 2 4 ρ Note-se que J = D + N , onde

 ρ −  2 D =   0



0 −



 , ρ

N = 

2

0

1

0

0



.

´ f´acil verificar que D e N comutam e que N 2 = 0. Assim, E eAt = P e(D+N )t P −1 = P eDt eN t P −1 , sendo que



eDt = 

e

eN t = Portanto,

e

At

 

  =   

ρt 1+ 2

ρt

e− 2

0

0

− ρt 2

e 

+ Nt = 



e



1

t

0

1

−ρt/2

ρ2 t − e−ρt/2 4



te 



.

−ρt/2

ρt 1− 2



e−ρt/2



  .  

O leitor ´e convidado agora a escrever as f´ormulas expl´ıcitas para x(t) e v(t) que advˆem de (7.24). Para x(t), por exemplo, obtem-se

JCABarata. Curso de F´ısica-Matem´ atica

x(t) = e

−ρt/2



Vers˜ ao de 29 de setembro de 2005.

 1 ρ  1 + t x0 + t v 0 + 2 m

Z

Cap´ıtulo 7

326/1304

t 0

(t − s)e−ρ(t−s)/2 f (s) ds.

• O caso ρ = 0 Analisemos tamb´em o caso ρ = 0, que corresponde a` ausˆencia do termo de amortecimento −γv(t) na equa¸ca˜o de movimento da part´ıcula. Nesse caso   0 1 A = −ω02 0 λ1 = iω0 , λ2 = −iω0 e, por (7.25),



 eAt = 

cos(ω0 t) −ω0 sen (ω0 t)

 1 sen (ω0 t)  ω0 . cos(ω0 t)

O leitor ´e convidado agora a escrever as f´ormulas expl´ıcitas para x(t) e v(t) que advˆem de (7.24). Para x(t), por exemplo, obtem-se   Z t 1 v0 sen (ω0 (t − s))f (s) ds, sen (ω0 t) + x(t) = x0 cos(ω0 t) + ω0 mω0 0 • O caso k = 0, γ = 0. Part´ıcula submetida a for¸ ca externa dependente do tempo Nesse caso, usando a nota¸ca˜o anterior, x¨(t) = g(t), ou seja,

Y˙ (t) = AY (t) + F (t)

com A = A ´e nilpotente com A2 = 0. Logo e

At

=



 0 1 . 0 0

+ At =



 1 t . 0 1

O leitor ´e convidado agora a escrever as f´ormulas expl´ıcitas para x(t) e v(t) que advˆem de (7.24). Para x(t), por exemplo, obtem-se Z 1 t (t − s)f (s) ds . x(t) = (x0 + v0 t) + m 0 Por exemplo, no caso de f ser constante, segue disso a conhecid´ıssima rela¸ca˜o x(t) = x 0 + v0 t +

f 2 t . 2m

JCABarata. Curso de F´ısica-Matem´ atica

7.4

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

327/1304

Teoria de Perturba¸ co ˜es de Sistemas Lineares

Existem muitos problemas, especialmente na Mecˆanica Cl´assica e na Mecˆanica Quˆantica, que tˆem a seguinte estrutura. Procura-se encontrar a solu¸ca˜o de uma equa¸ca˜o linear homogˆenea Y˙ (t) = A(t)Y (t), com a condi¸ca˜o inicial Y (0) = Y0 , sendo que A(t) ´e da forma A(t) = L + I(t) onde L ´e uma matriz constante e I(t) pode depender do tempo mas ´e, em um sentido a ser precisado, “pequena”. Por exemplo, I(t) pode ser da forma I(t) = λJ(t), onde λ ´e uma constante “pequena”. Se I fosse zero a solu¸ca˜o seria Y (t) = eLt Y0 . Deve-se esperar que se I for pequena a solu¸ca˜o de Y˙ (t) = A(t)Y (t) n˜ao deve estar muito afastada de Y (t) = eLt Y0 e a presen¸ca de I(t) deve perturbar a solu¸ca˜o Y (t) = eLt Y0 apenas ligeiramente. Como determinar a perturba¸ca˜o que I provoca? Esse tipo de problema ´e muito freq¨ uentemente encontrado em F´ısica. Vamos usar aqui a s´erie de Dyson para tratar esse problema no contexto acima de sistemas lineares. O primeiro passo consiste em definir um novo vetor coluna X(t) por X(t) = e−Lt Y (t). Vamos verificar qual condi¸ca˜o inicial e qual equa¸ca˜o diferencial X(t) obedece. Tem-se que X(0) = Y (0) = Y0 . Fora isso  d −Lt e Y (t) dt

˙ X(t) =

= −Le−Lt Y (t) + e−Lt Y˙ (t) = −Le−Lt Y (t) + e−Lt A(t)Y (t) = −Le−Lt Y (t) + e−Lt (L + I(t))Y (t) = e−Lt I(t)Y (t) = e−Lt I(t)eLt X(t). Assim, definindo-se

˜ I(t) = e−Lt I(t)eLt ,

conclu´ımos que X(t) satisfaz

˙ ˜ X(t) = I(t)X(t).

Pela s´erie de Dyson, a solu¸ca˜o dessa equa¸ca˜o com a condi¸ca˜o inicial X(0) = Y 0 ´e (∞ Z Z ) Z tn−1 X t t1 ˜ 1 )I(t ˜ 2 ) · · · I(t ˜ n ) dtn dtn−1 · · · dt1 Y0 . X(t) = Y0 + ··· I(t n=1

0

0

0

JCABarata. Curso de F´ısica-Matem´ atica

Retornando a Y (t) = eLt X(t), temos (∞ Z Z X t Lt Lt Y (t) = e Y0 + e 0

n=1

t1 0

···

Z

Vers˜ ao de 29 de setembro de 2005.

tn−1 0

Cap´ıtulo 7

˜ 1 )I(t ˜ 2 ) · · · I(t ˜ n ) dtn dtn−1 · · · dt1 I(t

328/1304

)

Y0 .

(7.26)

De modo mais expl´ıcito, isso ´e Y (t) = eLt Y0 +eLt

(∞ Z Z X t 0

n=1

t1

···

0

Z

tn−1 0

e−Lt1 I(t1 )eL(t1 −t2 ) I(t2 )eL(t2 −t3 ) · · · eL(tn−1 −tn ) I(tn )eLtn dtn · · · dt1

)

Vamos supor que I(t) seja da forma I(t) = λJ(t). Substituindo na u ´ ltima express˜ao obtemos a solu¸ca˜o expressa em termos de uma s´erie de potˆencias em λ: Y (t) = eLt Y0 + eLt

(∞ X

λn

0

n=1

Lt

= e Y0 +λe

Z tZ

Lt

Z

t1 0

···

Z

tn−1 0

e−Lt1 J(t1 )eL(t1 −t2 ) J(t2 )eL(t2 −t3 ) · · · eL(tn−1 −tn ) J(tn )eLtn dtn · · · dt1

t

e

−Lt1

J(t1 )e

Lt1



2 Lt

dt1 Y0 +λ e

0

Z t Z 0

t1

e

−Lt1

J(t1 )e

L(t1 −t2 )

J(t2 )e

0

Lt2

)

Y0



dt2 dt1 Y0 +· · · .

Nessa forma ´e poss´ıvel ver as corre¸co˜es que o termo I(t) = λJ(t) adiciona a` solu¸ca˜o e Lt Y0 quando λ ´e uma constante pequena. A corre¸ca˜o de primeira ordem em λ ´e  Z t Lt Lt1 −Lt1 λe J(t1 )e dt1 Y0 . e 0

A de segunda ordem em λ ´e 2 Lt

λ e

Z t Z 0

t1

e

−Lt1

J(t1 )e

L(t1 −t2 )

J(t2 )e

Lt2

0



dt2 dt1 Y0

etc. Todas essa express˜oes s˜ao empregadas em Mecˆanica Quˆantica. • Um problema de teoria de perturba¸ co ˜es Consideremos o problema de uma part´ıcula de massa m presa a uma mola de constante k(t) = k0 + λk1 (t) onde λ ´e um n´ umero pequeno, e sem nenhuma for¸ca adicional agindo sobre a part´ıcula. Ou seja, a constante de mola tem uma pequena dependˆencia temporal e desejamos estudar o efeito dessa pequena perturba¸ca˜o sobre a solu¸ca˜o obtida quando λ = 0, a qual ´e, sabidamente, x0 cos(ω0 t) +

v0 sen (ω0 t), ω0

Y0 .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

329/1304

onde ω02 = k0 /m. A equa¸ca˜o de movimento ´e m¨ x(t) = −k(t)x(t), ou seja,   λk1 (t) 2 x¨(t) = − ω0 + x(t), m que em forma de um sistema de duas equa¸co˜es de primeira ordem fica Y˙ (t) = A(t)Y (t), onde Y (t) = e



 x(t) , v(t)

A(t) = A + λJ(t), com A = e J(t) =





0 1 −ω02 0



 0 0 . − m1 k1 (t) 0

Pelas express˜oes obtidas na Se¸ca˜o 7.4, a solu¸ca˜o em primeira ordem em λ ´e  Z t At1 At At −At1 J(t1 )e dt1 Y0 . e Y0 + λe e 0

De modo mais expl´ıcito, isso ´e igual a  

λ   ω0

 

cos(ω0 t) −ω0 sen (ω0 t)

cos(ω0 t)x0 +

1 sen (ω0 t)v0 ω0



 +

−ω0 sen (ω0 t)x0 + cos(ω0 t)v0   1 1 sen 2 (ω0 t1 )v0 − sen (ω t ) cos(ω t )x + 0 1 0 1 0 Z sen (ω0 t)  t mω 0   ω0 k1 (t1 )    0 1 cos(ω0 t) − cos2 (ω0 t1 )x0 + sen (ω0 t1 ) cos(ω0 t1 )v0 m

Para a posi¸ca˜o x(t), a corre¸ca˜o de primeira ordem em λ a` solu¸ca˜o n˜ao perturbada cos(ω0 t)x0 + ´e λ ω0

"

cos(ω0 t)

Z

t 0



1 sen (ω0 t)v0 ω0

1 sen 2 (ω0 t1 )v0 k1 (t1 ) − sen (ω0 t1 ) cos(ω0 t1 )x0 + mω0



dt1



   dt1 . 

JCABarata. Curso de F´ısica-Matem´ atica

1 + sen (ω0 t) ω0

Z

t 0

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

330/1304

#   1 k1 (t1 ) − cos2 (ω0 t1 )x0 + sen (ω0 t1 ) cos(ω0 t1 )v0 dt1 . m

O c´alculo expl´ıcito dessas integrais depende da forma de k1 (t). O leitor ´e convidado nesse momento a ler nos bons livros de Mecˆanica Cl´assica (por ex., Arnold [6], Landau-Lifchitz [78]) algo sobre o assunto “ressonˆancia param´etrica”. • Coment´ ario final sobre as s´ eries perturbativas Se λ for pequeno e t n˜ao for muito grande a aproxima¸ca˜o de primeira ordem em λ ´e uma aproxima¸ca˜o razoavelmente boa para a solu¸ca˜o. As corre¸co˜es de ordem superior em λ podem tamb´em ser calculadas, embora seu cˆomputo fique cada vez mais complexo, como se vˆe pela express˜oes (7.26) e seguintes. Para t → ∞ os termos individuais da s´erie perturbativa (7.26) podem divergir com t, sem que a solu¸ca˜o x(t) seja ela mesmo divergente. Esse tipo de comportamento n˜ao ´e t˜ao estranho assim se nos lembrarmos, por exemplo, do que acontece com a s´erie da Taylor da fun¸ca˜o seno (ou co-seno): ∞ X (−1)n 2n+1 2n+1 λ t sen (λt) = (2n + 1)! n=0

Os primeiros termos s˜ao

λ3 3 λ5 5 t + t +··· . 6 120 Cada um deles diverge quanto t → ∞ (para qualquer λ 6= 0 fixo, n˜ao importa o qu˜ao grande ou pequeno) mas a fun¸ca˜o sen (λt) permanece limitada. λt −

A li¸ca˜o a se aprender ´e que certas expans˜oes podem n˜ao ser boas quando se deseja estudar o comportamento para t grande das solu¸co˜es. Tal ´e o caso da s´erie de Taylor acima e da s´erie de Dyson (em muitos casos). Para estudar o comportamento para t grande ´e preciso procurar expans˜oes que sejam uniformemente convergentes em t para toda a reta real.

7.5

Mais sobre a S´ erie de Dyson. Produtos de Tempo Ordenado

• A fun¸ c˜ ao degrau, ou fun¸ c˜ ao de Heaviside Define-se a chamada fun¸ca ˜o degrau ou fun¸ca ˜o de Heaviside4 , θ(s), s ∈  1, se s ≥ 0 θ(s) := . 0, se s < 0 Defina-se tamb´em, para t1 , . . . , tm ∈ 



, por

,

Θm (t1 , . . . , tm ) := θ(tm−1 − tm )θ(tm−2 − tm−1 ) · · · θ(t1 − t2 ) . 4

Oliver Heaviside (1850-1925).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

´ bastante f´acil de constatar pela defini¸ca˜o que E  1, se tm ≤ tm−1 ≤ · · · ≤ t1 Θm (t1 , . . . , tm ) := 0, de outra forma

.

331/1304

(7.27)

Seja Sm o grupo de permuta¸co˜es de m ´ındices {1, . . . , m}. Os elementos π de Sm s˜ao bije¸co˜es de {1, . . . , m} em si mesmo. H´a um importante fato sobre a fun¸ca˜o Θm : se os m n´ umeros reais t1 , . . . , tm forem todos distintos entre si, ent˜ao X Θm (tπ(1) , . . . , tπ(m) ) = 1 . (7.28) π∈Sm

Para prov´a-la, observe-se que, devido ao fato de ser totalmente ordenado, para uma m-upla t 1 , . . . , tm ∈ composta de elementos distintos existe um e somente um elemento π0 ∈ Sm tal que tπ0 (m) < . . . < tπ0 (1) . Assim, por (7.27), segue que h´a no lado esquerdo de (7.28) apenas um termo n˜ao-nulo: aquele que corresponde a π0 , e esse termo vale 1, tamb´em devido a (7.27). A condi¸ca˜o de os pontos t1 , . . . , tm serem todos distintos entre si ´e importante nesse racioc´ınio, mas o conjunto dos pontos que n˜ao a satisfazem ´e um conjunto de medida nula em m . Da´ı, podemos afirmar que (7.28) vale quase em toda a parte em m (ou seja, vale em todo m , exceto em um sub-conjunto de medida nula). 









• Reescrevendo a s´ erie de Dyson. Pretendemos apresentar uma outra maneira de representar a s´erie de Dyson (7.11): D(t) =

+

∞ Z tZ X

m=1

0

t1 0

···

Z

tm−1 0

A(t1 )A(t2 ) · · · A(tm ) dtm dtm−1 · · · dt1 .

(7.29)

da qual certas conseq¨ uˆencias podem ser mais facilmente extra´ıdas. O leitor h´a de notar que nas integrais em (7.29) as vari´aveis t1 , . . . , tm aparecem ordenadas na forma 0 ≤ tm ≤ tm−1 ≤ · · · ≤ t1 ≤ t. Dessa forma, no produto de matrizes A(t1 )A(t2 ) · · · A(tm ) os fatores aparecem ordenados (da esquerda para a direita) de acordo com a ordem temporal decrescente dos argumentos. Devido a` propriedade (7.27) de Θm (t1 , . . . , tm ), podemos reescrever (7.29) na forma D(t) =

+

∞ Z X

m=1

t 0

···

Z

t 0

Θm (t1 , . . . , tm )A(t1 )A(t2 ) · · · A(tm ) dtm dtm−1 · · · dt1 .

(7.30)

Note o leitor que uma diferen¸ca entre (7.29) e (7.30) est´a nos limites superiores das integra¸co˜es, que passam a ser todos iguais a t, o que ´e permitido pela introdu¸ca˜o dos fatores Θm (t1 , . . . , tm ) nos integrandos, fatores esses que se anulam caso a restri¸ca˜o tm ≤ tm−1 ≤ · · · ≤ t1 seja violada. Se F (t1 , . . . , tm ) ´e uma fun¸ca˜o de m vari´aveis, tem-se evidentemente que Z t Z t Z t Z t ··· F (t1 , . . . , tm ) dtm dtm−1 · · · dt1 = ··· F (tπ(1) , . . . , tπ(m) ) dtm dtm−1 · · · dt1 , 0

0

para qualquer permuta¸ca˜o π ∈ Sm .

0

0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

332/1304

E. 7.8 Exerc´ıcio. Justifique! Sugest˜ao: mudan¸ca de vari´aveis mais a observa¸c˜ao que o hipercubo [0, t] m ´e invariante por permuta¸co˜es das coordenadas. 6 Assim, como Sm possui m! elementos, segue trivialmente que Z t Z t Z Z t 1 X t F (tπ(1) , . . . , tπ(m) ) dtm dtm−1 · · · dt1 , F (t1 , . . . , tm ) dtm dtm−1 · · · dt1 = ··· ··· m! π∈S 0 0 0 0 m

pois os termos somados no lado direito s˜ao todos iguais. Aplicando essa simples identidade a (7.30), tem-se Z Z t ∞ X 1 X t D(t) = + ··· Θm (tπ(1) , . . . , tπ(m) )A(tπ(1) )A(tπ(2) ) · · · A(tπ(m) ) dtm dtm−1 · · · dt1 . m! 0 0 m=1 π∈S m

(7.31)

Vamos definir   X T A(t1 )A(t2 ) · · · A(tm ) := Θm (tπ(1) , . . . , tπ(m) )A(tπ(1) )A(tπ(2) ) · · · A(tπ(m) ) .

(7.32)

π∈Sn

Para uma m-upla (t1 , . . . , tm ) ∈ [0, t]m composta de elementos distintos, existe um e somente um elemento π0 ∈ Sm tal que tπ0 (m) < . . . < tπ0 (1) . Segue disso que o lado direito de (7.32) vale A(tπ0 (1) )A(tπ0 (2) ) · · · A(tπ0 (m) ). O leitor deve observar que esse produto aparece ordenado da esquerda para a direita na ordem decrescente dos argumentos. Por essa raz˜ao a express˜ao do lado esquerdo de (7.32) ´e denominada produto de tempo ordenado das matrizes A, denotada por T (A(t 1 ) · · · A(tm )): Com essa nota¸ca˜o podemos escrever (7.31) na forma D(t) =

Z t Z t  ∞  X 1 + ··· T A(t1 )A(t2 ) · · · A(tm ) dtm dtm−1 · · · dt1 . m! 0 0 m=1

(7.33)

Essa forma de representar a s´erie de Dyson ´e freq¨ uentemente empregada na Teoria Quˆantica de Campos, sendo que l´a as matrizes A(t) s˜ao substitu´ıdas por operadores com valores em distribui¸co˜es e os produtos de tempo ordenado s˜ao definidos em um sentido distribucional e de forma iterativa, de modo a permitir um tratamento de problemas de renormaliza¸ca˜o. Para uma referˆencia moderna sobre tais assuntos, vide [116]. • O caso comutativo Uma situa¸ca˜o particular de interesse ´e aquela na qual as matrizes A(s) comutam para valores distintos do argumento, ou seja, A(s)A(s0 ) = A(s0 )A(s) para todos s, s0 . Tal ´e o caso, por exemplo, se A(s) forem matrizes 1 × 1, ou se forem diagonais, ou ainda se forem da forma A(s) = f (s)B para alguma matriz constante B e alguma fun¸ca˜o real ou complexa f . Sob essa hip´otese de comutatividade, tem-se que para todo π ∈ Sm A(tπ(1) )A(tπ(2) ) · · · A(tπ(m) ) = A(t1 )A(t2 ) · · · A(tm )

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

333/1304

pois a ordem dos fatores n˜ao importa, devido a` comutatividade. A express˜ao (7.31) fica, ent˜ao, # Z t"X Z t ∞ X 1 Θm (tπ(1) , . . . , tπ(m) ) A(t1 )A(t2 ) · · · A(tm ) dtm dtm−1 · · · dt1 ··· D(t) = + m! 0 0 m=1 π∈S m

(7.28)

=

comut.

=

def.

=

Z t Z t ∞ X 1 + ··· A(t1 )A(t2 ) · · · A(tm ) dtm dtm−1 · · · dt1 m! 0 0 m=1 m Z t ∞ X 1 A(τ )dτ + m! 0 m=1 exp

Z

t

A(τ )dτ 0



.

(7.34)

Usando que D(t, s) = D(t)D(s)−1 , obtem-se D(t, s) = exp

Z

t

A(τ )dτ s



.

(7.35)

Conclu´ımos que no caso comutativo, a solu¸ca˜o da equa¸ca˜o Y˙ = A(t)Y (t) + F (t) com uma condi¸ca˜o inicial Y (0) = Y0 dada em (7.12) fica Z t R Rt t A(τ )dτ Y (t) = e 0 e s A(τ )dτ F (s) ds . Y0 + (7.36) 0

O estudante pode constatar que no caso n = 1 (um sistema com uma u ´ nica equa¸ca˜o de primeira ordem) a express˜ao acima corresponde precisamente a` solu¸ca˜o dada em (6.2), p´agina 287.

7.6

Sistemas de Equa¸ co ˜es Diferenciais Lineares no Plano Complexo

Em (7.1), e em tudo que vimos at´e aqui, consideramos sistemas lineares de equa¸co˜es diferenciais onde a vari´avel t ´e assumida real. Para muitos prop´ositos importantes, alguns dos quais discutiremos abaixo, ´e conveniente alargar um pouco o dom´ınio de nossas considera¸co˜es e discutir sistemas lineares de equa¸co˜es diferenciais definidas no plano complexo. Por simplicidade trataremos apenas equa¸co˜es homogˆeneas, caso em que se encontra a maioria das aplica¸co˜es. A Se¸ca˜o 7.7.3, p´agina 364, discute exemplos. Para referˆencias gerais sobre o assunto, recomendamos [122] e [64]. Seja A(z) uma matriz m × m complexa cujos elementos Aij (z), i, j = 1, . . . , m, s˜ao fun¸co˜es de uma vari´avel complexa z em um certo dom´ınio aberto e simplesmente conexo comum D do plano complexo: D ⊂ . Consideremos a equa¸ca˜o diferencial linear e homogˆenea Y 0 (z) = A(z)Y (z),

(7.37)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

334/1304

onde Y (z) denota um vetor coluna de fun¸co˜es complexas   y1 (z)   Y (z) =  ...  . ym (z) Estaremos aqui interessados em estudar esses sistemas de equa¸co˜es diferenciais quando uma condi¸ca ˜o inicial ´e fornecida, ou seja, quando o valor de Y (z) em um ponto z0 ∈ D ´e especificado:   y10   Y (z0 ) =: Y0 =  ...  , 0 ym

0 com y10 , . . . , ym sendo constantes complexas. Notemos que ao procurarmos solu¸co˜es Y (z) de (7.37) ´e implicitamente sub-entendido que as mesmas fun¸co˜es Y (z) sejam anal´ıticas, pois apenas fun¸co˜es anal´ıticas s˜ao diferenci´aveis.

7.6.1

O Caso Anal´ıtico

Comecemos pelo caso no qual a matriz A(z) ´e anal´ıtica em um dom´ınio aberto simplesmente conexo D, ou seja, todos os seus elementos de matriz Aij (z) s˜ao fun¸co˜es anal´ıticas de z em D. Uma primeira pergunta importante diz respeito a` unicidade da solu¸ca˜o da equa¸ca˜o diferencial Y 0 (z) = A(z)Y (z), z ∈ D, com a condi¸ca˜o Y (z0 ) = Y0 para algum z0 ∈ D. Essa pergunta pode ser respondida usando nosso resultado anterior (do come¸co deste cap´ıtulo) que garante unicidade de solu¸ca˜o de sistemas lineares de equa¸co˜es diferenciais com vari´aveis reais. De fato, seja z(t), t ∈ [0, 1], uma curva arbitr´aria cont´ınua e diferenci´avel em D e tal que z(0) = z 0 . Sejam Y1 e Y2 duas solu¸co˜es anal´ıticas de Y 0 (z) = A(z)Y (z), z ∈ D, com a mesma condi¸ca˜o Y1 (z0 ) = Y2 (z0 ) = Y0 . Sejam X1 (t) := Y1 (z(t)) e X2 (t) := Y2 (z(t)). Definamos tamb´em B(t) := z(t)A(z(t)). ˙ Notemos que B(t) ´e uma matriz cont´ınua em t, pois A(z) ´e anal´ıtica. ´ f´acil, ent˜ao, constatar que X1 e X2 s˜ao ambos solu¸co˜es da equa¸ca˜o diferencial E ˙ X(t) = B(t)X(t),

t ∈ [0, 1],

com a condi¸ca˜o X(0) = Y0 . Pelas nossas considera¸co˜es anteriores, isso implica X1 (t) = X2 (t), ∀t ∈ [0, 1], ou seja, Y1 (z(t)) = Y2 (z(t)), ∀t ∈ [0, 1]. Como a curva z(t) ´e arbitr´aria e sua imagem pode estar em todo D, isso implica Y1 (z) = Y2 (z) para todo z ∈ D. Isso prova a unicidade da solu¸ca˜o de Y 0 (z) = A(z)Y (z), z ∈ D, com condi¸ca˜o Y1 (z0 ) = Y2 (z0 ) = Y0 . Uma vez garantida a unicidade da solu¸ca˜o, tentemos exib´ı-la. O que faremos ´e seguir a inspira¸ca˜o fornecida pela s´erie de Dyson, estudada anteriormente, e tentar generaliz´a-la para o plano complexo. • A s´ erie de Dyson no plano complexo Seja ent˜ao D um dom´ınio aberto simplesmente conexo do plano complexo e A(z) anal´ıtica em D e limitada em D. Seja tamb´em z0 ∈ D.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

335/1304

Uma vez demonstrada a unicidade da eventual solu¸ca˜o de uma equa¸ca˜o como Y 0 (z) = A(z)Y (z) com condi¸ca˜o Y (z0 ) = Y0 precisamos demonstrar que a solu¸ca˜o existe. O que faremos ´e generalizar nossas considera¸co˜es anteriores sobre a s´erie de Dyson para o plano complexo. Para z e w ∈ D , seja D(z, w) a matriz m × m definida por D(z, w) =

+

∞ Z X n=1

z w

Z

z1 w

···

Z

zn−1 w

A(z1 )A(z2 ) · · · A(zn ) dzn dzn−1 · · · dz1 .

(7.38)

Acima, todas as integra¸co˜es complexas s˜ao feitas em uma curva C, simples, orientada de w a z e inteiramente contida em D. Para cada n os pontos z1 , . . . , zn s˜ao ordenados em sentido crescente ao longo de C. Mais precisamente, denotamos por C a curva cont´ınua e diferenci´avel C : [0, 1] → D parametrizada por t ∈ [0, 1] com w = C(0), z = C(1). Ent˜ao, para cada n, tem-se zk = C(tk ), 1 ≤ k ≤ n, com 0 ≤ t1 ≤ · · · ≤ tn ≤ 1. Devido ao fato de A ser anal´ıtica no dom´ınio simplesmente conexo D, a matriz D(z, w) n˜ao depende da particular curva orientada C adotada que conecta w a z (justifique isso!).

Afirmamos que a equa¸ca˜o Y 0 (z) = A(z)Y (z) com uma condi¸ca˜o Y (z0 ) = Y0 tem solu¸ca˜o, a qual ´e dada por Y (z) = D(z, z0 )Y0 (7.39) A demonstra¸ca˜o ser´a feita provando-se que o lado direito satisfaz a equa¸ca˜o diferencial e a condi¸ca˜o inicial. Como a solu¸ca˜o ´e u ´ nica (pelo provado acima), infere-se que n˜ao pode haver outra. Comecemos por mostrar que a s´erie que aparece em (7.38) ´e convergente, sem o que aquela express˜ao n˜ao faria sentido. O leitor facilmente constatar´a que o que faremos ´e uma simples imita¸ca˜o da prova anterior para a reta real, dado que somente faremos uso da hip´otese de que A(z) ´e limitada em D. Sejam z e w dois pontos de um dom´ınio D sob as hip´oteses acima (D ´e aberto e simplesmente conexo) e seja Cw→z uma curva cont´ınua, diferenci´avel, orientada, ligando w a z e inteiramente contida em D. Para z 0 ∈ Cw→z , denotemos por l(z 0 ) ≡ lCw→z (z 0 ) o comprimento medido de w a z 0 ao longo da curva Cw→z . A fun¸ca˜o l : Cw→z → + ´e bijetora e, portanto, possui uma inversa, o que nos permite parametrizar os pontos de Cw→z pelo comprimento l medido ao longo de Cw→z a partir de w. Denotaremos por z 0 (l) essa parametriza¸ca˜o, ou seja, z 0 (l) ´e o ponto de Cw→z cuja distˆancia a w ao longo de Cw→z ´e l ∈ + . ´ um fato bem conhecido da teoria das fun¸co˜es de vari´aveis complexas que se f : D → ´e ao menos E Z 5 cont´ınua , ent˜ao f (z 0 )dz 0 , a integral de f de w a z ao longo da curva Cw→z , pode ser estimada 



por

5

Cw→z

Z

Z f (z )dz ≤ 0

Cw→z

Essa condi¸ca ˜o pode ser enfraquecida.

0

l(z) 0

|f (z 0 (l))| dl .

(7.40)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

336/1304

Denotando por Dab (z, w) o elemento ab da matriz D(z, w), temos Z zn−1 ∞ Z z Z z1 X Dab (z, w) = ab + ··· (A(z1 )A(z2 ) · · · A(zn ))ab dzn dzn−1 · · · dz1 n=1

= δa b +

w

w

w

∞ X m X m X

n=1 k1 =1 k2 =1

···

Z m X

kn−1 =1

Z

z w

z1

···

w

Z

zn−1

Aak1 (z1 )Ak1 k2 (z2 ) · · · Akn−1 b (zn ) dzn · · · dz1 .

w

Definindo como antes α := max max |Aab (z)| , a, b

z∈D

aplicando (7.40) e escrevendo l1 ≡ l(zj ), j = 1, . . . , n, temos Z ln−1 Z l(z) Z l1 ∞ X m m X X ··· |Dab (z, w)| ≤ 1 + ··· n=1 k1 =1

≤ 1+

∞ X

≤ 1+

∞ X

≤ 1+

∞ X

α

n

n=1

m X

k1 =1

α

n l(z)

n=1

n=1

kn−1 =1

αn

n!

···

n

0

0

Z m X

kn−1 =1

m X

k1 =1

···

0

|Aak1 (z 0 (l1 ))| |Ak1 k2 (z 0 (l2 ))| · · · Akn−1 b (z 0 (ln )) dln · · · dl1

l(z) 0

m X

Z

l1

0

···

Z

ln−1

0

dln · · · dl1

1

kn−1 =1

l(z)n n−1 m n!

 1 αml(z) e −1 . m Acima, usamos o fato, demonstr´avel por indu¸ca˜o, que Z l(z) Z l1 Z ln−1 l(z)n . ··· dln · · · dl1 = n! 0 0 0 = 1+

(7.41)

Como mencionamos, l(z) ´e a distˆancia de w a z ao longo da curva de integra¸ca˜o, ou seja, ´e o comprimento total dessa curva. Se D for um dom´ınio convexo, podemos tomar a curva de integra¸ca˜o como sendo a linha reta que une w a z, em cujo caso teremos l(z) = |z − w|. N˜ao precisamos, no entanto, supor convexidade de D. Provamos ent˜ao que, para cada elemento de matriz ab, a s´erie do lado direito de (7.38) ´e absolutamente convergente, e isso para todo w e z ∈ D. Como, para cada N ∈ , as fun¸co˜es Z z Z z1 Z zn−1 N X m X m m X X fN (z, w) = δab + ··· ··· Aak1 (z1 )Ak1 k2 (z2 ) · · · Akn−1 b (zn ) dzn · · · dz1 . 

n=1 k1 =1 k2 =1

kn−1 =1

w

w

w

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

337/1304

s˜ao anal´ıticas em D (pois integrais de fun¸co˜es anal´ıticas s˜ao tamb´em anal´ıticas), conclu´ımos do exposto acima que cada elemento de matriz Dab (z, w) ´e o limite uniforme (por quˆe?) da seq¨ uˆencia de fun¸co˜es anal´ıticas fN (z, w). Um teorema importante da an´alise complexa (vide e.g. [126]) afirma que sob essas circunstˆancias Dab (z, w) ´e tamb´em anal´ıtica em D. Para mostrar que (7.39) representa de fato a solu¸ca˜o procurada, vamos mostrar que ∂ D(z, w) = A(z)D(z, w). ∂z

(7.42)

De fato, ∂ ∂ D(z, w) = ∂z ∂z

(

∂ = ∂z

(

+

∞ Z X

+

Z Z





w

Z

z1 w

z w z

w

= 0 + A(z) +

= A(z)

A(z1 ) dz1 +

Z

n=1

+

= A(z)

···

Z

z

+

+

Z

Z

Z Z

z1 w

Z

zn−1

A(z1 )A(z2 ) · · · A(zn ) dzn dzn−1 · · · dz1 .

w z w

Z

z1

A(z1 )A(z2 ) dz2 dz1 w

z2 w

A(z1 )A(z2 )A(z3 ) dz3 dz2 dz1 + · · ·

z

A(z)A(z2 ) dz2 + w z

A(z2 ) dz2 + w z

A(z1 ) dz1 + w

Z Z

z w z w

)

Z Z

Z

z w

Z

)

z2 w

A(z)A(z2 )A(z3 ) dz3 dz2 + · · ·

z2 w

A(z2 )A(z3 ) dz3 dz2 + · · ·

z1 w

A(z1 )A(z2 ) dz2 dz1 + · · ·

 

= A(z)D(z, w), como quer´ıamos provar. Acima, na passagem da quarta para a quinta linha, fizemos uma s´erie de mudan¸cas de nomes das vari´aveis de integra¸ca˜o, chamando z2 de z1 , z3 de z2 etc. De maneira an´aloga prova-se tamb´em que ∂ D(z, w) = −D(z, w)A(w). ∂w E. 7.9 Exerc´ıcio. Fa¸ca!

6

´ tamb´em evidente pela defini¸ca˜o (7.38) que para todo z vale D(z, z) = . Notemos que, por (7.39), E Y (z0 ) = D(z0 , z0 )Y0 = Y0 , mostrando que o lado direito de (7.39) satisfaz a condi¸ca˜o Y (z0 ) = Y0 . Derivando o lado direito de (7.39) em rela¸ca˜o a z, tem-se Y 0 (z) =

∂ D(z, z0 )Y0 = A(z)D(z, z0 )Y0 = A(z)Y (z) , ∂z

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

338/1304

provando que o lado direito de (7.39) satisfaz a equa¸ca˜o diferencial. Como a solu¸ca˜o ´e u ´ nica, ela deve ser aquela dada em (7.39). De maneira an´aloga ao caso real podemos igualmente provar que vale a regra de composi¸ca˜o D(z1 , z3 ) = D(z1 , z2 )D(z2 , z3 ) ,

(7.43)

para quaisquer z1 , z2 e z3 contidos no dom´ınio simplesmente conexo onde A ´e anal´ıtica. E. 7.10 Exerc´ıcio. Prove (7.43) mostrando que ambos os lados satisfazem as mesmas equa¸co˜es diferenciais e as mesmas condi¸co˜es iniciais. 6 • A equa¸ c˜ ao n˜ ao-homogˆ enea E. 7.11 Exerc´ıcio importante. Para A e F anal´ıticas em um dom´ınio aberto e simplesmente conexo D e limitadas em D, mostre que a solu¸c˜ao geral da equa¸c˜ao n˜ao-homogˆenea Y 0 (z) = A(z)Y (z) + F (z) com condi¸c˜ao Y (z0 ) = Y0 , z0 ∈ D ´e Z z Y (z) = D(z, z0 )Y0 + D(z, w)F (w)dw , (7.44) z0

onde D(z, z0 ) foi definida acima e a integra¸c˜ao do lado direito ´e tomada em qualquer curva simples, cont´ınua e diferenci´avel em D, pois D e F s˜ao anal´ıticas em D. 6 • Analiticidade da solu¸ c˜ ao Uma importante conclus˜ao que tiramos da an´alise acima ´e que, sob a hip´otese que A ´e anal´ıtica em D e limitada em D, ent˜ao a solu¸ca˜o Y da equa¸ca˜o homogˆenea Y 0 (z) = A(z)Y (z) com condi¸ca˜o Y (z0 ) = Y0 , z0 ∈ D ´e igualmente anal´ıtica em D pois, como vimos, D(z, z0 ) ´e anal´ıtica em z. • Solu¸ co ˜es nulas H´a uma conseq¨ uˆencia das considera¸co˜es acima que ´e bastante elementar, possuindo, por´em, implica¸co˜es profundas, como veremos, por exemplo, quando discutirmos equa¸co˜es com pontos singulares. Expressaremos essa conseq¨ uˆencia em forma de uma proposi¸ca˜o: Proposi¸ c˜ ao 7.1 Seja a equa¸ca ˜o homogˆenea Y 0 (z) = A(z)Y (z) onde A(z) ´e anal´ıtica em um dom´ınio aberto e simplesmente conexo D. Ent˜ ao, se Ys (z) ´e uma solu¸ca ˜o dessa equa¸ca ˜o que se anula em um ponto z0 ∈ D, ou seja, Ys (z0 ) = 0, vale Ys (z) = 0 para todo z ∈ D. 2 Essa proposi¸ca˜o diz que se a solu¸ca˜o de uma equa¸ca˜o linear homogˆenea Y 0 (z) = A(z)Y (z) anula-se em algum ponto de D (com A(z) anal´ıtica em um dom´ınio aberto e simplesmente conexo D), ent˜ao ela anula-se em todo D. A prova ´e a simples observa¸ca˜o que, pelo que vimos, a solu¸ca˜o ´e dada por Y (z) = D(z, z0 )Y (z0 ). • Equa¸ co ˜es Matriciais Complexas

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

339/1304

At´e agora estudamos equa¸co˜es da forma Y 0 (z) = A(z)Y (z), com condi¸ca˜o Y (z0 ) = Y0 , onde A(z) ´e uma matriz m × m anal´ıtica em um dom´ınio aberto e simplesmente conexo D que contem z0 e onde Y ´e um vetor coluna com m componentes:   y1 (z)   Y (z) =  ...  . ym (z) Consideremos agora a equa¸ca˜o M0 (z) = A(z)M(z), com condi¸ca˜o M(z0 ) = M0 , onde A(z) e M(z) s˜ao matrizes m × m, a inc´ognita sendo a matriz M(z) e a matriz A(z) sendo anal´ıtica em um dom´ınio aberto e simplesmente conexo D. Veremos facilmente que podemos tratar esse problema com os mesmos m´etodos do anterior, onde a inc´ognita era um vetor coluna Y de m componentes e n˜ao uma matriz quadrada. De fato, como toda matriz m × m, a matriz M(z) ´e da forma (para nota¸ca˜o, vide p´agina 143) hh ii M(z) = M1 (z), . . . , Mm (z) , onde Mi (z) s˜ao vetores coluna com m componentes, representando a i-´esima coluna da matriz M(t). Nessa nota¸ca˜o a equa¸ca˜o diferencial M0 (z) = A(z)M(z) fica hh ii hh ii 0 M10 (z), . . . , Mm (z) = A(z)M1 (z), . . . , A(z)Mm (z) ,

ou seja, tem-se um conjunto de m sistemas de equa¸co˜es independentes Mi0 (z) = A(z)Mi (z),

i = 1, . . . , m

(7.45)

do tipo que tratamos acima, onde as inc´ognitas s˜ao vetores coluna. Para cada uma dessas equa¸co˜es valem todas as afirma¸co˜es provadas acima. Assim conclu´ımos que a equa¸ca˜o matricial M0 (z) = A(z)M(z), com condi¸ca˜o M(z0 ) = M0 , tem solu¸ca˜o u ´ nica, a qual ´e dada por Mi (z) = D(z, z0 )Mi (z0 ), i = 1, . . . , m. Reunindo as colunas Mi novamente na matriz M, temos M(z) = D(z, z0 )M0 como solu¸ca˜o u ´ nica de M0 (z) = A(z)M(z), com condi¸ca˜o M(z0 ) = M0 . A partir do exposto acima ´e f´acil demonstrar a validade da composi¸ca˜o D(z, z 0 ) = D(z, z1 )D(z1 , z0 ) para quaisquer pontos z0 , z1 e z do dom´ınio aberto e simplesmente conexo D. Como D(z0 , z0 ) = , isso em particular diz que toda matriz D(z, z0 ) ´e invert´ıvel com D(z, z0 )−1 = D(z0 , z). Uma simples mas importante observa¸ca˜o que se pode fazer ´e que, como a matriz fundamental D(z, z0 ) ´e invert´ıvel, M(z) ser´a invert´ıvel para todo z ∈ D se e somente se M0 o for. Ou seja, se a solu¸ca˜o da equa¸ca˜o M0 (z) = A(z)M(z), com A(z) anal´ıtica em um dom´ınio aberto simplesmente conexo D ´e anal´ıtica em um ponto de D, ent˜ao o ´e em todo D. Vamos aqui discutir propriedades dessas equa¸co˜es diferenciais matriciais homogˆeneas, com A(z) uma matriz m × m anal´ıtica em um dom´ınio aberto e simplesmente conexo D. Se M1 (z) ´e uma

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

340/1304

solu¸ca˜o desta equa¸ca˜o, constata-se trivialmente que, para qualquer matriz m × m constante C, a matriz M2 (z) = M1 (z)C ´e igualmente solu¸ca˜o de M0 (z) = A(z)M(z), bastando para tal multiplicar a equa¸ca˜o a` direita por C. A seguinte afirma¸ca˜o rec´ıproca ´e tamb´em verdadeira: Proposi¸ c˜ ao 7.2 Se M1 (z) e M2 (z) s˜ ao duas solu¸co ˜es invert´ıveis de M0 (z) = A(z)M(z), com A(z) anal´ıtica em um dom´ınio aberto e simplesmente conexo D, ent˜ ao existe uma matriz constante invert´ıvel C tal que M2 (z) = M1 (z)C para todo z ∈ D. 2 Prova. Para ver isso, seja z0 um ponto arbitr´ario de D e defina-se M01 = M1 (z0 ) e M02 = M2 (z0 ). Seja ent˜ao C := (M01 )−1 M02 . Ent˜ao, teremos que M3 (z), definida por M3 (z) = M2 (z) − M1 (z)C ´e tamb´em solu¸ca˜o da equa¸ca˜o M0 (z) = A(z)M(z), mas que obviamente anula-se em z0 . Com isso, pela Proposi¸ca˜o 7.1, M3 (z) ´e identicamente nula em todo D, ou seja, M2 (z) = M1 (z)C para todo z ∈ D. Conseq¨ uˆencias dessas observa¸co˜es ser˜ao discutidas na Se¸ca˜o 7.6.3.

7.6.2

Resolu¸ c˜ ao por S´ eries de Potˆ encias

A possibilidade, revelada acima, de se apresentar a solu¸ca˜o da equa¸ca˜o homogˆenea Y 0 (z) = A(z)Y (z) com condi¸ca˜o Y (z0 ) = Y0 , z0 ∈ D, em termos da matriz D(z, w) (a qual depende apenas de A) ´e interessante do ponto de vista te´orico mas nem sempre do ponto de vista pr´atico, pois nem sempre ´e poss´ıvel computar a s´erie infinita de integrais de produtos de matrizes que comp˜oe D(z, w) (a s´erie de Dyson). No entanto, uma das conclus˜oes te´oricas da an´alise acima, a saber, o fato de Y ser anal´ıtica, aponta para um outro m´etodo de resolu¸ca˜o, esse sim mais simples de ser usado em aplica¸co˜es. Trata-se do M´etodo de S´eries de Potˆencias que descreveremos agora. O fato de Y ser anal´ıtica nos diz a priori que Y pode ser expressa por uma s´erie de Taylor convergente centrada em z0 : ∞ X Y (z) = (z − z0 )n Yn , (7.46) n=0

onde Yn s˜ao vetores-coluna constantes com m componentes, tal qual Y (z). Note-se que, pela express˜ao acima, Y (z0 ) = Y0 . Para ver isso, tome z = z0 em ambos os lados da express˜ao.

Como a matriz A ´e igualmente anal´ıtica em torno de z0 , A pode ser expressa por uma s´erie de Taylor convergente centrada em z0 : A(z) =

∞ X n=0

(z − z0 )n An ,

onde An s˜ao igualmente matrizes m × m constantes. Com isso, a equa¸ca˜o diferencial Y 0 (z) = A(z)Y (z)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

341/1304

fica ∞ X n=0

∞ X (z − z0 )k Ak

(n + 1)(z − z0 )n Yn+1 = =

k=0

∞ X ∞ X k=0 l=0

=

∞ X n=0

!

∞ X l=0

(z − z0 )l Yl

!

(z − z0 )k+l Ak Yl

(z − z0 )n

n X

An−p Yp ,

(7.47)

p=0

o que nos leva a concluir que n

Yn+1

1 X An−p Yp , = n + 1 p=0

∀n ≥ 0.

E. 7.12 Exerc´ıcio importante. Complete os detalhes das dedu¸co˜es que levam a (7.47) e (7.48).

(7.48)

6

A express˜ao (7.48) nos permite obter os vetores Yn recursivamente a partir de Y0 . Com isso, a solu¸ca˜o Y (z) fica determinada por sua s´erie de Taylor (7.46). Esse ´e o m´etodo de resolu¸ca˜o por s´eries de potˆencias. Por exemplo, para n = 0, (7.48) nos d´a Y1 = A 0 Y0 . Para n = 1, (7.48) nos d´a Y2 =

 1 1 (A1 Y0 + A0 Y1 ) = A1 + A20 Y0 , 2 2

e assim por diante. Os primeiros termos da solu¸ca˜o Y (z) s˜ao, ent˜ao,

 (z − z0 )2 A1 + A20 Y0 + · · · 2    (z − z0 )2 2 + (z − z0 )A0 + A 1 + A 0 + · · · Y0 . = 2

Y (z) = Y0 + (z − z0 )A0 Y0 +

(7.49)

Isso permite-nos identificar a express˜ao entre colchetes {· · · } como sendo a expans˜ao em s´erie de Taylor de D(z, z0 ). E. 7.13 Exerc´ıcio. Determine Y3 e Y4 em termos de Y0 .

6

E. 7.14 Exerc´ıcio importante. Desenvolva o m´etodo de expans˜ao em s´erie de potˆencias para a resolu¸c˜ao da equa¸c˜ao n˜ao-homogˆenea Y 0 (z) = A(z)Y (z) + F (z) com condi¸c˜ao Y (z0 ) = Y0 , z0 ∈ D, onde A e F s˜ao anal´ıticas em um dom´ınio simplesmente conexo D e limitadas em D. 6

JCABarata. Curso de F´ısica-Matem´ atica

7.6.3

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

342/1304

Sistemas com Pontos Singulares. Monodromia

Nas p´aginas anteriores consideramos equa¸co˜es diferenciais como Y 0 (z) = A(z)Y (z) onde A(z) era suposta ser anal´ıtica em um certo dom´ınio aberto e simplesmente conexo D. H´a in´ umeros problemas importantes nos quais essa situa¸ca˜o n˜ao ´e encontrada, de modo que devemos afrouxar um pouco as condi¸co˜es sobre a analiticidade de A(z). Consideraremos aqui a situa¸ca˜o na qual A ´e anal´ıtica dentro de um anel aberto Az0 , a, b centrado em z0 ∈ com raio interno a e raio externo b definido por n o Az0 , a, b := z ∈ a < |z − z0 | < b ,

sendo 0 ≤ a < b (os casos em que a = 0 e/ou b = ∞ podem ser tamb´em permitidos). Vide Figura 7.1. Uma t´ıpica situa¸ca˜o na qual isso ocorre se d´a quando A(z0 ), ou seja, alguns de seus elementos de matriz, tem uma singularidade tipo p´olo ou essencial6 em um ponto z0 . Em verdade, interessaremo-nos mais pelo caso de singularidades tipo p´olo, caso que, felizmente, corresponde a` maioria das aplica¸co˜es. Notemos que a hip´otese de A(z) ser anal´ıtica em um anel Az0 , a, b significa que A(z) pode ser expressa em uma s´erie de Laurent7 convergente (vide e.g. [21]) em Az0 , a, b : A(z) =

∞ X

m=−∞

(z − z0 )m Am .

Notemos que um anel Az0 , a, b ´e a uni˜ao dom´ınios abertos e simplesmente conexos do tipo Sz0 , a, b (φ1 , φ2 ), com 0 < φ2 − φ1 < 2π, onde  Sz0 , a, b (φ1 , φ2 ) := z ∈ | z − z0 = ρeiφ , com a < ρ < b e φ1 < φ < φ2 . Denominaremos essas regi˜oes setores. Vide Figura 7.2. • Monodromia Se tomarmos z1 e z dentro do anel Az0 , a, b , podemos encontrar um setor Sz0 , a, b (φ1 , φ2 ) que contem ambos os pontos (se, por exemplo, na representa¸ca˜o polar, z1 = ρ1 eiθ1 e z = ρeiθ , podemos tomar φ1 < min{θ1 , θ} mod 2π e φ2 < max{θ1 , θ} mod 2π). Como A ´e anal´ıtica dentro de um tal setor e o mesmo ´e simplesmente conexo, podemos representar a matriz de Dyson D(z, z1 ) na forma (7.38) com as integrais tomadas em um caminho orientado de z1 a z inteiramente contido no interior de Sz0 , a, b (φ1 , φ2 ) (e, portanto, de Az0 , a, b ). Isso permite definir D(z, z1 ) dentro de cada setor. Uma quest˜ao muito importante para o que segue ´e saber o que ocorre com a matriz D(z, z 1 ) se, fixando z1 , fizermos z dar uma volta de 2π em torno do ponto z0 . Mais precisamente, consideremos os pontos z(φ) definidos por z(φ) := (z − z0 )eiφ + z0 . Como ´e f´acil constatar, ao variarmos φ entre 0 e 2π, z(φ) move-se em um c´ırculo de raio |z − z0 | centrado em z0 e orientado em sentido anti-hor´ario, sendo que z(0) = z(2π) = z. Para 0 ≤ φ < 2π, os pontos z1 e z(φ) est˜ao dentro de algum setor simplesmente conexo de Az0 , a, b e podemos escrever, por (7.43), D(z(φ), z1 ) = D(z(φ), z)D(z, z1 ). Consideremos a matriz D(z(φ), z). A mesma pode ser expressa na forma (7.38), sendo que podemos tomar como caminho de integra¸ca˜o o arco de c´ırculo orientado no sentido anti-hor´ario C(φ) que vai de z a z(φ) (lembremo-nos que |z(φ) − z0 | = |z − z0 |). Vide Figura 7.3. A para a matriz D(z, z1 ) podemos 6 7

Para o estudante que queira recordar esses conceitos sugerimos, por exemplo, [21]. Pierre Alphonse Laurent (1813-1854).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

b

Cap´ıtulo 7

343/1304

a z0

Figura 7.1: Um anel do tipo Az0 , a, b .

tomar o caminho de integra¸ca˜o C1 da Figura 7.3. A medida em que φ aproxima-se de 2π, o caminho de integra¸ca˜o aproxima-se do c´ırculo fechado de raio |z − z0 | (indicado por C na Figura 7.3), orientado de z a z no sentido anti-hor´ario. Vemos assim que lim D(z(φ), z1 ) = M D(z, z1 )

φ→2π

onde

M := lim D(z(φ), z) . φ→2π

Pela defini¸ca˜o e pela representa¸ca˜o (7.38), Z wn−1 ∞ I Z w1 X M = + ··· A(w1 )A(w2 ) · · · A(wn ) dwn dwn−1 · · · dw1 , n=1

z

z

(7.50)

z

H onde por z entende-se a integra¸ca˜o (na vari´avel w1 ) de z a z tomada ao longo do c´ırculo fechado C de raio |z − z0 |, orientado de z a z no sentido anti-hor´ario. Como se percebe, esse c´ırculo corresponde ao arco C(2π). Devido a` express˜ao (7.50), ´e f´acil constatar que M , n˜ao depende da particular curva C tomada unindo z a z, desde que essa curva dˆe exatamente uma volta em torno de z0 sentido anti-hor´ario sem abandonar Az0 , a, b . Devido ao fato de o integrando ser anal´ıtico dentro de todos os setores de Az0 , a, b , podemos deformar continuamente o caminho de integra¸ca˜o sem alterar seu valor, desde que n˜ao se abandone Az0 , a, b . Podemos, assim, tomar como caminho de integra¸ca˜o em (7.50) qualquer curva fechada que dˆe uma volta completa no sentido anti-hor´ario em torno de z0 ao longo do anel Az0 , a, b , sem sair do mesmo. Em particular, vemos com esse argumento que M tamb´em n˜ao depende do ponto z.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

344/1304

φ

2

b

a

φ

1

z0

Figura 7.2: Em cinza, um setor Sz0 , a, b (φ1 , φ2 ) no interior do anel Az0 , a, b .

A matriz M ´e denominada matriz de monodromia associada a` matriz A(z) em Az0 , a, b . Se M 6= , dizemos que D(z, z1 ) possui uma monodromia n˜ ao-trivial. Caso M 6= (veremos exemplos logo adiante), a matriz de Dyson D(z, z1 ) n˜ao ´e uma fun¸ca˜o un´ıvoca, ou seja, quando a vari´avel z d´a uma volta de 2π em torno de z0 , D(z, z1 ) n˜ao volta ao mesmo valor. Esse fenˆomeno ´e bem conhecido na teoria das fun¸co˜es de vari´avel complexa e ´e associado a` presen¸ca de singularidades do tipo ponto de ramifica¸ca˜o. Por exemplo, para a fun¸ca˜o complexa ln(z), z 6= 0, vale lim ln(zeiφ ) = ln(z) + 2πi e para a fun¸ca˜o complexa z γ , z 6= 0, com γ 6∈ , vale iφ γ

lim (ze ) = e

φ→2π

φ→2π 2πγi γ

z .

• Mais propriedades da matriz de monodromia Um coment´ario que ser´a importante ´e que toda matriz de monodromia ´e invert´ıvel. Para vermos isso, notemos que pela defini¸ca˜o, M = limφ→2π D(z(φ), z). Assim, considerando o ponto z(π) (escolhido de forma arbitr´aria, por´em conveniente), tem-se pela f´ormula de composi¸ca˜o (7.43) que M = limφ→2π D(z(φ), z) = limφ→2π D(z(φ), z(π))D(z(π), z) = Db (z, z(π))Da (z(π), z), sendo que Da (z 0 , z) envolve integra¸co˜es ao longo de um arco Ca , orientado de z a z(π), e Db (z, z(π)) envolve integra¸co˜es ao longo do arco Cb , orientado de z(π) a z. Ambos os arcos est˜ao contidos em Az0 , a, b . A uni˜ao Ca ∪ Cb ´e uma curva fechada que d´a exatamente uma volta completa no sentido anti-hor´ario em torno de z0 ao longo do anel Az0 , a, b , sem sair do mesmo. Ambas as matrizes Da (z 0 , z) e Db (z, z 0 ) s˜ao invert´ıveis. Portanto, a matriz M tamb´em o ´e. Um segundo coment´ario ´e que a matriz de monodromia comuta com D(z, z1 ) e com A(z) para

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

345/1304

z

C1 C(φ) z1 φ z0 z(φ)

C

Figura 7.3: O arco de c´ırculo orientado no sentido anti-hor´ario C(φ) que vai de z a z(φ).

todos z, z1 ∈ Az0 , a, b . Para ver isso, considere a curva C, fechada, orientada, inteiramente contida em Az0 , a, b , indicada na Figura 7.4. Essa curva ´e a fronteira deH uma regi˜ao simplesmente conexa, portanto, se f (z) ´e uma fun¸ca˜o anal´ıtica em Az0 , a, b , sua integral C f (w) dw ao longo de C ´e nula. Por essa raz˜ao, tem-se que +

∞ I Z X n=1

C

w1 z

···

Z

wn−1 z

A(w1 )A(w2 ) · · · A(wn ) dwn dwn−1 · · · dw1 =

,

(7.51)

pois todas as integrais ao lado direito se anulam (os integrandos s˜ao anal´ıticos). A curva C pode ser continuamente deformada a` curva fechada indicada na Figura 7.5 sem alterar a igualdade (7.51). Tem-se agora, por´em, que o percurso ao longo de C pode ser caminhado pelo seguinte conjunto de percursos sucessivos: 1) partindo do ponto z1 ao longo da curva C1 at´e o ponto z; 2) partindo de z ao longo da curva fechada C2 , orientada no sentido anti-hor´ario, at´e de volta a z; 3) partindo de z at´e z1 , ao longo da curva C3 ; 4) partindo de z1 ao longo da curva fechada C4 , orientada no sentido hor´ario, at´e de volta a z1 . Essas considera¸co˜es e a express˜ao para M em (7.50) em termos de integra¸co˜es ao longo de um circuito arbitr´ario fechado que d´a uma volta no sentido anti-hor´ario em torno de z 0 , levam-nos a concluir que (7.51) significa que M −1 D(z1 , z)M D(z, z1 ) =

.

Como D(z1 , z) = D(z, z1 )−1 , conclu´ımos que M D(z, z1 ) = D(z, z1 )M , ou seja, M e D(z, z1 ) comutam para quaisquer z, z1 ∈ Az0 , a, b . Derivando em rela¸ca˜o a z, obtemos M A(z)D(z, z1 ) =

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

346/1304

A(z)D(z, z1 )M e tomando z1 = z, segue que M A(z) = A(z)M , ou seja, M e A(z) comutam para qualquer z ∈ Az0 , a, b .

C z0

Figura 7.4: A curva fechada orientada C.

Os dois exerc´ıcios que seguem exibem mais propriedades de matrizes de monodromia em certos casos. E. 7.15 Exerc´ıcio. Monodromia no caso comutativo. Considere o caso em que A(z) ´e uma matriz anal´ıtica no anel Az0 , a, b e tal que A(z)A(z 0 ) = A(z 0 )A(z) para todos z, z 0 ∈ Az0 , a, b . Usando (7.35), p´agina 333, e (7.50), mostre que I  M = exp

A(w) dw

,

(7.52)

H a integral sendo tomada ao longo de qualquer curva fechada que dˆe exatamente uma volta completa no sentido anti-hor´ario em torno de z0 ao longo do anel Az0 , a, b , sem sair do mesmo. 6

E. 7.16 Exerc´ıcio. Sejam A(z) matrizes n × n anal´ıticas no anel A z0 , a, b . Suponha que dentro de Az0 , a, b existam n2 pontos distintos z1 , . . . , zn2 com a propriedade que as n2 matrizes A(z1 ), . . . , A(zn2 ) s˜ao linearmente independentes. Mostre que isso implica que M = η para algum η ∈ , η 6= 0. Sugest˜ao: explore o fato que M A(z) = A(z)M para todo z ∈ Az0 , a, b . 6 *

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

347/1304

z

C1

C3 z1

C2 z0 C4

Figura 7.5: A curva fechada orientada C composta dos segmentos orientados C 1 , C2 , C3 e C4 . Os pontos z1 e z.

Antes de examinarmos as conseq¨ uˆencias da existˆencia de uma monodromia n˜ao-trivial para a matriz D(z, z1 ) , devemos mostrar exemplos concretos onde se tem M 6= . • Monodromia n˜ ao trivial. Um exemplo O seguinte exemplo8 ´e ilustrativo. Seja A(z) = z −1 R, onde R ´e a matriz constante   λ 1 R = , 0 λ

(7.53)

sendo λ um n´ umero complexo fixo arbitr´ario. Claramente A(z) ´e singular em z0 = 0 e anal´ıtica em todo anel A0, b = {z ∈ | 0 < |z| < b}, com qualquer b > 0. Tomando z1 ∈ A0, b , fixo, a matriz de Dyson D(z, z1 ) ´e dada por9  !  λ z 1 ln zz1 D(z, z1 ) = , (7.54) z1 0 1 pois, como facilmente se constata, essa matriz satisfaz 8

∂ D(z, ∂z

z1 ) = A(z)D(z, z1 ) e D(z1 , z1 ) = .

Esse exemplo ´e extra´ıdo com pequenas modifica¸co ˜es de [122]. Em tudo o que segue utilizaremos o chamado ramo principal do logaritmo de uma vari´ avel complexa z. Ou seja, se z ∈ tem a decomposi¸ca ˜o polar z = |z|eiφ com −π ≤ φ < π, ent˜ ao ln(z) = ln |z| + iφ. 9

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

348/1304

E. 7.17 Exerc´ıcio. As matrizes A(z) = z −1 R, acima, comutam para valores diferentes de z. Por essa raz˜ao, D(z, z1 ) pode ser calculada com o uso da express˜ao (7.35), p´agina 333. Obtenha (7.54) dessa forma. 6 Fixando-se z1 , ´e f´acil verificar que lim D(zeiφ , z1 ) = lim

φ→2π

φ→2π





ze z1





zeiφ z1

1 ln 0 1

!

= e2πiλ



z z1





.



1 ln 0

  z z1

1

+ 2πi

!

= M D(z, z1 ) ,

com a matriz de monodromia M sendo dada por M = e

2πiλ

1 2πi 0 1

(7.55)

E. 7.18 Exerc´ıcio. Obtenha (7.55) fazendo uso da rela¸c˜ao (7.52), v´alida no caso comutativo. Verifique explicitamente que M A(z) = A(z)M para todo z ∈ A0, b . Vide Exerc´ıcio E. 7.15. 6 E. 7.19 Exerc´ıcio. Mostre, fazendo uso da rela¸c˜ao (7.52), que para qualquer matriz R a matriz de monodromia associada `as fun¸co˜es A(z) = z −p R, com p ∈ , p = 6 1, ´e M = , ou seja, a monodromia ´e trivial. 6 * A existˆencia de monodromias n˜ao-triviais em equa¸co˜es singulares do tipo que consideramos aqui ´e um fato relevante que, como veremos, tem conseq¨ uˆencias sobre a forma geral das solu¸co˜es. • Um coment´ ario sobre a matriz de monodromia Como j´a observamos, toda matriz de monodromia M ´e invert´ıvel. Vamos mostrar que para cada M existe uma matriz Γ tal que M = e2πiΓ . Por exemplo, para a M dada em (7.55) podemos tomar Γ = R, onde R ´e dada em (7.53) (verifique!). Para a prova geral, vamos primeiro escrever M na sua forma de Jordan (vide Teorema 3.18, p´agina 199): seja T invert´ıvel tal que T −1 M T = D + N onde D ´e diagonal, N ´e nilpotente e DN = N D. Definimos, ent˜ao, Γ :=

  1 T ln D + ln( + D −1 N ) T −1 . 2πi

Antes de prosseguirmos comentemos que essa express˜ao est´a bem definida. De fato, D ´e uma matriz diagonal D = diag (d1 , . . . , dm ), tendo na diagonal os autovalores de M . Como M ´e invert´ıvel, nenhum desses autovalores ´e nulo, assim ln D est´a bem definida como ln D = diag (ln(d1 ), . . . , ln(dm )). Fora P k −1 k k isso, ln( + D −1 N ) ´e dada (j´a que D e N comutam) por ∞ e uma soma finita, k=0 (−1) (D ) N , que ´ pois N ´e nilpotente.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

349/1304

Isto posto, dado que ln D e ln( + D −1 N ) comutam (por que?), ´e f´acil ent˜ao ver que  e2πiΓ = T exp ln D + ln( + D −1 N ) T −1  = T exp (ln D) exp ln( + D −1 N ) T −1 = T D( + D −1 N )T −1 = T (D + N )T −1 = M, como quer´ıamos provar. Logo abaixo usaremos a matriz Γ e o fato agora provado que M = e2πiΓ para extrair algumas conclus˜oes sobre a forma geral das solu¸co˜es com pontos singulares do tipo aqui tratado. Para isso, faremos uso da matriz eln(z−z0 )Γ . Vamos discutir sua forma geral. Como toda matriz, Γ pode ser conduzida a` sua forma de Jordan por uma transforma¸ca˜o de similaridade: existe matriz Q invert´ıvel tal que QΓQ−1 = D0 + N0 onde D0 ´e diagonal, N0 ´e nilpotente e D0 N0 = N0 D0 . Com isso, eln(z−z0 )Γ = Q−1 eln(z−z0 )(D0 +N0 ) Q = Q−1 eln(z−z0 )D0 eln(z−z0 )N0 Q. Se a matriz D0 for a matriz diagonal diag (γ1 , . . . , γm ) ent˜ao a matriz eln(z−z0 )D0 ´e a matriz diagonal diag ((z − z0 )γ1 , . . . , (z − z0 )γm ). Por outro lado, como N0 ´e nilpotente de ´ındice menor ou igual a m (ou seja N0m = 0), os elementos de matriz de eln(z−z0 )N0 s˜ao polinˆomios em ln(z − z0 ) de ordem menor ou igual a m − 1. Conseq¨ uentemente, cada elemento de matriz eln(z−z0 )Γ ab ´e da forma e

 ln(z−z0 )Γ

ab

=

m−1 X k=0

m X l=1

kl (z − z0 )γl Cab

!

(ln(z − z0 ))k

(7.56)

kl para certas constantes complexas Cab (algumas podendo ser nulas).

Note-se que os γl s˜ao, em geral, n´ umeros complexos: os autovalores de Γ. E. 7.20 Exerc´ıcio importante. Complete os detalhes que levam a (7.56).

6

Observa¸ca ˜o importante. Como a expans˜ao de eln(z−z0 )N0 e

ln(z−z0 )N0

=

+

m−1 X k=1

(ln(z − z0 ))k N0k

contem o termo , a expans˜ao (7.56) sempre contem um termo n˜ao-nulo do tipo (ln(z − z 0 ))k com k = 0, ou seja, h´a um termo n˜ao-nulo que n˜ao envolve potˆencias de ln(z − z0 ). Essa observa¸ca˜o ser´a lembrada adiante. • A Forma Geral das Solu¸ co ˜es Essa discuss˜ ao ´e baseada na referˆencia [122], cuja leitura recomendamos.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

350/1304

Seja a equa¸ca˜o Y 0 (z) = A(z)Y (z) com A(z) anal´ıtica no anel Az0 , a, b e seja como antes D(z, z1 ), z, z1 ∈ Az0 , a, b , uma matriz fundamental dessa equa¸ca˜o com uma matriz de monodromia M = e2πiΓ . Para z1 fixo, seja S(z) a matriz definida por S(z) = e− ln(z−z0 )Γ D(z, z1 ) . Pelas hip´oteses sobre D(z, z1 ) e pelas propriedades da fun¸ca˜o logaritmo, S(z) ´e anal´ıtica em cada setor Sz0 , a, b (φ1 , φ2 ) com 0 < φ2 − φ1 < 2π.

Consideremos o que ocorre com S(z) quando a vari´avel z d´a uma volta de 2π em torno de z 0 , ou seja, comparemos S(z) com10 limφ→2π S (z − z0 )eiφ + z0 . Temos que !      iφ iφ iφ lim S (z − z0 )e + z0 = lim exp − ln((z − z0 )e )Γ D (z − z0 )e + z0 , z1 φ→2π

φ→2π

=

e

− ln((z−z0 ))Γ





lim e

φ→2π

−iφΓ





lim D (z − z0 )e + z0 , z1

φ→2π

= e− ln((z−z0 ))Γ e−2πiΓ M D(z, z1 )





= e− ln((z−z0 ))Γ M −1 M D(z, z1 ) = e− ln((z−z0 ))Γ D(z, z1 ) = S(z) . Isso diz-nos que S(z) ´e cont´ınua no anel Az0 , a, b . Como ´e anal´ıtica em cada setor Sz0 , a, b (φ2 , φ1 ) com 0 < φ2 − φ1 < 2π, conclu´ımos que S(z) ´e anal´ıtica em Az0 , a, b . Se pudermos tomar o raio interno do anel arbitrariamente pequeno, S(z) pode ser singular em z0 . Essa singularidade, por´em, se houver, ser´a do tipo p´olo ou do tipo singularidade essencial, mas n˜ao do tipo ponto de ramifica¸ca˜o, pois isso contrariaria o fato de S(z) ser anal´ıtica em qualquer anel centrado em z0 . Resumimos nossos conclus˜oes em forma de uma proposi¸ca˜o. Proposi¸ c˜ ao 7.3 Seja a equa¸ca ˜o Y 0 (z) = A(z)Y (z) com A(z) matriz m × m anal´ıtica no anel Az0 , a, b e seja como antes D(z, z1 ), com z, z1 ∈ Az0 , a, b , uma matriz fundamental dessa equa¸ca ˜o com matriz de monodromia M = e2πiΓ . Ent˜ ao, para z1 fixo, D(z, z1 ) ´e da forma D(z, z1 ) = eln(z−z0 )Γ S(z),

(7.57)

onde S(z) ´e anal´ıtica no anel Az0 , a, b . Se pudermos tomar o raio interno do anel arbitrariamente pequeno, S(z) pode ser singular em z0 , a singularidade, se houver, sendo do tipo p´ olo ou do tipo singularidade essencial. Conseq¨ uentemente, por (7.56), cada elemento de matriz D(z, z1 )ab , para z1 fixo, ´e da forma D(z, z1 )ab =

m−1 m XX k=0 l=1

10

kl (z) , (z − z0 )γl (ln(z − z0 ))k Fab

(7.58)

Note que, para z e z0 fixos, quando φ varia de 0 a 2π os pontos (z − z0 )eiφ + z0 descrevem um c´ırculo orientado no sentido anti-hor´ ario no plano complexo e centrado em z0 . Esse c´ırculo tem raio |z − z0 |, inicia-se e termina em z.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

351/1304

kl a, b = 1, . . . , m, onde cada fun¸ca ˜o Fab (z) ´e anal´ıtica no anel Az0 , a, b . Novamente, se pudermos kl tomar o raio interno do anel arbitrariamente pequeno, cada Fab (z) pode ser singular em z0 . Essa singularidade, se houver, ´e do tipo p´ olo ou do tipo singularidade essencial. As constantes complexas γ l s˜ ao os autovalores de Γ. Os termos com k = 0 s˜ ao n˜ ao-nulos. 2

E. 7.21 Exerc´ıcio importante. Complete os detalhes que conduzem a (7.58).

6

E. 7.22 Exerc´ıcio. Qual a rela¸c˜ao entre os expoentes γl e os autovalores da matriz de monodromia M ? Sugest˜ao: pela constru¸c˜ao acima, os expoentes γl s˜ao os autovalores de Γ e M = e2πiΓ . 6 • O M´ etodo de Frobenius A forma geral das matrizes fundamentais apresentada acima sugere e justifica um m´etodo de solu¸ca˜o para o caso de sistemas de equa¸co˜es lineares provenientes de uma equa¸ca˜o diferencial ordin´aria de ordem m (vide Se¸ca˜o 7.7): y (m) (z) + am−1 (z)y (m−1) (z) + · · · a1 (z)y 0 (z) + a0 (z)y(z) = 0,

(7.59)

onde as fun¸co˜es a0 (z), . . . , am−1 (z) s˜ao anal´ıticas em Az0 , b := {z ∈ | 0 < |z − z0 | < b}. O m´etodo consiste em procurar solu¸co˜es na forma y(z) = (z − z0 )γ (ln(z − z0 ))k f (z), para algum γ ∈ , algum k = 0, . . . , m − 1, inteiro e f (z) anal´ıtica no anel Az0 , b . Como f possui uma singularidade tipo p´olo ou essencial em z0 , ela pode ser representada em Az0 , b por uma s´erie de Laurent convergente (vide e.g. [21]): ∞ X f (z) = cn (z − z0 )n . n=−∞

A tarefa consiste em determinar γ ∈ , k = 0, . . . , m − 1, e os coeficientes cn de modo que a equa¸ca˜o (7.59) seja satisfeita.

Esse m´etodo ´e conhecido como m´etodo de Frobenius11 . Em certos casos esse m´etodo ´e muito eficaz, fornecendo solu¸co˜es para uma classe muito grande de equa¸co˜es diferenciais de interesse. Mais sobre ele, adiante. Note-se que, pela observa¸ca ˜o importante da p´agina 349, sempre h´a pelo menos uma solu¸ca˜o que n˜ao envolve potˆencias de ln(z − z0 ). • Singularidades tipo p´ olo de S(z). Pontos Singulares Regulares Retornando a` (7.57), fa¸camos alguns coment´arios sobre as singularidades de S(z) em z 0 . Como dissemos, caso z0 seja um ponto singular de A(z), a matriz S(z), sendo anal´ıtica em Az0 , b , ou possui uma singularidade do tipo p´olo em z0 ou uma singularidade essencial. No caso de a singularidade 11

Ferdinand Georg Frobenius (1849-1917).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

352/1304

ser do tipo p´olo (de qualquer ordem), z0 ´e dito ser um ponto singular regular12 da equa¸ca˜o Y 0 (z) = A(z)Y (z). No caso de z0 ser um ponto singular regular uma simplifica¸ca˜o importante pode ser feita. Se S(z) tem um p´olo de ordem l em z0 , ent˜ao S(z) = (z − z0 )−l S0 (z), onde S0 (z) ´e anal´ıtica em z0 . Com isso, a forma geral (7.57) pode ser reescrita como 0

D(z, z1 ) = S0 (z) eln(z−z0 )Γ , onde Γ0 = Γ − l . E. 7.23 Exerc´ıcio. Verifique!

6

Como se constata, ´e a mesma forma de (7.57), envolvendo apenas uma redefini¸ca˜o da matriz Γ, sendo que agora o fator S0 (z) ´e uma matriz anal´ıtica. O ponto importante ´e que a conclus˜ao (7.58) sobre a forma geral dos elementos de matriz de D(z, z1 ) ´e igualmente v´alida, sendo que agora, por´em, kl as fun¸co˜es Fab (z) s˜ao fun¸co˜es anal´ıticas de z em z0 e n˜ao apenas no anel Az0 , b . Nesse caso, ent˜ao, o m´etodo de Frobenius discutido acima adquire o seguinte aspecto: procura-se solu¸co˜es na forma ∞ X γ k y(z) = (z − z0 ) (ln(z − z0 )) cn (z − z0 )n n=0

e tenta-se determinar γ, k e os coeficientes cn de modo que a equa¸ca˜o diferencial seja satisfeita. Esse m´etodo ´e eficaz e, em muitos casos, pr´atico, fornecendo solu¸co˜es para v´arias equa¸co˜es diferenciais de interesse na F´ısica. Mais sobre o m´etodo de Frobenius pode ser encontrado nos bons livros sobre equa¸co˜es diferenciais e F´ısica-Matem´atica ou no Cap´ıtulo 8, com exemplos.

A quest˜ao que se coloca ent˜ao ´e: quando ocorre que S(z) possui apenas singularidades do tipo p´olo em z0 ? A resposta depende do tipo de singularidade que a pr´opria matriz A(z) possui em z0 . Come¸caremos a discutir isso na Se¸ca˜o 7.6.4.

7.6.4

Sistemas com Pontos Singulares Simples

Nesta se¸ca˜o seguiremos muito proximamente a discuss˜ao da Se¸ca˜o 2 do cap´ıtulo V da referˆencia [122], cuja leitura recomendamos fortemente. De especial importˆancia em aplica¸co˜es s˜ao equa¸co˜es diferenciais Y 0 (z) = A(z)Y (z) nas quais A(z) possui um p´olo simples em z0 , ou seja, A(z) ´e da forma A(z) = (z − z0 )−1 A0 (z), onde A0 (z) ´e anal´ıtica em z0 . Nesse caso, em que z0 ´e um p´olo simples de A(z), dizemos que z0 ´e um ponto singular simples da equa¸ca˜o diferencial. Essa situa¸ca˜o ´e tamb´em particularmente feliz pois, como veremos, nesse caso z 0 ´e um ponto singular regular. Isso ´e o conte´ udo do seguinte teorema: 12

Coment´ ario. A express˜ ao “ponto singular regular” parece conter uma contradi¸ca ˜o em termos pois, na teoria das fun¸co ˜es de vari´ aveis complexas, os adjetivos “singular” e “regular” s˜ ao comummente empregados como antˆ onimos. A express˜ ao “ponto singular regular” aparentemente provem de uma tradu¸ca ˜o imprecisa do Alem˜ ao, mas manteve-se, por raz˜ oes hist´ oricas, em v´ arias l´ınguas. Na express˜ ao “ponto singular regular” o adjetivo “regular” deve ser entendido no sentido de “comum”, “ordin´ ario”. Com isso pretende-se dizer que a singularidade em z 0 n˜ ao ´e do tipo mais grave, como no caso de singularidades essenciais.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

353/1304

Teorema 7.1 Se z0 ´e um ponto singular simples da equa¸ca ˜o diferencial Y 0 (z) = A(z)Y (z), ou seja, A0 (z) := (z − z0 )A(z) ´e anal´ıtica em z0 , ent˜ ao z0 ´e um ponto singular regular dessa equa¸ca ˜o, ou seja, S(z) (definida acima) tem no m´ aximo uma singularidade tipo p´ olo em z 0 . 2 Prova. (Extra´ıda de [122], com ligeiras modifica¸co˜es). Comecemos com alguns coment´arios preparat´orios. 1. Para uma matriz complexa m×m qualquer K denotamos por kKk sua norma operatorial, definida por kKvk kKk := sup , m , v6=0 kvk v∈ p onde, para v = (v1 , . . . , vm ) ∈ m , definimos a norma vetorial kvk := |v1 |2 + · · · + |vm |2 . 







2. Para qualquer elemento ab de uma matriz K vale v u m uX |Kab | ≤ t |Kcb |2 = kKeb k , 

c=1

onde eb ´e o vetor da base canˆonica cuja b-´esima componente ´e 1 e as demais s˜ao nulas. Como ´e o´bvio, keb k = 1. Assim, 

|Kab | ≤

kKeb k keb k 





kKvk m , v6=0 kvk

sup v∈ 





=: kKk.

E. 7.24 Exerc´ıcio. Justifique a segunda desigualdade.

(7.60)

6

3. Da defini¸ca˜o da norma operatorial de uma matriz K, ´e evidente que vale kKvk ≤ kKk kvk para qualquer vetor v. Pela defini¸ca˜o, ´e bem f´acil constatar desse fato que norma operatorial de um produto de matrizes satisfaz kKLk ≤ kKk kLk, (7.61) 



para quaisquer matrizes complexas m × m K e L. E. 7.25 Exerc´ıcio. Prove isso.

6

Agora passemos a` demonstra¸ca˜o do teorema. Com z, z1 ∈ Az0 , b e z1 fixo, vamos denotar D(z, z1 ) por Φ(z). Obviamente, Φ(z) satisfaz Φ0 (z) = A(z)Φ(z) = (z − z0 )−1 A0 (z)Φ(z).

(7.62)

Vamos escrever, para z ∈ Az0 , b , z = z0 + reiθ . Assim, r > 0 mede a distˆancia de z a z0 . Vamos tamb´em definir, para r > 0,

  f (r, θ) := kΦ (z)k = Φ z0 + reiθ = D z0 + reiθ , z1 .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

354/1304

Temos que (abaixo z = z0 + reiθ e w = δeiθ ) ∂ ∂f  iθ (r, θ)

= ∂r Φ z0 + re ∂r

 

Φ z0 + (r + δ)eiθ − Φ z0 + reiθ = lim δ→0 δ = por

(2.19)



=

=

=

lim

  iθ iθ

Φ z + (r + δ)e − Φ z + re 0 0

δ

 

Φ z0 + (r + δ)eiθ − Φ z0 + reiθ lim δ→0 δ

 

Φ z0 + (r + δ)eiθ − Φ z0 + reiθ

lim

δ→0

δ

δ→0



iθ Φ z + δe − Φ (z)



e lim

δ→0

δeiθ



iθ iθ Φ z + δe − Φ (z)

e lim



δe |{z} δ→0 =1

= por

por

(7.62)

=

(7.61)





Φ (z + w) − Φ (z)

lim

w→0

w



(z − z0 )−1 A0 (z)Φ(z) 1 kA0 (z)k kΦ(z)k r

=

1 kA0 (z)k f (r, θ) r



C f (r, θ) , r

=

=

=

kΦ0 (z)k

1 kA0 (z)Φ(z)k r

 1 kA0 (z)k Φ z0 + reiθ r

onde C := sup kA0 (z)k. Note-se que C ´e finito pois, por hip´otese, A0 (z) ´e anal´ıtica em torno de z0 . |z−z0 | 0), z0 sendo um ponto singular simples dessa equa¸ca ˜o diferencial, ou seja, A 0 (z) := (z − z0 )A(z) ´e anal´ıtica em z0 . Seja como antes D(z, z1 ), z, z1 ∈ Az0 , b , uma matriz fundamental dessa equa¸ca ˜o com matriz de monodromia M = e2πiΓ . Ent˜ ao, para z1 fixo, D(z, z1 ) ´e da forma ln(z−z0 )Γ D(z, z1 ) = e S(z), onde S(z) ´e anal´ıtica no anel Az0 , b e tem no m´ aximo uma singularidade −l tipo p´ olo em z0 . Isso significa que S(z) ´e da forma S(z) = (z − z0 ) S0 (z), para algum inteiro l ≥ 0, onde S0 ´e anal´ıtica em z0 . Com isso, definindo Γ0 = Γ − l , conclu´ımos que D(z, z1 ) ´e da forma 0

D(z, z1 ) = eln(z−z0 )Γ S0 (z) ,

(7.64)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

357/1304

Conseq¨ uentemente, cada elemento de matriz D(z, z1 )pq , para z1 fixo, ´e da forma D(z, z1 )pq =

m−1 m XX k=0 l=1

kl (z − z0 )γl (ln(z − z0 ))k Fpq (z) ,

(7.65)

kl p, q = 1, . . . , m, onde as fun¸co ˜es Fpq (z) s˜ ao anal´ıticas em z0 , podendo, portanto, ser expressas por s´eries de Taylor centradas nesse ponto. As constantes complexas γ l s˜ ao os autovalores de Γ0 . Os termos com k = 0 s˜ ao n˜ ao-nulos. 2

7.7

Sistemas Provenientes de EDOs de Ordem m

Considere-se a equa¸ca˜o diferencial linear homogˆenea complexa de ordem m y (m) (z) + am−1 (z)y (m−1) (z) + · · · a1 (z)y 0 (z) + a0 (z)y(z) = 0,

(7.66)

onde as m fun¸co˜es a0 , . . . , am−1 s˜ao anal´ıticas em um dom´ınio aberto simplesmente conexo comum D. ´ f´acil constatar (fa¸ca!) que essa equa¸ca˜o equivale ao sistema E Y 0 (z) = A(z)Y (z), onde



e A(z) ´e a matriz m × m

A(z)

:=

  Y (z) :=                     

0

1

y(z) y 0 (z) .. . y (m−1) (z)

0

0

0

1

.. .

.. .

..

0 0 .

..

.

    

(7.67)

···

0

···

0

..

.. .

.

0

0

0

..

.

1

0

0

0

0

···

0

1

−a0 (z) −a1 (z) −a2 (z)

···

−am−2 (z) −am−1 (z)



          ,        

(7.68)

a qual ´e anal´ıtica em D, por assim o serem as fun¸co˜es a0 , . . . , am−1 , em cujo caso aplicam-se as conclus˜oes supra-citadas, ou seja, a solu¸ca˜o y(z) ´e igualmente anal´ıtica em D. Para futura referˆencia coletamos essa conclus˜ao no seguinte teorema

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

358/1304

Teorema 7.3 Seja a equa¸ca ˜o diferencial linear homogˆenea complexa de ordem m y (m) (z) + am−1 (z)y (m−1) (z) + · · · a1 (z)y 0 (z) + a0 (z)y(z) = 0 e suponhamos que as fun¸co ˜es a0 , . . . , am−1 s˜ ao todas anal´ıticas em um dom´ınio aberto e simplesmente conexo D. Ent˜ ao as solu¸co ˜es da equa¸ca ˜o s˜ ao igualmente anal´ıticas em D. Em particular, se D contiver um disco aberto Daz0 := {z ∈ | |z − z0 | < a}, centrado em z0 e de raio a > 0, ent˜ ao as solu¸co ˜es da equa¸ca ˜o podem ser expressas em termos de uma s´erie de potˆencias y(z) =

∞ X n=0

cn (z − z0 )n ,

a qual converge (absolutamente) pelo menos no disco aberto D az0 , ou seja, pelo menos para todo z ∈ tal que |z − z0 | < a. 2

7.7.1

Pontos Singulares Simples em EDO’s de Ordem m

• Introdu¸ c˜ ao e motiva¸ c˜ ao Seja o sistema de equa¸co˜es Y 0 (z) = A(z)Y (z) procedente de uma EDO linear complexa homogˆenea de ordem m como (7.66), com Y (z) como em (7.67) e A(z) dada em (7.68), definida em um dom´ınio D do plano complexo. Seja tamb´em z0 ∈ D. ´ Vamos supor que z0 seja um ponto singular de A(z), ou seja, A(z) n˜ao ´e anal´ıtica em z = z0 . E bastante claro que se as fun¸co˜es ak (z), k = 0, . . . , m − 1, tiverem no m´aximo um p´olo de ordem 1 em z0 = 0, ou seja, se as fun¸co˜es (z − z0 )ak (z), k = 0, . . . , m − 1, forem todas anal´ıticas em z0 , ent˜ao z0 ser´a um ponto singular regular de Y 0 (z) = A(z)Y (z), pois, teremos Y 0 (z) = (z − z0 )−1 A0 (z)Y (z), onde A0 (z) := (z − z0 )A(z) ´e anal´ıtica em z0 . Assim, nesse caso, valeriam todas as importantes conclus˜oes a que chegamos na Se¸ca˜o 7.6.4, p´agina 352, especialmente aquelas expressas no Teorema 7.2, p´agina 357. Sucede que h´a condi¸co˜es ainda menos restritivas sobre as fun¸co˜es ak (z), k = 0, . . . , m − 1, para as quais as importantes conclus˜oes sobre a forma geral da solu¸ca˜o, expressas no Teorema 7.2, tamb´em se aplicam. A saber, tal ´e o caso se as fun¸co˜es (z − z0 )m−k ak (z), k = 0, . . . , m − 1, forem todas anal´ıticas em z0 , ou seja, se cada fun¸ca˜o ak (z) tiver no m´aximo um p´olo de ordem m − k em z0 . No que segue iremos primeiramente justificar as afirmativas do u ´ ltimo par´agrafo para depois extrair as conclus˜oes pertinentes. Esse caminho nos conduzir´a a uma no¸ca˜o mais abrangente do conceito de ponto singular simples de equa¸co ˜es diferenciais lineares complexas homogˆeneas de ordem m como (7.66). • A no¸ c˜ ao de ponto singular simples para EDOs de ordem m Seja ent˜ao Y 0 (z) = A(z)Y (z) com Y (z) como em (7.67) e com A(z) dada em (7.68), definida em um dom´ınio aberto e simplesmente conexo D com z0 ∈ D. Vamos definir um novo vetor coluna Y˜ (z) := E(z)Y (z),

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

onde E(z) ´e a matriz diagonal m × m 

E(z)

:=

1

0

0

···

0

  0 (z − z0 ) 0 ··· 0    .  0 (z − z0 )2 . . 0 0   . .. .. .. ..  .. . . . .    0 0 0 (z − z0 )m−2   0

0

0

···

0

0 0 0 .. . 0 (z − z0 )m−1

359/1304



          ,        

(7.69)

ou seja, E(z) ´e a matriz diagonal com E(z)kk = (z − z0 )k−1 , 1 ≤ k ≤ m. O porquˆe de procedermos essa mudan¸ca de Y para Y˜ atrav´es dessa matriz E ficar´a claro logo abaixo. Diferenciando-se Y˜ (z), teremos, para z 6= z0 , Y˜ 0 (z) = E(z)Y 0 (z) + E 0 (z)Y (z) = E(z)A(z)Y (z) + E 0 (z)E(z)−1 Y˜ (z) = E(z)A(z)E(z)−1 Y˜ (z) + E 0 (z)E(z)−1 Y˜ (z), ou seja, definindo obtemos,

i h ˜ A(z) := (z − z0 ) E(z)A(z)E(z)−1 + E 0 (z)E(z)−1 ,

(7.70)

˜ Y˜ (z). Y˜ 0 (z) = (z − z0 )−1 A(z)

(7.71)

Para prosseguirmos (e para finalmente entendermos por que fizemos a mudan¸ca de Y para Y˜ ), ´e ˜ muito importante calcularmos explicitamente a matriz A(z) definida acima. ˜ definida acima. Use (7.70), E. 7.28 Exerc´ıcio muito importante. Calcule explicitamente a matriz A(z) (7.68) e (7.69). 6

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

360/1304

O resultado ´e 

˜ A(z)

=

                     

0

1

0

0

1

1

0

0

2

.. .

.. .

0

0

0

0

0

0

b0 (z) b1 (z) b2 (z)

···

0

0

0

0

0

.

0

..

.

..

···

0

0 ..

···

0

.. .

.

m−3

1

0

0

m−2

1

bm−3 (z) bm−2 (z) bm−1 (z)



            ,          

onde b0 (z) := −(z − z0 )m a0 (z), b1 (z) := −(z − z0 )m−1 a1 (z), b2 (z) := −(z − z0 )m−2 a2 (z), .. . bm−2 (z) := −(z − z0 )2 am−2 (z), bm−1 (z) := −(z − z0 )am−1 (z) + (m − 1). Como exemplo, tem-se no caso de particular interesse f´ısico das equa¸co˜es de segunda ordem y 00 (z) + a1 (z) y 0 (z) + a0 (z) y(z) = 0     y(z) 1 0 , e que E(z) = , Y˜ (z) =  0 z − z0 0 (z − z0 )y (z)   0 1 ˜ Y˜ (z), com A(z) ˜ . Y˜ 0 (z) = (z − z0 )−1 A(z) =  2 −(z − z0 ) a0 (z) −(z − z0 )a1 (z) + 1 De volta ao caso geral, vemos que se as fun¸co˜es bk (z), 0 ≤ k ≤ m − 1, forem todas anal´ıticas em ˜ torno de z0 , ent˜ao A(z) ser´a anal´ıtica em torno de z0 e, portanto, o sistema (7.71) ser´a um sistema com um ponto singular simples em z0 . Coloquemos, assim, a seguinte defini¸ca˜o:

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

361/1304

Defini¸ c˜ ao. Seja a equa¸ca ˜o diferencial linear homogˆenea complexa de ordem m y (m) (z) + am−1 (z)y (m−1) (z) + · · · a1 (z)y 0 (z) + a0 (z)y(z) = 0.

(7.72)

˜o se pelo Um ponto z0 ∈ ´e dito ser um ponto singular simples, ou ponto singular regular dessa equa¸ca menos uma das fun¸co ˜es ak (z) for singular em z0 mas de modo que todas as fun¸co ˜es (z − z0 )m−k ak (z), k = 0, . . . , m − 1, sejam anal´ıticas em z0 . Isso significa que cada fun¸ca ˜o ak (z) ou ´e anal´ıtica em z0 ou tem um p´ olo em z0 cuja ordem deve no m´ aximo ser m − k, sendo que supostamente pelo menos uma das fun¸co ˜es ak (z) ´e singular em z0 . Isso significa que um ponto z0 ´e um ponto singular simples se A(z) n˜ao ´e anal´ıtica em z = z0 mas ˜ se A(z) ´e anal´ıtica em z = z0 . Assim, por exemplo, dizemos que z0 ´e um ponto singular simples da equa¸ca ˜o de segunda ordem (ou 00 0 seja, para m = 2) dada por y (z) + a1 (z) y (z) + a0 (z) y(z) = 0 se a0 (z) tiver um p´olo de ordem no m´aximo 2 em z0 ou se a1 (z) tiver um p´olo de ordem no m´aximo 1 em z0 , ou ambos. V´arios exemplos s˜ao apresentados e discutidos na Se¸ca˜o 7.7.3. No caso de z0 ser um ponto singular simples de uma equa¸ca˜o como (7.72), aplicam-se os resultados da Se¸ca˜o 7.6.4, p´agina 352, a`s solu¸co˜es de (7.71). Discutiremos adiante as implica¸co˜es deste fato. • Solu¸ co ˜es de equa¸ co ˜es com pontos singulares simples Unindo as observa¸co˜es acima com o Teorema 7.2 chegamos a` seguinte importante conclus˜ao. Teorema 7.4 Seja a equa¸ca ˜o diferencial linear homogˆenea complexa de ordem m y (m) (z) + am−1 (z)y (m−1) (z) + · · · a1 (z)y 0 (z) + a0 (z)y(z) = 0 e seja z0 um ponto singular simples dessa equa¸ca ˜o, ou seja pelo menos uma das fun¸co ˜es a k (z) ´e singular m−k em z0 mas de modo que todas as fun¸co ˜es (z − z0 ) ak (z), k = 0, . . . , m − 1, sejam anal´ıticas em z0 . Ent˜ ao as solu¸co ˜es da equa¸ca ˜o diferencial s˜ ao combina¸co ˜es lineares de solu¸co ˜es da forma yγ, k (z) = (z − z0 )γ (ln(z − z0 ))k fγ, k (z), para certos γ ∈ , k = 0, . . . , m − 1 e fγ, k anal´ıtica em torno de z0 .

Por fim, pela observa¸ca ˜o importante da p´ agina 349, sempre h´ a pelo menos uma solu¸ca ˜o que n˜ ao envolve potˆencias de ln(z − z0 ), ou seja, h´ a sempre pelo menos uma solu¸ca ˜o com k = 0. 2 • A equa¸ c˜ ao de Euler

Um exemplo-prot´otipo de uma equa¸ca˜o com um ponto singular simples ´e a equa¸ca ˜o de Euler de ordem m: z m y (m) (z) + z m−1 bm−1 y (m−1) (z) + · · · zb1 y 0 (z) + b0 y(z) = 0 ,

onde bm−1 , . . . , b0 s˜ao constantes. Nesse caso tem-se am−1 (z) =

bm−1 , z

am−2 (z) =

bm−2 , z2

...,

a0 (z) =

b0 zm

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

362/1304

e, claramente, essa equa¸ca˜o possui um ponto singular simples em z0 = 0. No caso m = 2 a equa¸ca˜o de Euler ´e z 2 y 00 (z) + zb1 y 0 (z) + b0 y(z) = 0 , cujas solu¸co˜es s˜ao, caso (1 − b1 )2 − 4b0 6= 0, y(z) = αz γ+ + βz γ− onde γ± = ou, caso (1 − b1 )2 − 4b0 = 0,

1 − b1 ±

(7.73)

p (1 − b1 )2 − 4b0 2

y(z) = αz γ0 + β ln(z) z γ0

(7.74)

onde

1 − b1 . 2 Acima, α e β s˜ao constantes arbitr´arias. Essas solu¸co˜es ilustram as afirma¸co˜es do Teorema 7.4. γ0 =

E. 7.29 Exerc´ıcio importante. Verifique todas as afirma¸co˜es feitas acima.

6

• Um Teorema de Fuchs H´a um importante teorema, devido a Fuchs, que estabelece uma rec´ıproca do Teorema 7.4: se toda solu¸ca˜o da equa¸ca˜o y (m) (z) + am−1 (z)y (m−1) (z) + · · · + a1 (z)y 0 (z) + a0 (z)y(z) = 0

(7.75)

for uma combina¸ca˜o linear de fun¸co˜es da forma (z − z0 )γ (ln(z − z0 ))k fγ, k (z), para certos γ ∈ , k = 0, . . . , m − 1 e fγ, k anal´ıticas em torno de z0 , ent˜ao z0 ´e um ponto singular simples de (7.75), ou seja, todas as fun¸co˜es (z − z0 )m−k ak (z), k = 0, . . . , m − 1, s˜ao anal´ıticas em z0 . Uma demonstra¸ca˜o pode ser encontrada em [122].

7.7.2

Singularidades no Infinito

Seja a equa¸ca˜o diferencial linear homogˆenea complexa de ordem m y (m) (z) + am−1 (z)y (m−1) (z) + · · · a1 (z)y 0 (z) + a0 (z)y(z) = 0. Em muitas situa¸co˜es deseja-se estudar o comportamento dessas equa¸co˜es e suas solu¸co˜es para |z| tendendo a infinito e, para tal, presta-se muitas vezes estudar propriedades das solu¸co˜es como fun¸co˜es de 1/z. Com isso poder´ıamos, por exemplo, perguntar-nos se a solu¸ca˜o pode ser expressa em termos de uma s´erie de potˆencias em 1/z etc., e usar os m´etodos j´a discutidos para obter essa expans˜ao, caso ela exista, e, dessa forma, conhecer a solu¸ca˜o para |z| grande. Por simplicidade limitaremos nossa discuss˜ao a equa¸co˜es de segunda ordem13 y 00 (z) + a1 (z) y 0 (z) + a0 (z) y(z) = 0. 13

Para uma discuss˜ ao mais geral, vide [122] ou [64].

(7.76)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

363/1304

Fa¸camos a mudan¸ca de vari´aveis w = 1/z. Definindo u(w) = y(z) = y(1/w), teremos   a0 (1/w) a1 (1/w) 2 00 u0 (w) + − u(w) = 0. u (w) + 2 w w w4

(7.77)

Vers˜ ao de 29 de setembro de 2005.

E. 7.30 Exerc´ıcio. Confira.

6

Chamaremos essa equa¸ca˜o “vers˜ao no infinito” da equa¸ca˜o (7.76). Claramente essa equa¸ca˜o equivale a U 0 (w) = C(w)U (w), com U (w) := onde



 u(w) , u0 (w)

C(w) :=



 0 1 , −c0 (w) −c1 (w)

c0 (w) :=

a0 (1/w) , w4

c1 (w) :=

2 a1 (1/w) − . w w2

Analogamente ao que fizemos anteriormente, podemos transformar esse sistema no sistema equivalente 1 ˜ ˜ (w), U U˜ 0 (w) = C(w) w onde   ˜ (w) := E(w)U (w), ˜ U C(w) := w E(w)C(w)E(w)−1 + E 0 (w)E(w)−1 ,     u(w) 1 0 e com E(w) = , U˜ (w) =  0 w wu0 (w)     0 1 0 1   ˜  =    C(w) =  1 1 .  a0 w a1 w −w 2 c0 (w) −wc1 (w) + 1 − −1 + w2 w Por analogia com nossas no¸co˜es pr´evias, fa¸camos as seguintes defini¸co˜es:

1. Diremos que a equa¸ca˜o (7.76) ´e uma equa¸ca ˜o anal´ıtica no infinito se C(w) for anal´ıtica em torno de w = 0. 2. Diremos que a equa¸ca˜o (7.76) tem uma singularidade no infinito se C(w) n˜ao for anal´ıtica em torno de w = 0. 3. Diremos que a equa¸ca˜o (7.76) tem uma singularidade simples no infinito (ou que z 0 = ∞ ´e um ˜ ponto singular simples de (7.76)) se C(w) n˜ao for anal´ıtica em torno de w = 0 mas C(w) o for, ou seja, se c0 (w) tiver um p´olo de ordem no m´aximo 2 em w = 0 ou se c1 (w) tiver um p´olo de ordem no m´aximo 1 em w = 0, ou ambos. V´arios exemplos s˜ao discutidos na Se¸ca˜o 7.7.3.

JCABarata. Curso de F´ısica-Matem´ atica

7.7.3

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

364/1304

Alguns Exemplos de Interesse

Nesta se¸ca˜o analisaremos algumas equa¸co˜es diferenciais de importˆancia na F´ısica-Matem´atica previamente mencionadas na Se¸ca˜o 5.1.2, p´agina 267, a` luz do que discutimos neste cap´ıtulo. E. 7.31 Exerc´ıcio importante. que seguem.

Complete os detalhes de todos os c´alculos apresentados nos exemplos 6

1. A equa¸ c˜ ao de segunda ordem com coeficientes constantes y 00 (z) + by 0 (z) + cy(z) = 0, onde b e c s˜ao constantes, corresponde a 

A(z) = 

0

1

−c

−b

Assim, a equa¸ca˜o ´e regular em todo z0 ∈ .



.

Ponto no infinito. A vers˜ao no infinito da equa¸ca˜o de segunda ordem com coeficientes constantes ´e   c b 2 00 − 2 u0 (w) + 4 u(w) = 0. u (w) + w w w Claramente, z0 = ∞ ´e um ponto singular irregular da equa¸ca˜o de segunda ordem com coeficientes constantes, exceto no caso em que b = c = 0, onde z0 = ∞ ´e um ponto singular regular.

2. A equa¸ c˜ ao de Euler z 2 y 00 (z) + az y 0 (z) + b y(z) = 0, ou seja, y 00 (z) +

a 0 b y (z) + 2 y(z) = 0, z z

onde a e b s˜ao constantes, corresponde a 

1

b − 2 z

a − z

0

1

−b

−a + 1

 A(z) =  Para z0 = 0 tem-se



˜ A(z) = 



0

 . 

 .

Assim, z0 = 0 ´e um ponto singular simples da equa¸ca˜o de Euler, exceto se a = b = 0, em cujo caso z0 = 0 ´e um ponto regular.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

365/1304

Ponto no infinito. A vers˜ao no infinito da equa¸ca˜o de Euler ´e u00 (w) +

b 2−a 0 u (w) + 2 u(w) = 0 . w w

Claramente, z0 = ∞ ´e um ponto singular simples da equa¸ca˜o de Euler, exceto se a = 2 e b = 0, em cujo caso z0 = ∞ ´e um ponto regular. 3. A equa¸ c˜ ao de Bessel z 2 y 00 (z) + z y 0 (z) + (z 2 − ν 2 ) y(z) = 0,

ou seja,

  1 0 ν2 y (z) + y (z) + 1 − 2 y(z) = 0, z z 00

onde ν ∈ 

, corresponde a



 A(z) = 

Para z0 = 0 tem-se

0

1

2

ν −1 z2



˜ A(z) = 

0 ν 2 − z2



1 z



 .

 1 . 0

Assim, z0 = 0 ´e um ponto singular simples da equa¸ca˜o de Bessel. Ponto no infinito. A vers˜ao no infinito da equa¸ca˜o de Bessel ´e   1 0 1 ν2 00 u (w) + u (w) + u(w) = 0. − w w4 w2 Claramente, c0 tem um p´olo de ordem 4 em w = 0. Assim, z0 = ∞ ´e um ponto singular irregular da equa¸ca˜o de Bessel. 4. A equa¸ c˜ ao de Legendre (1 − z 2 ) y 00 (z) − 2z y 0 (z) + λ(λ + 1) y(z) = 0, ou seja, y 00 (z) − onde λ ∈ , corresponde a

λ(λ + 1) 2z y 0 (z) + y(z) = 0, 2 1−z 1 − z2 

 A(z) = 

0 −

λ(λ + 1) 1 − z2

1 2z 1 − z2



 .

Claramente percebe-se que a equa¸ca˜o de Legendre ´e anal´ıtica no dom´ınio simplesmente conexo D formado pelo disco aberto de raio 1: D = {z ∈ : |z| < 1}. Conclu´ımos que as solu¸co˜es da equa¸ca˜o de Legendre s˜ao anal´ıticas nesse dom´ınio D.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

366/1304

Os pontos z0 = ±1 s˜ao pontos singulares da equa¸ca˜o de Legendre. Para z0 = 1 teremos

que ´e anal´ıtica em z0 = 1. Para z0 = −1 teremos

que ´e anal´ıtica em z0 = −1.



 ˜ A(z) =  

 ˜ A(z) = 

0

1

λ(λ + 1)(z − 1) 1+z

1−z 1+z

0

1

λ(λ + 1)(z + 1) z−1

1+z 1−z



 , 

 ,

Vemos ent˜ao que os pontos z0 = ±1 s˜ao pontos singulares simples da equa¸ca˜o de Legendre. Ponto no infinito. A vers˜ao no infinito da equa¸ca˜o de Legendre ´e     1 λ(1 + λ) 2w 0 00 u (w) + 2 u(w) = 0. u (w) + w2 − 1 w w2 − 1

Claramente, z0 = ∞ ´e um ponto singular simples da equa¸ca˜o de Legendre. 5. A equa¸ c˜ ao de Hermite y 00 (z) − 2z y 0 (z) + λ y(z) = 0, onde λ ∈ 

, corresponde a A(z) =



 0 1 . −λ 2z

Conclu´ımos que a equa¸ca˜o de Hermite ´e anal´ıtica em todo o plano complexo, assim sendo tamb´em as suas solu¸co˜es. Ponto no infinito. A vers˜ao no infinito da equa¸ca˜o de Hermite ´e   2 λ 2 00 u (w) + + 3 u0 (w) + 4 u(w) = 0. w w w Claramente, c0 tem um p´olo de ordem 4 em w = 0 e c1 tem um p´olo de ordem 3 em w = 0. Assim, z0 = ∞ ´e um ponto singular irregular da equa¸ca˜o de Hermite. 6. A equa¸ c˜ ao de Airy y 00 (z) − z y(z) = 0. corresponde a A(z) =



 0 1 . z 0

Conclu´ımos que a equa¸ca˜o de Airy ´e anal´ıtica em todo o plano complexo, assim sendo tamb´em as suas solu¸co˜es.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

367/1304

Ponto no infinito. A vers˜ao no infinito da equa¸ca˜o de Airy ´e u00 (w) +

1 2 0 u (w) − 5 u(w) = 0. w w

Claramente, c0 tem um p´olo de ordem 5 em w = 0. Assim, z0 = ∞ ´e um ponto singular irregular da equa¸ca˜o de Airy. 7. A equa¸ c˜ ao de Laguerre zy 00 (z) + (1 − z) y 0 (z) + λ y(z) = 0, ou seja, 00

y (z) + onde λ ∈

, corresponde a 



1 −1 z





 A(z) = 

Para z0 = 0 teremos

y 0 (z) +

λ y(z) = 0, z

0

1

λ z





˜ A(z) = 

1− 0

1

−λz

z

1 z



 .



.

Assim, z0 = 0 ´e um ponto singular simples da equa¸ca˜o de Laguerre. Ponto no infinito. A vers˜ao no infinito da equa¸ca˜o de Laguerre ´e   1 1 λ 00 u (w) + + 2 u0 (w) + 3 u(w) = 0. w w w Claramente, c0 tem um p´olo de ordem 3 em w = 0 e c1 tem um p´olo de ordem 2 em w = 0. Assim, z0 = ∞ ´e um ponto singular irregular da equa¸ca˜o de Laguerre. 8. A equa¸ c˜ ao de Chebyshev (1 − z 2 ) y 00 (z) − z y 0 (z) + λ2 y(z) = 0, ou seja, y 00 (z) − onde λ ∈ 

, corresponde a

z λ2 0 y (z) + y(z) = 0, 1 − z2 1 − z2 

 A(z) = 

0 −

λ 1 − z2

1 z 1 − z2



 .

Claramente percebe-se que a equa¸ca˜o de Chebyshev ´e anal´ıtica no dom´ınio simplesmente conexo D formado pelo disco aberto de raio 1: D = {z ∈ : |z| < 1}. Conclu´ımos que as solu¸co˜es da equa¸ca˜o de Chebyshev s˜ao anal´ıticas nesse dom´ınio D.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

368/1304

Os pontos z0 = ±1 s˜ao pontos singulares da equa¸ca˜o de Chebyshev. Para z0 = 1 teremos



 ˜ A(z) = 

que ´e anal´ıtica em z0 = 1. Para z0 = −1 teremos



 ˜ A(z) = 

que ´e anal´ıtica em z0 = −1.

0

1

λ(z − 1) 1+z

1 1+z

0

1

λ(z + 1) z−1

1 1−z



 , 

 ,

Vemos ent˜ao que os pontos z0 = ±1 s˜ao pontos singulares simples da equa¸ca˜o de Chebyshev. Ponto no infinito. A vers˜ao no infinito da equa¸ca˜o de Chebyshev ´e     1 λ2 1 1 00 0 u (w) + 2− u(w) = 0. u (w) + 2 w 1 − w2 w w2 − 1

Claramente, z0 = ∞ ´e um ponto singular simples da equa¸ca˜o de Chebyshev. 9. A equa¸ c˜ ao hipergeom´ etrica z(1 − z) y 00 (z) + [c − (1 + a + b)z] y 0 (z) − ab y(z) = 0, ou seja, 00

y (z) +



c − (1 + a + b)z z(1 − z)

com a, b, c constantes, corresponde a   A(z) =  

0 ab z(1 − z)



y 0 (z) −

ab y(z) = 0, z(1 − z) 1



 . (1 + a + b)z − c  z(1 − z)

Seus pontos singulares s˜ao z0 = 0 e z0 = 1. Para z0 = 0 teremos

que ´e anal´ıtica em z0 = 0.



 ˜ A(z) = 

0

1

abz 1−z

(a + b)z − c + 1 1−z



 ,

JCABarata. Curso de F´ısica-Matem´ atica

Para z0 = 1 teremos

que ´e anal´ıtica em z0 = 1.



 ˜ A(z) = 

Vers˜ ao de 29 de setembro de 2005.

0 −

1

ab(z − 1) z

−(a + b)z + c z

Cap´ıtulo 7

369/1304



 ,

Assim, z0 = 0 e z0 = 1 s˜ao pontos singulares simples da equa¸ca˜o hipergeom´etrica. Ponto no infinito. A vers˜ao no infinito da equa¸ca˜o hipergeom´etrica ´e   1 (2 − c)w + a + b − 1 ab 00 u (w) + u0 (w) − 2 u(w) = 0. w w−1 w (w − 1) Claramente, z0 = ∞ ´e um ponto singular simples da equa¸ca˜o hipergeom´etrica. 10. A equa¸ c˜ ao hipergeom´ etrica confluente z y 00 (z) + [c − z] y 0 (z) − a y(z) = 0, ou seja, 00

y (z) + com a, c constantes, corresponde a

c z



− 1 y 0 (z) − 

0

 A(z) =  a z Para z0 = 0 teremos



˜ A(z) = 

a y(z) = 0, z 1



 c. 1− z

0

1

az

z−c+1



,

que ´e anal´ıtica em z0 = 0. Assim, z0 = 0 ´e um ponto singular simples da equa¸ca˜o de hipergeom´etrica confluente. Ponto no infinito. A vers˜ao no infinito da equa¸ca˜o hipergeom´etrica confluente ´e   1 a 2−c 00 + 2 u0 (w) − 3 u(w) = 0. u (w) + w w w Claramente, c0 tem um p´olo de ordem 3 em w = 0 e c1 tem um p´olo de ordem 2 em w = 0. Assim, z0 = ∞ ´e um ponto singular irregular da equa¸ca˜o hipergeom´etrica confluente.

JCABarata. Curso de F´ısica-Matem´ atica

7.8

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

370/1304

Equa¸ co ˜es Fuchsianas. S´ımbolos de Riemann

Nesta se¸ca˜o apresentaremos propriedades das chamadas equa¸co ˜es Fuchsianas (definidas abaixo), mas nos restringiremos a`s equa¸co˜es de primeira e de segunda ordem por serem de maior interesse (especialmente as de segunda ordem). Para um tratamento mais abrangente, vide [64]. O estudo das equa¸co˜es Fuchsianas despertou grande interesse na Matem´atica da segunda metade do S´eculo XIX e do in´ıcio do S´eculo XX, tendo alimentado muitos desenvolvimentos na teoria das fun¸co˜es de vari´aveis complexas. Esta se¸ca˜o ´e dispens´avel para o estudo do material que segue nos cap´ıtulos seguintes, mas pode servir, em uma segunda leitura, para esclarecer a relevˆancia das equa¸co˜es hipergeom´etricas no contexto das equa¸co˜es diferenciais lineares de segunda ordem no plano complexo. • Equa¸ co ˜es Fuchsianas Uma equa¸ca˜o diferencial linear de ordem n ´e dita ser uma equa¸ca ˜o Fuchsiana 14 se possuir um n´ umero finito de pontos singulares, todos simples (incluindo eventualmente, mas n˜ao necessariamente, um ponto singular simples no infinito). A equa¸ca˜o Euler, a equa¸ca˜o de Legendre e a equa¸ca˜o hipergeom´etrica s˜ao exemplos de equa¸co˜es Fuchsianas (vide Se¸ca˜o 7.7.3, acima). Equa¸co˜es com tal propriedade podem ser resolvidas em todo o plano complexo pelo m´etodo de Frobenius, atrav´es de expans˜oes em torno dos pontos singulares simples. Al´em disso, equa¸co˜es Fuchsianas possuem algumas de propriedades de transforma¸ca˜o que facilitam seu estudo. Por exemplo, toda equa¸ca˜o Fuchsiana de segunda ordem com exatamente trˆes pontos singulares pode ser transformada em uma equa¸ca˜o hipergeom´etrica. Equa¸co˜es Fuchsianas podem ser classificadas de forma mais ou menos sistem´atica de acordo com o n´ umero de singularidades e ´e nosso prop´osito fazer essa classifica¸ca˜o de modo a obter a forma geral de equa¸co˜es Fuchsianas de primeira e de segunda ordem com uma, duas ou trˆes singularidades (que, no caso de equa¸co˜es de segunda ordem, correspondem a` maioria das equa¸co˜es encontradas em aplica¸co˜es).

7.8.1

Equa¸ co ˜es Fuchsianas de Primeira Ordem

Como pr´e-aquecimento consideremos as equa¸co˜es de primeira ordem. Seja a equa¸ca˜o diferencial y 0 (z) + a0 (z) y(z) = 0

(7.78)

u0 (w) + b0 (w)u(w) = 0 ,

(7.79)

e sua vers˜ao no infinito onde w = 1/z, u(w) = y(z) = y(1/w) e b0 (w) := −

a0 (1/w) . w2

No que segue vamos procurar a forma geral de uma tal equa¸ca˜o que possua um certo n´ umero de singularidades, todas simples, ou seja, de modo que a equa¸ca˜o seja Fuchsiana. Come¸camos nos perguntando se h´a equa¸co˜es sem quaisquer pontos singulares, nem no infinito. 14

Lazarus Immanuel Fuchs (1833-1902).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

371/1304

• Equa¸ co ˜es sem pontos singulares Se (7.78) n˜ao possui pontos singulares finitos, ent˜ao a0 (z) ´e uma fun¸ca˜o inteira de z (ou seja, ´e ∞ X (n) anal´ıtica em toda parte) e, portanto, possui uma s´erie de Taylor centrada em 0: a 0 (z) = α0 z n , n=0

convergente para todo z ∈ . Com isso vemos que b0 (w) = −

∞ X

(n)

α0

n=0

1

(7.80)

w n+2

que convege para todo w ∈ , w 6= 0. Para que (7.78) tamb´em n˜ao possua uma singularidade no (n) infinito, ´e necess´ario e suficiente que b0 seja anal´ıtica em 0. Isso s´o ´e poss´ıvel se α0 = 0 para todo n, ou seja, se a0 for identicamente nula. Assim, a equa¸ca˜o y 0 (z) = 0, cuja vers˜ao no infinito ´e u0 (w) = 0, ´e a u ´ nica equa¸ca˜o diferencial de primeira ordem sem qualquer singularidade. Como veremos na Se¸ca˜o 7.8.2, n˜ao h´a equa¸co˜es de segunda ordem com essa caracter´ıstica. • Equa¸ co ˜es com apenas um ponto singular simples no infinito De (7.80) vemos tamb´em que n˜ao existem equa¸co˜es de primeira ordem que sejam regulares em toda parte mas possuam uma singularidade simples no infinito. De fato, vemos por (7.80) que b0 tem um p´olo de ordem maior ou igual a dois em w = 0 e n˜ao de primeira ordem, como seria necess´ario para que a singularidade no infinito fosse simples. • Equa¸ co ˜es Fuchsianas de primeira ordem. Caso geral Consideremos agora o caso geral em que (7.78) ´e Fuchsiana e seus pontos singulares finitos s˜ao um subconjunto de {z1 , . . . , zk } formado por k ≥ 1 pontos distintos. Isso significa que a0 (z) tem no m´aximo um polo de ordem 1 nos pontos z1 , . . . zk com k ≥ 1, sendo portanto da forma a0 (z) =

c0 (z) , (z − z1 ) · · · (z − zk )

onde c0 ´e uma fun¸ca˜o inteira de z (para que um certo za seja de fato singular simples ´e necess´ario que c0 n˜ao tenha um zero em za ). Obtemos disso que w k−2 c0 (1/w) b0 (w) = − (1 − wz1 ) · · · (1 − wzk ) Como fun¸ca˜o inteira, c0 possui uma expans˜ao de Taylor centrada em 0: c0 (z) =

(n)

γ0 z n , a qual

n=0

converge para todo z ∈ . Assim, obtemos

b0 (w) = −

∞ X

∞ X n=0

(n)

γ0

1 w n−k+2

(1 − wz1 ) · · · (1 − wzk )

.

(7.81)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

372/1304

Para que o ponto no infinito seja regular ´e necess´ario e suficiente que b0 (w) seja anal´ıtica em w = 0. (n) 1 Pelo fato de (1−wz1 )···(1−wz ser anal´ıtica em w = 0, isso requer que γ0 = 0 para todo n > k − 2. Para k) k = 1 isso requer que a0 e b0 sejam identicamente nulas, n˜ao havendo, ent˜ao, qualquer singularidade. Para k ≥ 2 isso requer que a0 (z) e b0 (w) sejam da forma k−2 X n=0

a0 (z) = e

b0 (w) = −

k−2 X n=0

(z − z1 ) · · · (z − zk ) k−2 X

1

(n)

γ0

(n)

γ0 z n

w n−k+2

n→k−2−n

=

(1 − wz1 ) · · · (1 − wzk )



(k−2−n)

γ0

wn

n=0

(1 − wz1 ) · · · (1 − wzk )

.

Retornando a (7.81), para que o ponto no infinito seja singular simples ´e necess´ario que b 0 (w) tenha (n) um p´olo simples em w = 0. Uma condi¸ca˜o necess´aria e suficiente para tal ´e que γ 0 = 0 para todo (k−1) n > k − 1 com γ0 6= 0. Nesse caso a0 e b0 s˜ao da forma k−1 X n=0

a0 (z) = e

b0 (w) = − ou seja

k−1 X n=0

(n) γ0

(n)

γ0 z n

(z − z1 ) · · · (z − zk )

1 w n−k+2

n→k−1−n

=

(1 − wz1 ) · · · (1 − wzk ) (k−1)

b0 (w) = −

γ0 w

+

k−1 X



k−1 X

(k−1−n)

γ0

w n−1

n=0

(1 − wz1 ) · · · (1 − wzk )

(k−1−n)

γ0

,

w n−1

n=1

(1 − wz1 ) · · · (1 − wzk )

.

• Analisando alguns casos expl´ıcitos Analisemos o que ocorre concretamente para k = 1 e k = 2. (n)

1. Caso k = 1. Nessa situa¸ca˜o a equa¸ca˜o ser´a anal´ıtica no infinito apenas se γ 0 = 0 para todo n > −1, ou seja, se c0 for identicamente nula. Assim, a0 e b0 s˜ao tamb´em identicamente nulas e as equa¸co˜es reduzem-se a y 0 (z) = 0 e u0 (w) = 0 e n˜ao h´a quaisquer singularidades. Para que (7.78) tenha uma singularidade simples no infinito e outra singularidade simples em z1 devemos ter (0) (0) γ0 γ0 a0 (z) = e b0 (w) = − . (z − z1 ) w(1 − wz1 )

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

373/1304

Assim, a u ´ nica equa¸ca˜o Fuchsiana com uma singularidade simples em z1 e uma singularidade simples no infinito ´e da forma (0)

(0)

γ0 y(z) = 0 , y (z) + (z − z1 ) 0

cuja vers˜ao no infinito ´e

γ0 u (w) − u(w) = 0 . (7.82) w(1 − wz1 ) 0

(n)

2. Caso k = 2. Para que a equa¸ca˜o seja regular no infinito devemos ter γ0 Assim, nesse caso a0 e b0 ser˜ao da forma (0)

= 0 para todo n > 0.

(0)

γ0 a0 (z) = (z − z1 )(z − z2 )

γ0 b0 (w) = − . (1 − wz1 )(1 − wz2 )

e

Assim, a forma geral de uma equa¸ca˜o de primeira ordem regular no infinito e com exatamente dois pontos singulares simples em z1 e z2 ´e (0)

(0)

γ0 γ0 y (z)+ y(z) = 0 , cuja vers˜ao no infinito ´e u0 (w)− u(w) = 0. (z − z1 )(z − z2 ) (1 − wz1 )(1 − wz2 ) 0

Para que a equa¸ca˜o tenha um ponto singular simples no infinito devemos ter (1)

a0 (z) =

(0) γ0

γ0 w b0 (w) = − . (1 − wz1 )(1 − wz2 ) (0)

(1) γ0 z

+ (z − z1 )(z − z2 )

γ0 +

e

Conclu´ımos que a forma geral de uma equa¸ca˜o Fuchsiana com um ponto singular simples no infinito e no m´aximo dois pontos singulares simples em z1 e z2 ∈ ´e (0)

(1)

(1)

(0)

γ0 + γ 0 z y (z) + y(z) = 0 , (z − z1 )(z − z2 ) 0

cuja vers˜ao no infinito ´e γ0 + γ 0 w u(w) = 0 . u (w) − w(1 − wz1 )(1 − wz2 ) 0

(0)

(1)

Caso γ0 = −γ0 z2 essas equa¸co˜es ficam (1)

y 0 (z) +

γ0 y(z) = 0 , (z − z1 )

(1)

e

u0 (w) −

γ0 u(w) = 0 w(1 − wz1 )

e agora z2 n˜ao ´e mais uma singularidade da equa¸ca˜o diferencial. Essas equa¸co˜es tem a mesma forma de (7.82), o que n˜ao ´e de surpreender pois aqui temos apenas singularidades simples em z 1 e no infinito. * Para futura referˆencia resumamos os resultados obtidos at´e o momento na forma de uma proposi¸ca˜o.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

374/1304

Proposi¸ c˜ ao 7.4 Para a equa¸ca ˜o diferencial linear de primeira ordem no plano complexo y 0 (z) + a0 (z)y(z) = 0

(7.83)

valem as seguintes afirma¸co ˜es: I. Para que (7.83) n˜ ao tenha qualquer singularidade finita ou no infinito ´e necess´ ario e suficiente 0 0 que seja da forma y (z) = 0, cuja vers˜ ao no infinito ´e u (w) = 0. II. N˜ ao h´ a equa¸co ˜es Fuchsianas de primeira ordem como (7.83) que tenham apenas uma singularidade simples, finita ou no infinito. III. Para que (7.83) seja Fuchsiana tendo uma singularidade simples em z 1 e outra no infinito ´e necess´ ario e suficiente que seja da forma (0)

(0)

y 0 (z) +

γ0 y(z) = 0 , (z − z1 )

cuja vers˜ ao no infinito ´e

u0 (w) −

γ0 u(w) = 0 w(1 − wz1 )

(0)

com γ0 6= 0. IV. Para que (7.83) seja Fuchsiana, tendo o infinito como ponto regular e no m´ aximo k singularidades simples nos pontos z1 , . . . , zk com k ≥ 2, ´e necess´ ario e suficiente que seja da forma 

k−2 X

(n)



γ0 z n     n=0 0   y(z) = 0 , y (z) +   (z − z ) · · · (z − z ) 1 k  

cuja vers˜ ao no infinito ´e



k−2 X

(k−2−n) n γ0 w



    n=0  u (w) −   (1 − wz1 ) · · · (1 − wzk )  u(w) = 0 .   0

V. Para que (7.83) seja Fuchsiana, tendo o infinito como ponto singular simples e no m´ aximo k singularidades simples nos pontos z1 , . . . , zk com k ≥ 2, ´e necess´ ario e suficiente que seja da forma   k−1 X (n) γ0 z n     n=0 0  y(z) = 0 ,  y (z) +   (z − z ) · · · (z − z ) 1 k  

JCABarata. Curso de F´ısica-Matem´ atica

(k−1)

com γ0

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

375/1304

6= 0, cuja vers˜ ao no infinito ´e 

 k−1 (k−1) X γ0 (k−1−n) n−1 γ0 w   w +   n=1  u0 (w) −   (1 − wz1 ) · · · (1 − wzk )  u(w) = 0 .   2

7.8.2

Equa¸ co ˜es Fuchsianas de Segunda Ordem

Muito mais relevante que as equa¸co˜es Fuchsianas de primeira ordem s˜ao as equa¸co˜es Fuchsianas de segunda ordem, as quais estudaremos agora. Consideremos a equa¸ca˜o diferencial linear de segunda ordem y 00 (z) + a1 (z) y 0 (z) + a0 (z) y(z) = 0 (7.84) e sua vers˜ao no infinito u00 (w) + b1 (w)u0 (w) + b0 (w)u(w) = 0 (vide (7.76) e (7.77)), onde w = 1/z, u(w) = y(z) = y(1/w) e   a0 (1/w) 2 a1 (1/w) b0 (w) := . , b1 (w) := − w4 w w2

(7.85)

(7.86)

No que segue vamos procurar a forma geral de uma tal equa¸ca˜o que possua um certo n´ umero de singularidades, todas simples, ou seja, de modo que a equa¸ca˜o seja Fuchsiana. Come¸camos nos perguntando se h´a equa¸co˜es sem quaisquer pontos singulares, nem no infinito. • Equa¸ co ˜es sem pontos singulares Se (7.84) n˜ao possuir pontos singulares finitos, ent˜ao as fun¸co˜es a0 e a1 devem ser fun¸co˜es inteiras (anal´ıticas em todo ) e, portanto, possuem s´eries de Taylor centradas em 0 a0 (z) =

∞ X

(n) α0 z n

,

a1 (z) =

n=0

∞ X

(n)

α1 z n

n=0

convergentes para todo z ∈ . Com isso, vemos que b0 (w) =

∞ X n=0

(n) α0

1 w n+4

,



2 X (n) 1 b1 (w) = − α , w n=0 1 w n+2

onde as s´eries convergem para todo w ∈ , w 6= 0. Trata-se claramente de s´eries de Laurent centradas em w = 0 para b0 e b1 . Para que (7.84) tamb´em n˜ao possua uma singularidade no infinito, seria (n) necess´ario que b0 e b1 fossem anal´ıticas em 0. Para b0 isso s´o seria poss´ıvel se α0 = 0 para todo n mas

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

para b1 n˜ao h´a como alcan¸car essa condi¸ca˜o devido ao termo (n) pode ser anulado por qualquer escolha dos coeficientes α1 .

2 w

376/1304

de sua expans˜ao de Laurent, o qual n˜ao

Conclu´ımos disso que n˜ao existem equa¸co˜es diferenciais lineares de segunda ordem sem quaisquer pontos singulares finitos ou no infinito. • Equa¸ co ˜es com apenas um ponto singular simples no infinito Se (7.84) n˜ao tiver pontos singulares finitos, vimos que possuir´a um ponto singular no infinito. Sob quais circunstˆancias esse ponto no infinito ´e singular simples? Para tal ´e necess´ario que b 0 (w) tenha em w = 0 um polo de ordem no m´aximo 2 e b1 (w) tenha em w = 0 um polo de ordem no m´aximo 1. (n) (n) Assim, conclu´ımos que devemos ter α0 = α1 = 0 para todo n. Em um tal caso as fun¸co˜es a0 , a1 e b0 s˜ao identicamente nulas, enquanto que b1 (w) = 2/w. Conclu´ımos que a u ´ nica equa¸ca˜o diferencial de segunda ordem com apenas um ponto singular simples no infinito ´e a equa¸ca˜o y 00 (z) = 0 ,

u00 (w) +

cuja vers˜ao no infinito ´e

2 0 u (w) = 0 . w

(7.87)

• Equa¸ co ˜es com apenas um ponto singular simples finito em z = 0 Procuremos agora saber a forma geral de uma equa¸ca˜o diferencial com apenas um ponto singular finito em z = 0 e regular no infinito. Em tal caso, a0 (z) tem no m´aximo um polo duplo em z = 0 e a1 tem no m´aximo um polo simples z = 0, esse sendo se u ´ nico ponto singular. Assim, a0 (z) e a1 (z) tem as representa¸co˜es de Laurent (−2)

a0 (z) =

(−1)

α0 α0 + z2 z

+

∞ X

(−1)

(n)

α0 z n ,

a1 (z) =

n=0

α1 z

+

∞ X

(n)

α1 z n

n=0

as quais convergem para todo z ∈ , z 6= 0. Com isso, temos ∞

X (n) 1 α0 α0 + + α0 , n+4 w2 w3 w n=0 (−2)

b0 (w) =

(−1)

(−1)

b1 (w) =

2 − α1 w



∞ X

(n)

α1

n=0

1 w n+2

.

Para que o ponto no infinito seja regular ´e necess´ario que b0 (w) e b1 (w) sejam anal´ıticas em w = 0. (n) Como se constata das expans˜oes de Laurent dadas acima dessas fun¸co˜es, isso requer que α 0 = 0 para (n) (−1) todo n ≥ −2, α1 para todo n ≥ 0 e α1 = 2. Nesse caso as fun¸co˜es b0 e b1 s˜ao identicamente nulas, assim como a fun¸ca˜o a0 , sendo que a1 (z) = 2/z. Conclu´ımos que a u ´ nica equa¸ca˜o diferencial que possui um u ´ nico ponto singular simples finito em z = 0 e tem o infinito como ponto regular ´e a equa¸ca˜o 2 y 00 (z) + y 0 (z) = 0 , z

cuja vers˜ao no infinito ´e

u00 (w) = 0 .

Essa equa¸ca˜o ser´a generalizada em (7.92) para uma singularidade que n˜ao seja no ponto z = 0. • Equa¸ co ˜es Fuchsianas de segunda ordem. Caso geral

(7.88)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

377/1304

Consideremos agora o caso geral em que (7.84) ´e Fuchsiana e seus pontos singulares finitos s˜ao um subconjunto de {z1 , . . . , zk } formado por k ≥ 1 pontos distintos. Isso significa que a0 (z) tem no m´aximo um polo de ordem 2 e a1 (z) no m´aximo um polo de ordem 1 nos pontos z1 , . . . zk com k ≥ 1. Assim, ambas s˜ao da forma c0 (z) (z − z1 · · · (z − zk )2

a0 (z) =

e

)2

a1 (z) =

c1 (z) , (z − z1 ) · · · (z − zk )

onde c0 e c1 s˜ao fun¸co˜es inteiras de z (para que um certo za seja de fato singular simples ´e necess´ario que c0 n˜ao tenha um zero de ordem 2 em za e c1 n˜ao tenha um zero de ordem 1 em za ). Obtemos disso que 2 w k−2 c1 (1/w) w 2k−4 c0 (1/w) e b (w) = − . b0 (w) = 1 (1 − wz1 )2 · · · (1 − wzk )2 w (1 − wz1 ) · · · (1 − wzk )

Como fun¸co˜es inteiras, c0 e c1 possuem expans˜oes de Taylor centradas em 0 ∞ X

c0 (z) =

(n) γ0 z n

e

c1 (z) =

n=0

as quais convergem para todo z ∈

b0 (w) =

∞ X

(n) γ0

n=0

∞ X

(n)

γ1 z n

n=0

e, portanto, ∞ X

1 w n+4−2k

)2

(1 − wz1 · · · (1 − wzk

)2

e

b1 (w) =

1

(n)

γ1

w n+2−k

2 n=0 − . w (1 − wz1 ) · · · (1 − wzk )

Perguntemo-nos agora sob quais circunstˆancias o infinito ´e tamb´em no m´aximo um ponto singular simples da equa¸ca˜o. Para tal, b0 deve ter no m´aximo um polo de ordem 2 e b1 no m´aximo um polo de 1 1 ordem 1 em w = 0. Como as fun¸co˜es (1−wz1 )2 ···(1−wz ao anal´ıticas em w = 0 e n˜ao 2 e (1−wz )···(1−wz ) s˜ 1 k) k se anulam nesse ponto, conclu´ımos que a condi¸ca˜o procurada exige que w 2k−4 c0 (1/w) tenha no m´aximo um polo de ordem 2 em w = 0 e w k−2 c1 (1/w) tenha no m´aximo um polo de ordem 1 em w = 0. Agora, w

2k−4

c0 (1/w) =

∞ X

(n) γ0

n=0

(n)

donde conclu´ımos que γ0

1 w n+4−2k

e

w

k−2

(n)

2k−2 X

(n)

γ0 z n

e

1

(n)

γ1

n=0

= 0 para todo n > 2k − 2 e γ1

c0 (z) =

c1 (1/w) =

∞ X

w n+2−k

,

= 0 para todo n > k − 1. Assim,

c1 (z) =

n=0

k−1 X

(n)

γ1 z n ,

n=0

que s˜ao polinˆomios de grau menor ou igual a 2k − 2 e k − 1, respectivamente. Para a vers˜ao no infinito da equa¸ca˜o diferencial teremos nesse caso

b0 (w) =

2k−2 X n=0

(n)

γ0

1 w n+4−2k

(1 − wz1 )2 · · · (1 − wzk )2

n→2k−2−n

=

2k−2 X

(2k−2−n)

γ0

w n−2

n=0

(1 − wz1 )2 · · · (1 − wzk )2

(7.89)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

378/1304

e

b1 (w)

k−1 X

1

(n)

γ1

w n+2−k

2 n=0 − w (1 − wz1 ) · · · (1 − wzk )

=

2(1 − wz1 ) · · · (1 − wzk ) −

=

k−1 X

γ1

k−1 X

γ1

1

(n)

n=0

w n+1−k

w(1 − wz1 ) · · · (1 − wzk ) 2(1 − wz1 ) · · · (1 − wzk ) −

n→k−1−n

=

(k−1−n)

n=0

wn .

w(1 − wz1 ) · · · (1 − wzk )

(7.90)

Das express˜oes (7.89) e (7.90) podemos identificar as condi¸co˜es para que b 0 (w) e b1 (w) sejam regu1 lares em w = 0, ou seja, para que o infinito seja um ponto regular de (7.96): como (1−wz1 )2 ···(1−wz 2 k) 1 e (1−wz1 )···(1−wzk ) s˜ao anal´ıticas em w = 0 e n˜ao se anulam nesse ponto, para que b0 (w) e b1 (w) se2k−2 X (2k−2−n) jam regulares em w = 0 ´e necess´ario e suficiente que γ0 w n−2 seja anal´ıtica em w = 0 e n=0

2(1 − wz1 ) · · · (1 − wzk ) −

k−1 X

(k−1−n)

γ1

w n seja anal´ıtica em w = 0 (o que sempre ´e o caso) e tenha um

n=0

zero de ordem pelo menos 1 nesse ponto (observar o fator w no denominador de (7.90)). (2k−3)

(2k−2)

Para a primeira condi¸ca˜o ´e necess´ario e suficiente que γ0 = γ0 = 0 (se k = 1, ´e necess´ario (0) (k−1) e suficiente que γ0 = 0). Para a segunda condi¸ca˜o, ´e necess´ario e suficiente que γ1 = 2. • Analisando alguns casos expl´ıcitos Vamos analizar explicitamente os casos k = 1, k = 2 e k = 3. 1. Caso k = 1. Nesse caso, para que (7.84) seja Fuchsiana com no m´aximo um ponto singular simples no infinito e em z1 , temos que c0 e c1 devem ser polinˆomios e grau zero (ou seja, constantes) e (7.84) ´e da forma ! ! (0) (0) γ γ 1 0 y 0 (z) + y(z) = 0 , (7.91) y 00 (z) + z − z1 (z − z1 )2 cuja vers˜ao no infinito ´e (0)

u00 (w) +

2 − γ1 − 2wz1 w(1 − wz1 )

!

(0)

u0 (w) +

γ0 2 w (1 − wz1 )2

!

u(w) = 0 . (0)

(0)

O ponto z1 ´e um ponto singular simples (exceto no caso trivial em que γ1 = γ0 = 0, quando z1 ´e um ponto regular). Note que (7.91) ´e uma equa¸ca˜o de Euler.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

(0)

379/1304

(0)

Para que o infinito seja regular ´e necess´ario e suficiente que γ0 = 0 e γ1 = 2. Compare com a discuss˜ao sobre a equa¸ca˜o de Euler a` p´agina 364. Conclu´ımos que a equa¸ca˜o de Euler     2z1 2 0 00 00 y (z) = 0 , cuja vers˜ao no infinito ´e u (w) − u0 (w) = 0 , y (z) + z − z1 1 − wz1 (7.92) ´e a u ´ nica equa¸ca˜o Fuchsiana com um u ´ nico ponto singular, a saber z1 . Essa express˜ao generaliza (7.88) e a ela se reduz para z1 = 0. Como vimos em (7.87), a equa¸ca˜o y 00 (z) = 0 ´e a u ´ nica equa¸ca˜o Fuchsiana com um u ´ nico ponto singular no infinito. Note-se que a equa¸ca˜o y 00 (z) = 0 e sua vers˜ao no infinito u00 (w) + 22 u0 (w) = 0 (vide (7.87)) s˜ao obtidas formalmente de (7.92) tomando-se o limite |z1 | → ∞. Tal processo ´e por vezes denominado confluˆencia de singularidades e ser´a reencontrado quando tratarmos da rela¸ca˜o entre a equa¸ca˜o hipergeom´etrica e a equa¸ca˜o hipergeom´etrica confluente (vide discuss˜ao do come¸co da Se¸ca˜o 8.2.7, p´agina 447). (0)

(0)

A equa¸ca˜o de Euler (7.91) com γ0 6= 0 ou γ1 6= 2 ´e a u ´ nica equa¸ca˜o Fuchsiana com dois pontos singulares simples, um em z1 e o segundo no infinito. Logo abaixo veremos a forma geral das equa¸co˜es Fuchsianas com com dois pontos singulares simples finitos. 2. Caso k = 2. Nesse caso, para que (7.84) seja Fuchsiana com no m´aximo pontos singulares simples em z1 , z2 e no infinito, c0 e c1 devem ser polinˆomios de grau menor ou igual a 2 e 1, respectivamente e (7.84) deve ser da forma ! ! (0) (1) (2) 2 (0) (1) γ + γ z + γ z γ + γ z 0 0 0 1 1 y 0 (z) + y 00 (z) + y(z) = 0 . (7.93) (z − z1 )(z − z2 ) (z − z1 )2 (z − z2 )2 Os pontos z1 e z2 ser˜ao pontos singulares simples desde que os dois polinˆomios dos numeradores dos coeficientes n˜ao tenham zeros de ordem 1 ou 2, respectivamente, nesses pontos. Por exemplo, (0) (1) (0) (1) (2) se γ1 + γ1 z = α(z − z2 ) e γ0 + γ0 z + γ0 z 2 = β(z − z2 )2 a equa¸ca˜o torna-se     β α 0 00 y (z) + y(z) = 0 , y (z) + (z − z1 ) (z − z1 )2

que tem a mesma forma da equa¸ca˜o de Euler (7.91), a qual, como vimos, ´e a u ´ nica equa¸ca˜o Fuchsiana com um u ´ nico ponto singular finito, a saber z1 (e eventualmente um outro no infinito). (1)

Voltando a (7.93), para que o ponto no infinito seja regular ´e necess´ario e suficiente que γ 0 = (2) (1) γ0 = 0 e γ1 = 2. Assim, a forma geral da equa¸ca˜o Fuchsiana com no m´aximo dois pontos singulares simples finitos z1 e z2 e regular no infinito ´e ! ! (0) (0) γ0 γ1 + 2z 0 00 y (z) + y(z) = 0 . y (z) + (z − z1 )(z − z2 ) (z − z1 )2 (z − z2 )2 (0)

(0)

Se escolhermos γ1 = −2z2 e γ0 = 0 o ponto z2 deixa de ser singular e essa equa¸ca˜o reduz-se a (7.92). (1)

(2)

(1)

A equa¸ca˜o (7.93) com γ0 6= 0 ou γ0 6= 0 ou γ1 6= 2 ´e a u ´ nica equa¸ca˜o Fuchsiana com um ponto singular simples no infinito e com no m´aximo dois pontos singulares simples finitos, em z1 e z2 . Mais adiante mostraremos que uma tal equa¸ca˜o sempre pode ser transformada em uma equa¸ca˜o hipergeom´etrica.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

380/1304

3. Caso k = 3. Nesse caso, para que (7.84) seja Fuchsiana com no m´aximo pontos singulares simples em z1 , z2 , z3 e no infinito, c0 e c1 devem ser polinˆomios de grau nenor ou igual a 4 e 2, respectivamente e (7.84) deve ser da forma   4 X (n) n ! γ0 z   (0) (1) (2) 2   γ + γ z + γ z n=0 1 1 1 00 0  y(z) = 0 . (7.94) y (z) + y (z) +   2 2 2 (z − z1 )(z − z2 )(z − z3 )  (z − z1 ) (z − z2 ) (z − z3 )  Os pontos z1 , z2 e z3 ser˜ao singulares simples se os dois polinˆomios dos numeradores dos coeficientes acima n˜ao possuirem neles zeros de ordem 1 ou 2, respectivamente. (3)

(4)

Para que o ponto no infinito seja regular ´e necess´ario e suficiente que γ0 = γ0 = 0 e que (2) γ1 = 2. Nesse caso, (7.94) assume a forma ! ! (0) (1) (2) 2 (0) (1) 2 γ + γ z + γ z γ + γ z + 2z 0 0 0 1 1 y 0 (z) + y(z) = 0 . (7.95) y 00 (z) + (z − z1 )(z − z2 )(z − z3 ) (z − z1 )2 (z − z2 )2 (z − z3 )2 Mais adiante mostraremos que, assim como a equa¸ca˜o (7.93), que tamb´em tem trˆes pontos singulares simples, esta equa¸ca˜o tamb´em pode ser transformada em uma equa¸ca˜o hipergeom´etrica. (3)

(4)

(2)

Se γ0 6= 0, γ0 6= 0 ou γ1 6= 2, o infinito ser´a um ponto regular simples de (7.94). A forma geral das equa¸co˜es Fuchsianas com trˆes pontos singulares simples (7.93) e (7.95) foi primeiramente estudada por Papperitz15 e especialmente por Riemann16 , o qual demonstrou diversos fatos relevantes sobre essas equa¸co˜es. Sobre esses desenvolvimentos falaremos mais adiante na Se¸ca˜o 7.8.3. * Para futura referˆencia capturamos os diversos resultados obtidos at´e agora na seguinte proposi¸ca˜o: Proposi¸ c˜ ao 7.5 Para a equa¸ca ˜o diferencial linear de segunda ordem no plano complexo y 00 (z) + a1 (z)y 0 (z) + a0 (z)y(z) = 0

(7.96)

valem as seguintes afirma¸co ˜es: I. A equa¸ca ˜o (7.96) sempre possui ao menos um ponto singular (eventualmente no infinito). II. Para que (7.96) seja Fuchsiana e tenha apenas uma singularidade simples no infinito ´e necess´ ario 2 0 00 00 e suficiente que seja da forma y (z) = 0, cuja vers˜ ao no infinito ´e u (w) + w u (w) = 0. III. Para que (7.96) seja Fuchsiana, tenha apenas uma singularidade simples em z 1 e seja regular no infinito ´e necess´ ario e suficiente que seja da forma   2 2 00 u0 (w) = 0 . y (z) + y 0 (z) = 0 , cuja vers˜ ao no infinito ´e u00 (w) − z − z1 w(1 − wz1 ) 15 16

Erwin Johannes Papperitz (1857-1938). Georg Friedrich Bernhard Riemann (1826-1866).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

381/1304

IV. Para que (7.96) seja Fuchsiana, tenha uma singularidade simples no infinito e tenha no m´ aximo singularidades simples nos pontos z1 , . . . , zk (com k ≥ 1) ´e necess´ ario e suficiente que a0 e a1 sejam da forma

a0 (z) = (2k−3)

2k−2 X

k−1 X

(n)

γ0 z n

n=0

e

(z − z1 )2 · · · (z − zk )2

n=0

a1 (z) =

(2k−2)

(n)

γ1 z n

(z − z1 ) · · · (z − zk )

(0)

(k−1)

onde ou γ0 6= 0 ou γ0 6= 0 (caso k = 1, basta γ0 6= 0) ou que γ1 infinito de (7.96) ´e nesse caso

6= 2. A vers˜ ao no

u00 (w) + b1 (w)u0 (w) + b0 (w)u(w) = 0 , com

2k−2 X

(2k−2−n)

γ0

w n−2

n=0

b0 (w) = e

2(1 − wz1 ) · · · (1 − wzk ) −

b1 (w) =

(7.97)

(1 − wz1 )2 · · · (1 − wzk )2 k−1 X

(k−1−n)

γ1

wn

n=0

.

w(1 − wz1 ) · · · (1 − wzk )

(7.98)

V. Para que (7.96) seja Fuchsiana e tenha no m´ aximo singularidades simples nos pontos z 1 , . . . , zk (2k−3) (2k−2) (com k ≥ 1), sendo regular no infinito, ´e necess´ ario e suficiente que γ 0 = γ0 = 0 (caso (0) (k−1) k = 1, que γ0 = 0) e que γ1 = 2, ou seja, ´e necess´ ario e suficiente que

a0 (z) =

(z −

2k−4 X

(n) γ0 z n

n=0 z1 )2 · · · (z

− zk

e

)2

a1 (z) =

k−2 X

(n)

γ1 z n + 2z k−1

n=0

(z − z1 ) · · · (z − zk )

em cujo caso temos para a vers˜ ao no infinito

b0 (w) = e

b1 (w) =

h

2k−2 X

(2k−2−n)

γ0

w n−2

n=2

(1 − wz1 )2 · · · (1 − wzk )2 i

2 (1 − wz1 ) · · · (1 − wzk ) − 1 −

k−1 X n=1

w(1 − wz1 ) · · · (1 − wzk )

(k−1−n)

γ1

wn . 2

JCABarata. Curso de F´ısica-Matem´ atica

7.8.3

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

382/1304

S´ımbolos de Riemann. Simetrias de Equa¸ co ˜es Fuchsianas de Segunda Ordem

Para continuarmos nossa discuss˜ao precisamos introduzir a importante no¸ca˜o de ´ındices de uma equa¸ca ˜o diferencial em um ponto do plano complexo. • ´Indices de uma equa¸ c˜ ao diferencial em um ponto Seja a equa¸ca˜o diferencial Fuchsiana (7.84) e seja ζ ∈ . Sejam definidos os n´ umeros complexos pζ := lim (z − ζ)2 a0 (z) z→ζ

e

qζ := lim (z − ζ)a1 (z) .

(7.99)

z→ζ

O polinˆomio de segundo grau Pζ (λ) := λ2 + (qζ − 1)λ + pζ ´e denominado polinˆ omio indicial da equa¸ca˜o diferencial Fuchsiana (7.84) em ζ e seus zeros p p 2 − 4p (q − 1) (qζ − 1)2 − 4pζ 1 − q − 1 − q + ζ ζ ζ ζ − , λ = λ+ = ζ ζ 2 2

(7.100)

s˜ao denominados ´ındices da equa¸ca˜o diferencial Fuchsiana (7.84) em ζ. A relevˆancia dessas no¸co˜es ´e a seguinte. Se ζ ´e um ponto singular simples da equa¸ca˜o diferencial Fuchsiana (7.84), ent˜ao, para |z −ζ| “pequeno” a mesma pode, pela defini¸ca˜o de p ζ e qζ , ser aproximada pela equa¸ca˜o pζ qζ 0 y (z) + y(z) = 0 y 00 (z) + z−ζ (z − ζ)2 +



− que ´e uma equa¸ca˜o de Euler, cuja solu¸ca˜o geral ´e da forma α(z − ζ)λζ + β(z − ζ)λζ caso λ+ ζ 6= λζ ou +

+

− ao constantes arbitr´arias. da forma α(z − ζ)λζ + β(z − ζ)λζ ln(z − ζ) caso λ+ ζ = λζ . Aqui α e β s˜

Por outro lado, se ζ ´e um ponto regular da equa¸ca˜o Fuchsiana, ent˜ao, pela defini¸ca˜o, p ζ = qζ = 0 − e teremos λ+ ca˜o, na regi˜ao onde |z − ζ| ´e “pequeno” pode ser aproximada pela ζ = 1, λζ = 0. A equa¸ +



equa¸ca˜o y 00 (z) = 0, cuja solu¸ca˜o geral ´e da forma α(z − ζ) + β, ou seja, da forma α(z − ζ) λζ + β(z − ζ)λζ , onde novamente α e β s˜ao constantes arbitr´arias. Aprendemos, assim, que os ´ındices fixam as solu¸co˜es da equa¸ca˜o diferencial Fuchsiana (7.84) em uma vizinhan¸ca pequena de um ponto ζ, quer esse ponto seja singular simples ou regular. Para o ponto no infinito podemos, analogamente, definir ´ındices. A vers˜ao no infinito de (7.84) ´e, como visto, dada por (7.85)-(7.86) Definimos, ent˜ao p∞ e q∞ por p∞ := lim w 2 b0 (w) w→0

e

q∞ := lim wb1 (w) w→0

(7.101)

ou seja (por (7.86)), p∞ := lim w −2 a0 (1/w) = lim z 2 a0 (z)

(7.102)

q∞ := 2 − lim w −1 a1 (1/w) = 2 − lim za1 (z) .

(7.103)

w→0

e w→0

|z|→∞

|z|→∞

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

383/1304

Com isso definimos o polinˆomio indicial P∞ (λ) := λ2 + (q∞ − 1)λ + p∞ , cujos zeros s˜ao p p 2 − 4p 1 − q − 1 − q + (q − 1) (q∞ − 1)2 − 4p∞ ∞ ∞ ∞ ∞ , λ− . λ+ ∞ = ∞ = 2 2

(7.104)

Estes s˜ao os ´ındices da equa¸ca˜o diferencial Fuchsiana (7.84) no infinito. • ´Indices e equa¸ co ˜es Fuchsianas Vimos p´aginas acima (vide, em especial, Proposi¸ca˜o 7.5, p´agina 380) que uma equa¸ca˜o diferencial linear de segunda ordem como (7.84) ter´a no m´aximo k singularidades simples17 nos pontos finitos z1 , . . . , zk , sendo regular no infinito, se e somente se a0 e a1 forem da forma

a0 (z) =

(z −

2k−4 X

(n) γ0 z n

n=0 z1 )2 · · · (z

− zk

e

)2

a1 (z) =

k−2 X

(n)

γ1 z n + 2z k−1

n=0

(z − z1 ) · · · (z − zk )

.

(7.105)

Para que a equa¸ca˜o seja singular simples no infinito e tenha no m´aximo k − 1 singularidades simples nos pontos finitos z1 , . . . , zk−1 ´e necess´ario e suficiente que

a0 (z) = (2k−5)

onde ou γ0

2k−4 X

(z − z1

(n) γ0 z n

n=0 )2 · · · (z

(2k−4)

6= 0 ou γ0

− zk−1

e

)2

(k−2)

6= 0 ou que γ1

a1 (z) =

k−2 X

(n)

γ1 z n

n=0

(z − z1 ) · · · (z − zk−1 )

,

(7.106)

6= 2.

Em ambos os casos h´a no m´aximo k singularidades, incluindo eventualmente uma no infinito. Chama a aten¸ca˜o o fato de que em ambos os casos a0 depende de 2k − 3 constantes livres (as constantes (n) (n) γ0 , n = 0, . . . , 2k − 4), enquanto que a1 depende de k − 1 constantes livres (as constantes γ1 , n = 0, . . . , k − 2). Assim, para no m´aximo k singularidades simples a equa¸ca˜o depende de 3k − 4 constantes livres. Uma quest˜ao importante, cuja relevˆancia ser´a discutida mais adiante, ´e saber sob quais circunstˆancias essas 3k − 4 constantes podem ser inteiramente determinadas pelos ´ındices das singularidades simples. Essa quest˜ao foi proposta a estudada originalmente por Riemann e, para respondˆe-la, precisamos contar quantos s˜ao os ´ındices independentes numa situa¸ca˜o de no m´aximo k singularidades simples. Como h´a dois ´ındices para cada singularidade, haveria em princ´ıpio um total de 2k ´ındices independentes mas, em verdade, h´a apenas 2k − 1. Isso se deve a fato expresso no seguinte lema. Lema 7.1 Se a equa¸ca ˜o Fuchsiana (7.84) possui no m´ aximo k singularidades simples em z 1 , . . . , zk (k ≥ 2), sendo regular no infinito, vale k X l=1

17

Assumiremos aqui que k ≥ 2.

− (λ+ zl + λ zl ) = k − 2

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

384/1304

Se a equa¸ca ˜o Fuchsiana (7.84) tem no m´ aximo k − 1 singularidades simples em z 1 , . . . , zk−1 (k ≥ 2), tendo tamb´em uma singuaridade simples no infinito, ent˜ ao tamb´em vale λ+ ∞

+

λ− ∞



+

k−1 X

− λ+ zl + λ zl

l=1



= k−2.

ao, pela defini¸ca ˜o (7.99), pzl = qzl = 0, o que implica que λ+ Se (7.84) ´e regular em zl ent˜ zl = 1 e − + − λzl = 0 e, portanto, que λzl + λzl = 1. Assim, se (7.84) possui exatamente j singularidades simples (incluindo eventualmente uma no infinito), ent˜ ao a soma de todos o ´ındices desses pontos singulares ´e igual a j − 2 2 Prova. H´a dois casos a considerar: 1o os k pontos singulares simples s˜ao finitos z1 , . . . , zk ; 2o o infinito ´e um ponto singular simples e h´a k − 1 pontos singulares simples finitos z1 , . . . , zk−1 . − 1o caso. Por (7.100), λ+ zl + λzl = 1 − qzl e, portanto,

k X

− (λ+ zl + λ zl ) = k −

k X

qzl . Pela defini¸ca˜o em

l=1 l=1 P (7.99), qzl ´e o res´ıduo da fun¸ca˜o a1 em zl e, portanto, kl=1 qzl ´e a soma de todos os res´ıduos de a1 em seus pontos singulares z1 , . . . , zk . Como esses s˜ao todos os pontos singulares de a1 , conclu´ımos pelo I k X 1 qzl = teorema dos res´ıduos que a1 (z)dz, onde C ´e uma curva fechada orientada no sentido 2πi C l=1 anti-hor´ario que contem todos os pontos z1 , . . . , zk na regi˜ao que delimita. Por simplicidade adotamos C como sendo um c´ırculo de raio R grande o suficiente. Por (7.105),

1 2πi

I

a1 (z) dz = C

k−2 X

(n) γ1

n=0

1 2πi

I

C

zn 1 dz + 2 (z − z1 ) · · · (z − zk ) 2πi

I

C

z k−1 dz; . (z − z1 ) · · · (z − zk )

H zn dz s˜ao aproximadas para R → Para n = 1, . . . , k − 2, as integrais C (z−z1 )···(z−z k) H n−k H H k−1 inf ty por C z dz = 0. Para R → ∞ a integral C (z−z1z)···(z−zk ) dz ´e aproximada por C z −1 dz = 2πi. k X Pk − Conclu´ımos que l=1 qzl = 2 e, portanto, (λ+ zl + λzl ) = k − 2. l=1

o

2 caso. O tratamento aqui ´e an´alogo. Novamente k−1−

k−1 X

qzl e novamente

Pk−1 l=1

λ+ zl

+

λ− zl

= 1 − q zl

k−1 X − e, portanto, (λ+ zl + λ zl ) = l=1

qzl ´e a soma dos res´ıduos de a1 em suas singularidades finitas, que

Hl=1 1 vale 2πi a (z)dz, onde C ´e uma curva fechada orientada no sentido anti-hor´ario que contem todos C 1 os pontos z1 , . . . , zk na regi˜ao que delimita. Por simplicidade adotamos C como sendo um c´ırculo de raio R grande o suficiente. Por (7.106) I

a1 (z) dz = C

k−2 X n=0

(n) γ1

I

C

zn dz , (z − z1 ) · · · (z − zk−1 )

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Para R → ∞ as integrais acima s˜ao aproximadas pelas integrais Pk−1 (k−1) quando n = k − 1, quando vale 2πi. Assim, l=1 qzl = γ 1 .

H

C

Cap´ıtulo 7

z n−k+1 dz, as quais s˜ao nulas, exceto (k−1)

− Agora, por (7.104), λ+ ∞ + λ∞ = 1 − q∞ e por (7.103) e (7.106), q∞ = 2 − γ1 (k−1) −1 + γ1 e, portanto,

λ+ ∞

+

λ− ∞



Isso completa a prova.

+

k−1 X l=1

λ+ zl

+

λ− zl



=



k−1−

(k−1) γ1



+



385/1304

−1+

(k−1) γ1



− . Assim, λ+ ∞ + λ∞ =

= k−2.

Retomando a` discuss˜ao do par´agrafo que antecede ao enunciado do lema acima, vimos que a equa¸ca˜o Fuchsiana (7.84) possui 3k − 4 parˆametros livres e 2k − 1 ´ındices independentes. Conclu´ımos que se 3k − 4 ≤ 2k − 1, ou seja, se k ≤ 3, ´e poss´ıvel escrever todos os parˆametros livres em termos dos ´ındices. As situa¸ca˜o interessante, portanto, ´e aquela em que se tem no m´aximo trˆes pontos singulares simples (incluindo, eventualmente, um no infinito). Nela, a equa¸ca˜o Fuchsiana (7.84) ´e totalmente determinada pelos ´ındices de suas singularidades simples e, portanto, assim s˜ao suas solu¸co˜es. Essa conclus˜ao foi primeiramente obtida por Riemann por volta de 185718 . Como os ´ındices de uma singularidade est˜ao relacionados a` monodromia em torno da mesma, Riemann colocou a quest˜ao de sob quais condi¸co˜es existe uma equa¸ca˜o Fuchsiana com pontos singulares e monodromias pr´e-determinados. Essa quest˜ao despertou o interesse de Hilbert por volta de 1905, passando a ser conhecida como problema de RiemannHilbert. Al´em de Hilbert, contribuiram para o estudo desse problema nomes como Birkhoff 19 , Plemelj20 e outros. • Equa¸ co ˜es Fuchsianas com trˆ es singularidades Como discutimos acima, h´a um interesse especial na equa¸ca˜o Fuchsiana (7.84) com trˆes singularidades pois a mesma possui cinco parˆametros livres e tamb´em cinco ´ındices independentes associados a`s trˆes pontos singulares (lembremos que, pelo Lema 7.1, a soma dos seis ´ındices deve ser igual a 1). Portanto, deve ser, em princ´ıpio, poss´ıvel expressar univocamente esses cinco parˆametros em termos dos ´ındices. Vamos mostrar que isso de fato ´e verdade. Para k = 3 e singularidades simples apenas nos pontos finitos z1 , z2 e z3 , (7.84) assume a forma. ! ! (0) (1) (0) (1) (2) 2 2 γ + γ z + 2z γ + γ z + γ z 1 1 0 0 0 y 00 (z) + y 0 (z) + y(z) = 0 (7.107) (z − z1 )(z − z2 )(z − z3 ) (z − z1 )2 (z − z2 )2 (z − z3 )2 e para singularidades simples apenas no pontos finitos z1 , z2 e uma no infinito, (7.84) assume a forma ! ! (0) (1) (0) (1) (2) 2 γ1 + γ 1 z γ0 + γ 0 z + γ 0 z y 00 (z) + y 0 (z) + y(z) = 0 (7.108) (z − z1 )(z − z2 ) (z − z1 )2 (z − z2 )2 18

G. F. B. Riemann, “Beitr¨ age zur Theorie der durch die Gauss’sche Reihe F (α, β, γ, x) darstellbaren Functionen”. Abhandlungen der K¨ oniglichen Gesellschaft der Wissenschaften zu G¨ ottingen, 7, 3-32 (1857). G. F. B. Riemann, “Beitr¨ age zur Theorie der durch die Gauss’sche Reihe F (α, β, γ, x) darstellbaren Functionen”. G¨ ottinger Nachrichten, 6-8 (1857). 19 George David Birkhoff (1884-1944). 20 Josip Plemelj (1873-1967).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 7

Vers˜ ao de 29 de setembro de 2005.

386/1304

(1)

com γ1 6= 2.

No caso (7.107) podemos escrever, de acordo com (7.99) e (7.105), para l = 1, . . . , 3, ! 3 ! 3 1 2 X Y X Y 1 1 (n) (n) n 2 γ (z ) + 2(z ) , q = . γ0 (zl )n p zl = l l zl 1 2 (z − z ) (z − z ) l a l a a=1 a=1 n=0 n=0

(7.109)

a6=l

a6=l

Como − λ+ zl + λ zl = 1 − q zl

− λ+ z l λz l = p z l ,

e

(7.110)

vemos que as u ´ ltimas equa¸co˜es podem ser escritas como − λ+ z l λz l

3 Y a=1 a6=l

2

(zl − za ) =

2 X

(n) γ0 (zl )n



,

n=0



λ− zl

βl :=



1−

λ+ zl

3 Y a=1 a6=l

(zl − za ) =

1 X

(n)

γ1 (zl )n + 2(zl )2 .

n=0

Definindo − αl := λ+ z l λz l

3 Y a=1 a6=l

(zl − za )2

e





−  1 − λ+ zl − λ zl 

3 Y a=1 a6=l



 (zl − za ) ,

para l = 1, 2, 3, as u ´ ltimas rela¸co˜es podem ser escritas em forma matricial      (0)       (0)  γ0 α1 1 z1 (z1 )2 β1 1 z1 (z1 )2 γ1 (1)  2   (1)  α2  = 1 z2 (z2 )2      β 1 z (z ) e = . γ 0  2 2 2 γ1 2 2 (2) α3 1 z3 (z3 ) β3 1 z3 (z3 ) 2 γ0 

 1 z1 (z1 )2 A matriz Z := 1 z2 (z2 )2  ´e uma matriz de Vandermonde21, e seu determinante ´e 1 z3 (z3 )2 det(Z) =

Y

1≤a 0. t→∞

6

t→∞

E. 7.39 Exerc´ıcio. Seja Pn o espa¸co vetorial complexo (n + 1)-dimensional de todos os polinˆomios d complexos de grau menor ou igual a n. Seja D = dx o operador de deriva¸c˜ao agindo em Pn . a) Expresse D como uma matriz (n + 1) × (n + 1) agindo na base {e 0 , . . . , en }, onde ek = xk /k!.

b) Mostre que D, agindo em Pn , ´e nilpotente. c) Expresse exp(tD), t ∈



, como matriz na base {e0 , . . . , en }.

d) Seja p(x) = a0 + a1 x + · · · + an xn um elemento de Pn . Mostre que (exp(tD)p)(x) = p(x + t). Sugest˜ ao. Mostre que isso ´e verdade para todos os elementos da base {e 0 , . . . , en }. 6 E. 7.40 Exerc´ıcio. As chamadas matrizes de Pauli s˜ao definidas por       0 1 0 −i 1 0 σ1 := , σ2 := e σ3 := . i 0 0 −1 1 0

(7.118)

a) Mostre que as mesmas satisfazem as seguintes rela¸co˜es alg´ebricas: para todos a, b = 1, 2, 3 valem [σa , σb ] := σa σb − σb σa = 2i

3 X

εabc σc ,

(7.119)

c=1

{σa , σb } := σa σb + σb σa = 2δab , σa σb = δab + i

(7.120) 3 X

εabc σc .

(7.121)

c=1

Note que as matrizes de Pauli s˜ao auto-adjuntas: σi∗ = σi . b) Mostre que as quatro matrizes , σ1 , σ2 , σ3 formam uma base em Mat ( , 2): toda matriz complexa 2 × 2 pode ser escrita como uma combina¸c˜ao linear das mesmas.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

392/1304

c) Mostre que as matrizes , σ1 , σ2 , σ3 s˜ao ortonormais em rela¸c˜ao ao seguinte produto escalar definido em Mat ( , 2): hA, Bi := 21 Tr (A∗ B).

d) Seja ~η := (η1 , η2 , η3 ) um vetor de comprimento 1 de 3 , ou seja, k~ηk = 1. Seja, ~η · ~σ := η1 σ1 + η2 σ2 + η3 σ3 , onde σk s˜ao as matrizes de Pauli, definidas acima. Mostre que  exp (iθ~η · ~σ ) = cos(θ) + i sen (θ) η~ · ~σ . 

e) Obtenha a representa¸c˜ao espectral das matrizes de Pauli.

6 E. 7.41 Exerc´ıcio. Exiba pelo menos um exemplo de um par de matrizes quadradas A e B tais que exp(A) exp(B) 6= exp(A + B). 6 E. 7.42 Exerc´ıcio. I. Mostre que se A(t) s˜ao matrizes complexas n × n que comutam para t’s diferentes, ou seja, tais que A(t)A(t0 ) = A(t0 )A(t) para todos t e t0 , ent˜ao a s´erie de Dyson Z tn−1 ∞ Z t Z t1 X D(t) := + ··· A(t1 )A(t2 ) · · · A(tn ) dtn dtn−1 · · · dt1 n=1

pode ser escrita como D(t) = exp II. Sejam R =



0

Z

0

0



t

A(τ ) dτ . 0

 1 2 , e A(t) = tR. Compute D(t), t ∈ 0 1

E. 7.43 Exerc´ıcio. Seja a matriz A = onde α, β ∈



.



α β − iα 0 βi



. 

6

,

a) Determine seus auto-valores e seus projetores espectrais E 1 e E2 e escreva a matriz A na forma espectral A = λ 1 E1 + λ 2 E2 .

Mostre explicitamente que E1 e E2 satisfazem Ea Eb = δa, b Ea e E1 + E2 = . b) Determine explicitamente a matriz eAt , t ∈



.

c) Determine explicitamente a solu¸c˜ao da equa¸c˜ao ˙ X(t) = AX(t) + G(t) ,

onde



X(t) = 

x1 (t) x2 (t)



 ,



G(t) = 

eiωt e

−iωt



 ,

 0 x1 X(0) = X0 =   . x02

6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 7

393/1304

E. 7.44 Exerc´ıcio. Seja a matriz 

α 0  A =  0 0 0

0 α 0 0 0

0 β α 0 0

0 0 0 γ δ

 0 0  0  , δ γ

onde α, β, γ e δ s˜ao n´umeros complexos. Calcule exp(tA), t ∈



.

6

E. 7.45 Exerc´ıcio. Sejam  s1 (t)   S(t) =  ...  sn (t)

 y1 (t)   Y (t) =  ...  , yn (t)





e M uma matriz n × n complexa de coeficientes constantes. Mostre que o sistema linear Y˙ (t) = M Y (t) + S(t) com condi¸c˜ao inicial Y (0) = Y0 tem por solu¸c˜ao Y (t) = e

Mt

Y0 +

Z

t

e(t−u)M S(u) du . 0

6

Cap´ıtulo 8 Solu¸co ˜es de Equa¸co ˜es Diferenciais Ordin´ arias Lineares no Plano Complexo Conte´ udo 8.1

8.2

8.3

8.4

Solu¸ co ˜es em S´ eries de Potˆ encias para Equa¸ co ˜es Regulares . . . . . . . . . 395 8.1.1

A Equa¸ca˜o do Oscilador Harmˆonico Simples . . . . . . . . . . . . . . . . . . . 396

8.1.2

A Equa¸ca˜o de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398

8.1.3

A Equa¸ca˜o de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401

8.1.4

A Equa¸ca˜o de Airy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404

8.1.5

A Equa¸ca˜o de Chebyshev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406

8.1.6

O Caso de Equa¸co˜es Regulares Gerais . . . . . . . . . . . . . . . . . . . . . . 409

Solu¸ ca ˜o de Equa¸ co ˜es Singulares Regulares. O M´ etodo de Frobenius . . . 411 8.2.1

Equa¸co˜es Singulares Regulares. O Caso Geral . . . . . . . . . . . . . . . . . . 415

8.2.2

A Equa¸ca˜o de Euler Revisitada . . . . . . . . . . . . . . . . . . . . . . . . . . 424

8.2.3

A Equa¸ca˜o de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427

8.2.4

Equa¸co˜es Relacionadas a` de Bessel. A Equa¸ca˜o de Bessel Esf´erica . . . . . . 438

8.2.5

A Equa¸ca˜o de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441

8.2.6

A Equa¸ca˜o Hipergeom´etrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443

8.2.7

A Equa¸ca˜o Hipergeom´etrica Confluente . . . . . . . . . . . . . . . . . . . . . 447

Algumas Equa¸ co ˜es Associadas . . . . . . . . . . . . . . . . . . . . . . . . . . 450 8.3.1

A Equa¸ca˜o de Legendre Associada . . . . . . . . . . . . . . . . . . . . . . . . 450

8.3.2

A Equa¸ca˜o de Laguerre Associada . . . . . . . . . . . . . . . . . . . . . . . . 452

A Fun¸ ca ˜o Gama. Defini¸ ca ˜o e Propriedades . . . . . . . . . . . . . . . . . . 453

8.A Prova da Proposi¸ ca ˜o 8.1. Justificando os Polinˆ omios de Legendre . . . . 470 8.B Provando (8.14) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472 8.C Justificando os Polinˆ omios de Hermite . . . . . . . . . . . . . . . . . . . . . 474 8.D Provando (8.20) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476 8.E Porque λ deve ser um Inteiro Positivo na Equa¸ ca ˜o de Laguerre 8.6

. . . . . 477

Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480

rataremos no presente cap´ıtulo de apresentar solu¸co˜es de equa¸co˜es diferenciais ordin´arias lineares e homogˆeneas, regulares ou com pontos singulares regulares. Por simplicidade, e para atender ao interesse de problemas f´ısicos, trataremos apenas de equa¸co˜es de segunda ordem mas, em essˆencia, tudo o que faremos facilmente se generaliza para equa¸co˜es de ordem 394

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

395/1304

superior. Nossa abordagem estar´a centrada no chamado m´etodo de expans˜ao em s´erie de potˆencias (para equa¸co˜es regulares) e no m´etodo de Frobenius (para equa¸co˜es com singularidades regulares). Estudaremos tanto casos gerais (com razo´avel detalhe) quanto equa¸co˜es particulares de interesse em F´ısica. Em um certo sentido, o presente cap´ıtulo d´a continuidade ao Cap´ıtulo 7, mas dele s´o utilizaremos os Teoremas 7.3 e 7.4, das p´aginas 358 e 361, respectivamente. Esses teoremas fundamentais s˜ao as justificativas dos m´etodos de solu¸ca˜o que empregaremos. Comentamos ainda que trataremos as equa¸co˜es diferenciais como equa¸co˜es no plano complexo ainda que, na F´ısica, o interesse tipicamente resida em equa¸co˜es na reta real pois, como discutimos no Cap´ıtulo 7, a natureza das solu¸co˜es e a justificativa dos m´etodos de solu¸ca˜o s˜ao melhor entendidas quando abandonamos as limita¸co˜es da reta real de modo a explorar a estrutura anal´ıtica das equa¸co˜es e suas solu¸co˜es. Por vezes, omitiremos detalhes de c´alculos e o estudante ´e convidado a complet´a-los como exerc´ıcio. Apesar de alguns desses c´alculos omitidos serem reconhecidamente entediantes (n˜ao s´o os omitidos, ali´as), o estudante dever´a fazˆe-los ao menos uma vez na vida, pois n˜ao ´e poss´ıvel apoderar-se do conhecimento aqui desenvolvido apenas por meio de leitura passiva. O tratamento que faremos de solu¸co˜es de equa¸co˜es gerais ´e bastante detalhado, um tanto mais do que o por vezes encontrado na literatura. Os resultados gerais est˜ao resumidos nos Teoremas 8.1 e 8.2, adiante. O tratamento de certas equa¸co˜es particulares de interesse em F´ısica (como as de Legendre, Hermite, Airy, Chebyshev, Bessel e Laguerre) ´e razoavelmente completo e v´arias propriedades especiais das solu¸co˜es, tais como rela¸co˜es de ortogonalidade, rela¸co˜es de recorrˆencia, f´ormulas do tipo de Rodrigues, representa¸co˜es integrais etc. (todas importantes na resolu¸ca˜o de problemas de F´ısica) s˜ao discutidas com detalhe no Cap´ıtulo 9, p´agina 483. Uma omiss˜ao ´e um estudo detalhado do comportamento assint´otico de certas solu¸co˜es. Esperamos que futuramente essa lacuna possa ser completada. Exemplos selecionados de problemas de F´ısica onde algumas das equa¸co˜es particulares que discutimos se apresentam (e a conseq¨ uente resolu¸ca˜o desses problemas) poder˜ao ser encontrados no Cap´ıtulo 10, p´agina 544, ao qual remetemos os estudantes interessados em adquirir um pouco de motiva¸ca˜o. A leitura daquele cap´ıtulo requer um conhecimento parcial das solu¸co˜es das equa¸co˜es diferenciais e suas propriedades, de modo que o estudante dever´a alternar sua leitura com a do material que a precede nos Cap´ıtulos 8 e 9. A Se¸ca˜o 8.4, p´agina 453, contem um tratamento detalhado das propriedades mais relevantes da fun¸ca˜o Gama de Euler. Todas as equa¸co˜es particulares tratadas, suas solu¸co˜es e propriedades dessas solu¸co˜es, s˜ao amplamente discutidas na vasta literatura pertinente e a ela remetemos os estudantes interessados. Vide, por exemplo, [112], [136], [83], [4], [131], [23], [66], [67], [11], [27], [28], [39], [122], [64], [62]. Para uma abordagem da teoria das fun¸co˜es especiais sob o ponto de vista de teoria de grupos, vide [129].

8.1

Solu¸ co ˜es em S´ eries de Potˆ encias para Equa¸ co ˜es Regulares

Vamos na presente se¸ca˜o ilustrar o Teorema 7.3 da p´agina 358 estudando a solu¸ca˜o por s´erie de potˆencias de algumas equa¸co˜es diferenciais ordin´arias, homogˆeneas de segunda ordem e regulares de interesse

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

396/1304

(especialmente em F´ısica). Boa parte dos m´etodos apresentados nos exemplos aplicam-se a equa¸co˜es de ordem maior que dois, mas n˜ao trataremos de tais generaliza¸co˜es aqui pois elas pouco apresentam de especial e seu interesse na F´ısica ´e reduzido. Na Se¸ca˜o 8.2, p´agina 411, ilustraremos o Teorema 7.4, p´agina 361, tratando de forma semelhante v´arias equa¸co˜es singulares regulares de interesse pelo m´etodo de Frobenius. Conforme demonstramos em p´aginas anteriores (Teorema 7.3, p´agina 358), se a equa¸ca˜o diferencial linear homogˆenea de segunda ordem y 00 (z) + a(z)y 0 (z) + b(z)y(z) = 0

(8.1)

for tal que os coeficientes a(z) e b(z) s˜ao fun¸co˜es anal´ıticas de z em torno de um ponto z 0 , ent˜ao suas solu¸co˜es ser˜ao igualmente anal´ıticas em torno desse ponto e poderemos procurar resolvˆe-la em termos de s´eries de potˆencia centradas em z0 : y(z) =

∞ X n=0

cn (z − z0 )n .

(8.2)

O chamado m´etodo de s´erie de potˆencias consiste precisamente em inserir o Ansatz (8.2) na equa¸ca˜o (8.1) e determinar recursivamente os coeficientes cn . Pelas conclus˜oes obtidas anteriormente, resumidas no Teorema 7.3 da p´agina 358, a solu¸ca˜o obtida deve ser convergente pelo menos no maior disco aberto centrado em z0 no qual ambas as fun¸co˜es a(z) e b(z) sejam tamb´em anal´ıticas. Ilustraremos a aplica¸ca˜o desse m´etodo na resolu¸ca˜o da equa¸ca˜o do oscilador harmˆonico simples e nas equa¸co˜es de Legendre, Hermite, Airy e Chebyshev, todas equa¸co˜es de interesse em F´ısica. Ao final discutiremos a solu¸ca˜o do problema geral.

8.1.1

A Equa¸ c˜ ao do Oscilador Harmˆ onico Simples

Por raz˜oes pedag´ogicas, vamos come¸car discutindo uma equa¸ca˜o diferencial bastante simples e familiar. Seja a bem-conhecida equa¸ca˜o do oscilador harmˆonico simples y 00 (z) + ω02 y(z) = 0 ,

(8.3)

onde ω0 ´e uma constante. Nesse caso P a(z) = 0 e b(z) = ω02 , ambas anal´ıticas em toda parte. Procuremos n ´ acil ver que ent˜ao uma solu¸ca˜o da forma y(z) = ∞ n=0 cn z (com z0 = 0). E f´ y 0 (z) =

∞ X

ncn z n−1 =

n=0

∞ X

ncn z n−1

n→n+1

=

n=1

ou seja, 0

y (z) =

∞ X

∞ X

(n + 1)cn+1 z n ,

n=0

(n + 1)cn+1 z n

(8.4)

n=0

e que 00

y (z) =

∞ X n=0

n(n + 1)cn+1 z

n−1

=

∞ X n=1

n(n + 1)cn+1 z

n−1 n→n+1

=

∞ X n=0

(n + 1)(n + 2)cn+2 z n ,

JCABarata. Curso de F´ısica-Matem´ atica

ou seja, 00

y (z) =

∞ X

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

397/1304

(n + 1)(n + 2)cn+2 z n .

(8.5)

n=0

Inserindo-se (8.4) e (8.5) em (8.3), obtem-se ∞ h X n=0

i (n + 1)(n + 2)cn+2 + ω02 cn z n = 0 .

Como essa u ´ ltima rela¸ca˜o supostamente vale para todo z, tem-se for¸cosamente que os fatores entre colchetes s˜ao todos nulos (por que?): (n + 1)(n + 2)cn+2 + ω02 cn = 0 ,

ou seja,

cn+2 =

−ω02 cn (n + 1)(n + 2)

(8.6)

para todo n ≥ 0. A solu¸ca˜o dessa u ´ ltima equa¸ca˜o recursiva ´e c2k =

(−1)k ω02k c0 , (2k)!

c2k+1 =

(−1)k ω02k c1 . (2k + 1)!

com k ≥ 0. Essas express˜oes relacionam todos os coeficientes cn com os dois primeiros coeficientes, c0 e c1 . P n Inserindo isso na express˜ao y(z) = ∞ n=0 cn z , tem-se y(z) =

∞ X

c2k z 2k +

k=0

= c0

c2k+1 z 2k+1 = c0

k=0

∞ X (−1)k k=0

∞ X

(2k)!

(ω0 z)

= c0 cos(ω0 z) +

∞ X (−1)k ω 2k 0

k=0

2k

(2k)!

z 2k + c1

∞ X (−1)k ω 2k 0

k=0

(2k + 1)!

z 2k+1

∞ c1 X (−1)k + (ω0 z)2k+1 ω0 k=0 (2k + 1)!

c1 sen (ω0 z) . ω0

Na u ´ ltima passagem pudemos identificar as duas s´eries de potˆencias com as s´eries de Taylor (em torno de 0) das fun¸co˜es seno e co-seno. Notemos que em problemas menos simples, como os que encontraremos adiante, nem sempre ser´a poss´ıvel identificar as s´eries resultantes com as s´eries de Taylor de fun¸co˜es previamente conhecidas, o que nos conduzir´a a` defini¸ca˜o de novas fun¸co˜es, as chamadas fun¸co ˜es especiais. ´ de se notar que a solu¸ca˜o final, y(z) = c0 cos(ω0 z) + c1 sen (ω0 z), ´e anal´ıtica em toda a parte como E ω0 fun¸ca˜o de z, o que j´a era esperado do fato de as fun¸co˜es a(z) e b(z) serem fun¸co˜es anal´ıticas em toda parte (duas constantes). Obtivemos, assim, a bem-conhecida solu¸ca˜o do oscilador harmˆonico simples em termos de uma combina¸ca˜o linear das fun¸co˜es seno e co-seno. Os coeficientes c0 e c1 podem ser determinados se mais condi¸co˜es forem impostas a` solu¸ca˜o. Por exemplo, se impusermos “condi¸co˜es iniciais” y(0) = y 0 e y 0 (0) = v0 , obtemos c0 = y0 e c1 = v0 .

JCABarata. Curso de F´ısica-Matem´ atica

8.1.2

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

398/1304

A Equa¸ c˜ ao de Legendre

A equa¸ca˜o diferencial (1 − z 2 )y 00 (z) − 2zy 0 (z) + λ(λ + 1)y(z) = 0

(8.7)

´e denominada equa¸ca ˜o de Legendre1 de ordem2 λ. Em princ´ıpio, adotamos λ ∈ , arbitr´ario, mas na maioria das aplica¸co˜es em F´ısica apenas valores especiais de λ s˜ao considerados, a saber, λ ´e tomado um inteiro n˜ao-negativo. A equa¸ca˜o de Legendre e uma parente pr´oxima, a equa¸ca˜o de Legendre associada, tratada na Se¸ca˜o 8.3.1, p´agina 450, surgem em v´arios problemas de F´ısica, do Eletromagnetismo a` Mecˆanica Quˆantica. Tipicamente ambas surgem quando da resolu¸ca˜o da equa¸ca˜o de Helmholtz pelo m´etodo de separa¸ca˜o de vari´aveis em coordenadas esf´ericas em trˆes dimens˜oes. Vide Cap´ıtulo 10, p´agina 544. A equa¸ca˜o de Legendre acima pode ser posta na forma padr˜ao (8.1) com a(z) =

−2z 1 − z2

e

b(z) =

λ(λ + 1) . 1 − z2

´ portanto, Claramente, ambas as fun¸co˜es s˜ao anal´ıticas emPum disco de raio 1 centrado em z 0 = 0. E, ∞ leg´ıtimo procurarmos solu¸co˜es na forma y(z) = n=0 cn z n (com z0 = 0). Tais solu¸co˜es ser˜ao anal´ıticas pelo menos no disco de raio 1 centrado em z0 = 0. Inserindo-se (8.4)-(8.5) em (8.7), obtem-se

∞ X n=0

n

(n + 1)(n + 2)cn+2 z −

´ f´acil ver que E I ≡

∞ X

∞ X

(n + 1)(n + 2)cn+2 z

|n=0

n+2

{z

}

I

(n + 1)(n + 2)cn+2 z

n+2 n→n−2

=

n=0

−2

∞ X n=2

∞ X

(n + 1)cn+1 z

|n=0

n+1

{z

(n − 1)n cn z

=

∞ X n=0

cn z n = 0 .

n=0

}

II

n

+λ(λ + 1)

∞ X

(8.8)

(n − 1)n cn z n ,

(8.9)

onde, na pen´ ultima igualdade, fizemos a mudan¸ca de vari´aveis n → n − 2 e, na u ´ ltima, acrescentamos os termos com n = 0 e n = 1 por estes serem nulos. Analogamente, ∞ X II ≡ (n + 1)cn+1 z n+1 n=0

n→n−1

=

∞ X

ncn z

n=1

n

=

∞ X

ncn z n ,

(8.10)

n=0

onde, na pen´ ultima igualdade, fizemos a mudan¸ca de vari´aveis n → n − 1 e, na u ´ ltima, acrescentamos o termo com n = 0 por este ser nulo. Assim, (8.8) fica ∞ X n=0

1 2

(n + 1)(n + 2)cn+2 z n −

∞ X n=0

(n − 1)n cn z n − 2

∞ X n=0

ncn z n + λ(λ + 1)

∞ X

cn z n = 0 ,

n=0

Adrien-Marie Legendre (1752-1833). Aqui a palavra “ordem” n˜ ao deve ser confundida com a ordem da equa¸ca ˜o diferencial, que ´e dois.

JCABarata. Curso de F´ısica-Matem´ atica

ou seja, ∞ X n=0

"

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.





399/1304

#

(n + 1)(n + 2)cn+2 − (n − 1)n + 2n − λ(λ + 1) cn z n = 0 .

Como (n − 1)n + 2n = n(n + 1), obtemos o seguinte conjunto de equa¸co˜es   (n + 1)(n + 2)cn+2 − n(n + 1) − λ(λ + 1) cn = 0 , ∀n ≥ 0 . Essas express˜oes fornecem as seguintes equa¸co˜es recursivas para os coeficientes c n : n(n + 1) − λ(λ + 1) cn , (n + 1)(n + 2)

cn+2 =

∀n ≥ 0 .

(8.11)

De maneira an´aloga ao que ocorre no caso do oscilador harmˆonico simples (vide eq. (8.6)), podemos expressar todos os coeficientes cn com n par em termos de c0 e todos os coeficientes cn com n ´ımpar em termos de c1 . Mais precisamente, tem-se " #  k−1 k−1  1 Y λ(λ + 1) Y λ(λ + 1) c2k = 2l(2l + 1) − λ(λ + 1) c0 = − 1− c0 , (2k)! 2k 2l(2l + 1) l=0

c2k+1

l=1

" #  k−1 k−1  Y 1 Y λ(λ + 1) 1 (2l + 1)(2l + 2) − λ(λ + 1) c1 = 1− c1 . = (2k + 1)! l=0 2k + 1 l=0 (2l + 1)(2l + 2)

Para λ ∈

gen´erico conclu´ımos que a solu¸ca˜o geral da equa¸ca˜o de Legendre ´e da forma (0)

(1)

y(z) = c0 yλ (z) + c1 yλ (z) , onde ∞ k−1 X z 2k Y = 2l(2l + 1) − λ(λ + 1) (2k)! l=0 k=0

(0) yλ (z)

(1) yλ (z)

=

∞ X k=0

!

k−1 z 2k+1 Y (2l + 1)(2l + 2) − λ(λ + 1) (2k + 1)! l=0

(8.12) !

(8.13)

Conforme comentamos, sabemos a priori que ambas as s´eries acima convergem para |z| < 1. O que ocorre caso |z| = 1? Isso ´e respondido na seguinte proposi¸ca˜o, cuja demonstra¸ca˜o encontra-se no Apˆendice 8.A, p´agina 470 (vide tamb´em [112] para uma outra prova semelhante): Proposi¸ c˜ ao 8.1 Caso λ ∈ n˜ ao seja um inteiro n˜ ao-negativo par, a s´erie em (8.12) diverge em z = ±1. Caso λ ∈ n˜ ao seja um inteiro positivo ´ımpar, a s´erie em (8.13) diverge em z = ±1. 



Essa proposi¸ca˜o ensina-nos que as solu¸co˜es (8.12) e (8.13) da equa¸ca˜o de Legendre ser˜ao divergentes em z = ±1 caso λ n˜ao seja um inteiro n˜ao-negativo e isso para qualquer escolha de c 0 e c1 n˜ao-nulos. Em aplica¸co˜es, por´em, ´e muito importante ter-se solu¸co˜es finitas no intervalo fechado real [−1, 1] de

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

400/1304

valores de z. A u ´ nica esperan¸ca que resta reside na situa¸ca˜o na qual λ ´e um inteiro n˜ao-negativo e, de (0) (1) fato, podemos verificar que em tal caso yλ ´e finita se λ for par e que yλ ´e finita se λ for ´ımpar. • Os Polinˆ omios de Legendre Contemplando a express˜ao (8.12) facilmente constata-se que no caso em que λ = 2n, um inteiro n˜ao-negativo par, tem-se ! n k−1 2k X Y z (0) y2n (z) := 2l(2l + 1) − 2n(2n + 1) , (2k)! k=0 l=0 que ´e um polinˆomio de grau 2n em z. Analogamente, contemplando a express˜ao (8.13) facilmente se constata que no caso em que λ = 2n + 1, um inteiro positivo ´ımpar, tem-se ! k−1 n 2k+1 X Y z (1) (2l + 1)(2l + 2) − (2n + 1)(2n + 2) , y2n+1 (z) := (2k + 1)! l=0 k=0 que ´e um polinˆomio de grau 2n + 1 em z. Assim, vemos que no caso de λ ser um inteiro n˜ao-negativo a equa¸ca˜o de Legendre tem uma solu¸ca˜o (0) (1) finita em toda a parte, a saber, o polinˆomio c0 y2n (z), caso λ = 2n, par, ou o polinˆomio c1 y2n+1 (z), caso λ = 2n + 1, ´ımpar. Definimos, ent˜ao,  ! m/2 k−1  2k Y X  z  (0)  c0 y m (z) = c0 2l(2l + 1) − m(m + 1) , m par    (2k)!  l=0 k=0 Pm (z) := . !   (m−1)/2 k−1  X  z 2k+1 Y  (1)  c y (z) = c (2l + 1)(2l + 2) − m(m + 1) , m ´ımpar 1 1  m  (2k + 1)! k=0

l=0

´ claro pela defini¸ca˜o acima que Pm ´e um polinˆomio de grau m e o coeficiente do monˆomio de maior E grau, z m , vale ! m/2−1 1 Y c0 2l(2l + 1) − m(m + 1) , para m par m! l=0 e

1 c1 m!

!

(m−3)/2

Y l=0

(2l + 1)(2l + 2) − m(m + 1) ,

para m ´ımpar.

Por raz˜oes hist´oricas, convenciona-se escolher c0 e c1 de modo que o coeficiente do monˆomio de maior . Como facilmente se constata ap´os alguns c´alculos entediantes, isso grau de Pm seja igual a 2m(2m)! (m!)2 conduz a` seguinte express˜ao para os polinˆomios Pm (z): Pm (z) :=

bm/2c

X a=0

(−1)a (2m − 2a)! z m−2a , m 2 (m − a)! (m − 2a)! a!

(8.14)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

401/1304

onde bm/2c ´e o maior inteiro menor ou igual a m/2, ou seja,  m  2 , m par, jmk :=  m−1 2 , m ´ımpar. 2

A prova de (8.14) pode ser encontrada no Apˆendice 8.B, p´agina 472. E. 8.1 Exerc´ıcio. Tente provar (8.14) sem ler o Apˆendice 8.B.

6

A express˜ao (8.14) define os assim denominados polinˆ omios de Legendre de grau m, cada qual ´e solu¸ca˜o da equa¸ca˜o de Legendre de ordem m (1 − z 2 )y 00 (z) − 2zy 0 (z) + m(m + 1)y(z) = 0 , com m inteiro n˜ao-negativo. Como comentamos, essa equa¸ca˜o possui, para cada m inteiro n˜ao-negativo, uma segunda solu¸ca˜o que ´e, por´em, divergente para z → ±1. Os quatro primeiros polinˆomios de Legendre s˜ao P0 (z) = 1 ,

1 3 P2 (z) = − + z 2 , 2 2

P1 (z) = z ,

3 5 P3 (z) = − + z 3 , 2 2

como facilmente se vˆe pela defini¸ca˜o acima. Os polinˆomios de Legendre possuem v´arias propriedades importantes, tais como rela¸co˜es de ortogonalidade, f´ormulas de recorrˆencia etc., as quais ser˜ao discutidas na Se¸ca˜o 9.2.1, p´agina 495. Tamb´em remetemos o estudante a` literatura pertinente supracitada.

8.1.3

A Equa¸ c˜ ao de Hermite

A equa¸ca˜o diferencial y 00 (z) − 2zy 0 (z) + λy(z) = 0,

(8.15)

˜o de Hermite3 . Essa equa¸ca˜o ´e famosa por surgir em um problema com λ ∈ ´e denominada equa¸ca b´asico da Mecˆanica Quˆantica, a saber, o problema do oscilador harmˆonico. Vide Se¸ca˜o 10.4, p´agina 567. Comparando a` forma padr˜ao (8.1), constatamos que aqui a(z) = −2z

e

b(z) = λ .

Ambas essas fun¸co˜es s˜ao anal´ıticas em todo o plano complexo e, pelo Teorema 7.3 da p´agina 358, assim ser˜ao as solu¸co˜es da equa¸ca˜o de Hermite, sendo que encontr´a-las atrav´es de uma expans˜ao P podemos n em s´erie de potˆencias em torno de z0 = 0: y(z) = ∞ c z . n=0 n Inserindo-se (8.4)-(8.5) em (8.15), obtem-se ∞ X n=0

3

∞ ∞ X X n+1 +λ cn z n = 0 . (n + 1)(n + 2)cn+2 z − 2 (n + 1)cn+1 z

Charles Hermite (1822-1901).

n

n=0

|

{z II

}

n=0

(8.16)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

402/1304

A soma II pode ser escrita como em (8.10) e, assim, (8.16) fica ∞ X n=0

ou seja,

n

(n + 1)(n + 2)cn+2 z − 2 ∞ h X n=0

∞ X

n

ncn z + λ

n=0

∞ X

cn z n = 0 ,

n=0

i (n + 1)(n + 2)cn+2 + (λ − 2n) cn z n = 0 ,

para todo z ∈ , o que implica (n + 1)(n + 2)cn+2 + (λ − 2n) cn = 0, ∀n ≥ 0. Disso conclu´ımos que cn+2 =

2n − λ cn , (n + 1)(n + 2)

∀n≥0.

(8.17)

Assim como no caso do oscilador harmˆonico simples e no caso da equa¸ca˜o de Legendre, os coeficientes cn com n par s˜ao proporcionais a c0 e os coeficientes cn com n ´ımpar s˜ao proporcionais a c1 . Mais precisamente, tem-se λ c2 = − c0 , 2

k−1

c2k = −c0

λ Y (4l − λ) , (2k)! l=1

k≥2,

k

c2k+1

Y 1 (4l − 2 − λ) , = c1 (2k + 1)! l=1

k≥1.

Desta forma, chegamos a` seguinte solu¸ca˜o geral da equa¸ca˜o de Hermite: (0)

(1)

y(z) = c0 yλ (z) + c1 yλ (z) , onde (0) yλ (z)



k−1

k=2

l=1

X z 2k Y λ := 1 − z 2 − λ (4l − λ) , 2 (2k)!

(1) yλ (z)

:= z +

∞ X k=1

k

z 2k+1 Y (4l − 2 − λ) . (2k + 1)! l=1

Conforme comentamos, o Teorema 7.3 da p´agina 358 garante-nos que ambas as s´eries acima convergem (1) (0) absolutamente para todo z ∈ , fazendo de yλ e yλ fun¸co˜es inteiras de z. • Os Polinˆ omios de Hermite No caso em que z ´e restrita a ser uma vari´avel real, chamˆemo-la x, ´e poss´ıvel demonstrar que se λ for real e as s´eries acima forem infinitas, ent˜ao ambas comportam-se, para |x| grande, como fun¸co˜es que crescem mais r´apido que exp(x2 /2). Isso ´e provado no Apˆendice 8.C, p´agina 474, e, por outros meios, em [83] ou em [79]. No contexto da Mecˆanica Quˆantica esse fato ´e indesejado, pois conduz a fun¸co˜es de onda que n˜ao s˜ao de quadrado integr´avel (vide Se¸ca˜o 10.4, p´agina 567). Assim, interessa-nos investigar sob quais circunstˆancias as s´eries acima podem ser reduzidas a polinˆomios. Como vemos facilmente por (8.17), isso se d´a apenas quando λ for um n´ umero inteiro n˜ao-negativo e par: λ = 2m, com m = 0, 1, 2, . . . etc. De fato, se λ = 2m, com m = 0, 1, 2, . . . etc., a express˜ao

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

403/1304

(0)

(8.17) diz-nos que 0 = cm+2 = cm+4 = cm+6 = · · · etc. Assim, caso m for par, yλ ser´a um polinˆomio (1) de ordem m e caso m for ´ımpar, yλ ser´a um polinˆomio de ordem m. Defina-se, assim,

Hm (z) :=

ou seja,

Hm (z) :=

    (0) m/2  (−2) (m − 1)!! y2m (z),   

para m par,

     (1) (m+1)/2  (m!!) y2m (z), para m ´ımpar,  −(−2)

   m 2  2k k−1 Y X  2m 2 z   (4l − 2m) , para m par, (−2)m/2 (m − 1)!! 1 − z − 2m   2 (2k)!   l=1 k=2     m−1  k  2 2k+1 X Y  z   (4l − 2(m + 1)) , −(−2)(m+1)/2 (m!!) z +    (2k + 1)! k=1 l=1

(8.18)

(8.19)

para m ´ımpar.

De maneira compacta, podemos escrever isso da seguinte forma Hm (z) :=

bm/2c

X k=0

(−1)k m! (2z)m−2k . k! (m − 2k)!

(8.20)

A demonstra¸ca˜o pode ser encontrada no Apˆendice 8.D, p´agina 476. E. 8.2 Exerc´ıcio. Tente mostrar isso sem ler o Apˆendice 8.D.

6

As fun¸co˜es Hm (z) s˜ao polinˆomios de grau m e s˜ao denominados polinˆ omios de Hermite. Os fatores m/2 (m+1)/2 (−2) (m − 1)!! e −(−2) (m!!) provˆem de uma conven¸ca˜o hist´orica sobre a normaliza¸ca˜o dos polinˆomios de Hermite. Os quatro primeiros s˜ao H0 (z) = 1 ,

H1 (z) = 2z ,

H2 (z) = −2 + 4z 2 ,

H3 (z) = −12z + 8z 3 ,

como facilmente se vˆe pela defini¸ca˜o acima. Cada polinˆomio de Hermite Hm ´e solu¸ca˜o da equa¸ca˜o de Hermite y 00 (z) − 2zy 0 (z) + 2my(z) = 0, com m inteiro positivo. Como mencionamos, essa equa¸ca˜o possui ainda uma segunda solu¸ca˜o que, embora finita para todo z ∈ , cresce muito rapidamente quando z ´e real e |z| → ∞, o que elimina seu interesse no contexto da Mecˆanica Quˆantica (especificamente, no problema do oscilador harmˆonico). Os polinˆomios de Hermite possuem v´arias propriedades importantes, tais como rela¸co˜es de ortogonalidade, f´ormulas de recorrˆencia etc., que ser˜ao discutidas na Se¸ca˜o 9.2.3, p´agina 511. Tamb´em remetemos o estudante a` literatura pertinente supracitada.

JCABarata. Curso de F´ısica-Matem´ atica

8.1.4

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

404/1304

A Equa¸ c˜ ao de Airy

A equa¸ca˜o diferencial y 00 (z) − zy(z) = 0.

´e denominada equa¸ca ˜o de Airy4 . Essa equa¸ca˜o surge em v´arios contextos, como por exemplo no estudo da propaga¸ca˜o de ondas eletromagn´eticas em meios com ´ındice de refra¸ca˜o vari´avel, no estudo da reflex˜ao de ondas de radio na atmosfera e, de especial importˆancia, na Mecˆanica Quˆantica, mais especificamente, na equa¸ca˜o de Schr¨odinger de uma part´ıcula que se move em uma dimens˜ao sob um potencial que cresce linearmente com a posi¸ca˜o (i.e., sob uma for¸ca constante). Na Se¸ca˜o 10.2.3, p´agina 560, tratamos com detalhe de um outro problema f´ısico onde ocorre a equa¸ca˜o de Airy, a saber, o problema de determinar os modos de vibra¸ca˜o de uma corda n˜ao-homogˆenea cuja densidade varia linearmente com a posi¸ca˜o. Comparando a` forma padr˜ao (8.1), constatamos que aqui a(z) = 0 e b(z) = −z. Ambas essas fun¸co˜es s˜ao anal´ıticas em todo o plano complexo e, pelo Teorema 7.3 da p´agina 358, assim ser˜ao as solu¸co˜es da equa¸ca˜o de Airy, sendo que encontr´a-las atrav´es de uma expans˜ao em s´erie de P podemos n potˆencias em torno de z0 = 0: y(z) = ∞ c z . n=0 n Inserindo-se (8.5) em (8.15), obtem-se ∞ X n=0

n

(n + 1)(n + 2)cn+2 z −

A express˜ao III pode ser escrita como III =

∞ X

cn z

n+1

=

n=0

∞ X n=0

|

cn z n+1 = 0 . {z

III

∞ X

(8.21)

}

cn−1 z n

n=1

pela mudan¸ca n → n − 1. Assim, a equa¸ca˜o de Airy diz-nos que ∞ X n=0

n

(n + 1)(n + 2)cn+2 z −

ou seja, 2c2 +

∞ h X n=1

Com isso, devemos ter c2 = 0 ,

cn−1 z n = 0 ,

n=1

i (n + 1)(n + 2)cn+2 − cn−1 z n = 0 .

(n + 1)(n + 2)cn+2 − cn−1 = 0,

ou seja, c2 = 0 ,

∞ X

cn+3 =

cn , (n + 2)(n + 3)

∀n≥1.

∀n≥0.

(8.22)

4 George Biddell Airy (1801-1892). A equa¸ca ˜o de Airy surgiu originalmente em seus estudos sobre a Teoria do Arco´Iris. Vide tamb´em “On the diffraction of an object-glass with circular aperture”, G. B. Airy, in Transactions of the Cambridge Philosophical Society (1835).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

405/1304

O conjunto de coeficientes {cn , n = 0, 1, 2, . . .} ´e a uni˜ao dos seguintes trˆes conjuntos disjuntos: {c3k , k = 0, 1, 2, . . .} = {c0 , c3 , c6 , c9 , . . .} {c3k+1 , k = 0, 1, 2, . . .} = {c1 , c4 , c7 , c10 , . . .} {c3k+2 , k = 0, 1, 2, . . .} = {c2 , c5 , c8 , c11 , . . .} As rela¸co˜es de recorrˆencia de (8.22) implicam que os coeficientes do primeiro conjunto acima s˜ao proporcionais a c0 , que os coeficientes do segundo conjunto acima s˜ao proporcionais a c1 e que os coeficientes do terceiro conjunto acima s˜ao proporcionais a c2 . Por´em, como c2 = 0, conclu´ımos que os coeficientes do terceiro conjunto s˜ao todos nulos. Logo, y(z) =

∞ X

c3k z

3k

+

k=0

1 c0 , 3k k! (3k − 1)!!!

c3k+1 z 3k+1 .

k=0

As rela¸co˜es de recorrˆencia de (8.22) dizem-nos que c3k =

∞ X

1 c1 3k k! (3k + 1)!!!

c3k+1 =

e

c3k+2 = 0 ,

para todo k ≥ 0. Assim, a solu¸ca˜o geral da equa¸ca˜o de Airy ´e "∞ # "∞ # X X z 3k z 3k+1 y(z) = c0 + c1 . k k! (3k − 1)!!! k k! (3k + 1)!!! 3 3 k=0 k=0

(8.23)

Como 3k k! = (3k)!!! (por que?), podemos reescrever isso como "∞ # "∞ # X X z 3k z 3k+1 y(z) = c0 + c1 . (3k)!!! (3k − 1)!!! (3k)!!! (3k + 1)!!! k=0 k=0 • As fun¸ co ˜es de Airy de primeiro e de segundo tipo H´a ainda uma outra maneira de reescrever (8.23), a saber, usando as identidades   3k Γ k + 32 3k Γ k + 43   (3k − 1)!!! = , (3k + 1)!!! = , Γ 32 Γ 34

sendo, para x ≥ 0,

Γ(x) :=

Z



e−t tx−1 dt

(8.24)

(8.25)

0

a bem conhecida Fun¸ca ˜o Gama de Euler, a qual satisfaz Γ(x + 1) = xΓ(x) .

(8.26)

assim como a assim denominada f´ ormula de duplica¸ca ˜o √ Γ(x)Γ(x + 1/2) = 21−2x πΓ(2x) .

(8.27)

A fun¸ca˜o Gama de Euler e suas propriedades s˜ao discutidas com mais detalhe na Se¸ca˜o 8.4, p´agina 453.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

406/1304

E. 8.3 Exerc´ıcio. Usando (8.26) prove (8.24).

6

Com isso, podemos escrever a solu¸ca˜o (8.23) da equa¸ca˜o de Airy como # #   "X   "X ∞ ∞ z 3k z 3k+1 4 2  + c1 Γ  . y(z) = c0 Γ 2k k! Γ k + 2 2k k! Γ k + 4 3 3 3 3 3 3 k=0 k=0

(8.28)

Essa express˜ao pode ser escrita como combina¸ca˜o linear das seguintes fun¸co˜es: Ai(z) :=

∞ X k=0

Bi(z) := 31/2

∞ X z 3k+1 z 3k  , − 2k+4/3 k! Γ k + 4 32k+2/3 k! Γ k + 23 3 3 k=0

"

∞ X

3k

32k+2/3

k=0

z  + k! Γ k + 23

∞ X k=0

3k+1

32k+4/3

(8.29) (8.30)

z  k! Γ k + 43

#

,

(8.31)

as quais s˜ao denominadas fun¸co ˜es de Airy de primeiro tipo e de segundo tipo, respectivamente. As fun¸co˜es Ai(z) e Bi(z) foram definidas como acima por conven¸ca˜o hist´orica. Ambas s˜ao anal´ıticas para todo z ∈ e representam solu¸co˜es da equa¸ca˜o de Airy. Propriedades dessas fun¸co˜es podem ser estudadas em [83]. Como veremos com um pouco mais de detalhe a` p´agina 439, a equa¸ca˜o de Airy pode ser transformada em uma equa¸ca˜o de Bessel de ordem 1/3 e as fun¸co˜es de Airy Ai(z) e Bi(z) podem ser escritas em termos das fun¸co˜es de Bessel J±1/3 . Vide express˜oes (8.123) e (8.124).

8.1.5

A Equa¸ c˜ ao de Chebyshev

A equa¸ca˜o diferencial (1 − z 2 )y 00 (z) − z y 0 (z) + λ2 y(z) = 0 5

´e denominada equa¸ca ˜o de Chebyshev . Em princ´ıpio adotamos λ ∈ estar´a no caso em que λ ´e um inteiro n˜ao-negativo.

(8.32) arbitr´ario, mas o maior interesse

A equa¸ca˜o de Chebyshev acima pode ser posta na forma padr˜ao (8.1) com a(z) =

−z 1 − z2

e

b(z) =

λ2 . 1 − z2

´ portanto, Claramente, ambas as fun¸co˜es s˜ao anal´ıticas emPum disco de raio 1 centrado em z 0 = 0. E, ∞ leg´ıtimo procurarmos solu¸co˜es na forma y(z) = n=0 cn z n (com z0 = 0). Tais solu¸co˜es ser˜ao anal´ıticas pelo menos no disco de raio 1 centrado em z0 = 0. Inserindo-se (8.4)-(8.5) em (8.32), obtem-se

∞ X n=0

5

n

(n + 1)(n + 2)cn+2 z −

∞ X

|n=0

(n + 1)(n + 2)cn+2 z

Pafnuty Lvovich Chebyshev (1821-1894).

{z I

n+2

}



∞ X

|n=0

(n + 1)cn+1 z {z II

n+1

}



2

∞ X n=0

cn z n = 0 . (8.33)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

407/1304

Novamente, I e II s˜ao dadas como em (8.9) e (8.10), respectivamente, e, portanto, (8.33) fica ∞ X n=0

n

(n + 1)(n + 2)cn+2 z −

ou seja, 2c2 + λ2 c0 +

∞ X n=1

2

"

∞ X n=1

n

(n − 1)n cn z −

∞ X

n

ncn z + λ

2

∞ X

cn z n = 0 ,

n=0

n=1





#

(n + 1)(n + 2)cn+2 − (n − 1)n + n − λ2 cn z n = 0 .

Como (n − 1)n + n = n , obtemos o seguinte conjunto de equa¸co˜es 2c2 + λ2 c0 = 0 ,   (n + 1)(n + 2)cn+2 − n2 − λ2 cn = 0 ,

∀n ≥ 1 .

Essas express˜oes fornecem as seguintes equa¸co˜es recursivas para os coeficientes c n : cn+2 =

n2 − λ 2 cn , (n + 1)(n + 2)

∀n ≥ 0 .

(8.34)

De maneira an´aloga ao que fizemos em exemplos anteriores, podemos expressar todos os coeficientes c n com n par em termos de c0 e todos os coeficientes cn com n ´ımpar em termos de c1 . Mais precisamente, tem-se " # k−1 1 Y (2l)2 − λ2 c0 , c2k = (2k)! l=0

c2k+1 Para λ ∈

" # k−1 Y 1 = (2l + 1)2 − λ2 c1 . (2k + 1)! l=0

gen´erico conclu´ımos que a solu¸ca˜o geral da equa¸ca˜o de Chebyshev ´e da forma (1)

(0)

y(z) = c0 yλ (z) + c1 yλ (z) , onde " # ∞ k−1 2k X Y z (0) yλ (z) = 1 + (2l)2 − λ2 , (2k)! k=1

(1)

yλ (z) = z +

∞ X k=1

• Os Polinˆ omios de Chebyshev

(8.35)

l=0

# " k−1 z 2k+1 Y (2l + 1)2 − λ2 . (2k + 1)! l=0

(8.36)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

408/1304

Como mencionamos, o principal interesse reside no caso em que λ ´e um inteiro n˜ao-negativo: λ = m. (0) (1) Nesse caso ´e f´acil ver que ym (z) ser´a um polinˆomio de grau m, caso m seja par e ym (z) ser´a um polinˆomio de grau m, caso m seja ´ımpar. Esses polinˆomios s˜ao " # m/2 k−1 X z 2k Y (0) 2 2 ym (z) = 1 + (2l) − m , m par, (2k)! l=0 k=1 (m−1)/2 (1) ym (z) = z +

X k=1

# " k−1 z 2k+1 Y (2l + 1)2 − m2 , m ´ımpar. (2k + 1)! l=0

Por uma conven¸ca˜o hist´orica, costuma-se redefinir esses polinˆomios multiplicando-os por uma constante dependente de m de modo a fazer o coeficiente do monˆomio de maior grau, z m , igual a 2m−1 . Ap´os alguns c´alculos entediantes o estudante poder´a convencer-se que, com essa conven¸ca˜o, os polinˆomios acima podem ser escritos de uma forma compacta como bm/2c m X (−1)k (m − k − 1)! (2z)m−2k , Tm (z) := 2 k=0 k! (m − 2k)!

ou ainda como Tm (z) =

bm/2c

X p=0

(−1)

p



m 2p



z m−2p 1 − z 2

p

,

(8.37)

(8.38)

ambas v´alidas para todo m = 0, 1, 2, 3, 4, . . .. Os polinˆomios assim definidos s˜ao denominados polinˆ omios de Chebyshev, os quais desempenham um papel central na teoria da aproxima¸ca˜o. Vide, por exemplo, [31], [125], [117] ou [91]. Os quatro primeiros polinˆomios de Chebyshev s˜ao T0 (z) = 1 ,

T1 (z) = z ,

T2 (z) = 2z 2 − 1 ,

T3 (z) = 4z 3 − 3z .

Uma das mais curiosas e importantes propriedades dos polinˆomios de Chebyshev Tm ´e a seguinte identidade:  Tm (z) = cos m arccos(z) , (8.39)

a qual pode ser facilmente demonstrada a partir da express˜ao (8.38). Vide exerc´ıcio abaixo.

Demonstrar diretamente a validade das express˜oes (8.37), (8.38) e (8.39) pode ser trabalhoso, por envolver o uso de v´arias identidades combinat´orias um tanto complicadas. O procedimento mais pr´atico ´e provar que todas essas express˜oes satisfazem a equa¸ca˜o de Chebyshev e as mesmas condi¸co˜es iniciais, por exemplo em z = 0. De (8.39) segue a interessante propriedade de composi¸ca˜o Tn (Tm (z)) = Tnm (z), v´alida para todos n, m n˜ao-negativos.

(8.40)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

409/1304

E. 8.4 Exerc´ıcio resolvido. Prove (8.38) a partir de (8.39). Sugest˜ao: defina y = arccos(z) e escreva o lado direito como  cos m arccos(z) = cos(my) =

 1  imy e + e−imy 2

1 [(cos y + i sen y)m + (cos y − i sen y)m ] 2 m  m i √ √ 1 h = z + i 1 − z2 + z − i 1 − z2 2 # " m    m  p X  √ p 1 X m m−p  √ m = . z m−p −i 1 − z 2 i 1 − z2 + z 2 p=0 p p p=0 =

´ muito f´acil ver que nas duas somas acima os termos com p ´ımpar cancelam-se mutuamente. Assim, E ficamos com   bm/2c X p  m p (−1) cos m arccos(z) = z m−2p 1 − z 2 , 2p p=0

que ´e o que quer´ıamos. Para provar (8.39) a partir de (8.38), basta ler as linhas acima do fim para o come¸co. 6

8.1.6

O Caso de Equa¸ co ˜es Regulares Gerais

Nas p´aginas acima resolvemos em v´arios exemplos particulares a equa¸ca˜o y 00 (z) + a(z)y 0 (z) + b(z)y(z) = 0

(8.41)

em casos em que os coeficientes a(z) e b(z) s˜ao fun¸co˜es anal´ıticas de z em torno de um ponto z 0 . Para tal, evocando o Teorema 7.3, p´agina 358, procuramos solu¸co˜es na forma de s´eries de potˆencias: y(z) =

∞ X n=0

cn (z − z0 )n .

(8.42)

Vamos agora mostrar como o m´etodo que descrevemos se aplica ao caso geral no qual as fun¸co˜es a(z) e b(z) s˜ao tamb´em dadas em termos de s´eries de potˆencias: a(z) =

∞ X n=0

n

an (z − z0 ) ,

b(z) =

∞ X n=0

bn (z − z0 )n .

Usando novamente (8.4) e (8.5) a equa¸ca˜o (8.41) fica (adotamos daqui para frente z 0 = 0, sem perda de generalidade) ! ! ∞ ! ! ∞ ∞ ∞ ∞ X X X X X n n n n n . (8.43) cn z (n + 1)(n + 2)cn+2 z + an z (n + 1)cn+1 z + bn z n=0

n=0

n=0

n=0

n=0

JCABarata. Curso de F´ısica-Matem´ atica

Para o produto de duas s´eries de potˆencia ∞ X

αp z

p=0

p

!

∞ X

βq z

q

q=0

!

=

P∞

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

p=0

αp z p e

∞ X ∞ X

P∞

α p βq z

q=0

p+q

410/1304

βq z q vale ∞ X

=

p=0 q=0

n=0

n X

αn−m βm

m=0

!

zn .

(8.44)

E. 8.5 Exerc´ıcio. Mostre isso.

6

Assim, (8.43) fica ∞ X

(n + 1)(n + 2)cn+2 z n +

n=0

ou seja,

n ∞ X X n=0

∞ h X

o que implica

m=0

(n + 1)(n + 2)cn+2 +

n=0

an−m (m + 1)cm+1

n X

!

zn +

n=0

(m + 1)an−m cm+1 +

m=0

cn+2

∞ X

n X

m=0

n X

bn−m cm

m=0

!

z n = 0,

i

bn−m cm z n = 0,

n X  1 = − (m + 1)an−m cm+1 + bn−m cm (n + 1)(n + 2) m=0

(8.45)

para todo n ≥ 0. Observe que essa express˜ao determina cn+2 em termos de c0 , c1 , . . . , cn+1 . Assim, apenas fixando c0 e c1 podemos determinar todos os demais coeficientes cn atrav´es da express˜ao recursiva acima. Como dissemos, que nos conduziram ao Teorema 7.3, p´agina 358, garantem-nos que P∞ os resultados n a s´erie y(z) = e convergente na mesma regi˜ao em que convergem as s´eries n=0 cn z assim obtida ´ de a(z) e b(z), de modo que n˜ao precisamos provar isso. Alguns autores (por exemplo, usam P∞ [112]) n as express˜oes recursivas (8.45) para demonstrar a convergˆencia da s´erie y(z) = n=0 cn z . Como dissemos, pelo nosso proceder isso n˜ao ´e mais necess´ario, mas o estudante interessado ´e convidado a estudar essa outra (elegante) demonstra¸ca˜o no texto supracitado. Para futura referˆencia, resumimos nossas conclus˜oes sobre equa¸co˜es regulares no seguinte teorema. Teorema 8.1 (Solu¸ c˜ ao de equa¸ co ˜es regulares por expans˜ ao em s´ erie de potˆ encias) Considerese a equa¸ca ˜o diferencial y 00 (z) + a(z)y 0 (z) + b(z)y(z) = 0 , (8.46) z ∈ , com a(z) e b(z) anal´ıticas em torno de z0 e expressas em termos de suas s´eries de Taylor em torno de z0 como ∞ ∞ X X n a(z) = an (z − z0 ) , b(z) = bn (z − z0 )n , n=0

n=0

s´eries estas supostas absolutamente convergentes em |z − z0 | < r, para algum r > 0. Ent˜ ao a solu¸ca ˜o geral da equa¸ca ˜o (8.46) pode ser expressa em termos de uma expans˜ ao em s´erie de potˆencias em z − z 0 : y(z) =

∞ X n=0

cn (z − z0 )n ,

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

411/1304

onde os coeficientes cn podem ser obtidos atrav´es das rela¸co ˜es recursivas cn+2

n X  1 = − (m + 1)an−m cm+1 + bn−m cm , (n + 1)(n + 2) m=0

∀n≥0,

a partir dos dois primeiros coeficientes c0 e c1 , arbitr´ arios. A expans˜ ao em s´erie de potˆencias para y(z) converge absolutamente pelo menos na regi˜ ao |z − z0 | < r, onde representa uma fun¸ca ˜o anal´ıtica. 2

8.2

Solu¸ c˜ ao de Equa¸ co ˜es Singulares Regulares. O M´ etodo de Frobenius

Na presente se¸ca˜o ilustraremos o Teorema 7.4, p´agina 361, estudando a solu¸ca˜o, por um m´etodo devido a Frobenius6 , de algumas equa¸co˜es diferenciais ordin´arias, homogˆeneas de segunda ordem e singulares regulares de interesse (especialmente em F´ısica). Boa parte dos m´etodos apresentados nos exemplos aplicam-se a equa¸co˜es de ordem maior que dois, mas n˜ao trataremos de tais generaliza¸co˜es aqui pois elas pouco apresentam de especial e seu interesse na F´ısica ´e reduzido. Vale aqui novamente a advertˆencia sobre a omiss˜ao de alguns detalhes de c´alculos, sendo o estudante novamente convidado a complet´a-los como exerc´ıcio (todos merecem ser feitos ao menos uma vez na vida). Todas as equa¸co˜es particulares tratadas e suas solu¸co˜es s˜ao amplamente discutidos na vasta literatura pertinente, por exemplo, aquela listada a` p´agina 395. Conforme demonstramos em p´aginas anteriores (Teorema 7.3, p´agina 358), se a equa¸ca˜o diferencial linear homogˆenea de segunda ordem y 00 (z) +

b(z) a(z) 0 y (z) + y(z) = 0 (z − z0 ) (z − z0 )2

(8.47)

for tal que a(z) e b(z) s˜ao fun¸co˜es anal´ıticas de z em torno de um ponto z0 , ent˜ao o coeficiente

a(z) (z−z0 )

b(z) tem no m´aximo uma singularidade de tipo polo de ordem 1 em z0 e o coeficiente (z−z aximo 2 tem no m´ 0) uma singularidade de tipo polo de ordem 2 em z0 . Assim, pelas nossas defini¸co˜es pr´evias, z0 ´e um ponto singular regular da equa¸ca˜o (8.47). Nesse caso, o Teorema 7.3, p´agina 358, diz-nos que ou a equa¸ca˜o (8.47) tem duas solu¸co˜es independentes da forma

y(z) = (z − z0 )

γ

∞ X n=0

cn (z − z0 )n .

(8.48)

P n onde γ ∈ e a s´erie ∞ e absolutamente convergente para |z − z0 | < r (e, portanto, repren=0 cn (z − z0 ) ´ senta uma fun¸ca˜o anal´ıtica em torno de z0 ) ou ent˜ao a equa¸ca˜o (8.47) tem duas solu¸co˜es independentes, uma da forma (8.48) e outra da forma y(z) = (z − z0 )γ (ln(z − z0 )) 6

Ferdinand Georg Frobenius (1849-1917).

∞ X n=0

cn (z − z0 )n + (z − z0 )γ

0

∞ X n=0

vn (z − z0 )n .

(8.49)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

412/1304

P P∞ n n onde, novamente as s´eries ∞ ao absolutamente convergentes para n=0 cn (z − z0 ) e n=0 vn (z − z0 ) s˜ |z − z0 | < r (e, portanto, representam fun¸co˜es anal´ıticas em torno de z0 ). Em ambos os casos acima r > 0 ´e o raio do maior disco aberto centrado em z0 dentro do qual a(z) e b(z) s˜ao anal´ıticas. O chamado m´etodo de Frobenius consiste precisamente em inserir-se o Ansatz (8.48) na equa¸ca˜o (8.47) e determinar recursivamente os coeficientes cn , assim como o expoente γ. Caso duas solu¸co˜es distintas sejam encontradas dessa forma, o problema est´a resolvido. Caso se encontre apenas uma solu¸ca˜o, ent˜ao uma segunda solu¸ca˜o da forma (8.49) deve ser procurada atrav´es da determina¸ca˜o recursiva dos coeficientes cn e vn , assim como dos expoentes γ e γ 0 . Ao contr´ario do que fizemos no caso de equa¸co˜es regulares, quando primeiro exploramos exemplos particulares para depois tratarmos do caso geral, ´e mais conveniente no presente contexto que nos apoderemos primeiramente da an´alise geral para depois tratarmos de equa¸co˜es espec´ıficas, pois uma vis˜ao pr´evia das complica¸co˜es envolvidas nos auxiliar´a a evitar certas armadilhas ocultas no tratamento de equa¸co˜es singulares regulares particulares7 . Ilustraremos o m´etodo de Frobenius apresentando a resolu¸ca˜o da equa¸ca˜o de Euler, da equa¸ca˜o de Bessel, da equa¸ca˜o de Laguerre e das equa¸co˜es hipergeom´etrica e hipergeom´etrica confluente, todas de interesse em F´ısica. O principal teorema que demonstraremos, o qual resume os resultados do m´etodo de Frobenius e expressa a solu¸ca˜o de uma equa¸ca˜o singular regular homogˆenea de segunda ordem geral, ´e o seguinte: Teorema 8.2 (Solu¸ c˜ ao de equa¸ co ˜es singulares regulares pelo m´ etodo de Frobenius) Seja a equa¸ca ˜o diferencial (z − z0 )2 y 00 (z) + (z − z0 )a(z)y 0 (z) + b(z)y(z) = 0 , (8.50) z ∈ , com a(z) e b(z) anal´ıticas em torno de z0 e expressas em termos de suas s´eries de Taylor em torno de z0 como ∞ ∞ X X n a(z) = an (z − z0 ) , b(z) = bn (z − z0 )n , n=0

n=0

s´eries estas supostas absolutamente convergentes em |z − z0 | < r, para algum r > 0. Seja definido o polinˆ omio de segundo grau

f (x) := x(x − 1) + a0 x + b0 = x2 + (a0 − 1)x + b0 , e considere-se a equa¸ca ˜o alg´ebrica f (x) = 0 ,

(8.51)

a qual ´e denominada equa¸ca˜o indicial. Sejam γ± as solu¸co ˜es dessa equa¸ca ˜o no plano complexo: γ− =

1 − a0 −

p

(a0 − 1)2 − 4b0 2

e

γ+ =

1 − a0 +

p (a0 − 1)2 − 4b0 . 2

Ent˜ ao a equa¸ca ˜o (8.50) possui duas solu¸co ˜es independentes y 1 (z) e y2 (z), v´ alidas pelo menos na regi˜ ao 0 < |z − z0 | < r. A forma dessas solu¸co ˜es varia conforme as seguintes condi¸co ˜es complementares sobre γ− e γ+ : 1. γ− − γ+ 6∈ , 2. γ− − γ+ = 0 ou 3. γ− − γ+ ∈ \ {0}, como enumeramos a seguir: 7

O estudante ´e convidado a n˜ ao entrar em pˆ anico diante da aparente complexidade de algumas express˜ oes que obteremos. Na maioria das equa¸co ˜es diferenciais de interesse as fun¸co ˜es a(z) e b(z) s˜ ao apenas polinˆ omios de grau 0, 1 ou 2 e as express˜ oes obtidas no tratamento geral se simplificam um tanto.

JCABarata. Curso de F´ısica-Matem´ atica

1. Caso γ− − γ+ 6∈

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

413/1304

.

Nesse caso tem-se y1 (z) = (z − z0 )

γ−

∞ X n=0

cn (γ− )(z − z0 )

onde cn (γ± ) = −

n

y2 (z) = (z − z0 )

e

γ+

∞ X n=0

cn (γ+ )(z − z0 )n , (8.52)

n−1 h i X 1 (m + γ± )an−m + bn−m cm (γ± ) , f (γ± + n) m=0

(8.53)

para todo n ≥ 1. Essas express˜ oes recursivas permitem-nos obter todos os c n (γ− ) a partir de um c0 (γ− ) n˜ ao-nulo arbitr´ ario e, respectivamente, todos os cn (γ+ ) a partir de um c0 (γ+ ) n˜ ao-nulo arbitr´ ario. 2. Caso γ− − γ+ = 0. p Neste caso (a0 − 1)2 − 4b0 = 0 e γ− = γ+ = γ0 com γ0 :=

1 − a0 2

e tem-se y1 (z) = (z−z0 )

γ0

∞ X

cn (γ0 ) (z−z0 )

n

e

y2 (z) = y1 (z) ln(z−z0 )+(z−z0 )

γ0

n=0

onde

para todo n ≥ 1, e

∞ X

vn (γ0 ) (z−z0 )n ,

n=0

n−1 h i X 1 (m + γ0 )an−m + bn−m cm (γ0 ) cn (γ0 ) = − f (γ0 + n) m=0

" n X   1 vn (γ0 ) = − − 2(n + γ0 ) − 1 cn (γ0 ) − an−m cm (γ0 ) f (γ0 + n) m=0 +

n−1 h X

m=0

i

#

(m + γ0 )an−m + bn−m vm (γ0 ) ,

(8.54) (8.55)

∀ n ≥ 1 , (8.56)

onde os coeficientes cn (γ0 ) s˜ ao obtidos recursivamente a partir de um c0 (γ0 ) n˜ ao-nulo arbitr´ ario e os coeficientes vn (γ0 ) s˜ ao obtidos recursivamente a partir dos coeficientes cm (γ0 ) e a partir de um v0 (γ0 ) arbitr´ ario (mas que pode ser escolhido igual a zero). 3. Caso γ− − γ+ ∈

\ {0}. p Neste caso γ− − γ+ = − (a0 − 1)2 − 4b0 ´e um inteiro n˜ ao-nulo. Definamos ent˜ ao p n0 = (a0 − 1)2 − 4b0 .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

414/1304

Claro est´ a que n0 ∈ {1, 2, 3, 4, . . .}. Definamos tamb´em γ1 := γ− ,

γ2 := γ+ ,

γ1 := γ+ ,

γ2 := γ− ,

caso γ− − γ+ ≥ 1,

ou (8.57)

caso γ+ − γ− ≥ 1.

Com essas defini¸co ˜es tem-se γ1 = γ 2 + n0 . Ent˜ ao, y1 (z) = (z −z0 ) onde

γ1

∞ X n=0

cn (γ1 )(z −z0 )

n

e

y2 (z) = Ay1 (z) ln(z −z0 )+(z −z0 )

γ2

∞ X n=0

vn (z −z0 )n ,

n−1 h i X 1 (m + γ1 )an−m + bn−m cm (γ1 ) , cn (γ1 ) = − f (γ1 + n) m=0

para n ≥ 1 e  n−1   X  1   − (m + γ2 )an−m + bn−m vm ,     f (γ2 + n) m=0     arbitr´ario , vn =     " #  n−1  X   1   (m + γ2 )an−m + bn−m vm ,   − f (γ + n) −Agn−n0 + 2 m=0

(8.58) (8.59)

para 1 ≤ n ≤ n0 − 1 , para n = n0 , para n > n0 , (8.60)

onde,

e

nX 0 −1 1 [(m + γ2 )an0 −m + bn0 −m ] vm A = − c0 (γ1 ) n0 m=0

gn = [2(n + γ1 ) − 1] cn (γ1 ) +

n X

m=0

an−m cm (γ1 ) ,

n≥0.

(8.61)

(8.62)

As express˜ oes recursivas para cn (γ1 ) dependem de um c0 (γ1 ) n˜ ao-nulo e arbitr´ ario e as express˜ oes recursivas para vn dependem tamb´em de um v0 arbitr´ ario. Todas as s´eries de potˆencia em z − z0 apresentadas acima convergem absolutamente pelo menos na regi˜ ao |z − z0 | < r e nela representam, portanto, fun¸co ˜es anal´ıticas. 2 Para a demonstra¸ca˜o desse teorema devotaremos toda a Se¸ca˜o 8.2.1. Em uma primeira leitura o estudante poder´a dispensar-se de um estudo detalhado da demonstra¸ca˜o e passar mais rapidamente aos exemplos discutidos na Se¸ca˜o 8.2.2, p´agina 424, e seguintes.

JCABarata. Curso de F´ısica-Matem´ atica

8.2.1

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

415/1304

Equa¸ co ˜es Singulares Regulares. O Caso Geral

Daqui para frente, sem perda de generalidade, adotaremos z0 = 0. Seja, ent˜ao, a equa¸ca˜o (8.47) escrita agora na forma z 2 y 00 (z) + za(z)y 0 (z) + b(z)y(z) = 0

(8.63)

com a(z) e b(z) anal´ıticas em torno de z0 = 0 e expressas em termos de suas s´eries de Taylor em torno de 0 como ∞ ∞ X X n a(z) = an z , b(z) = bn z n . n=0

n=0

Sob a luz do Teorema 7.4, p´agina 361, procuraremos primeiramente uma solu¸ca˜o na forma ∞ X

y(z) =

cn z n+γ .

(8.64)

n=0

Antes de iniciarmos nossa an´alise, comentemos que, sem perda de generalidade, podemos sempre adotar o primeiro coeficiente, c0 , como n˜ao-nulo: c0 6= 0. Isso se deve ao seguinte. Se cm fosse o primeiro coeficiente n˜ao-nulo, ter´ıamos ∞ X y(z) = cn z n+γ . n=m

Agora, com a mudan¸ca de vari´avel n0 = n − m ficar´ıamos com ∞ X

y(z) =

0

cn0 +m z n +(γ+m)

n0 =0

redefinindo c0n0 := cn0 +m e γ 0 = γ + m, ficar´ıamos com y(z) =

∞ X

0 0 c0n0 z n +γ

n0 =0

=

∞ X

0

c0n z n+γ .

n=0

A u ´ ltima express˜ao possui a mesma estrutura de (8.64) mas, como se vˆe, o primeiro coeficiente ´e 0 c0 = cm , que ´e n˜ao-nulo, por hip´otese. Isto posto, passemos a analisar o que se passa inserindo a express˜ao (8.64) em (8.63). Para (8.64) valem ∞ X y 0 (z) = (n + γ)cn z n+γ−1 (8.65) n=0

e

00

y (z) =

∞ X n=0

a equa¸ca˜o (8.63) fica ∞ X n=0

(n + γ)(n + γ − 1)cn z

n+γ

+

∞ X n=0

(n + γ)(n + γ − 1)cn z n+γ−2 ,

an z

n

!

∞ X n=0

(n + γ)cn z

n+γ

+

∞ X n=0

(8.66)

bn z

n

!

∞ X n=0

cn z n+γ = 0.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

416/1304

Usando novamente (8.44), isso fica ∞ X n=0

(n + γ)(n + γ − 1)cn z n+γ +

∞ n X X n=0

an−m (m + γ)cm

m=0

!

z n+γ +

∞ X n=0

n X

bn−m cm

m=0

!

z n+γ = 0.

ou seja, ∞ X n=0

"

n X

(n + γ)(n + γ − 1)cn +

an−m (m + γ)cm

m=0

!

+

n X

bn−m cm

m=0

!#

z n+γ = 0

que implica

h

h

i γ(γ − 1) + a0 γ + b0 c0 = 0 , i

(n + γ)(n + γ − 1) + a0 (n + γ) + b0 cn = −

n−1 h X

m=0

i an−m (m + γ) + bn−m cm ,

∀n ≥ 1 .

para todo n ≥ 0. Como c0 6= 0, temos que γ(γ − 1) + a0 γ + b0 = 0 , h

(8.67)

n−1 h i i X (n + γ)(n + γ − 1) + a0 (n + γ) + b0 cn = − an−m (m + γ) + bn−m cm , m=0

∀ n ≥ 1 . (8.68)

A equa¸ca˜o (8.67) ´e denominada na literatura equa¸ca ˜o indicial, por ser uma equa¸ca˜o alg´ebrica (de segundo grau) para o ´ındice γ. Antes de escrevermos a solu¸ca˜o dessa equa¸ca˜o, denotemos por f o polinˆomio de segundo grau f (x) = x(x − 1) + a0 x + b0 = x2 + (a0 − 1)x + b0 . As equa¸co˜es (8.67) e (8.68) podem, claramente, ser reescritas como f (γ) = 0 , f (γ + n) cn = −

n−1 h X

m=0

(8.69) i an−m (m + γ) + bn−m cm ,

∀n ≥ 1 .

(8.70)

A equa¸ca˜o f (γ) = 0 ´e uma equa¸ca˜o alg´ebrica de segundo grau, cujas solu¸co˜es s˜ao p p 1 − a0 − (a0 − 1)2 − 4b0 1 − a0 + (a0 − 1)2 − 4b0 γ− = e γ+ = . 2 2 Assim, a equa¸ca˜o indicial f (γ) = 0 obriga o ´ındice γ a ser γ− ou γ+ . H´a dois casos a considerar: o caso γ− − γ+ 6∈ e o caso γ− − γ+ ∈ . Trataremos primeiramente do caso γ− − γ+ 6∈ , que ´e o mais simples.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

417/1304

• O caso γ− − γ+ 6∈ Como a diferen¸ca γ− − γ+ n˜ao ´e um n´ umero inteiro, tem-se em particular que γ− 6= γ+ . Fora isso, como γ− e γ+ s˜ao os dois u ´ nicos zeros (distintos) do polinˆomio f (x), tem-se que f (γ± + n) 6= 0 para todos n ≥ 1 inteiros. Se assim n˜ao fosse e houvesse n0 ∈ com, digamos, f (γ+ + n0 ) = 0 valeria γ− = γ+ + n0 , ou seja, γ− − γ+ = n0 , que ´e inteiro: uma contradi¸ca˜o. Com isso, podemos de (8.70) obter n−1 h i X 1 an−m (m + γ± ) + bn−m cm (γ± ) cn (γ± ) = − f (γ± + n) m=0 n−1 h i X 1 = − a (m + γ ) + b n−m ± n−m cm (γ± ) , (γ± + n)2 + (a0 − 1)(γ± + n) + b0 m=0

(8.71)

para todo n ≥ 1. Essas express˜oes recursivas permitem-nos obter todos os c n (γ− ) a partir de um c0 (γ− ) n˜ao-nulo arbitr´ario e, respectivamente, todos os cn (γ+ ) a partir de um c0 (γ+ ) n˜ao-nulo arbitr´ario. Conclu´ımos assim, que no caso γ− − γ+ 6∈ a equa¸ca˜o diferencial (8.63) (com z0 = 0) possui duas solu¸co˜es linearmente independentes y1 (z) e y2 (z), dadas por y1 (z) =

∞ X n=0

cn (γ− )z n+γ−

e

y2 (z) =

∞ X

cn (γ+ )z n+γ+ ,

n=0

com cn (γ± ) dadas por (8.71), a solu¸ca˜o geral sendo uma combina¸ca˜o linear de ambas. As constantes c0 (γ− ) e c0 (γ+ ) s˜ao n˜ao-nulas e arbitr´arias. • O caso γ− − γ+ ∈ O caso γ− −γ+ ∈ com o primeiro.

subdivide-se em dois: o caso γ− −γ+ = 0 e o caso γ− −γ+ ∈

\{0}. Comecemos

• O caso γ− = γ+ O caso γ− = γ+ ocorre se e somente se (a0 − 1)2 − 4b0 = 0 e, portanto, tem-se γ− = γ+ = γ0 , com γ0 :=

1 − a0 . 2

(8.72)

Note-se que se (a0 − 1)2 − 4b0 = 0 a equa¸ca˜o f (x) = 0 tem apenas γ0 por raiz e, portanto, f (n + γ0 ) 6= 0 para todo n ≥ 1. Conseq¨ uentemente, os coeficientes cn com n ≥ 1 ser˜ao dados recursivamente por (vide (8.70)) n−1 h i X 1 an−m (m + γ0 ) + bn−m cm (γ0 ) cn (γ0 ) = − f (γ0 + n) m=0

= −



1 2 (γ0 + n) + (a0 − 1)(γ0 + n) + b0

 X n−1 h m=0

i

an−m (m + γ0 ) + bn−m cm (γ0 ) ,

(8.73)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

418/1304

para todo n ≥ 1. Como se constata, a u ´ ltima express˜ao relaciona cn com os coeficientes anteriores cn−1 , . . . , c0 . Assim, fixando apenas c0 todos os demais est˜ao determinados. Obtemos dessa forma, para o caso (a0 − 1)2 − 4b0 = 0 a solu¸ca˜o y1 (z) =

∞ X

cn (γ0 ) z n+γ0 ,

(8.74)

n=0

onde os coeficientes cn (γ0 ) s˜ao obtidos recursivamente de (8.73) a partir de um c0 arbitr´ario. Pelo Teorema 7.4, p´agina 361, a s´erie acima ser´a convergente (ao menos na regi˜ao onde as s´eries de a(z) e b(z) convergem). Com esse proceder obtivemos apenas uma solu¸ca˜o da equa¸ca˜o diferencial (8.63). Como a mesma ´e de segunda ordem, uma segunda solu¸ca˜o dever´a existir. Novamente, o Teorema 7.4, p´agina 361, indica-nos que essa segunda solu¸ca˜o pode ter uma singularidade logar´ıtmica. Podemos procurar essa segunda solu¸ca˜o seguindo um procedimento devido a D’Alembert8 , que consiste em procurar solu¸co˜es da forma y2 (z) = Ay1 (z) ln(z) + v(z) , (8.75) sendo y1 (z) a solu¸ca˜o j´a conhecida em (8.74) e onde A ´e uma constante a ser determinada, assim como a fun¸ca˜o v(z). Note-se que o Ansatz (8.75) est´a de acordo com o Teorema 7.4, p´agina 361, que prevˆe a ocorrˆencia de solu¸co˜es com uma singularidade logar´ıtmica. A especialidade do Ansatz de D’Alembert est´a em espertamente9 prever que o fator que multiplica ln(z) ´e a primeira solu¸ca˜o y1 (z). Substituindo (8.75) na equa¸ca˜o (8.63), obtem-se a seguinte equa¸ca˜o para v(z):   z 2 v 00 (z) + za(z)v 0 (z) + b(z)v(z) = −A 2zy10 (z) + (a(z) − 1)y1 (z) . E. 8.6 Exerc´ıcio. Verifique!

(8.76) 6

Como facilmente se verifica, o lado direito ´e dado pela expans˜ao −A

∞ X

fn z n+γ0 ,

(8.77)

n=0

onde fn = [2(n + γ0 ) − 1] cn (γ0 ) +

n X

an−m cm (γ0 ) .

(8.78)

m=0

P n+γ0 . A equa¸ca˜o (8.77) sugere que uma solu¸ca˜o para v(z) deve ser procurada na forma v(z) = ∞ n=0 vn z Inserindo isso em (8.76) tem-se " # ∞ ∞ n h i X X X fn z n+γ0 , (n + γ0 )(n + γ0 − 1)vn + (m + γ0 )an−m + bn−m vm z n+γ0 = −A n=0

8

m=0

n=0

Jean Le Rond d’Alembert (1717-1783). Na literatura matem´ atica o truque ´e por vezes denominado m´etodo de redu¸ca ˜o de D’Alembert e pode ser usado em v´ arias equa¸co ˜es diferenciais de segunda ordem para se obter uma segunda solu¸ca ˜o da equa¸ca ˜o a partir de uma primeira solu¸ca ˜o conhecida. 9

JCABarata. Curso de F´ısica-Matem´ atica

que implica (n + γ0 )(n + γ0 − 1)vn +

n h X

m=0

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

419/1304

i

(m + γ0 )an−m + bn−m vm = −Afn

para todo n ≥ 0. Para n = 0 a rela¸ca˜o acima ´e h i γ0 (γ0 − 1) + a0 γ0 + b0 v0 = −Af0 ,

que ´e uma identidade trivial, j´a que γ0 (γ0 − 1) + a0 γ0 + b0 = 0 e que f0 = γ0 [2γ0 − 1 + a0 ] c0 (γ0 ) = 0, por (8.72). Para n ≥ 1 tem-se, por´em, #   " n−1 h i X 1 vn = − −Afn + (m + γ0 )an−m + bn−m vm , ∀ n ≥ 1 , (γ0 + n)2 + (γ0 + n)(a0 − 1) + b0 m=0 (8.79) o que permite obter recursivamente todos os vn a partir de v0 . Expressando-se os fn ’s como em (8.78), tem-se

vn (γ0 ) = −



1 2 (γ0 + n) + (γ0 + n)(a0 − 1) + b0

 "

+

−[2(n + γ0 ) − 1] cn (γ0 ) −

n−1 h X

i

n X

#

(m + γ0 )an−m + bn−m vm ,

m=0

an−m cm (γ0 )

m=0

∀ n ≥ 1 , (8.80)

que expressa os vn ’s em termos dos coeficientes cn (γ0 ) de y1 (z), os quais, por sua vez, s˜ao dados pelas rela¸co˜es recursivas (8.73)10 , e de v0 (γ0 ) arbitr´ario. Observemos, por fim, que A deve, nesse caso, ser for¸cosamente n˜ao-nulo, pois se tom´assemos A = 0 ver´ıamos por (8.80) que os coeficientes vn satisfazem as mesmas rela¸co˜es de recorrˆencia dos cn (γ0 ). Assim, v(z) e y1 (z) n˜ao seriam linearmente independentes. Podemos, portanto, adotar sem perda de generalidade A = 1. Resumindo nossas conclus˜oes, caso (a0 − 1)2 − 4b0 = 0, a solu¸ca˜o da equa¸ca˜o diferencial (8.63) (com z0 = 0) possui duas solu¸co˜es linearmente independentes y1 (z) e y2 (z), dadas por y1 (z) =

∞ X

cn (γ0 )z

n+γ0

n=0

e

y2 (z) = y1 (z) ln(z) +

∞ X

vn (γ0 )z n+γ0 ,

n=0

com γ0 = (1 − a0 )/2, com os cn (γ0 )’s dados em (8.73) e com os vn (γ0 )’s dados em (8.80), tomando-se A = 1. As constantes c0 (γ) e v0 (γ) s˜ao n˜ao-nulas e arbitr´arias. ´ de se notar que, como A ´e n˜ao-nulo, uma das solu¸co˜es possui uma singularidade logar´ıtmica. E • O caso γ− − γ+ ∈ 10

\ {0}

Vide nota de rodap´e da p´ agina 412.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

420/1304

Esse u ´ ltimo caso, com a generalidade com que o abordamos aqui, ´e o mais complexo e o estudante poder´a dispensar seu estudo detalhado em uma primeira leitura, atendo-se preferencialmente aos exemplos das equa¸co˜es de Bessel e Laguerre, das quais trataremos adiante. O caso γ− − γ+ ∈ \ {0} ´e semelhante ao caso anterior onde γ− = γ+ , a principal diferen¸ca sendo que aqui podem ocorrer situa¸co˜es onde A = 0, de modo que ambas as solu¸co˜es podem ser livres de singularidades logar´ıtmicas. De fato, sabe-se de equa¸co˜es particulares onde tem-se A = 0 (um exemplo sendo a equa¸ca˜o de Bessel de ordem 1/2) e de equa¸co˜es particulares onde tem-se A 6= 0 (um exemplo sendo a equa¸ca˜o de Bessel de ordem 1). p Comecemos com algumas defini¸co˜es. O caso γ− − γ+ ∈ \ {0} s´o pode ocorrer se (a0 − 1)2 − 4b0 for um inteiro n˜ao nulo. Definamos ent˜ao p n0 = (a0 − 1)2 − 4b0 . Claro est´a que n0 ∈ {1, 2, 3, 4, . . .}. Como γ− − γ+ ´e um inteiro n˜ao-nulo, definamos tamb´em γ1 := γ− ,

γ2 := γ+ ,

caso γ− − γ+ ≥ 1,

γ1 := γ+ ,

γ2 := γ− ,

caso γ+ − γ− ≥ 1.

ou (8.81)

Com essas defini¸co˜es, est´a sempre garantido que γ1 = γ 2 + n0 . Isso diz-nos que para todo n ≥ 1 a express˜ao f (γ1 +n) n˜ao pode se anular, pois se assim o fosse ter´ıamos for¸cosamente γ1 + n = γ2 , ou seja, n = −n0 , um absurdo, j´a que n0 ≥ 1. Por outro lado, existe um u ´ nico valor de n para o qual f (γ2 + n) se anula, a saber n = n0 . Com isso em mente, vemos que para a solu¸ca˜o γ = γ1 da equa¸ca˜o indicial, a express˜ao (8.70) permite-nos obter todos os coeficientes cn a partir de um c0 n˜ao nulo: n−1 h i X 1 an−m (m + γ1 ) + bn−m cm (γ1 ) cn (γ1 ) = − f (γ1 + n) m=0

= −

n−1 h i X 1 a (m + γ ) + b n−m 1 n−m cm (γ1 ) , (γ1 + n)2 + (a0 − 1)(γ1 + n) + b0 m=0

(8.82)

para todo n ≥ 1. Isso fornece-nos a primeira solu¸ca˜o da equa¸ca˜o diferencial (8.63) (com z 0 = 0): y1 (z) =

∞ X

cn (γ1 )z n+γ1 ,

(8.83)

n=0

com os cn (γ1 ) dados em (8.82) em termos de c0 (γ1 ), arbitr´ario mas n˜ao-nulo. Passemos a procurar a segunda solu¸ca˜o independente da equa¸ca˜o diferencial (8.63). O caso da solu¸ca˜o γ = γ2 da equa¸ca˜o indicial requer cuidado pois, como comentamos, vale que f (γ2 + n0 ) = 0. Assim, para n = n0 a equa¸ca˜o (8.70) s´o faz sentido se o lado direito for igualmente nulo: nX 0 −1h i an0 −m (m + γ2 ) + bn0 −m cm (γ2 ) = 0 . (8.84) m=0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

421/1304

Essa rela¸ca˜o pode ou n˜ao ser satisfeita, dependendo da equa¸ca˜o diferencial tratada. Por exemplo, no caso da equa¸ca˜o de Bessel de ordem semi-inteira (ou seja, de ordem 1/2, 3/2, 5/2 etc.) verifica-se que a rela¸ca˜o (8.84) ´e satisfeita. J´a no caso da equa¸ca˜o de Bessel de ordem inteira verifica-se que a rela¸ca˜o (8.84) n˜ ao ´e satisfeita. Isso ser´a discutido explicitamente na Se¸ca˜o 8.2.3, p´agina 427. Devemos, portanto, separar provisoriamente os dois casos: aquele no qual (8.84) ´e satisfeita e aquele no qual n˜ao ´e. Posteriormente veremos que essa separa¸ca˜o ´e sup´erflua, mas por ora ela ´e logicamente necess´aria. Na situa¸ca˜o feliz em que (8.84) ´e satisfeita, o coeficiente cn0 (γ2 ) fica indeterminado e pode ser escolhido livremente, j´a que as equa¸co˜es recursivas (8.70) n˜ao o fixam e nada mais h´a para fix´a-los. Com isso, as equa¸co˜es recursivas (8.70) determinam todos os demais coeficientes c n (γ2 ), n ≥ 1, n 6= n0 , a partir de um c0 (γ2 ) n˜ao-nulo mas arbitr´ario. Assim, obtemos a solu¸ca˜o y2 (z) =

∞ X

cn (γ2 )z n+γ2 ,

(8.85)

n=0

com cn (γ2 ) = −

n−1 h i X 1 an−m (m + γ2 ) + bn−m cm (γ2 ) f (γ2 + n) m=0

n−1 h i X 1 = − an−m (m + γ2 ) + bn−m cm (γ2 ) , (γ2 + n)2 + (a0 − 1)(γ2 + n) + b0 m=0

(8.86)

para todo n ≥ 1, n 6= n0 e cn0 (γ2 ) = constante arbitr´aria11 .

Resta-nos ainda tratar do caso em que a rela¸ca˜o (8.84) n˜ ao ´e satisfeita. Aqui, devemos proceder como fizemos no caso γ− = γ+ e procurar uma solu¸ca˜o na forma y2 (z) = Ay1 (z) ln(z) + v(z), com A sendo uma constante e y1 sendo a solu¸ca˜o j´a conhecida (8.83). Substituindo isso na equa¸ca˜o (8.63), obtem-se novamente a equa¸ca˜o (8.76) para v(z). Como facilmente se verifica, o lado direito de (8.76) ´e dado pela expans˜ao = −A

∞ X

gn (γ1 ) = [2(n + γ1 ) − 1] cn (γ1 ) +

n X

−A

∞ X

gn (γ1 )z

n+γ1

n=0

gn (γ1 )z n+n0 +γ2 ,

(8.87)

n=0

onde, como antes,

m=0

an−m cm (γ1 ) ,

n≥0,

(8.88)

os coeficientes cm (γ1 ) sendo dados por (8.82). 11

O que ocorre se, por op¸ca ˜o, escolhermos cn0 (γ2 ) n˜ ao-nulo? Nesse caso ter´ıamos um termo a mais em y2 (z) do tipo ˜o y1 (z), ou ˜o geral ao termo c0 (γ1 )z γ1 proveniente da solu¸ca cn0 z n0 +γ2 = cn0 z γ1 . Esse termo se adicionaria na solu¸ca seja, corresponderia a uma nova escolha da constante arbitr´ aria c0 (γ1 ), n˜ ao representando, assim, nenhuma mudan¸ca na solu¸ca ˜o geral.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

422/1304

A equa¸ca˜o (8.87) sugere que uma solu¸ca˜o para v(z) deve ser procurada na forma v(z) =

∞ X

vn z n+γ2 .

n=0

Inserindo isso em (8.76) tem-se ∞ X n=0

"

n X

(n + γ2 )(n + γ2 − 1)vn +

an−m (m + γ2 )vm

m=0

!

n X

+

bn−m vm

m=0

!#

z n+γ2

= −A

∞ X

gn−n0 (γ1 )z n+γ2 ,

n=n0

o que implica (n + γ2 )(n + γ2 − 1)vn +

(n + γ2 )(n + γ2 − 1)vn +

n h X

m=0

n h X

m=0

i (m + γ2 )an−m + bn−m vm = 0,

n = 0, . . . , n0 − 1 ,

i

(m + γ2 )an−m + bn−m vm = −Agn−n0 (γ1 ),

(8.89)

∀n ≥ n0 . (8.90)

Para n = 0 a rela¸ca˜o (8.89) tem a forma h i γ2 (γ2 − 1) + a0 γ2 + b0 v0 = 0,

mas como o fator entre colchetes ´e f (γ2 ) = 0, conclu´ımos que essa rela¸ca˜o ´e trivialmente satisfeita e, assim, v0 pode ser escolhido livremente. Para 1 ≤ n ≤ n0 − 1, (8.89) implica que vn

n−1 h i X 1 (m + γ2 )an−m + bn−m vm = − f (γ2 + n) m=0 n−1 h i X 1 = − (m + γ )a + b 2 n−m n−m vm (γ2 + n)2 + (a0 − 1)(γ2 + n) + b0 m=0

(8.91)

Para n = n0 a rela¸ca˜o (8.90) ´e h

i

(n0 + γ2 )(n0 + γ2 − 1) + a0 (n0 + γ2 ) + b0 vn0 +

nX 0 −1h m=0

i (m + γ2 )an0 −m + bn0 −m vm = −A[2γ1 − 1 + a0 ] c0 (γ1 ) .

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

423/1304

Como (n0 + γ2 )(n0 + γ2 − 1) + a0 (n0 + γ2 ) + b0 = f (n0 + γ2 ) = f (γ1 ) = 0, ficamos apenas com nX 0 −1 m=0

[(m + γ2 )an0 −m + bn0 −m ] vm = −A[2γ1 − 1 + a0 ] c0 (γ1 ) = ∓A

p (a1 − 1)2 − 4b0 c0 (γ1 ) , (8.92)

´ f´acil ver, por´em, que em o sinal ∓ dependendo de se ter γ1 = γ+ ou γ1 = γ− , respectivamente. E p 2 qualquer caso ∓ (a1 − 1) − 4b0 = −n0 . A rela¸ca˜o (8.92) fixa A:   nX 0 −1 1 A = − [(m + γ2 )an0 −m + bn0 −m ] vm , (8.93) c0 (γ1 ) n0 m=0 com os vm fixados na express˜ao (8.91) em fun¸ca˜o de v0 6= 0 arbitr´ario.

O coeficiente vn0 n˜ao ´e fixado por nenhuma das rela¸co˜es anteriores e pode ser escolhido livremente. Sua presen¸ca adiciona um termo do tipo vn0 z n0 +γ2 = vn0 z γ1 a` solu¸ca˜o geral e aplica-se novamente o coment´ario de rodap´e da p´agina 421. Para n > n0 , tem-se ainda por (8.90) " # n−1 h i X 1 −Agn−n0 (γ1 ) + an−m (m + γ2 ) + bn−m vm vn = − f (γ2 + n) m=0

= −



1 2 (γ2 + n) + (γ2 + n)(a0 − 1) + b0

 "

−Agn−n0 (γ1 ) +

n−1 h X

i

an−m (m + γ2 ) + bn−m vm

m=0

#

.

(8.94) com os gn (γ1 ) fixados em (8.88) em termos dos coeficientes cm (γ1 ) da solu¸ca˜o y1 (z). As express˜oes (8.91), (8.93) e (8.94) permitem fixar todos os vn ’s e a constante A em termos de v0 6= 0 e de vn0 , arbitr´arios. Observemos, A n˜ao ´e for¸cosamente nulo, nem pode ser escolhido arbitrariamente. Sobre a constante A vale ainda uma observa¸ca˜o importante. • A condi¸ c˜ ao (8.84) e a constante A Observe o leitor que as rela¸co˜es de recorrˆencia (8.91), que fixam os v m ’s com m = 0, . . . , n0 − 1, s˜ao idˆenticas a`s de (8.86), que fixam todos os cm (γ2 )’s, em particular aqueles com m = 0, . . . , n0 − 1. Os vm ’s s˜ao fixados por um v0 inicial n˜ao-nulo e os cm (γ2 )’s por um c0 (γ2 ) inicial n˜ao-nulo. Contemplando aquelas rela¸co˜es de recorrˆencia, um minuto de medita¸ca˜o nos leva a perceber que todos os v m s˜ao proporcionais a v0 e que todos os cm (γ2 ) s˜ao proporcionais a c0 (γ2 ). Como as rela¸co˜es de recorrˆencia s˜ao idˆenticas, conclu´ımos que v0 vm = cm (γ2 ) para todo m = 0, . . . , n0 − 1 . c0 (γ2 ) Agora, pela express˜ao (8.93), A ´e proporcional a nX 0 −1 m=0

[(m + γ2 )an0 −m + bn0 −m ] vm

n0 −1 v0 X = [(m + γ2 )an0 −m + bn0 −m ] cm (γ2 ) . c0 (γ2 ) m=0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

424/1304

Au ´ ltima soma, por´em, ´e idˆentica a`quela de (8.84)! Assim, percebemos que, sob a hip´otese que (8.84) n˜ao ´e satisfeita, tem-se que A 6= 0.

Por outro lado, se (8.84) ´e satisfeita, ent˜ao A = 0. Mas se A = 0, as rela¸co˜es de recorrˆencia (8.94) tornam-se tamb´em idˆenticas a`quelas de (8.86), que fixam todos os cm (γ2 )’s. Conclu´ımos ent˜ao, que nesse caso em que A = 0 (ou seja, sob (8.63)) vale tamb´em vm =

v0 cm (γ2 ) , c0 (γ2 )

mas agora para todo m ≥ 0. Assim, para A = 0 a solu¸ca˜o y2 (z) = A ln(z)y1 (z)+v(z) reduz-se (a menos de uma constante multiplicativa trivial) a` solu¸ca˜o para y2 (z) dada em (8.85), obtida sob a condi¸ca˜o (8.84). Nesse sentido, a condi¸ca˜o (8.84) ´e sup´erflua e podemos unificar as solu¸co˜es que obtivemos nos casos em que (8.84) ´e ou n˜ao ´e satisfeita e resumir nossas conclus˜oes da seguinte forma: Para γ− − γ+ 6∈ \ {0}, a equa¸ca˜o diferencial (8.63) (com z0 = 0) tem duas solu¸co˜es independentes y1 (z) e y2 (z), onde: y1 (z) =

∞ X

cn (γ1 )z

n+γ1

e

y2 (z) = Ay1 (z) ln(z) +

n=0

∞ X

vn z n+γ2 ,

n=0

onde os cn (γ1 ), n ≥ 1, tamb´em est˜ao definidos em (8.82) a partir de um c0 (γ1 ) n˜ao-nulo arbitr´ario e onde os vn ’s com n ≥ 1, n 6= n0 , e a constante A s˜ao fixados em (8.91), (8.93) e (8.94) em termos de v0 6= 0 e de vn0 , arbitr´arios.

Como mencionamos, h´a casos em que A = 0, exemplos sendo as equa¸ca˜o de Bessel de ordem semi-inteira e a equa¸ca˜o de Euler, para certos parˆametros. Com tudo isso a demonstra¸ca˜o do Teorema 8.2 est´a completa e podemos passar ao estudo de exemplos particulares.

8.2.2

A Equa¸ c˜ ao de Euler Revisitada

A equa¸ca ˜o de Euler12 (de segunda ordem) ´e a equa¸ca˜o diferencial z 2 y 00 (z) + azy 0 (z) + by(z) = 0, onde a e b s˜ao constantes. Comparando com a forma (8.50), vemos que z0 = 0 ´e um ponto singular regular da equa¸ca˜o, vemos que a(z) = a e que b(z) = b. Assim, no presente caso tem-se   a, para n = 0 b, para n = 0 an = , bn = . 0, para n ≥ 1 0, para n ≥ 1 12

Leonhard Euler (1707-1783). Um dos matem´ aticos mais prol´ıficos e influentes de todos os tempos, Euler foi um dos fundadores da teoria das equa¸co ˜es diferenciais e deixou contribui¸co ˜es seminais em in´ umeros campos da Matem´ atica e da F´ısica. A equa¸ca ˜o de Euler apresentada abaixo ´e uma das v´ arias que levam seu nome. H´ a uma outra equa¸ca ˜o de Euler na Mecˆ anica dos Fluidos, assim como f´ ormulas de Euler, invariantes de Euler, m´etodos de Euler, Ans¨ atze de Euler, multiplicadores de Euler, constantes de Euler, a ˆngulos de Euler, problemas de Euler, conjecturas de Euler, teoremas de Euler etc. Boa parte da nota¸ca ˜o matem´ atica usada atualmente ´e tamb´em sua inven¸ca ˜o (por exemplo, o s´ımbolo f 0 para denotar a derivada de uma fun¸ca ˜o f ou o uso da letra e para designar o n´ umero 2, 7182818 . . .).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

425/1304

A equa¸ca˜o de Euler j´a foi resolvida a` p´agina 361, onde encontramos as solu¸co˜es (7.73) e (7.74). Vamos trat´a-la aqui sob a luz do Teorema 8.2, p´agina 412. Se procurarmos uma solu¸ca˜o na forma ∞ X

cn z n+γ ,

(8.95)

(n + γ)cn z n+γ−1

(8.96)

(n + γ)(n + γ − 1)cn z n+γ−2 ,

(8.97)

y(z) =

n=0

com 0

y (z) =

∞ X n=0

e 00

y (z) =

∞ X n=0

a equa¸ca˜o de Euler fica ∞ X n=0

ou seja,

(n + γ)(n + γ − 1)cn z n+γ + ∞ h X n=0

o que implica

∞ X

a(n + γ)cn z n+γ +

n=0

∞ X

bcn z n+γ = 0

n=0

i

(n + γ)(n + γ − 1)cn + a(n + γ)cn + bcn z n+γ = 0, f (n + γ) cn = 0

onde f ´e o polinˆomio de segundo grau.

∀ n ≥ 0.

f (x) := x(x − 1) + ax + b = x2 + (a − 1)x + b . Sem perda de generalidade, podemos sempre adotar c0 6= pois se cm fosse o primeiro coeficiente P∞ P0, 0 ∞ n+γ n˜ao-nulo, a s´erie n=0 cn z poderia ser reescrita como n=0 c0n z n+γ com c0n := cn+m e γ 0 = γ + m, que tem a mesma forma gen´erica mas com c00 6= 0. Assim, devemos impor f (γ) = 0, o que possui duas solu¸co˜es: p p 1 − a − (a − 1)2 − 4b 1 − a + (a − 1)2 − 4b γ− = e γ+ = . 2 2

Se γ− − γ+ n˜ao for um inteiro, a equa¸ca˜o f (γ± + n) = 0 n˜ao ´e satisfeita para nenhum n ≥ 1 inteiro. A raz˜ao ´e a seguinte: f ´e um polinˆomio de segundo grau e, portanto, possui apenas duas solu¸co˜es. Assim, se f (γ± + n) = 0 ter´ıamos γ± + n = γ∓ , o que implica que γ− − γ+ ´e inteiro, uma contradi¸ca˜o. Nesse caso, ent˜ao, temos que adotar cn = 0 para todo n ≥ 1 e as solu¸co˜es da equa¸ca˜o de Euler ficam y1 (z) = z γ−

e

y2 (z) = z γ+ .

(8.98)

No caso de γ− = γ+ = γ0 = (1 − a)/2, tem-se por (8.54) uma solu¸ca˜o na forma y1 (z) = z

γ0

∞ X n=0

cn (γ0 )z

n

e uma segunda na forma

y2 (z) = y1 (z) ln(z) + z

γ0

∞ X n=0

vn (γ0 )z n ,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

426/1304

com os cn dados em (8.55) e os vn dados em (8.56). Observando (8.55), constata-se que nesse caso cn (γ0 ) = 0 para todo n, exceto n = 0, pois apenas a0 e b0 podem ser n˜ao-nulos. Igualmente, observando (8.56) constata-se que vn (γ0 ) ´e proporcional a cn (γ0 ) para todo n ≥ 1 e, com isso, apenas v0 pode ser n˜ao-nulo. Assim, temos nesse caso, tomando c0 = v0 = 1, y1 (z) = z γ0

y2 (z) = z γ0 ln(z) + z γ0 .

e

O termo z γ0 na express˜ao de y2 (z) ´e o pr´oprio y1 (z), de modo que podemos tomar como solu¸co˜es linearmente independentes as seguintes: y1 (z) = z γ0

y2 (z) = z γ0 ln(z) .

e

(8.99)

Por fim, consideremos o caso em que γ− − γ+ ´e um inteiro n˜ao-nulo. Definamos γ1 e γ2 como em p (8.57), com n0 = | (a − 1)2 − 4b|. P∞ γ1 n Ent˜ a o uma solu¸ c a ˜ o ser´ a y (z) = z a a forma y2 (z) = Ay1 (z) ln(z) + 1 n=0 cn (γ1 )z e a outra ter´ P∞ γ2 n z v z onde aqui os c s˜ a o dados em (8.59), os v s˜ a o dados em (8.60) e A ´e dada em (8.61). n n n=0 n

Contemplando (8.59) constata-se que cn (γ1 ) = 0 para todo n ≥ 1, pois apenas a0 e b0 podem ser n˜ao-nulos, sendo que podemos escolher c0 = 1, livremente. Disso conclu´ımos que y1 (z) = z γ1 . Por (8.61) tem-se que A = 0 pois, no caso da equa¸ca˜o de Euler, an0 −m = bn0 −m = 0 para m = 0, . . . , n0 −1. Por (8.60), tem-se analogamente  para 1 ≤ n ≤ n0 − 1 ,  0, arbitr´ario , para n = n0 , vn =  0, para n > n0 , Assim, apenas v0 e vn0 s˜ao arbitr´arios, sendo que v0 deve ser n˜ao-nulo. Escolhendo v0 = 1 e vn0 = 0, segue que y2 (z) = z γ2 . Concluindo, vale aqui que y1 (z) = z γ1

e

y2 (z) = z γ2 .

(8.100)

Todos esses resultados coincidem, como deveria ser, com aqueles obtidos em (7.73) e (7.74), p´agina 361 e seguintes. O estudo das solu¸co˜es da equa¸co˜es de Euler ´e u ´ til na resolu¸ca˜o de equa¸co˜es com singularidades regulares mais gerais como z 2 y 00 (z) + za(z)y 0 (z) + b(z)y(z) = 0 pela seguinte raz˜ao. Pr´oximo ao ponto singular z0 = 0, podemos aproximar a(z) ≈ a0 e b(z) ≈ b0 , j´a que esses s˜ao os primeiros termos das expans˜oes de Taylor de a(z) e b(z). Assim, para |z| pequeno o suficiente, a equa¸ca˜o aproxima-se de z 2 y 00 (z) + a0 z y 0 (z) + b0 y(z) = 0 que ´e uma equa¸ca˜o de Euler com a = a0 e b = b0 . Com isso, vemos que as solu¸co˜es da equa¸ca˜o geral se aproximam para |z| pequeno daquelas encontradas em (8.98), (8.99) ou (8.100), dependendo do caso. Esse proceder permite-nos, face a uma equa¸ca˜o singular regular geral, estudar qual tipo de singularidade deve ocorrer pr´oximo ao ponto singular e, com isso, perceber qual das solu¸co˜es descritas no Teorema 8.2, p´agina 412, se aplica. Em verdade, a resolu¸ca˜o da equa¸ca˜o indicial (8.51) fornece o mesmo tipo de informa¸ca˜o.

JCABarata. Curso de F´ısica-Matem´ atica

8.2.3

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

427/1304

A Equa¸ c˜ ao de Bessel

Uma das equa¸co˜es diferenciais mais importantes dentro da classe que temos estudado ´e a equa¸ca˜o de Bessel, a qual surge em v´arios problemas aplicados. A mesma pode ser encontrada, por exemplo, quando da resolu¸ca˜o da equa¸ca˜o de Helmholtz em duas dimens˜oes em coordenadas polares ou em trˆes dimens˜oes em coordenadas esf´ericas (levando a`s chamadas fun¸co ˜es de Bessel esf´ericas). Vide para tal o Cap´ıtulo 10, p´agina 544. Para alguns coment´arios hist´oricos sobre a origem das equa¸co˜es de Bessel e das fun¸co˜es de Bessel, vide p´agina 523. A equa¸ca˜o diferencial z 2 y 00 (z) + zy 0 (z) + (z 2 − ν 2 )y(z) = 0,

com z ∈ , onde ν ∈ ´e uma constante, ´e denominada equa¸ca ˜o de Bessel13 de ordem ν. Comparando com a forma (8.50), vemos que z0 = 0 ´e um ponto singular regular da equa¸ca˜o, vemos que a(z) = 1 e que b(z) = z 2 − ν 2 . Assim, no presente caso tem-se    −ν 2 , para n = 0 1, para n = 0 1, para n = 2 an = , bn = . 0, para n ≥ 1  0, para n = 1 ou n ≥ 3 A equa¸ca˜o indicial (8.51) conduz a`s solu¸co˜es

γ− = −ν

e

γ+ = ν .

H´a, portanto, trˆes casos a considerar: 1. o caso em que 2ν 6∈ , 2. o caso em que 2ν = 0 e 3. o caso em que 2ν ∈ \ {0}. Observe o leitor que as condi¸co˜es 2 e 3 correspondem a ν semi-inteiro ou inteiro. Os dois casos s˜ao os mais relevantes em F´ısica. O caso de ν inteiro conduz a`s chamadas fun¸co ˜es de Bessel e o caso de ν semi-inteiro conduz a`s chamadas fun¸co ˜es de Bessel esf´ericas as quais surgem, por exemplo, em problemas de propaga¸ca˜o de ondas em duas ou trˆes dimens˜oes, respectivamente. Vide Se¸ca˜o 8.2.4, p´agina 438. Para a origem das fun¸co˜es de Bessel, vide nota hist´orica a` p´agina 523. Caso 1. 2ν 6∈

.

Nesse caso tem-se duas solu¸co˜es y± =

∞ X

cn (±ν)z n±ν ,

n=0

com cn (±ν) dados por (8.53): n−1 h i X 1 cn (±ν) = − (m ± ν)an−m + bn−m cm (±ν) . n(n + ±2ν) m=0

Podemos nos concentrar apenas nos coeficientes cn (+ν), pois os coeficientes cn (−ν) podem ser obtidos fazendo-se ν → −ν. Vale n−1 h i X 1 cn (ν) = − (m + ν)an−m + bn−m cm (ν) , n(n + 2ν) m=0

13

Friedrich Wilhelm Bessel (1784-1846).

(8.101)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

428/1304

e tem-se c1 (ν) = 0 , c2 (ν) = −

1 c0 (ν) , 2(2 + 2ν)

cn (ν) = −

1 cn−2 (ν), n(n + 2ν)

n ≥ 3.

Com isso, fica claro que (−1)k c0 (ν) , (2k)!! (2 + 2ν)(4 + 2ν) · · · (2k + 2ν)

c2k (ν) =

k≥0.

k≥0.

c2k+1 (ν) = 0 ,

E. 8.7 Exerc´ıcio importante. Mostre isso!

6

Au ´ ltima express˜ao pode ser reescrita como c2k (ν) =

(−1)k c0 (ν) , k! 22k (1 + ν)(2 + ν) · · · (k + ν)

c2k+1 (ν) = 0 ,

k≥0.

k≥0,

onde usamos que (2 + 2ν)(4 + 2ν) · · · (2k + 2ν) = 2k (1 + ν)(2 + ν) · · · (k + ν) e tamb´em que (2k)!! = 2k k!. Como a fun¸ca˜o Γ definida em (8.25)-(8.26) satisfaz Γ(k + 1 + ν) = Γ(1 + ν)(1 + ν)(2 + ν) · · · (k + ν) , podemos ainda escrever c2k (ν) =

(−1)k Γ(1 + ν) c0 (ν) , k! 22k Γ(k + 1 + ν)

c2k+1 (ν) = 0 ,

k≥0.

k≥0.

Por conven¸ca˜o hist´orica adota-se c0 (ν) =



1 Γ(1 + ν)

e chega-se com isso a` express˜ao Jν (z) :=

∞ X k=0

 z 2k+ν (−1)k . k! Γ(k + 1 + ν) 2

(8.102)

Essa fun¸ca˜o representa uma das solu¸co˜es da equa¸ca˜o de Bessel de ordem ν para o caso considerado e ´e denominada fun¸ca ˜o de Bessel de primeiro tipo e ordem ν. Como comentamos, uma segunda solu¸ca˜o ´e obtida fazendo-se ν → −ν: ∞  z 2k−ν X (−1)k . J−ν (z) := k! Γ(k + 1 − ν) 2 k=0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

429/1304

Conclu´ımos, assim, com a constata¸ca˜o que a solu¸ca˜o geral da equa¸ca˜o de Bessel de ordem ν para o caso 2ν 6∈ ´e α1 Jν (z) + α2 J−ν (z) , onde α1 e α2 s˜ao constantes arbitr´arias. Por conven¸ca˜o hist´orica, ´e costume considerar-se tamb´em uma combina¸ca˜o linear particular de J±ν (z), a saber a seguinte: Jν (z) cos(νπ) − J−ν (z) . (8.103) Nν (z) := sen (νπ) Essa fun¸ca˜o Nν (z) tamb´em representa uma das solu¸co˜es da equa¸ca˜o de Bessel de ordem ν (por ser uma combina¸ca˜o linear de duas outras) e ´e denominada fun¸ca ˜o de Bessel de segundo tipo e ordem ν, ou 14 ainda fun¸ca ˜o de Neumann de ordem ν. Conclu´ımos, assim, que a solu¸ca˜o geral da equa¸ca˜o de Bessel de ordem ν para o caso 2ν 6∈ pode ser escrita em termos das fun¸co˜es Jν e Nν na forma

tamb´em

β1 Jν (z) + β2 Nν (z) , onde β1 e β2 s˜ao constantes arbitr´arias. O estudante deve notar que as fun¸co˜es J±ν (z) e Nν (z), para 2ν n˜ao-inteiro, s˜ao anal´ıticas em toda a parte, exceto em z = 0, onde possuem um ponto de ramifica¸ca˜o devido ao fator z ±ν = exp(±ν ln(z)). Caso 2. 2ν = 0. No caso em quest˜ao aplicam-se as solu¸co˜es (8.54), (8.55) e (8.56). Aqui tem-se γ 0 = (1 − a0 )/2 = 0 P n e para y1 tem-se y1 (z) = ∞ c (0)z , com (por (8.55)) n=0 n n−1 i 1 Xh man−m + bn−m cm (0) . cn (0) = − 2 n m=0

Essas rela¸co˜es s˜ao idˆenticas a`quelas de (8.101) (tomando-se aqui ν = 0) e, assim, tem por solu¸ca˜o c2k (0) =

(−1)k Γ(1) (−1)k c (0) , = c0 (0) , 0 k! 22k Γ(k + 1) (k!)2 22k

c2k+1 (0) = 0 ,

k≥0,

k≥0

onde usamos que Γ(1) = 1 e Γ(k + 1) = k!. Por conven¸ca˜o hist´orica adota-se c0 (0) = 1 e chega-se com isso a` express˜ao J0 (z) =

∞ X (−1)k  z 2k . 2 (k!) 2 k=0

(8.104)

Essa fun¸ca˜o representa uma das solu¸co˜es da equa¸ca˜o de Bessel de ordem 0 e ´e denominada fun¸ca ˜o de Bessel de primeiro tipo e ordem 0. 14

Carl Neumann (1832-1925).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

430/1304

Para a segunda solu¸ca˜o y2 teremos, por (8.54), y2 (z) = J0 (z) ln(z) +

∞ X

vn z n ,

n=0

com os vn dados em (8.56). Como o estudante pode facilmente verificar, adotando-se v0 = 0, obtem-se para esses coeficientes as seguintes express˜oes: v2k =

(−1)k+1 hk , (k!)2 22k

v2k+1 = 0 ,

k≥0,

k≥0

onde h0 := 0 , hn

(8.105)

n X 1 1 1 1 := 1 + + + · · · + = , 2 3 n l l=1

∀n≥1.

(8.106)

Note-se que v0 = 0. E. 8.8 Exerc´ıcio importante. Verifique!

6

Com isso, a segunda solu¸ca˜o y2 (z) ser´a y2 (z) = J0 (z) ln(z) +

∞ X (−1)k+1 k=1

(k!)2

hk

 z 2k 2

.

(8.107)

Por conven¸ca˜o hist´orica, costuma-se considerar tamb´em uma particular combina¸ca˜o das solu¸co˜es J0 (z) e y2 (z): ! ∞   z  X (−1)k+1 hn  z 2k 2  2 y2 (z) + (γ − ln(2))J0 (z) = γ + ln J0 (z) + , N0 (z) := π π 2 (k!)2 2 k=1 (8.108) 15 16 onde γ ´e a chamada constante de Euler-Mascheroni , definida por :   1 1 1 γ := lim (hn − ln(n)) = lim 1 + + + · · · + − ln(n) ≈ 0, 5772156649 . . . . n→∞ n→∞ 2 3 n Essa fun¸ca˜o N0 (z) tamb´em representa uma das solu¸co˜es da equa¸ca˜o de Bessel de ordem 0 (por ser uma combina¸ca˜o linear de duas outras) e ´e denominada fun¸ca ˜o de Bessel de segundo tipo e ordem 0, ou ainda fun¸ca ˜o de Neumann de ordem 0. 15

Leonhard Euler (1707-1783). Lorenzo Mascheroni (1750-1800). Essa constante foi introduzida por Euler em 1735, o qual calculou seus 16 primeiros d´ıgitos decimais. Em 1790, Mascheroni calculou seus 32 primeiros d´ıgitos decimais, dos quais apenas os primeiros 19 estavam corretos. 16

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

431/1304

Conclu´ımos, assim, com a constata¸ca˜o que a solu¸ca˜o geral da equa¸ca˜o de Bessel de ordem 0 ´e α1 J0 (z) + α2 N0 (z) , onde α1 e α2 s˜ao constantes arbitr´arias. O estudante deve notar que a primeira solu¸ca˜o J0 (z) ´e uma fun¸ca˜o anal´ıtica para todo z ∈ (pois a s´erie em (8.104) converge absolutamente para todo z (mostre isso!)). J´a a solu¸ca˜o N 0 (z) ´e tamb´em anal´ıtica em toda parte, exceto em z = 0, onde possui uma singularidade logar´ıtmica. Caso 3. 2ν ∈

\ {0}.

Como a equa¸ca˜o de Bessel ´e invariante por ν → −ν, podemos sem perda de generalidade tomar aqui 2ν um inteiro positivo. Como veremos, h´a dois casos a considerar: a. ν ´e um inteiro positivo e b. ν ´e um semi-inteiro positivo, ou seja, no caso a. tem-se ν = 1, 2, 3, 4, . . . enquanto que no caso b. tem-se ν = 1/2, 3/2, 5/2, . . .. Caso a. ν = 1, 2, 3, 4, . . .. Vamos aqui escrever ν = p, com p sendo um inteiro positivo: p = 1, 2, 3, 4, . . .. Com essas conven¸co˜es, tem-se que γ1 = p, γ2 = −p e n0 = 2p. As solu¸co˜es y1 e y2 s˜ao aquelas dadas em (8.58), (8.59) e (8.60): y1 (z) = z

p

∞ X

cn (p)z

n

e

y2 (z) = Ay1 (z) ln(z) + z

n=0

−p

∞ X

vn z n ,

n=0

onde, segundo (8.59), as constantes cn (p) satisfazem n−1 h i X 1 (m + p)an−m + bn−m cm (p) cn (p) = − f (p + n) m=0

para n ≥ 1. Novamente, essas rela¸co˜es s˜ao idˆenticas a`quelas de (8.101) e, assim, suas solu¸co˜es s˜ao c2k (p) =

(−1)k Γ(1 + p) (−1)k p! c (p) = c0 (p) , 0 k! 22k Γ(k + 1 + p) k! 22k (k + p)!

c2k+1 (p) = 0 ,

k≥0.

k≥0,

onde usamos que Γ(1 + p) = p! e Γ(k + 1 + p) = (k + p)!. Por conven¸ca˜o hist´orica adota-se c0 (p) =

1 p!

2p

e chega-se com isso a` express˜ao Jp (z) =

∞ X k=0

 z 2k+p (−1)k . k! (k + p)! 2

Essa fun¸ca˜o representa uma das solu¸co˜es da equa¸ca˜o de Bessel de ordem p (com p = 1, 2, 3, 4, . . .) e ´e denominada fun¸ca ˜o de Bessel de primeiro tipo e ordem p.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

432/1304

O leitor ´e convidado a constatar que a express˜ao (8.104) para J0 (z) ´e idˆentica a essa se tomarmos p = 0. Procuremos agora a segunda solu¸ca˜o y2 (z): y2 (z) = AJp (z) ln(z) + z −p

∞ X

vn (p)z n .

n=0

Por (8.60),  n−1   X  1   − (m − p)an−m + bn−m vm (p) ,    f (n − p) m=0      arbitr´ario , vn (p) =     # "  n−1  X   1   (m − p)an−m + bn−m vm (p) ,   − f (n − p) −Agn−2p + m=0

para 1 ≤ n ≤ 2p − 1 , para n = 2p , para n > 2p,

A constante A ´e dada em (8.61) e, para o presente caso, tem-se

2p−1 X 1 2p p! A = − v2p−2 (p) . [(m − p)a2p−m + b2p−m ] vm (p) = − 2p c0 (p) m=0 2p

Agora, por (8.60), 2p−3  X 1 v2p−2 (p) = − (m − p)a2p−2−m + b2p−2−m vm (p) , f (p − 2) m=0

de onde se vˆe imediatamente que v2p−2 (p) = e, portanto, v2p−2 (p) =

1 v2p−4 (p), − 1)

p≥2,

22 (p

1 v0 (p), 22(p−1) (p − 1)!

p≥2.

Logo, A = −4v0 (p). Adotando-se v0 (p) = −1/4 teremos A = 1 e y2 (z) = Jp (z) ln(z) + z

−p

∞ X n=0

vn (p)z n .

(8.109)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

433/1304

com

 n−1   X  1   (m − p)a + b −  n−m n−m vm (p) ,   f (n − p) m=0      vn (p) = arbitr´ario ,     " #  n−1  X   1   (m − p)an−m + bn−m vm (p) ,   − f (n − p) −gn−2p + m=0

para 1 ≤ n ≤ 2p − 1 , para n = 2p , para n > 2p, (8.110)

com os gn dados em (8.62) em termos de cn (p).

Um c´alculo um pouco trabalhoso, que nos poupamos de apresentar em detalhe, conduz ao seguinte resultado: 1 X (p − n − 1)!  z 2n−p 1 X (−1)n (hn + hn+p )  z 2n+p − , y2 (z) = Jp (z) ln(z) − 2 n=0 n! 2 2 n=0 n! (n + p)! 2 p−1



com p = 1, 2, 3, 4, . . .. E. 8.9 Exerc´ıcio. Tome uma hora livre e mostre isso.

6

O leitor ´e convidado a constatar que a express˜ao (8.107) ´e idˆentica a essa se tomarmos p = 0 (com P (· a conven¸ca˜o que −1 n=0 · · ) = 0).

Por conven¸ca˜o hist´orica, costuma-se considerar tamb´em uma particular combina¸ca˜o das solu¸co˜es Jp (z) e y2 (z):

Np (z) := 2 π



γ + ln

 2 y2 (z) + (γ − ln(2))Jp (z) = π

 z  2

1 X (p − n − 1)!  z 2n−p 1 X (−1)n (hn + hn+p )  z 2n+p Jp (z) − − 2 n=0 n! 2 2 n=0 n! (n + p)! 2 p−1



!

, (8.111)

onde γ ´e a constante de Euler-Mascheroni mencionada acima. Essa fun¸ca˜o Np (z) tamb´em representa uma das solu¸co˜es da equa¸ca˜o de Bessel de ordem p (por ser uma combina¸ca˜o linear de duas outras) e ´e denominada fun¸ca ˜o de Bessel de segundo tipo e ordem p, ou ainda fun¸ca ˜o de Neumann de ordem p. Conclu´ımos, assim, com a constata¸ca˜o que a solu¸ca˜o geral da equa¸ca˜o de Bessel de ordem p, p = 1, 2, 3, 4, . . ., ´e α1 Jp (z) + α2 Np (z) , onde α1 e α2 s˜ao constantes arbitr´arias. O estudante deve notar que a primeira solu¸ca˜o Jp (z) ´e uma fun¸ca˜o anal´ıtica para todo z ∈ (pois a s´erie em (8.104) converge absolutamente para todo z (mostre isso!)). J´a a solu¸ca˜o N p (z) ´e tamb´em anal´ıtica em toda parte, exceto em z = 0, onde possui uma singularidade logar´ıtmica assim como um polo de ordem p.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

434/1304

Advertˆencia. O estudante deve ser advertido do fato de n˜ao haver, infelizmente, uniformidade na literatura quanto a` defini¸ca˜o exata das v´arias fun¸co˜es de Neumann N ν apresentadas acima, pois alguns textos, especialmente alguns mais antigos, adotam para Nν uma combina¸ca˜o linear com constantes ligeiramente diferentes daquelas de (8.103), (8.108) ou (8.111). A conven¸ca˜o que adotamos ´e a mais freq¨ uente modernamente. As fun¸co˜es de Neumann s˜ao tamb´em por vezes denotadas por Y ν . Precisamos estudar ainda o caso em que ν ´e um n´ umero semi-inteiro onde, diferentemente do caso que acabamos de estudar, as solu¸co˜es independentes s˜ao ambas livres de singularidades logar´ıtmicas. Caso b. ν = 1/2, 3/2, 5/2, . . .. Vamos convencionar escrever ν = q + 1/2, com q = 0, 1, 2, . . .. Teremos aqui n 0 = (2q + 1), γ1 = ν = q + 1/2 e γ2 = −ν = −q − 1/2. As solu¸co˜es y1 e y2 s˜ao aquelas dadas em (8.58), (8.59) e (8.60): ∞ ∞ X X q+1/2 n −q−1/2 y1 (z) = z cn (q)z e y2 (z) = Ay1 (z) ln(z) + z vn (q)z n , n=0

n=0

onde, segundo (8.59), as constantes cn (q) satisfazem

  n−1  X 1 1  m+q+ an−m + bn−m cm (q) , cn (q) = − 2 f n + q + 21 m=0

(8.112)

para n ≥ 1. Novamente, essas rela¸co˜es s˜ao idˆenticas a`quelas de (8.101) com ν substitu´ıdo por q + 1/2 e, assim, suas solu¸co˜es s˜ao  (−1)k Γ 1 + q + 21  c0 (q) , k ≥ 0 . c2k (q) = k! 22k Γ k + 1 + q + 12 c2k+1 (q) = 0 ,

k≥0,

onde usamos Γ(1 + q + 1/2) = q!Γ(1/2) e Γ(k + 1 + q + 1/2) = (k + q)!Γ(1/2). Adotando c0 (q) = chegamos a` express˜ao Jq+1/2 (z) :=

∞ X k=0

2q+1/2

1 , Γ 1 + q + 12

 z 2k+q+1/2 (−1)k . k! Γ(k + 1 + q + 1/2) 2

Essa fun¸ca˜o representa uma das solu¸co˜es da equa¸ca˜o de Bessel de ordem q + 1/2 com q = 0, 1, 2, . . . e ´e denominada fun¸ca ˜o de Bessel de primeiro tipo e ordem q + 1/2. Passemos agora a` segunda solu¸ca˜o y2 (z) = AJq+1/2 (z) ln(z) +

∞ X n=0

vn (q)z n−q−1/2 .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

435/1304

Por (8.60),    n−1  X  −1 1    m−q− an−m + bn−m vm (q) , 1 ≤ n ≤ 2q ,    2 f n − q − 21 m=0      arbitr´ario , n = 2q + 1 , vn (q) =     ( )    n−1   X  −1 1   m−q− an−m + bn−m vm (q) , n > 2q + 1,   f n − q − 1  −Agn−2q−1 + 2 2 m=0

onde,

  2q  X 1 1 A = − a2q+1−m + b2q+1−m vm (q) m−q− c0 (q) (2q + 1) m=0 2

Para 1 ≤ n ≤ 2q tem-se

vn (q) =

Por´em, −1 v1 (q) = 1 f ( 2 − q)

−1 vn−2 (q) . f (n − q − 21 )



1 0−q− 2



(8.113)

(8.114)



a1 + b1 v0 (q) = 0 ,

pois a1 = b1 = 0. Conjuntamente com (8.114), isso diz-nos que vn (q) = 0 para todo n ´ımpar com 1 ≤ n ≤ 2q. A importˆancia dessa observa¸ca˜o reside no seguinte. Por (8.113) vˆe-se facilmente que A = −

1 v2q−1 (q) . c0 (q) (2q + 1)

Portanto, tem-se no caso presente que A = 0 e, assim, a segunda solu¸ca˜o ´e livre de singularidades logar´ıtmicas. Al´em disso, com A = 0 as express˜oes recursivas para vn (q) simplificam-se para    n−1  X  1 −1    an−m + bn−m vm (q) , 1 ≤ n ≤ 2q , m−q−    2 f n − q − 21 m=0      arbitr´ario , n = 2q + 1 , (8.115) vn (q) =     ( n−1  )     X  −1 1   m−q− an−m + bn−m vm (q) , n > 2q + 1.   f n − q − 1 2 2 m=0

Como j´a vimos, para 1 ≤ n ≤ 2q os vn (q) com n ´ımpar s˜ao nulos. Como v2q+1 ´e arbitr´ario, ´e conveniente escolhˆe-lo igual a zero tamb´em. Com isso, as rela¸co˜es (8.115) ficam idˆenticas a`quelas de (8.101) com ν substitu´ıdo por −(q + 1/2) e, assim, suas solu¸co˜es s˜ao  (−1)k Γ 1 − q − 21  v0 (q) , k ≥ 0 . v2k (q) = k! 22k Γ k + 1 − q − 21 v2k+1 (q) = 0 ,

k≥0,

JCABarata. Curso de F´ısica-Matem´ atica

Adotando v0 (q) =

2−q−1/2

chagamos a` seguinte express˜ao: J−q−1/2 (z) =

∞ X k=0

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

436/1304

1 , Γ 1 − q − 12

 z 2k−q−1/2 (−1)k  . 2 k! Γ k + 1 − q − 12

Essa fun¸ca˜o representa uma segunda solu¸ca˜o da equa¸ca˜o de Bessel de ordem q+1/2 com q = 0, 1, 2, . . . e ´e denominada fun¸ca ˜o de Bessel de primeiro tipo e ordem −(q + 1/2).

Conclu´ımos, assim, que a solu¸ca˜o geral da equa¸ca˜o de Bessel de ordem q+1/2 com q = 0, 1, 2, 3, . . .,

´e α1 Jq+1/2 (z) + α2 J−q−1/2 (z) , onde α1 e α2 s˜ao constantes arbitr´arias. Podemos definir tamb´em as fun¸co ˜es de Neumann de ordem q + 1/2 em analogia com (8.103), mas aqui, tem-se Nq+1/2 (z) :=

Jq+1/2 (z) cos((q + 1/2)π) − J−q−1/2 (z) = (−1)q+1 J−q−1/2 (z) . sen ((q + 1/2)π)

(8.116)

De qualquer forma, a solu¸ca˜o geral da equa¸ca˜o de Bessel de ordem q + 1/2 com q = 0, 1, 2, 3, . . ., ´e β1 Jq+1/2 (z) + β2 Nq+1/2 (z) , onde β1 e β2 s˜ao constantes arbitr´arias. O estudante ´e convidado a constatar que Jq+1/2 (z) ´e uma fun¸ca˜o anal´ıtica para todo z ∈ , z 6= 0, mas em z = 0 possui uma singularidade como z q+1/2 , que ´e uma singularidade do tipo ponto ramifica¸ca˜o (de grau 2). Paralelamente, J−q−1/2 (z) (e, portanto, Nq+1/2 (z)) ´e anal´ıtica para todo z 6= 0, mas possui em z = 0 uma singularidade como z −q−1/2 , que ´e uma singularidade do tipo ponto ramifica¸ca˜o (de grau −2). Essas afirma¸co˜es s˜ao ilustradas no pr´oximo exerc´ıcio. E. 8.10 Exerc´ıcio semi-resolvido. Com q = 0 tem-se pelas nossas defini¸co˜es acima J1/2 (z) =

∞ X k=0

 z 2k+1/2 (−1)k k! Γ(k + 1 + 1/2) 2

Usando as identidades Γ(3/2) (2k + 1)!! = Γ(k + 1 + 1/2) = 2k 2k k! = (2k)!! ,

e

J−1/2 (z) =

∞ X k=0

 z 2k−1/2 (−1)k  . 2 k! Γ k + 12



π (2k + 1)!! , 2 2k

(2k + 1)!!(2k)!! = (2k + 1)! ,

(2k)!!(2k − 1)!! = (2k)! ,

(prove-as!) teremos, J1/2 (z) = z

−1/2

r

∞ 2 X (−1)k z 2k+1 , π k=0 (2k + 1)!

e

J−1/2 (z) = z

−1/2

r

∞ 2 X (−1)k 2k z , π k=0 (2k)!

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

437/1304

e reconhecemos que J1/2 (z) =

r

2 sen (z) π z 1/2

e

Observe ainda que J1/2 (z) = z sendo que

sen (z) z

1/2

J−1/2 (z) = r

r

2 cos(z) . π z 1/2

(8.117)

2 sen (z) , π z

´e uma fun¸c˜ao anal´ıtica para todo z ∈ , inclusive em z = 0 (por que?).

Complete os detalhes faltantes de todos os c´alculos indicados acima.

6

E. 8.11 Exerc´ıcio. Verifique por c´alculo expl´ıcito que as fun¸co˜es sen (z)/z 1/2 e cos(z)/z 1/2 s˜ao, de fato, solu¸co˜es da equa¸c˜ao de Bessel de ordem ν = 1/2. 6 Para futura referˆencia, reunimos nossos resultados sobre as solu¸co˜es da equa¸ca˜o de Bessel no seguinte teorema: Teorema 8.3 (Solu¸ co ˜es da equa¸ c˜ ao de Bessel) Seja a equa¸ca ˜o de Bessel de ordem ν ∈ z 2 y 00 (z) + zy 0 (z) + (z 2 − ν 2 )y(z) = 0, com z ∈ . 1. Caso ν 6∈

duas solu¸co ˜es independentes s˜ ao Jν (z) e J−ν (z), onde Jν (z) :=

∞ X k=0

 z 2k+ν (−1)k . k! Γ(k + 1 + ν) 2

(8.118)

Definindo Nν (z) :=

Jν (z) cos(νπ) − J−ν (z) , sen (νπ)

as fun¸co ˜es Jν (z) e Nν (z) s˜ ao tamb´em duas solu¸co ˜es independentes. 2. Caso ν ∈ podemos, sem perda de generalidade, adotar ν ≥ 0, pois a equa¸ca ˜o de Bessel ´e invariante pela mudan¸ca ν → −ν. Com essa conven¸ca ˜o, duas solu¸co ˜es independentes s˜ ao J ν (z) e Nν (z), onde Jν (z) :=

∞ X k=0

e

∞  z 2k+ν  z 2k+ν X (−1)k (−1)k = k! Γ(k + 1 + ν) 2 k! (k + ν)! 2 k=0

(8.119)

Nν (z) := 2 π



γ + ln

 z  2

1 X (ν − n − 1)!  z 2n−ν 1 X (−1)n (hn + hn+ν )  z 2n+ν − Jν (z) − 2 n=0 n! 2 2 n=0 n! (n + ν)! 2 ν−1



!

,

JCABarata. Curso de F´ısica-Matem´ atica

sendo que h0 := 0 ,

hn

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

n X 1 1 1 1 = , := 1 + + + · · · + 2 3 n l l=1

438/1304

∀n≥1.

e γ ´e a constante de Euler-Mascheroni: γ := lim (hn − ln(n)) ≈ 0, 5772156649 . . .. n→∞

As fun¸co ˜es Jν (z), ν ∈ , s˜ ao denominadas fun¸co˜es de Bessel de primeiro tipo e ordem ν, ou simplesmente fun¸co˜es de Bessel de ordem ν. As fun¸co ˜es Nν (z), ν ∈ , s˜ ao denominadas fun¸co˜es de Bessel de segundo tipo e ordem ν, ou fun¸co˜es de Neumann de ordem ν. 2 Coment´ ario. O caso em que ν ´e semi-inteiro est´a inclu´ıdo no caso 1, acima: ν 6∈

.

• Nota sobre as fun¸ co ˜es de Bessel de ordem inteira negativa At´e o momento definimos as fun¸co˜es de Bessel Jν atrav´es das express˜oes (8.118) e (8.119), mas apenas para ν’s que n˜ao sejam inteiros negativos. A express˜ao (8.118) contem uma fun¸ca˜o Γ(x) no denominador e Γ(x) diverge se x for inteiro negativo. Por isso, em princ´ıpio (8.118) n˜ao est´a definida para ν’s inteiros negativos. A experiˆencia mostrou, por´em, que ´e conveniente definir Jν para ν’s que sejam inteiros negativos atrav´es da seguinte express˜ao: J−m (z) := (−1)m Jm (z) , (8.120) para todo m ∈ e todo z ∈ . Note que, como a equa¸ca˜o de Bessel ´e invariante pela troca ν → −ν, J−m definida acima ´e solu¸ca˜o da equa¸ca˜o de Bessel de ordem ±m. A conveniˆencia dessa conven¸ca˜o n˜ao pode ser apreciada no momento, mas ir´a manifestar-se quando discutirmos algumas propriedades das fun¸co˜es de Bessel na Se¸ca˜o 9.2.6, que inicia-se na p´agina 522, tais como as rela¸co˜es de recorrˆencia e a fun¸ca˜o geratriz. 

E. 8.12 Exerc´ıcio. Mostre que com a conven¸c˜ao acima vale J−m (−z) = Jm (z),

∀m∈ 

,

Sugest˜ao: Jm (z) ´e uma soma de monˆomios da forma z 2k+m e vale (−z)2k+m = (−1)m z 2k+m .

8.2.4

6

Equa¸ co ˜es Relacionadas ` a de Bessel. A Equa¸ c˜ ao de Bessel Esf´ erica

Diversas equa¸co˜es diferenciais podem ser transformadas na de Bessel e podem ter suas solu¸co˜es expressas em termos de fun¸co˜es de Bessel e de Neumann. Uma classe bastante geral ´e composta pelas equa¸co˜es da forma   z 2 y 00 (z) + (1 − 2α)zy 0 (z) + β 2 γ 2 z 2γ + α2 − ν 2 γ 2 y(z) = 0 , (8.121) com α, β, γ e ν constantes (com βγ 6= 0), cuja solu¸ca˜o mais geral ´e az α Jν (βz γ ) + bz α Nν (βz γ ) , onde a e b s˜ao constantes arbitr´arias.

(8.122)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

439/1304

E. 8.13 Exerc´ıcio. Prove as afirma¸co˜es acima, ou seja, prove que (8.122) ´e asolu¸c˜ao geral de (8.121). Sugest˜ao: defina a fun¸c˜ao v por y(z) =: z α v(βz γ ) e, substituindo em (8.121), mostre que v satisfaz a equa¸c˜ao de Bessel de ordem ν. 6 Dois casos particulares de interesse, dentro da classe definida em (8.121), s˜ao a equa¸ca˜o de Airy (que corresponde a α = 1/2, β = 2/3, γ = 3/2 e ν = 1/3) e a equa¸ca˜o de Bessel esf´erica (que corresponde a α = −1/2, β = 1, γ = 1 e ν = σ + 1/2). Trataremos desses casos logo abaixo.

O estudante deve observar que, caso 2γ n˜ao seja um inteiro positivo ou zero, a equa¸ca˜o (8.121) n˜ao ´e singular regular em z0 = 0 (compare a` (8.47)) e, portanto, a ela n˜ao se aplica o m´etodo de Frobenius. A solu¸ca˜o dada em (8.122), de fato, n˜ao ´e como aquelas obtidas pelo m´etodo de Frobenius, que seriam da forma z η φ(z) ou da forma z η ln(z)φ(z), para alguma constante η e com φ anal´ıtica em torno de z0 = 0. Por exemplo, tem-se z α Jν (βz γ ) =

∞  z νγ+α X (−1)k β 2k+ν  z 2kγ , 2 k! Γ(k + 1 + ν) 2 k=0

que n˜ao ´e da forma z η φ(z) com φ anal´ıtica em torno de z0 = 0, pois a s´erie do lado direito n˜ao ´e uma s´erie de potˆencias em z. • A equa¸ c˜ ao de Airy e a equa¸ c˜ ao de Bessel Como dissemos acima, v´arias equa¸co˜es diferenciais podem ser transformadas em equa¸co˜es de Bessel. Um exemplo ´e o da equa¸ca˜o de Airy: y 00 (z) − zy(z) = 0, cujas solu¸co˜es foram apresentadas na Se¸ca˜o 17 8.1.4, p´agina 404. A maneira mais simples de ver isso . Se y ´e uma solu¸ca˜o da equa¸ca˜o de  √ ´e a seguinte 2 3/2 Airy, ent˜ao a fun¸ca˜o v(z) definida por por y(z) =: zv 3 z satisfaz a equa¸ca˜o de Bessel de ordem ν = 1/3, como facilmente se constata. E. 8.14 Exerc´ıcio. Verifique isso!

6

Conclu´ımos da´ı que √ as solu¸co˜es y(z) √ da equa¸ca˜o de Airy podem ser escritas como combina¸co˜es lineares das fun¸co˜es zJ1/3 32 z 3/2 e zJ−1/3 32 z 3/2 . Com efeito, pelas defini¸co˜es (8.29)-(8.31) e (8.118) (para ν = 1/3) pode-se facilmente constatar a validade das rela¸co˜es      2 3/2 2 3/2 z 1/2 + J1/3 , (8.123) J−1/3 Ai(z) = z z 3 3 3      z 1/2 2 3/2 2 3/2 Bi(z) = z − J1/3 z . J−1/3 3 3 3

(8.124)

que permitem expressar as fun¸co˜es de Airy Ai e Bi em termos das fun¸co˜es J±1/3 . E. 8.15 Exerc´ıcio. Prove as rela¸co˜es (8.123)-(8.124) usando (8.29)-(8.31) e (8.118).

6

Na Se¸ca˜o 10.2.3, p´agina 560, veremos uma aplica¸ca˜o dessas considera¸co˜es sobre as solu¸co˜es da equa¸ca˜o de Airy. 17

Uma outra maneira usa propriedades de simetria da equa¸ca ˜o hipergeom´etrica confluente.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

440/1304

• A equa¸ c˜ ao de Bessel esf´ erica A equa¸ca˜o diferencial z 2 y 00 (z) + 2zy 0 (z) + (z 2 − σ(σ + 1))y(z) = 0 , para z ∈ , com σ ∈ , constante, ´e denominada equa¸ca ˜o de Bessel esf´erica de ordem σ.

A equa¸ca˜o de Bessel esf´erica surge, por exemplo, quando da resolu¸ca˜o da equa¸ca˜o de Helmholtz em trˆes dimens˜oes em coordenadas esf´ericas (vide Cap´ıtulo 10, p´agina 544) e, portanto, ´e importante para o estudo da propaga¸ca˜o de ondas ou de fenˆomenos de difus˜ao em trˆes dimens˜oes. Se definirmos v(z) = z 1/2 y(z), obtemos para v a equa¸ca˜o diferencial 2 !  1 v(z) = 0 , z 2 v 00 (z) + zv 0 (z) + z 2 − σ + 2 uentemente as solu¸co˜es da que nada mais ´e que a equa¸ca˜o de Bessel usual de ordem σ + 12 . Conseq¨ equa¸ca˜o de Bessel esf´erica s˜ao da forma y(z) = A

Jσ+ 1 (z) Nσ+ 1 (z) √2 + B √2 , z z

onde A e B s˜ao constantes arbitr´arias. Em fun¸ca˜o disso, definem-se as chamadas fun¸co ˜es de Bessel esf´ericas de ordem ν por r π jν (z) := J 1 (z) , 2z ν+ 2 e as chamadas fun¸co ˜es de Neumann esf´ericas de ordem ν por r π N 1 (z) . nν (z) := 2z ν+ 2

(8.125)

(8.126)

´ bastante claro que as fun¸co˜es nν (z) s˜ao singulares em z = 0, enquanto que as fun¸co˜es jν (z) n˜ao E divergem em z = 0, sendo at´e mesmo fun¸co˜es inteiras (anal´ıticas em toda parte) para ν inteiro n˜aonegativo. Um caso de particular interesse ´e aquele no qual σ = l ∈ geral da equa¸ca˜o de Bessel esf´erica na forma 

. Nesse caso, podemos escrever a solu¸ca˜o

y(z) = ajl (z) + bnl (z) , com a e b constantes arbitr´arias, onde r π jl (z) := J 1 (z) , e 2z l+ 2 r r π π (8.116) l+1 1 (z) . Nl+ 1 (z) = (−1) J nl (z) := 2 2z 2z −(l+ 2 )

(8.127)

(8.128)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

441/1304

Note que, por (8.117), tem-se sen (z) z

j0 (z) =

e

n0 (z) = −

cos(z) . z

(8.129)

Algumas propriedades das fun¸co˜es de Bessel esf´ericas ser˜ao estudadas na Se¸ca˜o 9.2.7, p´agina 537.

8.2.5

A Equa¸ c˜ ao de Laguerre

A equa¸ca ˜o de Laguerre18 ´e a equa¸ca˜o diferencial zy 00 (z) + (1 − z)y 0 (z) + λy(z) = 0, com z ∈ , onde λ ∈

´e uma constante.

A equa¸ca˜o de Laguerre, e uma parente pr´oxima, a equa¸ca˜o de Laguerre associada, apresentada na Se¸ca˜o 8.3.2, p´agina 452, emergem em um dos problemas mais importantes da F´ısica, a equa¸ca˜o de Schr¨odinger para o a´tomo de hidrogˆenio em coordenadas esf´ericas. Vide Se¸ca˜o 10.5, p´agina 568. A equa¸ca˜o de Laguerre ´e tamb´em um caso particular da equa¸ca˜o hipergeom´etrica confluente, a ser discutida na Se¸ca˜o 8.2.7, p´agina 447. Comparando com a forma (8.50), vemos que z0 = 0 ´e um ponto singular regular da equa¸ca˜o, vemos que a(z) = 1 − z e que b(z) = λz. Assim, no presente caso tem-se    1, para n = 0 λ, para n = 1 −1, para n = 1 , an = bn = . 0, para n = 0 ou n ≥ 2  0, para n ≥ 2

´ elementar constatar-se que, para essa equa¸ca˜o, γ− = γ+ = 0 e, portanto, estamos no caso 2 do E Teorema 8.2 da p´agina 412 com f (x) = x2 , γ0 = 0, y1 (z) =

∞ X

cn z

n

e

y2 (z) = y1 (z) ln(z) +

n=0

onde cn e vn

18

∞ X

vn z n ,

n−1 i 1 Xh λ−n+1 = − 2 man−m + bn−m cm = − cn−1 , n m=0 n2

1 = − 2 n

"

− 2n − 1 cn −

1 = − 2 n

"

#





n X

m=0

−2n cn + cn−1 −

Edmond Nicolas Laguerre (1834-1886).

(8.130)

n=0

an−m cm +

n−1 h X

i

man−m + bn−m vm

m=0

λ−n+1 vn−1 , n2

n≥2,

∀n ≥ 1 ,

# (8.131)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

442/1304

Adotando-se c0 = 1, obtem-se para n ≥ 1 cn

n−1 (−1)n Y (−1)n Γ(λ + 1) = (λ − l) = (n!)2 l=0 (n!)2 Γ(λ − n + 1)

e y1 (z) fica y1 (z) = 1 +

∞ X (−1)n n=1

(n!)2

n−1 Y l=0

(λ − l)

!

z

n

∞ X (−1)n Γ(λ + 1) = 1+ zn . 2 (n!) Γ(λ − n + 1) n=1

(8.132)

A situa¸ca˜o de maior interesse em F´ısica ´e aquela na qual λ ´e um inteiro positivo: λ = m ∈ . A raz˜ao disso ser´a explicada detalhadamente no Apˆendice 8.E, p´agina 477, mas adiantamos que nos casos em que λ n˜ao ´e um inteiro positivo a solu¸ca˜o y1 cresce muito rapidamente (exponencialmente) quando z ´e restrito ao semi-eixo real positivo. Esse comportamento ´e inadequado em v´arias aplica¸co˜es, por exemplo no cl´assico problema do a´tomo de hidrogˆenio da Mecˆanica Quˆantica, o que leva ao descarte de tais solu¸co˜es. 

J´a no caso em que λ ´e um inteiro positivo, λ = m ∈ , a solu¸ca˜o dada em (8.132) reduz-se a um polinˆomio de grau m: ! m m n−1 X X (−1)n (−1)n Y m! n (m − l) z = 1 + y1 (z) = 1 + zn 2 2 (n!) (n!) (m − n)! n=1 n=1 l=0 

  m X (−1)n m zn = n n! n=0

Os chamados polinˆ omios de Laguerre, denotados por Lm (z), s˜ao definidos como m! vezes o polinˆomio 19 acima :   m X m n m! Lm (z) := (−1) zn . (8.133) n! n n=0

Os quatro primeiros s˜ao L0 (z) = 1,

L1 (z) = 1 − z,

L2 (z) = 2 − 4z + z 2 ,

L3 (z) = 6 − 18z + 9z 2 − z 3 .

´ f´acil provar, tamb´em, que a seguinte express˜ao ´e v´alida (vide p´agina 516): E Lm (z) = ez

dm  m −z  z e . dz m

(8.134)

Os polinˆomios de Laguerre Lm (z) s˜ao, portanto, uma das solu¸co˜es da equa¸ca˜o de Laguerre (com λ = m) zy 00 (z) + (1 − z)y 0 (z) + my(z) = 0, (8.135) 19 O fator de normaliza¸ca ˜o m! tem origem hist´ orica. O leitor deve ser advertido do fato, j´ a lamentado p´ aginas acima, que em alguns textos outra normaliza¸ca ˜o ´e empregada.

JCABarata. Curso de F´ısica-Matem´ atica

com z ∈ , onde m ∈ 

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

443/1304

. De acordo com (8.130), uma segunda solu¸ca˜o ´e dada na forma y2 (z) = Lm (z) ln(z) +

∞ X

vn z n ,

n=0

onde os coeficientes vn s˜ao dados em (8.131) em termos dos coeficientes cn dos polinˆomios de Laguerre. Ap´os c´alculos um tanto ma¸cantes, chega-se a` seguinte express˜ao: m X

m! y2 (z) = Lm (z) ln(z) + (−1) k! k=1 k

  m (hm−k − hm − 2hk ) z k k + (−1)

m

∞ X k=1

(m +

(k − 1)! z m+k , + 2)2 · · · (m + k)2

1)2 (m

onde hn est´a definido em (8.105)-(8.106). E. 8.16 Exerc´ıcio. Mostre isso. Sugest˜ao: tire uma tarde livre.

6

E. 8.17 Exerc´ıcio. Caso o leitor n˜ao deseje fazer o exerc´ıcio anterior, poder´a contentar-se com a tarefa mais simples de verificar que a express˜ao acima ´e, de fato, uma solu¸c˜ao de (8.135). 6 Essa segunda solu¸ca˜o ´e raramente empregada em problemas de F´ısica, especialmente devido a` singularidade logar´ıtmica que apresenta. Mais propriedades dos polinˆomios de Laguerre ser˜ao estudadas na Se¸ca˜o 9.2.4, p´agina 515.

8.2.6

A Equa¸ c˜ ao Hipergeom´ etrica

A equa¸ca˜o diferencial z(1 − z)y 00 (z) + [γ − (1 + α + β)z]y 0 (z) − αβy(z) = 0,

(8.136)

para z ∈ e com α, β e γ ∈ constantes, ´e denominada equa¸ca ˜o hipergeom´etrica, ou equa¸ca ˜o de 20 Gauß , quem a primeiro estudou. A raz˜ao do interesse nessa equa¸ca˜o reside em trˆes fatos. Primeiro, a equa¸ca˜o hipergeom´etrica ´e (a menos de multiplica¸ca˜o trivial por uma constante) a u ´ nica equa¸ca˜o linear homogˆenea de segunda ordem com apenas trˆes pontos singulares regulares em 0, 1 e ∞ (vide discuss˜ao a` p´agina 368). Segundo, h´a v´arias equa¸co˜es diferenciais de interesse que podem ser transformadas em equa¸co˜es hipergeom´etricas e, com isso, pode-se estudar certas propriedades de v´arias fun¸co˜es especiais, tais como seu comportamento assint´otico, a partir das propriedades correspondentes de fun¸co˜es hipergeom´etricas. Terceiro, suas solu¸co˜es possuem muitas simetrias. A equa¸ca˜o hipergeom´etrica ´e uma 20

Carl Friedrich Gauß (1777-1855). Um dos maiores e mais influentes matem´ aticos de todos os tempos, Gauß dedicouse tamb´em intensamente a problemas de F´ısica, Astronomia, Matem´ atica Aplicada e mesmo Engenharia (´e um dos co-inventores do tel´egrafo) e encontrou as equa¸co ˜es hipergeom´etricas em estudos de Geodesia, assunto a que se dedicou quando da constru¸ca ˜o das primeiras linhas f´erreas da Alemanha. Seus trabalhos nessa a ´rea tamb´em inspiraram uma das suas muitas contribui¸co ˜es importantes a ` matem´ atica pura: a formula¸ca ˜o de geometrias n˜ ao-Euclidianas.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

444/1304

das equa¸co˜es diferenciais ordin´arias mais estudadas, sendo suas solu¸co˜es riqu´ıssimas em propriedades. Sua abordagem completa est´a muito al´em das pretens˜oes destas Notas e, para um tratamento detalhado, recomendamos as referˆencias [66], [122], [136], [83], [64] e outras. Propriedades combinat´orias envolvendo as s´eries hipergeom´etricas e suas generaliza¸co˜es podem ser encontradas em [50]. Vamos aqui apresentar as solu¸co˜es da equa¸ca˜o hipergeom´etrica (8.136) em termos de expans˜oes em torno de seu ponto singular regular z0 = 0. O leitor poder´a encontrar em [122] solu¸co˜es de (8.136) expressas como expans˜oes em torno dos outros pontos singulares regulares z 0 = 1 e z0 = ∞. O interesse nessas u ´ ltimas expans˜oes ´e um tanto menor, especialmente pois as mesmas podem ser expressas em termos das solu¸co˜es obtidas em torno de z0 = 0. Reescrevemos (8.136) na forma b(z) a(z) 0 y (z) + 2 y(z) = 0, z z sendo a(z) e b(z) anal´ıticas em |z| < 1, a saber, y 00 (z) +

(8.137)

∞ ∞ X X γ − (1 + α + β)z n a(z) = = an z = γ + (γ − 1 − α − β)z n , 1−z n=0 n=1 ∞ ∞ X X αβz n = bn z = (−αβ)z n . b(z) = − 1−z n=0 n=1

A equa¸ca˜o indicial, neste caso, ´e

f (x) = x(x − 1) + γx = x(x + γ − 1) = 0 e temos γ− = 1 − γ H´a, assim, trˆes casos a considerar: 1. γ − 1 6∈ seja, γ ∈ mas γ 6= 1.

Caso 1. γ − 1 6∈

, ou seja, γ 6∈

e

γ+ = 0 .

, ou seja, γ 6∈

. 2. γ = 1. 3. γ − 1 ∈

\ {0}, ou

.

Aqui, de acordo com (8.52) e (8.53), as solu¸co˜es s˜ao y1 (z) = z 1−γ

∞ X

cn z n

e

y2 (z) =

n=0

onde cn = −

∞ X

dn z n ,

(8.138)

n=0

n−1 h i X 1 (m + 1 − γ)an−m + bn−m cm , f (1 − γ + n) m=0

dn = −

n−1 i 1 Xh man−m + bn−m dm , f (n) m=0

para todo n ≥ 1. Nesse caso, por´em, n˜ao ´e t˜ao simples resolver recursivamente essas equa¸co˜es, pelo ´ muito mais f´acil obter as rela¸co˜es recursivas de menos na maneira como est˜ao expressas acima. E outra forma: inserindo (8.138) na equa¸ca˜o diferencial ainda na forma (8.136). Com esse procedimento, come¸cando pela solu¸ca˜o y2 (z), obtem-se alegremente para os coeficientes dn a seguinte rela¸ca˜o recursiva: dn+1 = para todo n ≥ 0.

(α + n)(β + n) dn , (n + 1)(γ + n)

(8.139)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

445/1304

E. 8.18 Exerc´ıcio importante. Verifique!

6

Convencionando-se tomar d0 = 1, chegamos a dn =

(α)n (β)n , n!(γ)n

onde, para n ≥ 1, (x)n := x(x + 1) · · · (x + n − 1) =

n≥1, n−1 Y

(x + l) =

l=0

Γ(x + n) , Γ(x)

s˜ao os denominados s´ımbolos de Pochhammer21 . Com isso, obtemos para a solu¸ca˜o y2 a express˜ao F (α, β, γ, z) := 1 +

∞ X (α)n (β)n n=1

n!(γ)n

z

n



Γ(γ) X Γ(α + n)Γ(β + n) z n = . Γ(α)Γ(β) n=0 Γ(γ + n) n!

(8.140)

Essa fun¸ca˜o, introduzida por Gauß em cerca de 1812, ´e denominada fun¸ca ˜o hipergeom´etrica, denomina¸ca˜o aparentemente criada por Kummer22 em 1836. Contribu´ıram a` teoria das fun¸co˜es hipergeom´etricas nomes como Euler, Gauß, Kummer e Riemann. Na literatura F (α, β, γ, z) ´e muitas vezes denotada por 2 F1 (α, β, γ, z)23 . Repetindo considera¸co˜es anteriores, F (α, β, γ, z) ´e anal´ıtica como fun¸ca˜o de z pelo menos na regi˜ao |z| < 1. No caso em que α ou β s˜ao inteiros n˜ao-positivos, ´e f´acil ver que F (α, β, γ, z) reduz-se a um polinˆomio e ´e, portanto, anal´ıtica em toda parte. Exceto nesses casos, a s´erie que define F (α, β, γ, z) ´e divergente para |z| > 1, como se vˆe pelo teste da raz˜ao, pois (α)n+1 (β)n+1 n+1 |α + n| |β + n| (n+1)!(γ)n+1 z |z| , (α)n (β)n = n (n + 1) |γ + n| z n!(γ)n

que para n grande aproxima-se de |z| > 1. Casualmente, o mesmo argumento prova convergˆencia da s´erie hipergeom´etrica (8.140) para |z| < 1.

Fazemos ainda notar que a express˜ao acima para F (α, β, γ, z) est´a definida mesmo para o caso em que γ ´e um inteiro positivo e, portanto, representa uma solu¸ca˜o da equa¸ca˜o hipergeom´etrica naquele caso. Para γ nulo ou um inteiro negativo, digamos γ = −m, o denominador (γ)n anula-se para n > m e a express˜ao para F (α, β, γ, z) deixa de fazer sentido. Para obtermos a outra solu¸ca˜o inserimos y1 de (8.138) na equa¸ca˜o diferencial ainda na forma (8.136) e obtemos alegremente para os coeficientes cn a rela¸ca˜o cn+1 = para todo n ≥ 0. 21

(n + α + 1 − γ)(n + β + 1 − γ) cn , (n + 1)(n + 2 − γ)

Leo August Pochhammer (1841-1920). Ernst Eduard Kummer (1810-1893). 23 A explica¸ca ˜o da nota¸ca ˜o 2 F1 ´e a seguinte: o “2” a ` esquerda indica a presen¸ca de dois s´ımbolos de Pochhammer no numerador dos termos da s´erie hipergeom´etrica (8.140). O “1” a ` direita indica a presen¸ca de um s´ımbolo de Pochhammer no denominador. H´ a generaliza¸co ˜es da s´erie (8.140) que definem as chamadas fun¸co ˜es hipergeom´etricas generalizadas, denotadas por k Fl , e que contˆem k s´ımbolos de Pochhammer no numerador e l no denominador. Mais abaixo encontraremos as fun¸co ˜es hipergeom´etricas confluentes, que s˜ ao do tipo 1 F1 . 22

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

446/1304

E. 8.19 Exerc´ıcio importante. Verifique!

6

Alguns segundos de contempla¸ca˜o nos levam a concluir que essas rela¸co˜es s˜ao idˆenticas a`quelas de (8.139), desde que l´a fa¸camos as seguintes modifica¸co˜es: α → α + 1 − γ, β → β + 1 − γ e γ → 2 − γ. Por tr´as dessa aparente coincidˆencia residem propriedades de simetria da equa¸ca˜o hipergeom´etrica. O leitor poder´a encontrar essa discuss˜ao nos textos supra-citados. Assim, tomando-se tamb´em c0 = 1, conclu´ımos que a outra solu¸ca˜o ´e z 1−γ F (α + 1 − γ, β + 1 − γ, 2 − γ, z) . Fazemos ainda notar que F (α + 1 − γ, β + 1 − γ, 2 − γ, z) est´a definida mesmo para o caso em que γ ´e um inteiro n˜ao-positivo e, portanto, z 1−γ F (α + 1 − γ, β + 1 − γ, 2 − γ, z) representa uma solu¸ca˜o da equa¸ca˜o hipergeom´etrica naquele caso. Resumindo nossas conclus˜oes, para o caso γ 6∈ a solu¸ca˜o geral da equa¸ca˜o hipergeom´etrica (8.136) expressa em termos de uma expans˜ao em torno do ponto singular regular z0 = 0 ´e A1 z 1−γ F (α + 1 − γ, β + 1 − γ, 2 − γ, z) + A2 F (α, β, γ, z) . onde A1 e A2 s˜ao constantes arbitr´arias. Caso 2. γ = 1. Aqui γ− = γ+ = γ0 = 0. Nesse caso a primeira solu¸ca˜o ´e da forma y1 (z) = an´alogo, obtemos (α + n)(β + n) cn , cn+1 = (n + 1)2 para todo n ≥ 0. Assim, a primeira solu¸ca˜o ´e F (α, β, 1, z) = 1 +

∞ X (α)n (β)n n=1

(n!)2

z

n

P∞

n=0 cn

z n e, de modo (8.141)



X zn 1 Γ(α + n)Γ(β + n) = . Γ(α)Γ(β) n=0 (n!)2

Pelo mesmo argumento de acima, a expans˜ao em s´erie do lado direito converge para |z| < 1 e diverge para |z| > 1. Pelo Teorema 8.2, p´agina 412, a segunda solu¸ca˜o tem a forma F (α, β, 1, z) ln(z) +

∞ X

vn z n ,

n=0

com os vn dados em (8.56) em termos dos cn de acima. A express˜ao que se obtem ´e um tanto complexa e evitamos coloc´a-la aqui. O leitor poder´a encontr´a-la, por exemplo, em [122]. Caso 3. γ − 1 ∈

\ {0}, ou seja, γ ∈

mas γ 6= 1.

H´a dois casos a distinguir: a. γ > 1 e b. γ ≤ 0.

No caso a, γ = m, com m > 1 inteiro. Aqui tem-se n0 = m − 1, γ1 = γ+ = 0 e γ2 = γ− = 1 − m. Como j´a observamos acima, uma solu¸ca˜o ´e dada por F (α, β, m, z). Uma segunda solu¸ca˜o ser´a da forma ∞ X 1−m vn z n , AF (α, β, m, z) ln(z) + z n=0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

447/1304

com os vn e A dados como em (8.60) e (8.61) a partir dos coeficientes cn de F (α, β, m, z). Novamente, a express˜ao que se obtem ´e complexa e remetemos o estudante a, e.g., [122]. No caso b, γ = −m, com m ≥ 0 inteiro. Aqui tem-se n0 = m + 1, γ1 = γ− = 1 + m e γ2 = γ+ = 0. Como j´a observamos acima, uma solu¸ca˜o ´e dada por z 1+m F (α + 1 + m, β + 1 + m, 2 + m, z). Uma segunda solu¸ca˜o ser´a da forma Az

1+m

F (α + 1 + m, β + 1 + m, 2 + m, z) ln(z) +

∞ X

vn z n ,

n=0

com os vn e A dados como em (8.60) e (8.61) a partir dos coeficientes cn de z 1+m F (α + 1 + m, β + 1 + m, 2 + m, z). Novamente, a express˜ao que se obtem ´e complexa e remetemos o estudante a, e.g., [122]. Com isso encerramos nossa breve excurs˜ao a`s fun¸co˜es hipergeom´etricas e remetemos o estudante interessado em um maior aprofundamento a` literatura supra-citada.

8.2.7

A Equa¸ c˜ ao Hipergeom´ etrica Confluente

A equa¸ca˜o diferencial zy 00 (z) + [γ − z]y 0 (z) − αy(z) = 0,

(8.142)

˜o hipergeom´etrica confluente ou equa¸ca ˜o para z ∈ e com α e γ ∈ constantes, ´e denominada equa¸ca de Kummer. A mesma pode ser obtida da equa¸ca˜o hipergeom´etrica por um procedimento de limite no qual a singularidade regular de z0 = 1 daquela equa¸ca˜o ´e feita imergir (“confluir”, da´ı o nome) na singularidade regular de z0 = ∞. Esse processo pode ser descrito da seguinte forma. Fa¸camos na equa¸ca˜o hipergeom´etrica z(1 − z)y 00 (z) + [γ − (1 + α + β)z]y 0 (z) − αβy(z) = 0 a mudan¸ca de vari´aveis ζ = βz. A mesma assume a forma (verifique!)       ζ d2 y α+β+1 dy − αy = 0 . ζ 1− + γ− ζ 2 β dζ β dζ Tomando-se agora o limite |β| → ∞ obtemos a forma (8.142). Vide, e.g., [122] ou [66]. A equa¸ca˜o hipergeom´etrica confluente possui uma singularidade regular em z0 = 0 e uma irregular em z0 = ∞ (vide discuss˜ao a` p´agina 369). Assim como no caso da equa¸ca˜o hipergeom´etrica, h´a v´arias equa¸co˜es diferenciais de interesse que podem ser transformadas em equa¸co˜es hipergeom´etricas confluentes. Os exemplos mais evidentes s˜ao a equa¸ca˜o de Laguerre, Se¸ca˜o 8.2.5, p´agina 441, que corresponde a γ = 1 e α = −λ, e a equa¸ca˜o de Laguerre associada, Se¸ca˜o 8.3.2, p´agina 452, que corresponde a γ = m + 1 e α = −(n − m). Com isso, pode-se estudar certas propriedades de v´arias fun¸co˜es especiais, tais como seu comportamento assint´otico, a partir das propriedades correspondentes de fun¸co˜es hipergeom´etricas confluentes. Para a equa¸ca˜o hipergeom´etrica confluente tem-se y 00 (z) +

[γ − z] 0 αz y (z) − 2 y(z) = 0 z z

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

448/1304

e assim, comparando com a forma padr˜ao (8.47), temos a(z) = γ − z, Logo, an

 

γ, −1, =  0,

b(z) = −αz .

e

para n = 0 para n = 1 , para n ≥ 2

bn =



−α, 0,

para n = 1 . para n = 0 ou n ≥ 2

A equa¸ca˜o indicial ´e, portanto,

f (x) = x(x + γ − 1) ,

cujas ra´ızes s˜ao

γ− = 1 − γ

e

γ+ = 0 ,

tal como para a equa¸ca˜o hipergeom´etrica. H´a, assim, trˆes casos a considerar: 1. γ − 1 6∈ γ 6∈ . 2. γ = 1. 3. γ − 1 ∈ \ {0}, ou seja, γ ∈ mas γ 6= 1.

Caso 1. γ − 1 6∈

, ou seja, γ 6∈

, ou seja,

.

Aqui, de acordo com (8.52) e (8.53), as solu¸co˜es s˜ao y1 (z) = z

1−γ

∞ X

cn z

n

e

y2 (z) =

n=0

∞ X

dn z n ,

(8.143)

n=0

onde cn = −

n−1 h i X 1 (m + 1 − γ)an−m + bn−m cm , f (1 − γ + n) m=0

dn = −

n−1 i 1 Xh man−m + bn−m dm , f (n) m=0

para todo n ≥ 1. Assim, cn =

n+α−γ cn−1 , n(n + 1 − γ)

dn =

n+α−1 dn−1 , n(n + γ − 1)

o que conduz a cn =

(α + 1 − γ)n c0 , n!(2 − γ)n

dn =

(α)n d0 , n!(γ)n

(8.144)

Tomando d0 = 1 a solu¸ca˜o y2 assume a forma

∞ ∞ X (α)n n Γ(γ) X Γ(α + n) z n z = . 1 F1 (α, γ, z) := 1 + n!(γ)n Γ(α) n=0 Γ(γ + n) n! n=1

(8.145)

Esta fun¸ca˜o ´e denominada fun¸ca ˜o hipergeom´etrica confluente ou, por vezes, fun¸ca ˜o de Kummer. E. 8.20 Exerc´ıcio. Prove, usando diretamente as defini¸co˜es, a seguinte rela¸c˜ao entre as fun¸co˜es hipergeom´etricas confluentes e as fun¸co˜es hipergeom´etricas:   z α, β, γ, . 1 F1 (α, γ, z) = lim F |β|→∞ β 6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

449/1304

Aplicando o teste da raz˜ao a` s´erie de (8.145) (α)n+1 n+1 |α + n| (n+1)!(γ)n+1 z |z| , = (α) n n (n + 1) |γ + n| z n!(γ)n

vemos que a mesma converge para todo z, pois para cada z fixo o lado direito torna-se menor que 1 para n grande o suficiente. Assim, 1 F1 (α, γ, z) ´e anal´ıtica para todo z ∈ .

Fazemos ainda notar que a express˜ao acima para 1 F1 (α, γ, z) est´a definida mesmo para o caso em que γ ´e um inteiro positivo e, portanto, representa uma solu¸ca˜o da equa¸ca˜o hipergeom´etrica confluente naquele caso. Para γ nulo ou um inteiro negativo, digamos γ = −m, o denominador (γ) n anula-se para n > m e a express˜ao para F (α, γ, z) deixa de fazer sentido. Passemos agora a` solu¸ca˜o y1 . Alguns segundos de contempla¸ca˜o das express˜oes de (8.144) conduzemnos a` percep¸ca˜o que a rela¸ca˜o entre cn e c0 equivale a` rela¸ca˜o entre dn e d0 com a troca α → α + 1 − γ e γ → 2 − γ (tal como se fez no caso da equa¸ca˜o hipergeom´etrica, acima). Assim, convencionando-se tamb´em c0 = 1 tem-se que a solu¸ca˜o y1 (z) ´e dada por z 1−γ 1 F1 (α + 1 − γ, 2 − γ, z) . Fazemos ainda notar que 1 F1 (α + 1 − γ, 2 − γ, z) est´a definida mesmo para o caso em que γ ´e um inteiro n˜ao-positivo e, portanto, z 1−γ 1 F1 (α + 1 − γ, 2 − γ, z) representa uma solu¸ca˜o da equa¸ca˜o hipergeom´etrica confluente naquele caso. Resumindo, para o caso γ 6∈

a solu¸ca˜o geral da equa¸ca˜o hipergeom´etrica confluente (8.142) ´e

A1 z 1−γ 1 F1 (α + 1 − γ, 2 − γ, z) + A2 1 F1 (α, γ, z) , onde A1 e A2 s˜ao constantes arbitr´arias. Caso 2. γ = 1. Esse ´e o caso da equa¸ca˜o de Laguerre. Aqui γ− = γ+ = γ0 = 0. Nesse caso a primeira solu¸ca˜o ´e da forma y1 (z) = an´alogo, obtemos (α + n) cn , cn+1 = (n + 1)2

P∞

n=0 cn

z n e, de modo (8.146)

para todo n ≥ 0. Assim, a primeira solu¸ca˜o ´e 1 F1 (α, 1, z) = 1 +

∞ ∞ X zn (α)n n 1 X Γ(α + n) z = . 2 2 (n!) Γ(α) (n!) n=1 n=0

Pelo Teorema 8.2, p´agina 412, a segunda solu¸ca˜o tem a forma 1 F1 (α, 1, z) ln(z) +

∞ X

vn z n ,

n=0

com os vn dados em (8.56) em termos dos cn de acima. A express˜ao que se obtem ´e um tanto complexa e evitamos coloc´a-la aqui.

JCABarata. Curso de F´ısica-Matem´ atica

Caso 3. γ − 1 ∈

\ {0}, ou seja, γ ∈

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

450/1304

mas γ 6= 1.

Esse ´e o caso da equa¸ca˜o de Laguerre associada.

H´a dois casos a distinguir: a. γ > 1 e b. γ ≤ 0.

No caso a, γ = m, com m > 1 inteiro. Aqui tem-se n0 = m − 1, γ1 = γ+ = 0 e γ2 = γ− = 1 − m. Como j´a observamos acima, uma solu¸ca˜o ´e dada por 1 F1 (α, m, z). Uma segunda solu¸ca˜o ser´a da forma A 1 F1 (α, m, z) ln(z) + z 1−m

∞ X

vn z n ,

n=0

com os vn e A dados como em (8.60) e (8.61) a partir dos coeficientes cn de 1 F1 (α, m, z). Novamente, a express˜ao que se obtem ´e complexa e a omitimos aqui. No caso b, γ = −m, com m ≥ 0 inteiro. Aqui tem-se n0 = m + 1, γ1 = γ− = 1 + m e γ2 = γ+ = 0. Como j´a observamos acima, uma solu¸ca˜o ´e dada por z 1+m 1 F1 (α + 1 + m, 2 + m, z). Uma segunda solu¸ca˜o ser´a da forma Az 1+m 1 F1 (α + 1 + m, 2 + m, z) ln(z) +

∞ X

vn z n ,

n=0

com os vn e A dados como em (8.60) e (8.61) a partir dos coeficientes cn de z 1+m 1 F1 (α+1+m, 2+m, z). Novamente, a express˜ao que se obtem ´e complexa e ´e omitida aqui. Com isso encerramos nossa breve excurs˜ao a`s fun¸co˜es hipergeom´etricas confluentes. Para um tratamento extensivo da equa¸ca˜o hipergeom´etrica confluente e propriedades de suas solu¸co˜es, vide [121], [66] ou [136].

8.3

Algumas Equa¸ co ˜es Associadas

Algumas das equa¸co˜es tratadas acima possuem parentes pr´oximos com os quais se relacionam amistosamente. Vamos estudar algumas delas.

8.3.1

A Equa¸ c˜ ao de Legendre Associada

A equa¸ca ˜o de Legendre associada ´e equa¸ca˜o diferencial (1 − z 2 )y 00 (z) − 2zy 0 (z) + λ(λ + 1)y(z) −

µ2 y(z) = 0 . 1 − z2

(8.147)

Como ´e f´acil de se constatar, os pontos ±1 s˜ao pontos singulares regulares da equa¸ca˜o de Legendre associada. Repare tamb´em que para µ = 0 recupera-se a equa¸ca˜o de Legendre usual (1 − z 2 )y 00 (z) − 2zy 0 (z) + λ(λ + 1)y(z) = 0 .

(8.148)

O principal interesse na equa¸ca˜o (8.147) se d´a no caso em que µ ´e um n´ umero inteiro, µ = m ∈ , situa¸ca˜o que corresponde a` maioria das aplica¸co˜es. Nesse caso, um truque feliz permite-nos encontrar as solu¸co˜es sem termos de recorrer ao m´etodo de Frobenius.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

451/1304

Tudo come¸ca com a observa¸ca˜o que a equa¸ca˜o de Legendre usual e a equa¸ca˜o de Legendre associada podem ser transformadas em uma mesma equa¸ca˜o. Se em (8.147) fizermos a substitui¸ca˜o (j´a adotando µ = m ∈ ) y(z) = (1 − z 2 )m/2 v(z), obtemos para v a equa¸ca˜o   2 00 0 (1 − z )v (z) − 2(m + 1)z v (z) + λ(λ + 1) − m(m + 1) v(z) = 0 . (8.149) E. 8.21 Exerc´ıcio importante. Mostre isso. Sugest˜ao: um pouco de paciˆencia. Se, por outro lado, tomarmos a equa¸ca˜o (8.148) e a derivarmos m vezes, obtemos   00 0  (1 − z 2 ) y (m) (z) − 2(m + 1)z y (m) (z) + λ(λ + 1) − m(m + 1) y (m) (z) = 0 .

6

(8.150)

E. 8.22 Exerc´ıcio importante. Mostre isso. Sugest˜ao: use a regra de Leibniz para calcular as derivadas     dm 2 00 0 (1 − z )y (z) e dz m zy (z) . 6

dm dz m

Comparando (8.149) com (8.150), constatamos que ambas s˜ao a mesma equa¸ca˜o. Com isso, vemos que se yL ´e a solu¸ca˜o geral da equa¸ca˜o de Legendre e yLa ´e a solu¸ca˜o geral da equa¸ca˜o de Legendre (m) associada, ent˜ao (1 − z 2 )−m/2 yLa (z) e yL (z) devem ser proporcionais, j´a que obedecem a` mesma equa¸ca˜o (8.149). Com isso, obtemos que a solu¸ca˜o geral da equa¸ca˜o de Legendre associada pode ser obtida da solu¸ca˜o geral da equa¸ca˜o de Legendre por (m)

yLa (z) = km (1 − z 2 )m/2 yL (z) , km sendo constantes de normaliza¸ca˜o a serem convencionadas. Coloquemo-nos agora a quest˜ao: qual solu¸ca˜o yL da equa¸ca˜o de Legendre devemos adotar? Isso certamente depende do tipo de problema considerado, mas na maioria das aplica¸co˜es procuramos resolver a equa¸ca˜o de Legendre associada no intervalo [−1, 1] e procuramos solu¸co˜es que sejam finitas em todo esse intervalo, incluindo as bordas ±1. Ora, j´a vimos que as u ´ nicas solu¸co˜es da equa¸ca˜o de Legendre usual que permanecem limitadas nos extremos ±1 (assim como suas derivadas) s˜ao os polinˆomios de Legendre Pl (z), os quais ocorrem como solu¸ca˜o apenas no caso λ = l, um inteiro n˜aonegativo. Obtemos assim que as solu¸co˜es de interesse da a¸ca˜o de Legendre associada que s˜ao limitadas em todo o intervalo fechado [−1, 1] ocorrem para λ = l, um inteiro n˜ao-negativo, e s˜ao dadas por Plm (z) := (1 − z 2 )m/2

dm Pl (z) , dz m

(8.151)

´ claro que P m (z) ´e nulo se m > l (pois Pl ´e um polinˆomio onde Pl ´e o polinˆomio de Legendre de grau l. E l de grau l). omios de Legendre associados, ainda que As fun¸co˜es Plm definidas acima s˜ao denominadas polinˆ n˜ao sejam realmente polinˆomios em z no caso em que m ´e ´ımpar (devido ao fator (1 − z 2 )m/2 )24 e 24

Se, no entanto, substituirmos z por cos θ, com 0 ≤ θ ≤ π, o que costumeiramente se faz em aplica¸co ˜es, P lm (cos θ) 2 m/2 torna-se um polinˆ omio trigonom´etrico, ou seja, um polinˆ omio em cos θ e sen θ, j´ a que (1 − z ) torna-se ( sen (θ))m . Essa ´e a raz˜ ao dessa nomenclatura. Vide express˜ ao (9.53), p´ agina 505.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

452/1304

desempenham um papel importante na resolu¸ca˜o de equa¸co˜es diferenciais parciais em 3 dimens˜oes em coordenadas esf´ericas, tais como a equa¸ca˜o de Laplace e de Helmholtz. A eles est˜ao intimamente relacionados os chamados harmˆ onicos esf´ericos, dos quais falaremos na Se¸ca˜o 9.2.2, p´agina 501, e que desempenham um papel na Mecˆanica Quˆantica (orbitais atˆomicos), na Teoria de Grupos (representa¸co˜es do grupo SO(3)), no Eletromagnetismo (emiss˜ao de ondas eletromagn´eticas por antenas) etc. As fun¸co˜es Plm est˜ao definidas acima para l inteiro n˜ao-negativo, ou seja l = 0, 1, 2, 3, . . ., e m inteiro com 0 ≤ m ≤ l (pois para m > l o lado direito de (8.151) anula-se). Cada Plm ´e solu¸ca˜o da equa¸ca˜o de Legendre associada (1 − z 2 )y 00 (z) − 2zy 0 (z) + l(l + 1)y(z) −

m2 y(z) = 0 . 1 − z2

(8.152)

Na Se¸ca˜o 9.2.1, que se inicia a` p´agina 495, mostraremos que os polinˆomios de Legendre podem ser escritos como  1 dl  2 l Pl (z) = l (z − 1) , 2 l! dz l express˜ao essa conhecida como f´ ormula de Rodrigues para os polinˆ omios de Legendre. Assim, obtemos Plm (z) =

 l+m  1 2 m/2 d 2 l (1 − z ) (z − 1) , 2l l! dz l+m

(8.153)

express˜ao v´alida para 0 ≤ m ≤ l, com l um inteiro n˜ao-negativo: l = 0, 1, 2, 3, . . .. Caso m > l, o lado direito se anula. Um ponto interessante, por´em, ´e que a express˜ao do lado direito de (8.153) est´a bem definida para quaisquer l e m com l + m ≥ 0, ou seja, tamb´em para m’s negativos tais que m ≥ −l. Assim, (8.153) est´a definida para todo m inteiro com −l ≤ m ≤ l 25 . Da express˜ao (8.153), entendida para todo l inteiro n˜ao-negativo e −l ≤ m ≤ l, ´e poss´ıvel mostrar que (l − m)! m Pl−m (z) = (−1)m P (z) . (l + m)! l

Essa rela¸ca˜o, que ´e relevante para os chamados harmˆonicos esf´ericos, mostra que P l−m (z) ´e tamb´em solu¸ca˜o da equa¸ca˜o de Legendre associada (8.152), por ser proporcional a P lm (z). Trataremos disso na Se¸ca˜o 9.2.2, p´agina 501, onde outras propriedades dos polinˆomios de Legendre associados ser˜ao apresentadas e sua rela¸ca˜o com os harmˆonicos esf´ericos discutida.

8.3.2

A Equa¸ c˜ ao de Laguerre Associada

A equa¸ca ˜o de Laguerre associada ´e a equa¸ca˜o diferencial xy 00 + (m + 1 − x)y 0 + (n − m)y = 0 .

(8.154)

O principal interesse nessa equa¸ca˜o reside no caso onde m e n s˜ao inteiros satisfazendo 0 ≤ m ≤ n. Como o leitor facilmente constata, trata-se de um caso particular da equa¸ca˜o hipergeom´etrica confluente 25

De passagem, comentamos que a rela¸ca ˜o −l ≤ m ≤ l desempenha um papel na teoria do momento angular na Mecˆ anica Quˆ antica, mas isso n˜ ao ´e nosso assunto aqui.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

453/1304

(8.142). A equa¸ca˜o de Laguerre associada surge da equa¸ca˜o de Schr¨odinger para o a´tomo de hidrogˆenio quando a mesma ´e resolvida pelo m´etodo de separa¸ca˜o de vari´aveis em coordenadas esf´ericas. A solu¸ca˜o dessa equa¸ca˜o pode ser obtida diretamente da solu¸ca˜o da equa¸ca˜o de Laguerre usual xy 00 + (1 − x)y 0 + ny = 0

(8.155)

pois esta, quando diferenciada m vezes em rela¸ca˜o a` x, transforma-se exatamente na equa¸ca˜o (8.154). E. 8.23 Exerc´ıcio. Verifique! Sugest˜ao: regra de Leibniz.

6

Assim, se y ´e solu¸ca˜o de (8.155) segue que y (m) ´e solu¸ca˜o de (8.154). Conclu´ımos que as u ´ nicas solu¸co˜es de (8.154) que s˜ao regulares em x = 0 s˜ao da forma   n dm dm (m) x d n −x Ln (x) = Ln (x) = e (x e ) . (8.156) dxm dxm dxn au ´ ltima igualdade sendo proveniente de (8.134) ou de (9.86). (m)

Os polinˆomios Ln s˜ao denominados polinˆ omios de Laguerre associados. Os polinˆomios de Laguerre associados surgem, como dissemos, na resolu¸ca˜o da equa¸ca˜o de Schr¨odinger para o a´tomo de hidrogˆenio em coordenadas esf´ericas. Vide Se¸ca˜o 10.5, p´agina 568. Junto com os harmˆonicos esf´ericos, definidos a` p´agina 509, os polinˆomios de Laguerre associados definem a forma dos orbitais eletrˆonicos do a´tomo de hidrogˆenio e (de forma aproximada) de a´tomos hidrogen´oides. A forma desses orbitais ´e de importˆancia fundamental no estudo de a´tomos e mol´eculas e suas liga¸co˜es qu´ımicas. Usando (8.133), ´e f´acil constatar que Ln(m) (x)



 n = (−1) (−1) xk . k! m + k k=0 m

n−m X

k n!

Mais propriedades dos polinˆomios de Laguerre associados ser˜ao estudadas na Se¸ca˜o 9.2.5, p´agina 519.

8.4

A Fun¸ c˜ ao Gama. Defini¸ c˜ ao e Propriedades

Apresentaremos na presente se¸ca˜o algumas das propriedades mais importantes da chamada fun¸ca ˜o gama uentemente aparece de Euler, ou simplesmente fun¸ca ˜o gama, denotada por Γ(z), com z ∈ , a qual freq¨ na resolu¸ca˜o de equa¸co˜es diferenciais ordin´arias pelo m´etodo de expans˜ao em s´eries de potˆencias, assim como em v´arias a´reas da F´ısica e da Matem´atica, por representar uma esp´ecie de generaliza¸ca˜o cont´ınua do fatorial de n´ umeros inteiros, como ser´a precisado adiante. Aqui nos restringiremos a`s propriedades mais relevantes da fun¸ca˜o gama. Para um estudo mais extenso de propriedades dessa fun¸ca˜o e suas aplica¸co˜es, recomendamos [66], [83], [136], [7], [107] ou ainda [82]. Ainda que nem todos esses textos primem por escolher as demonstra¸co˜es mais simples para seus resultados, vale a pena o estudante inteirar-se de abordagens diversas. A referˆencia [107] contem algumas notas hist´oricas sobre a fun¸ca˜o gama de Euler.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

454/1304

• Definindo a fun¸ c˜ ao gama A fun¸ca˜o Γ, pode ser definida em todo plano complexo (exceto, como veremos, para inteiros n˜aopositivos, onde possui p´olos simples). No semiplano Re (z) > 0, Γ(z) ´e definida por Z ∞ e−t tz−1 dt . (8.157) Γ(z) := 0

A seguinte proposi¸ca˜o contem informa¸co˜es relevantes sobre (8.157) e sobre a estrutura anal´ıtica de Γ: Proposi¸ c˜ ao 8.2 A integral em (8.157) converge absolutamente para todo z ∈ com Re (z) > 0. A fun¸ca ˜o Γ definida por (8.157) ´e anal´ıtica no semiplano Re (z) > 0 e pode ser analiticamente estendida a todo , exceto para os pontos z = 0, −1, −2 . . . que s˜ ao p´ olos simples de Γ. O res´ıduo de Γ em (−1)n z = −n ´e dado por n! para todo n = 0, 1, 2, . . .. 2 Prova. Para ver que a integral em (8.157) converge absolutamente para Re (z) > 0, escrevemos z = x+iy com x = Re (z), y = Im (z) e escolhemos α e β tais que 0 < α < x < β < ∞. Como |tz−1 | = tx−1 tem-se Z

∞ 0

−t z−1 e t dt =

Z



e−t tx−1 dt

0

= Agora, a integral

enquanto que nencial tem-se

R∞ 1

R1 0

Z

1

e

−t x−1

t

dt +

0

Z



e

−t x−1

t

1

dt ≤

Z

1

e

−t α−1

t

dt +

0

Z



e−t tβ−1 dt .

1

e−t tα−1 dt ´e finita, pois, para α > 0 Z 1 Z 1 1 −t α−1 < ∞. e t dt ≤ tα−1 dt = α 0 0

e−t tβ−1 dt ´e finita para qualquer β ∈ 

pois, devido ao r´apido decaimento da expo-

lim e−γt tβ−1 = 0 ,

t→∞

para todo γ > 0, o que implica que existe constante Cγ, β > 0 tal que tβ−1 ≤ Cγ, β , eγt

(8.158)

para todo t > 1. Assim, tomando 0 < γ < 1, vale Z ∞ Z ∞ e−(1−γ) −t β−1 e−(1−γ)t dt = Cγ, β e t dt ≤ Cγ, β < ∞. 1−γ 1 1 Isso prova que a integral em (8.157) converge absolutamente se Re (z) > 0. Para provar que Γ(z) ´e anal´ıtica no semiplano Re (z) > 0, come¸camos observando que, para 0 < a < A < ∞, a fun¸ca˜o Z A e−t tz−1 dt Γa, A (z) := a

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

455/1304

´e anal´ıtica na regi˜ao Re (z) > 0. Isso se deve ao fato de ser poss´ıvel verificar a validade das rela¸co˜es de Cauchy-Riemann para Γa, A (z), diferenciando-a sob o s´ımbolo de integra¸ca˜o e usando o fato de que tz−1 = e(z−1) ln(t) ´e anal´ıtica em z para t > 0. Que ´e poss´ıvel diferenciar sob o s´ımbolo de integra¸ca˜o segue do fato de o integrando ser cont´ınuo em t e a regi˜ao de integra¸ca˜o ser o intervalo compacto [a, A]. Uma vez estabelecido que Γa, A (z) ´e anal´ıtica em Re (z) > 0, podemos provar que ΓA (z), definida por ΓA (z) := lim Γa, A (z) = a→0

Z

A

e−t tz−1 dt ,

(8.159)

0

´e tamb´em anal´ıtica em Re (z) > 0. Para tal, tomemos z ∈ Fα, β , onde Fα, β ⊂

´e a faixa definida por

Fα, β = {z ∈ | α < Re (z) < β} , com 0 < α < β < ∞, ou seja, tomemos 0 < α < Re (z) < β. Ent˜ao, para A > 0 fixo e 0 < a 0 < a < 1, Z a Z a (a0 )α − aα −t x−1 tα−1 dt = e t dt ≤ |Γa, A (z) − Γa0 , A (z)| ≤ , α a0 a0 que pode ser feito menor que qualquer  > 0 dado, para todos a e a0 pequenos o suficiente. Dessa forma, o limite que define ΓA (z) em (8.159) ´e uniforme em Fα, β , Assim, por ser o limite uniforme de fun¸co˜es anal´ıticas, ΓA (z) ´e igualmente anal´ıtica em Fα, β (esse ´e um teorema bem-conhecido da teoria das fun¸co˜es de vari´avel complexa). Como α e β s˜ao arbitr´arios (0 < α < β), Γ A (z) ´e anal´ıtica para todo o semiplano Re (z) > 0. Para provar que Γ(z) = lim ΓA (z)

(8.160)

A→∞

´e anal´ıtica para todo o semiplano Re (z) > 0 temos que provar que esse limite ´e uniforme nas faixas z ∈ Fα, β e evocar o mesmo teorema da teoria das fun¸co˜es de vari´avel complexa mencionado acima. Para provar uniformidade do limite, notemos que para 1 < A < B, tem-se, com 0 < γ < 1, Z B Z B Z A −t z−1 −t z−1 e t dt − e t dt ≤ e−t tx−1 dt 0

0

A



(8.158)

Z

B

e−t tβ−1 dt

A

Z

B

e−(1−γ)t dt



Cγ, β

=

 Cγ, β  −(1−γ)A e − e−(1−γ)B , 1−γ

A

que pode ser feito menor que qualquer  > 0 prescrito para todos A e B grandes o suficiente. Isso provou que o limite em (8.160) ´e uniforme em cada faixa Fα, β com 0 < α < β, mostrando que Γ(z) ´e anal´ıtica em cada uma dessas faixas Fα, β e, portanto, em todo o semiplano Re (z) > 0. Para provar que Γ possui uma extens˜ao anal´ıtica para a regi˜ao Re (z) ≤ 0 (exceto, como mencionamos, os inteiros n˜ao-positivos), notamos que para Re (z) > 0 podemos escrever (8.157) trivialmente

JCABarata. Curso de F´ısica-Matem´ atica

como Γ(z) :=

Z

R∞

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

1 −t z−1

e t

dt +

0

Z



456/1304

e−t tz−1 dt .

1

Agora, a integral impr´opria I(z) := 1 e−t tz−1 dt ´e anal´ıtica para todo z ∈ , o que pode ser visto repetindo os argumentos de convergˆencia uniforme de acima: para 1 < A < A0 < ∞, escrevendo x = Re (z) e restringindo-nos provisoriamente a` regi˜ao x < β, para algum β ∈ , temos Z Z 0 Z A0 A A e−t tz−1 dt − e−t tz−1 dt = e−t tz−1 dt (8.161) 1 1 A 



t≥1



(8.158)

Z

Z

A0

e−t tx−1 dt

(8.162)

e−t tβ−1 dt

(8.163)

Z

(8.164)

A A0 A A0

e−(1−γ)t dt



Cγ, β

=

e−(1−γ)A − e−(1−γ)A , Cγ, β 1−γ

A 0

(8.165)

que, escolhendo-se 0 < γ < 1, pode ser feita menor Rque qualquer  > 0 prescrito para todos A, A 0 A grandes o suficiente. Isso prova que o limite limA→∞ 1 e−t tz−1 dt ´e uniforme na regi˜ao Re (z) < β, o que prova que a integral impr´opria I(z), sendo o limite uniforme de fun¸co˜es anal´ıticas em Re (z) < β, ´e tamb´em anal´ıtica nessa regi˜ao. Como β ∈ ´e arbitr´ario, conclu´ımos que a integral impr´opria I(z) ´e anal´ıtica em todo o plano complexo . R1 J´a para a integral Γ1 (z) = 0 e−t tz−1 dt tem-se ! Z 1 Z 1 X ∞ n (−1) tn tz−1 dt e−t tz−1 dt = n! 0 0 n=0 

=

Z ∞ X (−1)n n=0

=

n!

∞ X (−1)n n=0

n!

1

tn+z−1 , dt 0

1 , z+n

(a invers˜ao da s´erie pela integral na segunda linha acima ´e justificada pois, como ´e bem sabido, a s´erie de Taylor da fun¸ca˜o exponencial converge uniformemente em intervalos compactos, como o intervalo de integra¸ca˜o [0, 1]).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

457/1304

Dessa forma, obtemos a representa¸ca ˜o de Mittag-Leffler26 da fun¸ca˜o Γ: Γ(z) =

∞ X (−1)n n=0

n!

1 + z+n

Z



e−t tz−1 dt .

(8.166)

1

Como dissemos, a integral no lado direito de (8.166) ´e anal´ıtica para todo z ∈ . J´a a soma no lado direito de (8.166) converge uniformemente (devido ao n! no denominador) em regi˜oes finitas de que excluam os pontos 0, −1, −2, −3, . . . e, portanto, representa uma fun¸ca˜o anal´ıtica para todo z ∈ , exceto nos inteiros n˜ao-positivos, como mencionado, onde possui p´olos simples. Como se constata n para todo n = 0, 1, 2, 3, . . .. Isso inspecionando (8.166), o res´ıduo de Γ em z = −n ´e dado por (−1) n! completa a demonstra¸ca˜o. A demonstra¸ca˜o acima da existˆencia da mencionada extens˜ao de Γ para argumentos com parte real negativa mostra que essa extens˜ao pode ser calculada por meio da representa¸ca˜o de Mittag-Leffler (8.166). Como veremos mais abaixo, por´em, h´a uma outra forma, talvez mais conveniente, de expressar essa extens˜ao, a saber, com uso da chamada f´ ormula dos complementos: Γ(z)Γ(1 − z) =

π , sen (πz)

v´alida para z n˜ao-inteiro e que permite escrever Γ(−z) = −

π , zΓ(z) sen (πz)

(8.167)

com a qual, caso Re (z) > 0, a extens˜ao de Γ para argumentos com parte real negativa (lado esquerdo) pode ser calculada em termos de Γ(z) com Re (z) > 0 (no lado direito), dada concretamente pela integral (8.157). Mais abaixo apresentaremos outro argumento, talvez mais elementar, para provar que Γ possui uma extens˜ao anal´ıtica para o semiplano Re (z) ≤ 0 (exceto os inteiros n˜ao-positivos). Antes disso, fa¸camos alguns coment´arios importantes.

• Convexidade de Γ e de ln Γ ´ imediato da defini¸ca˜o (8.157) que para Re (z) > 0 valem E Z ∞ Z 0 −t z−1 00 Γ (z) = e t ln(t) dt e Γ (z) = 0



e−t tz−1 (ln(t))2 dt .

(8.168)

0

A segunda express˜ao acima diz-nos que se z for real e positivo (z ≡ x > 0) ent˜ao Γ 00 (x) > 0 e, portanto, Γ ´e uma fun¸ca˜o convexa em + . Em verdade, vale que tamb´em ln Γ ´e convexa em + , fato de certa relevˆancia como veremos abaixo quando mencionarmos o Teorema de Bohr-Mollerup, Teorema 8.4. 

26



Magnus G¨ osta Mittag-Leffler (1846-1927). Para a defini¸ca ˜o geral da no¸ca ˜o de s´erie de Mittag-Leffler, vide [107].

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

458/1304

Para mostrar isso, notemos que, por (8.168), 0 2

(Γ(x) )

Z

=

Z

= Cauchy-Schwarz



Z



−t x−1

e t

ln(t) dt

0 ∞ 0 ∞ 0



e

−t/2 (x−1)/2

t

−t x−1

e t

dt

2



 Z

e

−t/2 (x−1)/2



t

−t x−1

e t



ln(t) dt

ln(t) dt

0



2

= Γ(x)Γ00 (x) ,

 Γ00 (x)Γ(x) − (Γ(x)0 )2 d2  ≥ 0, mostrando que ln Γ ´e convexa em o que implica ln Γ(x) = dx2 (Γ(x))2 

+.

• A fun¸ c˜ ao Γ e o fatorial Usando integra¸ca˜o por partes, segue que, para Re (z) > 0, ∞ Z ∞ Z ∞ −t z −t z e t dt = −e t +z e−t tz−1 dt , Γ(z + 1) = 0 0 | {z 0} =0

provando que

Γ(z + 1) = zΓ(z) .

(8.169)

A rela¸ca˜o (8.169) ´e de grande importˆancia e representa a raz˜ao de ser da fun¸ca˜o gama de Euler. R∞ Por indu¸ca˜o finita, e pelo fato de que, por (8.157), Γ(1) = 0 e−t dt = 1, segue facilmente de (8.169) que Γ(n + 1) = n! , para todo n ∈ . Assim, a fun¸ca˜o Γ ´e uma esp´ecie de extens˜ao complexa do fatorial de n´ umeros inteiros positivos. 

Essa u ´ ltima observa¸ca˜o merece um coment´ario. H´a certamente muitas fun¸co˜es f em + satisfazendo f (n + 1) = n! para todo n ∈ . Se f ´e uma fun¸ca˜o satisfazendo f (x + 1) = xf (x) para todo x ∈ + , ent˜ao f (x)/Γ(x) ´e peri´odica de per´ıodo 1, pois f (x + 1)/Γ(x + 1) = (xf (x))/(xΓ(x)) = f (x)/Γ(x) para todo x ∈ + . Assim, f (x) = P (x)Γ(x) com P peri´odica de per´ıodo 1 ´e a solu¸ca˜o mais geral da equa¸ca˜o f (x + 1) = xf (x). Se P (1) = 1 ent˜ao f (n + 1) = n! para todo n ∈ . Um c´elebre teorema, devido a Bohr27 e Mollerup28 , garante que a fun¸ca˜o gama de Euler ´e u ´ nica em um certo sentido: Z ∞ e−t tx−1 dt, x > 0, ´e a u ´nica Teorema 8.4 (Teorema de Bohr-Mollerup) A fun¸ca ˜o Γ(x) := 









fun¸ca ˜o real em 27



+

satisfazendo

0

Harald August Bohr (1887-1951). H. Bohr era irm˜ ao mais novo do f´ısico Niels Bohr (Niels Henrik David Bohr (1885-1962)). H. Bohr recebeu v´ arios prˆemios por sua obra matem´ atica e foi agraciado com a medalha de prata nos ´ provavelmente at´e hoje o Jogos Ol´ımpicos de 1908, em Londres, como jogador da sele¸ca ˜o dinamarquesa de futebol(!) E u ´nico cientista a alcan¸car essa honraria. 28 Johannes Peter Mollerup (1872-1937).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

459/1304

1. f (1) = 1, 2. f (x + 1) = xf (x) para todo x > 0 (e, conseq¨ uentemente, satisfazendo f (n + 1) = n! para todo n ∈ ), 

3. ln f ´e convexa.

2

Uma demonstra¸ca˜o desse interessante teorema pode ser encontrada em [7], assim como em [26]. • Revisitando a extens˜ ao de Γ para Re(z) ≤ 0 A express˜ao (8.157) permite definir Γ(z), mas somente se Re (z) > 0 pois, de outra forma, a integral ´ poss´ıvel, no entanto, estender analiticamente a fun¸ca˜o no lado direito de (8.157) n˜ao est´a definida. E Γ a todo , exceto aos inteiros n˜ao-positivos. J´a demonstramos esse fato acima, mas o mesmo pode tamb´em ser diretamente derivado da rela¸ca˜o (8.169). Trataremos disso agora. Para n = 0, 1, 3, . . ., (8.169) diz-nos que Γ(z + n) = (z + n − 1)(z + n − 2) · · · zΓ(z) , o que permite escrever Γ(z) =

Γ(z + n) . (z + n − 1)(z + n − 2) · · · z

(8.170)

Agora, Γ(z + n) est´a definida por (8.157) para Re (z + n) > 0, Assim, (8.170) permite definir Γ(z) para Re (z) > −n. Como n ´e arbitr´ario, a f´ormula (8.169) prolonga analiticamente Γ(z), exceto nos pontos z = −n (n = 0, 1, 2 . . .). Note-se que, por (8.170) tem-se na regi˜ao Re (z) > −n que Γ(z + 1) =

Γ(z + 1 + n) (z + n)(z + n − 1) · · · (z + 1)

(8.169)

=

(z + n)Γ(z + n) (z + n)(z + n − 1) · · · (z + 1) =

Γ(z + n) (z + n − 1) · · · (z + 1)

(8.170)

=

zΓ(z) ,

provando que (8.169) permanece v´alida para a extens˜ao. Por (8.170) pode-se ver que z = 0, −1, −2 . . . s˜ao p´olos simples de Γ. De fato, pode-se calcular o res´ıduo de Γ em cada ponto z = −n e constatar que ´e n˜ao-nulo. Por (8.170), esses res´ıduos s˜ao dados por lim (z + n)Γ(z) = lim (z + n)

z→−n

z→−n

Γ(z + n + 1) Γ(1) (−1)n = = (z + n)(z + n − 1) · · · z (−1)(−2) · · · (−n) n!

como j´a hav´ıamos observado. Conclu´ımos que Γ possui uma extens˜ao anal´ıtica ao plano complexo 0, −1, −2 . . ., onde possui p´olos simples. • Outra representa¸ c˜ ao integral equivalente

, exceto aos pontos z =

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

Fazendo a mudan¸ca de vari´avel t = u2 a integral em (8.157) torna-se Z ∞ 2 Γ(z) = 2 e−u u2z−1 du .

460/1304

(8.171)

0

Disso segue que

  Z ∞ √ 1 2 = 2 e−u du = π , Γ 2 0

identidade essa que usaremos adiante. Usando (8.169) para z = 21 , obtem-se        1 1 3 1 (2n − 1)!! √ (2n)! √ 1 = n− n− ··· Γ = π = 2n π, Γ n+ n 2 2 2 2 2 2 2 n! para todo n ∈ 

(8.172)

(8.173)

.

• A representa¸ c˜ ao produto de Gauss para Γ A fun¸ca˜o Γ pode ser expressa de diversas outras formas, muitas delas u ´ teis para a obten¸ca˜o de resultados mais profundos e exibiremos algumas aqui. Uma delas ´e uma representa¸ca ˜o produto de Gauss para a fun¸ca ˜o Γ: n! nz , (8.174) Γ(z) = lim n→∞ z(z + 1) · · · (z + n) v´alida para todo z ∈ , z 6= 0, −1, −2 . . ..

Para mostrar que (8.157) e (8.174) s˜ao equivalentes provemos primeiramente o seguinte lema

Lema 8.1 Para Re (z) > 0 vale Γ(z) = lim

n→∞

Z

n 0



t 1− n

n

tz−1 dt .

(8.175) 2

Prova. (De [66] com modifica¸co˜es). Tomemos z ∈ 0 < α < β < ∞. Rn Como Γ(z) = limn→∞ 0 e−t tz−1 dt, precisamos  Z n −t lim e − 1− n→∞

0

Defina-se para 0 ≤ t ≤ n, hn (t) := 1 − e Como facilmente se constata, h0n (t)

= e

t



t 1− n

n−1

Fα, β , ou seja, α < Re (z) < β, com α e β fixos, apenas provar que n  t tz−1 dt = 0 . n t



t 1− n

t ≥ 0 n

n

.

para 0 ≤ t ≤ n .

(8.176)

JCABarata. Curso de F´ısica-Matem´ atica Z

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

461/1304

t

h0n (s) ds. Como h0n (s) ≥ 0 para 0 ≤ s ≤ n, segue disso que 0 n−1 hn (t) ≥ 0 para 0 ≤ t ≤ n. Adicionalmente, como 1 − ns ≤ 1 para 0 ≤ s ≤ n, tem-se tamb´em Como

h0n (0)

= 0, segue que hn (t) =

hn (t) =

Z

s

0

h0n (s) ds

Com isso, estabeleceu-se que 0 ≤ hn (t) ≤

=

Z

t

 s n−1 s es 1 − ds n n

t

s e ds ≤ et n

0



Z

=

e t t2 . 2n

s

0

Z

t 0

s ds n

e t t2 , 2n

o que implica  n t2 t −t . ≤ 0 ≤ e − 1− n 2n

(8.177)

Disso segue o fato bem-conhecido de cursos de C´alculo que  n t −t e = lim 1 − , n→∞ n para todo t ∈ 

(8.178)

, mas segue tamb´em que 

t 1− n

n

≤ e−t ,

(8.179)

fato que usaremos adiante. Agora,

Z

n 0



e

−t



t − 1− n

n 

onde, para 1 < a < n, definimos n   Z a t −t Fa := e − 1− tz−1 dt , n 0

tz−1 dt = Fa + Ga, n ,

Ga, n :=

Z

n a



e

−t



t − 1− n

n 

tz−1 dt .

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

462/1304

Podemos afirmar que, para 1 < a < n, |Ga, n |

Z

≤ (8.179)



a>1



(8.158)



2 2

n a

Z

Z



e

−t



t + 1− n

n 

tx−1 dt

n

e−t tx−1 dt a n

e−t tβ−1 dt a

2Cγ, β

Z

n

e−(1−γ)t dt a

 2Cγ, β −(1−γ)a e − e−(1−γ)n , 1−γ

=

onde x = Re (z) > 0, α < x < β, e usamos que |tz | = tx . A constante positiva γ de (8.158) ´e arbitr´aria, mas vamos escolhˆe-la de sorte que 0 < γ < 1, o que garante o decaimento da u ´ ltima express˜ao em n e a. Paralelamente, n  Z a x+1 Z a (8.177) −t ax+1 t x−1 t t dt ≤ dt = |Fa | ≤ e − 1 − n 2n 2n(x + 2) 0 0 Com isso, vemos que para 1 < a < n, Z n   n   t ax+1 2Cγ, β −(1−γ)a −t z−1 −(1−γ)n e − 1 − t dt e − e . ≤ + n 2n(x + 2) 1 − γ 0 Portanto,

Z lim n→∞

n

0



e

−t



t − 1− n

n 

t

z−1

2Cγ, β −(1−γ)a e . dt ≤ 1−γ

Mas o lado esquerdo n˜ao depende de a e o lado direito pode ser feito arbitrariamente pequeno tomando a → ∞. Isso prova (8.176), completando a demonstra¸ca˜o de (8.175) para z ∈ F α, β . Como α e β s˜ao arbitr´arios (com 0 < α < β), (8.175) fica provado para todo Re (z) > 0.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

463/1304

Passemos agora a` prova de (8.174). Temos,  n  n z n n−1 Z n Z n n t t t t int. por partes z−1 t dt = 1− tz dt 1− 1− + nz n n z n 0 0 0 1 z

=

Z

n

0



t 1− n

(n − 1) nz(z + 1)

int. por partes

=

Z

n−1

n 0



tz dt

t 1− n

n−2

tz+1 dt

.. . n

n! nn z(z + 1) · · · (z + n − 1)

itera¸ co ˜es

=

Z

n

tz+n−1 dt 0

n! nz n! nz+n = . nn z(z + 1) · · · (z + n) z(z + 1) · · · (z + n)

=

(8.180)

Por (8.175), isso prova (8.174). • A representa¸ c˜ ao produto de Weierstrass para Γ A representa¸ca ˜o produto de Weierstrass para a fun¸ca ˜o Γ, v´alida para Re (z) > 0, ´e ∞  Y 1 z  −z γz = ze e n 1+ Γ(z) n n=1

onde γ ´e o definida por γ := lim

n→∞



1 1 1 + + · · · + − ln(n) 2 n

(8.181) 

.

´ at´e hoje um A constante γ ´e chamada constante de Euler-Mascheroni29 e vale 0, 577215665 . . .. E problema em aberto saber se γ ´e um n´ umero racional ou n˜ao. Definindo, Γ

(n)

(z) :=

Z

n 0



t 1− n

n

tz−1 dt

(8.180)

=

n! nz , z(z + 1) · · · (z + n)

provamos no Lema 8.1 que Γ(z) = limn→∞ Γ(n) (z) para Re (z) > 0. Temos

  1 z n−z z −z ln(n) · · · 1 + = z(z + 1) · · · (z + n) = ze (1 + z) 1 + Γ(n) (z) n! 2 n = ze

1 −ln(n)) z (1+ 12 +···+ n

n  Y s=1

29

z z 1+ es s

Lorenzo Mascheroni (1750-1800). Vide nota de rodap´e a ` p´ agina 837.

(8.182)

JCABarata. Curso de F´ısica-Matem´ atica

e, portanto,

provando (8.181). Por (8.181) vˆe-se que

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

464/1304

∞  Y z  −z 1 1 γz 1+ = lim (n) = ze e s , n→∞ Γ Γ(z) (z) s s=1 1 Γ(z)

´e uma fun¸ca˜o inteira (i.e., anal´ıtica em toda parte), o que implica que

Γ(z) n˜ao tem zeros. Segue tamb´em de (8.181) que Γ(z) = Γ(z). • A representa¸ c˜ ao produto de Euler para Γ ´ bastante evidente que para todo n > 1, inteiro, vale E n =

n−1 Y l=1

l+1 l



=

n−1 Y l=1

1 1+ l



,

(8.183)

De acordo com (8.182), podemos escrever Γ

(n)

n! nz (z) = z(z + 1) · · · (z + n)

=

(8.183)

=

n

z1

z

m=1

"n−1  Y l=1

=

n  Y

z −1 1+ m

1 1+ l

z #

n z −1 1Y 1+ z m=1 m

z   n  Y 1 1 z −1 1+ , 1+ m m z(1 + n1 )z m=1

(8.184)

e tomando o limite n → ∞, obtemos

z   ∞  1 z −1 1 Y 1+ 1+ Γ(z) = z m=1 m m

(8.185)

v´alida para todo z ∈ , exceto z = 0, −1, −2, −3, . . .. Esta ´e a representa¸ca ˜o produto de Euler para a fun¸ca ˜o Γ. A express˜ao (8.185), obtida por Euler em 1729, foi a defini¸ca˜o historicamente original da fun¸ca˜o Γ, a representa¸ca˜o integral (8.157) tendo sido obtida posteriormente pelo mesmo autor a partir de (8.185). Euler chegou a (8.185) propondo-a como solu¸ca˜o da equa¸ca˜o funcional f (z + 1) = zf (z) com f (1) = 1, tentando dessa forma obter uma generaliza¸ca˜o cont´ınua do fatorial de n´ umeros inteiros positivos. E. 8.24 Exerc´ıcio. Verifique diretamente de (8.185) que Γ satisfaz Γ(z + 1) = zΓ(z) com Γ(1) = 1. Sugest˜ao: usando a u ´ltima express˜ao em (8.184) considere a raz˜ao Γ (n) (z + 1)/Γ(n) (z) e tome o limite n → ∞. 6 • Fun¸ c˜ ao Beta. Propriedades elementares

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

465/1304

A chamada fun¸ca ˜o beta, denotada por B(p, q) ´e definida por B(p, q) :=

Γ(p) Γ(q) Γ(p + q)

(8.186)

para p e q complexos, mas diferentes de inteiros n˜ao-positivos. Para Re (p) > 0 e Re (q) > 0 podemos expressar B(p, q) em uma forma integral muito u ´ til: B(p, q) = 2

Z

π 2

(cos θ)2p−1 ( sen θ)2q−1 dθ .

(8.187)

0

Provamo-la com uso de (8.171), que nos diz que   Z ∞ Z ∞ x −v 2 2q−1 −u2 2p−1 e v dv = 4 e u du Γ(p)Γ(q) = 4 0

0

e−(u

2 +v 2 )

u2p−1 v 2q−1 dudv .

u≥0, v≥0

Usando coordenadas polares, escrevemos u = r cos θ e v = r sen θ com 0 ≤ θ ≤ π/2 (pois u ≥ 0 e v ≥ 0) e obtemos Γ(p)Γ(q)

=

4

Z

∞ 0

 Z 2

=

Z



π/2

2

e−r r 2(p+q)−1 (cos θ)2p−1 (cos θ)2q−1 dr dθ 0

e

−r 2

r 2(p+q)−1 dr

0

(8.171)

=

Γ(p + q) 2

Z



2

Z

π/2

(cos θ)2p−1 (cos θ)2q−1 dθ 0

π/2

(cos θ)2p−1 (cos θ)2q−1 dθ

0

!

!

,

provando (8.187). Por mudan¸cas de vari´avel, obt´em-se outras representa¸co˜es integrais equivalentes a (8.187) para B(p, q). Tomando t = (cos θ)2 obtemos trivialmente de (8.187) que B(p, q) = Tomando em (8.188) u =

t t−1

Z

1

tp−1 (1 − t)q−1 dt .

0

(8.188)

obtem-se, por outro lado, B(p, q) =

Z

∞ 0

up−1 du . (1 + u)p+q

(8.189)

As representa¸co˜es (8.187), (8.188) e (8.189) valem para Re (p) > 0 e Re (q) > 0. Alguns textos adotam (8.188) como defini¸ca˜o de B(p, q) para Re (p) > 0 e Re (q) > 0. • A f´ ormula dos complementos

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

466/1304

Talvez a principal aplica¸ca˜o de (8.186) e das representa¸co˜es integrais (8.187), (8.188) e (8.189) seja o estabelecimento da importante f´ ormula dos complementos: sen (πz) 1 = , Γ(z)Γ(1 − z) π

(8.190)

v´alida para todo z ∈ , rela¸ca˜o esta que pode ser escrita em forma mais sim´etrica como Γ v´alida para todo z ∈ .

1 2

1  −z Γ

1 2

+z

 =

cos(πz) , π

(8.191)

Antes de demonstrar (8.190) notemos que ela permite escrever, para z n˜ao-inteiro, Γ(−z) = −

π π = − . Γ(z + 1) sen (πz) zΓ(z) sen (πz)

Essa express˜ao permite calcular a extens˜ao anal´ıtica de Γ de Re (z) > 0 para Re (z) < 0. Por exemplo, se Re (z) > 0, o lado direito pode ser calculado usando (8.157), fornecendo a fun¸ca˜o gama do lado esquerdo, cujo argumento tem parte real negativa. Para demonstrar30 (8.190), come¸camos usando (8.186) e (8.189) para obter Z ∞ z−1 u Γ(z)Γ(1 − z) = B(z, 1 − z) = du , 1+u 0

(8.192)

onde a representa¸ca˜o integral acima ´e v´alida para Re (z) > 0 e Re (1 − z) > 0, ou seja, na faixa 0 < Re (z) < 1, a qual nos restringiremos provisoriamente. A integral acima pode ser calculada pelo m´etodo dos res´ıduos, como descreveremos. Seja I a integral Z w z−1 dw , I := C 1+w onde C ´e a curva fechada no plano complexo, orientada no sentido anti-hor´ario, indicada na figura 8.1. A curva C ´e composta dos segmentos orientados (1) e (2), localizados, respectivamente, imediatamente acima e imediatamente abaixo do semi-eixo real positivo (sendo que faremos a distˆancia desses segmentos a esse semi-eixo ir a zero) e dos arcos orientados γ e Γ, de raios  e R, respectivamente. Escolhemos z−1 R > 1, de modo que o p´olo simples que a fun¸ca˜o f (w) = w1+w possui em w = −1 fique no interior da regi˜ao delimitada por C. Vamos representar a vari´avel complexa w na forma w = ρeiφ , com 0 ≤ ρ < ∞, 0 ≤ φ < 2π. Devido a essa escolha do intervalo de valores de φ, vemos que no segmento (1) tem-se que φ ≈ 0, enquanto que R R z−1 no segmento (2) φ ≈ 2π. Assim, a integral no segmento orientado (1) ´e aproximada por  ρ1+ρ dρ, R R z−1 enquanto que a integral no segmento orientado (2) ´e aproximada por −e2πiz  ρ1+ρ dρ, as aproxima¸co˜es sendo tanto melhores quanto mais pr´oximos os segmentos (1) e (2) encontrarem-se do semi-eixo real positivo (lembrar que o integrando ´e cont´ınuo nas regi˜oes acima a abaixo do semi-eixo real positivo 30

Seguimos os argumentos das notas de aula da Profa. Carmen Lys Ribeiro Braga. Para uma outra demonstra¸ca ˜o igualmente elementar que faz uso da f´ ormula de produto de Weierstrass (8.181), vide [66].

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

467/1304

Γ

γ

(1)

−1

(2)

R

Figura 8.1: A curva C composta pelos segmentos de integra¸ca˜o γ, Γ, (1) e (2).

e cada integra¸ca˜o ´e feita em segmentos finitos). Assim, a contribui¸ca˜o das integra¸co˜es de (1) e (2) a` integral I ´e Z  R ρz−1 2πiz dρ , 1−e  1+ρ

que nos limites  → 0, R → ∞ converge a (1 − e2πiz ) Γ(z)Γ(1 − z) devido a (8.192). Vamos agora estimar as integrais sobre os segmentos γ e Γ. Em γ temos ρ = , de modo que podemos escrever w = eiφ , com α ≤ φ ≤ 2π − α, para um certo α pequeno, e dw = ieiφ dφ, de forma que, escrevendo z = x + iy com x = Re (z), y = Im (z), Z e, portanto,

γ

w z−1 dw = −iz 1+w

Z

2π−α α

eiφ(z−1) iφ e dφ 1 + eiφ

Z Z 2π−α φ|y| 2π|y| w z−1 e x x 2πe dw ≤  dφ ≤  , 1+w 1− 1− α γ

que converge a zero quando  → 0 (lembrar que assumimos 0 < Re (z) < 1, ou seja, 0 < x < 1).

Em Γ temos, analogamente, ρ = R, de modo que podemos escrever w = Reiφ , com β ≤ φ ≤ 2π − β, para um certo β pequeno, e dw = iReiφ dφ, de forma que, escrevendo z = x + iy com x = Re (z),

JCABarata. Curso de F´ısica-Matem´ atica

y = Im (z),

Z

Γ

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

w z−1 dw = iRz 1+w

Z

2π−β β

468/1304

eiφ(z−1) iφ e dφ 1 + Reiφ

e, portanto, Z   Z 2π−β φ|y| z−1 x w Rx−1 e x 2π|y| R 2π|y| , dφ ≤ 2πe = 2πe 1 + w dw ≤ R R−1 R−1 1 − 1/R Γ β que converge a zero quando R → ∞ pois x < 1.

z−1

No interior da regi˜ao delimitada por C o integrando f (w) = w1+w possui uma u ´ nica singularidade: iπ(z−1) iπ um p´olo simples em w = −1, cujo res´ıduo ´e e (lembrar que −1 = e ). Assim, pelo teorema dos res´ıduos, Z z−1 u du = −2πieiπz 1 + u C

que independe de  e R. Coletando os resultados anteriores sobre as integrais em (1), (2), γ e Γ conclu´ımos que nos limites  → 0 e R → ∞ vale a igualdade  −2πieiπz = 1 − e2πiz Γ(z)Γ(1 − z) , que conduz trivialmente a

1 sen (πz) = . Γ(z)Γ(1 − z) π

At´e agora assumimos que 0 < Re (z) < 1. Todavia, ambos os lados da u ´ ltima express˜ao s˜ao fun¸co˜es inteiras. Portanto, a igualdade acima vale em todo plano complexo . • F´ ormula de duplica¸ c˜ ao de Legendre As propriedades da fun¸ca˜o beta permitem provar mais uma identidade sobre as fun¸co˜es gama, a chamada f´ ormula de duplica¸ca ˜o da fun¸ca ˜o Gama, devida a Legendre:   22z−1 1 Γ(2z) = √ Γ(z)Γ z + , (8.193) 2 π v´alida para todo z ∈ que n˜ao seja um inteiro n˜ao-positivo ou um semi-inteiro n˜ao-positivo, isto ´e, que n˜ao seja da forma −n ou da forma −n − 1/2, com n = 0, 1, 2, 3, . . .. A demonstra¸ca˜o ´e bastante simples. Assumindo provisoriamente Re (z) > 0, temos Γ(z)Γ(z) = B(z, z) Γ(2z)

(8.188)

=

Z

1 0

t(1 − t)

z−1

dt .

Efetuamos a mudan¸ca de vari´avel de integra¸ca˜o u = 2t − 1, temos Z +1 Z 1 1 2 Γ(z)Γ(z) 2 z−1 = 2z−1 (1 − u ) du = 2z−1 (1 − u2 )z−1 du . Γ(2z) 2 2 −1 0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

Por fim, fazendo a mudan¸ca de vari´avel de integra¸ca˜o v = u2 , tem-se  Z 1 Γ(z)Γ( 21 ) B z, 21 (8.188) 1 Γ(z)Γ(z) z−1 − 21  (1 − v) v dv = = 2z−1 = Γ(2z) 2 22z−1 22z−1 Γ z + 12 0

(8.172)

=

469/1304

√ Γ(z) π , 22z−1 Γ z + 21

provando (8.193) para Re (z) > 0. A generaliza¸ca˜o para todo z ∈ segue do fato de que ambos os lados de (8.193) possuem uma extens˜ao anal´ıtica para todo , exceto para os pontos em que z ´e um inteiro n˜ao-positivo ou um semi-inteiro n˜ao-positivo.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

470/1304

Apˆ endices 8.A

Prova da Proposi¸ c˜ ao 8.1. Justificando os Polinˆ omios de Legendre

Provaremos a Proposi¸ca˜o 8.1 apenas para o caso da s´erie ∞ X

∞ X

c2k z 2k , pois a demonstra¸ca˜o para a s´erie

k=0

c2k+1 z 2k+1 ´e, mutatis mutantis, idˆentica.

k=0

Caso λ ∈ seja um inteiro n˜ao-negativo par, a s´erie em (8.12) torna-se um polinˆomio e ´e, conseq¨ uentemente, finita para todo z ∈ . 

Consideremos, ent˜ao, que λ ∈ n˜ao ´e um inteiro n˜ao-negativo par. Tomemos a s´erie em (8.12) somada, para simplificar, a partir de k = 2 e calculada em z = ±1 (tomamos c0 = 1, sem perda de generalidade):  k−1  ∞ ∞ X X λ(λ + 1) 1 Y 1− c2k = −λ(λ + 1) . 2k l=1 2l(2l + 1) k=2 k=2 

Consideremos, para N > 2,

N X k=2

Se λ(λ + 1) ≤ 0 teremos que

c2k

 N k−1  X 1 Y λ(λ + 1) = 1− . 2k 2l(2l + 1) k=2

k−1 Y l=1

l=1

λ(λ + 1) 1− 2l(2l + 1)



≥ 1,

pois os fatores s˜ao positivos e maiores que 1. Logo, N X k=2

c2k

 N k−1  N X X 1 Y 1 λ(λ + 1) . = 1− ≥ 2k 2l(2l + 1) 2k k=2 l=1 k=2

N N X X 1 Portanto, como lim c2k diverge, completando a prova. diverge, isso prova que lim N →∞ N →∞ 2k k=2 k=2

´ claro que existe k0 ∈ Se λ(λ + 1) > 0 devemos proceder de outra forma. E 0
2, tal que (8.A.1)

JCABarata. Curso de F´ısica-Matem´ atica

o que implica 1 − N X

λ(λ+1) 2l(2l+1)

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

471/1304

> 0 para todo l > k0 . Escolhendo N > k0 , podemos escrever

c2k =

k=2

=

k0 X

N X

c2k +

c2k

k=2

k=k0 +1

k0 X

 kY 0 −1

c2k +

k=2

l=1

λ(λ + 1) 1− 2l(2l + 1)

 X N k=k0

 k−1  1 Y λ(λ + 1) . 1− 2k 2l(2l + 1) +1 l=k

(8.A.2)

0

Podemos escrever k−1 Y

l=k0

pois 1 −

λ(λ+1) 2l(2l+1)

  !  k−1 X λ(λ + 1) λ(λ + 1) ln 1 − = exp , 1− 2l(2l + 1) 2l(2l + 1) l=k 0

> 0 para todo l ≥ k0 .

Agora, se 0 ≤ x ≤ M para algum 0 < M < 1, ent˜ao vale ln(1 − x) ≥ x

ln(1 − M ) . M

(8.A.3)

Isso pode ser provado de diversas formas, por exemplo usando a concavidade da fun¸ca˜o logaritmo, que garante que   ln αa + (1 − α)b ≥ α ln(a) + (1 − α) ln(b) , para todo 0 ≤ α ≤ 1 e todo 0 < a < b. Tomando a = 1 − M , b = 1 e α = x/M , estabelece-se (8.A.3). Com isso, e como 0 < exp

k−1 X

l=k0

λ(λ+1) 2l(2l+1)



λ(λ+1) 2k0 (2k0 +1)



λ(λ + 1) ln 1 − 2l(2l + 1)

=: M , para todo l ≥ k0 , temos que

!

≥ exp

k−1 ln(1 − M ) X λ(λ + 1) M 2l(2l + 1) l=k 0

!

,

Agora, k−1 ∞ X X λ(λ + 1) λ(λ + 1) ≤ < ∞, 2l(2l + 1) 2l(2l + 1) l=k l=k 0

0

∞ X λ(λ + 1) , teremos que pois a s´erie acima ´e convergente. Assim, definindo K := 2l(2l + 1) l=k 0

exp

k−1 X

l=k0



λ(λ + 1) ln 1 − 2l(2l + 1)

!

j´a que, por (8.A.1), ln(1 − M ) < 0.

≥ exp

k−1 ln(1 − M ) X λ(λ + 1) M 2l(2l + 1) l=k

Dessa forma, retornando a (8.A.2), temos que

0

!

≥ exp



ln(1 − M ) K M



JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

k −1   k0 N 0 Y X X λ(λ + 1) 1− c2k = c2k − 2l(2l + 1) l=1 k=2 k=2

  k−1 X 1 λ(λ + 1) ln 1 − exp 2k 2l(2l + 1) +1 l=k

N X

k=k0

0

k −1     0 Y λ(λ + 1) ln(1 − M ) K ≥ 1− exp 2l(2l + 1) M l=1

Como o limite lim

N →∞

prova.

8.B

N X

k=k0

472/1304

N X

k=k0 +1

!

1 . 2k

N X 1 diverge, conclu´ımos que lim c2k tamb´em diverge, completando a N →∞ 2k +1 k=2

Provando (8.14)

Vamos considerar apenas o caso em que m ´e par, pois o caso em que m ´e ´ımpar pode ser tratado de forma totalmente an´aloga. Temos que ! m/2 k−1 2k Y X z (0) 2l(2l + 1) − m(m + 1) , Pm (z) = c0 ym (z) = c0 (2k)! l=0

k=0

Como dissemos, a conven¸ca˜o ´e escolher c0 de modo que o coeficiente do monˆomio de maior grau do polinˆomio acima seja 2m(2m)! . Assim, devemos ter (m!)2 m

−1 2 1 Y 2l(2l + 1) − m(m + 1) c0 m! l=0

ou seja,

Com isso

!

=

m

(2m)! 2m (m!)2

−1 2 (2m)! Y 2l(2l + 1) − m(m + 1) c0 = m 2 m! l=0 m

!−1

,

.

−1 m/2 2 X z 2k (2m)! Y 2l(2l + 1) − m(m + 1) Pm (z) = (2k)! 2m m! l=k k=0

Fa¸camos agora a mudan¸ca de vari´avel k → Pm (z) =

m/2 X k=0

Pm (z) =

k=0

− k. Ficamos com

z m−2k (2m)! (m − 2k)! 2m m!

Fa¸camos ainda a mudan¸ca de vari´avel l → m/2 X

m 2

m 2

!−1

m −1 2

Y

l= m −k 2

2l(2l + 1) − m(m + 1)

.

!−1

− l. Obtemos,

k (2m)! Y z (m − 2l)(m − 2l + 1) − m(m + 1) (m − 2k)! 2m m! l=1 m−2k

.

!−1

.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

473/1304

Entretanto, (m − 2l)(m − 2l + 1) − m(m + 1) = −2l(2m − 2l + 1) ,

como facilmente se vˆe. Agora, com isso, k Y l=1

(m − 2l)(m − 2l + 1) − m(m + 1)

!−1

k Y

=

l=1

−2l(2m − 2l + 1)

(−1)k

=

(−1)k (2k)!!

=

k Y 1 2l l=1 m Y

l→l+k

Assim,

Vale, por´em,

m/2 X (−1)k z m−2k Pm (z) = 2m (m − 2k)! k=0

(2m)! (2(m − k) − 1)!! = m! (2k)!! (2m − 1)!!

l=1

1 2m − 2l + 1

!

(2m − 2l + 1)

(2m − 2l + 1)

m Y (−1)k (2m − 2l + 1) (2k)!! (2m − 1)!! l=k+1

=

=

k Y

l=k+1 m Y l=1

=

!

!−1

m−k Y (−1)k (2(m − k) − 2l + 1) (2k)!! (2m − 1)!! l=1

(−1)k (2(m − k) − 1)!! . (2k)!! (2m − 1)!! (2m)! (2(m − k) − 1)!! m! (2k)!! (2m − 1)!!

(2m)! (2(m − k) − 1)!! m! (2k)!! (2m − 1)!!

!

!

.

(2(m − k))!! (2(m − k))!!

=

(2m)! (2(m − k))! m! (2m − 1)!! (2k)!! (2(m − k))!!

=

(2m)!! (2m − 2k)! m! (2k)!! (2(m − k))!!

=

2m m! (2m − 2k)! m! 2k k! 2m−k (m − k)!

=

(2m − 2k)! , k! (m − k)!

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

onde, na pen´ ultima passagem, usamos que (2p)!! = 2p p! para todo p ∈ 

474/1304

. Com isso,

m/2 X (−1)k z m−2k (2m − 2k)! , Pm (z) = 2m (m − 2k)! k! (m − k)! k=0

que ´e a express˜ao (8.14) para m par. O caso em que m ´e ´ımpar ´e an´alogo e ´e deixado como exerc´ıcio.

8.C

Justificando os Polinˆ omios de Hermite

Tomaremos aqui z = x ∈ 

e consideraremos apenas a s´erie ∞ k−1 X λ 2 x2k Y := 1 − x − λ (4l − λ) , 2 (2k)! k=2 l=1

(0) yλ (x)

com λ ∈ mas λ 6= 2m para m um inteiro positivo par (o que faz da s´erie acima uma s´erie infinita), (1) pois o tratamento da s´erie yλ ´e idˆentico.   Seja s > 1, arbitr´ario mas fixo, e escolhamos k0 > 2 tal que 1 − 4kλ0 > 1s . Note que se λ ≤ 0, isso ´e v´alido para todo k0 > 2 enquanto que, se λ > 0, devemos tomar   λs , 2 . (8.C.4) k0 > max 4(s − 1) 

Escrevemos (0) yλ (x)

k−1 ∞ k−1 k0 X X λ 2 x2k Y x2k Y := 1 − x − λ (4l − λ) − λ (4l − λ) . 2 (2k)! l=1 (2k)! l=1 k=k +1 k=2 0

´ f´acil verificar que E ∞ X

k=k0

k−1

x2k Y (4l − λ) = (2k)! l=1 +1 =

Vamos agora nos concentrar na s´erie que para l ≥ k0 , vale

∞ X

4

 k−1  − 1)! Y λ 1− (2k)! l=1 4l

k−1 2k (k

x

k=k0 +1

 k0 −1  λ 1 Y 1− 4 l=1 4l ∞ X

λ 1− 4l

∞ X

4 x 

4 x

k=k0 +1

0

 k−1  − 1)! Y λ 1− . Pela escolha de k0 , sabemos (2k)! l=k 4l 0





 k−1  − 1)! Y λ 1− . (2k)! l=k 4l

k 2k (k

k 2k (k

k=k0 +1



!

λ 1− 4k0



>

1 s

JCABarata. Curso de F´ısica-Matem´ atica

e, portanto, k−1 Y

l=k0

Al´em disso,



Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

λ 1− 4l



>

1

475/1304

.

sk−k0

(2k)! = (2k)!! (2k − 1)!! = 2k k! (2k − 1)!! < 22k (k!)2 , pois (2k−1)!! = (2k−1)(2k−3)(2k−5) · · · 1 = 2

k



1 k− 2



3 k− 2



 5 1 k− · · · < 2k k(k−1)(k−2) · · · 1 . 2 2

Logo, ∞ X

k=k0 +1

  2 k k−1  ∞ X 1 x λ − 1)! Y k0 > s 1− (2k)! l=k 4l k(k!) s k=k +1

k 2k (k

4 x

0

0

> s

k0

∞ X

k=k0

1 (k + 1)! +1



x2 s

k

 2 k+1 ∞ 1 x s X = s 2 x k=k +1 (k + 1)! s k0

0

sk0 +1 = x2

e

x2 /s



k=k 0 +1 X k=0

1 k!



x2 s

k !

.

2 Kex /s − p(x) (0) Tudo isso mostra que yλ (x) ´e maior que , onde K ´e uma constante (que depende x2 de λ, s e k0 ) e p(x) ´e um polinˆomio de grau 2k0 + 2 em x. Como s ´e arbitr´ario, vemos que o produto 2 (0) yλ e−x /2 diverge para |x| → ∞, j´a que podemos escolher 1/s > 1/2, tomando31 1 < s < 2.

No contexto do problema do oscilador harmˆonico na Mecˆanica Quˆantica (vide Se¸ca˜o 10.4, p´agina 2 (0) 567) esse comportamento ´e inaceit´avel, pois o produto yλ e−x /2 representa uma fun¸ca˜o de onda, que deve ser de quadrado integr´avel em . Isso for¸ca-nos a tomar λ = 2m com m um inteiro positivo e (0) par, de modo a reduzir yλ (x) a um polinˆomio. 

(1)

Para yλ (x) as considera¸co˜es s˜ao an´alogas e n˜ao iremos repeti-las aqui. 31

(0)

Por (8.C.4), tomar s pr´ oximo de 1 aumenta o grau do polinˆ omio p(x), mas n˜ ao altera o fato que y λ (x)e−x para |x| → ∞

2

/2

diverge

JCABarata. Curso de F´ısica-Matem´ atica

8.D

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

476/1304

Provando (8.20)

Consideraremos apenas o caso em que m ´e par, pois o caso em que m ´e ´ımpar ´e tratado analogamente. Para m par, tem-se   m 2 2k k−1 X Y z Hm (z) = (−2)m/2 (m − 1)!! 1 − m z 2 − 2m (4l − 2m) . (2k)! k=2

Fazendo a mudan¸ca de vari´aveis k →

m 2

− k, teremos 

Hm (z) = (−2)m/2 (m − 1)!! 1 − m z 2 − 2m

m −2 2

X k=0

l=1

m−2k

z (m − 2k)!

m −k−1 2

Y l=1



(4l − 2m) .

Tem-se que m −k−1 2

Y l=1

(4l − 2m)

=

(−2)

m −k−1 2

m −k−1 2

Y

(m − 2l)

l=1

m −1 2

=

(−2)

Y

m −k−1 2

(m − 2l)

l=1

m −1 2

Y

−k l0 = m 2

(m − 2l0 )

m −1 2

−l0 l0 → m 2

=

(−2)

m −k−1 2

Y l=1

(m − 2l)

k Y

m

= (−2) 2 −k−1

2l0

(m − 2)!! . (2k)!!

l0 =1

Logo, 

Hm (z) = (−2)m/2 (m − 1)!! 1 − m z 2 − 2m m 2

= (−2) (m − 1)!! 1 − m z

 2

m −2 2

+

X k=0

m −2 2

X k=0

m−2k



m (m − 2)!!  z (−2) 2 −k−1 (m − 2k)! (2k)!!

(−1)k m! (2z)m−2k (m − 2k)! k!

m

2 X (−1)k m! (2z)m−2k , = (m − 2k)! k! k=0

(8.D.5)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

477/1304

j´a que m (m−1)!! (m−2)!! = m!,

que

(2k)!! = 2k k!

(2p)! (2p)!! (2p − 1)!! = = 2p (2p−1)!! . p! p!

e que

A express˜ao (8.D.5) coincide com (8.20) para m par. O caso em que m ´e ´ımpar ´e an´alogo e ´e deixado como exerc´ıcio.

8.E

Porque λ deve ser um Inteiro Positivo na Equa¸ c˜ ao de Laguerre

Justificaremos aqui por que consideramos λ um inteiro positivo na equa¸ca˜o de Laguerre. Temos dois casos a tratar: a. λ < 0 e b. λ > 0 mas λ n˜ao-inteiro. Em aplica¸co˜es, especialmente na Mecˆanica Quˆantica, a vari´avel z ´e um n´ umero real positivo (uma coordenada radial). Vamos ent˜ao doravante tomar z real e positivo e escrever z = r > 0. Se λ n˜ao for um inteiro positivo a s´erie (8.132) acima ´e uma s´erie infinita. Podemos escrever (−1)

n

n−1 Y l=0

(λ − l) = −λ

n−1 Y l=1

(l − λ) = −λ(n − 1)!

Se λ < 0, a u ´ ltima express˜ao fica |λ|(n − 1)! e y1 (r) = 1 + |λ| Agora,

1 n

1 n+1

>



e 1+

|λ| l



∞ X n=1

n−1 Y l=1

1 n(n!)

|λ| 1+ l

"n−1  Y l=1

n−1 Y l=1

λ 1− l



.

(8.E.6)



|λ| 1+ l

#

rn .

> 1. Assim,

y1 (r) > 1 + |λ|

∞ X n=1

1 |λ| r rn = 1 + (e − 1 − r) . (n + 1)! r

Disso conclu´ımos que y1 (r) cresce da ordem de er quando r → ∞. O problema com isso ´e que em v´arias aplica¸co˜es tal comportamento ´e indesejado. No problema do a´tomo de hidrogˆenio da Mecˆanica Quˆantica, por exemplo, o produto e−r/2 y1 (r) representa a fun¸ca˜o de onda radial de um el´etron de momento angular nulo sob um potencial coulombiano32 . Pelo visto acima, se λ < 0 a fun¸ca˜o de onda cresceria para r → ∞ pelo menos como e+r/2 , n˜ao podendo, assim, ser uma fun¸ca˜o de quadrado integr´avel em 3 , uma condi¸ca˜o fundamental ligada a` interpreta¸ca˜o probabil´ıstica da Mecˆanica Quˆantica. Assim, solu¸co˜es com λ < 0 devem ser descartadas nesse contexto. 

32

Vide Se¸ca ˜o 10.5, p´ agina 568, ou qualquer bom livro de Mecˆ anica Quˆ antica.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

478/1304

Tratemos agora do caso em que λ ´e positivo, mas n˜ao ´e um n´ umero inteiro. Por (8.E.6), podemos escrever, para n − 1 ≥ 2dλe, (−1)

n

n−1 Y l=0

(λ − l) = −λ(n − 1)!

2dλe−1 

Y l=1

λ 1− l

 n−1 Y  l=2dλe

onde dλe ´e o menor inteiro maior ou igual a λ. Assim, y1 (r) = 1 +

2dλe X (−1)n n=1

(n!)2

"n−1 Y l=0

(λ − l)

#

com L := −λ

∞ X

rn + L

n=2dλe+1 2dλe−1 

Y l=1

λ 1− l





1  n (n!)

λ 1− l

n−1 Y

l=2dλe





1−

,





λ  n r , l

.

A raz˜ao de escrevermos essa express˜ao dessa forma reside no fato que, agora,

n−1 Y

l=2dλe

produto de termos positivos, sendo que, para l ≥ 2dλe tem-se 1−



λ 1− l



´e um

λ ≥ α l

onde

λ 2dλe − λ dλe + (dλe − λ) dλe 1 = = > = . 2dλe 2dλe 2dλe 2dλe 2 Com isso, para a u ´ ltima soma do lado direito vale     n−1 ∞ ∞ X Y X λ  n 1  1 1− (α)n−2dλe r n r ≥ n (n!) l n (n!) α := 1 −

n=2dλe+1

l=2dλe

n=2dλe+1

= K

∞ X

n=2dλe+1

> K

∞ X

n=2dλe+1

1 (αr)n n (n!) 1 (αr)n (n + 1)!

  K αr = e − P (αr) αr 2dλe+1

onde K := α

−2dλe

, P (αr) :=

X 1 (αr)n ´e um polinˆomio de grau 2dλe + 1 e α > 1/2. n! n=0

Disso conclu´ımos que para r → ∞, |y1 (r)| cresce mais r´apido que eαr com α > 1/2. Assim, um produto como e−r/2 y1 (r), que como dissemos representa a fun¸ca˜o de onda radial de um el´etron de

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

479/1304

momento angular nulo sob um potencial coulombiano, n˜ao ´e de quadrado integr´avel no espa¸co 3 , uma condi¸ca˜o fundamental ligada a` interpreta¸ca˜o probabil´ıstica da Mecˆanica Quˆantica. Assim, solu¸co˜es com λ > 0, mas λ n˜ao-inteiro, devem tamb´em ser descartadas nesse contexto. 

JCABarata. Curso de F´ısica-Matem´ atica

8.6

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

480/1304

Exerc´ıcios Adicionais

E. 8.25 Exerc´ıcio. Considere as equa¸co˜es diferenciais u0 (x) − au(x) = 0 e u00 (x) + ω02 u(x) = 0, com a ∈ , ω0 ∈ , constantes e x ∈ . Usando o m´etodo de expans˜ao em s´erie mostre que suas solu¸co˜es gerais s˜ao, respectivamente, u(x) = Aeax e u(x) = A cos(ω0 x) + B sen (ω0 x), onde A e B s˜ao constantes. 6 E. 8.26 Exerc´ıcio. Seja a bem conhecida expans˜ao binomial (1 + x)

α

=

∞ X k=0

v´alida para x ∈

Γ(α + 1) xk , Γ(α − k + 1)Γ(k + 1)

com |x| < 1 e para todo α ∈ . Demonstre-a resolvendo a equa¸c˜ao diferencial (1 + x)y 0 − αy = 0

com a condi¸c˜ao y(0) = 1. Sugest˜ ao. Verifique que (1+x) α ´e solu¸c˜ao da equa¸c˜ao diferencial acima e satisfaz y(0) = 1. Depois resolva a mesma equa¸c˜ao, procurando solu¸co˜es na forma de uma s´erie de potˆencias na regi˜ao |x| < 1. Mostre que quando α ´e um inteiro positivo a solu¸c˜ao reduz-se a um polinˆomio.

6

E. 8.27 Exerc´ıcio. Usando o m´etodo de expans˜ao em s´erie de potˆencias mostre que a solu¸c˜ao da equa¸c˜ao diferencial y 0 (z) + zy(z) = 0 ´e y(z) = c exp(−z 2 /2), onde c ´e uma constante. 6 E. 8.28 Exerc´ıcio. equa¸c˜ao diferencial

Encontre, utilizando o m´etodo de expans˜ao em s´erie, a solu¸c˜ao geral da seguinte 2

u00 (x) − e−x u0 (x) + sin(x)u(x) = 0 . Em que regi˜ao a s´erie de potˆencias obtida para u(x) deve ser convergente? Justifique.

6

E. 8.29 Exerc´ıcio. Mostre que a fun¸c˜ao u(x) = ( arcsen x)2 ´e a solu¸c˜ao da equa¸c˜ao diferencial (1 − x2 )u00 (x) − xu0 (x) = 2 , com as condi¸co˜es iniciais u(0) = u0 (0) = 0. Usando o m´etodo de expans˜ao em s´erie para resolver a equa¸c˜ao, ∞ X 2 obtenha a expans˜ao de ( arcsen x) em uma s´erie de potˆencias ck xk . Essa s´erie coincide com a s´erie de k=0

Taylor de ( arcsen x)2 em x = 0. Esse m´etodo de determinar a expans˜ao em s´erie de Taylor dessa fun¸c˜ao ´e muito mais simples que o m´etodo direto, envolvendo o cˆomputo das derivadas da fun¸c˜ao ( arcsen x) 2 em x = 0, e foi descoberto por Euler. A s´erie obtida j´a era conhecida do matem´atico Kowa Seki (1642-1708), contemporˆaneo de Newton). 6

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 8

Vers˜ ao de 29 de setembro de 2005.

481/1304

E. 8.30 Exerc´ıcio. a) Pelo m´etodo de Frobenius determine a solu¸c˜ao geral da seguinte equa¸c˜ao diferencial: x2 u00 (x) − (1 + x)u(x) = 0 , b) Qual o raio de convergˆencia das s´eries encontradas? Justifique. c) Determine a solu¸c˜ao da mesma equa¸c˜ao que satisfaz a condi¸c˜ao u(0) = 0. H´a solu¸co˜es para a condi¸c˜ao inicial u(0) = 1? Justifique. 6 E. 8.31 Exerc´ıcio. Prove as identidades 2k k! = (2k)!! , k∈ 

(2k)!!(2k − 1)!! = (2k)! ,

(2k + 1)!!(2k)!! = (2k + 1)! ,

.

6

E. 8.32 Exerc´ıcio. Prove as identidades Γ(3/2) (2n + 1)!! Γ(n + 1 + 1/2) = = 2n



π (2n + 1)!! , 2 2n

Γ(n + 1 + 1/3) = 3−(n+1) (3n + 1)!!! Γ(1/3) , Γ(n + 2/3) = 3−n (3n − 1)!!! Γ(2/3) ,

n∈

n∈ 



n∈ 

, n≥0,

, n≥0,

, n≥1.

Sugest˜ao: use a bem-conhecida propriedade da fun¸c˜ao gama: Γ(z + 1) = zΓ(z). E. 8.33 Exerc´ıcio. Usando (8.167) e o fato que Γ(z) = Γ(z), prove que para todo y ∈ |Γ(iy)|2 =



6 vale

π y senh (πy)

e usando (8.191), prove que para todo y ∈ vale   2 π Γ 1 + iy = . 2 cosh(πy) 

E. 8.34 Exerc´ıcio. A fun¸c˜ao zeta de Riemann ´e definida por ∞ X 1 ζ(s) := ns n=1

para Re (s) > 1. Mostre que, para n = 1, 2, 3, . . ., Z s Γ(s) = n

∞ 0

e−nx xs−1 dx

6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 8

482/1304

e, usando esta u ´ltima rela¸c˜ao, mostre que ζ(s) Γ(s) =

Z

∞ 0

xs−1 dx, ex − 1

Re (s) > 1. 6

Cap´ıtulo 9 Propriedades de Algumas Fun¸co ˜es Especiais Conte´ udo 9.1

9.2

Discuss˜ ao Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483 9.1.1

Defini¸co˜es e Considera¸co˜es Preliminares . . . . . . . . . . . . . . . . . . . . . 484

9.1.2

Rela¸co˜es de Ortogonalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486

9.1.3

F´ormulas de Rodrigues

9.1.4

Fun¸co˜es Geratrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 491

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488

Propriedades de Algumas Fun¸ co ˜es Especiais . . . . . . . . . . . . . . . . . 495 9.2.1

Propriedades dos Polinˆomios de Legendre . . . . . . . . . . . . . . . . . . . . 495

9.2.2

Propriedades dos Polinˆomios de Legendre Associados. Harmˆonicos Esf´ericos . 501

9.2.3

Propriedades dos Polinˆomios de Hermite . . . . . . . . . . . . . . . . . . . . . 511

9.2.4

Propriedades dos Polinˆomios de Laguerre . . . . . . . . . . . . . . . . . . . . 515

9.2.5

Propriedades dos Polinˆomios de Laguerre Associados . . . . . . . . . . . . . . 519

9.2.6

Propriedades das Fun¸co˜es de Bessel

9.2.7

Propriedades das Fun¸co˜es de Bessel Esf´ericas . . . . . . . . . . . . . . . . . . 537

. . . . . . . . . . . . . . . . . . . . . . . 522

9.A Provando (9.44) a ` For¸ ca Bruta . . . . . . . . . . . . . . . . . . . . . . . . . 541 9.2

Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543

ste cap´ıtulo d´a continuidade ao Cap´ıtulo 8 e concentra-se no estudo de propriedades especiais de algumas das fun¸co˜es l´a apresentadas como solu¸co˜es de equa¸co˜es diferenciais de interesse. Nossos principais objetivos s˜ao a dedu¸ca˜o das rela¸co˜es de ortogonalidade de certas fun¸co˜es, a dedu¸ca˜o das chamadas f´ormulas de Rodrigues e de rela¸co˜es de recorrˆencia para as mesmas e tamb´em a determina¸ca˜o de suas fun¸co˜es geratrizes. Essas propriedades, que ser˜ao devidamente definidas e discutidas na Se¸ca˜o 9.1, s˜ao u ´ teis para a resolu¸ca˜o de equa¸co˜es diferenciais, especialmente aquelas provenientes de problemas envolvendo equa¸co˜es diferenciais parciais submetidas a certas condi¸co˜es iniciais e/ou de contorno. Exemplos de aplica¸co˜es a problemas f´ısicos s˜ao discutidos no Cap´ıtulo 10, p´agina 544. Ainda que nosso tratamento seja t˜ao completo quanto poss´ıvel, dentro do escopo relativamente limitado que pretendemos, repetimos aqui a recomenda¸ca˜o das referˆencias listadas no Cap´ıtulo 8 a` p´agina 395.

9.1

Discuss˜ ao Preliminar

Na pr´oxima se¸ca˜o, a Se¸ca˜o 9.2, tencionamos apresentar ao leitor certas propriedades de algumas das fun¸co˜es encontradas como solu¸ca˜o de equa¸co˜es diferenciais de interesse em F´ısica, propriedades essas

483

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

484/1304

cuja utilidade maior manifesta-se especialmente, como mencionado, na resolu¸ca˜o de equa¸co˜es diferenciais parciais submetidas a certas condi¸co˜es iniciais e/ou de contorno. Na presente se¸ca˜o prepararemos o terreno discutindo algumas id´eias gerais. As id´eias gerais que apresentaremos envolvem 1. as chamadas rela¸co ˜es de ortogonalidade, que generalizam aquelas bem-conhecidas da teoria das s´eries de Fourier; 2. as chamadas f´ ormulas de Rodrigues, u ´ teis para a obten¸ca˜o de rela¸co˜es de recorrˆencia entre fun¸co˜es e 3. as chamadas fun¸co ˜es geratrizes, das quais outras propriedades u ´ teis s˜ao extra´ıdas, como por exemplo representa¸co˜es integrais para certas fun¸co˜es. Os exemplos principais dos quais trataremos a seguir, na Se¸ca˜o 9.2, envolvem os polinˆomios de Legendre, de Hermite e de Laguerre e as fun¸co˜es de Bessel, todas de importˆancia na resolu¸ca˜o de problemas do Eletromagnetismo, de Mecˆanica Quˆantica, da Mecˆanica dos Fluidos e de outras a´reas.

9.1.1

Defini¸ co ˜es e Considera¸ co ˜es Preliminares

No Cap´ıtulo 8 tratamos nossas equa¸co˜es diferenciais como equa¸co˜es no plano complexo. Para a discuss˜ao das chamadas rela¸co˜es de ortogonalidade devemos considerar apenas equa¸co˜es diferenciais de uma vari´avel real. De qualquer forma, na absoluta maioria das equa¸co˜es diferenciais de interesse em F´ısica a fun¸ca˜o inc´ognita y ´e uma fun¸ca˜o de uma vari´avel real, digamos, x, e assim consideraremos aqui. Em muitas das equa¸co˜es diferenciais de interesse em F´ısica a vari´avel x ´e restrita a uma regi˜ao J ⊂ da reta real, sendo J um intervalo fechado (tal como [a, b]), aberto (tal como (a, b)) ou semi-aberto (tal como (a, b] ou [a, b)). Podem tamb´em ocorrer intervalos infinitos, tais como J = (−∞, ∞), ou semi-infinitos, como J = (0, ∞) ou J = [0, ∞). Denotaremos por J 0 o interior do intervalo J, ou seja, J 0 ´e o maior intervalo aberto contido em J. Por exemplo, se J = [a, b] teremos J 0 = (a, b), se J = [0, ∞) ent˜ao J 0 = (0, ∞) e se J ´e aberto ent˜ao J 0 = J. 

At´e aqui escrevemos nossas equa¸co˜es lineares homogˆeneas de segunda ordem na forma y 00 (x) + a(x)y 0 (x) + b(x)y(x) = 0

(agora j´a adotando como vari´avel x ∈ J). Em muitos problemas de interesse essa equa¸ca˜o pode ser escrita de outra forma, denominada por alguns autores de forma canˆ onica de Liouville, e que ser´a importante para o que segue: (p(x)y 0 (x))0 + q(x)y(x) + µ r(x)y(x) = 0,

(9.1)

onde, 1. p(x) ´e real, cont´ınua e diferenci´avel em J 0 e p(x) > 0 para todo x ∈ J 0 . 2. q ´e real e cont´ınua em J. 3. r(x) ´e real e cont´ınua em J 0 e r(x) > 0 para todo x ∈ J 0 . 4. µ ´e uma constante.

(9.2)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

485/1304

As condi¸co˜es de positividade de p e r em J 0 s˜ao as mais importantes. Note-se que n˜ao excluiremos que p e r possam se anular (ou mesmo divergir) nos extremos do intervalo J 1 . Como o leitor pode facilmente constatar, a rela¸ca˜o entre essas fun¸co˜es ´e a seguinte: a(x) =

p0 (x) , p(x)

b(x) =

1 (q(x) + µr(x)) . p(x)

Dadas a(x) e b(x), a primeira rela¸ca˜o acima fixa p(x) (a menos de uma constante), a saber, Z x  0 0 p(x) = exp a(x )dx + const. . 0

J´a a segunda nem sempre fixa q(x) e r(x) univocamente, tudo dependendo da condi¸ca˜o de positividade sobre r(x), que foi mencionada acima, ou de qual parˆametro se deseja tomar por µ. Na maioria dos casos, por´em, q e r podem ser fixados univocamente, o que ficar´a claro nos exemplos que seguem. V´arias das equa¸co˜es diferenciais de segunda ordem das quais tratamos no Cap´ıtulo 8 podem ser escritas na forma canˆonica em algum intervalo J conveniente2 . Vamos a alguns exemplos que nos interessar˜ao: A equa¸ c˜ ao do oscilador harmˆ onico simples: y 00 (x) + λy(x) = 0. Aqui p(x) = 1, q(x) = 0, r(x) = 1 e µ = λ. V´arios tipos de intervalos J aparecem em problemas. No problema da corda vibrante, por exemplo, pode-se adotar J = [0, L], L sendo o comprimento da corda. A equa¸ c˜ ao de Legendre (1 − x2 )y 00 (x) − 2xy 0 (x) + λ(λ + 1)y(x) = 0 ´e tipicamente considerada no intervalo J = [−1, 1] e pode ser escrita como  0 1 − x2 y 0 (x) + λ(λ + 1)y(x) = 0. Aqui p(x) = (1 − x2 ), q(x) = 0, r(x) = 1 e µ = λ(λ + 1).

Note que p(x) > 0 em J 0 = (−1, 1), mas anula-se nos extremos x = ±1. J´a a fun¸ca˜o r(x) ´e positiva em todo J = [−1, 1].

A equa¸ c˜ ao de Hermite y 00 (x) − 2xy 0 (x) + λy(x) = 0, ´e tipicamente considerada no intervalo J = (−∞, ∞) e pode ser escrita como  2 0 2 e−x y 0 (x) + λe−x y(x) = 0. 2

2

Aqui p(x) = e−x , q(x) = 0, r(x) = e−x e µ = λ.

Note que p(x) > 0 e r(x) > 0 em todo J = (−∞, ∞).

1

A equa¸ c˜ ao de Chebyshev (1 − x2 )y 00 (x) − x y 0 (x) + λ2 y(x) = 0 ´e tipicamente considerada no intervalo J = [−1, 1] e pode ser escrita como √ 0 1 0 2 1 − x y (x) + λ2 √ y(x) = 0. 1 − x2

O caso em que p e r permanecem finitas e positivas nos extremos do intervalo J ´e particularmente importante no chamado Problema de Sturm-Liouville regular, tratado no Cap´ıtulo 12. 2 A conveniˆencia ´e ditada pelo problema f´ısico subjacente.

JCABarata. Curso de F´ısica-Matem´ atica

Aqui p(x) =



Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

486/1304

√ 1 − x2 , q(x) = 0, r(x) = 1/ 1 − x2 e µ = λ2 .

Note que p(x) > 0 em J 0 = (−1, 1), mas anula-se nos extremos x = ±1. J´a a fun¸ca˜o r(x) ´e positiva em todo J = (−1, 1), mas diverge nos extremos x = ±1. A equa¸ c˜ ao de Laguerre xy 00 (x)+(1−x)y 0 (x)+λy(x) = 0 ´e tipicamente considerada no intervalo J = [0, ∞) e pode ser escrita como 0 xe−x y 0 (x) + λe−x y(x) = 0. Aqui p(x) = xe−x , q(x) = 0, r(x) = e−x e µ = λ.

Note que p(x) > 0 em J 0 = (0, ∞), mas anula-se no extremo x = 0. J´a a fun¸ca˜o r(x) ´e positiva em todo J = [0, ∞). A equa¸ca˜o de Bessel e a equa¸ca˜o de Bessel esf´erica tamb´em podem ser escritas desta forma canˆonica. Por´em, o tratamento das rela¸co˜es de ortogonalidade que se segue exige para elas algumas adapta¸co˜es e postergaremos sua discuss˜ao paras as Se¸co˜es 9.2.6 e 9.2.7, adiante. Daqui para frente vamos escrever o intervalo J, finito ou n˜ao, na forma J := (A, B) ⊂



.

Para uma fun¸ca˜o u definida em J que seja pelo menos duas vezes diferenci´avel, vamos definir o operador diferencial L por (Lu)(x) := (p(x)u0 )0 + q(x)u . (9.3) A equa¸ca˜o (9.1) fica simplificada na forma (Ly)(x) + λ r(x)y(x) = 0 .

(9.4)

Se λ for um n´ umero tal que a equa¸ca˜o (9.4) for satisfeita para alguma fun¸ca˜o u λ (que em geral depender´a de λ), ent˜ao diz-se que λ ´e um autovalor e uλ ´e dito ser a auto-fun¸ca ˜o associada ao autovalor λ. Essa nomenclatura surge por analogia com os conceitos de autovalor e auto-vetor de matrizes na a´lgebra linear3 .

9.1.2

Rela¸ co ˜es de Ortogonalidade

O teorema que agora apresentamos expressa uma da mais importantes propriedades das solu¸co˜es das equa¸co˜es diferenciais discutidas acima: as chamadas rela¸co˜es de ortogonalidade. Teorema 9.1 Considere-se a equa¸ca ˜o diferencial Lu(x) + µr(x)u(x) = 0 definida no intervalo (n˜ ao necessariamente finito) J = (A, B), com p, q e r satisfazendo as condi¸co ˜es enumeradas em (9.2). Sejam λ1 e λ2 ∈ com λ1 6= λ2 e suponhamos que uλ1 e uλ2 sejam fun¸co ˜es n˜ ao-nulas que satisfazem 

Luλ1 (x) + λ1 r(x)uλ1 (x) = 0

e

em J = (A, B) e suponhamos ainda que os limites4   lim p(b) uλ1 (b)u0λ2 (b) − u0λ1 (b)uλ2 (b) e b→B−

3

4

Luλ2 (x) + λ2 r(x)uλ2 (x) = 0 ,   lim p(a) uλ1 (a)u0λ2 (a) − u0λ1 (a)uλ2 (a)

a→A+

1 Estritamente falando λ e uλ s˜ ao auto-valores, respectivamente, auto-fun¸co ˜es, do operador M = − r(x) L. Os limites lim e lim significam os limites a ` esquerda e a ` direita, respectivamente. x→Y−

x→Y+

(9.5)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

existam e satisfa¸cam     0 0 0 0 lim p(b) uλ1 (b)uλ2 (b) − uλ1 (b)uλ2 (b) = lim p(a) uλ1 (a)uλ2 (a) − uλ1 (a)uλ2 (a) . a→A+

b→B−

Ent˜ ao,

Z

487/1304

(9.6)

B

uλ1 (x) uλ2 (x) r(x) dx = 0 .

(9.7)

A

2

Prova. Seja (a, b), com A < a < b < B, qualquer intervalo finito contido em J 0 . Consideremos a express˜ao Z b (λ1 − λ2 ) uλ1 (x) uλ2 (x) r(x) dx . a

Como λ1 e λ2 s˜ao reais, isso pode ser escrito por (9.5) como Z

b a

(λ1 r(x)uλ1 (x)) uλ2 (x) dx −

Z

b

uλ1 (x) (λ2 r(x)uλ2 (x)) dx a

=

Z

b a

uλ1 (x) (Luλ2 )(x) dx −

Z

b

(Luλ1 )(x) uλ2 (x) dx . a

Agora, para quaisquer u e v duas vezes diferenci´aveis definidas em (a, b) vale, usando-se integra¸ca˜o por partes, Z b Z b Z b 0 0 v(x) (Lu)(x) dx = v(x)(p(x)u ) dx + v(x)q(x)u(x) dx a

a

= − =

= ou seja,

Z

b a

Assim, concluimos que (λ1 − λ2 )

Z

b a

Z

Z

a

Z

b

v 0 (x)(p(x)u0 ) a

b

u(pv 0 )0 a b a

b Z dx + vpu + 0

a

b

v(x)q(x)u(x) dx a

b b Z 0 dx + vpu − v pu + 0

a

a

b

v(x)q(x)u(x) dx a

b b (Lv)(x) u(x) dx + vpu0 − v 0 pu ,

v(x) (Lu)(x) dx −

a

Z

b

a

(9.8)

a

b b (Lv)(x) u(x) dx = vpu0 − v 0 pu . a

b b uλ1 (x) uλ2 (x) r(x) dx = uλ1 pu0λ2 − u0λ1 puλ2 a

a

(9.9)

a

    = p(b) uλ1 (b)u0λ2 (b) − u0λ1 (b)uλ2 (b) − p(a) uλ1 (a)u0λ2 (a) − u0λ1 (a)uλ2 (a) .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

488/1304

Conseq¨ uentemente, tem-se pelas hip´oteses,

(λ1 − λ2 )

Z

B

uλ1 (x) uλ2 (x) r(x) dx A

    = lim p(b) uλ1 (b)u0λ2 (b) − u0λ1 (b)uλ2 (b) − lim p(a) uλ1 (a)u0λ2 (a) − u0λ1 (a)uλ2 (a) = 0 . a→A+

b→B−

Como λ1 6= λ2 , isso implica

Z

B

uλ1 (x) uλ2 (x) r(x) dx = 0, como quer´ıamos provar. A

A rela¸ca˜o (9.7) diz-nos que uλ1 e uλ2 s˜ao ortogonais em rela¸ca˜o ao produto escalar hf, gir :=

Z

B

f (x)g(x) r(x) dx ,

(9.10)

A

RB definido no conjunto de todas as fun¸co˜es f : J → tais que A |f (x)|2 r(x) dx < ∞. Essas rela¸co˜es de ortogonalidade s˜ao de suma importˆancia em aplica¸co˜es, especialmente na resolu¸ca˜o de equa¸co˜es diferenciais parciais sob certas condi¸co˜es de contorno. O leitor interessado em exemplos pode passar diretamente a` Se¸ca˜o 9.2, p´agina 495. Aplica¸co˜es a` solu¸ca˜o de equa¸co˜es diferenciais parciais de interesse em F´ısica ser˜ao vistas no Cap´ıtulo 10, p´agina 544. H´a v´arias condi¸co˜es sob as quais (9.6) ´e satisfeita. Por exemplo, ela ser´a satisfeita se p(A) = p(B) = 0 e se uλ1 , uλ2 e suas derivadas n˜ao divergirem em A e B. Outra condi¸ca˜o sob a qual (9.6) ´e satisfeita se d´a, no caso em que (A, B) ´e um intervalo finito, sob a hip´otese que p(A) e p(B) sejam finitos e que uλ1 e uλ2 satisfa¸cam condi¸co˜es de contorno em A e B do tipo α1 y(A) + α2 y 0 (A) = 0 ,

(9.11)

β1 y(B) + β2 y 0 (B) = 0 ,

(9.12)

onde α1 , α2 , β1 , β2 s˜ao constantes fixadas, sendo (α1 , α2 ) 6= (0, 0) e (β1 , β2 ) 6= (0, 0). Esse u ´ ltimo tipo de situa¸ca˜o ´e discutido com detalhe no Cap´ıtulo 12, p´agina 606, especialmente no Lema 12.1 da p´agina 620.

9.1.3

F´ ormulas de Rodrigues

As id´eias desta pequena se¸ca˜o ser˜ao melhor ilustradas nos exemplos da Se¸ca˜o 9.2. Consideremos a equa¸ca˜o diferencial (p(x)y 0 (x))0 + q(x)y(x) + µ r(x)y(x) = 0, ou seja, Ly + µry = 0, com p, q e r satisfazendo as condi¸co˜es enumeradas em (9.2) e suponhamos tamb´em que r seja uma fun¸ca˜o infinitamente diferenci´avel de x. Consideremos que o intervalo J onde a equa¸ca˜o ´e considerada seja J = [−1, 1]. Para n = 0, 1, 2, . . ., sejam definidas as fun¸co˜es ! 1 dn 2 n r(x)(1 − x ) . (9.13) pn (x) := r(x) dxn

JCABarata. Curso de F´ısica-Matem´ atica

´ f´acil ver que se m < n, ent˜ao E

Z

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

489/1304

1

xm pn (x) r(x) dx = 0 ,

(9.14)

−1

ou seja, cada pn ´e ortogonal, segundo o produto escalar h·, ·ir definido em (9.10), a todos os polinˆomios de grau menor que n. Para provar (9.14), basta escrever ! Z 1 Z 1 n m d m 2 n x x pn (x) r(x) dx = dx r(x)(1 − x ) dxn −1 −1   dk 2 n , com k < n, e fazer n vezes integra¸ca˜o por partes, lembrando que a express˜ao dx r(x)(1 − x ) k

sempre contem um fator (1 − x2 ) que se anula em ±1. E. 9.1 Exerc´ıcio importante. Fa¸ca isso!

6

Se as fun¸co˜es pn forem elas mesmas polinˆomios de grau n, o que ocorre em v´arios casos, conclu´ımos que Z 1 pm (x) pn (x) r(x) dx = 0 , −1

sempre que m 6= n. Isso significa que os polinˆomios pn (x) s˜ao ortogonais dois-a-dois segundo o produto escalar h·, ·ir no intervalo J = [−1, 1].

V´arias equa¸co˜es diferenciais do tipo mencionado acima, definidas em um intervalo finito [−1, 1], tˆem solu¸co˜es polinomiais, como por exemplo, a equa¸ca˜o de Legendre e de Chebyshev. Como as mesmas, pelo Teorema 9.1, s˜ao ortogonais em rela¸ca˜o ao produto escalar h·, ·ir no intervalo J = [−1, 1]5 , as considera¸co˜es acima sugerem que as solu¸co˜es polinomiais possam ser escritas, a menos de uma constante multiplicativa, na forma (9.13). Isso ´e, de fato, verdade para v´arias equa¸co˜es importantes (como as de Legendre e Chebyshev) e da express˜ao (9.13) ser´a poss´ıvel obter v´arias propriedades daqueles polinˆomios. Isso ser´a melhor discutido nos exemplos que trataremos na Se¸ca˜o 9.2. A express˜ao (9.13) ´e denominada f´ ormula de Rodrigues6 . E. 9.2 Exerc´ıcio. Generalize a f´ormula de Rodrigues (9.13) para um intervalo J = [a, b] finito arbitr´ario. Sugest˜ao: procure uma transforma¸c˜ao linear que mapeie bijetivamente [−1, 1] em [a, b]. 6 As f´ormulas de Rodrigues podem ser generalizadas para equa¸co˜es diferenciais definidas em intervalos n˜ao-finitos, como J = (0, ∞) ou J = (−∞, ∞). Tratemos disso.

Para o caso J = (0, ∞) devemos supor novamente que r(x) seja infinitamente diferenci´avel, mas devemos ainda supor que r(x) seja limitada em x = 0 e que r(x) e todas as suas derivadas r (m) (x) caiam no infinito mais r´apido que qualquer potˆencia, ou seja lim x→∞ xk r (m) (x) = 0 para todo k ≥ 0 e m ≥ 0. Definimos, nesse caso,  1 dn  n r(x) x . (9.15) pn (x) := r(x) dxn 5

Veremos isso explicitamente nos exemplos da Se¸ca ˜o 9.2 Benjamin Olinde Rodrigues (1794-1851). Rodrigues foi banqueiro e matem´ atico amador, nascido na Fran¸ca, mas de origem judaico-portuguesa. Encontrou a f´ ormula que leva seu nome apenas para o caso dos polinˆ omios de Legendre. A generaliza¸ca ˜o aqui apresentada ´e posterior. Rodrigues tamb´em deu contribui¸co ˜es para a teoria dos quat´ernions e para o grupo SO(3) (vide Proposi¸ca ˜o 13.5, p´ agina 695). Apesar de banqueiro, Rodrigues foi l´ıder do partido socialista francˆes. 6

JCABarata. Curso de F´ısica-Matem´ atica

´ f´acil ver que se m < n, ent˜ao E

Para ver isso, escrevemos novamente Z



Z



Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

xm pn (x) r(x) dx = 0 ,

490/1304

(9.16)

0

xm pn (x) r(x) dx =

0

Z



xm

0

dn r(x) xn n dx

!

dx

e fazemos integra¸ ca˜o  por partes, usando que limx→∞ xk r (m) (x) = 0 para todos k ≥ 0 e m ≥ 0 e que a  dk n , com k < n, sempre contem um fator x que se anula em 0. express˜ao dx k r(x)x E. 9.3 Exerc´ıcio importante. Complete os detalhes.

6

Em certos exemplos, como na equa¸ca˜o de Laguerre, as fun¸co˜es pn s˜ao polinˆomios na vari´avel x. Nesses casos, temos ent˜ao que Z ∞ pm (x) pn (x) r(x) dx = 0 , 0

sempre que m 6= n. Isso significa que os polinˆomios pn (x) s˜ao ortogonais dois-a-dois segundo o produto escalar h·, ·ir no intervalo J = (0, ∞). Como antes, isso sugere que as solu¸co˜es polinomiais de certas equa¸co˜es diferenciais definidas no intervalo J = (0, ∞) possam ser escritas, a menos de uma constante multiplicativa, na forma sugerida pela f´ormula de Rodrigues (9.15). Veremos que tal ´e o caso para os polinˆomios de Laguerre e isso nos permitir´a obter algumas rela¸co˜es u ´ teis sobre aqueles polinˆomios. Para o caso J = (−∞, ∞) devemos supor novamente que r(x) seja infinitamente diferenci´avel, mas devemos ainda supor que r(x) e todas as suas derivadas r (m) (x) caiam no infinito mais r´apido que qualquer potˆencia, ou seja lim|x|→∞ |x|k |r (m) (x)| = 0 para todo k ≥ 0 e m ≥ 0. Definimos, nesse caso, pn (x) := ´ f´acil ver que se m < n, ent˜ao E

Z



 1 dn  r(x) . r(x) dxn

xm pn (x) r(x) dx = 0 ,

(9.17)

(9.18)

−∞

Para ver isso, escrevemos novamente Z Z ∞ m x pn (x) r(x) dx = −∞

∞ −∞

xm

 dn  r(x) dx dxn

e fazemos integra¸ca˜o por partes, usando que lim|x|→∞ |x|k |r (m) (x)| = 0 para todos k ≥ 0 e m ≥ 0. E. 9.4 Exerc´ıcio importante. Complete os detalhes.

6

Em certos exemplos, como na equa¸ca˜o de Hermite, as fun¸co˜es pn s˜ao polinˆomios na vari´avel x. Nesses casos, temos ent˜ao que Z ∞ pm (x) pn (x) r(x) dx = 0 , −∞

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

491/1304

sempre que m 6= n. Isso significa que os polinˆomios pn (x) s˜ao ortogonais dois-a-dois segundo o produto escalar h·, ·ir no intervalo J = (−∞, ∞). Como antes, isso sugere que as solu¸co˜es polinomiais de certas equa¸co˜es diferenciais definidas no intervalo J = (−∞, ∞) possam ser escritas, a menos de uma constante multiplicativa, na forma sugerida pela f´ormula de Rodrigues (9.17). Veremos que tal ´e o caso para os polinˆomios de Hermite e isso nos permitir´a obter algumas rela¸co˜es u ´ teis sobre os mesmos.

9.1.4

Fun¸ co ˜es Geratrizes

Fun¸co˜es geratrizes desempenham um elegante papel no estudo de propriedades de seq¨ uˆencias num´ericas, em an´alise combinat´oria e no estudo de certas seq¨ uˆencias de fun¸co˜es (ilustraremos essa afirma¸ca˜o estudando com elas, logo abaixo, a chamada seq¨ uˆencia de Fibonacci). Faremos adiante uso de fun¸co˜es geratrizes para demonstrar algumas propriedades u ´ teis de algumas das solu¸co˜es que encontramos no Cap´ıtulo 8, como os polinˆomios de Legendre, de Hermite, de Laguerre, de Chebyshev e as fun¸co˜es de Bessel. O leitor poder´a encontrar na bela referˆencia [50] uma vasta cole¸ca˜o de identidades combinat´orias interessantes que podem ser engenhosamente demonstradas com o uso de fun¸co˜es geratrizes de seq¨ uˆencias, assim como outras referˆencias a` literatura pertinente. • Fun¸ co ˜es geratrizes Seja {an , n ∈ } uma seq¨ uˆencia de n´ umeros reais ou complexos. Define-se a fun¸ca ˜o geratriz da seq¨ uˆencia {an , n ∈ } como sendo a fun¸ca˜o dada por 



G{an } (t) :=

∞ X

a n tn .

n=0

Essa defini¸ca˜o pressup˜oe que a s´erie de potˆencias em t do lado direito seja convergente em alguma regi˜ao do plano complexo, digamos |t| < T , para algum T > 0. Isso nem sempre ´e o caso. Por exemplo, se an = n! a s´erie acima tem raio de convergˆencia nulo. • Fun¸ co ˜es geratrizes exponenciais A fun¸ca ˜o geratriz exponencial da seq¨ uˆencia {an , n ∈ E{an } (t) :=



} ´e definida por

∞ X an n=0

n!

tn .

Essa defini¸ca˜o pressup˜oe que a s´erie de potˆencias em t do lado direito seja convergente em alguma regi˜ao do plano complexo, digamos |t| < T . • Fun¸ co ˜es geratrizes de Dirichlet Para certos tipos de seq¨ uˆencias ´e conveniente definir outro tipo de fun¸ca˜o geratriz, substituindo os P monˆomios tn por outras fun¸co˜es de t: ∞ a S (t). O exemplo mais importante desse tipo de fun¸ca˜o n=0 n n t geratriz ´e aquele no qual se toma Sn (t) = 1/n , n ≥ 1. Isso nos conduz a` pr´oxima defini¸ca˜o.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

A fun¸ca ˜o geratriz de Dirichlet7 da seq¨ uˆencia {an , n ∈ D{an } (t) :=



492/1304

} ´e definida por

∞ X an n=1

Cap´ıtulo 9

nt

,

desde que a s´erie do lado direito convirja com a vari´avel t em alguma regi˜ao do plano complexo. A mais famosa das fun¸co˜es geratrizes de Dirichlet ´e a fun¸ca ˜o zeta de Riemann 8 , que ´e a fun¸ca˜o geratriz de Dirichlet da seq¨ uˆencia constante an = 1, n ≥ 1: ∞ X 1 ζ(s) := . ns n=1

Como facilmente se vˆe, a s´erie do lado direito converge na regi˜ao do plano complexo definida por Re(s) > 1. A fun¸ca˜o zeta de Riemann desempenha um papel de grande importˆancia na teoria das fun¸co˜es de vari´avel complexa e na teoria de n´ umeros, pois v´arias de suas propriedades est˜ao relacionadas a propriedades do conjunto de n´ umeros primos. Vide, e.g., [55], [126], [127] ou [34]. Os trˆes tipos de fun¸co˜es geratrizes definidas acima tˆem v´arias propriedades alg´ebricas interessantes, como mostrado nos trˆes exerc´ıcios que seguem. E. 9.5 Exerc´ıcio. Se {an } e {bn } s˜ao duas seq¨uˆencias cujas fun¸co˜es geratrizes G {an } (t) e G{bn } (t) tˆem uma regi˜ao de convergˆencia comum, mostre que G{an } (t) G{bn } (t) = G{cn } (t) , onde cn =

n X

an−p bp .

p=0

6

E. 9.6 Exerc´ıcio. Se {an } e {bn } s˜ao duas seq¨uˆencias cujas fun¸co˜es geratrizes exponenciais E {an } (t) e E{bn } (t) tˆem uma regi˜ao de convergˆencia comum, mostre que E{an } (t) E{bn } (t) = E{cn } (t) , onde cn =

n   X n p=0

p

an−p bp . 6

E. 9.7 Exerc´ıcio. Se {an } e {bn } s˜ao duas seq¨uˆencias cujas fun¸co˜es geratrizes de Dirichlet D {an } (t) e D{bn } (t) tˆem uma regi˜ao de convergˆencia comum, mostre que D{an } (t) D{bn } (t) = D{cn } (t) , 7 8

Johann Peter Gustav Lejeune Dirichlet (1805-1859). Georg Friedrich Bernhard Riemann (1826-1866).

JCABarata. Curso de F´ısica-Matem´ atica

onde

Vers˜ ao de 29 de setembro de 2005.

n X

cn =

Cap´ıtulo 9

493/1304

an/p bp .

p=1 n/p inteiro

6 • Um exemplo. A seq¨ uˆ encia de Fibonacci Seja an , n = 1, 2, 3, 4 . . ., a seq¨ uˆencia definida recursivamente da seguinte forma: a0 = 1,

a1 = 1,

an+2 = an+1 + an ,

∀n≥0.

Essa seq¨ uˆencia ´e denominada seq¨ uˆencia de Fibonacci9 . Os primeiros elementos da seq¨ uˆencia de Fibonacci s˜ao 1, 1, 2, 3, 5, 8, 13, 21, 34, 55... Cada elemento da seq¨ uˆencia de Fibonacci ´e a soma de seus dois antecessores. Fibonacci introduziu a seq¨ uˆencia que leva seu nome em um problema de seu livro Liber abbaci, de 1202 (livro esse que introduziu o sistema decimal ar´abico na Europa, em substitui¸ca˜o ao sistema de algarismos romanos, usado at´e ent˜ao): “Um certo homem coloca um casal de coelhos em um local cercado de muros por todos os lados. Quantos pares de coelhos podem ser produzidos a partir daquele casal em um ano se for suposto que a cada mˆes cada casal gera um novo casal, o qual se torna f´ertil em um mˆes”. A resposta (supondo que nenhum coelho morre) ´e que, ap´os n meses, tem-se a n pares de coelhos, sendo an dado acima. Trata-se provavelmente do primeiro modelo de evolu¸ca˜o de popula¸co˜es. A seq¨ uˆencia de Fibonacci ´e surpreendentemente rica em propriedades, sendo possivelmente uma das mais pesquisadas da hist´oria, existindo at´e mesmo uma publica¸ca˜o peri´odica (“Fibonacci Quarterly”) dedicada a seu estudo. No intuito de ilustrar a utilidade de fun¸co˜es geratrizes de seq¨ uˆencias, vamos demonstrar a seguinte identidade para os elementos da seq¨ uˆencia de Fibonacci:   √ !n+1 √ !n+1 1− 5 1 1+ 5  , − an = √  (9.19) 2 2 5

v´alida para todo n ≥ 0. Essa express˜ao permite obter cada an diretamente em termos de n. A fun¸ca˜o geratriz da seq¨ uˆencia de Fibonacci ´e F (t) =

∞ X

a n tn .

(9.20)

n=0

Mostremos primeiramente que a s´erie de potˆencias do lado direito tem um raio de convergˆencia n˜aonulo. Pelo teste da raz˜ao vale, para n > 0,   an+1 tn+1 = an+1 |t| = an + an−1 |t| = 1 + an−1 |t| ≤ 2|t| , a n tn an an an 9

Leonardo Pisano, cognominado “Fibonacci” (1170-1250).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

494/1304

≤ 1, j´a que a seq¨ uˆencia de Fibonacci ´e crescente. Logo, a s´erie converge absolutamente pelo pois an−1 an menos na regi˜ao |t| < 1/2. A verdadeira regi˜ao de convergˆencia ´e um pouco maior (como veremos adiante), mas n˜ao precisaremos desse fato por ora, pois tudo o que necessitamos ´e da existˆencia de um raio de convergˆencia n˜ao-nulo, o que justifica as manipula¸co˜es que faremos. Fa¸camos uso da defini¸ca˜o da seq¨ uˆencia de Fibonacci para obter uma f´ormula expl´ıcita para F (t). Temos que F (t) = 1 + t +

∞ X

a n tn

n=2

= 1+t+

∞ X

(an−1 + an−2 ) t

n

= 1+t+

n=2

= 1+t+t

∞ X

an−1 t +

n=2

∞ X

n

an t + t

2

∞ X

n

∞ X

an−2 tn

n=2

a n tn

n=0

n=1

= 1 + t + t(F (t) − 1) + t2 F (t) . Assim, (1 − t − t2 )F (t) = 1 e, portanto, F (t) =

1 . 1 − t − t2

A id´eia agora ´e obter a expans˜ao em s´erie de Taylor de F (t) em torno de t = 0 e compar´a-la a (9.20), para assim obter uma express˜ao expl´ıcita para os an ’s. Para isso, ao inv´es de calcularmos as derivadas de F em t = 0, ´e mais f´acil proceder da seguinte forma. Escrevemos 1 − t − t2 = −(t − γ1 )(t − γ2 ) onde √ √ 5−1 5+1 , γ2 = − . γ1 = 2 2 Assim,   1 1 1 1 1 F (t) = = − = − 1 − t − t2 (t − γ1 )(t − γ2 ) γ1 − γ 2 γ1 − t γ2 − t " ! !# 1 1 1 1 1 − = √ γ2 1 − γt2 5 γ1 1 − γt1 ∞

1 X = √ 5 n=0



1 γ1n+1



1 γ2n+1



tn

∞  1 X  = √ (−γ2 )n+1 − (−γ1 )n+1 tn 5 n=0

 √ !n+1 ∞ X 1  1+ 5 √ − = 2 5 n=0

 √ !n+1 1− 5  tn , 2

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

495/1304

onde usamos que 1/γ1 = −γ2 . Comparando com (9.20) obtemos (9.19), como quer´ıamos.√ Da u ´ ltima express˜ao, vˆe-se tamb´em que o raio de convergˆencia da s´erie de potˆencias que define F ´e ( 5 − 1)/2 ≈ 0, 618 . . ..

9.2

Propriedades de Algumas Fun¸ co ˜es Especiais

Vamos agora ent˜ao reunir o conhecimento acumulado acima para obter v´arias propriedades u ´ teis de algumas das fun¸co˜es especiais que encontramos como solu¸co˜es de equa¸co˜es diferenciais de interesse. As v´arias identidades que provaremos podem ser obtidas de diferentes modos, de sorte que o leitor certamente encontrar´a na literatura demonstra¸co˜es alternativas a`quelas aqui apresentadas.

9.2.1

Propriedades dos Polinˆ omios de Legendre

• Rela¸ co ˜es de ortogonalidade para os polinˆ omios de Legendre 0

A equa¸ca˜o de Legendre ((1 − x2 ) y 0 (x)) + λ(λ + 1)y(x) = 0, ´e tipicamente considerada no intervalo J = [−1, 1]. Aqui, p(x) = (1 − x2 ), q(x) = 0, r(x) = 1 e µ = λ(λ + 1). A fun¸ca˜o p(x) anula-se nos extremos ±1 do intervalo J = [−1, 1]. Os polinˆomios de Legendre Pm (x) foram definidos em (8.14) por Pm (x) :=

bm/2c

X a=0

(−1)a (2m − 2a)! xm−2a , m 2 (m − a)! (m − 2a)! a!

(9.21)

onde bm/2c ´e o maior inteiro menor ou igual a m/2, e s˜ao solu¸co˜es da equa¸ca˜o de Legendre com µ = m(m + 1), sendo (as u ´ nicas) solu¸co˜es da equa¸ca˜o de Legendre que permanecem limitadas nos pontos ±1.

Como p(x) anula-se nos extremos ±1 e os Pm (x) s˜ao limitados nesses pontos, vale para os polinˆomios de Legendre a rela¸ca˜o (9.6) e conclu´ımos pelo Teorema 9.1 que Z 1 Pn (x)Pm (x) dx = 0 (9.22) −1

para todo n 6= m, com m, n = 0, 1, 2, 3, . . .. Notemos que isso implica Z 1 xk Pm (x) dx = 0

(9.23)

−1

para todo k < m, pois os monˆomios xk podem ser escritos como combina¸co˜es lineares dos polinˆomios Pn ’s com n < m. Para calcular as integrais de (9.22) no caso n = m, podemos elegantemente usar as rela¸co˜es 0 0 Pn+1 (x) = (2n + 1)Pn (x) + Pn−1 (x) , n≥0, (9.24)

e

Pn (1) = 1 ,

Pn (−1) = (−1)n ,

n≥0,

(9.25)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

496/1304

as quais ser˜ao demonstradas mais abaixo (rela¸co˜es (9.30) e (9.34), respectivamente) como conseq¨ uˆencia da f´ormula de Rodrigues para os polinˆomios de Legendre. De fato, por integra¸ca˜o por partes, tem-se Z 1 Z 1 1 0 Pn0 (x)Pn+1 (x) dx . Pn (x)Pn+1 (x) dx = Pn (x)Pn+1 (x) − −1

−1

1 Por (9.25), Pn (x)Pn+1 (x)

−1

−1

= 1 + (−1)2n = 2. Por (9.23),

R1

−1

Pn0 (x)Pn+1 (x) dx = 0, pois Pn0 (x) ´e

seguramente um polinˆomio de grau n − 1. Assim, Z 1 Z 1   (9.24) 0 0 Pn (x) (2n + 1)Pn (x) + Pn−1 (x) dx Pn (x)Pn+1 (x) dx = 2 = −1

−1

= pois, novamente por (9.23), Isso provou que

R1

−1

(2n + 1)

Z

1

Pn (x)2 dx , −1

0 0 Pn (x)Pn−1 (x) dx = 0, j´a que Pn−1 (x) ´e um polinˆomio de grau n − 2.

Z

1

Pn (x)Pm (x) dx = −1

2 δn, m , 2n + 1

(9.26)

para todos m, n ≥ 0. Estas s˜ao as rela¸co ˜es de ortogonalidade para os polinˆ omios de Legendre.

Em muitas situa¸co˜es pr´aticas ´e conveniente expressar (9.26) atrav´es da mudan¸ca de vari´avel x = cos θ, com 0 ≤ θ ≤ π. Ficamos com Z π 2 δn, m , (9.27) Pn (cos θ)Pm (cos θ) sen (θ) dθ = 2n + 1 0 para todos m, n ≥ 0. • F´ ormula de Rodrigues para os polinˆ omios de Legendre Pelas nossas considera¸co˜es gerais sobre as f´ormulas de Rodrigues, podemos presumir que os polinˆomios Pm , por serem ortogonais entre si (vide (9.22)), possam ser expressos na forma (9.13) com r(x) = 1, ou seja,  dm  2 m , Pm (x) = Km m (1 − x ) dx onde Km s˜ao constantes que dependem ca˜o adotada. De fato, essa pressuposi¸ca˜o ´e correta  da normaliza¸ P m m−a 2m−2a pois, escrevendo (1 − x2 )m = m (−1) x (binˆomio de Newton) e notando que a=0 a  (2m − 2a)! m−2a   x , para 0 ≤ a ≤ bm/2c  dm  2m−2a  (m − 2a)! x = (9.28)  dxm   0, para bm/2c + 1 ≤ a ≤ m

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

497/1304

(justifique!), conclu´ımos facilmente que m    dm  dm X m 2 m (1 − x ) (−1)m−a x2m−2a = dxm dxm a=0 a bm/2c   dm X m (−1)m−a x2m−2a = m dx a=0 a

=

bm/2c

X

(−1)

m−a

a=0

m

m

= (−1) 2 m!

  m (2m − 2a)! m−2a x a (m − 2a)! bm/2c

X a=0

(−1)a (2m − 2a)! xm−2a m 2 (m − a)!(m − 2a)!a!

= (−1)m 2m m! Pm (x) . Assim, Km = (−1)m /(2m m!) e Pm (x) =

 1 dm  2 m (x − 1) , 2m m! dxm

(9.29)

como pressuposto. Essa express˜ao ´e conhecida como f´ ormula de Rodrigues para os polinˆ omios de Legendre e ´e v´alida para todo m ≥ 0, inteiro. De (9.29) outras rela¸co˜es u ´ teis podem ser extra´ıdas, nosso pr´oximo assunto.

• Rela¸ co ˜es de recorrˆ encia para os polinˆ omios de Legendre Vamos aqui demonstrar as seguintes rela¸co˜es v´alidas para os polinˆomios de Legendre: 0 0 Pn+1 (x) = (2n + 1)Pn (x) + Pn−1 (x) ,

(9.30)

0 Pn+1 (x) = xPn0 (x) + (n + 1)Pn (x) ,

(9.31)

0 nPn (x) = xPn0 (x) − Pn−1 (x) ,

(n + 1)Pn+1 (x) = (2n + 1)xPn (x) − nPn−1 (x) , Pn (1) = 1 ,

Pn (−1) = (−1)n .

(9.32) (9.33) (9.34)

Todas as rela¸co˜es acima tˆem aplica¸co˜es (vimos isso quando provamos as rela¸co˜es de ortogonalidade para os Pn ’s). A rela¸ca˜o (9.33) ´e particularmente interessante por permitir determinar os P n ’s recursivamente a partir dos dois primeiros: P0 (x) = 1 e P1 (x) = x. Comecemos por provar (9.30). Como

d (x2 dx

− 1)n+1 = 2(n + 1)x(x2 − 1)n , segue da f´ormula de

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

498/1304

Rodrigues para Pn+1 que i dn+1 h 1 2 n 2(n + 1)x(x − 1) 2n+1 (n + 1)! dxn+1

0 Pn+1 (x) =

i 1 dn h 2 n 2 2 n−1 (x − 1) + 2nx (x − 1) = n 2 n! dxn i 1 dn h 2 n 2 n−1 = n (2n + 1)(x − 1) + 2n(x − 1) 2 n! dxn 0 = (2n + 1)Pn (x) + Pn−1 (x) ,

provando (9.30). Por outro lado, come¸cando pela primeira linha obtida acima, e usando-se a regra de Leibniz, tem-se 0 Pn+1 (x) =

i 1 dn+1 h 2 n x(x − 1) 2n n! dxn+1

   p   n+1−p n+1  1 X n+1 d d 2 n = n x (x − 1) 2 n! p=0 dxp dxn+1−p p =

1 dn+1 2 (n + 1) dn 2 n x (x − 1) + (x − 1)n 2n n! dxn+1 2n n! dxn

= xPn0 (x) + (n + 1)Pn (x) , provando (9.31). A rela¸ca˜o (9.32) ´e obtida subtraindo-se (9.31) de (9.30). Por fim, para obter (9.33), multiplicamos (9.30) por x e escrevemos (2n + 1)xPn (x)

= = (9.32)

=

(9.31)

=

0 0 xPn+1 (x) − xPn−1 (x)  0 0 xPn+1 (x) − Pn0 (x) + Pn0 (x) − xPn−1 (x) 0 (n + 1)Pn+1 (x) + Pn0 (x) − xPn−1 (x)

(n + 1)Pn+1 (x) + nPn−1 (x) .



Disso (9.33) segue imediatamente. Por fim, vamos provar (9.34) por indu¸ca˜o. Como P0 (x) = 1 e P1 (x) = x, as rela¸co˜es acima valem para n = 0 e n = 1. Supondo-as v´alidas para n−1 e n, teremos por (9.33) que (n+1)P n+1 (1) = (2n+1)− n = (n+1), o que implica Pn+1 (1) = 1 e (n+1)Pn+1 (−1) = −(2n+1)(−1)n +n(−1)n = (n+1)(−1)n+1 , o que implica Pn+1 (−1) = (−1)n+1 . Isso encerra a demonstra¸ca˜o de (9.30)-(9.34). • A fun¸ c˜ ao geratriz dos polinˆ omios de Legendre

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

499/1304

A fun¸ca˜o geratriz dos polinˆomios de Legendre ´e L(x, t) :=

∞ X n=0

Pn (x) tn = √

1 , 1 − 2tx + t2

(9.35)

v´alida para |t| < 1 e |x| ≤ 1. Essa rela¸ca˜o tem diversas demonstra¸co˜es, a mais elegante sendo a seguinte ∂ (de [66]). Calculando-se ∂t L(x, t) e usando-se (9.33), tem-se ∞ X ∂ L(x, t) = nPn (x) tn−1 ∂t n=1

∞ X

=

(n + 1)Pn+1 (x) tn

n=0

(9.33)

=

∞ h X n=0

=

2x

i

(2n + 1)xPn (x) − nPn−1 (x) tn

∞ X

n

nPn (x) t + x

n=0

=

2x

∞ X

n=0

n

nPn (x) t + x

n=0

=

=

∞ X ∞ X n=0

n

Pn (x) t − n

Pn (x) t −

∞ X

nPn−1 (x) tn

n=0

∞ X

(n + 1)Pn (x) tn+1

n=0

∞ ∞ ∞ X X ∂ X n n 2 ∂ Pn (x) t − t Pn (x) t + (x − t) Pn (x) tn 2xt ∂t n=0 ∂t n=0 n=0

(2xt − t2 )

∂ L(x, t) + (x − t)L(x, t) . ∂t

E. 9.8 Exerc´ıcio. Verifique!

6

Assim, L(x, t) satisfaz a equa¸ca˜o diferencial 1 ∂ (x − t) L(x, t) = . L(x, t) ∂t 1 − 2xt + t2 O lado direito ´e −

 1∂ ln 1 − 2xt + t2 . Logo, 2 ∂t L(x, t) = √

exp(l(x)) , 1 − 2tx + t2

onde l(x) ´e, em princ´ıpio, uma fun¸ca˜o arbitr´aria. Lembrando, por´em, que L(x, 0) = P0 (x) = 1 para todo x, obtem-se de imediato que l(x) = 0 para todo x. Isso estabelece (9.35), como quer´ıamos. • Representa¸ co ˜es integrais para os polinˆ omios de Legendre

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

500/1304

A bem-conhecida F´ormula Integral de Cauchy, afirma que, para uma fun¸ca˜o f anal´ıtica em um dom´ınio aberto simplesmente conexo D, vale Z n! f (w) (n) dw , (9.36) f (z) = 2πi C (w − z)n+1 para todo z ∈ D, onde a curva C ´e uma curva diferenci´avel fechada inteiramente contida em D e d´a precisamente uma volta no sentido anti-hor´ario em torno de z. Combinando a f´ormula de Rodrigues e a F´ormula Integral de Cauchy, obtem-se imediatamente Z (w 2 − 1)l 1 Pl (z) = l+1 dw , (9.37) 2 πi C (w − z)l+1 onde C ´e uma curva fechada e diferenci´avel no plano complexo dando uma volta em torno de z no sentido anti-hor´ario. Essa express˜ao ´e conhecida como representa¸ca ˜o integral de Schl¨ afli 10 dos polinˆomios de Legendre. Uma conseq¨ uˆencia dessa representa¸ca˜o ´e a seguinte express˜ao: Z π l 1 z + i(1 − z 2 )1/2 cos(φ) dφ , Pl (z) = 2π −π

(9.38)

v´alida para |z| < 1. A demonstra¸ca˜o dessa express˜ao ser´a apresentada mais adiante como caso particular de uma identidade mais geral (express˜ao (9.49), abaixo), v´alida para os polinˆomios de Legendre associados. Como a equa¸ca˜o de Legendre ´e invariante pela mudan¸ca l → −(l + 1) (verifique que l(l + 1) ´e levado em si mesmo por essa transforma¸ca˜o!), vale tamb´em a identidade11 Z π 1 1 Pl (z) = (9.39)  l+1 dφ . 2π −π z + i(1 − z 2 )1/2 cos(φ) Para z real no intervalo [−1, 1], podemos escrever, como ´e comum em aplica¸co˜es, z = cos(θ) com 0 ≤ θ ≤ π e com isso as duas identidades acima ficam Z π Z π l 1 1 1 cos(θ) + i sen (θ) cos(φ) dφ = Pl (cos(θ)) =  l+1 dφ . 2π −π 2π −π cos(θ) + i sen (θ) cos(φ)

Usando o binˆomio de Newton podemos usar a primeira identidade para escrever Pl (cos(θ)) como 10

Ludwig Schl¨ afli (1814-1895). Esse argumento envolvendo a transforma¸ca ˜o l → −(l + 1) ´e ainda incompleto, mas pode-se provar que o lado direito de (9.39) ´e de fato igual ao esquerdo, pois ´e regular e satisfaz a equa¸ca ˜o de Legendre. Deixamos os detalhes como exerc´ıcio. 11

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

501/1304

um polinˆomio em cos θ e sen θ: l   l−p  p Z π  p 1 X l p sen (θ) Pl (cos(θ)) = i cos(θ) cos(φ) dφ 2π p=0 p −π

l−2q  2q X (−1)q  l 2q  cos(θ) sen (θ) = q 22q 2q q=0 bl/2c

=

bl/2c

X q=0

 l−2q  2q (−1)q l! . cos(θ) sen (θ) 22q (l − 2q)! (q!)2 *

E. 9.9 Exerc´ıcio. Prove que no intervalo (−1, 1) vale ∞

P0 (x) 5P2 (x) X (−1)m+1 (2m − 3)! (4m + 1) |x| = + + P2m (x) . 2m−1 (m + 1)! (m − 2)! 2 8 2 m=2 Sugest˜ao: para calcular integrais como partes e os fatos que Pn (1) = 1, ∀n ∈

(9.21).

9.2.2



Z

(9.40)

1

xP2m (x)dx pode-se usar (9.30) e/ou (9.33), integra¸c˜ao por 0

e P2m (0) =

(−1)m (2m − 1)!! , ∀m ∈ 2m m! 

, m ≥ 1, o qual segue de 6

Propriedades dos Polinˆ omios de Legendre Associados. Harmˆ onicos Esf´ ericos

Na Se¸ca˜o 8.3.1, p´agina 450, introduzimos a equa¸ca˜o de Legendre associada (8.147) e mostramos que para λ = l ∈ e µ = m ∈ a mesma possui solu¸co˜es da forma 



Plm (z) := (1 − z 2 )m/2

dm Pl (z) , dz m

(9.41)

´ claro que P m (z) ´e nulo se para z ∈ com |z| < 1, onde Pl ´e o polinˆomio de Legendre de grau l. E l m > l (pois Pl ´e um polinˆomio de grau l). A rela¸ca˜o (9.41), como dissemos na Se¸ca˜o 8.3.1, define os chamados polinˆ omios de Legendre associados12 , ainda que eles n˜ao sejam exatamente polinˆomios na vari´avel z. 12 O leitor deve ser advertido que, lastimavelmente, n˜ ao h´ a uniformidade na literatura quanto a ` defini¸ca ˜o dos polinˆ omios de Legendre associados. Alguns autores (e.g., [83]) introduzem um fator (−1) m no lado direito de (9.41). Assim, algumas das express˜ oes que obtemos aqui podem divergir das correspondentes encontradas em alguns textos e o leitor deve compar´ a-las cuidadosamente. A defini¸ca ˜o que seguimos ´e a recomendada pela American Mathematical Society.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

502/1304

Vimos tamb´em que, devido a` f´ormula de Rodrigues para os polinˆomios de Legendre, podemos escrever Plm (z) como  1 dl+m  Plm (z) = l (1 − z 2 )m/2 l+m (z 2 − 1)l , (9.42) 2 l! dz para z ∈ com |z| < 1 e 0 ≤ m ≤ l. L´a notamos tamb´em que essa express˜ao faz sentido mesmo para m inteiro negativo, mas tal que −l ≤ m ≤ l. Assim, definimos Pl−m (z) = tamb´em com 0 ≤ m ≤ l e para z ∈

 l−m  1 2 l 2 −m/2 d , (z − 1) (1 − z ) 2l l! dz l−m

(9.43)

com |z| < 1. Afirmamos que

Pl−m (z) = (−1)m

(l − m)! m P (z) . (l + m)! l

(9.44)

Essa rela¸ca˜o ´e importante por mostrar que Pl−m (z) ´e tamb´em uma solu¸ca˜o da equa¸ca˜o de Legendre associada, por ser proporcional a Plm (z). Fora isso a express˜ao acima ´e relevante para os chamados harmˆonicos esf´ericos, dos quais trataremos mais abaixo. Apresentaremos duas demonstra¸co˜es de (9.44), ambas instrutivas. Uma “`a for¸ca bruta”, usando diretamente as defini¸co˜es, ´e desenvolvida no Apˆendice 9.A, p´agina 541. Uma segunda, mais gentil, ser´a vista logo abaixo e usa uma representa¸ca˜o integral dos polinˆomios de Legendre associados. • Representa¸ co ˜es integrais para os polinˆ omios de Legendre associados Nossa inten¸ca˜o agora ´e obter algumas representa¸co˜es integrais u ´ teis para os polinˆomios de Legendre associados mas, en passant, encontraremos uma outra demonstra¸ca˜o mais gentil da identidade (9.44). k

d 2 l As express˜oes (9.42) e (9.43) envolvem derivadas do tipo dz k (z − 1) para k = l + m e k = l − m, dk 2 l respectivamente. Procuremos primeiramente expressar genericamente dz k (z − 1) em termos de certas integrais. Tomemos provisoriamente z real no intervalo aberto −1 < z < 1. Pela F´ormula Integral de Cauchy (9.36), podemos escrever13 Z dk 2 (w 2 − 1)l k! l (z − 1) = dw , (9.45) dz k 2πi C (w − z)k+1

onde C ´e uma curva fechada e diferenci´avel no plano complexo, dando uma volta em torno de z no sentido anti-hor´ario. Escolhemos a curva C dada por C := {w ∈ | |w − z| = (1 − z 2 )1/2 }, de modo que podemos escrever todo ponto w de C na forma w = z + i(1 − z 2 )1/2 eiφ com −π ≤ φ ≤ π. Com isso, a integral em w sobre C pode ser escrita como uma integral em φ e para 13

As id´eias que se seguem provavelmente originam-se dos trabalhos de Schl¨ afli. Nossas fontes s˜ ao [66] e [136], que seguimos com adapta¸co ˜es.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

503/1304

isso, usa-se dw = −(1 − z 2 )1/2 eiφ dφ , w − z = i(1 − z 2 )1/2 eiφ , w 2 − 1 = −(1 − z 2 ) (e2iφ + 1) + 2iz(1 − z 2 )1/2 eiφ 

2 1/2

= 2 i(1 − z )

2

2 1/2 iφ

= 2i(1 − z )

e

Assim, dk 2 k! (z − 1)l = k dz 2πi

Z

C

e







eiφ + e−iφ 2

2 1/2

z + i(1 − z )

(w 2 − 1)l dw (w − z)k+1

= −(1 − z 2 )1/2

k! 2πi

2 (l−k)/2

= (1 − z )

Z

π −π



2l il−k k! 2π

2 1/2

2i(1 − z ) Z



e



−π





cos(φ) .



(i(1 − π

+ 2iz(1 − z 2 )1/2 eiφ

2 1/2

z + i(1 − z )

k+1 z 2 )1/2 eiφ )

z + i(1 − z 2 )1/2 cos(φ)

l

cos(φ)

l

eiφ dφ

ei(l−k)φ dφ

e assim, Z l l l−k  k! π  dk 2 2 1/2 l 2 (l−k)/2 2 i cos (l − k)φ dφ , (9.46) z + i(1 − z ) cos(φ) (z − 1) = (1 − z ) dz k 2π −π Z π l pois z + i(1 − z 2 )1/2 cos(φ) sen ((l − k)φ) dφ = 0, pelo fato de o integrando ser uma fun¸ca˜o −π

´ımpar.

Aplicando (9.46) a`s express˜oes (9.42) e (9.43) de Plm e Pl−m (adotando k = l + m e k = l − m, respectivamente), chegamos a Z l  i−m (l + m)! π  m 2 1/2 Pl (z) = z + i(1 − z ) cos(φ) cos − mφ dφ , 2πl! −π Pl−m (z)

i+m (l − m)! = 2πl!

Z

π

−π



z + i(1 − z 2 )1/2 cos(φ)

l

e comparando-as, extra´ımos que Plm (z) = (−1)m

(l + m)! −m P (z) . (l − m)! l

 cos + mφ dφ ,

(9.47)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

504/1304

Com isso, encontramos uma segunda demonstra¸ca˜o de (9.44). As identidades acima foram provadas para z real em −1 < z < 1, mas valem para todo z complexo com |z| < 1 (e mesmo em z = ±1), pois l´a Plm (z) e Pl−m (z) tˆem uma extens˜ao anal´ıtica u ´ nica. Coletemos o que provamos acima. Aplicando (9.45) a` defini¸ca˜o (9.42) de P lm (z), agora para todo m ∈ com −l ≤ m ≤ l, chegamos a` express˜ao Z (l + m)! (w 2 − 1)l 2 m/2 m (1 − z ) dw , (9.48) Pl (z) = l+1 l+m+1 2 πi l! C (w − z) onde C ´e uma curva fechada e diferenci´avel no plano complexo dando uma volta em torno de z no sentido anti-hor´ario. Essa express˜ao generaliza a representa¸ca˜o de Schl¨afli (9.37) para os polinˆomios de Legendre. Como conseq¨ uˆencia, estabelecemos tamb´em logo acima a representa¸ca˜o integral Z l  i−m (l + m)! π  m z + i(1 − z 2 )1/2 cos(φ) cos mφ dφ , Pl (z) = (9.49) 2πl! −π

v´alida para |z| < 1 e para todo l ∈



e todo m ∈

com −l ≤ m ≤ l.

Assim como a equa¸ca˜o de Legendre, a equa¸ca˜o de Legendre associada ´e invariante pela transforma¸ca˜o l → −(l + 1). Assim, vale tamb´em14 Z π  im l! 1 m Pl (z) = (9.50)  l+1 cos mφ dφ , 2π(l − m)! −π 2 1/2 z + i(1 − z ) cos(φ)

= (l + m)(l + m − 1) · · · (l + 1) ´e levado pela transforma¸ca˜o onde acima usamos o fato que (l+m)! l! l! l → −(l + 1) em (−1 − l + m)(−2 − l + m) · · · (−l) = (−1)m (l)(l + 1) · · · (l − m + 1) = (l−m)! .

Em aplica¸co˜es ´e comum tomar-se z real no intervalo [−1, 1] e escrever z = cos(θ) com 0 ≤ θ ≤ π. Com isso, as duas identidades acima ficam Z l  i−m (l + m)! π  m (9.51) Pl (cos(θ)) = cos(θ) + i sen (θ) cos(φ) cos mφ dφ , 2πl! −π Z π  im l! 1 m Pl (cos(θ)) = (9.52)  l+1 cos mφ dφ . 2π(l − m)! −π cos(θ) + i sen (θ) cos(φ)

Atrav´es do binˆomio de Newton, a primeira identidade pode ser usada para expressar P lm (cos(θ)) como 14

Esse argumento envolvendo a transforma¸ca ˜o l → −(l + 1) ´e ainda incompleto, mas pode-se provar que o lado direito de (9.50) ´e de fato igual ao esquerdo, pois ´e regular e satisfaz a equa¸ca ˜o de Legendre associada. Deixamos os detalhes como exerc´ıcio.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

505/1304

um polinˆomio em cos θ e sen θ: l

Plm (cos(θ))

=

=

i−m (l + m)! X p = i 2πl! p=0 i

−m+|m|

i−m+|m|

  l−p  p Z π  p  l cos(θ) sen (θ) cos(φ) cos mφ dφ , p −π

(l + m)! 2|m| l!

c b l−|m| 2 X

(−1)q 22q



cos(θ)

(l + m)! 2|m|

b l−|m| c 2 X

(−1)q 22q (l − 2q − |m|)! (q + |m|)! q!

cos(θ)

q=0

q=0



l 2q + |m|



2q + |m| q

l−2q−|m|

l−2q−|m|

sen (θ)

sen (θ)

2q+|m|

2q+|m|

.

(9.53) Note que i−m+|m| = 1 se m ≥ 0 e i−m+|m| = (−1)m se m < 0, de modo que Plm (cos(θ)) ´e real se 0 ≤ θ ≤ π. A express˜ao (9.53) ´e por vezes utilizada na pr´atica para expressar os harmˆonicos esf´ericos (que definiremos abaixo) como polinˆomios em cos θ e sen θ. Logo adiante faremos uso da mesma no estudo das rela¸co˜es de ortogonalidade das fun¸co˜es Plm . • A fun¸ c˜ ao geratriz dos polinˆ omios de Legendre associados Usando (9.41), (9.35) e a identidade, v´alida para m ≥ 0, 1 1 dm (2m)! m (1 − 2tx + t2 )− 2 = m t (1 − 2tx + t2 )−m− 2 m dx 2 m!

(prove-a!) ´e f´acil mostrar que ∞ X

m

m Pl+m (x) tl

l=0

(2m)! (1 − x2 ) 2 = m , 2 m! (1 − 2tx + t2 )m+ 21

(9.54)

v´alida para todo m ≥ 0. E. 9.10 Exerc´ıcio. Mostre isso.

6

A express˜ao (9.54) ´e tamb´em denominada fun¸ca ˜o geratriz dos polinˆ omios de Legendre associados. A express˜ao (9.54) tem poucas aplica¸co˜es diretas, mas pode ser usada para demonstrar outras rela¸co˜es sobre os polinˆomios de Legendre associados. • Rela¸ co ˜es de recorrˆ encia para os polinˆ omios de Legendre associados Os polinˆomios de Legendre associados satisfazem uma s´erie de rela¸co˜es de recorrˆencia. Listemos as

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

506/1304

mais relevantes:   2mx m = √ Pl (x) − l(l + 1) − m(m − 1) Plm−1 (x) , 2 1−x √ m+1 m+1 (x) , Pl+1 (x) = (2l + 1) 1 − x2 Plm (x) + Pl−1 Plm+1 (x)

√ m−1 m−1 (2l + 1) 1 − x2 Plm (x) = (l + m)(l + m − 1)Pl−1 (x) − (l − m + 1)(l − m + 2)Pl+1 (x) , m m (2l + 1)xPlm (x) = (l + m)Pl−1 (x) + (l − m + 1)Pl+1 (x) ,

√ d 2 1 − x2 Plm (x) = Plm+1 (x) − (l + m)(l − m + 1)Plm−1 (x) . dx As demonstra¸co˜es podem ser obtidas da seguinte forma: 1. a partir das rela¸co˜es de recorrˆencia dos polinˆomios de Legendre (9.30)-(9.34) com uso da defini¸ca˜o (9.41); 2. a partir de (9.42) ou, em alguns casos, 3. com o uso da fun¸ca˜o geratriz (9.54). Deixamos as demonstra¸co˜es como exerc´ıcio. E. 9.11 Exerc´ıcio. Prove todas as rela¸co˜es acima. Sugest˜ao: tente por conta pr´opria seguir as sugest˜oes do u ´ltimo paragrafo. Sen˜ao, consulte a literatura supracitada, mas com as seguintes precau¸co˜es: a. diferentes textos apresentam defini¸co˜es diferentes dos Plm , o que conduz a rela¸co˜es de recorrˆencia distintas das de acima; b. nem todos os livros-texto15 provam todas as rela¸co˜es e c. alguns contˆem erros. 6 • Rela¸ co ˜es de ortogonalidade para os polinˆ omios de Legendre associados Obteremos agora rela¸co˜es de ortogonalidade para os polinˆomios de Legendre associados, rela¸co˜es essas de grande importˆancia na An´alise Harmˆonica e que inspiram a defini¸ca˜o dos chamados harmˆonicos esf´ericos. A equa¸ca˜o de Legendre associada (8.147) ´e considerada na maioria das aplica¸co˜es no intervalo [−1, 1], como j´a mencionamos. A mesma, em analogia com a equa¸ca˜o de Legendre, pode ser escrita como m2 y(x) = 0 , (9.55) ((1 − x2 )y 0 (x))0 + l(l + 1)y(x) − 1 − x2 onde aqui j´a nos restringimos ao caso l ∈ , m ∈ com −l ≤ m ≤ l. Como se vˆe, temos aqui p(x) = (1 − x2 ), mas podemos fazer as seguintes escolhas 

m2 , 1 − x2

1)

q(x) = −

2)

q(x) = l(l + 1),

r(x) = 1, r(x) =

1 , 1 − x2

µ = l(l + 1) , µ = −m2 .

Analisaremos essas duas op¸co˜es em separado. O caso 1 ´e o mais interessante, especialmente devido a sua aplica¸ca˜o para os harmˆonicos esf´ericos. O caso 2 n˜ao ´e de grande interesse e o leitor pode dispensar 15

Segundo o Houaiss, “livros-textos” ou “livros-texto” s˜ ao dois plurais gramaticalmente corretos para “livro-texto”, assim como “espa¸cos-tempos” e “espa¸cos-tempo” s˜ ao plurais aceit´ aveis para “espa¸co-tempo”.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

507/1304

sua leitura, se o desejar16 . Caso 1) A primeira quest˜ao que aqui se coloca ´e se a condi¸ca˜o (9.6) ´e satisfeita para fun¸co˜es P lm (x) e 0 Plm 0 (x) com l ≤ l , ou seja, se   1 0 0 m m m m = 0, (9.56) p(x) Pl (x) (Pl0 (x)) − Pl0 (x) (Pl (x)) −1

0

com l ≤ l . A maneira mais f´acil de discutir isso ´e escrever x = cos(θ) e, como d m d m 1 Pl0 (x) = − P 0 (cos θ), dx sen (θ) dθ l

e p(x) = sen (θ)2 , (9.56) fica   θ=π d d m m sen (θ) Plm (cos θ) Plm . (cos θ) − P (cos θ) P (cos θ) 0 l0 l θ=0 dθ dθ

(9.57)

d Agora, por (9.53), Plm (cos θ) ´e um polinˆomio trigonom´etrico, e assim o ´e tamb´em dθ Plm (cos θ). Logo, ambos s˜ao finitos em θ = 0 e θ = π. Como, por´em, sen θ anula-se nesses extremos, conclu´ımos que (9.57) ´e nula, confirmando a validade de (9.6) no caso em quest˜ao. Conclu´ımos assim, pelo Teorema 9.1, p´agina 487, que deve valer Z 1

−1

sempre que l 6= l0 .

Plm (x) Plm 0 (x) dx = 0

(9.58)

R1 Interessamo-nos agora pelo caso l 0 = l. Caso l = l0 = 0 vale P00 (x) = 1 e −1 (P00 )2 dx = 2. Para R1 calcular −1 (Plm (x))2 dx com l > 0 podemos proceder de diferentes maneiras, a mais direta sendo a seguinte. Usando (9.44) e as express˜oes (9.42) e (9.43) para Plm e Pl−m , respectivamente, escrevemos Z 1 Z 1 m m m (l + m)! Plm (x)Pl−m (x) dx Pl (x) Pl (x) dx = (−1) (l − m)! −1 −1 (−1)m (l + m)! 22l (l!)2 (l − m)!

= int. por partes

=

=

16

l−m

vezes

(−1)l (l + m)! 22l (l!)2 (l − m)! (2l)! (l + m)! 2l 2 (l!)2 (l − m)!

=

(2l)! (l + m)! 2l 2 (l!)2 (l − m)!

=

2 (l + m)! . 2l + 1 (l − m)!

Z Z Z

1 −1 1 −1

 

dl+m 2 (x − 1)l dxl+m



 dl−m 2 l (x − 1) dx dxl−m

 d2l 2 l (x − 1) (x2 − 1)l dx dx2l

1 −1



(1 − x2 )l dx

2 (2l)!! (2l + 1)!!



O caso 2 ´e um tanto patol´ ogico (pois a fun¸ca ˜o r(x) diverge em ±1 e n˜ ao ´e integr´ avel) e ´e evitado por quase todos os livros-texto.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

508/1304

Na terceira linha aplicamos integra¸ca˜o por partes l − m vezes. Isso ´e justificado pois, como facilmente dp 2 l ao proporcionais a (x2 − 1)l−p e, por se vˆe por indu¸ca˜o, derivadas como dx p (x − 1) , com 0 ≤ p < l s˜ (2l)! isso, os termos de fronteira se anulam. Na u ´ ltima passagem usamos o fato que (2l+1)!! = (2l)!! e o fato 2l+1 l que (2l)!! = 2 l!. Na pen´ ultima passagem usamos a identidade Z 1 (2l)!! (1 − x2 )l dx = 2 , (9.59) (2l + 1)!! −1 R1 a qual pode ser provada da seguinte forma. Seja Al := −1 (1 − x2 )l dx. Ent˜ao, para l > 0, Al :=

Z

1 2 l

−1

(1 − x ) dx =

Z

1 −1



dx dx



(1 − x2 )l dx

int. por partes

=

Z 1 1 x(1 − x ) +2l x2 (1 − x2 )l−1 dx = −2lAl + 2lAl−1 . −1 −1 | {z } 2 l

=0

Assim, Al =

2l A 2l+1 l−1

e como A0 = 2, segue (9.59).

Demonstramos, assim, as rela¸co˜es de ortogonalidade Z 1 2 (l + m)! δl, l0 , Plm (x) Plm 0 (x) dx = 2l + 1 (l − m)! −1

(9.60)

´ por vezes u ´ til expressar v´alidas para todo l, l0 ∈ e m, m0 ∈ com −l ≤ m ≤ l e −l0 ≤ m0 ≤ l0 . E essas rela¸co˜es com a mudan¸ca de vari´aveis x = cos θ: Z π 2 (l + m)! Plm (cos θ) Plm δl, l0 . (9.61) 0 (cos θ) sen θ dθ = 2l + 1 (l − m)! 0 

Essa forma das rela¸co˜es de ortogonalidade dos polinˆomios de Legendre associados ser´a particularmente relevante para os harmˆonicos esf´ericos, como veremos adiante. Caso 2) A primeira quest˜ao que aqui se coloca ´e se a condi¸ca˜o (9.6) ´e satisfeita para fun¸co˜es P lm (x) e 0 Plm (x), com |m| 6= |m0 | (lembre-se o leitor que µ = −m2 e, portanto µ 6= µ0 equivale a |m| 6= |m0 |), ou seja, se  1   0 0 0 m0 m m m = 0. (9.62) p(x) Pl (x) Pl (x) − Pl (x) (Pl (x)) 0

−1

sempre que |m| 6= |m |. A mesma an´alise feita para o caso 1 mostra que isso ´e verdadeiro, confirmando a validade de (9.6) no caso em quest˜ao. Conclu´ımos assim, pelo Teorema 9.1, p´agina 487, que deve valer Z 1 Z π 1 1 0 m m0 Pl (x) Pl (x) dθ = 0, (9.63) dx = 0, ou seja, Plm (cos θ) Plm (cos θ) 2 1−x sen (θ) −1 0

sempre que |m| 6= |m0 |. A express˜ao (9.53) ensina-nos que Plm (cos θ) ´e proporcional a ( sen θ)|m| . Logo, 0 como |m| 6= |m0 |, sempre haver´a no produto Plm (cos θ)Plm (cos θ) pelo menos um fator sen θ para

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

509/1304

compensar o sen1 θ , o que mostra que o integrando em (9.63) ´e limitado. O caso |m0 | = |m| ´e um tanto patol´ogico (a integral diverge se m = m0 = 0), dif´ıcil de demonstrar e sem conseq¨ uˆencias pr´aticas 17 relevantes, de modo que nos limitamos a apresentar o resultado final :  0, se |m0 | 6= |m|,         ∞, se m0 = m = 0,    Z 1  1 m m0 (9.64) Pl (x) Pl (x) dx = (−1)m  1 − x2 , se − m0 = m > 0, −1   m        1 (l + m)!   , se m0 = m > 0. m (l − m)! Note o leitor que a condi¸ca˜o m > 0 s´o pode ocorrer se l > 0.

Como j´a dissemos, as rela¸co˜es (9.64) s˜ao menos importantes na pr´atica que as de (9.60). Essas inspiram uma defini¸ca˜o importante: a dos harmˆonicos esf´ericos. • Os Harmˆ onicos Esf´ ericos No espa¸co n , n ≥ 2, o conjunto de pontos que distam de uma unidade da origem formam a assim chamada esfera unit´ aria18 , denotada por S n−1 : n o S n−1 := (x1 , . . . , xn ) ∈ n (x1 )2 + · · · + (xn )2 = 1 . 



O conjunto S 1 ´e o c´ırculo unit´ario e seus pontos podem ser descritos por um u ´ nico aˆngulo ϕ com −π ≤ ϕ ≤ π: n o  S 1 := cos ϕ, sen ϕ ∈ 2 , −π ≤ ϕ ≤ π . 

Como se vˆe, os pontos correspondentes a ϕ = ±π s˜ao identificados. O conjunto S 2 ´e a esfera unit´aria e seus pontos podem ser descritos por dois aˆngulos: ϕ e θ, com −π ≤ ϕ ≤ π e 0 ≤ θ ≤ π: n o  S 2 := sen (θ) cos(ϕ), sen (θ) sen ϕ, cos(θ) ∈ 3 , −π ≤ ϕ ≤ π, 0 ≤ θ ≤ π . 

Novamente, os pontos correspondentes a ϕ = ±π s˜ao identificados e para os pontos correspondentes a θ = 0 e θ = π o aˆngulo ϕ ´e indeterminado. Os chamados Harmˆ onicos Esf´ericos s˜ao as fun¸co˜es definidas por s 2l + 1 (l − m)! m Ylm (θ, ϕ) := (−1)m P (cos(θ)) eimϕ , 4π (l + m)! l

onde 0 ≤ θ ≤ π, −π ≤ ϕ ≤ π, l ∈

17 18



em∈

com −l ≤ m ≤ l. Note-se que r 2l + 1 Yl0 (θ, ϕ) = Pl (cos(θ)) , 4π

Para uma referˆencia mais detalhada, vide [90], pag. 74. H´ a aqui um abuso de linguagem, pois S n−1 ´e, estritamente falando, a superf´ıcie da esfera.

(9.65)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

510/1304

onde Pl s˜ao os polinˆomios de Legendre. Mais uma vez o leitor deve ser advertido da existˆencia de outras conven¸co˜es sobre a defini¸ca˜o dos harmˆonicos esf´ericos (alguns autores substituem o fator (−1)m por im ). Os harmˆonicos esf´ericos s˜ao solu¸ca˜o da equa¸ca˜o diferencial parcial   m2 ∂ 2 Y 1 ∂ ∂Y (θ, ϕ) − (θ, ϕ) + l(l + 1)Y (θ, ϕ) = 0 , ( sen θ) sen θ ∂θ ∂θ ( sen θ)2 ∂ϕ2 que ´e encontrada quando da resolu¸ca˜o da equa¸ca˜o de Helmholtz ou de Laplace em trˆes dimens˜oes em coordenadas esf´ericas, assim como no problema do a´tomo de hidrogˆenio na Mecˆanica Quˆantica ou qualquer outro problema quˆantico em trˆes dimens˜oes no qual o potencial seja esfericamente sim´etrico. Vide equa¸ca˜o (10.10) e seguintes. ´ um exerc´ıcio relevante verificar que, devido a` rela¸ca˜o (9.44), tem-se, com a defini¸ca˜o acima, E Yl−m (θ, ϕ) = (−1)m Ylm (θ, ϕ) . No c´ırculo unit´ario S 1 valem as bem-conhecidas rela¸co˜es de ortogonalidade Z π Z em0 em dl = em0 (ϕ) em (ϕ) dϕ = δm, m0 S1

onde, para m ∈

(9.66)

(9.67)

−π

,

1 em (ϕ) := √ eimϕ , −π ≤ ϕ ≤ π, 2π dl = dϕ sendo a medida de comprimento do c´ırculo unit´ario S 1 . Usando as rela¸co˜es de ortogonalidade (9.67) e as rela¸co˜es de ortogonalidade (9.61), ´e f´acil constatar que Z Z πZ π 0 m m m0 Yl0 Yl dΩ = Ylm (9.68) 0 (θ, ϕ) Yl (θ, ϕ) sen (θ) dθ dϕ = δm, m0 δl, l0 S2

−π

0

para todos l, l0 ∈ e todos m, m0 ∈ com −l0 ≤ m0 ≤ l0 e −l ≤ m ≤ l, onde dΩ = sen (θ) dθ dϕ ´e a medida de a´rea na esfera unit´aria S 2 em coordenada polares. Essas s˜ao as rela¸co ˜es de ortogonalidade dos harmˆ onicos esf´ericos, as quais desempenham um relevante papel na resolu¸ca˜o de problemas envolvendo certas equa¸co˜es diferenciais parciais em trˆes dimens˜oes que tenham simetria esf´erica. Os harmˆonicos esf´ericos surgem na importante solu¸ca˜o de um problema fundamental da Mecˆanica Quˆantica, o problema do a´tomo de hidrogˆenio. As formas dos orbitais eletrˆonicos, de importˆancia fundamental no estudo de a´tomos e mol´eculas e suas liga¸co˜es qu´ımicas, est˜ao intimamente relacionadas a`s fun¸co˜es Y lm (θ, ϕ) e aos polinˆomios de Laguerre associados. 

Como se percebe da compara¸ca˜o de (9.67) com (9.68), os harmˆonicos esf´ericos desempenham na esfera unit´aria S 2 o mesmo papel que as fun¸co˜es em desempenham no c´ırculo S 1 : formam um conjunto ortonormal em rela¸ca˜o a` medida de a´rea dΩ = sen (θ) dθ dϕ. Assim como as fun¸co˜es e m formam um conjunto ortonormal completo para as fun¸co˜es definidas em S 1 , o que nos permite expressar fun¸co˜es f (ϕ), peri´odicas de per´ıodo 2π, cont´ınuas por partes ou apenas de quadrado integr´avel, em termos de uma s´erie de Fourier: Z π ∞ X f (ϕ) = cm em (ϕ) com cm := em (ϕ) f (ϕ) dϕ , m=−∞

−π

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

511/1304

os harmˆonicos esf´ericos tamb´em formam um conjunto ortonormal completo para as fun¸co˜es definidas em S 2 . Assim, em um sentido a ser precisado, todas as fun¸co˜es f (θ, ϕ) definidas em S 2 , e que sejam cont´ınuas por partes ou apenas de quadrado integr´avel, podem ser escritas em termos de uma s´erie envolvendo harmˆonicos esf´ericos. Essa s´erie ´e dada por f (θ, ϕ) =

∞ X l X

m

cl, m Yl (θ, ϕ),

com

cl, m :=

l=0 m=−l

Z

π −π

Z

π 0

Ylm (θ, ϕ) f (θ, ϕ) sen (θ) dθ dϕ ,

e ´e uma esp´ecie de generaliza¸ca˜o para a esfera S 2 da s´erie de Fourier. Essas considera¸co˜es justificam a denomina¸ca˜o de “harmˆonicos esf´ericos” para as fun¸co˜es Ylm . Os harmˆonicos esf´ericos tamb´em desempenham um papel na teoria de representa¸co˜es do grupo SO(3). H´a tamb´em generaliza¸co˜es dos harmˆonicos esf´ericos para as esferas S n com n ≥ 3. Essas generaliza¸co˜es s˜ao estudadas, por exemplo, em [66].

9.2.3

Propriedades dos Polinˆ omios de Hermite

• Rela¸ co ˜es de ortogonalidade para os polinˆ omios de Hermite

 0 2 2 A equa¸ca˜o de Hermite e−x y 0 (x) + λe−x y(x) = 0 ´e tipicamente considerada no intervalo J = 2

2

(−∞, ∞). Aqui p(x) = e−x , q(x) = 0, r(x) = e−x e µ = λ. Note que p(x) > 0 e r(x) > 0 em todo J = (−∞, ∞). Os polinˆomios de Hermite Hm (x) foram definidos em (8.20) por Hm (x) :=

bm/2c

X k=0

(−1)k m! (2x)m−2k . k! (m − 2k)!

(9.69)

onde bm/2c ´e o maior inteiro menor ou igual a m/2, e s˜ao solu¸co˜es da equa¸ca˜o de Hermite com µ = 2m.

Como p(x) decai a zero para x → ±∞ e os Hm (x) s˜ao polinˆomios, vale para os polinˆomios de Hermite a rela¸ca˜o (9.6) e conclu´ımos pelo Teorema 9.1 que Z ∞ 2 Hn (x)Hm (x) e−x dx = 0 (9.70) −∞

para todo n 6= m, com m, n = 0, 1, 2, 3, . . .. Para calcular as integrais acima no caso n = m, podemos elegantemente usar as rela¸co˜es Hn+1 (x) = 2xHn (x) − 2nHn−1 (x) ,

(9.71)

JCABarata. Curso de F´ısica-Matem´ atica

as quais ser˜ao provadas mais abaixo (express˜ao (9.78)). Seja An := 2nAn−1

= (9.71)

=

= (9.71)

=

=

Z

Z Z

Z



2

(2nHn−1 (x)) Hn−1 (x) e−x dx

−∞ ∞

(2xHn (x)) Hn−1 (x) e

−x2

−∞



2

dx −

Hn (x) (2xHn−1 (x)) e−x dx

Z

Hn (x) Hn (x) e

−x2

−∞

R∞



−∞

512/1304

2

(Hn (x))2 e−x dx. Tem-se que

2

Hn+1 (x) Hn−1 (x) e−x dx {z } | −∞ = 0 por (9.70)

−∞ ∞

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

dx + (2n − 2)

An .

Z



2

Hn (x) Hn−2 (x) e−x dx {z } | −∞ = 0 por (9.70)

R∞ √ 2 Logo, An = (2n)An−1 , ou seja, An = (2n)!! A0 = 2n n! A0 . Como A0 = −∞ e−x dx = π, conclu´ımos que Z ∞ √ 2 (9.72) Hn (x)Hm (x) e−x dx = 2n n! π δn, m , −∞

para todo m, n ≥ 0. Estas s˜ao as rela¸co ˜es de ortogonalidade dos polinˆ omios de Hermite. • A fun¸ c˜ ao geratriz exponencial dos polinˆ omios de Hermite

Vamos aqui considerar a fun¸ca˜o geratriz exponencial dos polinˆomios de Hermite e provar que ∞ X Hn (x) n=0

n!

2

tn = e2xt−t .

(9.73)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

513/1304

Usando-se diretamente (9.69) e separando-se na soma n’s pares de n’s ´ımpares, segue que ∞ ∞ ∞ X X H2m (x) 2m X H2m+1 (x) 2m+1 Hn (x) n t = t + t n! (2m)! (2m + 1)! m=0 m=0 n=0 =

∞ X m X (−1)k (2x)2m−2k t2m

k! (2m − 2k)!

m=0 k=0

=

m→m+k

=

m=0 k=0

k! (2m + 1 − 2k)!

∞ X ∞ ∞ ∞ X (−1)k (2x)2m t2m+2k X X (−1)k (2x)2m+1 t2m+1+2k + k! (2m)! k! (2m + 1)! k=0 m=0 k=0 m=0 ∞ X (−1)k t2k

k!

k=0

e

!

∞ X (2xt)n

−t2

n=0

=

+

∞ ∞ ∞ X ∞ X (−1)k (2x)2m−2k t2m X X (−1)k (2x)2m+1−2k t2m+1 + k! (2m − 2k)! k! (2m + 1 − 2k)! k=0 m=k k=0 m=k

=

=

∞ X m X (−1)k (2x)2m+1−2k t2m+1

n!

!

∞ X (2xt)2m (2m)! m=0

!

+

∞ X (−1)k t2k k=0

k!

!

∞ X (2xt)2m+1 (2m + 1)! m=0

!

2

e2xt−t ,

como quer´ıamos provar. • F´ ormula de Rodrigues para os polinˆ omios de Hermite Pelas nossas considera¸co˜es gerais sobre as f´ormulas de Rodrigues, podemos presumir que os polinˆomios Hm , por serem ortogonais entre si (vide (9.70)), possam ser expressos na forma (9.17) com 2 r(x) = e−x , ou seja, n 2 d 2 Hn (x) = Kn ex e−x , n dx onde Km s˜ao constantes que dependem da normaliza¸ca˜o adotada. De fato, essa pressuposi¸ca˜o ´e correta 2 pois, multiplicando (9.73) por e−x , obtem-se e

−(x−t)2

2 ∞ X Hm (x)e−x m t . = m! m=0

(9.74)

Encarando o lado direito como a expans˜ao em s´erie de Taylor em t, em torno de t = 0, da fun¸ca˜o do lado esquerdo, conclu´ımos que n d 2 2 −(x−t) , e Hn (x)e−x = dtn t=0 para todo n ≥ 0. Com a mudan¸ca de vari´avel u = x − t, n n d −x2 −u2 = (−1) Hn (x)e e dun

d dt

u=x

d = − du , ficamos com

= (−1)n

dn −x2 . e dxn

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

514/1304

Assim,

dn −x2 e , dxn para todo n ≥ 0. Essa ´e a f´ ormula de Rodrigues dos polinˆ omios de Hermite. Hn (x) = (−1)n ex

2

(9.75)

• Rela¸ co ˜es de recorrˆ encia para os polinˆ omios de Hermite Tomando-se a derivada em x de (9.75), ´e elementar constatar que Hn0 (x) = 2xHn (x) − Hn+1 (x) .

(9.76)

Ao mesmo tempo, Hn+1 (x)

dn+1 −x2 e dxn+1   n d −x2 x2 d e e dxn dx

=

(−1)n+1 ex

=

(−1)n+1

Leibniz

=

dn  −x2  xe dxn    n−p n    p X d n d n x2 −x2 2(−1) e x e p dxp dxn−p p=0 2(−1)n ex

=

2

n

2

x2



 dn−1  −x2  dn  −x2  + n n−1 e x n e dx dx

=

2(−1) e

=

2xHn (x) − 2nHn−1 (x) .

Assim, Hn+1 (x) = 2xHn (x)−2nHn−1 (x). Note que, como H0 (x) = 1 e H1 (x) = 2x, essa identidade vale tamb´em para n = 0, convencionando que H−1 (0) ≡ 0. Reunindo isso com (9.76), somos conduzidos a Hn0 (x) = 2nHn−1 (x), n ≥ 0. Resumindo, obtemos as seguintes rela¸co˜es: Hn0 (x) = 2xHn (x) − Hn+1 (x) ,

(9.77)

Hn+1 (x) = 2xHn (x) − 2nHn−1 (x) ,

(9.78)

Hn0 (x) = 2nHn−1 (x) ,

(9.79)

v´alidas para todo n ≥ 0 com a conven¸ca˜o H−1 (0) ≡ 0. Estas express˜oes s˜ao bastante u ´ teis. A rela¸ca˜o (9.78), por exemplo, permite obter recursivamente todos os Hn ’s a partir de H0 (x) = 1 e H1 (x) = 2x. * Em livros de Mecˆanica Quˆantica o estudante poder´a aprender que algumas das propriedades dos polinˆomios de Hermite que obtivemos acima podem ser provadas com o uso dos chamados operadores de cria¸ca˜o e aniquila¸ca˜o.

JCABarata. Curso de F´ısica-Matem´ atica

9.2.4

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

515/1304

Propriedades dos Polinˆ omios de Laguerre

• Rela¸ co ˜es de ortogonalidade para os polinˆ omios de Laguerre 0

A equa¸ca˜o de Laguerre (xe−x y 0 (x)) + λe−x y(x) = 0 ´e tipicamente considerada no intervalo J = [0, ∞). Para ela tem-se p(x) = xe−x , q(x) = 0, r(x) = e−x e µ = λ. Note que p(x) > 0 em J 0 = (0, ∞), e anula-se em x = 0 e no infinito. Al´em disso, r(x) > 0 em todo J = [0, ∞). Os polinˆomios de Laguerre foram definidos em (8.133) por   m X m n m! Lm (x) := (−1) xn (9.80) n! n n=0 ´ bastante claro que para e representam solu¸co˜es da equa¸ca˜o de Laguerre em J = [0, ∞) para µ = m. E os polinˆomios de Laguerre vale a condi¸ca˜o (9.6) e, portanto, pelo Teorema 9.1, segue que Z ∞ Ln (x)Lm (x) e−x dx = 0 (9.81) 0

para todo n 6= m, com m, n = 0, 1, 2, 3, . . .. Notemos tamb´em aqui que (9.81) implica Z ∞ xk Lm (x) e−x dx = 0

(9.82)

0

para todo k < m, pois os monˆomios xk podem ser escritos como combina¸co˜es lineares dos polinˆomios Ln ’s com n < m. Para calcular as integrais de (9.81) no caso m = n podemos fazer uso da identidade L0n+1 (x) = (n + 1)L0n (x) − (n + 1)Ln (x) , que ser´a demonstrada mais abaixo (express˜ao (9.87)). Com ela, vˆe-se que Z ∞ Z ∞   2 −x (n + 1) Ln (x) e dx = Ln (x) (n + 1)Ln (x) e−x dx 0

(9.83)

0

(9.83)

=

int. por partes

=

=

(n + 1)

Z



Ln (x)L0n (x)

e

−x

dx − }

Z



Ln (x)L0n+1 (x) e−x dx

0 {z = 0 por (9.82) ∞ Z ∞ −x −Ln (x)Ln+1 (x)e + L0n (x)Ln+1 (x) e−x dx 0 {z } |0 = 0 por (9.82) Z ∞ − Ln (x)Ln+1 (x) e−x dx {z } |0 = 0 por (9.81)

|0

Ln (0)Ln+1 (0)

(9.80)

=

(n + 1)(n!)2 .

JCABarata. Curso de F´ısica-Matem´ atica

Conclu´ımos assim que

Z



Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

516/1304

Ln (x)Lm (x) e−x dx = (n!)2 δn, m

(9.84)

0

para todos n, m ≥ 0. Estas s˜ao as rela¸co ˜es de ortogonalidade para os polinˆ omios de Laguerre. • F´ ormula de Rodrigues para os polinˆ omios de Laguerre Pela ortogonalidade dos polinˆomios de Laguerre (9.81), podemos presumir, sob a luz das considera¸co˜es da Se¸ca˜o 9.1.3, p´agina 488, que os polinˆomios de Laguerre satisfazem, por (9.15), uma rela¸ca˜o como   m  1 dm  m x d m −x r(x) x = K e x e , (9.85) Lm (x) := Km m r(x) dxm dxm

onde Km ´e uma constante dependente da normaliza¸ca˜o adotada. De fato, pela regra de Leibniz,   p  m    m−p  m  X d m d −x x m −x m x d = e x e x e e p dxm dxm−p dxp p=0   m X m! p p m x = (−1) p! p p=0

(9.80)

=

Lm (x) .

Assim, Km = 1 e conclu´ımos que Lm (x) = ex

dm  m −x  x e , dxm

(9.86)

para todo m ≥ 0. Esta ´e a f´ ormula de Rodrigues para os polinˆ omios de Laguerre. • Rela¸ co ˜es de recorrˆ encia para os polinˆ omios de Laguerre Por (9.86), ´e elementar constatar que L0m+1 (x)

m+1 d  m+1 −x  dm+1  m+1 −x  x d x e + e x e dxm+1 dxm+1 dx

=

ex

=

Lm+1 (x) + (m + 1)ex

(9.86)

=

= =

 m+1  dm+1  m −x  x d m+1 −x x e − e x e dxm+1 dxm+1

dm+1  m −x  x e dxm+1   x d −x (m + 1)e e Lm (x) dx

(m + 1)ex

=

(m + 1)ex

d dm  m −x  x e dx dxm

−(m + 1)Lm (x) + (m + 1)L0m (x) .

Estabelecemos assim que L0m+1 (x) = (m + 1)L0m (x) − (m + 1)Lm (x) ,

(9.87)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

517/1304

m ≥ 0. Essa ´e uma das f´ormulas de recorrˆencia para os polinˆomios de Laguerre, a qual empregamos acima para provar as rela¸co˜es de ortogonalidade (9.84) no caso m = n. H´a uma segunda, da qual trataremos agora. Pela f´ormula de Rodrigues vale   dm  dm  (9.86) Lm (x) = ex m xm e−x = ex m x xm−1 e−x dx dx m    p  X  m d dm−p Leibniz x m−1 −x = e x x e p dxp dxm−p p=0 =

m−1   dm m−1 −x x d m−1 −x e x m x e + me x e dx dxm−1 x

 d −x e Lm−1 (x) + mLm−1 (x) dx

=

ex x

=

−xLm−1 (x) + xL0m−1 (x) + mLm−1 (x) .

Estabelecemos que Lm (x) = −xLm−1 (x) + xL0m−1 (x) + mLm−1 (x)

(9.88)

Lm+1 (x) = −xLm (x) + xL0m (x) + (m + 1)Lm (x) .

(9.89)

o que tamb´em implica (fazendo m → m + 1)

Multiplicando ambos os lados de (9.88) por −m e somando o resultado a (9.89), teremos: Lm+1 (x) − mLm (x) = −xLm (x) + xL0m (x) + (m + 1)Lm (x) + mxLm−1 (x) − mxL0m−1 (x) − m2 Lm−1 (x) . (9.90) (9.87)

Por (9.87), os termos xL0m (x) − mxL0m−1 (x) valem x(L0m (x) − mL0m−1 (x)) = −mxLm−1 (x). Introduzindo isso de volta a (9.90), inferimos que Lm+1 (x) = (2m − x + 1)Lm (x) − m2 Lm−1 (x) . Resumindo nossas conclus˜oes, estabelecemos as seguintes rela¸co˜es: L0m+1 (x) = (m + 1)L0m (x) − (m + 1)Lm (x) ,

(9.91)

Lm+1 (x) = (2m − x + 1)Lm (x) − m2 Lm−1 (x) .

(9.92)

Essas rela¸co˜es s˜ao denominadas f´ ormulas de recorrˆencia para os polinˆ omios de Laguerre. A rela¸ca˜o (9.92), em particular, permite obter recursivamente todos os Lm (x)’s a partir de L0 (x) = 1 e L1 (x) = 1 − x. • A fun¸ c˜ ao geratriz exponencial dos polinˆ omios de Laguerre Partindo de (9.80) obtemos para a fun¸ca˜o geratriz exponencial dos polinˆomios de Laguerre ∞ X Lm (x) m L(x, t) := t m! m=0

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

518/1304

o seguinte desenvolvimento19 : ∞ X m X

1 L(x, t) = (−1) n! m=0 n=0 n

∞ ∞ X X

1 = (−1) n! n=0 m=n n

∞ X

xn (−1)n = n! n=0

  m xn t m n   m xn t m n

∞   X m

m=n

tm

n

!

.

(9.93)

Agora, ∞   X m

m=n

n

t

m

m→m+n

=

=

= Leibniz

=

=

=

∞ tn X (m + n)! m t n! m=0 m! ∞ tn X dn m+n t n! m=0 dtn

tn d n n! dtn



tn 1−t

=

tn d n n! dtn

tn

∞ X

tm

m=0



!

  n−p  n    p d n tn X n d −1 t (1 − t) n! p=0 p dtp dtn−p

  n    (n − p)! tn X n n! n−p t n! p=0 p (n − p)! (1 − t)n−p+1 n−p n    tn X n t 1 − t p=0 p 1−t

=

tn 1−t



t 1+ 1−t

n

=

tn . (1 − t)n+1

Retornando com isso a (9.93), temos  n ∞ 1 X (−1)n xt L(x, t) = , 1 − t n=0 n! 1−t e assim conclu´ımos que

 xt exp − 1−t L(x, t) = . 1−t Essa ´e a fun¸ca ˜o geratriz exponencial dos polinˆ omios de Laguerre. 19



Assumimos |t| e |x| pequenos o suficiente para justificar as diversas manipula¸co ˜es que faremos.

(9.94)

JCABarata. Curso de F´ısica-Matem´ atica

9.2.5

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

519/1304

Propriedades dos Polinˆ omios de Laguerre Associados

A equa¸ca˜o de Laguerre associada xy 00 + (m + 1 − x)y 0 + (n − m)y = 0 ,

(9.95)

com m e n inteiros com 0 ≤ m ≤ n, ´e tipicamente considerada no intervalo J = [0, ∞). A mesma pode ser ser levada a` forma canˆonica (9.1), transformando-se em (xm+1 e−x y 0 (x))0 + (n − m)xm e−x y(x) = 0 . Tem-se, portanto, p(x) = xm+1 e−x , q(x) = 0, r(x) = xm e−x e µ = n − m. Uma alternativa talvez melhor ´e tomar-se p(x) = xm+1 e−x , q(x) = −mxm e−x , r(x) = xm e−x e µ = n. Note-se que p(x) e r(x) s˜ao os mesmos em ambas as escolhas. Os polinˆomios de Laguerre associados foram definidos em (8.156) e express˜oes seguintes por 20 Ln(m) (x)

dm dm L (x) = = n dxm dxm (m)

com 0 ≤ m ≤ n. O polinˆomio Ln



dn n −x e (x e ) dxn x



 n (−1) xk , = (−1) k! m + k k=0 m

n−m X

k n!



(9.96)

´e a u ´ nica solu¸ca˜o de (9.95) que ´e regular em x = 0.

E. 9.12 Exerc´ıcio. Mostre que Ln(m) (x) =

 (−1)m n! x −m dn−m n −x e x x e . (n − m)! dxn−m

6

´ bastante elementar constatar que, com m fixo, as fun¸co˜es Ln(m) com n ≥ m satisfazem (9.6) para E o intervalo J = [0, ∞). Assim, vale que Z ∞ (m) Ln(m) (x) Ln0 (x) xm e−x dx = 0 (9.97) 0

sempre que n 6= n0 . Para calcular a integral acima no caso n0 = n fazemos uso da rela¸ca˜o (9.104), que ser´a demonstrada logo adiante. Tomando (9.104), substituindo n → n − 1 e multiplicando-a por (m) n−1 Ln (x), obtemos (n − m)  (m) 2 (m) (m) = (2n − m − x − 1)Ln−1 (x)Ln(m) (x) − (n − 1)2 Ln−2 (x)Ln(m) (x) . Ln (x) n (m)

Tomando (9.104) e multiplicando-a por (n + 1)−1 Ln−1 (x), obtemos

 2 (n + 1 − m) (m) (m) (m) (m) Ln+1 (x)Ln−1 (x) = (2n − m − x + 1)Ln(m) (x)Ln−1 (x) − n2 Ln−1 (x) . n+1

20 Mais uma vez advertimos o leitor do fato de haver v´ arias conven¸co ˜es distintas quanto a ` defini¸ca ˜o dos polinˆ omios de Laguerre associados na literatura. Para compara¸ca ˜o, polinˆ omios de Laguerre associados definidos em [83], que denotamos (m) (−1)m (m) m aqui por L Lm n (x), diferem dos nossos Ln (x) da seguinte forma: L Ln (x) = (n+m)! Ln+m (x).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

520/1304

Subtraindo uma express˜ao da outra, obtemos (n − m)  (m) 2 (n + 1 − m) (m) (m) Ln+1 (x)Ln−1 (x) Ln (x) − n n+1 =

(m) −2Ln−1 (x)Ln(m) (x)

− (n − 1)

2

(m) Ln−2 (x)Ln(m) (x)

+n

2



(m) Ln−1 (x)

2

.

Multiplicando agora esta express˜ao por xm e−x , integrando entre 0 e ∞ e usando (9.97), ficamos com Z ∞ Z ∞ 2 2 n3 (m) m −x (m) Ln (x) x e dx = Ln−1 (x) xm e−x dx . (n − m) 0 0 A indu¸ca˜o pode ser feita diminuindo n at´e atingir o valor m, de onde extra´ımos que Z ∞ Z ∞ 2 2 (n!)3 (m) (m) m −x L (x) Ln (x) x e dx = xm e−x dx . m 3 (n − m)! (m!) 0 0 R∞ (m) Pela u ´ ltima igualdade em (9.96), tem-se Lm (x) = (−1)m m!. Ao mesmo tempo, 0 xm e−x dx = m!. Assim, Z ∞ 2 (n!)3 . Ln(m) (x) xm e−x dx = (n − m)! 0

Essa express˜ao pressup˜oe, naturalmente, 0 ≤ m ≤ n.

Conclu´ımos assim que com nossas defini¸co˜es Z ∞ (m) Ln(m) (x) Ln0 (x) xm e−x dx 0

=

(n!)3 δn, n0 . (n − m)!

(9.98)

Essas s˜ao as rela¸co˜es de ortogonalidade dos polinˆomios de Laguerre associados. Coment´ ario para o leitor mais avan¸cado. Ao contr´ario da lenda, as rela¸co˜es de ortogonalidade (9.98) n˜ ao s˜ao as rela¸co˜es de ortogonalidade da parte radial das auto-fun¸co˜es de energia do a´tomo de hidrogˆenio. Os polinˆomios de Laguerre associados possuem um outro tipo de rela¸ca˜o de ortogonalidade, a saber,     Z ∞ “ 0” ρ ρ 2 p2l+4 ((p + l)!)3 − ρ2 p+p (2l+1) (2l+1) 2l+2 0 pp 0 Lp0 +l L e ρ dρ = δ . (9.99) p, p p+l p0 p (p − l − 1)! 0

v´alida para todo p, p0 inteiros positivos (n˜ao-nulos), as quais discutiremos na Se¸ca˜o 10.5, p´agina 568. Lamentavelmente, poucos livros-texto de Mecˆanica Quˆantica discutem esse ponto quando tratam do a´tomo de hidrogˆenio. Uma exce¸ca˜o, um tanto surpreendentemente, ´e [4]. • Uma conseq¨ uˆ encia de (9.98) empregada no estudo do ´ atomo de hidrogˆ enio As rela¸co˜es (9.98) implicam um resultado que ´e usado no contexto do a´tomo de hidrogˆenio. Trata-se do seguinte: no caso n = n0 (9.98) diz-nos que Z ∞ 2 m −x (n!)3 (m) . Ln (x) x e dx = (n − m)! 0

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

521/1304

No problema do a´tomo de hidrogˆenio surge a necessidade de se determinar a integral Z ∞ 2 m+1 −x x e dx Ln(m) (x)

(9.100)

Vers˜ ao de 29 de setembro de 2005.

0

que difere da anterior pois o fator xm ´e substitu´ıdo por xm+1 . Essa u ´ ltima integral pode ser calculada empregando-se a rela¸ca˜o xLn(m) (x) = −

(n + 1 − m) (m) (m) Ln+1 (x) + (2n − m + 1)Ln(m) (x) − n2 Ln−1 (x) , n+1

que ser´a provada logo abaixo (express˜ao (9.104)). Inserindo-a em (9.100) e usando as rela¸co˜es de ortogonalidade (9.98), obtem-se facilmente Z ∞ 2 m+1 −x (n!)3 Ln(m) (x) x e dx = (2n − m + 1) . (9.101) (n − m)! 0 Essa express˜ao ser´a usada quando da normaliza¸ca˜o das auto-fun¸co˜es de energia do a´tomo de hidrogˆenio. • Rela¸ co ˜es de recorrˆ encia para os polinˆ omios de Laguerre associados (m)

Se explorarmos a primeira igualdade em (9.96), que define os polinˆomios Ln , algumas f´ormulas de recorrˆencia para os polinˆomios de Laguerre associados podem ser obtidas diretamente daquelas dos polinˆomios de Laguerre listadas em (9.91)-(9.92) simplesmente diferenciando-as m vezes em rela¸ca˜o a x. Como facilmente se constata, obtem-se (m+1)

Ln+1 (x) = (n + 1)Ln(m+1) (x) − (n + 1)Ln(m) (x) , (m)

(9.102) (m)

Ln+1 (x) = (2n − x + 1)Ln(m) (x) − mL(m−1) (x) − n2 Ln−1 (x) , n (m) 0

onde, em (9.102), usamos o fato evidente que Ll

(m+1)

(x) = Ll

(m−1)

Tomando (9.102) e trocando m → m − 1, obtem-se Ln isso em (9.103), obtem-se

(9.103)

(x). (m)

(m)

1 Ln+1 (x) + Ln (x). Inserindo (x) = − (n+1)

(m)

(m)

(n + 1 − m)Ln+1 (x) = (n + 1)(2n − m − x + 1)Ln(m) (x) − n2 (n + 1)Ln−1 (x) .

(9.104)

Essas rela¸co˜es s˜ao denominadas f´ ormulas de recorrˆencia para os polinˆ omios de Laguerre associados. • A fun¸ c˜ ao geratriz exponencial dos polinˆ omios de Laguerre associados A partir da defini¸ca˜o (9.96) e de (9.94) ´e elementar constatar que a fun¸ca˜o geratriz exponencial dos polinˆomios de Laguerre associados ´e dada por   ∞ (m) X Ll (x) l (−1)m tm xt t = Las. (x, t) := exp − . (9.105) m+1 l! (1 − t) 1 − t l=m A soma acima come¸ca com l = m pois

dm L (x) dxm l

= 0 caso m > l.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

522/1304

• A equa¸ c˜ ao de Laguerre generalizada A assim denominada equa¸ca ˜o de Laguerre generalizada ´e a equa¸ca˜o diferencial zy 00 (z) + (α + 1 − z)y 0 (z) + ny(z) . com n ∈ e α > −1, real. Trata-se de uma variante da equa¸ca˜o de Laguerre associada, pois α aqui n˜ao ´e necessariamente um inteiro. 

E. 9.13 Exerc´ıcio. Mostre que essa equa¸c˜ao tem uma solu¸c˜ao da forma de um polinˆomio Lαn (z)

  n Γ(n + α + 1) k z . := (−1) k Γ(k + α + 1) k=0 n X

k

6 E. 9.14 Exerc´ıcio. Mostre que Lαn (x) = ex x−α x > 0.

dn  n+α −x  , x e dxn

6

E. 9.15 Exerc´ıcio. Mostre que Z

∞ 0

Lαn (x)Lαm (x) xα e−x dx = 0

se m 6= n. Calcule a integral no caso m = n.

6

E. 9.16 Exerc´ıcio. Para α = m, inteiro, mostre que Lαn (x) = (−1)m

(n − m)! (m) Ln (x) . n! 6

9.2.6

Propriedades das Fun¸ co ˜es de Bessel

Na presente se¸ca˜o apresentaremos algumas das propriedades mais importantes e mais empregadas das fun¸co˜es de Bessel, especialmente as de ordem inteira. Devido a` sua importˆancia em um sem-n´ umero de problemas aplicados, as fun¸co˜es de Bessel e de Neumann tˆem sido intensamente estudadas nos u ´ ltimos duzentos anos e foi coletado um enorme conjunto de informa¸co˜es sobre as mesmas, gerando uma vasta literatura. Por isso, nossas pretens˜oes aqui s˜ao relativamente modestas. Um texto cl´assico sobre o assunto ´e [131]. Outros excelentes s˜ao [136], [66] e [83], mas todas as referˆencias listadas a` p´agina 395 tratam do assunto com maior ou menor grau de profundidade.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

523/1304

No estudo das propriedades das fun¸co˜es de Bessel Jν (x) procederemos de um modo ligeiramente diferente do que fizemos acima. Isso se d´a por v´arias raz˜oes. Uma delas ´e que as fun¸co˜es de Bessel n˜ao s˜ao polinˆomios, ao contr´ario dos casos de acima. Outra ´e a natureza das rela¸co˜es de ortogonalidade dessas fun¸co˜es. • Origens As fun¸co˜es de Bessel surgem em v´arios problemas da F´ısica-Matem´atica, especialmente envolvendo a resolu¸ca˜o de certas equa¸co˜es diferenciais em coordenadas cil´ındricas. O mais c´elebre desses problemas ´e aquele que estuda as vibra¸co˜es de uma membrana circular (um tambor), problema encontrado em v´arios livros-texto e que estudamos na Se¸ca˜o 10.3, p´agina 564. Esse problema foi tratado pela primeira vez por Euler21 em 1764, antecedendo a Bessel. Em verdade, certas fun¸co˜es de Bessel surgiram antes ainda, em 1703, na resolu¸ca˜o da chamada equa¸ca˜o de Riccati22 por Jacob Bernoulli23 (vide nota hist´orica a` p´agina 289) e em 1732, em trabalhos de Daniel Bernoulli24 sobre o problema da corda vibrante e suas variantes (vide problema da corda pendurada na Se¸ca˜o 10.2.2, p´agina 556). O trabalho do astrˆonomo Bessel25 no qual as fun¸co˜es que levam seu nome foram (re)encontradas ´e bem posterior e data de 1817, tendo sido publicado em 182426 . O problema que conduziu Bessel n˜ao foi o de resolver uma equa¸ca˜o diferencial, mas o de determinar coeficientes de Fourier que descrevem a trajet´oria de um planeta em movimento peri´odico em uma o´rbita el´ıptica em torno do Sol e obedecendo a segunda lei de Kepler27 , segundo a qual o raio-vetor que conecta o Sol ao planeta em quest˜ao varre a´reas iguais em tempos iguais28 . Bessel obteve para esses coeficientes uma express˜ao integral que ´e a representa¸ca˜o integral das fun¸co˜es de Bessel que apresentamos em (9.131), mais abaixo. Posteriormente, identificou-se que esses coeficientes representavam as fun¸co˜es previamente tratadas por Daniel Bernoulli e Euler, mas as mesmas acabaram sendo nomeadas em honra a Bessel (segundo [64], o nome de Bessel foi atribuido a` equa¸ca˜o diferencial por Schl¨omilch 29 em 1857 e Lipschitz30 em 1859). Em seu trabalho, na verdade, Bessel estendeu resultados anteriores de Lagrange31 , de 1769, o qual tamb´em dedicou-se a` quest˜ao de determinar os coeficientes de Fourier que expressam como fun¸ca˜o do tempo a distˆancia ao Sol de um planeta em o´rbita el´ıptica, calculando os trˆes primeiros32 . A determina¸ca˜o desses coeficientes de Fourier n˜ao ´e um mero exerc´ıcio acadˆemico, pois ´e importante para c´alculos, via teoria de perturba¸co˜es, da influˆencia gravitacional que os planetas exercem entre si e da conseq¨ uente previs˜ao de desvios das suas o´rbitas el´ıpticas. O estudo matem´atico de perturba¸co˜es 21

Leonhard Euler (1707-1783). Iacopo Francesco Riccati (1676-1754). 23 Jacob Bernoulli (1654-1705). 24 Daniel Bernoulli (1700-1782). 25 Friedrich Wilhelm Bessel (1784-1846). 26 F. W. Bessel, “Untersuchungen des Theils der planetarischen St¨ orungen, welcher aus der Bewegung der Sonne entsteht”. Berliner Abhandlungen, 1-52 (1824). 27 Johannes Kepler (1571-1630). 28 Como todo estudante de F´ısica bem sabe, isso ´e conseq¨ uˆencia da conserva¸ca ˜o do momento angular sob uma for¸ca central. 29 Oscar Xavier Schl¨ omilch (1823-1901). 30 Rudolf Otto Sigismund Lipschitz (1832-1903). 31 Joseph-Louis Lagrange (1736-1813). 32 Outras informa¸co ˜es hist´ oricas sobre o desenvolvimento das fun¸co ˜es de Bessel podem ser encontradas em [131]. 22

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

524/1304

peri´odicas ou quase-peri´odicas em sistemas mecˆanicos (ou em equa¸co˜es diferenciais, em geral) ´e um vasto assunto de pesquisa que tem desafiado in´ umeros pesquisadores at´e a atualidade. Bessel ´e tamb´em autor de dois outros importantes feitos cient´ıficos, a proposi¸ca˜o da existˆencia de estrelas bin´ arias e a medi¸ca˜o da distˆancia ao Sol de uma outra estrela. Bessel foi um dos primeiros a propor a existˆencia de estrelas bin´arias, prevendo em 1834 a existˆencia de uma companheira da estrela Sirius. Tal previs˜ao foi poss´ıvel em fun¸ca˜o de medidas de alta precis˜ao, que Bessel produziu durante anos, da posi¸ca˜o de v´arias estrelas. Tais medidas indicavam um movimento el´ıptico peri´odico de Sirius cuja origem n˜ao poderia ser explicada em termos de movimentos da Terra ou do sistema solar. Bessel propˆos que esse movimento era devido a` presen¸ca de uma outra estrela menos brilhante nas proximidades de Sirius e que ambas orbitavam em torno do centro de massa comum, explicando assim as observa¸co˜es. Em 1840, Bessel anunciou a observa¸ca˜o de tais movimentos peri´odicos em outra estrela, a estrela Procyon. A existˆencia da companheira de Sirius foi confirmada por observa¸co˜es feitas em 1862 por A. G. Clark33 e a de Procyon em 1896, por J. M. Schaeberle34 , ambas ap´os a morte de Bessel. As estat´ısticas atuais indicam que cerca de metade das estrelas da nossa gal´axia ´e composta por estrelas bin´arias. H´a tamb´em sistemas triplos de estrelas (α Centauri sendo o exemplo mais popularmente conhecido), qu´adruplos ( Lyrae) etc. Um problema matem´atico, levantado pela primeira vez por Laplace35 em 1785 e ainda hoje em aberto, ao qual nomes como o de Poincar´e36 deram importantes contribui¸co˜es, ´e o de saber se sistemas m´ ultiplos como esses, ou como o nosso pr´oprio sistema solar, s˜ao est´aveis. Esse problema deu origem a uma importante a´rea de pesquisa atual, a teoria dos sistemas dinˆamicos37 . M´etodos como os que Bessel e outros empregaram para a detec¸ca˜o de sistemas bin´arios s˜ao empregados hoje em dia na detec¸ca˜o de planetas orbitando estrelas, outro tema atual de pesquisa. Bessel foi tamb´em o primeiro, em 1838, a determinar a distˆancia ao Sol de uma outra estrela, usando para tal o m´etodo de paralaxe. A estrela em quest˜ao foi 61 Cygni e Bessel calculou sua distˆancia ao Sol como sendo cerca de 10 anos-luz. O valor atualmente aceito ´e de cerca de 10,7 anos-luz, ou 3,3 parsecs38 . Com esse trabalho, Bessel contribuiu para o estudo das escalas de distˆancia cosmol´ogicas, tarefa em implementa¸ca˜o at´e os nossos dias. • Rela¸ co ˜es de recorrˆ encia para as fun¸ co ˜es de Bessel Seja a fun¸ca˜o de Bessel Jν (x) definida em (8.102) por Jν (x) :=

∞ X k=0

33

 x 2k+ν (−1)k . k! Γ(k + 1 + ν) 2

(9.106)

Alvan Graham Clark (1832-1897). John Martin Schaeberle (1853-1924). 35 Pierre-Simon Laplace (1749-1827). 36 Jules Henri Poincar´e (1854-1912). 37 Em verdade, boa parte da topologia moderna foi criada por Poincar´e no seu tratamento do problema de estabilidade. 38 Um ano-luz ´e a distˆ ancia que a luz percorre em um ano e corresponde a aproximadamente 9, 46 10 12 km, ou 9, 5 trilh˜ oes de quilˆ ometros. Um parsec ´e definido como a distˆ ancia de um objeto cuja paralaxe em rela¸ca ˜o a ` Terra seja de um segundo de arco, uma medida de distˆ ancia usada tradicionalmente na Astronomia. Um parsec corresponde a aproximadamente 3, 262 anos-luz, ou 3, 09 1013 km. 34

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

525/1304

Consideremos provisoriamente ν diferente de 0 ou de um inteiro negativo (pois Γ(x) diverge se x ´e um inteiro negativo). Multiplicando Jν por xν e diferenciando em rela¸ca˜o a x, obtem-se  2k+ν ∞ d ν (−1)k 1 d X (x)2k+2ν (x Jν (x)) = dx dx k=0 k! Γ(k + 1 + ν) 2  2k+ν−1 ∞ X 1 (−1)k (k + ν) = (x)2k+2ν−1 k! Γ(k + 1 + ν) 2 k=0

= x

ν

∞ X k=0

 x 2k+ν−1 (−1)k k! Γ(k + ν) 2

= xν Jν−1 (x) . Multiplicando Jν por x−ν e diferenciando em rela¸ca˜o a x, obtem-se analogamente  2k+ν ∞  (−1)k d X 1 d −ν (x)2k x Jν (x) = dx dx k=0 k! Γ(k + 1 + ν) 2 =

∞ X k=1

=

x

−ν

(−1)k (k − 1)! Γ(k + 1 + ν) ∞ X k=1

k→k+1

=

=

−x−ν

 2k+ν−1 1 (x)2k−1 2

 x 2k+ν−1 (−1)k (k − 1)! Γ(k + 1 + ν) 2

∞ X k=0

 x 2k+ν+1 (−1)k k! Γ(k + 2 + ν) 2

−x−ν Jν+1 (x) .

Provamos assim que, para ν 6= 0, −1, −2, −3 . . .,  d ν d (x Jν (x)) = xν Jν−1 (x) e x−ν Jν (x) = −x−ν Jν+1 (x) . (9.107) dx dx Adotando-se a j´a mencionada defini¸ca˜o J−m (x) = (−1)m Jm (x), para m inteiro positivo ou zero, vemos que a express˜ao acima tamb´em vale para ν = 0, −1, −2, −3 . . .. E. 9.17 Exerc´ıcio. Mostre isso!

6

Para ν = 0, a segunda rela¸ca˜o em (9.107) diz-nos que J00 (x) = −J1 (x) .

(9.108)

Expandindo as derivadas em (9.107), teremos que xν Jν0 (x) + νxν−1 Jν (x) = xν Jν−1 (x)

e

x−ν Jν0 (x) − νx−ν−1 Jν (x) = −x−ν Jν+1 (x) ,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

526/1304

ou seja, xJν0 (x) = xJν−1 (x) − νJν (x)

e

xJν0 (x) = νJν (x) − xJν+1 (x) .

(9.109)

Somando e subtraindo essas duas express˜oes uma da outra obtemos as seguintes rela¸co˜es importantes:  1 Jν0 (x) = Jν−1 (x) − Jν+1 (x) , (9.110) 2  1 Jν+1 (x) = 2νJν (x) − xJν−1 (x) . (9.111) x

Essas rela¸co˜es, v´alidas para todo ν ∈ , s˜ao denominadas rela¸co ˜es de recorrˆencia das fun¸co ˜es de Bessel. A segunda delas permite, por exemplo, obter todas as fun¸co˜es Jm com m inteiro positivo a partir de J0 e J1 . Na verdade, por (9.108), basta conhecer J0 e sua derivada. Resumindo, obtivemos as seguintes rela¸co˜es d ν (x Jν (x)) = xν Jν−1 (x) , dx  d x−ν Jν (x) = −x−ν Jν+1 (x) , dx

(9.113)

xJν0 (x) = xJν−1 (x) − νJν (x) ,

(9.114)

xJν0 (x) = νJν (x) − xJν+1 (x) ,

(9.115)

 1 Jν−1 (x) − Jν+1 (x) , = 2  1 Jν+1 (x) = 2νJν (x) − xJν−1 (x) , x Jν0 (x)

v´alidas para todo ν ∈

(9.112)

(9.116) (9.117)

e todo x ∈ , x 6= 0.

Express˜oes an´alogas a`s de acima s˜ao tamb´em v´alidas para as fun¸co˜es N ν (x).

• A rela¸ c˜ ao entre Jn e J0 , n ∈ 

A segunda express˜ao em (9.107) diz-nos que  1 d x−ν Jν (x) = −x−(ν+1) Jν+1 (x) . x dx

Disso segue imediatamente que  n  1 d x−ν Jν (x) = (−1)n x−(ν+n) Jν+n (x) , x dx

v´alida para todo ν, x ∈

en∈

. No caso particular em que ν = 0, obtem-se,  n 1 d n n (J0 (x)) , Jn (x) = (−1) x x dx

(9.118)



(9.119)

JCABarata. Curso de F´ısica-Matem´ atica

v´alida para todo x ∈ e n ∈ com as f´ormulas de Rodrigues. 

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

527/1304

. A express˜ao (9.119) generaliza (9.108) e guarda certa semelhan¸ca

E. 9.18 Exerc´ıcio. Obtenha (9.118) e (9.119) diretamente da defini¸c˜ao (9.106).

6

• A fun¸ c˜ ao geratriz das fun¸ co ˜es de Bessel A determina¸ca˜o da fun¸ca˜o geratriz das fun¸co˜es de Bessel ´e importante, entre outras raz˜oes, por nos permitir obter representa¸co˜es integrais para as fun¸co˜es de Bessel, representa¸co˜es essas que assumem uma grande relevˆancia em v´arias aplica¸co˜es. Tomemos as fun¸co˜es de Bessel de ordem inteira definidas por Jm (x) :=

∞ X k=0

 x 2k+m (−1)k , k! (k + m)! 2

(9.120)

para m ≥ 0, convencionando-se que J−m (x) = (−1)m Jm (x) (vide (8.120) e a discuss˜ao que lhe acompanha). Vamos aqui considerar a fun¸ca˜o geratriz definida por J(x, t) :=

∞ X

tm Jm (x)

m=−∞

para t 6= 0 e vamos provar que

   x 1 t Jm (x) = exp t− . 2 t m=−∞ ∞ X

m

(9.121)

Dessa importante rela¸ca˜o ser˜ao extra´ıdos v´arios fatos u ´ teis sobre as fun¸co˜es de Bessel de ordem inteira. Antes de provarmos isso, mostremos que J(x, t) est´a bem definida. Por (9.120), vale |Jm (x)| ≤

∞ X k=0

1 k! (k + m)!

de modo que

|J(x, t)| ≤ |J0 (x)| +

∞ X

m=1

∞ x 2k+m 1 x m X 1 ≤ 2 m! 2 k=0 k!

∞ m X 1 |Jm (x)| |t| |Jm (x)| + t

x 2k 1 x m |x/2|2 = , e 2 m! 2

m

m=1

≤ |J0 (x)| + e

|x/2|2

sendo que as u ´ ltimas somas s˜ao convergentes para todo x ∈ J(x, t) ´e anal´ıtica para todo x ∈ e todo t ∈ com t 6= 0.

m ∞ ∞ X X 1 x m 1 xt |x/2|2 +e , m! 2 m! 2t m=1 m=1

e todo t ∈

com t 6= 0, o que prova que

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

528/1304

Podemos com isso demonstrar (9.121) de modo bem simples, tomando a derivada parcial em rela¸ca˜o a x de J(x, t), derivando termo a termo na soma (o que ´e permitido, devido a` analiticidade) e usando (9.110): ∂ J(x, t) ∂x

=

∞ X

0 t m Jm (x)

(9.122)

m=−∞

(9.110)

=

k=m−1, l=m+1

=

=

∞ ∞ 1 X m 1 X m t Jm−1 (x) − t Jm+1 (x) 2 m=−∞ 2 m=−∞ ∞ ∞ t X k t−1 X l t Jk (x) − t Jl (x) 2 k=−∞ 2 l=−∞

  1 1 t− J(x, t) . 2 t

(9.123)

(9.124)

(9.125)

 t) = 21 t − 1t J(x, t), cuja solu¸ca˜o geral ´e    1 x t− , J(x, t) = f (t) exp 2 t

Assim, J(x, t) satisfaz a equa¸ca˜o diferencial

∂ J(x, ∂x

para alguma fun¸ca˜o f (t). Agora, como Jm (0) = 0 para m 6= 0 e J0 (0) = 1, segue que J(0, t) = 1, o que implica f (t) = 1, provando (9.121). Estudando a demonstra¸ca˜o acima o leitor poder´a reconhecer a importˆancia de definir-se J −m (x) = (−1)m Jm (x), para m inteiro positivo ou zero. • F´ ormula de adi¸ c˜ ao das fun¸ co ˜es de Bessel Uma das rela¸co˜es mais u ´ teis que advˆem de (9.121) ´e a seguinte: Jm (x + y) =

∞ X

Jn (x)Jm−n (y) ,

(9.126)

n=−∞

v´alida para todo m ∈ e todos x, y ∈ . Essa express˜ao ´e denominada por alguns autores f´ ormula de adi¸ca ˜o das fun¸co ˜es de Bessel (a “adi¸ca˜o”, aqui, refere-se a` adi¸ca˜o dos argumentos da fun¸ca˜o no lado esquerdo). As fun¸co˜es de Bessel satisfazem v´arias outras rela¸co˜es de adi¸ca˜o do tipo de acima e remetemos o leitor a` literatura supracitada (por exemplo, a` referˆencia [66]) para generaliza¸co˜es. A demonstra¸ca˜o de (9.126) ´e obtida de (9.121) calculando-se o produto J(x, t)J(y, t) de duas

JCABarata. Curso de F´ısica-Matem´ atica

formas: por um lado,

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

529/1304

      x 1 y 1 J(x, t)J(y, t) = exp t− exp t− 2 t 2 t    1 x+y = exp t− 2 t ∞ X

=

tm Jm (x + y) .

(9.127)

m=−∞

Por outro lado, J(x, t)J(y, t) =

∞ X

tk Jk (x)

k=−∞

=

∞ X

∞ X

!

∞ X

tl Jl (y)

l=−∞

!

tk+l Jk (x)Jl (y)

k=−∞ l=−∞

=

∞ X

tm

m=−∞

∞ X

Jn (x)Jm−n (y)

n=−∞

!

.

(9.128)

Comparando-se (9.127) a (9.128) obtem-se (9.126). Se em (9.126) tomarmos y = −x e m = 0, e usarmos que Jn (x) = J−n (−x) e que J0 (0) = 1, obteremos ∞  ∞  2  2 2 X X (9.129) Jn (x) . = J0 (x) + 2 1 = Jn (x) n=1

n=−∞

Como Jn (x) ´e real para x ∈



, isso ensina-nos que |J0 (x)| ≤ 1

para todo x ∈ 

e

1 |Jn (x)| ≤ √ , 2

e n 6= 0, n inteiro.

E. 9.19 Exerc´ıcio. Justifique!

6

´ poss´ıvel estabelecer limites superiores mais precisos para |Jn (x)|, mas n˜ao trataremos disso aqui. E • Representa¸ co ˜es integrais das fun¸ co ˜es de Bessel A rela¸ca˜o (9.121) tem v´arios usos, um deles ´e o de fornecer uma representa¸ca˜o integral para as fun¸co˜es de Bessel, com a qual outras propriedades podem ser obtidas. A rela¸ca˜o (9.121) foi provada para todo x ∈ e t ∈ com t 6= 0. Tomemos t com |t| = 1, ou seja, tomemos t da forma t = eiϕ , com −π ≤ ϕ ≤ π. Obtemos, ∞ X eix sen (ϕ) = Jm (x)eimϕ . (9.130) m=−∞

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

530/1304

O ponto interessante ´e que podemos interpretar o lado direito como sendo a s´erie de Fourier na vari´avel ϕ da fun¸ca˜o peri´odica de per´ıodo 2π do lado esquerdo, de onde tiramos que Z π Z π 1 1 ix sen (ϕ) −imϕ Jm (x) = e e dϕ = eix sen (ϕ)−imϕ dϕ , 2π −π 2π −π . Usando eia = cos(a) + i sen (a), tem-se Z π Z π i 1 cos (x sen (ϕ) − mϕ) dϕ + sen (x sen (ϕ) − mϕ) dϕ . Jm (x) = 2π −π 2π −π

para todo m ∈

A segunda integral do lado direito ´e nula, pois o integrando ´e uma fun¸ca˜o ´ımpar em ϕ. Como o integrando da primeira integral do lado direito ´e uma fun¸ca˜o par em ϕ, segue que Z π Z 1 1 π Jm (x) = cos (x sen (ϕ) − mϕ) dϕ = cos (x sen (ϕ) − mϕ) dϕ , (9.131) 2π −π π 0 v´alida para todo m ∈ Jm (x), m ∈ .

. Essa express˜ao ´e a importante representa¸ca ˜o integral da fun¸ca ˜o de Bessel

Tomando-se t = ieiϕ em (9.121), obtem-se e

ix cos(ϕ)

∞ X

=

im Jm (x)eimϕ .

(9.132)

eix cos(ϕ)−imϕ dϕ .

(9.133)

m=−∞

de onde se extrai

(−i)m Jm (x) = 2π

´ f´acil obter da´ı que E (−1)m J2m (x) = 2π (−1)m J2m+1 (x) = 2π

Z Z

π −π

Z

π −π

  cos x cos(ϕ) − 2mϕ dϕ , 

π −π



sen x cos(ϕ) − (2m + 1)ϕ dϕ .

para todo m = 0, 1, 2, . . .. De (9.133) segue, em particular, a rela¸ca˜o Z π 1 eix cos(ϕ) dϕ . J0 (x) = 2π −π

(9.134)

Aplica¸co˜es dessa identidade encontram-se nos Exerc´ıcios E. 9.20 e E. 9.21. E. 9.20 Exerc´ıcio. Seja f :

2 



integr´avel e seja Z 1 F[f ](~ p) := f (~x)e−i~p·~x d2 ~x 2π 2 

sua transformada de Fourier, onde ~x = (x1 , x2 ), p~ = (p1 , p2 )p e p~ ·~x = p1 x1 + p2 x2 . Suponha que f dependa apenas da coordenada radial: f (~x) = f (r), com r = k~xk = x21 + x22 . Mostre que Z ∞ F[f ](~ p) = f (r)J0 (pr)r dr , 0

onde p = |~ p|.

6

JCABarata. Curso de F´ısica-Matem´ atica

E. 9.21 Exerc´ıcio.

Seja f :

2 



Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

definida por f (~x) = f (r) =

constantes com R > 0. Mostre que



531/1304

f0 , 0 ≤ r ≤ R , sendo f0 e R 0, r > R

f0 R J1 (pR) . p

F[f ](~ p) = Sugest˜ao: De (9.107) segue que xJ0 (x) = (xJ1 (x))0 .

6

• Propriedades adicionais De (9.130) podemos extrair mais algumas rela¸co˜es de interesse. Mostremos algumas aqui. Separando a parte real e a parte imagin´aria de ambos os lados de (9.130), teremos ∞   X cos x sen (ϕ) = Jm (x) cos(mϕ) , m=−∞

m

  sen x sen (ϕ) =

∞ X

Jm (x) sen (mϕ) .

m=−∞

Usando que J−m (x) = (−1) Jm (x), obtemos alguns cancelamentos que conduzem a ∞   X cos x sen (ϕ) = J0 (x) + 2 J2k (x) cos(2kϕ) ,

(9.135)

k=1



sen x sen (ϕ)



= 2

∞ X k=1

Em particular, para ϕ = π/2, isso diz-nos que

J2k−1 (x) sen ((2k − 1)ϕ) .

cos(x) = J0 (x) + 2

∞ X

(−1)k J2k (x) ,

(9.136)

(9.137)

k=1

∞ X sen (x) = 2 (−1)k+1 J2k−1 (x) .

(9.138)

k=1

Tomando ϕ = 0 em (9.135), segue tamb´em a identidade 1 = J0 (x) + 2

∞ X

J2k (x) .

k=1

De (9.135)-(9.136), obtem-se tamb´em, usando as bem-conhecidas rela¸co˜es de ortogonalidade das fun¸co˜es seno e co-seno,  Z  1 π Jm (x), m par cos x sen ϕ cos(mϕ)dϕ = . 0, m ´ımpar π 0  Z  1 π 0, m par . sen x sen ϕ sen (mϕ)dϕ = J (x), m ´ımpar π 0 m

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

532/1304

Outras identidades podem ser obtidas a partir das v´arias apresentadas de acima, ou com os mesmos m´etodos, mas encerramos aqui nossa apresenta¸ca˜o das mesmas, convidando o leitor a um passeio a` literatura pertinente a`s fun¸co˜es de Bessel. Nossa inten¸ca˜o agora ´e a de discutir as rela¸co˜es de ortogonalidade para as fun¸co˜es de Bessel. • Zeros das fun¸ co ˜es de Bessel Antes de entrarmos na discuss˜ao sobre as rela¸co˜es de ortogonalidade para as fun¸co˜es de Bessel em J = [0, 1] precisamos fazer alguns coment´arios sobre os zeros das fun¸co˜es de Bessel. Os seguintes teoremas s˜ao v´alidos: Teorema 9.2 As fun¸co ˜es Jn (z), com n ∈ , n˜ ao possuem zeros complexos e possuem uma cole¸ca ˜o infinita enumer´ avel de zeros reais, todos simples, exceto z = 0, que ´e um zero de ordem |m| de J m (z) para m ∈ , m 6= 0. Os zeros de Jn (z), com n ∈ , n˜ ao possuem pontos de acumula¸ca ˜o em . Como Jn (x) = (−1)n Jn (−x), vemos que os zeros de Jn (x) s˜ ao sim´etricos em rela¸ca ˜o ao ponto x = 0. Fora isso, como J−n (x) = (−1)n+1 Jn (x), os zeros de Jn (x) coincidem com os de J−n (x). Por fim, os zeros positivos das fun¸co ˜es de Bessel de ordem inteira positiva possuem a seguinte propriedade de alternˆ ancia: entre dois zeros positivos sucessivos de Jn existe um zero de Jn−1 e um de Jn+1 , para todos n ≥ 0. 2 

Teorema 9.3 Seja ν real e suponha que | arg z| < π. Ent˜ ao Jν (z) possui uma cole¸ca ˜o infinita enumer´ avel de zeros reais e positivos e um n´ umero 2N (ν) de zeros conjugados complexos, sendo que 1. N (ν) = 0 se ν > −1 ou ν = −1, −2, −3, . . ., 2. N (ν) = m se −m − 1 < ν < m, m = 1, 2, 3, . . .. Os zeros reais positivos de Jν (z), com ν real, n˜ ao possuem pontos de acumula¸ca ˜o em 

+.

2

Teorema 9.4 Para ν ≥ 0 a fun¸ca ˜o Jν0 (z) possui apenas zeros simples, exceto em z = 0 e entre dois zeros sucessivos de Jν0 (z) h´ a exatamente um zero de Jν (z). 2 O teorema seguinte ´e particularmente u ´ til na resolu¸ca˜o de problemas envolvendo condi¸co˜es de contorno mistas. Teorema 9.5 Para A e B reais e ν real com ν > −1 a equa¸ca ˜o AJν (z) + BzJν0 (z) para | arg z| < π possui uma cole¸ca ˜o enumer´ avel de zeros reais positivos e no caso em que ν + A/B ≥ 0, tamb´em n˜ ao possui ra´ızes complexas. Caso ν + A/B < 0, AJ ν (z) + BzJν0 (z) possui duas ra´ızes imagin´ arias puras. 2 Os enunciados acima foram extra´ıdos de [83], [66] e [62] e suas demonstra¸co˜es podem ser encontradas em [131] ou (parcialmente) em [66]. N˜ao as apresentaremos aqui, mas o leitor n˜ao deve ser desestimulado a estud´a-las pois as mesmas s˜ao elementares e utilizam-se essencialmente apenas do material que j´a apresentamos aqui.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

533/1304

• As rela¸ co ˜es de ortogonalidade das fun¸ co ˜es de Bessel no intervalo [0, 1] Em muitos problemas, por exemplo, naquele em que estudamos os modos de vibra¸ca˜o de uma membrana circular, estamos interessados nas solu¸co˜es da equa¸ca˜o de Bessel em um intervalo finito fechado. Consideraremos, para fixar id´eias, o caso em que o intervalo ´e J = [0, 1]. Em uma tal situa¸ca˜o encontraremos rela¸co˜es de ortogonalidade, as quais s˜ao muito importantes na resolu¸ca˜o de certos problemas envolvendo equa¸co˜es diferenciais parciais submetidas a condi¸co˜es iniciais e de contorno. Devido aos coment´arios que fizemos acima sobre os zeros das fun¸co˜es de Bessel consideraremos no que segue apenas o caso em que ν ´e real. ´ f´acil verificar que fα (x) ´e solu¸ca˜o da equa¸ca˜o Seja para um dado α ∈ a fun¸ca˜o fα (x) := Jν (αx). E 

(xy 0 (x))0 −

ν2 y(x) + α2 xy(x) = 0 . x

E. 9.22 Exerc´ıcio importante. Verifique isso.

(9.139) 6

Como α aparece elevada ao quadrado na express˜ao acima podemos sem perda de generalidade considerar α > 0 (o caso α = 0 ´e trivial, pois corresponde a uma fun¸ca˜o constante: f 0 (x) = Jν (0)). Nosso principal resultado ser´a o seguinte teorema, o qual estabelece uma classe bastante geral de rela¸co˜es de ortogonalidade para as fun¸co˜es de Bessel. Essas rela¸co˜es de ortogonalidade s˜ao de suma importˆancia nas aplica¸co˜es dessas fun¸co˜es a` solu¸ca˜o de certas equa¸co˜es diferenciais submetidas a certas condi¸co˜es iniciais e de contorno. Teorema 9.6 Seja ν ≥ 0 e sejam fixados certos n´ umeros reais A, B com (A, B) 6= (0, 0) satisfazendo ν + A/B ≥ 0, caso B 6= 0 (vide Teoremas 9.2-9.5). Seja tamb´em ZνA, B o conjunto de todos os n´ umeros α > 0 tais que AJν (α) + BαJν0 (α) = 0 , (9.140) ou seja, ZνA, B := {α > 0| AJν (α) + BαJν0 (α) = 0} .

(9.141)

Pelo Teorema 9.5, esse conjunto ´e n˜ ao-vazio e enumer´ avel. Ent˜ ao a condi¸ca ˜o (9.6) do Teorema 9.1, p´ agina 487, com J = [0, 1], ´e satisfeita para todas as fun¸co ˜es f α (x) = Jν (αx) com α ∈ ZνA, B e, ν ˜es de ortogonalidade (com r(x) = x) portanto, para α, β ∈ ZA, B com α 6= β valem as rela¸co Z 1 fα (x)fβ (x) x dx = 0 , 0

ou seja,

Z

1

Jν (αx)Jν (βx) x dx = 0 .

(9.142)

0

para todos α, β ∈ ZνA, B com α 6= β. Para todos α, β ∈ ZνA, B , tem-se     Z 1 δα, β ν2 2 2 0 Jν (αx)Jν (βx) x dx = (Jν (α)) + 1 − 2 (Jν (α)) 2 α 0   2ν (9.115) δα, β 2 2 = (Jν (α)) − Jν (α)Jν+1 (α) + (Jν+1 (α)) . 2 α

(9.143)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

534/1304

Essa express˜ ao ´e denominada rela¸ca ˜o de ortogonalidade das fun¸co ˜es de Bessel. Note que h´ a uma rela¸ca ˜o de ortogonalidade para cada tripla (ν, A, B) com ν ≥ 0 e (A, B) 6= (0, 0) e ν + A/B ≥ 0, B 6= 0, pois cada tripla (ν, A, B) fixa o conjunto WνA, B . A rela¸ca ˜o (9.140) corresponde a condi¸co ˜es de contorno freq¨ uentemente encontradas na resolu¸ca ˜o de equa¸co ˜es diferenciais parciais da F´ısica, como por exemplo no problema de propaga¸ca ˜o de ondas em uma membrana circular (um tambor). No caso A = 1, B = 0 o conjunto Z ν1, 0 coincide com o dos zeros ˜o da fun¸ca ˜o de Bessel Jν (x). No caso A = 0, B = 1 o conjunto Zν0, 1 coincide com o dos zeros da fun¸ca 0 Jν (x). Em particular, se ν ≥ 0 e αkν ´e o k-´esimo zero da fun¸ca ˜o Jν (x) no intervalo (0, ∞), ent˜ ao Z 1   (Jν0 (αkν ))2 (Jν+1 (αkν ))2 ν ν Jν αk x Jν αl x x dx = δk, l = δk, l . (9.144) 2 2 0

Analogamente, se ν ≥ 0 e βkν ´e o k-´esimo zero da fun¸ca ˜o Jν0 (x) no intervalo (0, ∞), ent˜ ao  2 ! Z 1   ν (Jν (βkν ))2 Jν βkν x Jν βlν x x dx = δk, l 1 − . βkν 2 0

(9.145)

Dessa rela¸ca ˜o percebemos incidentalmente que βkν > ν para todo k, pois o lado esquerdo ´e certamente positivo quando k = l. 2 Prova do Teorema 9.6. Podemos encarar a equa¸ca˜o (9.139) como sendo da forma canˆonica (9.1) para o 2 intervalo J = (0, 1] com p(x) = x, q(x) = − νx , r(x) = x e µ = α2 . Perguntemo-nos agora se para duas fun¸co˜es fα (x) := Jν (αx) e fβ (x) := Jν (βx) a condi¸ca˜o (9.6) do Teorema 9.1, p´agina 487 ´e satisfeita nos extremos do intervalo J = (0, 1], ou seja, se   p(1) fα (1)fβ0 (1) − fα0 (1)fβ (1) − lim p(x) fα (x)fβ0 (x) − fα0 (x)fβ (x) = 0 , x→0

isto ´e, se

(Jν (α)βJν0 (β) − αJν0 (α)Jν (β)) − lim x (Jν (αx)βJν0 (βx) − αJν0 (αx)Jν (βx)) = 0 . x→0

Dado que o primeiro termo da expans˜ao de Jν (x) ´e proporcional a xν , e que, conseq¨ uentemente, o 0 ν−1 primeiro termo da expans˜ao de Jν (x) ´e proporcional a x teremos que lim x (Jν (αx)βJν0 (βx) − αJν0 (αx)Jν (βx)) ∝ lim xxν xν−1 = 0

x→0

x→0

sempre que ν > 0. Para ν = 0 a rela¸ca˜o acima tamb´em ´e v´alida, pois o primeiro termo da expans˜ao de J0 (x) ´e constante, mas o primeiro termo da expans˜ao de J00 (x) ´e proporcional a x. Para ν < 0 o limite x → 0 da express˜ao acima ´e singular. Conclu´ımos que para ν ≥ 0 vale   p(1) fα (1)fβ0 (1) − fα0 (1)fβ (1) − lim p(x) fα (x)fβ0 (x) − fα0 (x)fβ (x) x→0

= (Jν (α)βJν0 (β) − αJν0 (α)Jν (β)) .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

535/1304

Procuramos agora identificar condi¸co˜es sob as quais o lado direito se anula, o que nos garantir´a a aplicabilidade do teorema de ortogonalidade, Teorema 9.1. Um caso o´bvio ´e aquele no qual α e β s˜ao zeros da fun¸ca˜o de Bessel Jν . Outro caso o´bvio ´e aquele no qual α e β s˜ao zeros de Jν0 , a derivada da fun¸ca˜o de Bessel Jν . O caso mais geral est´a na seguinte proposi¸ca˜o. Proposi¸ c˜ ao 9.1 Suponhamos que para certos n´ umeros A e B com (A, B) 6= (0, 0) existam constantes reais α e β tais que AJν (α) + BαJν0 (α) = 0

e

AJν (β) + BβJν0 (β) = 0 .

(9.146) (9.147)

Ent˜ ao, Jν (α)βJν0 (β) − αJν0 (α)Jν (β) = 0 . 2 Prova. As rela¸co˜es (9.146)-(9.147) podem ser expressas em forma matricial como      0 Jν (α) αJν0 (α) A    =   . 0 Jν (β) βJν0 (β) B

Como por hip´otese (A, B) 6= (0, 0), a rela¸ca˜o acima s´o ´e poss´ıvel se a matriz 2 × 2 do lado esquerdo for n˜ao-invert´ıvel, ou seja, se tiver determinante nulo. Assim, devemos ter   Jν (α) αJν0 (α)  = Jν (α)βJν0 (β) − αJν0 (α)Jν (β) , 0 = det  Jν (β) βJν0 (β) que ´e o que quer´ıamos estabelecer.

Com essa proposi¸ca˜o, fica estabelecido que a condi¸ca˜o (9.6) do Teorema 9.1, p´agina 487, com com J = [0, 1], ´e satisfeita para todas as fun¸co˜es fα (x) = Jν (αx) com α ∈ ZνA, B e, portanto, para α, β ∈ ZνA, B com α 6= β valem as rela¸co˜es de ortogonalidade (com r(x) = x) Z

1

fα (x)fβ (x) x dx = 0 0

para todos α, β ∈ ZνA, B com α 6= β.

ou seja,

Z

1

Jν (αx)Jν (βx) x dx = 0 , 0

Passemos a` quest˜ao de provar (9.143) para o caso em que α = β. Isso pode ser feito de diversas maneiras, a mais direta sendo a seguinte. Escrevamos a equa¸ca˜o (9.139) na forma  x2 y 00 (x) + xy 0 (x) + α2 x2 − ν 2 y(x) = 0 . (9.148)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

536/1304

Multiplicando-a por 2y 0 (x), obtemos  0 = 2x2 y 0 (x)y 00 (x) + 2x(y 0 (x))2 + 2 α2 x2 − ν 2 y(x)y 0 (x)  d d 0 2 (y (x)) + 2x(y 0 (x))2 + α2 x2 − ν 2 (y(x))2 dx dx   d d  2 0 2 = (y(x))2 x (y (x)) + α2 x2 − ν 2 dx dx = x2

e, portanto,

   d  2 0 d  2 2 2 x (y (x)) + α x − ν 2 (y(x))2 − 2α2 x (y(x))2 . dx dx Integrando-se ambos os lados da igualdade entre 0 e 1, obtem-se Z 1  i 1   1 h 2 2 2 2 2 2 2 0 x (y(x))2 dx . 0 = x (y (x)) + α x − ν (y(x)) − 2α 0 =

0

0

(9.149)

0

Como fα (x) = Jν (αx) ´e solu¸ca˜o de (9.148), podemos adotar y(x) = Jν (αx), acima. Assim,  1   1  2 2 2 x2 (y 0 (x)) = α2 x2 (Jν0 (αx)) = α2 (Jν0 (α)) . 0

0

h

2 2

α x −ν

2



 i 1    (y(x)) = α2 − ν 2 (Jν (α))2 + ν 2 (Jν (0))2 = α2 − ν 2 (Jν (α))2 , 2

0

pois ν 2 (Jν (0))2 = 0 para todo ν ≥ 0 (por que?). Portanto, (9.149) fica Z 1   2 2 2 0 2 2 2 x (Jν (αx)) dx = α (Jν (α)) + α − ν (Jν (α))2 , 2α 0

o que conduz a` primeira linha de (9.143) no caso α = β. A identidade   ν2 2ν 2 0 (Jν (α)) + 1 − 2 (Jν (α))2 = (Jν (α))2 − Jν (α)Jν+1 (α) + (Jν+1 (α))2 α α segue diretamente de (9.115). Com isso, o Teorema 9.6 est´a demonstrado • Coment´ ario sobre a equa¸ c˜ ao de Bessel no intervalo J = [0, ∞) Seja a equa¸ca˜o de Bessel x2 y 00 (x) + xy 0 (x) + (x2 − ν 2 )y(x) = 0 e consideremo-la agora no intervalo semi-infinito J = [0, ∞). A mesma pode ser escrita como (xy 0 (x))0 −

ν2 y(x) + xy(x) = 0, x

(9.150)

e aqui temos p(x) = x e poder´ıamos adotar q(x) = x, r(x) = x1 e µ = −ν 2 . H´a, por´em, uma diferen¸ca marcante em rela¸ca˜o aos casos anteriormente tratados. Para as fun¸co˜es J ν (x), mesmo com ν inteiro,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

537/1304

n˜ao vale a rela¸ca˜o (9.6), pois limx→∞ p(x)Jν (x)Jν 0 (x) n˜ao se anula e, portanto, o Teorema 9.1 n˜ao se aplica nesse caso. De fato, Jν (x) comporta-se para x → ∞ como r  π − 2 cos x − νπ 4 √2 . Jν (x) ≈ π x Infelizmente, n˜ao apresentaremos a demonstra¸ca˜o dessa express˜ao assint´otica nestas Notas. O leitor poder´a encontr´a-la em v´arios textos, por exemplo, em [131], [136], [66] e mesmo em [79]. Em [66], por exemplo, encontra-se demonstrada a express˜ao assint´otica mais detalhada

Jν (x) ≈

r

− 2 cos x − νπ √2 π x

π 4



  2r ∞ X (−1)r Γ ν + 2r + 21 1  1 2x (2r)! Γ ν − 2r + 2 r=0 −

r

− 2 sen x − νπ √ 2 π x

π 4



∞ X r=0

  2r+1 (−1)r Γ ν + 2r + 23 1  , 1 2x (2r + 1)! Γ ν − 2r − 2

v´alida para x → ∞. Com isso, percebemos que n˜ao devem valer para as fun¸co˜es de Bessel com ν’s diferentes rela¸co˜es de ortogonalidade envolvendo integrais em J = [0, ∞).

9.2.7

Propriedades das Fun¸ co ˜es de Bessel Esf´ ericas

As fun¸co˜es de Bessel e Neumann esf´ericas de ordem ν foram definidas em (8.125) e (8.126) por r r π π Jν+ 1 (z) , N 1 (z) . jν (z) := nν (z) := (9.151) 2 2z 2z ν+ 2 Por serem fortemente relacionadas a`s fun¸co˜es de Bessel, suas propriedades podem ser facilmente deduzidas das propriedades estudadas acima daquelas fun¸co˜es. Por (8.102), tem-se √ X ∞  z 2k+ν π (−1)k . jν (z) = 2 k=0 k! Γ(k + 1 + ν + 1/2) 2 Pela f´ormula de duplica¸ca˜o (8.27), podemos escrever isso como jν (z) = 2

ν

∞ X (−1)k Γ(k + 1 + ν) k=0

Em particular, para ν = l ∈ 

k! Γ(2(k + 1 + ν))

z 2k+ν .

, vale ∞ X (−1)k (k + l)! 2k+l z . jl (z) = 2 k! (2k + 2l + 1)! l

k=0

• Rela¸ co ˜es de recorrˆ encia para as fun¸ co ˜es de Bessel esf´ ericas

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

538/1304

F´ormulas de recorrˆencia para as fun¸co˜es de Bessel esf´ericas tamb´em podem ser obtidas daquelas para as fun¸co˜es de Bessel listadas em (9.112)-(9.117). Analisando-as, ´e imediato ver que de (9.112) e (9.113) segue facilmente que  d xν+1 jν (x) = xν+1 jν−1 (x) dx

 d x−ν jν (x) = −x−ν jν+1 (x) . dx

e

De (9.114) e (9.115) segue facilmente que xjν0 (x) = xjν−1 (x) − (ν + 1)jν (x)

e

(9.152)

xjν0 (x) = νjν (x) − xjν+1 (x) .

(9.153)



(9.154)

Dessas duas rela¸co˜es segue facilmente que jν0 (x)

1 = 2

jν+1 (x) =



jν (x) jν−1 (x) − − jν+1 (x) x

,

 1 (2ν + 1)jν (x) − xjν−1 (x) , x

para todo ν. Usando (9.155), ´e f´acil ver que (9.154) pode ser reescrita como   (2ν + 1) jν0 (x) = (ν + 1) jν−1 (x) − jν+1 (x)

(9.155)

(9.156)

para todo ν.

Resumindo nossas conclus˜oes, obtivemos que  d xν+1 jν (x) = xν+1 jν−1 (x) , dx

 d x−ν jν (x) = −x−ν jν+1 (x) , dx

xjν0 (x) = xjν−1 (x) − (ν + 1)jν (x) ,

xjν0 (x) = νjν (x) − xjν+1 (x) ,   (2ν + 1) jν0 (x) = (ν + 1) jν−1 (x) − jν+1 (x) ,

 1 (2ν + 1)jν (x) − xjν−1 (x) . jν+1 (x) = x

(9.157) (9.158) (9.159) (9.160) (9.161) (9.162)

Express˜oes an´alogas s˜ao v´alidas para as fun¸co˜es nν (x). Com o uso das rela¸co˜es de recorrˆencia acima ´e poss´ıvel obter para as fun¸co˜es de Bessel esf´ericas o an´alogo da express˜ao (9.119). • A rela¸ c˜ ao entre jn e j0 , n ∈ 

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

539/1304

A express˜ao (9.158) diz-nos que  1 d x−ν jν (x) = −x−(ν+1) jν+1 (x) . x dx

Disso segue imediatamente que n   1 d x−ν jν (x) = (−1)n x−(ν+n) jν+n (x) , x dx

v´alida para todo ν, x ∈

en∈

(9.163)

. No caso particular em que ν = 0, obtem-se, n n    sen x  1 d 1 d n n n n (j0 (x)) = (−1) x jn (x) = (−1) x , x dx x dx x

v´alida para todo x ∈ Rodrigues.

en∈ 



(9.164)

. A express˜ao (9.164) guarda certa semelhan¸ca com as f´ormulas de

Para as fun¸co˜es de Neumann esf´ericas tem-se uma express˜ao an´aloga: n   cos x  1 d n+1 n nn (x) = (−1) x . x dx x

(9.165)

• Rela¸ co ˜es de ortogonalidade para as fun¸ co ˜es de Bessel esf´ ericas no intervalo [0, 1] As rela¸co˜es de ortogonalidade para as fun¸co˜es de Bessel esf´ericas podem ser provadas diretamente daquelas expressas no Teorema 9.6. ν+1/2

Observemos em primeiro lugar que o conjunto ZA, B que, pela defini¸ca˜o (9.141), ´e ν+1/2

ZA, B

:=



0 α > 0| AJν+1/2 (α) + BαJν+1/2 (α) = 0



pode ser caracterizado em termos de jν como     B ν+1/2 0 ZA, B := α > 0 A + jν (α) + Bαjν (α) = 0 . 2 Assim, ao lidarmos com problemas que possuem condi¸co˜es de contorno do tipo Ajν (α) + Bαjν0 (α) = 0 ν+1/2

o conjunto de α’s que satisfazem isso ´e ZA−B/2, B . Isso mostra que podemos aplicar diretamente as conclus˜oes do Teorema 9.6, tomando o cuidado de q √ px 2α substituir: 1. ν por ν + 1/2, 2. Jν (α) por j (α), 3. (na integral) J (αx) por α π jν (αx) e 3. e ν ν π   √ √ Jν0 (α) por π j2ν√(α) + αjν0 (α) . Ap´os algumas contas elementares, obtem-se o seguinte: α

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 9

Vers˜ ao de 29 de setembro de 2005.

540/1304

Teorema 9.7 Seja ν ≥ 0, sejam fixados certos n´ umeros reais A, B com (A, B) 6= (0, 0) satisfazendo ν + 1/2 + A/B ≥ 0, caso B 6= 0 (vide Teoremas 9.2-9.5) e seja definido ν+1/2

WνA, B := {α > 0| Ajν (α) + Bαjν0 (α) = 0} = ZA−B/2, B . Pelo Teorema 9.5, esse conjunto ´e n˜ ao-vazio e enumer´ avel. Para todos α, β ∈ W νA, B , tem-se "  # 2  Z 1 1 2 √ ) (ν + 1 j (α) δ ν α, β 2 √ + αjν0 (α) + 1 − (jν (α))2 jν (αx)jν (βx) x2 dx = 2 2 α α 2 α 0 = (9.160)

=





jν (α)jν0 (α) (jν (α)) + + (jν0 (α))2 α   δα, β (2ν + 1) 2 2 jν (α)jν+1 (α) + (jν+1 (α)) . (jν (α)) − 2 α

δα, β 2

ν(ν + 1) 1− α2

2

 (9.166)

Essa express˜ ao ´e denominada rela¸ca ˜o de ortogonalidade das fun¸co ˜es de Bessel esf´ericas. Note que h´ a uma rela¸ca ˜o de ortogonalidade para cada tripla (ν, A, B) com ν ≥ 0 e (A, B) 6= (0, 0), pois cada tripla (ν, A, B) fixa o conjunto ZνA, B . ˜o de Bessel esf´erica jν (x). No caso A = 1, B = 0 o conjunto Wν1, 0 coincide com o dos zeros da fun¸ca ν ˜o jν0 (x). No caso A = 0, B = 1 o conjunto W0, 1 coincide com o dos zeros da fun¸ca Em particular, se ν ≥ 0 e αkν ´e o k-´esimo zero da fun¸ca ˜o jν (x) no intervalo (0, ∞), ent˜ ao Z 1   (j 0 (αν ))2 (jν+1 (αkν ))2 jν αkν x jν αlν x x2 dx = δk, l ν k = δk, l . (9.167) 2 2 0

˜o jν0 (x) no intervalo (0, ∞), ent˜ ao Analogamente, se ν ≥ 0 e βkν ´e o k-´esimo zero da fun¸ca   Z 1   2 ν(ν + 1) (jν (βkν ))2 ν ν jν βk x jν βl x x dx = δk, l 1 − . (9.168) (βkν )2 2 0 p Dessa rela¸ca ˜o percebemos incidentalmente que βkν > ν(ν + 1) para todo k, pois o lado esquerdo ´e certamente positivo quando k = l. 2 ´ instrutivo considerar a rela¸ca˜o (9.167) no caso ν = 0, quando j0 (x) = E com k > 0 inteiro. Como j00 (x) = cos(x) − senx2(x) , (9.167) est´a dizendo que x Z

ou seja,

1 0

δk, l sen (kπx) sen (lπx) dx = klπ 2 2 Z



cos(kπ) kπ

1

sen (kπx) sen (lπx) dx = 0

2

=

sen (x) x

e, portanto, αk0 = kπ,

1 δk, l , 2(kπ)2

1 δk, l . 2

Essa ´e uma rela¸ca˜o bem conhecida que, evidentemente, pode tamb´em ser provada por meios mais elementares.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

541/1304

Apˆ endices 9.A

Provando (9.44) ` a For¸ ca Bruta

A id´eia ´e tomar (9.42), escrever (z 2 − 1)l = (z − 1)l (z + 1)l e aplicar a regra de Leibniz. Tudo est´a resumido nas seguintes linhas auto-explicativas, acompanhadas de uns poucos coment´arios ao final: Plm (z)

:= = Leibniz

=

 (1 − z 2 )m/2 dl+m  2 l (z − 1) 2l l! dz l+m

 (1 − z 2 )m/2 dl+m  l l (z − 1) (z + 1) 2l l! dz l+m

 l+m   l+m−p   (1 − z 2 )m/2 X l + m dp  l d l (z − 1) (z + 1) 2l l! dz p dz l+m−p p p=0

=

 l   dl+m−p   (1 − z 2 )m/2 X l + m dp  l l (z − 1) (z + 1) 2l l! dz p dz l+m−p p p=m

=

   l  (1 − z 2 )m/2 X l + m l! l! l−p p−m (z − 1) (z + 1) 2l l! p (l − p)! (p − m)! p=m

=

 l  (1 − z 2 )m/2 X l + m (l!)2 (z − 1)l−p (z + 1)p−m p 2l l! (l − p)! (p − m)! p=m

(∗)

(∗∗)

=

 l  − 1)m (1 − z 2 )m/2 X l + m (l!)2 (−1) (z − 1)l−p (z + 1)p−m (1 − z 2 )m 2l l! (l − p)! (p − m)! p p=m m (z

2

JCABarata. Curso de F´ısica-Matem´ atica

=

p→p+m

=

=

=

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

542/1304

 l  (l!)2 (−1)m (1 − z 2 )−m/2 X l + m (z − 1)l−p+m (z + 1)p p 2l l! (l − p)! (p − m)! p=m  l−m  (−1)m (1 − z 2 )−m/2 X l + m (l!)2 (z − 1)l−p (z + 1)p+m 2l l! (l − p − m)! p! p + m p=0 l−m (−1)m (1 − z 2 )−m/2 X (l + m)! (l!)2 (z − 1)l−p (z + 1)p+m 2l l! (l − p)! (p + m)! (l − p − m)! p! p=0

(−1)m

l−m (l + m)! (1 − z 2 )−m/2 X (l − m)! (l!)2 (z − 1)l−p (z + 1)p+m (l − m)! 2l l! (l − p)! (p + m)! (l − p − m)! p! p=0

=

   l−m  l! + m)! (1 − z 2 )−m/2 X l − m l! l−p p+m (z − 1) (z + 1) (−1) p (l − m)! 2l l! (l − p)! (p + m)! p=0

=

 p   l−m−p  l−m  d d + m)! (1 − z 2 )−m/2 X l − m l l (z − 1) (z + 1) (−1) p l−m−p p (l − m)! 2l l! dz dz p=0

m (l

m (l

Leibniz

=

(−1)m

=

(−1)m

 (l + m)! (1 − z 2 )−m/2 dl−m l l (z − 1) (z + 1) (l − m)! 2l l! dz l−m

(l + m)! (1 − z 2 )−m/2 dl−m 2 (l + m)! −m (z − 1)l = (−1)m P (z) , l l−m (l − m)! 2 l! dz (l − m)! l

como quer´ıamos provar. p

l+m−p

d d l l No ponto indicado por (∗) acima, usamos o fato que dz p (z − 1) = 0 se p > l e dz l+m−p (z − 1) = 0 se l + m − p > l. Ambas as condi¸co˜es juntas implicam m ≤ p ≤ l, da´ı a mudan¸ca nos limites da soma. 2 −1)m . Na linha seguinte No ponto indicado por (∗∗) multiplicamos toda a express˜ao por 1 = (−1)m (z (1−z 2 )m 2 m m m o fator (z − 1) ´e escrito como (z − 1) (z + 1) e distribu´ıdo dentro da soma. Fora isso, usamos tamb´em que (1−z12 )m (1 − z 2 )m/2 = (1 − z 2 )−m/2 .

JCABarata. Curso de F´ısica-Matem´ atica

9.2

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 9

543/1304

Exerc´ıcios Adicionais

E. 9.23 Exerc´ıcio. A id´eia deste exerc´ıcio ´e provar as rela¸co˜es de ortogonalidade dos polinˆomios de Legendre usando a f´ormula de Rodrigues. a) Usando a f´ormula de Rodrigues para os polinˆomios de Legendre, express˜ao (9.29), p´agina 497, mostre que

Z

1

xm Pn (x)dx = 0

(9.1)

−1

para todo 0 ≤ m < n, m inteiro. Sugest˜ ao: integra¸c˜ao por partes. b) Mostre que

para todo n ∈



.

Z

1 −1

c) Mostre que

Sugest˜ ao: use a express˜ao do item b.

(x2 − 1)n dx = (−1)n

Z

22n+1 (n!)2 (2n + 1)!

1

2n+1 (n!)2 x Pn (x)dx = . (2n + 1)! −1 n

(9.2)

d) Usando (9.1) e (9.2) mostre a validade das rela¸co˜es de ortogonalidade Z 1 2 δn, m . Pn (x)Pm (x)dx = 2n + 1 −1 Sugest˜ ao: use a express˜ao (9.21) para os polinˆomios de Legendre.

6

Cap´ıtulo 10 Alguns Problemas Selecionados de Interesse F´ısico Conte´ udo 10.1 As Equa¸ co ˜es de Helmholtz e de Laplace . . . . . . . . . . . . . . . . . . . . 544 10.1.1 Problemas em Duas Dimens˜oes em Coordenadas Polares . . . . . . . . . . . . 546 10.1.2 Problemas em Trˆes Dimens˜oes em Coordenadas Esf´ericas . . . . . . . . . . . 549 10.2 O Problema da Corda Vibrante . . . . . . . . . . . . . . . . . . . . . . . . . 553 10.2.1 Corda Vibrante Homogˆenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553 10.2.2 O Problema da Corda Homogˆenea Pendurada . . . . . . . . . . . . . . . . . . 556 10.2.3 Corda Vibrante N˜ao-Homogˆenea . . . . . . . . . . . . . . . . . . . . . . . . . 560 10.3 O Problema da Membrana Circular . . . . . . . . . . . . . . . . . . . . . . 564 10.4 O Oscilador Harmˆ onico na Mecˆ anica Quˆ antica e a Equa¸ ca ˜o de Hermite 567 ´ 10.5 O Atomo de Hidrogˆ enio e a Equa¸ ca ˜o de Laguerre Associada . . . . . . . 568 10.6 Propaga¸ ca ˜o de Ondas em Tanques Cil´ındricos . . . . . . . . . . . . . . . . 571 10.7 Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 582

este cap´ıtulo ilustramos alguns problemas f´ısicos dos quais emergem algumas das equa¸co˜es diferenciais ordin´arias que temos estudado, tais como as equa¸co˜es de Euler, de Bessel, de Legendre, de Legendre associada, de Bessel esf´erica, de Hermite, de Laguerre e de Laguerre associada. O estudante que estiver procurando a motiva¸ca˜o e a origem f´ısica daquelas equa¸co˜es poder´a ler parcialmente a presente se¸ca˜o sem precisar dominar totalmente o material anteriormente apresentado, pelo menos at´e o ponto em que apresentarmos as solu¸co˜es das equa¸co˜es. Tamb´em evocaremos no que segue o chamado m´etodo de separa¸ca˜o de vari´aveis e alguns teoremas de unicidade de solu¸ca˜o de equa¸co˜es diferenciais parciais. Tais assuntos s˜ao discutidos no Cap´ıtulo 11 ao qual o estudante poder´a passar sem perdas, se julgar necess´ario.

10.1

As Equa¸ co ˜es de Helmholtz e de Laplace

Nesta se¸ca˜o apresentaremos alguns problemas envolvendo as equa¸co˜es diferenciais parciais de Laplace e Helmholtz dos quais emergem, pelo m´etodo de separa¸ca˜o de vari´aveis, algumas das equa¸co˜es diferenciais ordin´arias – e suas solu¸co˜es – de que tratamos em cap´ıtulos anteriores. O m´etodo de separa¸ca˜o de vari´aveis ´e discutido na Se¸ca˜o 11.2, p´agina 587. • A equa¸ c˜ ao de onda A equa¸ca˜o de onda

∂2u (~x, t) − c2 ∆u(~x, t) = 0 ∂t2 544

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

545/1304

com c > 0, pode ser tratada pelo procedimento de separa¸ca˜o de vari´aveis, atrav´es do qual procuramos solu¸co˜es independentes que sejam da forma de um produto u(~x, t) = T (t)E(~x). Por substitui¸ca˜o na equa¸ca˜o de onda, somos rapidamente levados a` seguinte equa¸ca˜o: 1 T 00 (t) ∆E(~x) = . 2 c T (t) E(~x) Como o lado esquerdo ´e uma fun¸ca˜o somente de t e o lado direito uma fun¸ca˜o somente das coordenadas espaciais ~x, a igualdade acima s´o ´e poss´ıvel se ambos os lados forem iguais a uma constante, a qual denotaremos por −λ2 . Assim, conclu´ımos que T 00 (t) + (cλ)2 T (t) = 0 ,

(10.1)

∆E(~x) + λ2 E(~x) = 0 .

(10.2)

Obtemos por esse procedimento duas equa¸co˜es, uma envolvendo apenas a fun¸ca˜o T , outra a fun¸ca˜o E e uma inc´ognita extra, a constante λ, a qual dever´a ser determinada pela fixa¸ca˜o de certas condi¸co˜es adicionais sobre o problema, por exemplo, atrav´es de condi¸co˜es de contorno. Tais constantes que aparecem quando do m´etodo de separa¸ca˜o de vari´aveis s˜ao denominadas constantes de separa¸ca ˜o. A solu¸ca˜o da equa¸ca˜o temporal ´e bem simples: T (t) = β1 + β2 t ,

caso λ = 0 ,

T (t) = α1 cos(λct) + α2 sen (λct) ,

caso λ 6= 0 ,

(10.3) onde α1 , α2 , β1 e β2 s˜ao constantes arbitr´arias a serem tipicamente fixadas por condi¸co˜es iniciais. • A equa¸ c˜ ao de difus˜ ao A equa¸ca˜o de difus˜ao

∂u (~x, t) − K∆u(~x, t) = 0 ∂t com K > 0, pode ser tratada pelo procedimento de separa¸ca˜o de vari´aveis, atrav´es do qual procuramos solu¸co˜es independentes que sejam da forma de um produto u(~x, t) = T (t)E(~x). Por substitui¸ca˜o na equa¸ca˜o de onda, somos rapidamente levados a` seguinte equa¸ca˜o: ∆E(~x) 1 T 0 (t) = . K T (t) E(~x) Como o lado esquerdo ´e uma fun¸ca˜o somente de t e o lado direito uma fun¸ca˜o somente das coordenadas espaciais ~x, a igualdade acima s´o ´e poss´ıvel se ambos os lados forem iguais a uma constante, a qual denotaremos por −λ2 . Assim, conclu´ımos que T 0 (t) + λ2 K T (t) = 0 , ∆E(~x) + λ2 E(~x) = 0 .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

546/1304

Obtemos por esse procedimento duas equa¸co˜es, uma envolvendo apenas a fun¸ca˜o T , outra a fun¸ca˜o E e uma inc´ognita extra, a constante λ, a qual dever´a ser determinada pela fixa¸ca˜o de certas condi¸co˜es adicionais sobre o problema, por exemplo, atrav´es de condi¸co˜es de contorno. A solu¸ca˜o da equa¸ca˜o temporal ´e bem simples: T (t) = β1 ,

caso λ = 0 , (10.4)

T (t) = α1 e

−λ2 Kt

,

caso λ 6= 0 ,

onde α1 e β1 s˜ao constantes arbitr´arias a serem tipicamente fixadas por condi¸co˜es iniciais. • As equa¸ co ˜es de Helmholtz e de Laplace Como se observa, tanto no caso da equa¸ca˜o de onda quanto no caso da equa¸ca˜o de difus˜ao, a fun¸ca˜o E(~x), que contem a dependˆencia espacial da fun¸ca˜o u(~x, t), satisfaz a equa¸ca˜o diferencial parcial ∆E(~x) + λ2 E(~x) = 0 , com λ constante. No caso em que λ 6= 0 essa equa¸ca˜o diferencial parcial ´e denominada equa¸ca ˜o de 1 2 Helmholtz . No caso λ = 0 temos a chamada equa¸ca ˜o de Laplace ∆E(~x) = 0 . Essa u ´ ltima equa¸ca˜o aparece em v´arios outros contextos, por exemplo na Eletrost´atica. Trataremos dessas duas equa¸co˜es em duas e trˆes dimens˜oes em coordenadas polares e esf´ericas, respectivamente.

10.1.1

Problemas em Duas Dimens˜ oes em Coordenadas Polares

• A Equa¸ c˜ ao de Laplace em duas dimens˜ oes em coordenadas polares O operador Laplaciano em duas dimens˜oes em coordenadas polares assume a forma   1 ∂ ∂u 1 ∂2u ∆u = ρ + 2 2 ρ ∂ρ ∂ρ ρ ∂ϕ

(10.5)

e a equa¸ca˜o de Laplace fica

  ∂E 1 ∂2E 1 ∂ ρ + 2 = 0. ρ ∂ρ ∂ρ ρ ∂ϕ2 E agora ´e tomada como uma fun¸ca˜o de ρ e ϕ. O m´etodo de separa¸ca˜o de vari´aveis prop˜oe procurarmos solu¸co˜es independentes dessa equa¸ca˜o que sejam da forma de um produto: E(ρ, ϕ) = Ξ(ρ)Φ(ϕ). Inserindo isso na equa¸ca˜o de Laplace, somos levados a ρ (ρΞ0 (ρ))0 Φ00 (ϕ) = − . Ξ(ρ) Φ(ϕ) 1 2

Hermann Ludwig Ferdinand von Helmholtz (1821-1894). Pierre-Simon Laplace (1749-1827).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

547/1304

Como o lado esquerdo ´e uma fun¸ca˜o somente de ρ e o lado direito uma fun¸ca˜o somente de ϕ, a igualdade acima s´o ´e poss´ıvel se ambos os lados forem iguais a uma constante de separa¸ca˜o, a qual denotaremos por ν 2 . Assim, conclu´ımos que ρ2 Ξ00 (ρ) + ρΞ0 (ρ) − ν 2 Ξ(ρ) = 0 , Φ00 (ϕ) + ν 2 Φ(ϕ) = 0 . Reconhecemos que a equa¸ca˜o para Ξ ´e uma equa¸ c˜ ao de Euler, cuja solu¸ca˜o geral ´e α ν ρν + βν ρ−ν , caso ν 6= 0, ou α0 ln(ρ) + β0 , caso ν = 0. Aqui, α’s e β’s s˜ao constantes arbitr´arias. Conclu´ımos que a equa¸ca˜o de Laplace em duas dimens˜oes em coordenadas polares possui solu¸co˜es independentes da forma    E(ρ, ϕ) = α0 ln(ρ) + β0 δ0 ϕ + γ0 , caso ν = 0 , E(ρ, ϕ) =



ν

αν ρ + β ν ρ

−ν





δν cos(νϕ) + γν sen (νϕ) ,

(10.6)

caso ν 6= 0 .

Acima α’s, β’s, γ’s e δ’s s˜ao constantes arbitr´arias a serem fixadas por condi¸co˜es adicionais a serem impostas a` solu¸ca˜o. Por exemplo, se desejarmos que as solu¸co˜es sejam fun¸co˜es peri´odicas em ϕ de per´ıodo 2π, ent˜ao devemos impor que δ0 = 0 e que ν seja um inteiro. A solu¸ca˜o geral da equa¸ca˜o de Laplace em duas dimens˜oes que representa fun¸co˜es peri´odicas de per´ıodo 2π em ϕ ´e, portanto, ∞    X m −m u(ρ, ϕ) = γ0 ln(ρ) + αm ρ + β m ρ δm cos(mϕ) + γm sen (mϕ) , m=−∞

ou, em forma complexa,

u(ρ, ϕ) = γ0 ln(ρ) +

∞  X

m=−∞

 am ρm + bm ρ−m eimϕ ,

onde γ0 , am e bm s˜ao constantes a serem determinadas por condi¸co˜es adicionais a serem impostas a` solu¸ca˜o. • A Equa¸ c˜ ao de Helmholtz em duas dimens˜ oes em coordenadas polares Devido a` forma do operador Laplaciano em duas dimens˜oes em coordenadas polares dada em (10.5), a equa¸ca˜o de Helmholtz assume a forma   1 ∂ ∂E 1 ∂2E ρ + 2 + λ2 E = 0 . 2 ρ ∂ρ ∂ρ ρ ∂ϕ E agora ´e tomada como uma fun¸ca˜o de ρ e ϕ. O m´etodo de separa¸ca˜o de vari´aveis prop˜oe procurarmos solu¸co˜es independentes dessa equa¸ca˜o que sejam da forma de um produto: E(ρ, ϕ) = Ξ(ρ)Φ(ϕ). Inserindo isso na equa¸ca˜o de Helmholtz, somos levados a Φ00 (ϕ) ρ (ρΞ0 (ρ))0 2 2 +λ ρ = − . Ξ(ρ) Φ(ϕ)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

548/1304

Como o lado esquerdo ´e uma fun¸ca˜o somente de ρ e o lado direito uma fun¸ca˜o somente de ϕ, a igualdade acima s´o ´e poss´ıvel se ambos os lados forem iguais a uma constante de separa¸ca˜o, a qual denotaremos por ν 2 . Assim, conclu´ımos que ρ2 Ξ00 (ρ) + ρΞ0 (ρ) + (λ2 ρ2 − ν 2 )Ξ(ρ) = 0 , Φ00 (ϕ) + ν 2 Φ(ϕ) = 0 . Pela mudan¸ca de vari´avel3 z = λρ e definindo y(z) = y(λρ) = Ξ(ρ), a primeira equa¸ca˜o acima transforma-se em z 2 y 00 (z) + zy 0 (z) + (z 2 − ν 2 )y(z) = 0 ,

que podemos reconhecer como sendo a equa¸ c˜ ao de Bessel de ordem ν.

Vemos assim que o m´etodo de separa¸ca˜o de vari´aveis para a equa¸ca˜o de Helmholtz em duas dimens˜oes em coordenadas polares conduz a solu¸co˜es independentes da forma E(ρ, ϕ) = y(λρ)Φ(ϕ) onde as fun¸co˜es y e Φ satisfazem as equa¸co˜es ordin´arias z 2 y 00 (z) + zy 0 (z) + (z 2 − ν 2 )y(z) = 0 , Φ00 (ϕ) + ν 2 Φ(ϕ) = 0 . sendo z = λρ. Conclu´ımos que a equa¸ca˜o de Helmholtz em duas dimens˜oes em coordenadas polares possui solu¸co˜es independentes da forma    E(ρ, ϕ) = α0 J0 (λρ) + β0 N0 (λρ) δ0 ϕ + γ0 , caso ν = 0 , (10.7)    E(ρ, ϕ) =

αν Jν (λρ) + βν Nν (λρ)

δν cos(νϕ) + γν sen (νϕ) ,

caso ν 6= 0 .

Acima, Jν s˜ao as fun¸co˜es de Bessel de ordem ν e Nν s˜ao as fun¸co˜es de Neumann de ordem ν. Fora isso, α’s, β’s, γ’s e δ’s s˜ao constantes arbitr´arias a serem fixadas por condi¸co˜es adicionais a serem impostas a` solu¸ca˜o. Por exemplo, se desejarmos que as solu¸co˜es sejam fun¸co˜es peri´odicas em ϕ de per´ıodo 2π, ent˜ao devemos impor que δ0 = 0 e que ν seja um inteiro. A solu¸ca˜o geral da equa¸ca˜o de Helmholtz em duas dimens˜oes que representa fun¸co˜es peri´odicas de per´ıodo 2π em ϕ ´e, portanto, u(ρ, ϕ) =

∞  X

αm Jm (λρ) + βm Nm (λρ)

m=−∞



 δm cos(mϕ) + γm sen (mϕ) ,

ou, em forma complexa, u(ρ, ϕ) =

∞  X

m=−∞ 3

Aqui supomos λ 6= 0.

 am Jm (λρ) + bm Nm (λρ) eimϕ ,

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

549/1304

onde am e bm s˜ao constantes a serem determinadas por condi¸co˜es adicionais a serem impostas a` solu¸ca˜o. Recomendamos ao leitor o exerc´ıcio instrutivo de comparar as equa¸co˜es radiais obtidas acima no caso de Laplace e de Helmholtz em duas dimens˜oes, assim como suas solu¸co˜es.

10.1.2

Problemas em Trˆ es Dimens˜ oes em Coordenadas Esf´ ericas

• A Equa¸ c˜ ao de Laplace em trˆ es dimens˜ oes em coordenadas esf´ ericas O operador Laplaciano em trˆes dimens˜oes em coordenadas esf´ericas assume a forma       1 ∂ ∂u 1 1 ∂ ∂2u 2 ∂u . ∆u = 2 r + ( sen θ) + r ∂r ∂r sen θ ∂θ ∂θ ( sen θ)2 ∂ϕ2

(10.8)

Assim, a equa¸ca˜o de Laplace em trˆes dimens˜oes em coordenadas esf´ericas fica       1 ∂ 1 ∂ ∂E 1 ∂2E 2 ∂E r + ( sen θ) + = 0, r 2 ∂r ∂r sen θ ∂θ ∂θ ( sen θ)2 ∂ϕ2 onde E agora ´e uma fun¸ca˜o de r, θ e ϕ. O m´etodo de separa¸ca˜o de vari´aveis prop˜oe procurarmos solu¸co˜es independentes dessa equa¸ca˜o que sejam da forma de um produto: E(r, θ, ϕ) = R(r)Y (θ, ϕ). Inserindo isso na equa¸ca˜o de Laplace, somos levados a     0 1 ∂ 1 ∂Y 1 ∂2Y (r 2 R0 (r)) = − ( sen θ) (θ, ϕ) + (θ, ϕ) . R(r) Y (θ, ϕ) sen θ ∂θ ∂θ ( sen θ)2 ∂ϕ2 Mais uma vez constatamos que, pelo fato de o lado esquerdo ser fun¸ca˜o apenas de r enquanto que o lado direito ´e fun¸ca˜o de θ e ϕ, a igualdade acima implica que ambos os lados devem ser iguais a uma constante. Por conveniˆencia futura, escrevemos essa constante na forma σ(σ + 1) (note que todo n´ umero complexo c pode ser escrito dessa forma, pois a equa¸ca˜o σ 2 + σ − c = 0 sempre tem pelo menos uma solu¸ca˜o). Conclu´ımos que

1 ∂ sen θ ∂θ



r 2 R00 (r) + 2rR0 (r) − σ(σ + 1)R(r) = 0 .

 ∂Y 1 ∂2Y ( sen θ) (θ, ϕ) + (θ, ϕ) + σ(σ + 1)Y (θ, ϕ) = 0 . ∂θ ( sen θ)2 ∂ϕ2

(10.9) (10.10)

Reconhecemos que a equa¸ca˜o para R ´e uma equa¸ c˜ ao de Euler, cujas solu¸co˜es s˜ao R(r) = α1 r σ + α2 r −(1+σ) , R(r) = r

− 21

(α1 ln(r) + α2 ),

caso σ 6= − 12 caso σ =

.

(10.11)

− 12

Passemos agora a` equa¸ca˜o para Y (θ, ϕ), a qual propomos novamente tratar pelo m´etodo de separa¸ca˜o de vari´aveis. Tomemos, ent˜ao, Y na forma de um produto Y (θ, ϕ) = Θ(θ)Φ(ϕ). Somos conduzidos a   dΘ Φ00 (ϕ) sen θ d 2 ( sen θ) (θ) + σ(σ + 1)( sen θ) = − . Θ(θ) dθ dθ Φ(ϕ)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

550/1304

Mais uma vez, a igualdade acima s´o ´e poss´ıvel se ambos os lados forem iguais a uma constante, que escrevemos na forma µ2 . Ficamos com   µ2 dΘ 1 d Θ(θ) = 0 , (10.12) sen (θ) (θ) + σ(σ + 1)Θ(θ) − sen (θ) dθ dθ ( sen (θ))2 Φ00 (ϕ) + µ2 Φ(ϕ) = 0 . A equa¸ca˜o para Φ tem por solu¸co˜es   δ0 ϕ + γ 0 , Φ(ϕ) =  δµ cos(µϕ) + γµ sen (µϕ) ,

(10.13)

caso µ = 0 , (10.14) caso µ 6= 0 .

Claramente, se desejarmos que Φ(ϕ) seja cont´ınua e peri´odica de per´ıodo 2π devemos impor que δ 0 = 0 e que µ seja um inteiro, ou seja, µ = m ∈ em cujo caso a solu¸ca˜o fica Φ(ϕ) = δm cos(mϕ)+γm sen (mϕ) para todo µ = m ∈ (inclusive m = 0). Essa solu¸ca˜o pode tamb´em ser escrita de forma complexa como Φ(ϕ) = am eimϕ + bm e−imϕ para outras constantes am e bm . A experiˆencia ensina que para melhor tratarmos a equa¸ca˜o (10.12) convem proceder a mudan¸ca de vari´avel d 1 d ζ = cos θ, com = − . dζ sen (θ) dθ Definindo tamb´em y(ζ) = Θ(θ), ou seja, Θ(θ) = y(cos θ), a equa¸ca˜o diferencial para Θ transforma-se em   µ2 d 2 dy (1 − ζ ) (ζ) + σ(σ + 1) y(ζ) − y(ζ) = 0 , dζ dζ 1 − ζ2

ou, equivalentemente,

(1 − ζ 2 )y 00 (ζ) − 2ζy 0(ζ) + σ(σ + 1) y(ζ) −

µ2 y(ζ) = 0 . 1 − ζ2

Reconhecemos que se trata da equa¸ c˜ ao de Legendre associada. Por (10.14) vemos que para o caso em que Φ ´e cont´ınua e peri´odica de per´ıodo 2π devemos necessariamente ter µ = m ∈ . Como discutimos quando tratamos da equa¸ca˜o de Legendre associada, se desejarmos tamb´em que y(ζ) seja finita nos extremos ±1 (ou seja, que Θ(θ) seja finita nos extremos θ = 0 e θ = π), devemos ter tamb´em que σ = l ∈ , sendo que l e m relacionam-se por −l ≤ m ≤ l. As solu¸co˜es para y(ζ) nesse caso s˜ao os polinˆomios de Legendre associados y(ζ) = Plm (ζ) ou, em termos de θ, Θ(θ) = Plm (cos(θ)). 

Conclu´ımos, assim, que se desejarmos solu¸co˜es que sejam peri´odicas de per´ıodo 2π em ϕ e finitas nos extremos θ = 0 e θ = π, temos   Y (θ, ϕ) = Plm (cos(θ)) δm cos(mϕ) + γm sen (mϕ) ou, em forma complexa,

  Y (θ, ϕ) = Plm (cos(θ)) am eimϕ + bm e−imϕ .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

551/1304

Constatamos que o lado direito ´e uma combina¸ca˜o linear dos harmˆonicos esf´ericos Y lm (θ, ϕ) e Yl−m (θ, ϕ), definidos em (9.65). Assim, retornando a` E(r, θ, ϕ), conclu´ımos que sob as condi¸co˜es mencionadas a equa¸ca˜o de Laplace tem solu¸co˜es independentes da forma   β l E(r, θ, ϕ) = α r + l+1 Ylm (θ, ϕ) , r com l ∈ , m ∈ e −l ≤ m ≤ l, α e β sendo constantes. Acima, adotamos para a parte radial a primeira solu¸ca˜o de (10.11), pois σ = l ∈ e, portanto, σ 6= − 21 . 



A solu¸ca˜o geral da equa¸ca˜o de Laplace em trˆes dimens˜oes que representa fun¸co˜es peri´odicas de per´ıodo 2π em ϕ e finitas nos extremos θ = 0 e θ = π ´e, portanto, u(r, θ, ϕ) =

 ∞ X l X l=0 m=−l

βl, m αl, m r + l+1 r l



Ylm (θ, ϕ) .

Aqui, αl, m e βl, m s˜ao constantes a serem determinadas por condi¸co˜es adicionais a serem impostas a` solu¸ca˜o. • Expans˜ ao de multipolos Se soubermos a priori que a solu¸ca˜o u(r, θ, ϕ) converge a 0 para r → ∞, podemos supor que as constantes αl, m , acima, se anulam. Nesse caso a solu¸ca˜o reduz-se a ∞ X l X βl, m m u(r, θ, ϕ) = Y (θ, ϕ) . r l+1 l l=0 m=−l

Essa situa¸ca˜o ocorre, por exemplo, na Eletrost´atica quando lidamos com o problema de determinar o potencial el´etrico produzido por uma distribui¸ca˜o de cargas el´etricas est´aticas limitadas a uma regi˜ao finita. Nesse caso a expans˜ao acima ´e denominada expans˜ ao de multipolos. O mesmo tipo de situa¸ca˜o ocorre se desejarmos determinar o potencial gravitacional produzido por uma distribui¸ca˜o de mat´eria limitada a uma regi˜ao finita (por exemplo, um planeta). Se soubermos a priori, por exemplo, por considera¸co˜es de simetria, que a fun¸ca˜o u(r, θ, ϕ) n˜ao depende da vari´avel ϕ, ent˜ao os termos da soma com m 6= 0 devem ser todos nulos. Como Y l0 (θ, ϕ) = q 2l+1 Pl (cos(θ)), 4π

onde Pl s˜ao os polinˆomios de Legendre, obtemos apenas u(r, θ) =

∞  X l=0

βl αl r + l+1 r l



Pl (cos(θ))

(10.15)

para certas constantes αl e βl . Novamente, se tamb´em soubermos que a solu¸ca˜o u(r, θ) converge a 0 para r → ∞, podemos supor que as constantes αl , acima, anulam-se, e obtemos para a expans˜ao de multipolos ∞ X βl Pl (cos(θ)) . (10.16) u(r, θ) = r l+1 l=0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

552/1304

Historicamente, o problema que conduziu Legendre aos polinˆomios de Legendre foi o de determinar o potencial gravitacional de uma distribui¸ca˜o de mat´eria limitada a uma regi˜ao finita e sim´etrica em rela¸ca˜o ao eixo z. Isso conduziu-o a` fun¸ca˜o geratriz dos polinˆomios de Legendre (express˜ao (9.35), p´agina 499), da qual ele derivou a express˜ao para os Pl (cos(θ)) como polinˆomios em cos(θ) e, da´ı, a` u ´ ltima express˜ao. • A Equa¸ c˜ ao de Helmholtz em trˆ es dimens˜ oes em coordenadas esf´ ericas Devido a` forma assumida pelo operador Laplaciano, expressa em (10.8), a equa¸ca˜o de Helmholtz em trˆes dimens˜oes em coordenadas esf´ericas assume a forma       1 ∂ ∂E 1 ∂2E 1 ∂ 2 ∂E + λ2 E = 0 , r + ( sen θ) + 2 2 2 r ∂r ∂r sen θ ∂θ ∂θ ( sen θ) ∂ϕ onde E agora ´e uma fun¸ca˜o de r, θ e ϕ. O m´etodo de separa¸ca˜o de vari´aveis prop˜oe procurarmos solu¸co˜es independentes dessa equa¸ca˜o que sejam da forma de um produto: E(r, θ, ϕ) = R(r)Y (θ, ϕ). Inserindo isso na equa¸ca˜o de Helmholtz, somos levados a     0 (r 2 R0 (r)) ∂2Y 1 1 1 ∂ ∂Y 2 2 +λ r = − (θ, ϕ) + (θ, ϕ) . ( sen θ) R(r) Y (θ, ϕ) sen θ ∂θ ∂θ ( sen θ)2 ∂ϕ2 Mais uma vez constatamos que, pelo fato de o lado esquerdo ser fun¸ca˜o apenas de r enquanto que o lado direito ´e fun¸ca˜o de θ e ϕ, a igualdade acima implica que ambos os lados devem ser iguais a uma constante. Por conveniˆencia futura, escrevemos essa constante na forma σ(σ + 1) (note que todo n´ umero complexo c pode ser escrito dessa forma, pois a equa¸ca˜o σ 2 + σ − c = 0 sempre tem pelo menos uma solu¸ca˜o). Conclu´ımos que   r 2 R00 (r) + 2rR0 (r) + λ2 r 2 − σ(σ + 1) R(r) = 0 , (10.17) 1 ∂ sen θ ∂θ



 ∂2Y 1 ∂Y (θ, ϕ) + (θ, ϕ) + σ(σ + 1)Y (θ, ϕ) = 0 . ( sen θ) ∂θ ( sen θ)2 ∂ϕ2

(10.18)

Reconhecemos que a equa¸ca˜o para Y (θ, ϕ) ´e precisamente a mesma que obtivemos no caso da equa¸ca˜o de Laplace em trˆes dimens˜oes em coordenadas esf´ericas. Assim, se desejarmos solu¸co˜es para Y (θ, ϕ) que sejam peri´odicas de per´ıodo 2π em ϕ e finitas nos extremos θ = 0 e θ = π, teremos que fixar σ = l ∈ e Y (θ, ϕ) ser´a uma combina¸ca˜o linear de Ylm (θ, ϕ) e Yl−m (θ, ϕ), onde m ∈ com −l ≤ m ≤ l. 

Concentremo-nos agora na equa¸ca˜o radial. Pela mudan¸ca de vari´avel 4 z = λr e definindo y(z) = y(λr) = R(r), a equa¸ca˜o (10.17) acima transforma-se em z 2 y 00 (z) + 2zy 0 (z) + (z 2 − σ(σ + 1))y(z) = 0 , que podemos reconhecer como sendo a equa¸ c˜ ao de Bessel esf´ erica de ordem σ. Como mencionamos, estamos interessados primordialmente no caso em que σ = l ∈ . Obtemos, nesse caso 

R(r) = a jl (λr) + b nl (λr), 4

Aqui supomos λ 6= 0.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

553/1304

onde a e b s˜ao constantes e jl e nl s˜ao as fun¸co˜es de Bessel esf´ericas de ordem l e de Neumann esf´ericas de ordem l, respectivamente. Retornando a E(r, θ, ϕ), conclu´ımos que, sob as hip´oteses delineadas acima, a equa¸ca˜o de Helmholtz em trˆes dimens˜oes possui solu¸co˜es independentes da forma   E(r, θ, ϕ) = α jl (λr) + β nl (λr) Ylm (θ, ϕ) , com l ∈



,m∈

e −l ≤ m ≤ l, α e β sendo constantes.

A solu¸ca˜o geral da equa¸ca˜o de Helmholtz em trˆes dimens˜oes que representa fun¸co˜es peri´odicas de per´ıodo 2π em ϕ e finitas nos extremos θ = 0 e θ = π ´e, portanto, u(r, θ, ϕ) =

∞ X l  X l=0 m=−l

 αl, m jl (λr) + βl, m nl (λr) Ylm (θ, ϕ) .

Aqui, αl, m e βl, m s˜ao constantes a serem determinadas por condi¸co˜es adicionais a serem impostas a` solu¸ca˜o. Recomendamos ao leitor o exerc´ıcio instrutivo de comparar as equa¸co˜es radiais obtidas acima no caso de Laplace e de Helmholtz em trˆes dimens˜oes, assim como suas solu¸co˜es.

10.2

O Problema da Corda Vibrante

Se considerarmos o problema de determinar o movimento transversal, no regime de pequenas oscila¸co˜es, de uma corda de comprimento L, de densidade linear de massa ρ(x), com 0 ≤ x ≤ L, submetida a uma tens˜ao longitudinal τ (x), chegaremos a` equa¸ca˜o diferencial   ∂2u ∂u ∂ ρ(x) 2 − τ (x) = 0, (10.19) ∂t ∂x ∂x onde u(x, t) representa o deslocamento transversal, no instante de tempo t, do ponto x da corda. A express˜ao acima ´e conseq¨ uˆencia, essencialmente, da segunda lei de Newton e sua dedu¸ca˜o pode ser acompanhada, por exemplo, em [33]. O estudo das solu¸co˜es de (10.19) ´e um cl´assico problema de Mecˆanica dos Meios Deform´aveis e da Teoria das Equa¸co˜es Diferenciais, tendo suas origens nos trabalhos pioneiros de Euler5 e Daniel Bernoulli6 na primeira metade do s´ec. XVIII. O m´etodo de separa¸ca˜o de vari´aveis, o m´etodo de expans˜ao em modos normais, e outras id´eias que tiveram sua aplica¸ca˜o estendida a outros campos, originaram-se daqueles estudos.

10.2.1

Corda Vibrante Homogˆ enea

O caso mais simples da equa¸ca˜o (10.19) ´e aquele no qual ρ(x) ≡ ρ0 e τ (x) ≡ τ0 s˜ao constantes, em cujo caso (10.19) assume a forma r 2 ∂2u τ0 2∂ u . (10.20) − c = 0 , c = ∂t2 ∂x2 ρ0 5 6

Leonhard Euler (1707-1783). Daniel Bernoulli (1700-1782).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

554/1304

Uma corda com ρ(x) ≡ ρ0 constante ´e dita ser uma corda homogˆenea.

Na situa¸ca˜o em que a corda encontra-se presa em suas extremidades localizadas em x = 0 e x = L, as condi¸co˜es de contorno a serem impostas s˜ao u(0, t) = 0 para todo t e u(L, t) = 0 para todo t. Tipicamente considera-se tamb´em condi¸co˜es iniciais que fixam a posi¸ca˜o e velocidade transversais da corda em t = 0: u(x, 0) = u0 (x) e ∂u (x, 0) = v0 (x), sendo u0 e v0 duas fun¸co˜es dadas, dotadas de ∂t propriedades convenientes.

Para encontrar as solu¸co˜es de (10.20) satisfazendo as condi¸co˜es iniciais e de contorno mencionadas acima, procede-se pelo m´etodo de separa¸ca˜o de vari´aveis, procurando primeiramente solu¸co˜es particulares que sejam da forma u(x, t) = T (t)U (x). Inserindo em (10.20), obtem-se U 00 (x) 1 T 00 (t) = . c2 T (t) U (x) Essa igualdade s´o ´e poss´ıvel se ambos os lados forem iguais a uma constante de separa¸ca˜o, que denotamos por −λ2 . Chegamos com isso a T 00 (t) + λ2 c2 T (t) = 0 ,

(10.21)

U 00 (x) + λ2 U (x) = 0 .

(10.22)

As solu¸co˜es da primeira equa¸ca˜o, naturalmente, s˜ao T (t) = a0 t + b0 ,

caso λ = 0 ,

T (t) = a1 cos(λct) + b1 sen (λct) ,

(10.23) caso λ 6= 0 .

(10.24)

Para λ = 0 a equa¸ca˜o (10.22) reduz-se a U 00 (x) = 0, cuja solu¸ca˜o ´e U (x) = c1 x + c2 . Como desejamos que U (0) = U (L) = 0, de modo que u(x, t) = T (t)U (x) satisfa¸ca as condi¸co˜es de contorno, obtem-se c1 = c2 = 0, ou seja, obtem-se a solu¸ca˜o trivial U (x) ≡ 0, o que corresponde a uma corda eternamente parada. O caso interessante, portanto, est´a em λ 6= 0. No caso λ 6= 0, as solu¸co˜es de (10.22) s˜ao, como ´e bem conhecido, U (x) = β1 cos(λx) + β2 sen (λx) . A imposi¸ca˜o que U (0) = 0 implica β1 = 0, levando a U (x) = β2 sen (λx). A imposi¸ca˜o que U (L) = 0 implica λL = nπ, com n ∈  (tomar β2 = 0 conduz novamente a` solu¸ca˜o trivial U (x) ≡ 0) e, assim, U (x) = Un (x) = β2 sen nπx , n ∈ . Em verdade, podemos nos restringir a n’s positivos n˜ao-nulos, L i.e., n = 1, 2, 3, . . ., pois para n = 0 tem-se U0 (x) ≡ 0 (solu¸ca˜o trivial) e U−n (x) = Un (x), mostrando que as solu¸co˜es com Un (x) e U−n (x) n˜ao s˜ao independentes.  nπx Resumindo, para cada n = 1, 2, , 3, . . . temos λn = nπ e U (x) = β sen . Para tais valores de n 2 L L nπct nπct λ a solu¸ca˜o (10.24) fica a1 cos L + b1 sen L , e as solu¸co˜es particulares para u(x, t) = T (t)U (x) ficam  nπx  , un (x, t) = [an cos (ωn t) + bn sen (ωn t)] sen L n = 1, 2, 3, . . ., onde nπc ωn := L

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

555/1304

(aqui, absorvemos a constante β2 dentro das constantes an e bn , as quais ainda est˜ao indeterminadas e podem depender de n). Chegamos at´e aqui com o m´etodo de separa¸ca˜o de vari´aveis. Evocando o princ´ıpio de sobreposi¸ca˜o, obtemos uma solu¸ca˜o mais geral de (10.20) somando as solu¸co˜es acima: u(x, t) =

∞ X

[an cos (ωn t) + bn sen (ωn t)] sen

n=1

 nπx  L

,

∞  nπx  X ∂u (x, t) = [−an ωn sen (ωn t) + bn ωn cos (ωn t)] sen . ∂t L n=1

A imposi¸ca˜o das condi¸co˜es iniciais u(x, 0) = u0 (x) e velocidade da corda em t = 0, conduz a ∞ X

u0 (x) =

an sen

n=1

∞ X

v0 (x) =

∂u (x, ∂t

 nπx  L

bn ωn sen

n=1

(10.25)

(10.26)

0) = v0 (x), que fixam posi¸ca˜o e

,

(10.27)

 nπx  L

.

(10.28)

Para invertermos essas rela¸co˜es, expressando as constantes an em termos de u0 e as constantes bn em termos de v0 , fazemos uso das bem-conhecidas rela¸co˜es de ortogonalidade da fun¸ca˜o seno: Z π π sen (my) sen (ny) dy = δm, n . m, n = 1, 2, 3, . . . . 2 0  Assim, multiplicando (10.27) por sen mπx e integrando de 0 a L, obtemos L Z

L

sen 0

 mπx  L

u0 (x) dx =

∞ X

an

n=1

Z

L

sen 0

 mπx  L

y=πx/L

=

ou seja, an

2 = L

Z

L

sen 0



sen

 nπx  L



LX An π n=1

nπx0 L



Z

dx π

sen (my) sen (ny) dy = 0

u0 (x0 ) dx0

para todo n = 1, 2, 3, . . .. De forma totalmente an´aloga, obtem-se de (10.28)     Z L Z L 2 2 nπx0 nπx0 0 0 bn = v0 (x ) dx = v0 (x0 ) dx0 sen sen ωn L 0 L nπc 0 L para todo n = 1, 2, 3, . . ..

L Am , 2

(10.29)

(10.30)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

556/1304

• As fun¸ co ˜es de Green para as condi¸ co ˜es iniciais Usando (10.29)-(10.29) podemos reescrever (10.25) como Z

u(x, t) =

L 0

0

0

G(x, t, x )u0 (x ) dx + 0

Z

L

H(x, t, x0 )v0 (x0 ) dx0 ,

(10.31)

0

onde, formalmente, ∞ X 2 0 sen G(x, t, x ) = L n=1

e

∞ X 2 sen H(x, t, x ) = nπc n=1 0

nπx L

!

nπx L

sen

!

sen

nπx0 L

!

nπx0 L

cos

!

sen

nπct L

!

nπct L

!

.

s˜ao denominadas fun¸co˜es de Green7 para as condi¸co˜es iniciais do problema em quest˜ao. Note-se que, tamb´em em um sentido formal, ∂H (x, t, x0 ) . G(x, t, x0 ) = ∂t A importˆancia de (10.31) est´a em expressar a solu¸ca˜o diretamente em termos das condi¸co˜es iniciais u 0 e v0 . As fun¸co˜es G e H contˆem em si a informa¸ca˜o de como os valores das condi¸co˜es iniciais no ponto x0 influenciam a solu¸ca˜o no ponto x no instante de tempo t.

10.2.2

O Problema da Corda Homogˆ enea Pendurada

Nosso prop´osito aqui ´e o de aplicar a equa¸ca˜o (10.19) para determinar o movimento de uma corda, ou barbante, homogˆenea (ou seja, de densidade constante) e de comprimento L que esteja pendurada por uma das suas extremidades em um campo gravitacional constante (por exemplo, o da superf´ıcie da Terra), a outra extremidade sendo mantida livre. Cada ponto da corda estar´a sujeito a uma tens˜ao igual ao peso do trecho de corda abaixo de si. Para fixar id´eias, vamos denotar por z a coordenada vertical e supor que a corda, quando parada, localize-se no intervalo 0 ≤ z ≤ L, estando presa no ponto z = L, apenas. A fun¸ca˜o u(z, t) representar´a o deslocamento horizontal da corda, digamos, no plano xz 8 , do ponto z no instante de tempo t. O ponto da corda situada a` altura z sustenta o peso do trecho de corda situado abaixo de si, ou seja, entre 0 e z. Como a corda ´e homogˆenea, esse peso ´e ρgz, onde g ´e a acelera¸ca˜o da gravidade. Assim, para a tens˜ao τ (z) tem-se τ (z) = ρgz e o problema que queremos resolver ´e o de determinar a solu¸ca˜o 2 ∂ da equa¸ca˜o diferencial ρ ∂∂t2u − ∂z ρgz ∂u = 0, ou seja, ∂z   ∂u ∂2u ∂ z = 0, (10.32) −g ∂t2 ∂z ∂z 7

George Green (1793-1841). Movimentos no plano yz podem ser tratados tamb´em mas, por simplicidade, consideramos apenas esse caso mais simples. 8

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

557/1304

para 0 ≤ z ≤ L, submetida a` condi¸ca˜o de contorno u(L, t) = 0 para todo t e a certas condi¸co˜es iniciais (z, 0) = v0 (z) que fixam posi¸ca˜o e velocidade transversal de cada ponto da corda u(z, 0) = u0 (z) e ∂u ∂t em t = 0. Comecemos seguindo o m´etodo de separa¸ca˜o de vari´aveis e procuremos solu¸co˜es particulares na forma de um produto u(z, t) = T (t)U (z). Inserindo isso em (10.32), obtemos facilmente 1 T 00 (t) (zU 0 (z))0 = . g T (t) U (z) Essa igualdade s´o ´e poss´ıvel se ambos os lados forem iguais a uma constante de separa¸ca˜o, que denotamos por −λ2 . Chegamos com isso a T 00 (t) + λ2 gT (t) = 0 ,

(10.33)

zU 00 (z) + U 0 (z) + λ2 U (z) = 0 .

(10.34)

As solu¸co˜es da primeira equa¸ca˜o, naturalmente, s˜ao T (t) = a0 t + b0 ,

caso λ = 0 ,

√ √ T (t) = a1 cos(λ gt) + b1 sen (λ gt) ,

caso λ 6= 0 .

Para λ = 0 a equa¸ca˜o (10.34) reduz-se a zU 00 (z) + U 0 (z) = 0, cuja solu¸ca˜o ´e U (z) = c1 ln(z) + c2 . Como desejamos que U (0) seja finita (o deslocamento da corda n˜ao pode divergir em nenhum ponto), devemos impor c1 = 0 e, portanto, U (z) = c2 . Por´em, como u(L, t) = 0 para todo t, devemos impor U (L) = 0. Assim, c2 = 0 tamb´em e obtemos apenas a solu¸ca˜o trivial U (z) = 0, o que corresponde a uma corda eternamente parada. O caso interessante, portanto, est´a em λ 6= 0. A equa¸ca˜o (10.34) para λ 6= 0 pode ser transformada em uma equa¸ca˜o conhecida atrav´es da mudan¸ca de vari´aveis √ √ ζ = 4λ2 z , U (z) = y(ζ) = y ( 4λ2 z) ,

com a qual obtemos ζ 2 y 00 (ζ) + ζy 0(ζ) + ζ 2 y(ζ) = 0 . E. 10.1 Exerc´ıcio. Mostre isso!

6

Essa equa¸ca˜o, como se constata, ´e a equa¸ca˜o de Bessel de ordem zero: ν = 0. Assim, suas solu¸co˜es s˜ao y(ζ) = β1 J0 (ζ) + β2 N0 (ζ) , J0 sendo a fun¸ca˜o de Bessel de ordem 0 e N0 sendo a fun¸ca˜o de Neumann de ordem 0. Isso significa, ent˜ao, que √ √ U (z) = β1 J0 (2λ z) + β2 N0 (2λ z) . √ A solu¸ca˜o acima tem por particularidade que se β2 6= 0 o termo N0 (2λ z) diverge em z = 0. Esse comportamento n˜ao ´e aceit´avel, obviamente, de modo que devemos impor9 β2 = 0. 9

Podemos interpretar a condi¸ca ˜o de finitude da solu¸ca ˜o em z = 0 como uma outra condi¸ca ˜o de contorno a ser imposta, juntamente a ` condi¸ca ˜o u(L, t) = 0, para o outro extremo da corda.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

558/1304

√ Chegamos dessa forma a` solu¸ca˜o U (z) = J0 (2λ z) (adotando aqui β1 = 1), para √ a qual devemos impor a condi¸ca˜o de contorno u(L, t) = 0, ou seja, U (L) = 0. Isso implica que 2λ L deve ser um dos zeros αk0 , k ∈ , k ≥ 1, da fun¸ca˜o de Bessel J0 em + . Assim, conclu´ımos que 



λ = e dessa forma, para 0 ≤ z ≤ L, Uk (z) = J0



αk0

αk0 √ , 2 L

r  z , L

k = 1, 2, 3, 4, . . . ,

representam solu¸co˜es de (10.34) que satisfazem as condi¸co˜es de contorno requeridas. Tem-se, ent˜ao, que  r  z uk (z, t) = [ak cos (ωk t) + bk sen (ωk t)] J0 αk0 , k = 1, 2, 3, 4, . . . , L com r αk0 g ωk := , 2 L

s˜ao solu¸co˜es particulares da equa¸ca˜o de onda (10.32) que satisfazem as condi¸co˜es de contorno p requeridas.  0 Acima, ak e bk s˜ao constantes a serem determinadas. Cada fun¸ca˜o cos (ωk t + δ0 ) J0 αk Lz , k = 1, 2, 3, 4, . . ., representa um modo de vibra¸ca ˜o da corda pendurada. A solu¸ca˜o geral da equa¸ca˜o de onda (10.32) que satisfaz as condi¸co˜es de contorno requeridas ´e dada

por u(z, t) =

∞ X

[ak cos (ωk t) + bk sen (ωk t)] J0

k=1



αk0

r  z , L

 ∞ X ∂u (z, t) = [−ak ωk sen (ωk t) + bk ωk cos (ωk t)] J0 αk0 ∂t k=1

(10.35)

r  z . L

Assim, a imposi¸ca˜o das condi¸co˜es iniciais u(z, 0) = u0 (z) e ∂u (z, 0) = v0 (z), que fixam posi¸ca˜o e ∂t velocidade da corda em t = 0, conduz a  r  ∞ X z u0 (z) = ak J0 αk0 , (10.36) L k=1 v0 (z) =

∞ X k=1

b k ω k J0



αk0

r  z . L

(10.37)

Para determinarmos as constantes ak em termos de u0 e as constantes bk em termos de v0 faremos uso das rela¸co˜es de ortogonalidade (9.144), p´agina 534, para as fun¸co˜es de Bessel J 0 : Z 1 2   (J1 (αk0 )) 0 0 . (10.38) J0 αk x J0 αl x x dx = δk, l 2 0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

559/1304

p  Multiplicando ambos os lados de (10.36)-(10.37) por J0 αl0 Lz e integrando-se em z entre 0 e L, obtem-se Z L  r  Z L  r   r  ∞ X z z z 0 ak J0 α l u0 (z) dz = J0 αl0 J0 αk0 dz , L L L 0 0 k=1

Z

L

J0 0



r  r ∞ Z L  r   r  X 1 z g z z αl0 J0 αl0 v0 (z) dz = bk αk0 J0 αk0 dz . L 2 L k=1 L L 0

Agora, Z

L

J0 0



αl0

r   r  z z J0 αk0 dz L L

√z Z L = 2L

1

x=

0

  J0 αk0 x J0 αl0 x x dx

(10.38)

=

L J1 (αk0 )

2

δk, l .

Assim, conclu´ımos que 1

al =

L (J1 (αk0 ))



L

J0 0

2

bl = para todos l ∈

2

Z

√ 2 αl0 gL (J1 (αl0 ))



Z

αl0

r  z u0 (z) dz , L

L

J0 0



αl0

r  z v0 (z) dz , L

(10.39)

(10.40)

, l ≥ 1.

A solu¸ca˜o obtida acima satisfaz as condi¸co˜es de contorno e as condi¸co˜es iniciais propostas. A Proposi¸ca˜o 11.7, p´agina 602, garante que a solu¸ca˜o assim obtida ´e a u ´ nica solu¸ca˜o do problema, o que a posteriori, justifica todo o nosso proceder. Note o leitor que as condi¸co˜es de contorno do problema tratado acima correspondem a`s condi¸co˜es de contorno do tipo IV da Proposi¸ca˜o 11.7, pois a corda est´a fixa em z = L e a tens˜ao anula-se em z = 0. Com isso, o problema de determinar o movimento da corda pendurada a partir de condi¸co˜es iniciais como acima est´a completamente resolvido. Esse problema foi um dos primeiros nos quais surgiram fun¸co˜es de Bessel como solu¸ca˜o. Ele foi tratado pela primeira vez em 1732 por D. Bernoulli1011 . • As fun¸ co ˜es de Green para as condi¸ co ˜es iniciais Usando (10.39)-(10.40) podemos reescrever (10.35) como u(z, t) = 10

Z

L 0

0

0

G(z, t, z )u0 (z ) dz + 0

Z

L

H(z, t, z 0 )v0 (z 0 ) dz 0 ,

(10.41)

0

Daniel Bernoulli (1700-1782). Em verdade, de acordo com os coment´ arios hist´ oricos de [62], D. Bernoulli n˜ ao incluiu a dependˆencia temporal na sua solu¸ca ˜o nem aplicou o princ´ıpio de sobreposi¸ca ˜o para somar os v´ arios modos de vibra¸ca ˜o. Como comentamos a ` p´ agina 265, ainda que conhecido anteriormente, o princ´ıpio de sobreposi¸ca ˜o para a resolu¸ca ˜o de equa¸co ˜es diferenciais lineares homogˆeneas s´ o se tornou de uso corrente sob a influˆencia de Helmholtz, no s´ec. XIX. 11

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

560/1304

onde

G(z, t, z 0 ) :=

∞ X

J0



k=1

0

H(z, t, z ) :=

∞ X

2J0

k=1

r ! z0 αk0  0r  L αk g t , cos  0 2 2 L L J1 (αk )

r  z 0 αk J0 L

r ! r  z z0 αk0 J0 αk0  0r  L L αk g sen t , p  2 2 L αk0 gL J1 (αk0 )



s˜ao as fun¸co˜es de Green para as condi¸co˜es iniciais do problema em quest˜ao. Note-se tamb´em que, formalmente, ∂H G(z, t, z 0 ) = (z, t, z 0 ) . ∂t A importˆancia de (10.41) est´a em expressar a solu¸ca˜o diretamente em termos das condi¸co˜es iniciais u 0 e v0 . As fun¸co˜es G e H contˆem em si a informa¸ca˜o de como os valores das condi¸co˜es iniciais no ponto z 0 influenciam a solu¸ca˜o no ponto z no instante de tempo t.

10.2.3

Corda Vibrante N˜ ao-Homogˆ enea

Vamos agora aplicar a equa¸ca˜o (10.19) para determinar o movimento de uma corda n˜ao-homogˆenea (ou seja, cuja densidade depende da posi¸ca˜o) e de comprimento L que esteja fixa em suas extremidades, assumindo tamb´em que a tens˜ao τ seja constante (τ (x) ≡ τ0 ). Sob essas hip´oteses (10.19) assume a forma ∂2u ∂2u (10.42) ρ(x) 2 − τ0 2 = 0 . ∂t ∂x Para encontrar as solu¸co˜es de (10.42) satisfazendo as condi¸co˜es iniciais e de contorno, procederemos novamente pelo m´etodo de separa¸ca˜o de vari´aveis, procurando primeiramente solu¸co˜es particulares que sejam da forma u(x, t) = T (t)U (x). Inserindo em (10.20), obtem-se 1 T 00 (t) 1 U 00 (x) = . τ0 T (t) ρ(x) U (x) Essa igualdade s´o ´e poss´ıvel se ambos os lados forem iguais a uma constante de separa¸ca˜o, que denotamos por −λ2 . Chegamos com isso a T 00 (t) + λ2 τ0 T (t) = 0 ,

(10.43)

U 00 (x) + λ2 ρ(x)U (x) = 0 .

(10.44)

As solu¸co˜es da primeira equa¸ca˜o, naturalmente, s˜ao T (t) = a0 t + b0 ,

caso λ = 0 ,

√ √ T (t) = a1 cos(λ τ0 t) + b1 sen (λ τ0 t) ,

(10.45) caso λ 6= 0 .

(10.46)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

561/1304

Para λ = 0 a equa¸ca˜o (10.44) reduz-se a U 00 (x) = 0, cuja solu¸ca˜o ´e U (x) = c1 x + c2 . Como desejamos que U (0) = U (L) = 0, de modo que u(x, t) = T (t)U (x) satisfa¸ca as condi¸co˜es de contorno, obtem-se c1 = c2 = 0, ou seja, obtem-se a solu¸ca˜o trivial U (x) ≡ 0, o que corresponde a uma corda eternamente parada. Novamente, o caso interessante, portanto, est´a em λ 6= 0.

A resolu¸ca˜o de (10.44) depende, obviamente, da fun¸ca˜o ρ(x). No que segue assumiremos que essa fun¸ca˜o ´e da forma ρ(x) = ρ0 + ηx, onde ρ0 e η s˜ao constantes. Essa ´e uma primeira corre¸ca˜o (linear) ao caso de ρ constante, que tratamos acima. A eq. (10.44) torna-se, portanto, U 00 (x) + λ2 (ρ0 + ηx)U (x) = 0 .

(10.47)

Com a mudan¸ca de vari´aveis ξ = ρ0 + ηx, U (x) = V (ξ) = V (ρ0 + ηx), essa equa¸ca˜o assume a forma V 00 (ξ) + µ2 ξV (ξ) = 0 , onde µ = λ/η. Trata-se de uma equa¸ca˜o de Airy, cujas solu¸co˜es podem ser escritas em termos de fun¸co˜es de Bessel J±1/3 (vide p´agina 439):    p  p p p 2 2 V (ξ) = A ξJ1/3 µ2 ξ 3 + B ξJ−1/3 µ2 ξ 3 , 3 3 A e B sendo constantes. Assim,      p p 2 2p 2 (ρ0 + ηx) AJ1/3 µ (ρ0 + ηx)3 + BJ−1/3 µ2 (ρ0 + ηx)3 U (x) = . 3 3

(10.48)

O caso mais simples ´e aquele no qual ρ0 = 0 com η > 0. Ficamos com  p   p  √ √ 2 2 3 λ ηx + B xJ−1/3 λ ηx3 . U (x) = A xJ1/3 3 3

A e B sendo constantes. Pela express˜ao (8.118), p´agina 437, as fun¸co˜es de Bessel, a fun¸ca˜o  √ que define √ 2 3/2 2 3/2 xJ1/3 3 x anula-se em x = 0, enquanto que a fun¸ca˜o xJ−1/3 3 x assume em x = 0 um valor n˜ao-nulo. Assim, a imposi¸ca˜o da condi¸ca˜o de contorno U (x) = 0 implica B = 0 e, portanto,  p  √ 2 λ ηx3 . U (x) = A xJ1/3 3 p (1/3) (1/3) A imposi¸ca˜o da condi¸ca˜o de contorno U (L) = 0 implica 32 λ ηL3 = αk , onde αk ´e o k-´esimo zero de J1/3 em + . 

Assim, (1/3)

e U (x) = Uk (x) = Ak

r

3α λ = λk := pk 2 ηL3

x J1/3 L



2 p 3 λk ηx 3



= Ak

r

x J1/3 L

(1/3) αk

r  ! x 3 L

,

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

562/1304

ambas v´alidas para todo k = 1, 2, 3, . . ., Ak sendo constantes. Obtemos para u(x, t) a solu¸ca˜o geral expressa em termos de uma s´erie de modos normais: r  ! ∞  r x X √ √ x 3 (1/3) ak cos(λk τ0 t) + bk sen (λk τ0 t) J1/3 αk u(x, t) = L L k=1 =

∞  X

ak cos (ωk t) + bk sen (ωk t)

k=1

sendo

3 (1/3) ωk := αk 2

Naturalmente, segue disso que

r x

r

(1/3)

J1/3

L

αk

u0 (x) =

ak

k=1

v0 (x) =

∞ X

ωk b k

k=1

x J1/3 L

r

x J1/3 L

Multiplicando a primeira das express˜oes acima por L, obtemos Z L  x 3/2 J1/3 u0 (x) L 0

(1/3)

αl

=

r  ! x 3

k=1

y=x/L

=

∞ X

ak

Z

ak L

k=1

u=y 3/2

=

=

L

0

Z

 x 2

3

J1/3

1 2

y J1/3 0

Z ∞ X 2ak L k=1

(9.144)

L

1 0

(1/3)

αk

r  ! x 3 L

.

(10.49)

∂u (x, ∂t

(1/3)

αk

r  ! x 3 L

 x 3/2 L

J1/3



(1/3) αl

. q

 x 3 L



e integrando de 0 a

dx

L

∞ X

,

0) = v0 (x), tem-se r  ! x 3 (1/3) , αk L

Dessa forma, impondo condi¸co˜es iniciais u(x, 0) = u0 (x), r

L

τ0 . ηL3

∞  r x X ∂u − ωk ak sen (ωk t) + ωk bk cos (ωk t) (x, t) = J1/3 ∂t L k=1

∞ X

r  ! x 3



(1/3)

αk

(1/3) αk

r  ! x 3 L

J1/3

(1/3)

αl

r  ! x 3

 p  p  (1/3) 3 y J1/3 αl y 3 dy

    (1/3) (1/3) u J1/3 αk u J1/3 αl u du

 2 al L  0  (1/3) 2 al L  (1/3) J2/3 αl = J1/3 αl . 3 3

L

dx

JCABarata. Curso de F´ısica-Matem´ atica

Disso, obtemos 3  2 (1/3) L J2/3 αl

al =



e, analogamente, bl =

3 



(1/3)

ωl L J2/3 αl para todo l = 1, 2, 3, . . ..

Z

2

L 0

Z

Cap´ıtulo 10

563/1304

 s    0 3/2 3 x x0  (1/3) 0  dx0 J1/3 αl u0 (x ) L L

L 0

Vers˜ ao de 29 de setembro de 2005.

 s    0 3/2 3 x x0  (1/3) v0 (x0 ) dx0 J1/3 αl L L

• As fun¸ co ˜es de Green para as condi¸ co ˜es iniciais Reunindo os resultados acima, podemos escrever Z L Z 0 0 0 0 u(x, t) = G(x, t, x ) u0 (x ) x dx + 0

com

G(x, t, x0 ) = 3

∞ X

r

x J1/3 L

k=1

0

H(x, t, x ) = 3

∞ X k=1

r

x J1/3 L

(1/3)

αk

L

H(x, t, x0 ) v0 (x0 ) x0 dx0 ,

(10.50)

0

s   3 x0  (1/3) J1/3 αk   r L L L τ0 3 (1/3) α t , cos   2 2 k ηL3 (1/3) 2 L J2/3 αk

r  ! r x 3 x0



s   3 x0  (1/3) (1/3) αk J1/3 αk   r L L L 3 (1/3) τ0 sen α t , 2   2 k ηL3 (1/3) 2 ωk L J2/3 αk r  ! r x0 x 3



sendo as fun¸co˜es de Green para as condi¸co˜es iniciais do problema em quest˜ao. Mais uma vez, vale formalmente ∂H (x, t, x0 ) . G(x, t, x0 ) = ∂t Nota. H´a duas raz˜oes para usarmos a medida de integra¸ca˜o x0 dx0 em (10.50) e n˜ao apenas a medida dx0 . Primeiro, obtem-se dessa forma fun¸co˜es G e H sim´etricas pela troca x ↔ x0 (como se vˆe explicitamente nas express˜oes acima). Segundo, como temos ρ0 = 0, (10.44) ´e da forma U 00 (x) + ηλ2 xU (x) = 0 e estamos, portanto, lidando com um problema de Sturm-Liouville com r(x) = x (para a teoria de Sturm-Liouville, vide Cap´ıtulo 12, p´agina 606). Ora, em problemas de Sturm-Liouville a medida natural de integra¸ca˜o ´e r(x0 )dx0 , para a qual valem as rela¸co˜es de ortogonalidade das autofun¸co˜es, da´ı ser natural a escolha que fizemos. A importˆancia de (10.50) est´a em expressar a solu¸ca˜o diretamente em termos das condi¸co˜es iniciais u0 e v0 . As fun¸co˜es G e H contˆem em si a informa¸ca˜o de como os valores das condi¸co˜es iniciais no ponto x0 influenciam a solu¸ca˜o no ponto x no instante de tempo t.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

564/1304

* E. 10.2 Exerc´ıcio. Retornando a (10.48) considere agora o caso ρ 0 6= 0, η 6= 0, e, segundo os passos de acima, obtenha a solu¸c˜ao do problema em termos de condi¸co˜es iniciais e as fun¸co˜es de Green. (Dispense-se de escrever explitamente os coeficientes das rela¸co˜es de ortogonalidade. Calcul´a-los ´e muito trabalhoso!). 6

10.3

O Problema da Membrana Circular

Com o que obtivemos na Se¸ca˜o 10.1, p´agina 544, sobre a equa¸ca˜o de Helmholtz em duas dimens˜oes em coordenadas polares podemos abordar o problema de determinar o movimento vibrat´orio, a partir de uma condi¸ca˜o inicial, de um tambor, ou membrana, circular de raio R, homogˆeneo, cujas bordas s˜ao fixas. Matematicamente, isso consiste em determinar as solu¸co˜es da equa¸ca˜o de onda dentro de um disco de raio R > 0 no plano bidimensional, ou seja, da equa¸ca˜o ∂2u (~x, t) − c2 ∆u(~x, t) = 0 , ∂t2

(10.51)

com c > 0, sendo ~x restrito a` regi˜ao k~xk ≤ R, com condi¸co˜es de contorno u(~x, t) = 0 para todo t e (~x, 0) = v0 (~x) para todo ~x satisfazendo k~xk = R e com certas condi¸co˜es iniciais u(~x, 0) = u 0 (~x) e ∂u ∂t para certas fun¸co˜es u0 (~x) e v0 (~x) convenientes. Pelo que apresentamos acima, solu¸co˜es particulares da equa¸ca˜o de Helmholtz correspondente em coordenadas polares s˜ao (por simplicidade escolhemos a solu¸ca˜o complexa) da forma   am Jm (λρ) + bm Nm (λρ) eimϕ ,

onde am e bm s˜ao constantes12 . Como esperamos que a solu¸ca˜o n˜ao apresente divergˆencias em ρ = 0, devemos ter bm = 0. A condi¸ca˜o de contorno que imp˜oe que a solu¸ca˜o deve anular-se em ρ = R conduz a Jm (λR) = 0, ou seja, λ = αkm /R, onde αkm ´e o k-´esimo zero da fun¸ca˜o de Bessel Jm (x) para x > 0. Isso fixa os valores da constante de separa¸ca˜o λ. Para cada k a solu¸ca˜o da equa¸ca˜o temporal (10.1) fica  m   m  αk c αk c T (t) = α1 cos t + α2 sen t . R R Assim, uma solu¸ca˜o particular da equa¸ca˜o de onda satisfazendo as condi¸co˜es de contorno ´e  m   m    m  αk ct αk ρ αk ct + bk, m sen Jm eimϕ , ak, m cos R R R ak, m e bk, m sendo constantes. Cada uma dessas fun¸co˜es, para k ∈ vibra¸ca ˜o da membrana circular de raio R. 12



em∈

, representa um modo de

Caso λ = 0, a u ´nica solu¸ca ˜o da equa¸ca ˜o de Laplace que ´e n˜ ao-singular em ρ = 0 e anula-se em ρ = R ´e a solu¸ca ˜o identicamente nula. Vide solu¸ca ˜o da equa¸ca ˜o de Laplace em duas dimens˜ oes dada acima.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

565/1304

Pelo princ´ıpio de sobreposi¸ca˜o (ou seja, pela linearidade e homogeneidade da equa¸ca˜o (10.51) e das condi¸co˜es de contorno consideradas), a solu¸ca˜o geral u da equa¸ca˜o de onda satisfazendo as condi¸co˜es de contorno e sua derivada temporal ∂u s˜ao dadas por ∂t u(ρ, ϕ, t) =

 ∞ ∞ X X

ak, m cos

k=1 m=−∞



αkm ct R



+ bk, m sen



αkm ct R



Jm



αkm ρ R



eimϕ ,

(10.52)

  m   m   m  ∞ ∞ X X ak, m αkm c bk, m αkm c ∂u αk ct αk ct αk ρ (ρ, ϕ, t) = − sen cos + Jm eimϕ . ∂t R R R R R k=1 m=−∞ ´ aqui que entram as As constantes ak, m e bk, m devem ser determinadas pelas condi¸co˜es iniciais. E imϕ rela¸co˜es de ortogonalidade das fun¸co˜es de Bessel e das fun¸co˜es e . As condi¸co˜es iniciais impoem (tomando t = 0 nas duas equa¸co˜es acima) que  m0  ∞ ∞ X X αk 0 ρ 0 eim ϕ , u0 (ρ, ϕ) = a k 0 , m 0 Jm 0 R k 0 =1 m0 =−∞  m0  0 ∞ ∞ X X bk0 , m0 αkm0 c αk 0 ρ 0 v0 (ρ, ϕ) = eim ϕ . Jm 0 R R 0 0 k =1 m =−∞

Multiplicando ambos os lados de ambas as express˜ oes por e−imϕ e tomando-se a integral em ϕ no R π i(m−m 0 )ϕ dϕ = 2πδm, m0 , intervalo −π ≤ ϕ ≤ π, obtemos com o uso de −π e Z

π

u0 (ρ, ϕ)e

−imϕ

dϕ = 2π

−π

Z

∞ X

a k 0 , m Jm

k 0 =1

π

v0 (ρ, ϕ)e −π

−imϕ



αkm0 ρ R



,

 m  ∞ X bk0 , m αkm0 c αk 0 ρ dϕ = 2π Jm . R R k 0 =1

Multiplicando ambos os lados de ambas as express˜oes por Jm



αkm ρ R



ρ e integrando-se as express˜oes R

resultantes para ρ entre 0 e R, obtemos  m   m   m  Z RZ π Z R ∞ X αk 0 ρ ρ αk ρ ρ αk ρ −imϕ Jm u0 (ρ, ϕ)e Jm dρdϕ = 2π ak 0 , m Jm dρ , R R R R R 0 −π 0 0 k =1 Z

R 0

Z

π

v0 (ρ, ϕ)e

−imϕ

Jm

−π



αkm ρ R





X bk0 , m αm0 c ρ k dρdϕ = 2π R R 0 k =1

Temos, por´em, com a o´bvia mudan¸ca de vari´aveis x = Z

R

Jm 0



αkm ρ R



Jm



αkm0 ρ R



ρ dρ = R R

Z

Z

R

Jm 0

αkm ρ R



Jm



αkm0 ρ R



ρ dρ . R

ρ , R

1 0



Jm (αkm x) Jm

(αkm0 x)

xdx

(9.144)

=

δ

k, k 0

(Jm+1 (αkm ))2 R 2

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

566/1304

e, portanto, ak, m

1 = π (Jm+1 (αkm ))2 R2

bk, m =

Z

R 0

1 παkm c (Jm+1 (αkm ))2 R

Z

Z

π

u0 (ρ, ϕ)e

−imϕ

Jm

−π R

0

Z



αkm ρ R

π

v0 (ρ, ϕ)e

−imϕ

−π

Jm





αkm ρ R

ρdρdϕ ,

(10.53)



(10.54)

ρdρdϕ .

Essas express˜oes determinam completamente os coeficientes ak, m e bk, m para todos k e m em temos das condi¸co˜es iniciais. A solu¸ca˜o assim obtida satisfaz, ent˜ao, as condi¸co˜es de contorno e iniciais. A Proposi¸ca˜o 11.7, p´agina 602, garante que a solu¸ca˜o assim obtida ´e a u ´ nica solu¸ca˜o do problema proposto (as condi¸co˜es de contorno que tratamos s˜ao do tipo de Dirichlet) o que, a posteriori, justifica todo o nosso proceder. • As fun¸ co ˜es de Green para as condi¸ co ˜es iniciais Assim como no problema da corda pendurada, podemos expressar a solu¸ca˜o diretamente em termos das condi¸co˜es iniciais com o uso das chamadas fun¸co˜es de Green. Usando (10.53)-(10.54), podemos reescrever (10.52) como u(ρ, ϕ, t) =

Z RZ 0

π 0

0

0

0

0

0

0

G(ρ, ϕ, t, ρ , ϕ ) u0 (ρ , ϕ ) ρ dρ dϕ + −π

Z RZ 0

π

H(ρ, ϕ, t, ρ0 , ϕ0 ) v0 (ρ0 , ϕ0 ) ρ0 dρ0 dϕ0 , −π

(10.55)

onde

0

0

G(ρ, ϕ, t, ρ , ϕ ) :=

Jm ∞ ∞ X X



  m 0 αkm ρ αk ρ 0  m  Jm eim(ϕ−ϕ ) αk ct R R cos , m 2 2 R π (Jm+1 (αk )) R



  m 0 αkm ρ αk ρ 0  m  Jm eim(ϕ−ϕ ) αk ct R R sen . m m 2 R παk c (Jm+1 (αk )) R

k=1 m=−∞

0

0

H(ρ, ϕ, t, ρ , ϕ ) :=

Jm ∞ ∞ X X k=1 m=−∞

Essas s˜ao as fun¸co˜es de Green para as condi¸co˜es iniciais do problema em quest˜ao. Note-se uma vez mais que ∂H (ρ, ϕ, t, ρ0 , ϕ0 ) . G(ρ, ϕ, t, ρ0 , ϕ0 ) = ∂t Tal como no problema da corda pendurada, a importˆancia de (10.55) est´a em expressar a solu¸ca˜o diretamente em termos das condi¸co˜es iniciais u0 e v0 . As fun¸co˜es G e H contˆem em si a informa¸ca˜o de como os valores das condi¸co˜es iniciais no ponto (ρ0 , ϕ0 ) influenciam a solu¸ca˜o no ponto (ρ, ϕ) no instante de tempo t.

JCABarata. Curso de F´ısica-Matem´ atica

10.4

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

567/1304

O Oscilador Harmˆ onico na Mecˆ anica Quˆ antica e a Equa¸ c˜ ao de Hermite

A equa¸ca˜o de Schr¨odinger13 independente do tempo para o oscilador harmˆonico unidimensional ´e −

k ~2 d 2 ψ(x) + x2 ψ(x) = Eψ(x) , 2 2m dx 2

(10.56)

onde E ´e um autovalor do operador de Hamilton14 , ~ ´e a constante de Planck15 , m a massa da part´ıcula e k a constante de Hooke16 . Definindo r  2 1/4 ~ 2E x k , ω0 := α := , λ := − 1, z := , v(z) := ψ(x) = v(x/α) , (10.57) mk m ~ω0 α a equa¸ca˜o (10.56) fica v 00 (z) + (λ + 1 − z 2 )v(z) = 0 .

A experiˆencia mostra que para melhor tratarmos dessa equa¸ca˜o devemos definir uma nova fun¸ca˜o 2 2 u(z) := ez /2 v(z), ou seja, escrevemos v(z) = e−z /2 u(z), obtendo para u a equa¸ca˜o diferencial u00 (z) − 2zu0 (z) + λu(z) = 0 ,

(10.58)

a qual reconhecemos ser a equa¸ c˜ ao de Hermite. Como discutimos, essa equa¸ca˜o s´o possui solu¸co˜es 2 que crescem mais lentamente que e+z /2 para |z| → ∞ se λ = 2n, sendo n um inteiro n˜ao-negativo. A 2 condi¸ca˜o que u cresce mais lentamente que e+z /2 para |z| → ∞ ´e necess´aria para que v(z) e, portanto, ψ(x), seja de quadrado integr´avel, uma condi¸ca˜o fundamental para a Mecˆanica Quˆantica. No caso em que λ = 2n, sendo n um inteiro n˜ao-negativo, a solu¸ca˜o para (10.58) ´e u(z) = H n (z), sendo Hn o n-´esimo polinˆomio de Hermite. Se λ = 2n, ent˜ao, por (10.57), o valor de E ´e dado por   1 En := ~ω0 n + , 2 para n = 0, 1, 2, 3 . . .. Essa equa¸ca˜o expressa a quantiza¸ca˜o da energia do oscilador harmˆonico unidimensional na Mecˆanica Quˆantica. Ainda para λ = 2n, sendo n um inteiro n˜ao-negativo, a solu¸ca˜o ψn (x) da equa¸ca˜o de Schr¨odinger (10.56) ser´a   x x2 −z 2 /2 ψn (x) = cn Hn (z)e = c n Hn exp − 2 , α 2α cRn sendo uma constante de normaliza¸ca˜o a ser fixada. Na Mecˆanica Quˆantica adota-se a normaliza¸ca˜o ∞ |ψn (x)|2 dx = 1. Isso implica, −∞  2 Z ∞   2 Z ∞  √ x x (9.72) 2 2 Hn exp − 2 dx = α|cn | (Hn (z))2 exp −z 2 dz = α|cn |2 2n n! π , 1 = |cn | α α −∞ −∞ 13

Erwin Rudolf Josef Alexander Schr¨ odinger (1887-1961). Sir William Rowan Hamilton (1805-1865). 15 Max Karl Ernst Ludwig Planck (1858-1947). 16 Robert Hooke (1635-1703).

14

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

de onde se extrai, escolhendo-se cn real e positivo, que cn =

ψn (x) =

s

q

1√ α2n n! π

Cap´ıtulo 10

568/1304

e, portanto,

  x x2 1 √ Hn exp − 2 α2n n! π α 2α

s˜ao os auto-estados normalizados de energia En para n = 0, 1, 2, 3 . . .. Com o uso de (9.72), ´e trivial verificar ainda que Z ∞ ψn (x)ψm (x) dx = δn, m , −∞

a bem-conhecida rela¸ca˜o de ortogonalidade das auto-fun¸co˜es ψn .

E. 10.3 Exerc´ıcio. Mostre que    2 Z ∞ Z ∞   2 1 x 1 x 2 2 2 2 √ x |ψn (x)| dx = x Hn , exp − 2 dx = α n + α2n n! π −∞ α α 2 −∞ para todo n ∈ , α sendo uma constante positiva. Na Mecˆanica Quˆantica a express˜ao do lado esquerdo, acima, representa o valor m´edio do quadrado do operador de posi¸c˜ao, ou seja, de x 2 , no auto-estado normalizado ψn do operador Hamiltoniano do oscilador harmˆonico. Sugest˜ao: use as rela¸co˜es de recorrˆencia (9.78), p´agina 514, e as rela¸co˜es de ortogonalidade (9.72), p´agina 512, das fun¸co˜es H n . 6 

10.5

´ O Atomo de Hidrogˆ enio e a Equa¸ c˜ ao de Laguerre Associada

A equa¸ca˜o de Schr¨odinger independente do tempo que descreve uma part´ıcula de massa m 0 , em trˆes dimens˜oes, sob um potencial de Coulomb17 atrativo V (r) = − αr , α > 0, ´e −

~2 α ∆ψ − ψ = Eψ . 2m0 r

Expressando o operador Laplaciano em coordenadas esf´ericas, como em (10.8), essa equa¸ca˜o fica        1 ∂ ∂ψ 1 1 ∂ 2m0  α ∂2ψ 2 ∂ψ r + ( sen θ) + +E ψ = 0. + 2 r 2 ∂r ∂r sen θ ∂θ ∂θ ( sen θ)2 ∂ϕ2 ~ r Seguindo o procedimento de separa¸ca˜o de vari´aveis, procuramos solu¸co˜es na forma ψ = R(r)Y (θ, ϕ) e obtemos, inserindo na equa¸ca˜o,      1 ∂ ∂Y 1 (r 2 R0 (r))0 2m0 1 ∂2Y 2 ( sen θ) + + 2 αr + Er = − . R(r) ~ Y (θ, ϕ) sen θ ∂θ ∂θ ( sen θ)2 ∂ϕ2 17

Charles Augustin de Coulomb (1736-1806).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

569/1304

Novamente, ambos os lados devem ser igualados a uma constante λ, e obtemos o par de equa¸co˜es    2m0 2 2 0 0 αr + Er − λ R(r) = 0 , (r R (r)) + ~2   1 ∂ ∂Y 1 ∂2Y + λY = 0 . ( sen θ) + sen θ ∂θ ∂θ ( sen θ)2 ∂ϕ2 Como j´a discutimos, a segunda equa¸ca˜o s´o possui solu¸co˜es finitas em θ = 0 e θ = π se λ = l(l + 1) com l ∈ , em cujo caso as solu¸co˜es para Y s˜ao dadas pelos harmˆonicos esf´ericos Y lm (θ, ϕ) com m ∈ e −l ≤ m ≤ l. A equa¸ca˜o radial fica ent˜ao    2m0 2 2 00 0 αr + Er − l(l + 1) R(r) = 0 . r R (r) + 2rR (r) + ~2 

Para simplificar essa express˜ao, definamos as constantes 2m0 β := α ~2

e

γ :=

r



2m0 E ~2

(tomamos aqui E ≤ 0, o que corresponde aos chamados estados ligados), com o quˆe, escrevemos  r 2 R00 (r) + 2rR0 (r) + βr − γ 2 r 2 − l(l + 1) R(r) = 0 .

Essa equa¸ca˜o ainda n˜ao se encontra em uma forma reconhec´ıvel, mas definindo S(r) := seja, escrevendo R na forma R(r) = r l e−γr S(r), obtem-se para S a seguinte equa¸ca˜o:     rS 00 (r) + 2(l + 1) − 2γr S 0 (r) + β − 2γ(l + 1) S(r) = 0 . E. 10.4 Exerc´ıcio. Fa¸ca essa conta ao menos uma vez na vida.

eγr R(r), rl

ou

6

Definindo uma nova vari´avel z = 2γr e y(z) = S(r) = y(2γr), obtemos para y(z) a equa¸ca˜o diferencial     β 00 0 zy (z) + 2(l + 1) − z y (z) − − (l + 1) y(z) = 0 , 2γ

a qual, para fins de compara¸ca˜o, escrevemos como 00





0

zy (z) + (2l + 1) + 1 − z y (z) −



  β + l − (2l + 1) y(z) = 0 . 2γ

β Comparando a (8.154), reconhecemos que se trata da equa¸ c˜ ao de Laguerre associada com n = 2γ +l. Pela nossa discuss˜ao de quando tratamos da equa¸ca˜o de Laguerre, devemos ter n um inteiro positivo com 0 ≤ 2l + 1 ≤ n, de outra forma a solu¸ca˜o da equa¸ca˜o de Laguerre crescer´a mais r´apido que exponencial, destruindo a propriedade de ψ ser de quadrado integr´avel. Assim, n deve ser tomado um β inteiro positivo e, portanto, p := 2γ deve ser tamb´em inteiro. Como 0 ≤ 2l + 1 ≤ n e n = p + l, segue que p ≥ l + 1 e, portanto, p ´e igualmente um inteiro positivo.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

570/1304

Na situa¸ca˜o descrita no u ´ ltimo par´agrafo, vimos na Se¸ca˜o 8.3.2, p´agina 452, que as solu¸co˜es da (2l+1) equa¸ca˜o de Laguerre associada acima s˜ao dadas pelos polinˆomios de Laguerre associados L n (z). Retornando a R(r), obtivemos a solu¸ca˜o 

βr Rp, l (r) = r exp − 2p l

β onde usamos p := 2γ ∈ β expressa-se como γ = 2p

r







, p > 0, e escrevemos γ =

2m0 αm0 E = , ~2 p~2

(2l+1) Lp+l

β . 2p

βr p



,

Voltando a`s constantes originais, a rela¸ca˜o

E ≡ Ep = −

ou seja,



α 2 m0 1 , 2~2 p2

com p = 1, 2, 3, 4, . . . .

Essa ´e a bem-conhecida regra de quantiza¸ca˜o de energia do a´tomo de hidrogˆenio, obtida pela primeira vez, por outros meios, por Bohr18 em 1912-1913 e reobtida posteriormente por Schr¨odinger em 1926 atrav´es do estudo das solu¸co˜es da equa¸ca˜o de Schr¨odinger para o potencial de Coulomb, como fizemos acima. O n´ umero inteiro n˜ao-negativo p ´e denominado n´ umero quˆ antico principal no contexto da Mecˆanica Quˆantica. Os auto-estados de energia s˜ao ψp, l, m (r, θ, ϕ) = cp, l, m



βr r exp − 2p l



(2l+1) Lp+l



βr p



Ylm (θ, ϕ) ,

cp, l, m sendo uma constante de normaliza¸ca˜o a ser fixada pela imposi¸ca˜o Z Z ∞Z 2 3 1 = |ψp, l, m | d x = |ψp, l, m (r, θ, ϕ)|2 r 2 drdΩ , 

3

onde dΩ = sen (θ)dθdϕ. Como por (9.68) tem-se 1

=

= (9.101)

=

S2

0

|cp, l, m |

2

Z

∞ 0



R

S2

|Ylm (θ, ϕ)|2 dΩ = 1, segue que

βr exp − p



(2l+1) Lp+l



βr p

2

 2l+3 Z ∞ 2  p (2l+1) e−ρ Lp+l (ρ) ρ2l+2 dρ |cp, l, m | β 0 2

 2l+3 p ((p + l)!)3 |cp, l, m | (2p) . β (p − l − 1)! 2

Assim, tomando cp, l, m real, obtemos cp, l, m = 18

r 2l+2 dr

Niels Henrik David Bohr (1885-1962).

s

β 2p2

 l+1 s (p − l − 1)! β . p ((p + l)!)3

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

571/1304

Finalmente, as auto-fun¸co˜es de energia normalizadas s˜ao s    l+1 s   β (p − l − 1)! l βr β βr (2l+1) r exp − ψp, l, m (r, θ, ϕ) = Lp+l Ylm (θ, ϕ) , 2 3 2p p ((p + l)!) 2p p com p ≥ l + 1, l ∈ 

,l≥0em∈

com −l ≤ m ≤ l.

• Um coment´ ario sobre a ortonormalidade das fun¸ co ˜es ψp, l, m Nota para o leitor com conhecimento de Mecˆ anica Quˆ antica Por serem auto-fun¸co˜es normalizadas do operador Hamiltoniano, as fun¸co˜es ψ p, l, m devem satisfazer as rela¸co˜es de ortogonalidade hψp0 , l, m , ψp, l, m i = δp, p0 . Integrando a parte angular, isso significa que          Z ∞ βr βr βr 2 p2l+4 ((p + l)!)3 βr (2l+1) (2l+1) 2l+2 0 exp − 0 Lp0 +l exp − . L r dr = δ p, p p+l 2p p0 2p p β 2l+3 (p − l − 1)! 0 O fator β pode ser absorvido com a mudan¸ca de vari´aveis ρ = βr e obtem-se     Z ∞ “ 0” ρ ρ 2 p2l+4 ((p + l)!)3 − ρ2 p+p (2l+1) (2l+1) 2l+2 0 pp 0 . e Lp+l ρ dρ = δp, p Lp0 +l p0 p (p − l − 1)! 0

(10.59)

Essa ´e uma nova rela¸ca˜o de ortogonalidade para os polinˆomio de Laguerre associados, a qual vale para todo p, p0 inteiros positivos (n˜ao-nulos). Perceba-se que n˜ao podemos eliminar simultaneamente p e p0 por uma mudan¸ca de vari´aveis na ´ de se notar que essa rela¸ca˜o de ortogonalidade n˜ao tem muito a ver com a rela¸ca˜o integral em (10.59). E de ortogonalidade dos polinˆomios de Laguerre associados que obtivemos em (9.98). Infelizmente, poucos livros de Mecˆanica Quˆantica ou de F´ısica-Matem´atica comentam esse ponto 19 , uma exce¸ca˜o um tanto surpreendente sendo [4] e estas Notas. Comentamos que toda a teoria do a´tomo de hidrogˆenio, incluindo as v´arias express˜oes complexas que derivamos acima envolvendo polinˆomios de Laguerre, e muito mais, j´a se encontrava nos primeiros trabalhos de Schr¨odinger sobre a Mecˆanica Quˆantica, de 1926.

10.6

Propaga¸ c˜ ao de Ondas em Tanques Cil´ındricos A vers˜ ao original desta se¸ca ˜o ´e de autoria de Andr´e M. Timpanaro, Fleury J. Oliveira e Paulo H. Reimberg20

A Mecˆanica de Fluidos, quando consideramos fluidos ideais, ´e baseada fundamentalmente na equa¸ca˜o de Euler (vide, e.g., [80] ou [18]) ∂~v 1 + (~v · ∇) ~v + ∇p − ~g = 0 , ∂t ρ 19

(10.60)

[79] e [113] ignoram o assunto e mesmo o excelente [42] atribui erroneamente a normaliza¸ca ˜o de ψ p, l, m a `s rela¸co ˜es de ortogonalidade (9.98). 20 No ano de 2005, alunos de gradua¸ca ˜o do Instituto de Fisica da Universidade de S˜ ao Paulo. T´ıtulo original da monografia: “Propaga¸ca ˜o de ondas na superf´ıcie de um l´ıquido contido em tanques circulares - uma breve an´ alise”, apresentada no curso de Mecˆ anica dos Fluidos ministrado pelo Prof. M. Cattani.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

572/1304

onde ~v ´e o campo de velocidades, ρ a densidade do fluido, p a press˜ao e ~g a acelera¸ca˜o da gravidade. Esta equa¸ca˜o, apesar de n˜ao-linear, pode, para certos limites, ser aproximada por equa¸co˜es lineares. Quando isto se d´a, a dificuldade em encontrar solu¸co˜es expl´ıcitas diminui consideravelmente. Ser´a este o caso tratado neste trabalho: o estudo de solu¸co˜es expl´ıcitas do problema de propaga¸ca˜o de ondas na superf´ıcie de um l´ıquido contido num tanque cil´ındrico. Consideraremos trˆes casos limites com a caracter´ıstica comum de que o comprimento de onda ´e muito maior que sua amplitude. O primeiro caso tratado ´e o da propaga¸ca˜o de tais ondas em um tanque cuja profundidade ´e muito grande, n˜ao havendo, desta forma, influˆencia do fundo na solu¸ca˜o das equa¸co˜es. O segundo caso tratado ´e um limite do anterior, fazendo com que o raio do tanque seja infinito. O terceiro, e u ´ ltimo caso estudado ´e aquele no qual a profundidade do tanque ´e muito menor que o comprimento de onda, para o qual obt´em-se uma solu¸ca˜o bastante parecida com a do problema da membrana circular da Se¸ca˜o 10.3, p´agina 564 (mas com condi¸co˜es de contorno do tipo de Neumann). • Ondas de gravita¸ c˜ ao e a propaga¸ c˜ ao de ondas em tanques profundos A superf´ıcie de um fluido em equil´ıbrio sob a influˆencia de um campo gravitacional uniforme ´e plana. Se, por meio de uma a¸ca˜o exterior qualquer, a superf´ıcie do fluido sair de seu estado de equil´ıbrio em um ponto, um movimento inicia-se no fluido. Este movimento se propaga por todo o fluido sob a forma de ondas. Admitamos, primeiramente, que as ondas tˆem comprimentos muito maiores que suas amplitudes. Assim, como ser´a demonstrado, o termo n˜ao linear da equa¸ca˜o de Euler, (~v · ∇)~v , pode ser desprezado v em compara¸ca˜o com ∂~ . ∂t Seja τ o per´ıodo de oscila¸co˜es das part´ıculas da onda, estas part´ıculas percorrem uma distˆancia da ordem da amplitude, a, da onda. A velocidade de seu movimento ´e , portanto, v ∼ τa .

A velocidade v varia de maneira not´avel para per´ıodos de tempo da ordem de τ e para comprimentos de onda, λ, dependendo da dire¸ca˜o de propaga¸ca˜o da onda. Desta forma, a derivada da velociade em rela¸ca˜o ao tempo ´e aproximadamente τv , e λv ´e a diferen¸ca de velocidades entre dois pontos distintos do espa¸co percorridos pela part´ıcula em um certo intervalo de tempo. Assim, se λ  a, que ´e nossa aproxima¸ca˜o inicial, tem-se 1a a2 1  , ττ τ λ

1 v v  v, τ λ

∂~v  (~v · ∇) v . ∂t

v Vemos que (~v · ∇) ~v ´e desprez´ıvel em rela¸ca˜o a ∂~ . Assim, obtemos para a equa¸ca˜o de Euler a ∂t simplifica¸ca˜o 1 ∂~v = − ∇p − ∇φ , (10.61) ∂t ρ onde φ ´e o potencial gravitacional (−∇φ = ~g ).

Para o caso isentr´opico, ou seja, para entropia constante, temos: 1 ∇p = ∇ (h + φ) , ρ

(10.62)

onde h ´e a entalpia do sistema. Aplicando o rotacional em ambos os lados da equa¸ca˜o (10.61) obtemos: ∂ ∇ × ~v = 0 ∂t

ou seja,

∇ × ~v = constante .

(10.63)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

573/1304

No entanto, para o movimento oscilat´orio, a m´edia temporal de ~v ´e nula de forma que ∇ × ~v = 0, sendo o fluido potencial em primeira aproxima¸ca˜o (ou seja, ~v ´e o gradiente de um “potencial”, por ter rotacional nulo). Pode-se ent˜ao definir uma fun¸ca˜o potencial, ϕ, como sendo: ~v = ∇ϕ

(10.64)

Aplicando a defini¸ca˜o (10.64) a` equa¸ca˜o de Euler (10.61) obtemos: ∂ϕ p = − − gz . ∂t ρ

(10.65)

Assim, temos

∂ϕ . (10.66) ∂t Suporemos o eixo z orientado verticalmente para cima e um sistema de coordenadas polares planas r, θ tendo como origem o centro do tanque cil´ındrico. p = −ρgz − ρ

Designaremos a coordenada z dos pontos da superf´ıcie do fluido por ζ; ζ ´e a fun¸ca˜o das coordenadas r, θ, e do tempo. Se na superf´ıcie a press˜ao for uma constante p0 , por exemplo, a press˜ao atmosf´erica, obteremos para a equa¸ca˜o (10.66) ∂ϕ . (10.67) p0 = −ρgζ − ρ ∂t Como, para um fluido incompress´ıvel,   p0 ∇ ϕ + t = ∇ϕ , (10.68) ρ podemos definir um novo potencial ϕ0 por:

ϕ0 := ϕ + Assim,

p0 t. ρ

∂ϕ0 = 0. gζ + ∂t z=ζ

(10.69)

(10.70)

Como ζ ´e pequeno, visto que as ondas tamb´em o s˜ao, podemos considerar que 0 ∂ζ (10.64) ∂ϕ (10.69) ∂ϕ = vz = , = ∂t ∂z ∂z de forma que a derivada temporal da equa¸ca˜o (10.70) torna-se  0  ∂ϕ 1 ∂ 2 ϕ0 = 0. + ∂z g ∂t2 z=ζ

(10.71)

(10.72)

Novamente, como as oscila¸co˜es s˜ao pequenas, pode-se substituir na equa¸ca˜o (10.72) z = 0 no lugar de z = ζ e ϕ0 por ϕ. De tal maneira, obtemos o sistema de equa¸co˜es diferencias que determinam as ondas na superf´ıcie do fluido. ∇2 ϕ = 0 ,   ∂ϕ 1 ∂ 2 ϕ = 0. + ∂z g ∂t2 z=0

(10.73) (10.74)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

574/1304

Seja (por separa¸ca˜o de vari´aveis) ϕ (r, θ, z, t) = Λ (r) A (θ) V (z) T (t). Obtem-se de (10.73) as seguintes equa¸co˜es para os fatores Λ, A e V :  r 2 Λ00 + rΛ0 + σ 2 r 2 − ν 2 Λ = 0 , (10.75) A00 + ν 2 A = 0 ,

(10.76)

V 00 − σ 2 V

(10.77)

= 0.

Para que a solu¸ca˜o seja peri´odica em θ, de per´ıodo 2π, devemos ter que ν = m, onde m ∈ . Para V , obtemos de (10.77) V (z) = Aeσz + Be−σz caso σ 6= 0 e V (z) = Az + B caso σ = 0, A e B sendo constantes. Como desejamos uma solu¸ca˜o finita para z → −∞ (onde localiza-se o fundo do tanque), devemos ter Re (σ) ≥ 0 e V (z) = Aeσz . Disso obtem-se V 0 (0)/V (0) = σ e, por (10.74), obtemos para o fator T a equa¸ca˜o T 00 + gσT = 0 . (10.78) Para que essa equa¸ca˜o tenha um carater oscilat´orio e n˜ao divirja para t → ±∞ devemos ter Im (σ) = 0 e σ > 0. Aplicando as condi¸co˜es de contorno (velocidade radial igual a zero em r = R) e admitindo que o tanque seja profundo o bastante para que o fundo n˜ao interfira, obt´em-se: ! !# " r r  m  ∞ ∞ X X βk r imθ+ βkm z gβkm gβkm R t + bk, m sen t , Jm e ak, m cos ϕ (r, θ, z, t) = R R R k=1 m=−∞ (10.79) m 0 onde Jm (x) s˜ao as fun¸co˜es de Bessel e βk ´e o k-´esimo zero da fun¸ca˜o Jm (x) em + \ {0}. Para a parte radial, n˜ao consideramos as fun¸co˜es de Neumann como poss´ıveis solu¸co˜es da equa¸ca˜o de Bessel (10.75), pois estas solu¸co˜es n˜ao s˜ao compat´ıveis com a finitude da energia, devido a` presen¸ca de uma singularidade na origem. 

Seja v0 a velocidade aplicada na superf´ıcie do fluido no instante t = 0 na dire¸ca˜o de z, ou seja, v0 ≡ v0 (r, θ, z = 0, t = 0) zˆ. Ent˜ao, v0 (r, θ) =

∞ ∞ X X

k=1 m=−∞

ak,m Jm



βkm r R



eimθ .

A partir da equa¸ca˜o (10.70) no caso em que ζ ≈ 0 e t = 0, temos s  m  ∞ ∞ X X βkm βk r imθ ζ0 (r, θ) = − bk,m e , Jm gR R k=1 m=−∞

(10.80)

(10.81)

onde ζ0 ´e a forma da superf´ıcie no instante inicial. Usando em (10.80) e (10.81) as rela¸ R πco˜es de ortogonalidade (9.145), p´agina 534, das fun¸co˜es de Bessel e as rela¸co˜es de ortogonalidade −π ei(m−n)θ dθ = 2πδmn das fun¸co˜es eimθ , determina-se o valor

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

575/1304

das constantes ak, m e bk, m , que seguem: ak, m

βkm = 2  πR (βkm )2 − m2 Jm (βkm ) (βkm )3/2

bk, m = πR3/2

(βkm )2



√ g 

m2

Jm (βkm )

Z RZ 0

2

π

v0 (r, θ) e

−imθ

Jm

−π

Z RZ 0



βkm r R

π

ζ0 (r, θ) e

−imθ

Jm

−π





r dθ dr ,

(10.82)



(10.83)

βkm r R

r dθ dr .

Assim, determina-se completamente a solu¸ca˜o para o potencial da velocidade do fluido. Aplicando o gradiente pode-se obter as velocidades com que as ondas se propagam nas dire¸co˜es radial e vertical em termos das condi¸co˜es iniciais. Desta forma, ! !# " r r   ∞ ∞ X X gβkm gβkm βkm 0 βkm r imθ+ βkm z R Jm t + bk, m sen t , ak, m cos e vr = R R R R m=−∞ k=1

vz

! " r  m  ∞ ∞ mz m m X X β βk βk r imθ+ k gβk R = Jm t + bk, m sen e ak, m cos R R R m=−∞ k=1

r

gβkm R

t

!#

.

Vemos dessas express˜oes que as velocidades decrescem exponencialmente com a profundidade. A forma final da superf´ıcie ´e dada pela equa¸ca˜o (10.70) (no caso em que ζ ≈ 0) e fica s ! !# " r r  m  ∞ ∞ X X βkm βk r imθ gβkm gβkm ζ = Jm t − bk, m cos t . (10.84) e ak, m sen gR R R R k=1 m=−∞ As ondas cuja propaga¸ca˜o ´e descrita pelas express˜oes acima s˜ao denominadas ondas de gravita¸ca ˜o na literatura da Mecˆanica dos Fluidos. Vide e.g. [80]. • Propaga¸ c˜ ao de ondas em um tanque profundo de raio infinito Abordaremos agora o limite em que o raio e a profundidade do tanque s˜ao muito grandes (infinitos). Tal ´e o caso se considerarmos ondas de pequeno comprimento de onda se propagando no meio de um oceano. Nesse caso teremos novamente as equa¸co˜es (10.73)-(10.74) 2 ϕ ∂ϕ ∂ 2 ϕ 2∂ ϕ + 2 +r ∇ϕ = 0 ⇒ r +r = 0 ∂r 2 ∂r ∂θ ∂z 2  2  ∂ ϕ ∂ϕ = 0. +g ∂t2 ∂z z=0 2

e

2∂

2

(10.85)

(10.86)

Para fazermos a separa¸ca˜o de vari´aveis suporemos que ϕ pode ser escrita como ϕ = ϕ(r, θ, z, t) = A(r)B(θ)C(z)D(t) .

(10.87)

Dessa forma, as equa¸co˜es (10.85) e (10.86) ficam respectivamente r 2 A00 BCD + rA0 BCD + AB 00 CD + r 2 ABC 00 D = 0

(10.88)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

576/1304

e ABC(0)D 00 + gABC 0 (0)D = 0 .

(10.89)

Para resolver a equa¸ca˜o (10.88) iremos dividi-la por ABCD = ϕ. Sempre poderemos fazer isso desde que a solu¸ca˜o para ϕ n˜ao seja a solu¸ca˜o trivial. Tamb´em iremos supor que as seguintes condi¸co˜es s˜ao obedecidas: B 00 = cte. = −ν 2 . (10.90) B e C 00 = cte. = k 2 . (10.91) C Discutiremos se ν e k s˜ao ou n˜ao reais mais tarde. Levando em conta (10.90) e (10.91), (10.88) fica: r2

A00 A0 +r = ν 2 − k2 r2 A A

=⇒

r 2 A00 + rA0 + (r 2 k 2 − ν 2 )A = 0 .

(10.92)

Se fizermos uma mudan¸ca de vari´avel chegaremos na equa¸ca ˜o de Bessel para a fun¸ca˜o J ν (x), de forma que a solu¸ca˜o ´e A(r) = KJν (kr) . (10.93) Se resolvermos (10.90) e (10.91) obteremos: B(θ) = ξθ eiνθ + ζθ e−iνθ ,

(10.94)

C(z) = ξz ekz + ζz e−kz .

(10.95)

Note que para que ϕ seja cont´ınua e diferenci´avel (precisaremos dessas condi¸co˜es se quisermos descrever a superf´ıcie de forma satisfat´oria), ent˜ao devemos ter que ν ´e inteiro. Al´em disso, como vamos somar as solu¸co˜es com ν variando de −∞ at´e +∞, podemos sem perda de generalidade considerar ζθ = 0. Na equa¸ca˜o (10.95), devemos manter em mente que como o tanque ´e sem fundo devemos ter a rela¸ca˜o z → −∞ ⇒ ϕ → 0 satisfeita, de forma que k deve ser real (e sem perda de generalidade positivo) e ζz = 0. Ent˜ao a equa¸ca˜o (10.89) fica  p  p D 00 gk t + ζtkν sen gk t . (10.96) = −gk =⇒ D(t) = ξtkν cos D

Ent˜ao o resultado para o potencial ´e

h p  p i ϕkν (r, z, θ, t) = Jν (rk)eiνθ+kz Ekν cos gk t + Fkν sen gk t ,

(10.97)

onde as constantes Ekν e Fkν s˜ao definidas como

Ekν = ξθ ξtkν , Fkν = ξθ ζtkν . Para determinarmos essas constantes em termos de k e ν, precisamos escolher condi¸co˜es iniciais. Lembrando ent˜ao as equa¸co˜es que foram deduzidas para as ondas pequenas (e que tamb´em valem nesse

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

577/1304

caso) para a coordenada z dos pontos do fluido na superf´ıcie, ζ. Ent˜ao podemos escrever as condi¸co˜es | e de Z(r, θ, t) = ∂ϕ | no instante t = 0 em termos de T (r, θ, t) = ∂ϕ ∂t z=0 ∂z z=0

Para tanto usaremos a transformada de Hankel21 (tamb´em conhecida como transformada de FourierBessel) e a rela¸ca˜o de ortogonalidade da fun¸ca˜o einx : Z ∞ √ F(q) = Hν (f )(q) = f (x) qxJν (qx) dx , (10.98) 0

f (x) =

Hν−1 (F)(x) Z

=

Z



√ F(q) qxJν (qx) dq ,

(10.99)

0

π

ei(m−n)x dx = 2πδmn .

(10.100)

−π

Ent˜ao, se Skν (r, θ) = Z(r, θ, 0), tem-se

Skν (r, θ) = kJν (rk)e

=

Z



iνθ

Ekν

=⇒

Hλ−1



Ekν =

Z

2πkJλ (rk)Ekλ dk =

0

o que nos leva a

Se R(r, θ) = T (r, θ, 0), ent˜ao p Rkν (r, θ) = gkJν (rk)Fkν =

Z

∞ 0

e, portanto,

Z

=⇒

0

π

Se

−iλθ

dθ =

−π

r

k Ekλ r

∞Z π

−π

Z

!

=⇒

∞ 0

∞ X

2πkJν (rk)Ekν δνλ dk

ν=−∞



kEkλ = Hλ

Z

π −π

 √ rS(r, θ)e−iλθ dθ , 2π

rZ(r, θ, 0) −iνθ e Jν (rk) dθ dr . 2π

π

Re

−iλθ

dθ =

−π

 r  p g −1 Fkλ 2π gkJλ (rk)Fkλ dk = Hλ 2π r Fkν

Z

Z

∞ 0

=⇒

∞ X

ν=−∞



(10.101)

p gkJν (rk)Fkν δνλ dk =

Fkλ = Hλ

s Z Z k ∞ π rT (r, θ, 0) −iνθ e Jν (rk) dθ dr . = g 0 −π 2π

r

r 1 g 2π

Z

π

Re −π

−iλθ





(10.102)

As fun¸co˜es Z e T podem ser obtidas a partir de ζ e ∂ζ , as condi¸co˜es iniciais, a partir das equa¸co˜es ∂t (10.69), (10.70) e (10.71) que tamb´em podem ser utilizadas para obter ζ. Por fim podemos obter o 21

Hermann Haenkel (1839-1873).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

578/1304

campo de velocidades tomando ~v = ∇ϕ. E e F determinam completamente ϕ: ϕ(r, z, θ, t) =

∞ Z X

ν=−∞



Jν (rk)e

iνθ+kz

0

h

Ekν cos

p



p i gk t + Fkν sen gk t dk , (10.103)

~v (r, z, θ, t) = ∇ϕ(r, z, θ, t) , ζ(r, θ, t) = −

(10.104)

p0 1 ∂ϕ − (r, θ, 0, t) . ρg g ∂t

(10.105)

• Grandes ondas de gravita¸ c˜ ao e a propaga¸ c˜ ao de ondas em tanques rasos Trataremos agora da propaga¸ca˜o de ondas com um comprimento de onda grande relativamente a` profundidade do meio onde se d´a a propaga¸ca˜o, mas amplitude pequena em rela¸ca˜o ao comprimento de onda. Suporemos tratar de tanque cil´ındrico de raio R. Na situa¸ca˜o de equil´ıbrio, sem movimento, o fluido atinge uma altura h0 do tanque. Suporemos um sistema de coordenadas cil´ındricas r, θ, z, com o eixo z coincidente com o eixo de simetria do tanque, sendo a coordenada z medida a partir do fundo do tanque no sentido crescente para cima. Em havendo movimento do fluido, cada ponto da sua superf´ıcie ter´a altura h(r, θ), medida a partir do fundo do tanque. Definindo ζ(r, θ) = h(r, θ) − h0 , podemos escrever h = h0 + ζ. A grandeza ζ descreve o afastamento da superf´ıcie do fluido em rela¸ca˜o a` superf´ıcie de equil´ıbrio. Como justificado anteriormente, podemos novamente desconsiderar o termo n˜ao-linear da equa¸ca˜o de Euler (10.60), que reduz-se a ∂~v ∇p = − + ~g (10.106) ∂t ρ Escrevendo esta equa¸ca˜o para as componentes radial e tangencial, respectivamente, teremos ∂vr ∂t

= −

1 ∂p , ρ ∂r

(10.107)

∂vθ ∂t

= −

1 ∂p , ρr ∂θ

(10.108)

∂vz ∂t

= −

∂p . ∂z

(10.109)

Lembrando que a press˜ao num ponto interior a um fluido aproximadamente est´atico ´e dada por p ∼ = p0 + ρg (h − z)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

579/1304

onde h ´e altura da superf´ıcie do fluido medida a partir do fundo, obteremos, substituindo esta em (10.107) e em (10.108), a aproxima¸ca˜o ∂vr ∂t

∂h ∼ , = −g ∂r

(10.110)

∂vθ ∂t

g ∂h ∼ , = − r ∂θ

(10.111)

∂vz ∂t

∼ = 0.

(10.112)

A equa¸ca˜o de continuidade ∂ρ + ∇ · (ρ~v ) = 0 reduz-se, para fluidos incompress´ıveis (ou seja, com ∂t ρ = const.) a ∇ · ~v = 0. Em coordenadas cil´ındricas isso significa ∂vz 1 ∂ (rvr ) 1 ∂vθ + + = 0. ∂z r ∂r r ∂θ Integrando-se essa equa¸ca˜o em z entre z = 0 (fundo do tanque) e z = h(r, θ, t) := h 0 + ζ(r, θ, t) (superf´ıcie superior do fluido), obtemos Z h Z h 1 ∂vθ 1 ∂ (rvr ) dz + dz = 0 , vz (r, θ, h(r, θ, t), t) + ∂r 0 r ∂θ 0 r onde usamos a hip´otese que vz (z = 0) = 0 (ou seja, o fluido n˜ao se move verticalmente no fundo do tanque). Supondo agora que o tanque seja razo, e que vr e vθ n˜ao dependam da altura z, a u ´ ltima express˜ao pode ser aproximada por vz (r, θ, h(r, θ, t), t) + h(r, θ, t) Lembrando que vz (r, θ, h, t) =

∂h , ∂t

1 ∂vθ 1 ∂ (rvr ) + h(r, θ, t) = 0, r ∂r r ∂θ

obtemos ∂h h ∂ (rvr ) h ∂vθ + + = 0, ∂t r ∂r r ∂θ

Derivando esta equa¸ca˜o em rela¸ca˜o ao tempo, teremos      vz ∂vθ ∂vr h ∂ ∂vθ vz ∂ ∂2h h ∂ (rv ) + = 0. + r + + r ∂t2 r ∂r ∂t r ∂θ ∂t r ∂r r ∂θ Usando as express˜oes (10.110) e (10.111) a equa¸ca˜o acima fica      ∂2h h ∂ vz ∂ vz ∂vθ ∂h h ∂2h − g + (rv ) + = 0. r − g r ∂t2 r ∂r ∂r r 2 ∂θ 2 r ∂r r ∂θ Utilizando h = h0 + ζ, desprezando termos quadr´aticos em ζ e nas velocidades, obtem-se  2  ∂2ζ ∂ ζ 1 ∂ζ 1 ∂2ζ − gh0 + + = 0. (10.113) ∂t2 ∂r 2 r ∂r r 2 ∂θ 2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

580/1304

Podemos notar que a express˜ao entre parˆenteses ´e o Laplaciano bidimensional escrito em coordenadas polares. Com isso podemos escrever (10.113) mais sucintamente como: ∂2ζ − gh0 ∇2 ζ = 0 . ∂t2

(10.114)

Vemos que esta√ ´e uma equa¸ca˜o de onda em duas dimens˜oes, que corresponde a ondas com velocidade de propaga¸ca˜o gh0 (Coment´ario en pasant: o fato de a velocidade de propaga¸ca˜o diminuir com a profundidade do tanque explica o por quˆe de uma onda “quebrar” ao se aproximar de uma praia). As ondas cuja propaga¸ca˜o ´e descrita por (10.114) s˜ao denominadas grandes ondas de gravita¸ca ˜o na literatura da Mecˆanica dos Fluidos. Vide e.g. [80]. Como desejamos conhecer a forma de ondas na superf´ıcie de um tanque cil´ındrico devemos aplicar o m´etodo de separa¸ca˜o de vari´aveis a` equa¸ca˜o (10.114). Supondo ζ da forma Λ (r) A (θ) T (t) na equa¸ca˜o (10.114), teremos: σ2 T = 0, gh0  r 2 Λ00 + rΛ0 + σ 2 r 2 − ν 2 Λ = 0 , T 00 +

A00 + ν 2 A = 0 .

(10.115) (10.116) (10.117)

Devido a` expres˜ao (10.110), e ao fato de a velocidade radial nula vr ser ∂h na borda do tanque (quando = = 0. Essa rela¸ca˜o deve ser r = R) para todo tempo t, constatamos que devemos ter ∂ζ ∂r r=R ∂r r=R entendida como condi¸ca˜o de contorno (do tipo de Neumann) a ser satisfeita pela fun¸ca˜o ζ(r, θ).

Resolvendo sistema de equa¸co˜es diferenciais (10.115)-(10.117) sujeito a` condi¸ca˜o de contorno de que a derivada de ζ em rela¸ca˜o ao raio deve anular-se em r = R a solu¸ca˜o para o perfil das ondas na superf´ıcie do l´ıquido ser´a:   m√   m    m√ ∞ ∞ X X βk gh0 t βk r imθ βk gh0 t + bk,m sen Jm e , (10.118) ζ (r, θ, t) = ak,m cos R R R k=1 m=−∞ onde ν = m ∈ para que a solu¸ca˜o seja peri´odica de per´ıodo 2π em θ e onde, como anterioremente, 0 em + \ {0}. Para a parte radial, n˜ao consideramos as fun¸co˜es de βkm designa o k-´esimo zero de Jm Neumann como poss´ıveis solu¸co˜es da equa¸ca˜o de Bessel, pois estas n˜ao s˜ao compat´ıveis com a finitude da energia, devido a` presen¸ca de uma singularidade na origem. 



Supondo, como condi¸co˜es iniciais, que a superf´ıcie do l´ıquido tenha uma forma descrita por uma fun¸ca˜o ζ0 (r, θ) e uma distribui¸ca˜o de velocidades verticais dada por v0 (r, θ) em t = 0, teremos: ζ0 (r, θ) =

∞ ∞ X X

k=1 m=−∞

ak, m Jm



βkm r R



eimθ ,

√  m  βk r imθ βkm gh0 Jm v0 (r, θ) = bk, m e . R R k=1 m=−∞ ∞ ∞ X X

(10.119)

(10.120)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

581/1304

Utilizando em (10.119) e (10.120) asR rela¸co˜es de ortogonalidade (9.145), p´agina 534, das fun¸co˜es de π Bessel e as rela¸co˜es de ortogonalidade −π ei(m−n)θ dθ = 2πδmn das fun¸co˜es eimθ , teremos: ak, m = πR2

bk, m = πR





1−



gh0 βkm

m βkm



1 2 

1−

(Jm (βkm ))2

1 

m βkm

2 

Z RZ 0

π

ζ0 (r, θ) e −π

(Jm (βkm ))2

Z RZ 0

−imθ

Jm



βkm r R



π

v0 (r, θ) e −π

−imθ

Jm

r drdθ ,



βkm r R



(10.121)

r drdθ (. 10.122)

Essas express˜oes determinam completamente os coeficientes ak, m e bk, m para todos k e m em termos das condi¸co˜es iniciais.

JCABarata. Curso de F´ısica-Matem´ atica

10.7

Cap´ıtulo 10

Vers˜ ao de 29 de setembro de 2005.

582/1304

Exerc´ıcios Adicionais

E. 10.5 Exerc´ıcio. Determine a solu¸c˜ao da equa¸c˜ao de ondas com amortecimento ∂u 1 ∂2u +γ − ∆u = 0, 2 2 c ∂t ∂t γ > 0, em duas dimens˜oes, no interior de um disco de raio R, com |u(ρ, ϕ, t)| < ∞, com condi¸co˜es de contorno de Dirichlet u(R, ϕ, t) = 0 e com as condi¸co˜es iniciais u(ρ, ϕ, 0) = 0 onde v0 (ρ) =

e

∂u (ρ, ϕ, 0) = v0 (ρ), ∂t

  V, 0 ≤ ρ ≤ R0 < R 

.

0, R0 < ρ ≤ R

Acima, as coordenadas ρ e ϕ referem-se ao sistema de cordenadas polares cuja origem coincide com o centro do disco de raio R. Sugest˜ ao. Ao resolver a equa¸c˜ao para a parte temporal (m´etodo de separa¸c˜ao de vari´aveis), lembre-se que alguns modos de vibra¸c˜ao podem ter amortecimento sub-cr´ıtico e outros supercr´ıtico. Para simplificar, ignore o caso de amortecimento cr´ıtico. 6 E. 10.6 Exerc´ıcio. Determine (t˜ao detalhada e explicitamente quanto poss´ıvel) a solu¸c˜ao da equa¸c˜ao de ondas com amortecimento 1 ∂2u ∂u − 4u = 0, +γ 2 2 c ∂t ∂t γ > 0, em trˆes dimens˜oes, no interior da esfera de raio R, com |u(r, θ, ϕ, t)| < ∞, com condi¸co˜es de contorno de Dirichlet u(R, θ, ϕ, t) = 0 e com as condi¸co˜es iniciais u(r, θ, ϕ, 0) = 0 onde v0 (r) =

e

∂u (r, θ, ϕ, 0) = v0 (r), ∂t

  V, 0 ≤ r ≤ R0 < R 

.

0, R0 < r ≤ R

6

E. 10.7 Exerc´ıcio. Determine a solu¸c˜ao da equa¸c˜ao da corda pendurada com amortecimento   ∂2u ∂ ∂u ∂u −g +γ z = 0, ∂t2 ∂t ∂z ∂z onde γ > 0 e g > 0, que descreve o movimento de uma corda de comprimento L localizada, quando em repouso, no intervalo 0 ≤ z ≤ L do eixo vertical, pendurada pelo seu extremo superior (o que corresponde `a

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

583/1304

(z, 0) = v0 (z), condi¸c˜ao de contorno u(L, t) = 0 para todo t) e com condi¸co˜es iniciais u(z, 0) = u 0 (z) e ∂u ∂t para certas fun¸co˜es u0 e v0 dadas. Sugest˜ ao. Ao resolver a equa¸c˜ao para a parte temporal (m´etodo de separa¸c˜ao de vari´aveis), lembre-se que alguns modos de vibra¸c˜ao podem ter amortecimento sub-cr´ıtico e outros super-cr´ıtico. Para simplificar, ignore o caso de amortecimento cr´ıtico. 6 E. 10.8 Exerc´ıcio. Determine o potencial el´etrico φ(r, θ) produzido no v´acuo por um anel unidimensional de raio R, uniformemente carregado com carga el´etrica total Q e densidade linear de carga λ = Q/(2πR), nas seguintes regi˜oes: a) r > R. b) r < R. c) r = R, mas θ 6= π/2.

As vari´aveis r e θ referem-se ao sistema de coordenadas esf´ericas cuja origem ´e o centro do anel e cujo eixo z, a partir de onde o ˆangulo θ ´e medido, coincide com o eixo de simetria do anel. Sugest˜ ao 1. Calcule primeiramente o potencial ao longo do eixo de simetria. Para os demais pontos use a solu¸c˜ao da equa¸c˜ao de Laplace:  ∞  X Bn n φ(r, θ) = An r + n+1 Pn (cos(θ)) . r n=0 Os coeficientes An e Bn s˜ao fixados pela solu¸c˜ao ao longo do eixo de simetria (que correspondem a θ = 0 e θ = π). Sugest˜ ao 2. Para |x| < 1 vale (1 + x)

α

=

∞ X k=0

Γ(α + 1) xk . Γ(α − k + 1)Γ(k + 1)

Em particular, para |t| < 1, tem-se (1 + t)

−1/2

= 1+

∞ X k=1

αk tk ,

com

αk = (−1)k

(2k − 1)!! . (2k)!! 6

E. 10.9 Exerc´ıcio. Determine o potencial el´etrico φ(r, θ) produzido no v´acuo por um disco de raio R, uniformemente carregado com carga el´etrica total Q e densidade superficial de carga σ = Q/(πR 2 ), nas seguintes regi˜oes: a) r > R. b) r < R, mas 0 ≤ θ < π/2.

c) r < R, mas π/2 < θ ≤ π.

As vari´aveis r e θ referem-se ao sistema de coordenadas esf´ericas cuja origem ´e o centro do disco e cujo eixo z, a partir de onde o ˆangulo θ ´e medido, coincide com o eixo de simetria do disco.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

584/1304

Sugest˜ oes. Calcule primeiramente o potencial ao longo do eixo de simetria. Para os demais pontos use a solu¸c˜ao (10.15) da equa¸c˜ao de Laplace : φ(r, θ) =

∞  X n=0

Bn An r + n+1 r n



Pn (cos(θ)) .

Use tamb´em a expans˜ao binomial citada no Exerc´ıcio E. 10.8, p´agina 583. Lembre-se tamb´em que sobre o semi-eixo z > 0, onde θ = 0, tem-se z 2n = r 2n P2n (cos(0)) para todo n ≥ 0 e |z| = +rP1 (cos(0)). Por´em, sobre o semi-eixo z < 0, onde θ = π, tem-se z 2n = r 2n P2n (cos(π)) para todo n ≥ 0 mas |z| = −rP1 (cos(π)). Esse u ´ltimo sinal “-” ´e importante para distinguir as solu¸co˜es dos itens b e c. 6 E. 10.10 Exerc´ıcio. Considere uma barra unidimensional de comprimento L, uniformemente carregada e com carga el´etrica total Q. Determine, em termos de uma expans˜ao em s´erie envolvendo polinˆomios de Legendre, o potencial el´etrico φ(r, θ) produzido por essa barra no v´acuo na regi˜ao r > L/2. As vari´aveis r e θ referem-se ao sistema de coordenadas esf´ericas cuja origem ´e ponto m´edio da barra e cujo eixo z, a partir do qual o ˆangulo θ ´e medido, coincide com o eixo da barra. Para averiguar se o resultado obtido est´a correto, verifique a validade aproximada da lei de Coulomb para r grande. Sugest˜ ao. Como no exerc´ıcio anterior, determine primeiro o potencial ao longo do eixo z.

6

E. 10.11 Exerc´ıcio. Uma esfera homogˆenea de raio R, boa condutora de calor, com constante de difus˜ao K, encontra-se em contacto t´ermico com um banho t´ermico `a temperatura T = 0. No instante de tempo t = 0 a temperatura inicial da esfera ´e descrita (em um sistema de coordenadas esf´ericas, cuja origem coincide com o centro da esfera) por uma fun¸c˜ao u0 (r, θ, ϕ), com 0 ≤ r ≤ R, 0 ≤ θ ≤ π e 0 ≤ ϕ ≤ 2π.

a. Determine a temperatura u(r, θ, ϕ, t) de um ponto do interior da esfera com coordenadas (r, θ, ϕ) no instante t ≥ 0.

b. Determine explicitamente u(r, θ, ϕ, t) para o caso em que u0 (r, θ, ϕ) = T0 ( sen ξ)/ξ, onde ξ = πr/R. Sugest˜ ao. Fun¸co˜es de Bessel esf´ericas. 6

E. 10.12 Exerc´ıcio. Um cano cil´ındrico infinito, cujo raio interno ´e R 1 e cujo raio externo ´e R2 , ´e formado por um material Mc cuja constante de difus˜ao t´ermica ´e K. O cano est´a em contacto por dentro com um material M1 `a temperatura T1 e por fora com um material M2 `a temperatura T2 . As temperaturas dos materiais M1 e M2 s˜ao mantidas constantes e n˜ao mudam nem com o tempo nem com a posi¸c˜ao. Adotemos coordenadas cil´ındricas (r, ϕ, z), cujo eixo z coincide com o eixo do cilindro. Deseja-se determinar a temperatura u(r, ϕ, z, t) no interior do cano, ou seja, para R 1 ≤ r ≤ R2 . Como o cano ´e infinito e as temperaturas dos meios M1 e M2 n˜ao variam, a temperatura u deve ser apenas uma fun¸c˜ao de r, ϕ e t. Seguindo a Lei de Fourier, as condi¸co˜es de contorno a serem satisfeitas em r = R 1 e em r = R2 devem

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 10

585/1304

impor que o fluxo de calor na superf´ıcie de contacto entre o cano um meio externo deve ser proporcional `a diferen¸ca de temperatura entre ambos os meios na superf´ıcie de contacto, sendo que a constante de proporcionalidade σ depende de ambos os materiais em contacto t´ermico. Ou seja, devemos impor ∂u (R1 , ϕ, t) = +σ1 [u(R1 , ϕ, t) − T1 ] ∂r e

∂u (R2 , ϕ, t) = −σ2 [u(R2 , ϕ, t) − T2 ] , ∂r

para todo t e todo ϕ. Sabendo que a temperatura no interior do cano (ou seja, para R 1 ≤ r ≤ R2 ) era u0 (r, ϕ) no instante t = 0, determine a temperatura u(r, ϕ, z, t) para todo t > 0. A temperatura u deve satisfazer a equa¸c˜ao de difus˜ao do calor ∂u = K4u . ∂t Sugest˜ ao. As condi¸co˜es de contorno acima s˜ao n˜ao-homogˆeneas. Para passar para condi¸co˜es homegˆeneas, proceda da seguinte forma. Escreva u(r, ϕ, t) = f (r, ϕ, t) + g(r) e escolha g, que ´e uma fun¸c˜ao apenas de r, de modo que 4g = 0 e de modo que g 0 (R1 ) − σ1 g(R1 ) = −σ1 T1

e g 0 (R2 ) + σ2 g(R2 ) = +σ2 T2 . Com isso, como 4g = 0, a fun¸c˜ao f deve satisfazer tamb´em a equa¸c˜ao de difus˜ao ∂f = K4f ∂t

mas com condi¸co˜es de contorno homogˆeneas ∂f (R1 , ϕ, t) − σ1 f (R1 , ϕ, t) = 0 ∂r e

∂f (R2 , ϕ, t) + σ2 f (R2 , ϕ, t) = 0 , ∂r

para todo t e todo ϕ. P.S. 1. A determina¸c˜ao dos auto-valores n˜ao precisa ser feita completamente, caso envolva a solu¸c˜ao ´ suficiente deixar indicado como proceder. de uma equa¸c˜ao transcendente. E P.S. 2. A solu¸c˜ao para f requer o uso de fun¸co˜es de Bessel e de Neumann (fun¸co˜es de Bessel de ´ importante determinar as rela¸co˜es de ortogonalidade a serem usadas. segundo tipo). E P.S. 3. N˜ao esque¸ca que a condi¸c˜ao inicial para f ´e f (r, ϕ, 0) = u0 (r, ϕ) − g(r) . 6

Cap´ıtulo 11 Rudimentos da Teoria das Equa¸co ˜es Diferenciais Parciais Conte´ udo 11.1 Defini¸ ca ˜o e Alguns Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . 586 11.2 O M´ etodo de Separa¸ ca ˜o de Vari´ aveis

. . . . . . . . . . . . . . . . . . . . . 587

11.3 Unicidade de Solu¸ co ˜es de Equa¸ co ˜es Diferenciais Parciais . . . . . . . . . . 590 11.3.1 Casos Simples. Discuss˜ao Preliminar . . . . . . . . . . . . . . . . . . . . . . . 590 11.3.2 Unicidade de Solu¸co˜es. Generaliza¸co˜es . . . . . . . . . . . . . . . . . . . . . . 597

este cap´ıtulo apresentaremos uma breve introdu¸ca˜o a` teoria das equa¸co˜es diferenciais parciais. Ser˜ao apresentados alguns m´etodos de resolu¸ca˜o mais comummente empregados e alguns teoremas de unicidade de solu¸ca˜o de importˆancia na justificativa daqueles m´etodos. Assim como as equa¸co˜es diferenciais ordin´arias, introduzidas no Cap´ıtulo 5, p´agina 260, equa¸co˜es diferenciais parciais s˜ao de guande importˆancia nas Ciˆencias Naturais por expressarem leis f´ısicas. Ainda que tenham se desenvolvido em paralelo, a teoria das equa¸co˜es diferenciais ordin´arias dintinguese um tanto da teoria das equa¸co˜es diferenciais parciais, pois na segunda menos resultados gerais s˜ao conhecidos e os m´etodos de resolu¸ca˜o e de an´alise qualitativa s˜ao mais intrincados e limitados em escopo. Por exemplo, n˜ao existem na teoria das equa¸co˜es diferenciais parciais, resultados sobre existˆencia de solu¸ca˜o que sejam t˜ao gerais quanto os Teoremas de Peano e de Picard-Lindel¨of, v´alidos para equa¸co˜es diferenciais ordin´arias (vide Teorema 5.1, p´agina 280 e Teorema 5.2, p´agina 281). V´arios m´etodos de resolu¸ca˜o de equa¸co˜es diferenciais parciais, como o m´etodo de separa¸ca˜o de vari´aveis e o m´etodo das caracter´ısticas, envolvem a resolu¸ca˜o de equa¸co˜es diferenciais ordin´arias e vamos nos dedicar a eles aqui. Exemplos de aplica¸co˜es poder˜ao ser encontrados no Cap´ıtulo 10, p´agina 544.

11.1

Defini¸ c˜ ao e Alguns Exemplos

• Exemplos de equa¸ co ˜es diferenciais parciais de interesse • Tipos de equa¸ co ˜es lineares parciais Lineares, homogˆeneas, n˜ao-homogˆeneas, semi-lineares etc... • Classifica¸ c˜ ao de equa¸ co ˜es lineares de segunda ordem

586

JCABarata. Curso de F´ısica-Matem´ atica

11.2

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

587/1304

O M´ etodo de Separa¸ c˜ ao de Vari´ aveis

O chamado m´etodo de separa¸ca ˜o de vari´ aveis ´e freq¨ uentemente empregado na solu¸ca˜o de certas equa¸co˜es diferenciais parciais lineares e homogˆeneas. Quer a sorte que muitas equa¸co˜es de interesse em F´ısica pertencem a` classe de equa¸co˜es para as quais esse m´etodo ´e eficaz, uma das raz˜oes da sua popularidade. Uma segunda vantagem desse m´etodo reside no fato de o mesmo transformar um problema de equa¸co˜es diferenciais parciais em uma s´erie de problemas de equa¸co˜es diferenciais ordin´arias, sobre as quais muito mais ´e conhecido no que concerne a m´etodos de solu¸ca˜o. Uma terceira raz˜ao para o interesse no m´etodo de separa¸ca˜o de vari´aveis reside no fato de o mesmo permitir explorar simetrias de determinados problemas (por exemplo, a simetria por rota¸co˜es), o que ´e de particular utilidade em certas situa¸co˜es. O m´etodo de separa¸ca˜o de vari´aveis foi descoberto originalmente por Daniel Bernoulli 1 no estudo de diversas equa¸co˜es diferenciais, como a equa¸ca˜o da corda vibrante. Vamos apresentar o m´etodo de separa¸ca˜o de vari´aveis no tratamento de uma equa¸ca˜o de segunda ordem em duas vari´aveis reais, digamos x e y, definidas em um certo dom´ınio de 2 . Seja a equa¸ca˜o a derivadas parciais da forma 

A(x)

∂2u ∂2u ∂u ∂u + B(y) + C(x) + D(y) + (E(x) + F (y))u = 0 , 2 2 ∂x ∂y ∂x ∂y

(11.1)

sendo que ou A ou B n˜ao ´e identicamente nula (de modo que a equa¸ca˜o seja de segunda ordem em pelo menos uma das vari´aveis, mas n˜ao-necessariamente em ambas) a ser satisfeita por uma fun¸ca˜o inc´ognita de duas vari´aveis u(x, y). Como claramente indicado acima, as fun¸co˜es A, C e E s˜ao fun¸co˜es de uma u ´ nica vari´avel, a saber x, enquanto que B, D e F s˜ao fun¸co˜es de uma u ´ nica vari´avel, a saber ´ preciso supor muito pouco sobre essas fun¸co˜es, por exemplo, que as mesmas s˜ao cont´ınuas, mas y. E mesmo essa hip´otese pode ser enfraquecida, o que ocorre em muitos exemplos de interesse (vide as pr´oximas se¸co˜es). Por enquanto, deixemos de lado considera¸co˜es sobre o dom´ınio de validade D ⊂ 2 da equa¸ca˜o acima e sobre condi¸co˜es de contorno e concentremo-nos em procurar solu¸co˜es particulares de (11.1). 

O m´etodo de separa¸ca˜o de vari´aveis consiste em procurar solu¸co˜es particulares para a equa¸ca˜o (11.1) que sejam da forma u(x, y) = X(x)Y (y). Antes de fazermos perguntas sobre a aplicabilidade dessa id´eia, vejamos a que a mesma conduz. Inserindo o Ansatz u(x, y) = X(x)Y (y) na equa¸ca˜o (11.1), obtem-se A(x)X 00 (x)Y (y) + B(y)X(x)Y 00 (y) + C(x)X 0 (x)Y (y) + D(y)X(x)Y 0 (y) + (E(x) + F (y))X(x)Y (y) = 0 . Dividindo-se essa express˜ao por X(x)Y (y), obtem-se A(x)

X 00 (x) Y 00 (y) X 0 (x) Y 0 (y) + B(y) + C(x) + D(y) + E(x) + F (y) = 0 . X(x) Y (y) X(x) Y (y)

Aqui, ´e de se observar que cada termo da express˜ao acima ´e fun¸ca˜o de uma u ´ nica vari´avel. Separando os termos que dependem de cada vari´avel em cada lado da igualdade, obtem-se da u ´ ltima express˜ao     X 00 (x) X 0 (x) Y 00 (y) Y 0 (y) A(x) + C(x) + E(x) = − B(y) + D(y) + F (y) . X(x) X(x) Y (y) Y (y) 1

Daniel Bernoulli (1700-1782).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

588/1304

Chegamos agora ao ponto crucial que justifica o que foi feito at´e aqui. Do lado esquerdo da igualdade acima encontra-se uma fun¸ca˜o que depende apenas de x e do lado direito uma fun¸ca˜o apenas de y. Ora, como ambas as vari´aveis s˜ao independentes, uma tal igualdade s´o ´e possivel se ambos os lados forem iguais a uma mesma constante, que denotaremos por λ, a qual ´e denominada constante de separa¸ca ˜o. Assim,     X 00 (x) X 0 (x) Y 00 (y) Y 0 (y) A(x) + C(x) + E(x) = − B(y) + D(y) + F (y) = λ , X(x) X(x) Y (y) Y (y) o que implica o par de equa¸co˜es A(x)X 00 (x) + C(x)X 0 (x) + (E(x) − λ)X(x) = 0 ,

(11.2)

B(y)Y 00 (y) + D(y)Y 0 (y) + (F (y) + λ)Y (y) = 0 ,

(11.3)

cada qual sendo uma equa¸ca˜o diferencial ordin´aria. Ambas as equa¸co˜es podem agora, em princ´ıpio, ser tratadas separadamente com os m´etodos de solu¸ca˜o dispon´ıveis para equa¸co˜es diferenciais ordin´arias ´ de se lembrar, por´em, como por exemplo, o m´etodo de expans˜ao em s´erie ou o m´etodo de Frobenius. E que ambas as equa¸co˜es n˜ao s˜ao totalmente desacopladas, pois tˆem em comum a presen¸ca da mesma constante de separa¸ca˜o ainda indeterminada λ. Uma pergunta que se coloca nesse momento ´e se a equa¸ca˜o (11.1) ´e a forma mais geral de uma equa¸ca˜o linear de segunda ordem em duas vari´aveis para a qual o Ansatz u(x, y) = X(x)Y (y) conduz a equa¸co˜es separadas para X e para Y . N˜ao ´e do conhecimento do autor que sejam conhecidas condi¸co˜es necess´arias e suficientes para a separabilidade de equa¸co˜es diferenciais parciais lineares, de modo que a forma da (11.1) ´e apenas uma condi¸ca˜o suficiente para separabilidade. Um pouco de experimenta¸ca˜o (fa¸ca!) permite concluir que a separa¸ca˜o dificilmente se d´a caso haja na equa¸ca˜o um termo com uma ∂2u derivada mista ∂x∂y , ou se as fun¸co˜es A, B etc. n˜ao forem fun¸co˜es de uma u ´ nica vari´avel especificamente como explicitado em (11.1), mas h´a excess˜oes, como mostra o exemplo do Exerc´ıcio E. 11.3, abaixo. Outrossim, o m´etodo de separa¸ca˜o de vari´aveis dificilmente pode ser feliz no caso de equa¸co˜es diferenciais n˜ao-lineares mas, novamente, n˜ao ´e do conhecimento do autor que isso tenha sido completamente demonstrado em uma classe grande de exemplos interessantes. ´ de se notar, por´em, que o m´etodo de separa¸ca˜o de vari´aveis n˜ao se restringe a equa¸co˜es envolvendo E apenas duas vari´aveis, nem a equa¸co˜es de segunda ordem. Nosso interesse pelas equa¸co˜es de segunda ordem provem do fato de que a grande maioria das equa¸co˜es diferenciais parciais encontrada na F´ısica ´e de segunda ordem. E. 11.1 Exerc´ıcio. Encontre uma classe de equa¸co˜es diferencias parciais de primeira ordem lineares e homogˆeneas em duas vari´aveis x e y para as quais o Ansatz u(x, y) = X(x)Y (y) conduz a equa¸co˜es separadas para X e para Y . Obtenha essas equa¸co˜es. 6 E. 11.2 Exerc´ıcio. Encontre uma classe de equa¸co˜es diferencias parciais de terceira ordem lineares e homogˆeneas em duas vari´aveis x e y para as quais o Ansatz u(x, y) = X(x)Y (y) conduz a equa¸co˜es separadas para X e para Y . Obtenha essas equa¸co˜es. 6

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 11

Vers˜ ao de 29 de setembro de 2005.

589/1304

E. 11.3 Exerc´ıcio. Mostre que uma equa¸c˜ao diferencial da forma A(x)

∂2u ∂u ∂2u + B(y) + (C(x) + D(y)) = 0 2 ∂x ∂x∂y ∂x

(11.4)

permite separa¸c˜ao de vari´aveis na forma u(x, y) = X(x)Y (y). Sugest˜ao: substitua esse Ansatz na equa¸c˜ao e divida-a por X 0 (x)Y (y), obtendo, com uma constante de separa¸c˜ao λ, A(x)X 00 (x) + (E(x) − λ)X 0 (x) = 0 , B(y)Y 0 (y) + (D(y) + λ)Y (y) = 0 . Outra sugest˜ao ´e observar que a equa¸c˜ao (11.4) pode ser reduzida a uma equa¸c˜ao linear de primeira ordem para ∂u , a qual ´e separ´avel. 6 ∂x O que determina a constante de separa¸ca˜o λ? Em situa¸co˜es t´ıpicas ela ´e determinada pela imposi¸ca˜o de condi¸co˜es de contorno, ou de outras condi¸co˜es subsidi´arias a` solu¸ca˜o, tais como que ela seja cont´ınua, ou que ela seja peri´odica, ou que ela seja limitada, ou que ela seja de quadrado integr´avel (o que tipicamente ocorre na Mecˆanica Quˆantica) etc. Os exemplos que se seguir˜ao ilustrar˜ao essas diversas situa¸co˜es. Um certo cuidado aqui ´e necess´ario. Para a imposi¸ca˜o de condi¸co˜es de contorno ou subsidi´arias a`s solu¸co˜es particulares da forma de um produto X(x)Y (y) ´e necess´ario que essas condi¸co˜es de contorno possam ser expressas separadamente como condi¸co˜es sobre a dependˆencia em x e sobre a dependˆencia em y. Geralmente, isso s´o ´e poss´ıvel se o dom´ınio D de validade da equa¸ca˜o (entenda-se, a regi˜ao onde o problema est´a definido) seja um retˆangulo tal como {(x, y) ∈ 2 , 0 ≤ x ≤ L, 0 ≤ y ≤ M }, um disco {(x, y) ∈ 2 , 0 ≤ x ≤ L, 0 ≤ y ≤ 2π} com uma dependˆencia peri´odica de per´ıodo 2π na vari´avel y (que representaria um aˆngulo, em algum sistema de coordenadas) ou talvez um toro {(x, y) ∈ 2 , 0 ≤ x ≤ 2π, 0 ≤ y ≤ 2π} com uma dependˆencia peri´odica de per´ıodo 2π em ambas as vari´aveis. Os exemplos s˜ao os melhores mestres nessa discuss˜ao. 





Assim, mesmo que uma equa¸ca˜o diferencial tenha a forma (11.1) o m´etodo de separa¸ca˜o de vari´aveis ser´a ineficaz se as condi¸co˜es de contorno e subsidi´arias n˜ao forem compat´ıveis com solu¸co˜es particulares na forma de um produto. Um fato importante observado na pr´atica (vide os exemplos tratados no Cap´ıtulo 10, p´agina 544) ´e que j´a a imposi¸ca˜o de algumas das condi¸co˜es de contorno ou subsidi´arias fixa todos os valores poss´ıveis para a constante de separa¸ca˜o λ e, em muitos casos, esse conjunto de valores poss´ıveis ´e um conjunto cont´avel: {λn , n ∈ }. Para cada uma dessas constantes λn haver´a possivelmente duas solu¸co˜es independentes para a equa¸ca˜o (11.2) e duas solu¸co˜es independentes para a equa¸ca˜o (11.3) (pois s˜ao equa¸co˜es de segunda ordem2 ). Assim, para cada n ∈ teremos associada uma cons(1) (2) tante de separa¸ca˜o λn , duas solu¸co˜es linearmente independentes, Xn e Xn , para a equa¸ca˜o (11.2) (a solu¸ca˜o geral sendo uma combina¸ca˜o linear de ambas) e duas solu¸co˜es linearmente independen(1) (2) tes, Yn e Yn , para a equa¸ca˜o (11.3) (a solu¸ca˜o geral sendo uma combina¸ca˜o linear de ambas). A solu¸   pelo Ansatz u(x, y) = X(x)Y (y) assume assim, para cada n, a forma  ca˜o particular fornecida (2) (1) (2) (1) αn Xn (x) + βn Xn (x) γn Yn (y) + δn Yn (y) , onde αn , βn , γn e δn s˜ao constantes. 



2

Nada impede, por´em, que se tenha A ≡ 0 ou B ≡ 0, em cujo caso uma das equa¸co ˜es (11.2) ou (11.3) ser´ a de primeira ordem. Tal ocorre, por exemplo, na equa¸ca ˜o de difus˜ ao. Vide p´ agina 545.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

590/1304

Como a equa¸ca˜o (11.1) ´e linear e homogˆenea, e as condi¸co˜es de contorno s˜ao homogˆeneas, o princ´ıpio de sobreposi¸ca˜o se aplica e uma solu¸ca˜o mais geral seria obtida somando-se as solu¸co˜es obtidas para cada n, ou seja,   X αn Xn(1) (x) + βn Xn(2) (x) γn Yn(1) (y) + δn Yn(2) (y) . (11.5) n∈



As constantes αn , βn , γn e δn devem ainda ser fixadas atrav´es das demais condi¸co˜es de contorno e subsidi´arias (que n˜ao aquelas que j´a foram usadas para fixar os λn ’s) e, ap´os isso, ´e preciso tamb´em demonstrar que a s´erie (11.5) assim obtida converge.

Ser´a, afinal, a express˜ao (11.5) a solu¸ca˜o completa do problema, que resolve a equa¸ca˜o diferencial e satisfaz todas as condi¸co˜es de contorno e subsidi´arias? Em muitos casos, a resposta ´e sim, o que pode ser provado por teoremas que garantem a unicidade de solu¸co˜es de certas equa¸co˜es diferenciais que satisfa¸cam certas condi¸co˜es de contorno. Vide Se¸ca˜o 11.3, p´agina, 590. Como comentamos, e como ilustram os exemplos que se seguir˜ao, o m´etodo de separa¸ca˜o de vari´aveis delineado acima ´e feliz em resolver v´arios problemas envolvendo equa¸co˜es diferenciais parciais de interesse em F´ısica. Mas, o estudante n˜ao deve adquirir a falsa impress˜ao de que o m´etodo de separa¸ca˜o de vari´aveis ´e o u ´ nico m´etodo de solu¸ca˜o dispon´ıvel para equa¸co˜es diferenciais parciais. Muitos outros m´etodos s˜ao oferecidos na gigantesca literatura sobre o assunto (vide para tal [27, 28] ou mesmo [141]), cada qual empreg´avel em uma classe espec´ıfica de equa¸co˜es. Para nos limitarmos a um u ´ nico exemplo, citamos o chamado m´etodo das carater´ısticas, que tamb´em permite a resolu¸ca˜o de certas equa¸co˜es diferenciais parciais em termos de equa¸co˜es diferenciais ordin´arias. Boa parte do estudo de equa¸co˜es diferenciais parciais n˜ao ´e voltado a` procura de solu¸co˜es para as equa¸co˜es, mas sim a an´alises qualitativas de propriedades das solu¸co˜es. Muitas vezes, advˆem dessas an´alises informa¸co˜es u ´ teis sobre o comportamento do sistema de interesse que n˜ao s˜ao facilmente obten´ıveis diretamente das solu¸co˜es, mesmo caso estas sejam conhecidas (vide para tal [45], [36], [100] [27, 28]).

11.3

Unicidade de Solu¸ co ˜es de Equa¸ co ˜es Diferenciais Parciais

Como j´a comentamos, teoremas de unicidade de solu¸co˜es de equa¸co˜es diferenciais parciais submetidas a condi¸co˜es iniciais e de contorno s˜ao de importˆancia crucial para justificar certos m´etodos de resolu¸ca˜o, como por exemplo o m´etodo de separa¸ca˜o de vari´aveis e de expans˜ao em modos (como os modos de vibra¸ca˜o de cordas ou membranas vibrantes, por exemplo), tal como discutido em diversos dos problemas tratados no Cap´ıtulo 10, p´agina 544. No que segue, apresentaremos alguns desses teoremas, concentrando-nos em casos de de maior interesse em problemas f´ısicos. Alguns desses teoremas s˜ao evocaremos na discuss˜ao do Cap´ıtulo 10.

11.3.1

Casos Simples. Discuss˜ ao Preliminar

Primeiramente, exporemos o leitor aos teoremas de unicidade de solu¸ca˜o mais simples e seus m´etodos de demonstra¸ca˜o. A inten¸ca˜o ´e pedag´ogica e por isso escolhemos dois tipos de equa¸co˜es de interesse f´ısico, as equa¸co˜es de difus˜ao e de onda com coeficientes constantes em uma dimens˜ao espacial. Generaliza¸co˜es ser˜ao apresentadas adiante na Se¸ca˜o 11.3.2, p´agina 597.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

591/1304

• Unicidade de solu¸ co ˜es para a equa¸ c˜ ao de difus˜ ao em um intervalo finito A proposi¸ca˜o que segue apresenta condi¸co˜es que garantem unicidade para as solu¸co˜es da equa¸ca˜o de difus˜ao a coeficientes constantes definida em um intervalo finito da reta sob certas condi¸co˜es iniciais e de contorno. Proposi¸ c˜ ao 11.1 Considere a equa¸ca ˜o diferencial ∂2u ∂u − K 2 = F (x, t) , ∂t ∂x

(11.6)

com K > 0 constante, e F ´e uma fun¸ca ˜o dada (em princ´ıpio arbitr´ aria). Acima, x ∈ [0, L] para algum L > 0 e t ≥ 0. As condi¸co ˜es iniciais s˜ ao u(x, 0) = u0 (x), onde u0 : [0, L] → 

(11.7)

´e uma fun¸ca ˜o arbitr´ aria. Considere os seguintes tipos de condi¸co ˜es de contorno.

I. Condi¸co˜es de Dirichlet3 : u(0, t) = f1 (t), u(L, t) = f2 (t) . II. Condi¸co˜es de Neumann4 : ∂u ∂u (0, t) = f3 (t), (L, t) = f4 (t) . ∂x ∂x Acima fi s˜ ao fun¸co ˜es arbitr´ arias. Ent˜ ao, caso exista, a solu¸ca ˜o de (11.6) sob as condi¸co ˜es iniciais (11.7) ´e u ´nica tanto sob condi¸co ˜es de contorno do tipo de Dirichlet quanto sob condi¸co ˜es de contorno do tipo de Neumann. 2 A proposi¸ca˜o acima garante unicidade da solu¸ca˜o para qualquer fun¸ca˜o F (x, t) e quaisquer fun¸co˜es fi , mas n˜ao garante a existˆencia de solu¸co˜es. Para garantir existˆencia e exibir uma solu¸ca˜o (por exemplo em termos de s´eries de Fourier) ´e preciso ser mais restritivo quanto a` fun¸ca˜o F e a`s fun¸co˜es f i . A demonstra¸ca˜o da Proposi¸ca˜o 11.1 ´e apresentada na forma do exerc´ıcio dirigido que segue. Generaliza¸co˜es encontram-se na Proposi¸ca˜o 11.5, p´agina 598, e a Proposi¸ca˜o 11.6, p´agina 601. E. 11.4 Exerc´ıcio. Prova da Proposi¸ca ˜o 11.1. Para demonstrar a unicidade de solu¸c˜ao da equa¸c˜ao diferencial (11.6) sob as condi¸co˜es acima procede-se da seguinte forma. Suponha que haja duas solu¸co˜es u e v da equa¸c˜ao acima, ambas satisfazendo as mesmas condi¸co˜es de contorno e as mesmas condi¸co˜es iniciais. Defina w(x, t) := u(x, t) − v(x, t). Desejamos mostrar que w = 0, implicando que as duas solu¸co˜es u e v s˜ao em verdade iguais. a. Mostre que w satisfaz a equa¸c˜ao diferencial homogˆenea ∂w ∂2w −K = 0. ∂t ∂x2 3 4

Johann Peter Gustav Lejeune Dirichlet (1805-1859). Carl Neumann (1832-1925).

(11.8)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

592/1304

b. Mostre que w satisfaz a condi¸c˜ao inicial w(x, 0) = 0. c. Mostre que w satisfaz as condi¸co˜es de contorno w(0, t) = 0, w(L, t) = 0 ,

(11.9)

no caso de condi¸co˜es de Dirichlet ou ∂w ∂w (0, t) = 0, (L, t) = 0 , ∂x ∂x

(11.10)

no caso de condi¸co˜es de Neumann. d. Defina E(t) = Mostre que E(t) ≥ 0 para todo t. (Trivial).

Z

L

(w(x, t))2 dx .

0

e. Mostre que E(0) = 0. (Use as condi¸co˜es iniciais de w). f. Mostre, diferenciando dentro da integral, usando integra¸c˜ao por partes e usando a equa¸c˜ao diferencial (11.8), que 0

E (t) = −2K

Z

L 0



∂w ∂x

2



∂w ∂w (0, t) dx + 2K w(L, t) (L, t) − w(0, t) ∂x ∂x

g. Conclua que 0

E (t) = −2K

Z

L 0



∂w ∂x

2



.

dx

supondo as condi¸co˜es de contorno (11.9) ou (11.10) para w. Conclua que, sob essas condi¸co˜es, E 0 (t) ≤ 0 para todo t. h. Conclua de g, d e e que E(t) = 0 para todo t. i. Conclua da´ı que w(x, t) ´e identicamente nula.

6 Uma das raz˜oes de expormos os passos acima de forma t˜ao detalhada ´e pedag´ogica: esses passos s˜ao seguidos, nem sempre com a mesma trivialidade, em outras demonstra¸co˜es de teoremas de unicidade de solu¸co˜es de equa¸co˜es diferenciais parciais. Para teoremas de unicidade v´alidos em generaliza¸co˜es da equa¸ca˜o de difus˜ao vide, por exemplo, a Proposi¸ca˜o 11.5, p´agina 598, e a Proposi¸ca˜o 11.6, p´agina 601. Podemos generalizar um pouco a proposi¸ca˜o acima, mas apenas para condi¸co˜es de Dirichlet. Isso ´e o conte´ udo da proposi¸ca˜o que segue.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

593/1304

Proposi¸ c˜ ao 11.2 Considere a equa¸ca ˜o diferencial ∂2u ∂u ∂u −K 2 −α = F (x, t) , ∂t ∂x ∂x

(11.11)

˜o dada (em princ´ıpio arbitr´ aria). Acima, x ∈ [0, L] com K > 0, α ∈ , constantes, e F ´e uma fun¸ca para algum L > 0 e t ≥ 0. As condi¸co ˜es iniciais s˜ ao 

u(x, 0) = u0 (x), onde u0 : [0, L] → 

(11.12)

´e uma fun¸ca ˜o arbitr´ aria. Ent˜ ao, para condi¸co ˜es de Dirichlet: u(0, t) = f1 (t), u(L, t) = f2 (t) ,

onde fi s˜ ao fun¸co ˜es arbitr´ arias, a solu¸ca ˜o de (11.11) ´e u ´nica, caso exista.

2

Prova. A prova segue os mesmos passos descritos no Exerc´ıcio E. 11.4, mas agora  2  Z L   ∂w ∂w ∂w 0 E (t) = −2K dx + 2K w(L, t) (L, t) − w(0, t) (0, t) + α w(L, t)2 − w(0, t)2 . ∂x ∂x ∂x 0

Por´em, os dois u ´ ltimos termos s˜ao nulos, em fun¸ca˜o das condi¸co˜es de Dirichlet, e obtemos a mesma express˜ao para E 0 (t) que no caso do Exerc´ıcio E. 11.4.

• Unicidade de solu¸ co ˜es para a equa¸ c˜ ao de ondas em um intervalo finito Vamos agora considerar outra equa¸ca˜o importante em F´ısica, a equa¸ca˜o de ondas. A proposi¸ca˜o que segue apresenta condi¸co˜es que garantem unicidade para as solu¸co˜es da equa¸ca˜o de ondas a coeficientes constantes definida em um intervalo finito da reta sob certas condi¸co˜es iniciais e de contorno. Proposi¸ c˜ ao 11.3 Considere a equa¸ca ˜o diferencial 2 ∂2u ∂u 2 ∂ u − c +γ = F (x, t) 2 2 ∂t ∂x ∂t

(11.13)

com c > 0, γ ≥ 0, constantes, sendo F uma fun¸ca ˜o dada (em princ´ıpio arbitr´ aria). Acima, x ∈ [0, L] para algum L > 0 e t ≥ 0. As condi¸co ˜es iniciais s˜ ao u(x, 0) = u0 (x), onde u0 , v0 : [0, L] → ramos 

∂u (x, 0) = v0 (x) , ∂t

(11.14)

s˜ ao igualmente fun¸co ˜es arbitr´ arias. Para as condi¸co ˜es de contorno, conside-

I. Condi¸co˜es de Dirichlet: u(0, t) = f1 (t), u(L, t) = f2 (t) .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

594/1304

II. Condi¸co˜es de Neumann: ∂u ∂u (0, t) = f3 (t), (L, t) = f4 (t) . ∂x ∂x Acima fi s˜ ao fun¸co ˜es arbitr´ arias. Ent˜ ao, caso exista, a solu¸ca ˜o de (11.13) com as condi¸co ˜es iniciais (11.14) ´e u ´nica tanto no caso de condi¸co ˜es de contorno do tipo de Dirichlet quando do tipo de Neumann. 2 A proposi¸ca˜o acima garante unicidade da solu¸ca˜o para qualquer fun¸ca˜o F (x, t) e quaisquer fun¸co˜es fi , mas n˜ao garante a existˆencia de solu¸co˜es. Para garantir existˆencia e exibir uma solu¸ca˜o (por exemplo em termos de s´eries de Fourier) ´e preciso ser mais restritivo quanto a` fun¸ca˜o F e a`s fun¸co˜es fi . A proposi¸ca˜o acima pode ser bastante generalizada. Isso ´e apresentado na Proposi¸ca˜o 11.7, p´agina 602. Para demonstrar a unicidade de solu¸c˜ao da equa¸c˜ao E. 11.5 Exerc´ıcio. Prova da Proposi¸ca ˜o 11.3. diferencial sob as condi¸co˜es acima proceda da seguinte forma: suponha que haja duas solu¸co˜es u e v da equa¸c˜ao acima, ambas satisfazendo as mesmas condi¸co˜es de contorno e as mesmas condi¸co˜es iniciais. Defina w(x, t) = u(x, t) − v(x, t). Desejamos mostrar que w = 0, implicando que as duas solu¸co˜es u e v s˜ao, em verdade, iguais. a. Mostre que w satisfaz a equa¸c˜ao diferencial homogˆenea 2 ∂w ∂2w 2 ∂ w = 0. − c +γ 2 2 ∂t ∂x ∂t

b. Mostre que w satisfaz as condi¸co˜es iniciais ∂w (x, 0) = 0 ∂t

w(x, 0) = 0, c. Mostre que w satisfaz as condi¸co˜es de contorno

w(0, t) = 0, w(L, t) = 0 ,

(11.15)

no caso de condi¸co˜es de Dirichlet ou ∂w ∂w (0, t) = 0, (L, t) = 0 ∂x ∂x

(11.16)

no caso de condi¸co˜es de Neumann. d. Defina E(t) =

Z

L 0

"

Mostre que E(t) ≥ 0 para todo t. (Trivial).

∂w ∂t

2

+ c2



∂w ∂x

2 #

dx .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

595/1304

e. Mostre que E(0) = 0. (Use as condi¸co˜es iniciais de w). f. Mostre, diferenciando dentro da integral e usando integra¸c˜ao por partes, que   Z L 2 ∂w ∂ 2 w 2 ∂ w 0 −c dx . E (t) = 2 ∂t ∂t2 ∂x2 0 Para a integra¸c˜ao por partes ´e preciso usar as condi¸co˜es de contorno (11.15) ou (11.16) para w. g. Usando a equa¸c˜ao diferencial de w conclua que 0

E (t) = −2γ

Z

L 0



∂w ∂t

2

dx .

e, portanto, E 0 (t) ≤ 0 para todo t. h. Conclua de g, d e e que E(t) = 0 para todo t. i. Conclua da´ı que w(x, t) ´e uma constante, ou seja, n˜ao depende de x e t. Disso, conclua pela condi¸c˜ao inicial w(x, 0) = 0 que w ´e identicamente nula.

6 • Unicidade de solu¸ c˜ ao para as equa¸ co ˜es de Laplace e Poisson em regi˜ oes finitas De grande importˆancia em problemas de Eletrost´atica, Magnetost´atica, Mecˆanica dos Fluidos ou em problemas de transporte de calor ´e a quest˜ao da unicidade de solu¸ca˜o da equa¸ca˜o de Laplace ∆φ(~x) = 0 ou da de Poisson5 ∆φ(~x) = ρ(~x) sob certas condi¸co˜es de contorno. Para o caso de regi˜oes limitadas essa quest˜ao ´e respondida na seguinte proposi¸ca˜o. Proposi¸ c˜ ao 11.4 Considere-se o problema de determinar a solu¸ca ˜o da equa¸ca ˜o de Poisson ∆φ(~x) = ρ(~x) (a equa¸ca ˜o de Laplace ´e o caso particular em que ρ(~x) ≡ 0) em trˆes dimens˜ oes em uma regi˜ ao R, compacta, conexa, limitada por uma superf´ıcie fechada, retific´ avel e orient´ avel ∂R, de forma que φ seja cont´ınua e diferenci´ avel em ∂R satisfazendo em ∂R uma das seguintes condi¸co ˜es de contorno: 1. Condi¸ca˜o de Dirichlet. Para todo ~x ∈ ∂R vale φ(~x) = f (~x), para uma fun¸ca ˜o f dada. 2. Condi¸ca˜o de Neumann. Para todo ~x ∈ ∂R vale ∂φ (~x) = g(~x), para uma fun¸ca ˜o g dada, onde ∂n  ∂φ ~ x) · ~n(~x) ´e a chamada derivada normal de φ em ~x ∈ ∂R, ~n(~x) sendo um versor (~x) := ∇φ(~ ∂n normal a ∂R em ~x ∈ ∂R, apontando para fora de R. 3. Condi¸ca˜o mista. Para todo ~x ∈ ∂R vale φ(~x) + a(~x) ∂φ (~x) = h(~x), onde h ´e uma fun¸ca ˜o dada ∂n e a ´e cont´ınua por partes, n˜ ao-identicamente nula e n˜ ao-negativa, ou seja, a(~x) ≥ 0 para todo ~x ∈ ∂R.

5

Sim´eon Denis Poisson (1781-1840).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

596/1304

Ent˜ ao, no caso de uma condi¸ca ˜o de Dirichlet ou mista a solu¸ca ˜o ´e u ´nica, se existir, e no caso de uma condi¸ca ˜o de Neumann a solu¸ca ˜o ´e u ´nica a menos de uma constante aditiva, se existir. Mutatis mutantis, as afirma¸co ˜es acima s˜ ao tamb´em v´ alidas em duas dimens˜ oes, ou mesmo em quatro ou mais dimens˜ oes. 2 Prova. Vamos supor que haja duas solu¸co˜es u e v da equa¸ca˜o ∆φ(~x) = ρ(~x) em R, ambas satisfazendo a mesma condi¸ca˜o de contorno, de Dirichlet, de Neumann ou mista, em ∂R. Ent˜ao, a fun¸ca˜o w := u − v obviamente satisfaz ∆w = 0 em R e uma das seguintes condi¸co˜es de contorno homogˆeneas: 1) w(~x) = 0 para todo ~x ∈ ∂R (no caso de uma condi¸ca˜o de Dirichlet), 2)

∂w (~x) ∂n

= 0 para todo ~x ∈ ∂R (no caso de uma condi¸ca˜o de Neumann) ou

3) w(~x) + a(~x) ∂w (~x) = 0 para todo ~x ∈ ∂R (no caso de uma condi¸ca˜o mista). ∂n Considere-se a quantidade U :=

Z  R

~ x) ∇w(~

2

d3 ~x .

   2  2 ´ evidente pela defini¸ca˜o que U ≥ 0. Como ∇ · w ∇w ~ ~ ~ E = ∇w + w∆w = ∇w (pois ∆w = 0), temos, pelo Teorema de Gauss, Z   { ∂w Gauss 3 ~ (~x) dσ(~x) , (11.17) w(~x) U = ∇ · w ∇w (~x) d ~x = ∂n R ∂R

dσ(~x) sendo a medida de integra¸ca˜o de superf´ıcie em ∂R. No caso de uma condi¸ca˜o de Neumann ou de Dirichlet o lado direito de (11.17) anula-se, pois ou w(~x) = 0 para todo ~x ∈ ∂R (Dirichlet) ou ∂w (~x) = 0 para todo ~x ∈ ∂R (Neumann). ∂n 2  { ∂w (~x) dσ(~x) ≤ 0, pois No caso de uma condi¸ca˜o mista o lado direito de (11.17) fica − a(~x) ∂n ∂R a foi suposta n˜ao-negativa. Como, de acordo com a defini¸ca˜o, U ≥ 0, conclu´ımos novamente que U ´e nulo. ~ = 0 em Assim, para cada uma das trˆes condi¸co˜es conclu´ımos que U = 0, o que implica que ∇w todo R. Logo, u(~x) = v(~x) + c, onde c ´e uma constante. No caso de uma condi¸ca˜o de Dirichlet essa constante deve anular-se, pois u e v satisfazem as mesmas condi¸co˜es em ∂R. O mesmo se d´a para uma condi¸ca˜o mista. No caso de uma condi¸ca˜o de Neumann essa constante pode ser arbitr´aria. Mutatis mutantis, a demonstra¸ca˜o das afirma¸co˜es de acima n˜ao se altera em duas ou mais dimens˜oes.

• Unicidade de solu¸ c˜ ao de EDP’s. Um contra-exemplo Sob a luz das Proposi¸co˜es 11.1, 11.2, 11.3, 11.4, 11.5 e 11.6 (p´aginas 591, 593, 593, 595, 598, e 601, respectivamente), o estudante n˜ao deve ser levado a pensar que a unicidade seja uma propriedade

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 11

Vers˜ ao de 29 de setembro de 2005.

597/1304

comum a todas as equa¸co˜es diferenciais parciais lineares com as condi¸co˜es iniciais e de contorno como as que tratamos. Vejamos um contra-exemplo. E. 11.6 Exerc´ıcio. Seja a equa¸c˜ao diferencial linear e homogˆenea (1 − 2x)t

∂u ∂u − x(1 − x) = 0, ∂t ∂x

para x ∈ [0, 1], t ≥ 0, com a condi¸c˜ao inicial u(x, 0) = 0 e as condi¸co˜es de contorno u(0, t) = u(1, t) = 0. a. Esse problema tem infinitas solu¸co˜es. Mostre que todas as fun¸co˜es da forma v α (x, t) = [x(1 − x)t]α com α > 0 satisfazem a equa¸c˜ao diferencial, a condi¸c˜ao inicial e as condi¸co˜es de contorno acima. Observe que a fun¸c˜ao u(x, t) ≡ 0 tamb´em satisfaz a equa¸c˜ao diferencial acima, assim como a condi¸c˜ao inicial e as condi¸co˜es de contorno. b. Seja 0 < a < b < ∞ e h uma fun¸c˜ao cont´ınua de [a, b] em wh (x, t) =

Z



. Mostre que

b a

h(α) [x(1 − x)t]α dα

tamb´em satisfaz a equa¸c˜ao diferencial, a condi¸c˜ao inicial e as condi¸co˜es de contorno acima. 6

11.3.2

Unicidade de Solu¸ co ˜es. Generaliza¸ co ˜es

Nesta se¸ca˜o continuaremos a discuss˜ao sobre teoremas de unicidade de solu¸co˜es de equa¸co˜es diferenciais parciais de interesse, particularmente para vers˜oes mais gerais das equa¸co˜es de onda e de difus˜ao, em uma ou mais dimens˜oes espaciais. O problema de determinar solu¸co˜es de equa¸co˜es diferenciais submetidas a condi¸co˜es iniciais ´e freq¨ uentemente demoninado problema de Cauchy. • Unicidade de solu¸ c˜ ao para a equa¸ c˜ ao de difus˜ ao em regi˜ oes finitas A proposi¸ca˜o que segue estabelece unicidade de solu¸ca˜o para uma forma bastante geral da equa¸ca˜o de difus˜ao definida em um conjunto pr´e-compacto6 e conexo D de n , para todo n ≥ 1, sob certas condi¸co˜es iniciais e certas condi¸co˜es de contorno, que podem ser do tipo de Dirichlet 7 , de Neumann8 ou mistas (vide abaixo), generalizando assim a Proposi¸ca˜o 11.1, da p´agina 591. 

6

Um conjunto ´e dito ser pr´e-compacto se seu fecho for compacto. No caso de somente se for fechado e limitado. 7 Johann Peter Gustav Lejeune Dirichlet (1805-1859). 8 Carl Neumann (1832-1925).

n

, um conjunto ´e compacto se e

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

598/1304

Proposi¸ c˜ ao 11.5 Consideremos para uma fun¸ca ˜o real u a equa¸ca ˜o diferencial linear, denominada equa¸ca ˜o de difus˜ ao, dada por γ(~x)

  ∂u ~ · κ(~x, t)∇u(~ ~ x, t) + η(~x)u(~x, t) = ϕ(~x, t) , (~x, t) − ∇ ∂t

definida para ~x em um conjunto n˜ ao-vazio, aberto, conexo e limitado D ⊂ pr´e-compacto e conexo.

n



(11.18)

, n ≥ 1. D ´e, assim,

Suporemos que γ e η s˜ ao cont´ınuas por partes com γ(~x) ≥ 0 e η(~x) ≥ 0, ambas podendo se anular apenas em um conjunto de medida nula. Suporemos tamb´em que κ ´e cont´ınua e diferenci´ avel e que κ(~x, t) ≥ 0.

Denotaremos por D o fecho de D (que ´e compacto, pois D ´e limitado) e denotaremos por ∂D = D\D a fronteira de D. Acima, ϕ(~x, t) ´e uma fun¸ca ˜o real dada de ~x e t que, se n˜ ao nula, faz de (11.18) uma equa¸ca ˜o n˜ ao-homogˆenea. Sobre a regi˜ ao D, suporemos ainda que ∂D seja diferenci´ avel e orient´ avel, de modo que em qualquer ponto ~x de ∂D possamos definir o versor (vetor de comprimento 1) ~n(~x) normal a ` ∂D no ponto ~x e apontando para fora de D. Iremos supor que a fun¸ca ˜o u esteja submetida a condi¸co ˜es iniciais que fixam seu valor em t = 0: u(~x, 0) = u0 (~x) ,

(11.19)

∀~x ∈ D, onde a fun¸ca ˜o real u0 ´e um dado do problema (denominado dado de Cauchy). Al´em disso, iremos supor que u(~x, t) esteja submetida a condi¸co ˜es na fronteira ∂D, as chamadas condi¸co ˜es de contorno. Trataremos dos seguintes tipos de condi¸co ˜es de contorno: I. Condi¸co˜es de Dirichlet: u(~x, t) = φ(~x, t) para todo ~x ∈ ∂D e todo t ≥ 0, φ(~x, t) sendo uma fun¸ca ˜o real dada. II. Condi¸co˜es de Neumann:

∂u (~x, t) = −ψ(~x, t) ∂n ∂u para todo ~x ∈ ∂D e todo t ≥ 0, ψ(~x, t) sendo uma fun¸ca ˜o real dada. Acima, ∂n representa a ∂u ~ derivada normal de u a ` superf´ıcie ∂D, ou seja, ∂n (~x, t) = ~n(~x) · ∇u(~x, t), ~x ∈ ∂D.

III. Condi¸co˜es mistas: para uma fun¸ca ˜o cont´ınua α(~x, t) ≥ 0, definida em ∂D para todo t ≥ 0, tem-se ∂u u(~x, t) + α(~x, t) (~x, t) = χ(~x, t) ∂n para todo ~x ∈ ∂D e todo t ≥ 0, χ(~x, t) sendo uma fun¸ca ˜o real dada. Ent˜ ao, para cada uma das condi¸co ˜es de contorno descritas acima, a solu¸ca ˜o do problema de Cauchy de determinar a solu¸ca ˜o (11.18) para as condi¸co ˜es iniciais (11.19) ´e u ´nica, caso exista. 2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

599/1304

Vide tamb´em a Proposi¸ca˜o 11.6 para uma generaliza¸ca˜o. Antes de passarmos a` demonstra¸ca˜o da Proposi¸ca˜o 11.5, fa¸camos alguns coment´arios. O leitor deve ter notado que no enunciado da Proposi¸ca˜o 11.5 n˜ao s˜ao feitas restri¸co˜es a`s fun¸co˜es ϕ, φ, ψ e χ, acima, pois, de fato, restri¸co˜es n˜ao s˜ao necess´arias para garantir-se unicidade. Para uma prova de existˆencia de solu¸ca˜o, por´em, certamente s˜ao necess´arias restri¸co˜es a essas fun¸co˜es, tais como continuidade por partes etc. N˜ao trataremos de condi¸co˜es gerais de existˆencia aqui. Na Proposi¸ca˜o 11.5, acima, a regi˜ao D ´e limitada (tecnicamente, ´e pr´e-compacta e conexa). O estudante pode perguntar-se o que ocorre com a quest˜ao da unicidade se considerarmos a equa¸ca˜o de difus˜ao, equa¸ca˜o (11.18), em regi˜oes abertas, conexas, mas n˜ao-limitadas, como n , por exemplo. Nesse caso, tem-se que considerar outras condi¸co˜es de contorno no infinito e os m´etodos de demonstra¸ca˜o abaixo n˜ao funcionam. Sob condi¸co˜es convenientes, ´e poss´ıvel demonstrar unicidade de solu¸ca˜o, mas algumas surpresas interessant´ıssimas ocorrem. Vide para tal a fascinante discuss˜ao de [75], especialmente seus cap´ıtulos 67 e 68. 

A equa¸ca˜o (11.18) pode ser interpretada como a equa¸ca˜o de difus˜ao de calor sem convec¸ca˜o em um meio homogˆeneo de constante de difus˜ao κ(~x, t), a fun¸ca˜o u(~x, t) representando a temperatura do meio no ponto ~x no instante t. Nessa interpreta¸ca˜o, para o caso em que para η e ϕ s˜ao identicamente nulas, a equa¸ca˜o (11.18) ´e uma representa¸ca˜o matem´atica de uma lei f´ısica denominada Lei de Fourier 9 do transporte de calor. Vide [33]. A Lei de Fourier foi originalmente obtida experimentalmente e ´e at´e hoje um problema de pesquisa demonstr´a-la teoricamente a partir de primeiros princ´ıpios usando os m´etodos da Mecˆanica Estat´ıstica, especialmente no caso quˆantico. O termo ϕ(~x, t) tem a interpreta¸ca˜o de uma fonte de calor externa e o termo η(~x, t)u(~x, t) com η ≥ 0 representa uma dissipa¸ca˜o de calor, por exemplo, por emiss˜ao de radia¸ca˜o. As trˆes condi¸co˜es de contorno listadas acima manifestam condi¸co˜es f´ısicas a`s quais o sistema definido em D se submete em seu contorno ∂D. Consideremos a interpreta¸ca˜o de (11.18) como a equa¸ca˜o de difus˜ao de calor sem convec¸ca˜o em um meio homogˆeneo. Fisicamente mais precisas s˜ao as condi¸co˜es ∂u (~x, t), vale mistas, que afirmam que para o fluxo de calor (para fora de D) por unidade de a´rea, − ∂n ∂u 1 − ∂n (~x, t) = α(~x, t) (u(~x, t) − χ(~x, t)). De acordo com a Lei de Fourier do transporte de calor (vide [33]), isso diz-nos que em cada ponto ~x ∈ ∂D o calor flui do sistema a` temperatura u(~x, t) para um banho t´ermico externo a` temperatura χ(~x, t), atrav´es da superf´ıcie de contacto cuja constante de difus˜ao ´e α(~x, t), a qual dependente do contacto entre o sistema e o meio, do material que os comp˜oe etc., e por isso pode depender de ~x e t. As condi¸co˜es de Dirichlet significam que cada ponto de ~x de ∂D est´a em contacto com um banho t´ermico a` temperatura φ(~x, t) que difunde calor perfeitamente ao sistema nos pontos de contacto, ou seja, vale a aproximar por zero a constante de difus˜ao de contacto α (o que ´e uma boa aproxima¸ca˜o no caso de contactos met´alicos). As condi¸co˜es de Neumann significam ∂u que, cada ponto de ~x de ∂D, o fluxo de calor (para fora de D) por unidade de a´rea, − ∂n , ´e fixado em ψ(~x, t). Tal se d´a, por exemplo, se u for desprez´ıvel face a` temperatura do meio externo, em cujo caso ter´ıamos, comparando com o caso das condi¸co˜es mistas, −ψ = χ/α. Um caso comum ´e aquele em que ψ ´e nula, o que corresponde a colocar o sistema em contacto com um isolante t´ermico perfeito, ou seja, para o qual α ´e pr´oximo ao infinito. Prova da Proposi¸c˜ao 11.5. Afirmamos que sob as condi¸co˜es descritas na proposi¸ca˜o, a solu¸ca˜o de 9

Jean Baptiste Joseph Fourier (1768-1830). Os trabalhos de Fourier na resolu¸ca ˜o da equa¸ca ˜o de difus˜ ao de calor em uma dimens˜ ao o conduziram a `s chamadas s´eries de Fourier.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 11

Vers˜ ao de 29 de setembro de 2005.

600/1304

(11.18) ´e u ´ nica, caso exista. Para tal, vamos supor que u e v sejam duas solu¸co˜es reais de (11.18), ambas satisfazendo as mesmas condi¸co˜es iniciais e as mesmas condi¸co˜es de contorno, quer sejam de Dirichlet, de Neumann ou mistas, descritas acima. Consideremos a fun¸ca˜o w definida por w(~x, t) := u(~x, t)−v(~x, t). Como (11.18) ´e linear, ´e f´acil constatar que w satisfaz a equa¸ca˜o homogˆenea   ∂w ~ ~ γ(~x) (~x, t) − ∇ · κ(~x, t)∇w(~x, t) + η(~x)w(~x, t) = 0 , ∂t

(11.20)

para todo ~x ∈ D e todo t ≥ 0, assim como a condi¸ca˜o inicial w(~x, 0) = 0, ∀~x ∈ D. Quanto a`s condi¸co˜es de contorno teremos, para o caso de condi¸co˜es de Dirichlet, w(~x, t) = 0 para todo ~x ∈ ∂D e todo t ≥ 0. Para o caso de condi¸co˜es de Neumann, ∂w (~x, t) = 0 para todo ~x ∈ ∂D e todo t ≥ 0. Para o caso de ∂n (~ x , t) = 0 para todo ~x ∈ ∂D e todo t ≥ 0. condi¸co˜es mistas, w(~x, t) + α(~x, t) ∂w ∂n

Desejamos mostrar que w ´e identicamente nula, o que prova que u e v s˜ao idˆenticas, estabelecendo unicidade de solu¸ca˜o sob as condi¸co˜es mencionadas. Para tal, consideremos a express˜ao  Z Z t Z  2 n 0 2 n η(~x) w(~x, t ) d ~x dt0 . (11.21) A(t) = γ(~x) w(~x, t) d ~x + 2 0

D

D

´ evidente que A(t) ≥ 0 para todo t ≥ 0. Tem-se, por´em, A(0) = 0, pois em t = 0 a fun¸ca˜o w anula-se E (pela condi¸ca˜o inicial para w). Como w ´e diferenci´avel em rela¸ca˜o a t, podemos calcular a derivada d A(t) por dt Z Z 2 n 2 dA ∂ (t) = γ(~x) w(~x, t) d ~x + 2 η(~x) w(~x, t) dn~x dt ∂t D D Z Z 2 ∂w n = 2 w(~x, t)γ(~x) (~x, t) d ~x + 2 η(~x) w(~x, t) dn~x ∂t D D Z Z h   i 2 (11.20) n ~ ~ = 2 w(~x, t) ∇ · κ(~x, t)∇w(~x, t) − η(~x)w(~x, t) d ~x + 2 η(~x) w(~x, t) dn~x D

=

= Gauss

=

2

2

2

Z

D

Z Z

D

  ~ · κ(~x, t)∇w(~ ~ x, t) dn~x w(~x, t) ∇

D

 Z    2 n n ~ ~ ~ ∇ · κ(~x, t) w ∇w d ~x − κ(~x, t) ∇w d ~x

∂w κ(~x, t)w ds(~x) − ∂n ∂D

D

Z

D



~ κ(~x, t) ∇w

2

n



d ~x ,

onde ds(~x)Z´e a medida de integra¸ca˜o n−1 dimensional em ∂D. Agora, no caso de condi¸co˜es de Dirichlet, ∂w a integral κ(~x, t) w ds(~x) anula-se pois w anula-se em ∂D, o mesmo se sucedendo no caso de ∂n ∂D condi¸co˜es de Neumann, quando ∂w anula-se em ∂D. Conclu´ımos que em ambos os casos ∂n Z  2 dA ~ (t) = −2 κ(~x, t) ∇w dn~x . (11.22) dt D

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

No caso de condi¸co˜es mistas, tem-se "Z #  2 Z  2 ∂w dA ~ (t) = −2 α(~x, t) κ(~x, t) ds(~x) + κ(~x, t) ∇w dn~x . dt ∂n ∂D D

601/1304

(11.23)

Ora, como κ(~x, t) ≥ 0 e α(~x, t) ≥ 0 , o lado direito de (11.22) e de (11.23) s˜ao ambos claramente (t) fosse negativa para algum t ≥ 0, menores ou iguais a zero. Por´em, como A(0) = 0, se a derivada dA dt a fun¸ca˜o A assumiria valores negativos, o que ´e imposs´ıvel pois, como observamos, A(t) ≥ 0 para todo (t) = 0 para todo t, ou seja, A ´e constante. Mas como A(0) = 0, vale t ≥ 0. Logo, devemos ter dA dt A(t) = 0 para todo t ≥ 0. Sendo A(t) dada em (11.21) como a somaZ de duas integrais maiores ou 2 iguais a zero, isso implica que ambas se anulam, ou seja, em particular, γ(~x) w(~x, t) dn~x = 0 para D

todo t ≥ 0. Como w ´e cont´ınua e γ(~x) se anula apenas em um conjunto de medida nula, isso implica que w ´e identicamente nula em todo D, para todo t ≥ 0, para a condi¸ca˜o inicial e para cada uma das condi¸co˜es de contorno consideradas, que ´e o que quer´ıamos mostrar.

Uma id´eia semelhante a` da demonstra¸ca˜o acima ser´a seguida quando tratarmos da equa¸ca˜o que descreve vibra¸co˜es em meios el´asticos na Proposi¸ca˜o 11.7, p´agina 602. A Proposi¸ca˜o 11.5 pode ser extendida, sob certas condi¸co˜es, como mostra a seguinte proposi¸ca˜o, que generaliza a Proposi¸ca˜o 11.2 da p´agina 593. Proposi¸ c˜ ao 11.6 Consideremos para uma fun¸ca ˜o real u a equa¸ca ˜o diferencial linear dada por   ∂u ~ x, t) · ∇u(~ ~ · κ(~x, t)∇u(~ ~ x, t) − θ(~ ~ x, t) + η(~x)u(~x, t) = ϕ(~x, t) , γ(~x) (~x, t) − ∇ (11.24) ∂t

definida sob as mesmas hip´ oteses da Proposi¸ca ˜o 11.5, mas assumindo ainda que θ~ ´e continuamente ~ ~ diferenci´ avel e ∇ · θ(~x, t) ≥ 0 para todo ~x ∈ D e t ≥ 0. Seja u submetida a condi¸co ˜es iniciais que fixam seu valor em t = 0: u(~x, 0) = u0 (~x) , (11.25) ∀~x ∈ D, onde a fun¸ca ˜o real u0 ´e um dado do problema (denominado dado de Cauchy) e a condi¸co ˜es de contorno do tipo de Dirichlet na fronteira ∂D: u(~x, t) = φ(~x, t) para todo ~x ∈ ∂D e todo t ≥ 0, φ(~x, t) sendo uma fun¸ca ˜o real dada.

Ent˜ ao, a solu¸ca ˜o do problema de Cauchy de determinar a solu¸ca ˜o (11.24) para as condi¸co ˜es iniciais (11.25) ´e u ´nica, caso exista. 2 O leitor deve notar que a equa¸ca˜o diferencial (11.24) difere de (11.18) pela introdu¸ca˜o do termo contendo o campo ~θ, sendo que supomos que o divergente desse campo seja maior ou igual a zero em D. ´ de se notar tamb´em o fato de a proposi¸ca˜o limitar-se a condi¸co˜es de contorno do tipo de Dirichlet. E Prova. A prova segue os mesmos passos do caso da Proposi¸ca˜o 11.5, mas obtem-se agora Z  Z Z     2 dA n 2 n 2 ~ ~ ~ ~ ∇ · θ w d ~x + w θ · ~n(~x) ds(~x) , (t) = −2 κ(~x, t) ∇w d ~x − dt D ∂D D

(11.26)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 11

Vers˜ ao de 29 de setembro de 2005.

602/1304

em lugar de (11.22). A integral sobre ∂D ´e nula sob condi¸co˜es de Dirichlet, pois para elas w anula-se na ~ · ~θ ≥ 0, obtem-se novamente dA (t) ≤ 0 sob condi¸co˜es de Dirichlet10 , conduzindo fronteira. Assim, se ∇ dt a`s mesmas conclus˜oes que no caso da Proposi¸ca˜o 11.5. • Unicidade de solu¸ c˜ ao para a equa¸ c˜ ao de vibra¸ co ˜es el´ asticas em regi˜ oes finitas A proposi¸ca˜o que segue estende os resultados de unicidade que obtivemos para a equa¸ca˜o de difus˜ao na Proposi¸ca˜o 11.5, acima, para uma forma bastante geral da equa¸ca˜o que descreve vibra¸co˜es em meios el´asticos, definida em um conjunto pr´e-compacto e conexo D de n , para todo n ≥ 1, sob certas condi¸co˜es iniciais e certas condi¸co˜es de contorno, que podem ser do tipo de Dirichlet, de Neumann ou mistas. Um caso particular importante ´e a equa¸ca˜o de ondas, de grande relevˆancia em F´ısica, tratado na Proposi¸ca˜o 11.3 da p´agina 593 no caso unidimensional. 

Proposi¸ c˜ ao 11.7 Consideremos para uma fun¸ca ˜o real u a equa¸ca ˜o diferencial linear, dada por   ∂u ∂2u ~ · τ (~x)∇u(~ ~ x, t) + η(~x)u(~x, t) = ϕ(~x, t) , (11.27) ρ(~x) 2 (~x, t) + γ(~x, t) (~x, t) − ∇ ∂t ∂t definida para ~x em um conjunto n˜ ao-vazio, aberto, conexo e limitado D ⊂ n , n ≥ 1. D ´e, assim, pr´e-compacto e conexo. Assumiremos que τ ´e cont´ınua e diferenci´ avel e que ρ, γ e η sejam cont´ınuas por partes. Suporemos tamb´em que ρ(~x) > 0 e τ (~x) > 0, exceto em conjuntos de medida nula, onde podem anular-se. Assumiremos tamb´em que η(~x) ≥ 0 e que γ(~x, t) ≥ 0 para todo ~x ∈ D e todo t ≥ 0. 

Denotaremos por D o fecho de D (que ´e compacto, pois D ´e limitado) e denotaremos por ∂D = D\D a fronteira de D. Sobre a regi˜ ao D, suporemos ainda que ∂D seja diferenci´ avel e orient´ avel, de modo que em qualquer ponto ~x de ∂D possamos definir o versor (vetor de comprimento 1) ~n(~x) normal a ` ∂D no ponto ~x e apontando para fora de D. Iremos supor que a fun¸ca ˜o u esteja submetida a condi¸co ˜es iniciais que fixam seu valor em t = 0 assim como o de sua derivada temporal:

∂u (~x, 0) = v0 (~x) . (11.28) ∂t ∀~x ∈ D, onde as fun¸co ˜es reais u0 e v0 s˜ ao dados do problema (denominados dados de Cauchy). Al´em disso, iremos supor que u(~x, t) esteja submetida a condi¸co ˜es na fronteira ∂D, as chamadas condi¸co ˜es de contorno. Trataremos dos seguintes tipos de condi¸co ˜es de contorno: u(~x, 0) = u0 (~x) ,

I. Condi¸co˜es de Dirichlet: u(~x, t) = φ(~x, t) para todo ~x ∈ ∂D e todo t ≥ 0, φ(~x, t) sendo uma fun¸ca ˜o real dada. II. Condi¸co˜es de Neumann:

∂u (~x, t) = −ψ(~x, t) ∂n ∂u para todo ~x ∈ ∂D e todo t ≥ 0, ψ(~x, t) sendo uma fun¸ca ˜o real dada. Acima, ∂n representa a ∂u ~ derivada normal de u a ` superf´ıcie ∂D, ou seja, ∂n (~x, t) = ~n(~x) · ∇u(~x, t), ~x ∈ ∂D.

O leitor poderia pensar que poder´ıamos incluir condi¸co ˜es mistas de contorno e ainda obter dA dt (t) ≤ 0 em (11.26) se ~ ~ ~ adionamente supus´essemos que θ · ~n(~x) ≤ 0 em todo ∂D, mas isso ´e incompat´ıvel com ∇ · θ ≥ 0, pelo Teorema de Gauss. 10

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

603/1304

III. Condi¸co˜es mistas: para uma fun¸ca ˜o cont´ınua ζ(~x, t) ≥ 0, definida em ∂D para todo t ≥ 0, tem-se ∂u ∂u (~x, t) + ζ(~x, t) (~x, t) = χ(~x, t) ∂t ∂n para todo ~x ∈ ∂D e todo t ≥ 0, χ(~x, t) sendo uma fun¸ca ˜o real dada. ∂u anula-se identicamente na fronteira ∂D. IV. A express˜ ao τ (~x) ∂u ∂t ∂n

Ent˜ ao, para cada uma das condi¸co ˜es de contorno descritas acima, a solu¸ca ˜o do problema de Cauchy de determinar a solu¸ca ˜o (11.27) para as condi¸co ˜es iniciais (11.28) ´e u ´nica, caso exista. 2 A equa¸ca˜o (11.27) descreve vibra¸co˜es el´asticas em um meio material de densidade ρ(~x) localizado em D. O termo γ(~x, t) ∂u (~x, t) descreve uma dissipa¸ca˜o (por exemplo, por atrito viscoso com um meio ∂t externo) e τ (~x) deve ser interpretado como a tens˜ao do meio no ponto ~x. O termo η(~x)u(~x, t) provem de uma for¸ca harmˆonica restauradora (caso η positivo) agindo sobre cada ponto do meio. Por fim, ϕ(~x, t) representa uma for¸ca externa (por unidade de volume) agindo sobre o sistema no ponto ~x no instante t. Para uma dedu¸ca˜o parcial dessa express˜ao no caso unidimensional vide, por exemplo, [33]. Um caso particular importante ´e aquele em que γ, η e ϕ s˜ao nulas e ρ e τ s˜ao constantes positivas, caso esse em que (11.27) assume a forma da equa¸ca ˜o de ondas livres r ∂2u τ 2 (~x, t) − c ∆u(~x, t) = 0 , c = . 2 ∂t ρ A constante c tem a interpreta¸ca˜o de velocidade de propaga¸ca˜o das ondas. Prova da Proposi¸c˜ao 11.7. Afirmamos que sob as condi¸co˜es descritas na proposi¸ca˜o, a solu¸ca˜o de (11.27) ´e u ´ nica, caso exista. Para tal, vamos supor que u e v sejam duas solu¸co˜es reais de (11.27), ambas satisfazendo as mesmas condi¸co˜es iniciais e as mesmas condi¸co˜es de contorno, quer sejam de Dirichlet, de Neumann ou mistas, descritas acima. Consideremos a fun¸ca˜o w definida por w(~x, t) := u(~x, t)−v(~x, t). Como (11.27) ´e linear, ´e f´acil constatar que w satisfaz a equa¸ca˜o homogˆenea ρ(~x)

  ∂w ∂2w ~ · τ (~x)∇w(~ ~ x, t) + η(~x)w(~x, t) = 0 , (~ x , t) + γ(~ x , t) (~ x , t) − ∇ ∂t2 ∂t

(11.29)

para todo ~x ∈ D e todo t ≥ 0, assim como as condi¸co˜es iniciais w(~x, 0) = 0, e ∂w (~x, 0) = 0, ∀~x ∈ D. ∂t Quanto a`s condi¸co˜es de contorno teremos, para o caso de condi¸co˜es de Dirichlet, w(~x, t) = 0 para todo ~x ∈ ∂D e todo t ≥ 0. Para o caso de condi¸co˜es de Neumann, ∂w (~x, t) = 0 para todo ~x ∈ ∂D e todo ∂n ∂w ∂w t ≥ 0. Para o caso de condi¸co˜es mistas, ∂t (~x, t) + ζ(~x, t) ∂n (~x, t) = 0 para todo ~x ∈ ∂D e todo t ≥ 0.

Desejamos mostrar que w ´e identicamente nula, o que prova que u e v s˜ao idˆenticas, estabelecendo unicidade de solu¸ca˜o sob as condi¸co˜es mencionadas. Para tal, consideramos a express˜ao #  2 Z "     2 2 τ (~x) ~ η(~x) ρ(~x) ∂w E(t) = (~x, t) + ∇w(~x, t) + w(~x, t) dn~x . (11.30) 2 ∂t 2 2 D

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 11

Vers˜ ao de 29 de setembro de 2005.

604/1304

´ evidente pelas hipoteses de positividade sobre ρ, τ e η que E(t) ≥ 0 para todo t ≥ 0. Tem-se, por´em, E E(0) = 0, pois em t = 0 a fun¸ca˜o w anula-se, assim como sua derivada temporal (pela condi¸ca˜o inicial para w). Como w ´e diferenci´avel em rela¸ca˜o a t, podemos calcular a derivada dtd E(t) por    Z  ∂w ∂2w ∂w dE ∂w ~ ~ (t) = ρ(~x) 2 + τ (~x) ∇w · ∇ + η(~x)w dn ~x dt ∂t ∂t ∂t ∂t D     Z   ∂w ∂w ~  ∂w (11.29) ~ ~ ~ = + ∇ · τ (~x)∇w − η(~x) w + τ (~x) ∇w · ∇ −γ(~x, t) dn~x ∂t ∂t ∂t D Z ∂w n d ~x + η(~x) w ∂t D =

= Gauss

=

onde

∂w ∂n



Z



Z



Z



∂w ∂t

2

γ(~x, t)



∂w ∂t

2

γ(~x, t)



∂w ∂t

2

γ(~x, t) D

D

D

n

d ~x +

Z  D

n

d ~x +

n

d ~x +

Z Z

   ∂w ∂w ~  ~ ~ ·∇ ~ ∇ · τ (~x)∇w + τ (~x) ∇w dn ~x ∂t ∂t 

~ ~ · τ (~x) ∂w ∇w ∇ ∂t D τ (~x) ∂D



∂w ∂w ds(~x) , ∂t ∂n

dn~x

(11.31)

´e a derivada normal introduzida a` p´agina 602.

No caso de condi¸co˜es de Dirichlet, w anula-se na fronteira ∂D para todo t e, portanto, tamb´em sua derivada temporal se anula. Com isso, a segunda integral em (11.31) vale zero, o que tamb´em ocorre para condi¸co˜es de Neumann pois, a´ı, ∂w ´e nula, assim como para as condi¸co˜es de contorno do tipo IV, ∂n descritas na p´agina 603. Nesses casos tem-se, assim,  2 Z ∂w dE dn~x , (t) = − γ(~x, t) dt ∂t D que ´e menor ou igual a zero, pois supomos γ(~x, t) ≥ 0. Para condi¸co˜es de contorno mistas, tem-se  2 2  Z Z ∂w dE ∂w n d ~x − τ (~x)ζ(~x, t) ds(~x) , (t) = − γ(~x, t) dt ∂t ∂n ∂D D que ´e igualmente menor ou igual a zero, pois supusemos que τ (~x) > 0, γ(~x, t) ≥ 0 e ζ(~x, t) ≥ 0.

Para os v´arios tipos de condi¸co˜es de contorno tratados, chegamos ao mesmo tipo de situa¸ca˜o encontrada na prova da Proposi¸ca˜o 11.5: temos que E(t) ≥ 0 e que dE (t) ≤ 0 para todo t ≥ 0, mas dt E(0) = 0. Isso s´o ´e poss´ıvel se E(t) = 0 para todo t ≥ 0. Lembrando a defini¸ca˜o de E(t) em (11.30) e da hip´otese que ρ e τ s˜ao positivos (exceto, talvez, em conjuntos de medida nula), conclu´ımos que ~ x, t) = 0, o que implica que w(~x, t) ´e uma para todo ~x ∈ D e todo t ≥ 0 tem-se ∂w (~x, t) = 0 e ∇w(~ ∂t constante para todo ~x ∈ D e todo t ≥ 0. Lembrando que w(~x, 0) = 0 pela condi¸ca˜o inicial, conclu´ımos que w(~x, t) ´e nula para todo ~x ∈ D e todo t ≥ 0. Isso implica que as solu¸co˜es u e v s˜ao idˆenticas, que ´e o que quer´ıamos provar.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 11

605/1304

E. 11.7 Exerc´ıcio. Se u ´e uma solu¸c˜ao da equa¸c˜ao (11.27), que descreve vibra¸co˜es el´asticas em um meio material, ent˜ao a express˜ao que define E(t) em (11.30), ou seja, #  2 Z " 2 η(~x)  2 ρ(~x) ∂u τ (~x)  ~ E(t) = ∇u(~x, t) + u(~x, t) dn~x , (~x, t) + 2 ∂t 2 2 D representa a energia mecˆanica dessas vibra¸co˜es. Justifique essa afirma¸c˜ao. Determine, como fizemos acima, (t). Discuta sob mas para ϕ n˜ao-nula e para condi¸co˜es de contorno n˜ao-homogˆeneas, a express˜ao de dE dt quais circunstˆancias a energia ´e conservada. 6

Cap´ıtulo 12 Introdu¸c˜ ao ao Problema de Sturm-Liouville Conte´ udo 12.1 Introdu¸ ca ˜o

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607

12.2 O Problema de Sturm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 611 12.2.1 Resolvendo o Problema de Sturm. A Fun¸ca˜o de Green . . . . . . . . . . . . . 612 12.2.2 O Teorema de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615 12.3 O Problema de Sturm-Liouville . . . . . . . . . . . . . . . . . . . . . . . . . 617 12.4 Propriedades B´ asicas dos Autovalores e das Autofun¸ co ˜es de Problemas de Sturm-Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 619 12.4.1 Realidade dos Autovalores. Ortogonalidade de Autofun¸co˜es . . . . . . . . . . 619 12.4.2 A Simplicidade dos Autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . 622 12.4.3 Condi¸co˜es Suficientes para a Positividade dos Autovalores . . . . . . . . . . . 623 12.5 A Equa¸ ca ˜o Integral de Fredholm . . . . . . . . . . . . . . . . . . . . . . . . 627 12.6 Uma Aplica¸ ca ˜o do Problema de Sturm-Liouville . . . . . . . . . . . . . . . 630 12.7 O M´ etodo dos Determinantes de Fredholm . . . . . . . . . . . . . . . . . . 634 12.7.1 A Equa¸ca˜o Integral de Fredholm Linear N˜ao-Homogˆenea . . . . . . . . . . . . 634 12.7.2 A Equa¸ca˜o Integral de Fredholm Linear Homogˆenea . . . . . . . . . . . . . . 638 12.8 Coment´ arios Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 640 12.8.1 O Problema de Sturm-Liouville Singular . . . . . . . . . . . . . . . . . . . . . 640 12.A Prova do Teorema 12.1. Existˆ encia e Unicidade . . . . . . . . . . . . . . . 643 12.B Prova da Proposi¸ ca ˜o 12.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644 12.C Coment´ ario Sobre o Determinante Wronskiano . . . . . . . . . . . . . . . 646 12.D Ausˆ encia de Autovalores em um Problema Singular

. . . . . . . . . . . . 647

12.E Demonstra¸ ca ˜o do Teorema 12.3 . . . . . . . . . . . . . . . . . . . . . . . . . 648 12.F Prova da Desigualdade (12.E.22) . . . . . . . . . . . . . . . . . . . . . . . . 652 12.G Obtendo os Determinantes de Fredholm . . . . . . . . . . . . . . . . . . . . 654 12.8 Exerc´ıcios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661

presente cap´ıtulo ´e dedicado ao problema de Sturm-Liouville, um cl´assico problema da teoria das equa¸co˜es diferenciais com v´arias aplica¸co˜es em F´ısica. Historicamente o problema de Sturm-Liouville engendrou uma s´erie de desenvolvimentos que conduziram, no come¸co do s´eculo XX, ao nascimento de uma nova e importante a´rea da Matem´atica, a An´alise Funcional, a´rea essa que ´e de importˆancia fundamental para a F´ısica Quˆantica.

606

JCABarata. Curso de F´ısica-Matem´ atica

12.1

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

607/1304

Introdu¸ c˜ ao

In´ umeros problemas em F´ısica envolvem a resolu¸ca˜o de equa¸co˜es diferenciais ordin´arias lineares de segunda ordem e o estudo de propriedades gerais de suas solu¸co˜es. De modo geral, uma equa¸ca˜o diferencial desse tipo ´e da forma u00 + a1 (x)u0 + a0 (x)u = g(x) ,

(12.1)

onde g, a0 e a1 s˜ao certas fun¸co˜es conhecidas de n´ umeros reais em n´ umeros reais das quais eventualmente exige-se certas condi¸co˜es (como continuidade, diferenciabilidade etc.). A fun¸ca˜o u representa alguma grandeza f´ısica e a equa¸ca˜o (12.1) ´e a express˜ao matem´atica de uma lei f´ısica que essa grandeza deve obedecer. Em muitos casos a fun¸ca˜o u ´e definida em um intervalo fechado finito [a, b] da reta real, b > a, e ´e obrigada a satisfazer certas condi¸co˜es nos extremos desse intervalo. Tais condi¸co˜es s˜ao chamadas de condi¸co ˜es de contorno. Condi¸co˜es de contorno s˜ao ditadas ou por leis f´ısicas ou por restri¸co˜es f´ısicas ou geom´etricas que devem ser impostas nos pontos a e b a` grandeza representada por u. O caso mais t´ıpico ´e aquele no qual imp˜oe-se que a fun¸ca˜o u ou sua primeira derivada (ou combina¸co˜es lineares de ambas) assumem certos valores fixos nos pontos a e b. H´a tamb´em muitas situa¸co˜es nas quais a fun¸ca˜o u ´e definida em intervalos semi-infinitos, como [0, ∞) ou infinitos, como (−∞, ∞), e as condi¸co˜es impostas podem exigir, por exemplo, que u se anule no infinito, que seja limitada ou que seja de quadrado integr´avel. • Condi¸ co ˜es de contorno lineares e homogˆ eneas H´a muitos tipos distintos de condi¸co˜es de contorno. De particular importˆancia s˜ao as condi¸co˜es de contorno lineares que, no caso de equa¸co˜es de segunda ordem, tˆem a seguinte estrutura. A fun¸ca˜o u est´a definida em um intervalo finito [a, b] e para certas constantes reais α1 , α2 , β1 , β2 , ϕ1 e ϕ2 tais que (α1 , α2 ) 6= (0, 0), (β1 , β2 ) 6= (0, 0) a fun¸ca˜o u satisfaz o par de condi¸co˜es α1 u(a) + α2 u0 (a) = ϕ1 ,

(12.2)

β1 u(b) + β2 u0 (b) = ϕ2 .

(12.3)

Condi¸co˜es de contorno desse tipo s˜ao ditas lineares devido a` dependˆencia linear em u do lado direito de (12.2) e (12.3). Nestas notas, estaremos interessados particularmente em condi¸co˜es do seguinte tipo: suporemos que u est´a definida em um intervalo finito [a, b] e que para certas constantes reais α1 , α2 , β1 e β2 tais que (α1 , α2 ) 6= (0, 0), (β1 , β2 ) 6= (0, 0) a fun¸ca˜o u satisfa¸ca o par de condi¸co˜es α1 u(a) + α2 u0 (a) = 0 ,

(12.4)

β1 u(b) + β2 u0 (b) = 0 .

(12.5)

Condi¸co˜es de contorno lineares desse tipo s˜ao ditas homogˆeneas devido ao lado direito de (12.4) e (12.5) ser zero.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

608/1304

Condi¸co˜es de contorno s˜ao restri¸co˜es de crucial importˆancia na resolu¸ca˜o de equa¸co˜es diferenciais. Para verificar essa importˆancia, fa¸ca os seguintes exerc´ıcios simples: E. 12.1 Exerc´ıcio. Verifique que o problema de determinar uma fun¸c˜ao u tal que u 00 = 0 tal que u0 (0) = 0 e u0 (1) = 1 n˜ao tem solu¸co˜es. 6 E. 12.2 Exerc´ıcio. Verifique que o problema de determinar uma fun¸c˜ao u tal que u 00 = 0 tal que 0 0 u (0) = 0 e u (1) = 0 tem infinitas solu¸co˜es. 6 E. 12.3 Exerc´ıcio. Verifique que o problema de determinar uma fun¸c˜ao u tal que u 00 + u = 0 com u(0) = 1 e u(π) = 1 n˜ao tem solu¸co˜es. 6 E. 12.4 Exerc´ıcio. Verifique que o problema de determinar uma fun¸c˜ao u tal que u 00 + u = 0 com u(0) = 1 e u(π) = −1 tem infinitas solu¸co˜es. 6 E. 12.5 Exerc´ıcio. Verifique que o problema de determinar uma fun¸c˜ao u tal que u 00 + u = 0 com u(0) = ϕ1 e u(π) = ϕ2 tem infinitas solu¸co˜es se ϕ1 = −ϕ2 e n˜ao tem solu¸c˜ao se ϕ1 6= −ϕ2 . 6 • Um teorema sobre existˆ encia e unicidade de solu¸ co ˜es Os exemplos dos exerc´ıcios acima mostram que a quest˜ao da existˆencia e unicidade de solu¸co˜es ´ importante nesse em problemas que envolvem condi¸co˜es de contorno n˜ao ´e uma quest˜ao trivial. E contexto mencionar o seguinte teorema, o qual expressa condi¸co˜es necess´arias e suficientes para garantir a existˆencia e a unicidade de solu¸co˜es: Teorema 12.1 Seja a equa¸ca ˜o diferencial linear de segunda ordem u00 + a1 (x)u0 + a0 (x)u = g(x),

(12.6)

onde g, a0 e a1 s˜ ao definidas num intervalo finito e fechado [a, b] e s˜ ao cont´ınuas nesse intervalo. O problema de encontrar solu¸co ˜es dessa equa¸ca ˜o que satisfa¸cam condi¸co ˜es de contorno do tipo α1 u(a) + α2 u0 (a) = ϕ1

(12.7)

β1 u(b) + β2 u0 (b) = ϕ2

(12.8)

para certas constantes reais α1 , α2 , β1 , β2 , ϕ1 e ϕ2 tais que (α1 , α2 ) 6= (0, 0), (β1 , β2 ) 6= (0, 0) tem solu¸ca ˜o u ´nica se e somente se o determinante da matriz   α1 u1 (a) + α2 u01 (a) α1 u2 (a) + α2 u02 (a)   (12.9) 0 0 β1 u2 (b) + β2 u2 (b) β1 u1 (b) + β2 u1 (b) for n˜ ao nulo, onde u1 e u2 s˜ ao duas solu¸co ˜es independentes quaisquer da equa¸ca ˜o homogˆenea u00 + a1 (x)u0 + a0 (x)u = 0 .

(12.10) 2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

609/1304

A demonstra¸ca˜o ´e apresentada no Apˆendice 12.A, p´agina 643, cujo estudo pode ser dispensado em uma primeira leitura. Exemplo. No Exerc´ıcio E. 12.5, p´agina 608, acima, verificamos que o problema de determinar uma fun¸ca˜o u tal que u00 + u = 0 com u(0) = ϕ1 e u(π) = ϕ2 ou tem infinitas solu¸co˜es (caso ϕ1 = −ϕ2 ) ou n˜ao tem nenhuma solu¸ca˜o (caso ϕ1 6= −ϕ2 ). Vamos analisar isso sob a luz do Teorema 12.1. Aqui temos [a, b] = [0, π]. Com as condi¸co˜es u(0) = ϕ1 e u(π) = ϕ2 tem-se α1 = β1 = 1 e α2 = β2 = 0. Duas solu¸co˜es independentes da equa¸ca˜o homogˆenea u00 + u = 0 s˜ao u1 (x) = cos(x) e u2 (x) = sen (x). Assim,       α1 u1 (a) + α2 u01 (a) α1 u2 (a) + α2 u02 (a) cos(0) sen (0) 1 0   =   =   , 0 0 β1 u1 (b) + β2 u1 (b) β1 u2 (b) + β2 u2 (b) cos(π) sen (π) −1 0 que tem determinante nulo. Logo, a condi¸ca˜o do Teorema 12.1 ´e violada e isso justifica por que n˜ao se pode garantir nem existˆencia nem unicidade a` solu¸ca˜o do problema em quest˜ao. • Relacionando problemas com condi¸ co ˜es de contorno n˜ ao-homogˆ eneas e homogˆ eneas Adiante, consideraremos apenas problemas com condi¸co˜es de contorno lineares e homogˆeneas. Por que n˜ao consideraremos tamb´em as condi¸co˜es de contorno n˜ao-homogˆeneas? A raz˜ao ´e que, como veremos, podemos sempre obter solu¸co˜es de problemas com condi¸co˜es de contorno n˜ao-homogˆeneas a partir das solu¸co˜es de problemas com condi¸co˜es de contorno homogˆeneas. A argumenta¸ca˜o ´e bem simples. Seja w uma fun¸ca˜o em princ´ıpio arbitr´aria (duas vezes diferenci´avel) mas que satisfa¸ca α1 w(a) + α2 w 0 (a) = ϕ1 ,

(12.11)

β1 w(b) + β2 w 0 (b) = ϕ2 .

(12.12)

Para uma tal fun¸ca˜o w, vamos definir uma fun¸ca˜o h(x) da seguinte forma: h(x) := w 00 + a1 (x)w 0 + a0 (x)w . Seja v solu¸ca˜o da equa¸ca˜o v 00 + a1 (x)v 0 + a0 (x)v = g(x) − h(x) ,

(12.13)

com as condi¸co˜es de contorno homogˆeneas α1 v(a) + α2 v 0 (a) = 0,

(12.14)

β1 v(b) + β2 v 0 (b) = 0.

(12.15)

Ent˜ao, ´e f´acil verificar que a fun¸ca˜o u(x) = v(x) + w(x) satisfaz u00 + a1 (x)u0 + a0 (x)u = g(x)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

610/1304

e α1 u(a) + α2 u0 (a) = ϕ1 ,

(12.16)

β1 u(b) + β2 u0 (b) = ϕ2 .

(12.17)

Isso diz-nos, em resumo, que para resolver problemas com condi¸co˜es de contorno n˜ao-homogˆeneas ´e suficiente saber determinar uma fun¸ca˜o como w acima e saber determinar a solu¸ca˜o de uma equa¸ca˜o diferencial linear com condi¸co˜es de contorno homogˆeneas. Por essa raz˜ao, daqui por diante s´o consideraremos problemas com condi¸co˜es de contorno homogˆeneas. Determinar uma fun¸ca˜o w pode ser feito, por exemplo, procurando uma w na forma de um polinˆomio e procurando ajustar os coeficientes desse polinˆomio de modo que (12.11)-(12.12) sejam satisfeitas. • Reescrevendo a equa¸ c˜ ao diferencial na forma de Liouville Uma observa¸ca˜o importante que devemos fazer sobre equa¸co˜es como (12.1) ´e que, para muitos casos, as mesmas sempre podem ser reescritas da seguinte forma equivalente, conhecida como forma de Liouville: (p(x)u0 )0 + q(x)u = f (x) , (12.18)  Rx onde p(x) = exp a a1 (x0 ) dx0 , q(x) = p(x)a0 (x) e f (x) = p(x)g(x). Estaremos usando esta forma da equa¸ca˜o mais freq¨ uentemente que a forma anterior. E. 12.6 Exerc´ıcio. Verifique a equivalˆencia das duas formas da equa¸c˜ao multiplicando (12.1) por p(x) e usando o fato que, pela defini¸c˜ao, p0 (x) = a1 (x)p(x). 6 • Condi¸ co ˜es de contorno homogˆ eneas caracterizam um espa¸ co vetorial Um fato importante sobre problemas com condi¸co˜es de contorno homogˆeneas e que ser´a implicitamente utilizado no que seguir´a ´e o seguinte: Sejam fixadas as constantes α1 , α2 , β1 e β2 . Se r1 e r2 s˜ao duas fun¸co˜es duas vezes diferenci´aveis definidas no intervalo [a, b] tais que ambas satisfazem as condi¸co˜es de contorno homogˆeneas (12.4)(12.5) ent˜ao qualquer combina¸ca˜o linear de ambas λ1 r1 (x) + λ2 r2 (x) ´e tamb´em uma fun¸ca˜o duas vezes diferenci´avel no intervalo [a, b] que satisfaz as mesmas condi¸co˜es de contorno homogˆeneas (12.4)-(12.5). E. 12.7 Exerc´ıcio. Verifique essa afirma¸c˜ao.

6

Em outras palavras, o conjunto de todas as fun¸co˜es duas vezes diferenci´aveis definidas no intervalo [a, b] que satisfazem as condi¸co˜es de contorno homogˆeneas (12.4)-(12.5) ´e um espa¸co vetorial. Esse espa¸co ser´a denotado aqui por V(α1 , α2 , β1 , β2 ), ou simplesmente por V, quando n˜ao houver confus˜ao.

• Condi¸ co ˜es de contorno n˜ ao-homogˆ eneas caracterizam um espa¸ co convexo Sejam fixadas as constantes α1 , α2 , β1 , β2 , ϕ1 e ϕ2 . Se r1 e r2 s˜ao duas fun¸co˜es duas vezes diferenci´aveis definidas no intervalo [a, b] tais que ambas satisfazem as condi¸co˜es de contorno n˜ao-

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

611/1304

homogˆeneas (12.2)-(12.3) ent˜ao qualquer combina¸ca˜o linear convexa de ambas λr 1 (x) + (1 − λ)r2 (x), 0 ≤ λ ≤ 1, ´e tamb´em uma fun¸ca˜o duas vezes diferenci´avel no intervalo [a, b] que satisfaz as mesmas condi¸co˜es de contorno n˜ao-homogˆeneas (12.2)-(12.3). E. 12.8 Exerc´ıcio. Verifique essa afirma¸c˜ao.

6

Em outras palavras, o conjunto de todas as fun¸co˜es duas vezes diferenci´aveis definidas no intervalo [a, b] que satisfazem as condi¸co˜es de contorno n˜ao-homogˆeneas (12.2)-(12.3) ´e um espa¸co convexo. • Uma nota¸ c˜ ao Como iremos daqui por diante tratar de equa¸co˜es diferenciais da forma (p(x)u0 )0 + q(x)u = f (x), convem introduzir uma nota¸ca˜o simplificadora: Lu := (p(x)u0 )0 + q(x)u . L pode ser entendido como o operador diferencial linear L :=

d d p(x) + q(x) . dx dx

L ´e linear pois claramente tem-se L(αu + βv) = αLu + βLv para quaisquer constantes α e β e quaisquer fun¸co˜es (duas vezes diferenci´aveis) u e v. * Ap´os estas observa¸co˜es podemos passar a tratar nosso problema de forma mais sistem´atica.

12.2

O Problema de Sturm

• Defini¸ c˜ ao do problema Entende-se como o Problema de Sturm1 o problema de determinar as solu¸co˜es da equa¸ca˜o diferencial (p(x)u0 )0 + q(x)u = f (x) , para u definida no intervalo fechado finito [a, b] ⊂ homogˆeneas

, b > a, com as condi¸co˜es de contorno lineares e

α1 u(a) + α2 u0 (a) = 0 ,

(12.20)

β1 u(b) + β2 u0 (b) = 0 ,

(12.21)

onde o seguinte estar´a sendo suposto: 1



(12.19)

Jacques Charles Fran¸cois Sturm (1803-1855).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

612/1304

As fun¸co˜es p, q e f s˜ao reais e cont´ınuas em [a, b]. A fun¸ca˜o p ´e diferenci´avel em [a, b] e estritamente positiva: p(x) > 0, x ∈ [a, b]. As constantes α1 , α2 , β1 e β2 s˜ao reais e tais que (α1 , α2 ) 6= (0, 0) e (β1 , β2 ) 6= (0, 0). As condi¸co˜es acima s˜ao essenciais mas n˜ao delimitam ainda totalmente o Problema de Sturm, pois ´e preciso impor restri¸co˜es que garantam a existˆencia e unicidade de solu¸co˜es do mesmo. Como aprendemos do Teorema 12.1, devemos impor ainda que   α1 u1 (a) + α2 u01 (a) α1 u2 (a) + α2 u02 (a)  6= 0 , (12.22) det  0 0 β1 u2 (b) + β2 u2 (b) β1 u1 (b) + β2 u1 (b)

onde u1 e u2 s˜ao duas solu¸co˜es independentes quaisquer da equa¸ca˜o homogˆenea Lu = 0. • Uma observa¸ c˜ ao importante

Essa u ´ ltima restri¸ca˜o tem uma conseq¨ uˆencia que usaremos abaixo quando tratarmos de desenvolver um m´etodo de resolver problemas de Sturm baseado no conceito de fun¸ca˜o de Green. A conseq¨ uˆencia da qual falamos ´e a seguinte: Proposi¸ c˜ ao 12.1 Com as defini¸co ˜es acima, existem fun¸co ˜es v1 e v2 , independentes, definidas no intervalo [a, b], tais que Lv1 = 0, Lv2 = 0 e tais que α1 v1 (a) + α2 v10 (a) = 0

(12.23)

β1 v2 (b) + β2 v20 (b) = 0 .

(12.24)

e 2 A demonstra¸ca˜o dessa proposi¸ca˜o, da qual faremos uso adiante, encontra-se no Apˆendice 12.B, p´agina 644. * Uma vez delineado o quadro onde iremos trabalhar, passemos ao importante conceito da fun¸ca˜o de Green que nos leva diretamente a` solu¸ca˜o do problema de Sturm.

12.2.1

Resolvendo o Problema de Sturm. A Fun¸ c˜ ao de Green

Al´em da equa¸ca˜o (p(x)u0 )0 + q(x)u = f (x) ,

(12.25)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

613/1304

consideremos tamb´em a equa¸ca˜o diferencial homogˆenea (p(x)u0 )0 + q(x)u = 0 .

(12.26)

Pela Proposi¸ca˜o 12.1, existem solu¸co˜es independentes v1 e v2 da equa¸ca˜o homogˆenea, tais que v1 e v2 satisfazem as seguintes condi¸co˜es de contorno: α1 v1 (a) + α2 v10 (a) = 0 ,

(12.27)

β1 v2 (b) + β2 v20 (b) = 0 .

(12.28)

Note-se que a (12.27) ´e uma restri¸ca˜o a` fun¸ca˜o v1 no ponto a enquanto que a (12.28) ´e uma restri¸ca˜o a` fun¸ca˜o v2 no ponto b. Com o uso dessas fun¸co˜es vamos construir uma solu¸ca˜o do problema de Sturm. Para tal, vamos introduzir a importante defini¸ca˜o da fun¸ca ˜o de Green2 . A fun¸ca˜o de Green ´e uma fun¸ca˜o de duas vari´aveis G(x, y), onde x ∈ [a, b] e y ∈ [a, b], definida da seguinte forma:  v1 (x)v2 (y)   , para a ≤ x ≤ y ≤ b    p(a)W (a) G(x, y) := , (12.29)   v (y)v (x) 1 2   , para a ≤ y ≤ x ≤ b  p(a)W (a)

onde W (x) ´e o chamado determinante Wronskiano3 , ou fun¸ca ˜o Wronskiana, definido4 , neste caso, por   v1 (x) v10 (x)  = v1 (x)v20 (x) − v2 (x)v10 (x) . (12.30) W (x) := det  0 v2 (x) v2 (x)

Note-se que, por (12.B.9), W (x) 6= 0 para todo x ∈ [a, b].

Antes de prosseguirmos, vamos demonstrar um fato simples sobre a fun¸ca˜o Wronskiana, a saber vamos mostrar que a fun¸ca˜o p(x)W (x) ´e constante no intervalo [a, b]. Isso significa provar que (p(x)W (x))0 = 0. De fato, (pW )0 = p0 W + pW 0 = p0 (v1 v20 − v10 v2 ) + p (v1 v20 − v10 v2 )0 = p0 (v1 v20 − v10 v2 ) + p (v10 v20 + v1 v200 − v100 v2 − v10 v20 ) = p0 (v1 v20 − v10 v2 ) + p (v1 v200 − v100 v2 ) = v1 (p0 v20 + pv200 ) − v2 (p0 v10 + pv100 ) = v1 (pv20 )0 − v2 (pv10 )0 = −v1 qv2 + v2 qv1 = 0, 2

(12.31)

George Green (1793-1841). Conde Josef Ho¨en´e de Wronski (1778-1853). 4 No Apˆendice 12.C, p´ agina 646, mostramos a rela¸ca ˜o entre essa defini¸ca ˜o de determinante Wronskiano e aquela introduzida no Cap´ıtulo 7, p´ agina 306 (vide p´ agina 318). 3

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

614/1304

onde, na pen´ ultima igualdade, usamos o fato que v1 e v2 satisfazem a equa¸ca˜o homogˆenea. Assim, provamos que, para todo x ∈ [a, b], tem-se p(x)W (x) = p(a)W (a) = p(b)W (b).

Dado que as fun¸co˜es v1 e v2 s˜ao cont´ınuas, ´e f´acil ver que G ´e igualmente cont´ınua no quadrado Q := [a, b] × [a, b] onde est´a definida. Entretanto, as derivadas parciais Gx e Gy de G n˜ao s˜ao cont´ınuas em Q, apresentando uma descontinuidade ao longo da diagonal de Q, que consiste nos pontos (x, y) ∈ Q com x = y. Como esse fato ter´a conseq¨ uˆencias adiante, vamos nos dedicar a estudar essa descontinuidade com mais detalhe. Dado que v1 e v2 s˜ao diferenci´aveis, ´e claro que  0 v1 (x)v2 (y)   ,    p(a)W (a) Gx (x, y) :=   v1 (y)v20 (x)   ,  p(a)W (a)

para a ≤ x < y ≤ b .

(12.32)

para a ≤ y < x ≤ b

Note que, nesta u ´ ltima express˜ao, exclu´ımos os pontos para os quais x = y, onde G x n˜ao est´a definida. Entretanto, apesar de Gx n˜ao estar definida nesses pontos, os limites lim Gx (x + , x) e lim Gx (x − , x) →0

→0

→0

→0

existem mas s˜ao, por´em, distintos, o mesmo se dando com os limites lim Gx (x, x + ) e lim Gx (x, x − )

(aqui  > 0). Dado que, para qualquer  > 0, tem-se x +  > x e x −  < x, segue que lim Gx (x + , x) =

v1 (x)v20 (x) p(a)W (a)

(12.33)

lim Gx (x − , x) =

v10 (x)v2 (x) . p(a)W (a)

(12.34)

lim Gx (x, x − ) =

v1 (x)v20 (x) p(a)W (a)

(12.35)

lim Gx (x, x + ) =

v10 (x)v2 (x) . p(a)W (a)

(12.36)

→0

e que →0

Analogamente segue que →0

e que →0

Portanto, segue que lim Gx (x + , x) − lim Gx (x − , x) = →0

→0

v1 (x)v20 (x) − v10 (x)v2 (x) W (x) 1 = = , p(a)W (a) p(a)W (a) p(x)

(12.37)

pois, como vimos, para qualquer x ∈ [a, b] tem-se p(a)W (a) = p(x)W (x). De maneira idˆentica, segue que 1 lim Gx (x, x − ) − lim Gx (x, x + ) = . (12.38) →0 →0 p(x) As rela¸co˜es (12.37) e (12.38) mostram-nos que, de fato, Gx ´e descont´ınua na diagonal de Q e nos dizem tamb´em qu˜ao grande ´e o salto dado pela fun¸ca˜o Gx quando se cruza a diagonal de Q no ponto (x, x).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

615/1304

O fato fundamental a respeito da fun¸ca˜o de Green ´e que a fun¸ca˜o u(x) definida por u(x) =

Z

b

G(x, y) f (y) dy

(12.39)

a

´e tal que u satisfaz a equa¸ca˜o n˜ao-homogˆenea (12.19) e satisfaz as condi¸co˜es de contorno (12.20)(12.21), ou seja, ´e a solu¸ca˜o do problema de Sturm. Esse fato ´e conhecido como Teorema de Green e ser´a provado na pr´oxima sub-se¸ca˜o.

12.2.2

O Teorema de Green

Vamos aqui demonstrar o Teorema de Green mencionado acima. Precisamos para tal calcular (pu0 )0 + qu = pu00 + p0 u0 + qu para u(x) dada por (12.39) e demonstrar que isso ´e igual a f (x). Dado que G tem derivadas parciais descont´ınuas, ´e conveniente escrever Z b Z x G(x, y) f (y) dy . (12.40) G(x, y) f (y) dy + u(x) = x

a

Em cada um dos peda¸cos em que quebramos a integral acima tem-se que Gx ´e cont´ınua. Da´ı, segue que Z b Z x 0 Gx (x, y) f (y) dy Gx (x, y) f (y) dy − G(x, x)f (x) + u (x) = G(x, x)f (x) + x

a

=

Z

x

Gx (x, y) f (y) dy + a

Z

b

Gx (x, y) f (y) dy .

(12.41)

x

E. 12.9 Exerc´ıcio. Justifique as express˜oes acima.

6

De forma inteiramente an´aloga tem-se que 00

u (x) = lim Gx (x, x − )f (x) + →0

Z

x

Gxx (x, y) f (y) dy a

− lim Gx (x, x + )f (x) + →0

f (x) + = p(x)

Z

Z

b

Gxx (x, y) f (y) dy x

x

Gxx (x, y) f (y) dy + a

Z

b

Gxx (x, y) f (y) dy ,

(12.42)

x

onde, na u ´ ltima igualdade, usamos (12.38). E. 12.10 Exerc´ıcio. Justifique as express˜oes acima.

6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

616/1304

Desta forma, temos que p(x)u00 + p0 (x)u0 + q(x)u =

p(x) f (x) p(x) Z x [p(x)Gxx (x, y) + p0 (x)Gx (x, y) + q(x)G(x, y)] f (y) dy + a

+

Z

b

[p(x)Gxx (x, y) + p0 (x)Gx (x, y) + q(x)G(x, y)] f (y) dy(12.43) . x

Entretanto, temos que p(x)Gxx (x, y) + p0 (x)Gx (x, y) + q(x)G(x, y) = 0 ,

(12.44)

e isto vale tanto para y = [a, x) quanto para y = (x, b]. Para ver isso basta notar, por exemplo, que para y = [a, x) tem-se que p(x)Gxx (x, y) + p0 (x)Gx (x, y) + q(x)G(x, y)

=

v1 (y) [p(x)v200 (x) + p0 (x)v20 (x) + q(x)v2 (x)] = 0 , p(a)W (a)

(12.45)

pois, por hip´otese, v2 ´e solu¸ca˜o da equa¸ca˜o homogˆenea p(x)v200 (x) + p0 (x)v20 (x) + q(x)v2 (x) = 0. O caso y = (x, b] ´e an´alogo. E. 12.11 Exerc´ıcio. Verifique!

6

Assim, retomando a equa¸ca˜o (12.43), vemos que p(x)u00 + p0 (x)u0 + q(x)u = f (x) .

(12.46)

Est´a, portanto, demonstrado que a fun¸ca˜o u dada por (12.39) ´e solu¸ca˜o da equa¸ca˜o diferencial n˜aohomogˆenea. Resta provar que essa fun¸ca˜o u satisfaz as condi¸co˜es de contorno (12.4)-(12.5). Deixamos a importante verifica¸ca˜o desse u ´ ltimo fato como exerc´ıcio. E. 12.12 Exerc´ıcio. Mostre que (12.39) satisfaz as condi¸co˜es de contorno (12.4)-(12.5).

6

• O problema de Sturm com condi¸ co ˜es de contorno n˜ ao-homogˆ eneas Com as observa¸co˜es da p´agina 609 podemos encontrar tamb´em solu¸co˜es de problemas de Sturm (Lu)(x) = f (x) com u satisfazendo condi¸co˜es de contorno n˜ao-homogˆeneas como (12.2)-(12.3). Seja w uma fun¸ca˜o duas vezes diferenci´avel satisfazendo tamb´em (12.11)-(12.12). Defina-se h(x) := (Lw)(x) . e seja v a solu¸ca˜o da equa¸ca˜o (Lv)(x) = f (x) − h(x) ,

(12.47)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

617/1304

com as condi¸co˜es de contorno homogˆeneas α1 v(a) + α2 v 0 (a) = 0 ,

(12.48)

β1 v(b) + β2 v 0 (b) = 0 .

(12.49)

Ent˜ao, u = v + w satisfaz Lu = f e as condi¸co˜es n˜ao-homogˆeneas (12.2)-(12.3). Agora, pela solu¸ca˜o do problema de Sturm homogˆeneo, sabemos que Z b v(x) = G(x, y)(f (y) − h(y)) dy, a

onde G ´e montada como antes (vide (12.29)) a partir de solu¸co˜es v1 e v2 da equa¸ca˜o homogˆenea Lv1, 2 = 0, com v1 e v2 satisfazendo (12.27) e (12.28), respectivamente. Logo, a solu¸ca˜o procurada ´e Z b u(x) = G(x, y)(f (y) − h(y)) dy + w(x) a

=

=

12.3

Z

Z

b

G(x, y)f (y) dy + w(x) −

a b a





G(x, y)f (y) dy + w(x) −

Z

Z

b



G(x, y)h(y) dy . a b

G(x, y)(Lw)(y) dy a



.

(12.50)

O Problema de Sturm-Liouville

Seja o intervalo J := [a, b] ⊂ 

e sejam p, q e r fun¸co˜es reais definidas em J, tais que

p ´e cont´ınua, diferenci´avel e estritamente positiva em J, ou seja, p(x) > 0 para todo x ∈ [a, b]. q ´e cont´ınua em J. r ´e cont´ınua e estritamente positiva em J, ou seja, r(x) > 0 para todo x ∈ [a, b]. Para uma fun¸ca˜o u definida em J que seja pelo menos duas vezes diferenci´avel, vamos como anteriormente definir o operador diferencial L por (Lu)(x) = (p(x)u0 )0 + q(x)u. Entende-se por Problema de Sturm-Liouville5 regular6 , ou simplesmente Problema de Sturm-Liouville, umeros λ tais que a seguinte equa¸ca˜o o problema de se determinar a fun¸ca˜o u definida em J e os n´ diferencial seja satisfeita: Lu + λ r(x)u = 0 , (12.51) 5

Jacques Charles Fran¸cois Sturm (1803-1855). Joseph Liouville (1809-1882). Os trabalhos de ambos sobre o problema que ´e hoje conhecido como Problema de Sturm-Liouville foram desenvolvidos entre 1829 e 1837. 6 O problema de Sturm-Liouville singular ser´ a tratado brevemente a ` p´ agina 640.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

618/1304

com o seguinte tipo de condi¸ca˜o de contorno: vamos supor que existam constantes reais α 1 , α2 , β1 e β2 tais que (α1 , α2 ) 6= (0, 0), (β1 , β2 ) 6= (0, 0) e tais que o seguinte par de rela¸co˜es deve ser v´alido α1 u(a) + α2 u0 (a) = 0 ,

(12.52)

β1 u(b) + β2 u0 (b) = 0 .

(12.53)

Se λ for um n´ umero tal que a equa¸ca˜o (12.51) seja satisfeita para alguma fun¸ca˜o u λ (que em geral depender´a de λ) ent˜ao diz-se que λ ´e um autovalor do Problema de Sturm-Liouville e u λ ´e dito ser a autofun¸ca ˜o associada ao autovalor λ do Problema de Sturm-Liouville. Essa nomenclatura surge por analogia com os conceitos de autovalor e autovetor de matrizes na a´lgebra linear. Muitos problemas de F´ısica envolvem a solu¸ca˜o de problemas de Sturm-Liouville. Fora isso, a solu¸ca˜o de problemas de Sturm-Liouville ´e u ´ til para a resolu¸ca˜o de equa¸co˜es n˜ao-homogˆeneas como Lu = f (x)

(12.54)

para uma fun¸ca˜o f dada, com condi¸co˜es de contorno como (12.52)-(12.53). A raz˜ao para isso reside no fato que, como veremos, a fun¸ca˜o de Green associada ao problema de Sturm Lu = f com condi¸co˜es de contorno como (12.52)-(12.53) pode ser escrita em termos das autofun¸co˜es e dos autovalores de um problema de Sturm-Liouville. Exemplo 12.1 No bem-conhecido problema da corda vibrante, descrevendo o movimento transversal de uma corda homogˆenea de densidade ρ > 0 e de comprimento L, estendida entre os pontos a e b = a + L e submetida a uma tens˜ao T > 0, temos que resolver a equa¸ca˜o de ondas s 2 T ∂ u ∂2u 2 , − c = 0 , c := ∂t2 ∂x2 ρ com x ∈ [a, b], t ∈ . Pelo m´etodo de separa¸ca˜o de vari´aveis (vide Se¸ca˜o 11.2, p´agina 587), procuramos ¨ + λc2 θ(t) = 0 e para y a equa¸ca˜o solu¸co˜es da forma u(x, t) = y(x)θ(t) e obtemos para θ a equa¸ca˜o θ(t) 

y 00 (x) + λy(x) = 0 ,

(12.55)

λ sendo uma constante de separa¸ca˜o. Se a corda estiver fixa em a e em b, devemos impor as condi¸co˜es de contorno y(a) = 0 e y(b) = 0. Esse problema de determinar a fun¸ca˜o y satisfazendo a equa¸ca˜o (12.55) e as condi¸co˜es de contorno acima ´e um problema de Sturm-Liouville com p(x) = 1, q(x) = 1, r(x) = 1, (α1 , α2 ) = (1, 0) e (β1 , β2 ) = (1, 0). No caso a = 0 e b = 0, obtem-se como solu¸co˜es desse problema de Sturm-Liouville as fun¸co˜es yn (x) = sen (nπx/L) com λn = (nπ/L)2 para todo n = 1, 2, 3, . . .. ◊

Exemplo 12.2 Na Mecˆanica Quˆantica, considere o problema de determinar a fun¸ca˜o de onda de uma part´ıcula de massa m movendo-se em uma dimens˜ao e constrita a um intervalo finito [a, b] ⊂ por barreiras infinitas de potencial em x ≤ a e x ≥ b e sujeita, no intervalo [a, b], a um potencial V (x). A equa¸ca˜o de Schr¨odinger independente do tempo ´e 

~2 d 2 ψ (x) − V (x)ψ(x) + Eψ(x) = 0 , 2m dx2 com x ∈ [a, b], sendo que, devido a`s barreiras infinitas de potencial, devemos impor as condi¸co˜es ~2 de contorno ψ(a) = 0 e ψ(b) = 0. Trata-se de um problema de Sturm-Liouville com p(x) = 2m , q(x) = −V (x), r(x) = 1, λ = E, (α1 , α2 ) = (1, 0) e (β1 , β2 ) = (1, 0). ◊

JCABarata. Curso de F´ısica-Matem´ atica

12.4

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

619/1304

Propriedades B´ asicas dos Autovalores e das Autofun¸ co ˜es de Problemas de Sturm-Liouville

´ bem sabido Seja C([a, b]) o conjunto das fun¸co˜es complexas cont´ınuas definidas no intervalo [a, b]. E que C([a, b]) ´e um espa¸co vetorial. Para cada α1 , α2 , β1 e β2 o espa¸co V(α1 , α2 , β1 , β2 ), definido a` p´agina 610, ´e um sub-espa¸co de C([a, b]). Um produto escalar complexo em um espa¸co vetorial complexo V ´e uma fun¸ca˜o V × V → , ou seja, uma fun¸ca˜o que associa pares de vetores a um n´ umero complexo, denotada por h·, ·i e de tal forma que os seguintes requerimentos sejam observados: 1. hx, xi ≥ 0 para todo x ∈ V . 2. hx, yi = hy, xi, para todos x, y ∈ V . 3. Se hx, xi = 0 ent˜ao x = 0, onde 0 ´e o vetor nulo. 4. Se a e b s˜ao n´ umeros complexos quaisquer ent˜ao hx, ay + bzi = ahx, yi + bhx, zi .

(12.56)

5. Se a e b s˜ao n´ umeros complexos quaisquer ent˜ao hax + by, zi = ahx, zi + bhy, zi .

(12.57)

Podemos dotar o espa¸co vetorial C([a, b]) de v´arios produtos escalares. Dois deles nos interessar˜ao aqui. Para f , g ∈ C([a, b]) definimos o produto escalar Z b hf, gi = f (x) g(x) dx , (12.58) a

e tamb´em o produto escalar hf, gir =

Z

b

f (x) g(x) r(x) dx ,

(12.59)

a

onde a fun¸ca˜o r ´e a fun¸ca˜o estritamente positiva caracterizada acima no problema de Sturm-Liouville.

12.4.1

Realidade dos Autovalores. Ortogonalidade de Autofun¸ co ˜es

Vamos aqui demonstrar duas propriedades b´asicas comuns a todos os problemas de Sturm-Liouville. A saber, vamos provar o seguinte teorema. Teorema 12.2 Os autovalores de um problema de Sturm-Liouville, como descrito acima s˜ ao sempre n´ umeros reais. Fora isso, se uλ1 e uλ2 s˜ ao duas autofun¸co ˜es associadas a dois autovalores distintos λ 1 e λ2 (λ1 6= λ2 ) ent˜ ao vale que Z b huλ1 , uλ2 ir = uλ1 (x) uλ2 (x) r(x) dx = 0 . (12.60) a

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

620/1304

Esta u ´ltima rela¸ca ˜o ´e chamada de rela¸ca ˜o de ortogonalidade (em rela¸ca ˜o ao produto escalar h·, ·i r ). 2 Para provar este teorema vamos antes demonstrar o seguinte lema: Lema 12.1 (Lema de Green) Sejam u e v duas fun¸co ˜es definidas em J = [a, b], que sejam pelo menos duas vezes diferenci´ aveis e tais que ambas satisfa¸cam condi¸co ˜es de contorno como (12.52)(12.53), ou seja, ambas s˜ ao elementos do espa¸co vetorial de fun¸co ˜es V(α 1 , α2 , β1 , β2 ) (p´ agina 610). Ent˜ ao, tem-se hv, Lui = hLv, ui, ou seja,

Z

b

v(x) (Lu)(x) dx = a

Z

b

(Lv)(x) u(x) dx .

(12.61)

a

2

Prova do Lema 12.1. Usando-se integra¸ca˜o por partes, tem-se Z b Z b Z b 0 0 v(x) (Lu)(x) dx = v(x)(p(x)u ) dx + v(x)q(x)u(x) dx a

a

= − =

=

Z

Z

a

Z

b

v 0 (x)(p(x)u0 ) a

b

u(pv 0 )0 a b a

dx +

dx +

b vpu0 |a



b vpu0 |a

+

b v 0 pu a

Z

+

b

v(x)q(x)u(x) dx a

Z

b

v(x)q(x)u(x) dx a

b b u(x) (Lv)(x) dx + vpu0 |a − v 0 pu a .

Agora, escrevendo-se explicitamente tem-se que b b vpu0 |a − v 0 pu a = p(b)v(b)u0 (b) − p(a)v(a)u0 (a) − p(b)v 0 (b)u(b) + p(a)v 0 (a)u(a)

    = p(b) v(b)u0 (b) − v 0 (b)u(b) − p(a) v(a)u0 (a) − v 0 (a)u(a) .

(12.62)

(12.63)

Vamos agora provar que os fatores entre parˆenteses em (12.63) s˜ao nulos. Como u e v satisfazem (12.52)-(12.53), tem-se           α1 0 β1 0 v(a) v 0 (a) v(b) v 0 (b)    =         . e = α2 0 β2 0 u(a) u0 (a) u(b) u0 (b)         α1 0 β1 0 Como 6= e 6= devemos ter α2 0 β2 0     v(a) v 0 (a) v(b) v 0 (b)  = 0  = 0, det  e det  0 0 u(a) u (a) u(b) u (b)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

621/1304

ou seja, v(a)u0 (a) − v 0 (a)u(a) = 0

v(b)u0 (b) − v 0 (b)u(b) = 0 .

e

O lado esquerdo de ambas as express˜oes s˜ao os termos entre parˆenteses de (12.63). Logo, b b vpu0 |a − v 0 pu a = 0.

Voltando a` (12.62), isso completa a demonstra¸ca˜o do Lema de Green. Vamos ent˜ao passar a`

Prova do Teorema 12.2. Para provar que os autovalores de um problema de Sturm-Liouville s˜ao reais, seja λ um autovalor e u a sua correspondente autofun¸ca˜o. Vamos mostrar que Z b (λ − λ) u(x) u(x) r(x) dx = 0 . (12.64) a

Rb Como u 6= 0 e r > 0 (por hip´otese), temos que a u u r(x) dx 6= 0. Portanto, (12.64) diz-nos que umero real. Para provar (12.64), notemos que λ − λ = 0, ou seja, que λ ´e um n´ Z b Z b Z b (λ − λ) u u r(x) dx = u (λu r(x)) dx − λur(x) u dx a

a

= −

a

Z

b

u (Lu) dx + a

Z

b

Lu u dx a

= 0,

(12.65)

pelo Lema de Green. Assim, completamos a demonstra¸ca˜o de que os autovalores de um problema de Sturm-Liouville s˜ao n´ umeros reais. Vamos agora provar a rela¸ca˜o de ortogonalidade (12.60). Para tal, vamos provar que Z b (λ1 − λ2 ) uλ1 (x) uλ2 (x) r(x) dx = 0 .

(12.66)

a

Como estamos supondo que λ1 6= λ2 , essa rela¸ca˜o diz ent˜ao que (12.60) deve ser verdadeira. Como λ1 e λ2 s˜ao reais, o lado esquerdo de (12.66) pode ser escrito como Z

b a

(λ1 r(x)uλ1 (x)) uλ2 (x) dx −

Z

b

uλ1 (x) (λ2 r(x)uλ2 (x)) dx a

= −

Z

b

(Luλ1 (x)) uλ2 (x) dx + a

Z

b

uλ1 (x) (Luλ2 (x)) dx = 0 , (12.67) a

pelo Lema de Green. A prova do Teorema 12.2 est´a ent˜ao completa. O que vimos no Teorema 12.2 ´e que autofun¸co˜es associadas a autovalores distintos de um problema de Sturm-Liouville s˜ao ortogonais entre si em rela¸ca˜o ao produto escalar definido em (12.59). O Lema de Green afirma que L ´e um operador sim´etrico em rela¸ca˜o ao produto escalar definido em (12.58) quando age em vetores do sub-espa¸co V(α1 , α2 , β1 , β2 ).

JCABarata. Curso de F´ısica-Matem´ atica

12.4.2

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

622/1304

A Simplicidade dos Autovalores

Se u1 , u2 ∈ V(α1 , α2 , β1 , β2 ) s˜ao duas autofun¸co˜es de um problema de Sturm-Liouville regular com o mesmo autovalor λ, ou seja, Lu1 + λru1 = 0 e Lu2 + λru2 = 0, ent˜ao ´e f´acil verificar que qualquer combina¸ca˜o linear a1 u1 +a2 u2 ´e tamb´em um elemento de V(α1 , α2 , β1 , β2 ) e ´e tamb´em uma autofun¸ca˜o com autovalor λ: L(a1 u1 +a2 u2 )+λr(a1 u1 +a2 u2 ) = 0. Em outras palavras, o conjunto das autofun¸co˜es de um um problema de Sturm-Liouville com um mesmo autovalor ´e um espa¸co vetorial. Uma quest˜ao importante sobre problemas de autovalores, como o de Sturm-Liouville, ´e a quest˜ao da multiplicidade dos autovalores, ou seja, a quest˜ao de saber, dado um autovalor λ, qual a dimens˜ao do espa¸co vetorial de todas as suas autofun¸co˜es. No problema de Sturm-Liouville regular a resposta ´e simples. A dimens˜ao ´e sempre igual a 1, ou seja, os autovalores s˜ao simples. A demonstra¸ca˜o ´e a seguinte. Sejam u1 , u2 ∈ V(α1 , α2 , β1 , β2 ) tais que Lu1 + λru1 = 0 e Lu2 + λru2 = 0 para um dado λ. Considere-se a fun¸ca˜o   u1 (x) u01 (x)  = u1 (x)u02 (x) − u01 (x)u2 (x) . W12 (x) = det  u2 (x) u02 (x)

Vamos em primeiro lugar mostrar que p(x)W12 (x) ´e constante no intervalo [a, b], ou seja, que (pW12 )0 = 0. De fato, (pW12 )0 = p0 W12 + pW012 = p0 (u1 u02 − u01 u2 ) + p (u1 u02 − u01 u2 )0 = p0 (u1 u02 − u01 u2 ) + p (u01 u02 + u1 u002 − u001 u2 − u01 u02 ) = p0 (u1 u02 − u01 u2 ) + p (u1 u002 − u001 u2 ) = u1 (p0 u02 + pu002 ) − u2 (p0 u01 + pu001 ) = u1 (pu02 )0 − u2 (pu01 )0 = −u1 (qu2 + λru2 ) + u2 (qu1 + λru1 ) = 0.

(12.68)

Vamos agora mostrar que W12 (b) = 0. Como acabamos de ver que p(x)W12 (x) ´e constante, isso implica p(x)W12 (x) = 0 para todo x ∈ [a, b].

7

Como as fun¸co˜es u1 e u2 s˜ao elementos de V(α1 , α2 , β1 , β2 ), temos em x = b7      0 β1 u1 (b) u01 (b)   =   .  0 u2 (b) u02 (b) β2 Um argumento an´ alogo funciona tamb´em em x = a.

JCABarata. Curso de F´ısica-Matem´ atica     β1 0 Agora, como 6= , segue que β2 0



det 

ou seja, W12 (b) = 0.

Vers˜ ao de 29 de setembro de 2005.

u1 (b)

u01 (b)

u2 (b)

u02 (b)

Cap´ıtulo 12

623/1304



 = 0,

Pelo que acabamos de provar, p(x)W12 (x) = 0 para todo x ∈ [a, b]. Como p ´e estritamente positiva, segue que W12 (x) = 0 para todo x ∈ [a, b], ou seja,   u1 (x) u01 (x)  = 0, det  0 u2 (x) u2 (x)

para todo x ∈ [a, b]. Isso diz que as duas linhas que formam a matriz acima s˜ao, para cada x ∈ [a, b], proporcionais uma a outra, ou seja, existe γ(x) tal que, por exemplo, u1 (x) = γ(x)u2 (x)

e

u01 (x) = γ(x)u02 (x)

para cada x ∈ [a, b]. Derivando a primeira e comparando a` segunda, conclui-se que γ(x) ´e constante, ou seja, n˜ao depende de x. Assim, verificamos que as fun¸co˜es u1 e u2 s˜ao m´ ultiplas entre si. Com isso, mostramos que se tivermos duas autofun¸co˜es com o mesmo autovalor as autofun¸co˜es s˜ao m´ ultiplas uma da outra e o subespa¸co que ambas geram tem dimens˜ao 1. Em resumo, autovalores de problemas de Sturm-Liouville regular s˜ao sempre simples, ou n˜ao-degenerados.

12.4.3

Condi¸ co ˜es Suficientes para a Positividade dos Autovalores

Em muitas aplica¸co˜es de interesse f´ısico ocorre que os autovalores s˜ao (ou precisam ser) n´ umeros positivos. Vamos apresentar agora um conjunto de condi¸co˜es que s˜ao suficientes para garantir isso. Proposi¸ c˜ ao 12.2 Se forem simultaneamente v´ alidas as condi¸co ˜es 1. q(x) ≤ 0 para todo x ∈ [a, b], 2. α1 α2 ≤ 0, 3. β1 β2 ≥ 0, ent˜ ao todos os autovalores λ do problema de Sturm-Liouville correspondente s˜ ao estritamente positivos: λ > 0. 2 Prova. A demonstra¸ca˜o ´e um tanto indireta. Seja u uma autofun¸ca˜o com autovalor λ, ou seja, (pu0 )0 + qu + λru = 0 .

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

Multiplicando-se essa igualdade por u e integrando-se entre a e b, tem-se Z b Z b Z b 0 0 2 u(x)(pu ) (x) dx − λ |u(x)|2 q(x) dx . |u(x)| r(x) dx = − a

624/1304

(12.69)

a

a

Vamos agora integrar por partes a primeira integral do lado direito. Temos, Z b b Z b 0 0 0 |u0 (x)|2 p(x) dx . u(x)(pu ) (x) dx = u(x)(pu )(x) − a

a

a

Substituindo em (12.69), tem-se Z b Z b h i  0 2 2 2 0 0 |u (x)| p(x) − |u(x)| q(x) dx + p(a)u(a)u (a) − p(b)u(b)u (b) . (12.70) |u(x)| r(x) dx = λ a

a

As trˆes integrais acima s˜ao n´ umeros reais. Portanto, vale, tomando-se a parte real da express˜ao, Z b Z b h    i  2 |u0 (x)|2 p(x) − |u(x)|2 q(x) dx+ p(a) Re u(a)u0 (a) − p(b) Re u(b)u0 (b) |u(x)| r(x) dx = λ . a

a

(12.71)

No ponto a u satisfaz α1 u(a) + α2 u0 (a) = 0. Multiplicando-se essa express˜ao pelo seu complexo conjugado, tem-se   α12 |u(a)|2 + α22 |u0 (a)|2 + 2α1 α2 Re u(a)u0 (a) = 0 , ou seja,



0

2α1 α2 Re u(a)u (a) Analogamente, para o ponto b,



 = − α12 |u(a)|2 + α22 |u0 (a)|2 .

   2β1 β2 Re u(b)u0 (b) = − β12 |u(b)|2 + β22 |u0 (b)|2 .

(12.72)

(12.73)

Consideremos agora que α1 α2 < 0 e β1 β2 > 0.

  A express˜ao (12.72) nos ensina que α1 α2 e Re u(a)u0 (a) tˆem sinais opostos e (12.73) que β1 β2   e Re u(b)u0 (b) tˆem sinais opostos. Assim, se tivermos q(x) ≤ 0 para todo x ∈ [a, b], α1 α2 < 0 e Rb β1 β2 > 0 a soma do lado direito de (12.71) ser´a estritamente positiva. Como a |u(x)|2 r(x) dx > 0, j´a que r ´e tamb´em por hip´otese estritamente positiva, segue de (12.71) que λ > 0. Se α1 α2 = 0, ent˜ao u(a)u0 (a) = 0 (por que?). Assim, se adicionalmente tivermos q(x) ≤ 0 para todo x ∈ [a, b] e β1 β2 > 0, ent˜ao a soma do lado direito de (12.71) ser´a estritamente positiva, o que implica λ > 0.

Analogamente, se β1 β2 = 0, ent˜ao u(b)u0 (b) = 0 (por que?). Assim, se adicionalmente tivermos q(x) ≤ 0 para todo x ∈ [a, b] e α1 α2 < 0, ent˜ao teremos novamente λ > 0. Por fim, se α1 α2 = 0 e β1 β2 = 0, ent˜ao u(a)u0 (a) = 0 e u(b)u0 (b) = 0. Assim, com q(x) ≤ 0 para todo x ∈ [a, b] teremos novamente λ > 0. • Coment´ ario sobre autovalores negativos

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

625/1304

´ importante dizer aqui que existem problemas de Sturm-Liouville regulares onde ocorrem autoE valores negativos (vide exerc´ıcio-exemplo abaixo). No Teorema 12.3, p´agina 626, mostraremos que apesar de ser poss´ıvel a existˆencia de autovalores negativos, os mesmos n˜ao podem ser arbitrariamente negativos, ou seja, negativos mas com m´odulo |λ| arbitrariamente grande. Provaremos que existe uma constante M tal que λ ≥ M . A constante M pode ser positiva, negativa ou nula. Em verdade, em um problema de Sturm-Liouville regular pode ocorrer no m´aximo um n´ umero finito de autovalores negativos. • Um Exemplo E. 12.13 Exerc´ıcio-exemplo. Seja o problema de Sturm-Liouville u 00 + λu = 0, no intervalo [0, 1], com as condi¸co˜es de contorno u(0) = 0 e β1 u(1) + β2 u0 (1) = 0. Aqui p(x) = 1, q(x) = 0, r(x) = 1, α1 = 1 e α2 = 0. A identidade (12.71) fica Z 1 Z 1   2 |u0 (x)|2 dx − Re u(1)u0 (1) . |u(x)| dx = λ

(12.74)

0

0

Caso β1 = 0, teremos u0 (1) = 0. Caso β2 = 0, teremos u(1) = 0. Nesses dois casos, (12.74) fica λ

Z

0

1 2

|u(x)| dx =

Z

1 0

|u0 (x)|2 dx ,

que garante que λ > 0. No caso em que β1 e β2 s˜ao n˜ao-nulos, (12.73) diz-nos que Z 1 Z 1  1 2 β12 |u(1)|2 + β22 |u0 (1)|2 . λ |u(x)| dx = |u0 (x)|2 dx + 2β1 β2 0 0

(12.75)

Como se vˆe, se β1 β2 > 0 tem-se λ > 0, mas se β1 β2 < 0 poderemos ter autovalores negativos. Abaixo (item f), veremos que isso de fato ocorre caso −β12 < β2 β1 < 0. a. No caso β1 = 0 mostre que os autovalores s˜ao λn = (n + 12 )2 π 2 , n = 0, 1, 2, . . .. b. No caso β2 = 0 mostre que os autovalores s˜ao λn = n2 π 2 , n = 1, 2, 3, . . .. c. Determine as autofun¸co˜es normalizadas nessas duas situa¸co˜es. d. No caso em que β1 e β2 s˜ao n˜ao-nulos mostre que os autovalores positivos s˜ao as (infinitas!) solu¸co˜es positivas de √ √ β1 λ = − tan( λ) . β2 Mostre graficamente que essa equa¸c˜ao tem infinitas solu¸co˜es positivas quer

β1 β2

> 0 ou quer

β1 β2

< 0.

e. Para o caso β1 = −β2 mostre que tamb´em ocorre o autovalor λ = 0, cuja autofun¸c˜ao ´e u(x) = αx, α sendo uma constante arbitr´aria n˜ao nula.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

626/1304

f. Mostre que se 0 < − ββ21 < 1, ou seja, se −β12 < β2 β1 < 0, ocorre tamb´em um (´unico!) autovalor negativo, o qual ´e solu¸c˜ao de √ √ β1 −λ = − tanh( −λ) . β2 Mostre graficamente que essa equa¸c˜ao n˜ao tem solu¸c˜ao n˜ao-nula caso 0 > − ββ21 ou caso − ββ21 > 1. g. Reunindo os resultados obtidos, indique no plano Cartesiano (β 1 , β2 ) a regi˜ao onde os autovalores s˜ao estritamente positivos, a regi˜ao onde ocorre o autovalor zero e a regi˜ao onde ocorrem tamb´em autovalores negativos al´em dos autovalores positivos. 6 • Um Limite Inferior para os Autovalores Ainda sobre os autovalores de problemas de Sturm-Liouville regulares, o seguinte teorema pode ser demonstrado. Teorema 12.3 Seja o problema de Sturm-Liouville (regular) definido pela equa¸ca ˜o Lu + λ r(x)u = 0, onde p, q e r s˜ ao fun¸co ˜es reais definidas em [a, b], tais que p ´e cont´ınua, diferenci´ avel e estritamente positiva em [a, b], ou seja, p(x) > 0 para todo x ∈ [a, b]; q ´e cont´ınua em [a, b]; r ´e cont´ınua e estritamente positiva em [a, b], ou seja, r(x) > 0 para todo x ∈ [a, b]; com as condi¸co ˜es de contorno α1 u(a) + α2 u0 (a) = 0 ,

β1 u(b) + β2 u0 (b) = 0

para (α1 , α2 ) 6= (0, 0), (β1 , β2 ) 6= (0, 0).

Ent˜ ao existe uma constante M , que depende (em geral de forma muito complicada) das fun¸co ˜es p, q e r e das constante α1, 2 e β1, 2 , tal que todos os autovalores λ satisfazem λ ≥ M. 2 A constante M pode ser positiva, negativa ou nula. O que esse teorema diz ´e que existe um limitante inferior para os autovalores de um problema de Sturm-Liouville, ou seja, os mesmos podem at´e ser eventualmente negativos, mas n˜ao arbitrariamente negativos. A demonstra¸ca˜o 8 desse teorema ´e apresentada no Apˆendice 12.E, p´agina 648. 8

Essa demonstra¸ca ˜o pode ser omitida numa primeira leitura.

JCABarata. Curso de F´ısica-Matem´ atica

12.5

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

627/1304

A Equa¸ c˜ ao Integral de Fredholm

Um dos passos mais u ´ teis para se estudar um problema de Sturm-Liouville consiste em transform´a-lo em uma equa¸ca˜o integral. Como veremos, isso pode ser feito caso 0 n˜ao seja um poss´ıvel autovalor. Considere o problema de Sturm-Liouville de determinar as solu¸co˜es de Lu = −λ r(x) u,

(12.76)

que satisfa¸cam as condi¸co˜es de contorno (12.52)-(12.53). Se λ = 0 n˜ao for um autovalor desse problema, ou seja, se Lu = 0 com as condi¸co˜es de contorno (12.52)-(12.53) possuir apenas a solu¸ca˜o trivial u = 0, ent˜ao o problema de Sturm Lu = f com as condi¸co˜es de contorno (12.52)-(12.53) possui solu¸ca˜o u ´ nica. Isso ´e elementar de se ver, pois se u1 e u2 s˜ao duas solu¸co˜es, ent˜ao L(u1 − u2 ) = 0, sendo que u1 − u2 obviamente satisfaz (12.52)-(12.53). Pelo pressuposto, u1 − u2 = 0. Z b Agora, pelo Teorema de Green, u(x) = G(x, y) f (y)dy ´e solu¸ca˜o de Lu = f com as condi¸co˜es a

de contorno (12.52)-(12.53) e, portanto, essa ´e a u ´ nica solu¸ca˜o. Assim sob a hip´otese que λ = 0 n˜ao ´e um autovalor do problema de Sturm-Liouville, todaZ fun¸ca˜o u que satisfaz Lu = f com as condi¸co˜es de b

contorno (12.52)-(12.53) satisfaz tamb´em u(x) =

G(x, y) f (y)dy para qualquer que seja a fun¸ca ˜o

a

cont´ınua f .

Disso conclu´ımos que a fun¸ca˜o u que satisfaz a equa¸ca˜o diferencial (12.76) satisfaz tamb´em Z b u(x) = −λ G(x, y) r(y) u(y) dy , (12.77) a

isto ´e, definindo-se

para x, y ∈ [a, b], vale

k(x, y) := −G(x, y) r(y) u(x) = λ

Z

(12.78)

b

k(x, y) u(y) dy .

(12.79)

a

Uma equa¸ca˜o como esta onde a fun¸ca˜o k(x, y) ´e cont´ınua em um intervalo fechado ´e conhecida como Equa¸ca ˜o Integral de Fredholm linear homogˆenea, ou simplesmente Equa¸ca ˜o Integral de Fredholm 9 . O estudo da equa¸ca˜o integral de Fredholm ´e um dos cap´ıtulos importantes da An´alise Funcional e da Teoria das Equa¸co˜es Integrais. Iremos agora tratar apenas de aspectos b´asicos da mesma que mais diretamente nos interessam. O m´etodo dos determinantes de Fredholm para a solu¸ca˜o de equa¸co˜es integrais de Fredholm homogˆeneas e n˜ao-homogˆeneas ser´a apresentado com certo detalhe na Se¸ca˜o 12.7, p´agina 634. O leitor poder´a encontrar mais material sobre a equa¸ca˜o integral de Fredholm n˜aolinear na Se¸ca˜o 17.2, p´agina 889, assim como na Se¸ca˜o 26.6, p´agina 1202, para o caso linear. Alguns poucos coment´arios hist´oricos podem ser encontrados a` p´agina 640. Seja o espa¸co vetorial C(J) introduzido acima, de todas as fun¸co˜es cont´ınuas definidas no intervalo J = [a, b]. Podemos ent˜ao, com o aux´ılio da fun¸ca˜o k(x, y) dada em (12.78), definir em C(J) um operador linear K dado por Z b

k(x, y) f (y) dy .

(Kf )(x) :=

a

9

Erik Ivar Fredholm (1866-1927).

(12.80)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

628/1304

x ∈ J. O operador K ´e denominado operador de Fredholm. A equa¸ca˜o (12.79) diz-nos ent˜ao que 1 u. λ

Ku =

(12.81)

A respeito desse operador K podemos provar o seguinte resultado. Tomando-se em C(J) o produto escalar h·, ·ir definido acima, temos hf, Kgir = hKf, gir

(12.82)

para todo f , g ∈ C(J). E. 12.14 Exerc´ıcio. Mostre esse fato. Para isso use que a fun¸c˜ao de Green satisfaz G(x, y) = G(y, x). 6 Um operador linear que satisfaz uma rela¸ca˜o como (12.82) ´e dito ser um operador sim´etrico ou Hermiteano, um conceito de grande importˆancia em F´ısica e Matem´atica. O operador K ´e ent˜ao um operador sim´etrico em rela¸ca˜o ao produto escalar h·, ·ir . Se A ´e um operador linear agindo em um espa¸co vetorial complexo V , dizemos que um vetor umero (real ou complexo) α tal que n˜ao-nulo x ´e um autovetor de A se houver um n´ Ax = α x.

(12.83)

O n´ umero α ´e dito ser um autovalor de A e x o autovetor associado a α. O conjunto de todos os autovalores de um operador linear A ´e chamado de espectro pontual10 de A. Um fato importante sobre operadores sim´etricos ´e o seguinte: se α ´e um autovalor de um operador sim´etrico A que age em um espa¸co vetorial complexo V , ent˜ao α ´e um n´ umero real. Para ver isso note que se x ´e o autovetor associado a α ent˜ao temos que, como A ´e sim´etrico 0 = hx, Axi − hAx, xi = λhx, xi − λhx, xi = (λ − λ)hx, xi . Como x 6= 0, isso implica λ = λ, ou seja, λ ´e real.

O fato de o operador de Fredholm K ser sim´etrico significa que seus autovalores s˜ao n´ umeros reais. Note-se que a equa¸ca˜o de Fredholm (12.81) ´e precisamente uma equa¸ca˜o de autovalores, o autovalor sendo, nesse caso, o n´ umero 1/λ. O que provamos acima diz-nos ent˜ao que λ dever ser um n´ umero real, uma outra demonstra¸ca˜o de um fato que j´a sab´ıamos. O seguinte teorema pode ser demonstrado sobre o operador de Fredholm associado a um problema de Sturm-Liouville: Teorema 12.4 Seja K o operador de Fredholm associado a um problema de Sturm-Liouville, que supomos n˜ ao admitir autovalor nulo. Ent˜ ao K ´e um operador cont´ınuo. Seus autovalores formam um conjunto discreto (ou seja, cont´ avel) {αn ∈ , n ∈ }. Os valores da seq¨ uˆencia dos αn s˜ ao limitados (n˜ ao divergem para ±∞), apenas um n´ umero finito deles pode ser negativo e eles se acumulam apenas 

10



O conceito geral de espectro de operadores definidos em espa¸cos de Banach ´e detalhadamente discutido na Se¸ca ˜o 26.5, p´ agina 1193.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

629/1304

1 = +∞. Al´em disso, os autovalores αn s˜ ao simples: existe para n→∞ αn cada autovalor αn apenas uma autofun¸ca ˜o un tal que no ponto 0. Assim, tem-se que lim

K u n = α n un .

(12.84)

Denotemos por Hr o espa¸co de Hilbert de todas as fun¸co ˜es em J = [a, b] tais que Z

b a

|f (x)|2 r(x) dx < ∞.

(12.85)

Nesse espa¸co de Hilbert o produto escalar considerado ´e o produto escalar h·, ·i r definido acima. Vamos supor que as autofun¸co ˜es un s˜ ao normalizadas, ou seja, satisfazem hun , un ir = 1. Ent˜ ao o conjunto das autofun¸co ˜es normalizadas un de K forma uma base ortonormal completa em Hr , ou seja, todo vetor f ∈ Hr pode ser escrito como f = lim

N →∞

N X

onde cn := hun , f ir = Mais precisamente, vale

lim

N →∞

*

f−

N X n=1

c n un

!

,

f−

N X n=1

cn un =:

n=1

c n un

∞ X

c n un ,

(12.86)

n=1

Z

!+

b

un (x) f (x) r(x) dx .

(12.87)

a

r

2 Z b N X = lim cn un (x) r(x) dx = 0 . (12.88) f (x) − N →∞ a n=1 2

A demonstra¸ca˜o deste teorema ´e elaborada e ser´a apresentada ao longo da Se¸ca˜o 26.6, p´agina 1202, do Cap´ıtulo 26. O que faremos ´e mostrar que o operador de Fredholm K ´e um operador compacto e auto-adjunto e para tais operadores valem as propriedades espectrais mencionadas acima. A afirma¸ca˜o (12.86)-(12.88), por exemplo, ´e parte do chamado Teorema Espectral, o qual vale para operadores compactos e auto-adjuntos, como mostrado no Teorema 26.29 da p´agina 1219. Notemos algumas conseq¨ uˆencias do teorema acima. Como os autovalores de um problema de SturmLiouville regular λn s˜ao da forma λn = 1/αn , onde αn ´e um autovalor de K, o teorema acima diz-nos que podemos ordenar os λn ’s em ordem crescente: −∞ < λ1 < λ2 < λ3 < · · ·

(12.89)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

630/1304

com lim λn = +∞. Uma segunda conseq¨ uˆencia de importˆancia relaciona o problema de Sturmn→∞ Liouville com a fun¸ca˜o de Green. Seja u um vetor arbitr´ario de Hr . Como dissemos, podemos escrever N

u = lim uN , onde uN = Σ cn un , onde os cn ’s s˜ao dados por (12.87). Como K ´e cont´ınuo, temos que N →∞

n=1

(Ku)(x) =

=

=

lim (KuN )(x) =

N →∞

lim

N →∞

lim

N →∞

N X

cn (Kun )(x)

n=1

N X n=1

cn

1 un (x) λn

Z b  N X 1 = lim un (y)u(y)r(y) dy un (x) N →∞ λn a n=1 =

Z

b

r(y) a

lim

N →∞

N X un (x)un (y) n=1

Por outro lado sabemos que, pela defini¸ca˜o, (Ku)(x) = − valem para qualquer u ∈ Hr , conclu´ımos que G(x, y) = −

λn

Rb a

u(y) dy .

(12.90)

G(x, y)r(y) u(y). Como ambas rela¸co˜es

∞ X un (x)un (y) n=1

!

λn

.

(12.91)

´ poss´ıvel demonstrar, o que n˜ao faremos aqui, que a soma do lado direito da u E ´ ltima express˜ao ´e absoluta e uniformemente convergente. A rela¸ca˜o (12.91), que ´e por vezes chamada f´ormula de Mercer 11 , mostra que a fun¸ca˜o de Green de um problema de Sturm pode ser escrita como uma expans˜ao envolvendo autovalores e autofun¸co˜es de um problema de Sturm-Liouville. Esse fato ´e relevante tanto na pr´atica da resolu¸ca˜o de equa¸co˜es diferenciais quanto na obten¸ca˜o de resultados qualitativos sobre a natureza das solu¸co˜es. Estudaremos adiante algumas dessas aplica¸co˜es.

12.6

Uma Aplica¸ c˜ ao do Problema de Sturm-Liouville

Vamos aqui tratar do problema de encontrar as solu¸co˜es da equa¸ca˜o diferencial n˜ao-homogˆenea Lu + γr(x)u = f (x) ,

(12.92)

onde a solu¸ca˜o u est´a ainda sujeita a`s condi¸co˜es de contorno homogˆeneas (12.52)-(12.53). Acima, o operador L ´e definido como anteriormente e assumimos para as fun¸co˜es p, q e r as mesmas condi¸co˜es 11

T. Mercer. “Functions of positive type and their connection with the theory of integral equations”. Transactions London Phil. Soc. (A) 209, 415-446 (1909).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

631/1304

mencionadas no in´ıcio do presente cap´ıtulo. A fun¸ca˜o f ser´a assumida uma fun¸ca˜o real e cont´ınua e γ um n´ umero real dado. Como veremos, a solu¸ca˜o pode ser obtida com uso das autofun¸co˜es e autovalores do problema de Sturm-Liouville Lu + λr(x)u = 0 com condi¸co˜es de contorno homogˆeneas do tipo (12.4)-(12.5). Chamaremos esse problema de problema de Sturm-Liouville associado (ao problema (12.92)). Novamente suporemos que o problema de SturmLiouville associado n˜ao tem solu¸ca˜o com autovalor λ = 0. Com o uso da representa¸ca˜o da fun¸ca˜o de Green em termos dos autovalores e autofun¸co˜es do problema de Sturm-Liouville associado (f´ormula de Mercer, (12.91)), vamos mostrar como podemos encontrar uma express˜ao para a solu¸ca˜o desse problema. A equa¸ca˜o diferencial (12.92) pode ser escrita como Lu = −γr(x)u + f .

(12.93)

Usando, como fizemos anteriormente, o Teorema de Green, podemos dizer que a fun¸ca˜o u(x) que satisfaz esta equa¸ca˜o diferencial satisfaz tamb´em a equa¸ca˜o integral Z b Z b u(x) = −γ G(x, y)r(y)u(y) dy + G(x, y)f (y) dy . (12.94) a

a

Definamos

g(x) :=

Z

b

G(x, y)f (y) dy .

(12.95)

a

Usando a f´ormula de Mercer para a fun¸ca˜o de Green, podemos escrever (12.94) como u(x) = γ

∞ X hun , uir un (x) + g(x) . λ n n=1

E. 12.15 Exerc´ıcio. Mostre isso.

(12.96)

6

Tomando-se o produto escalar de ambos os lados da igualdade com o vetor um , tiramos que   γ hum , uir = hum , gir . (12.97) 1− λm Aplicando agora a f´ormula de Mercer a` defini¸ca˜o de g em (12.95), tiramos que Z b  ∞ X 1 g(x) = − un (y) f (y) dy un (x) , λ a n=1 n

e, portanto, que

1 hum , gir = − λm ou seja,

Z

(12.98)

b

um (y) f (y) dy ,

(12.99)

a

hum , gir = −

1 hum , f i . λm

(12.100)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

E. 12.16 Exerc´ıcio. Mostre esses dois u ´ltimos resultados.

632/1304

6

At´e agora n˜ao fizemos quaisquer restri¸co˜es a respeito da constante γ que aparece na equa¸ca˜o diferencial n˜ao-homogˆenea (12.92). H´a dois casos a supor. Aquele em que γ n˜ao ´e igual a nenhum autovalor λm do problema de Sturm-Liouville associado e aquele caso em que γ = λs , para algum autovalor λs do problema de Sturm-Liouville associado. Caso I. γ n˜ao ´e um autovalor. Nesse caso as rela¸co˜es (12.97) e (12.99) dizem-nos que 1 hum , uir = γ − λm

Z

b

um (y) f (y) dy

(12.101)

a

e, portanto, temos que u(x) =

∞  X

m=1

1 γ − λm

Z

b

um (y) f (y) dy a



um (x) .

(12.102)

Esta f´ormula d´a-nos a solu¸ca˜o do problema em termos das autofun¸co˜es e autovalores do problema do Sturm-Liouville associado e mostra-nos uma das raz˜oes que tornam importante a solu¸ca˜o do mesmo problema de Sturm-Liouville. A s´erie do lado direito converge absoluta e uniformemente em J. Caso II. γ = λs para algum s. Neste caso o problema tratado nem sempre tem solu¸co˜es. Para ver isso, note que, supondo-se a existˆencia de uma solu¸ca˜o, a rela¸ca˜o (12.97) diz-nos neste caso que hu s , gir = 0, ou seja, por (12.100) hum , f i =

Z

b

us (y) f (y) dy = 0 .

(12.103)

a

Caso a fun¸ca˜o f seja tal que (12.103) n˜ao ´e satisfeita, ent˜ao nenhuma solu¸ca˜o ´e poss´ıvel para o problema tratado. Se f , por´em, for tal que (12.103) seja v´alida, teremos que a fun¸ca˜o u ˆ dada por u ˆ(x) =

∞  X m=1 m6=s

1 γ − λm

Z

b

um (y) f (y) dy a



um (x)

(12.104)

´e uma solu¸ca˜o do problema tratado. E. 12.17 Exerc´ıcio. Prove esta u ´ltima afirmativa seguindo passos semelhantes aos do caso I.

6

A solu¸ca˜o mais geral, por´em, ´e dada por u(x) = cus (x) + uˆ(x) ,

(12.105)

onde c ´e uma constante arbitr´aria, a ser determinada por alguma imposi¸ca˜o adicional qualquer a ser feita ao problema.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

633/1304

E. 12.18 Exerc´ıcio. Mostre que esta fun¸c˜ao u ´e de fato uma solu¸c˜ao (substitua na equa¸c˜ao (12.92) e verifique tamb´em se as condi¸co˜es de contorno s˜ao satisfeitas). Mostre que n˜ao pode haver solu¸c˜ao mais geral que esta. Para isso use o fato que o autovalor λs ´e simples. 6 • O caso de condi¸ co ˜es de contorno n˜ ao-homogˆ eneas Vamos aqui discutir brevemente uma generaliza¸ca˜o do problema anterior. Procuramos uma solu¸ca˜o da equa¸ca˜o diferencial n˜ao-homogˆenea Lu + γr(x)u = f (x) ,

(12.106)

onde a solu¸ca˜o u est´a ainda sujeita a`s condi¸co˜es de contorno n˜ao-homogˆeneas (12.2)-(12.3). Acima, o operador L ´e definido como anteriormente e assumimos para as fun¸co˜es p, q e r as mesmas condi¸co˜es mencionadas no in´ıcio destas notas. A fun¸ca˜o f ser´a assumida ser uma fun¸ca˜o real e cont´ınua e γ ser´a assumido ser um n´ umero real dado. Esse problema pode ser resolvido combinando m´etodos que j´a discutimos. Em primeiro lugar constr´oi-se uma fun¸ca˜o w que seja duas vezes diferenci´avel e satisfa¸ca as condi¸co˜es n˜ao-homogˆeneas (12.2)-(12.3). Procura-se ent˜ao uma supostamente existente solu¸ca˜o v da equa¸ca˜o Lv + γr(x)v = h(x) ,

(12.107)

com h(x) = f (x) − (L + γr(x))w(x) ,

que satisfa¸ca as condi¸co˜es de contorno homogˆeneas (12.4)-(12.5). Uma tal solu¸ca˜o pode ser obtida pelos m´etodos da Se¸ca˜o 12.6, p´agina 630. ´ claro, ent˜ao, que u = v + w satisfar´a E Lu + γr(x)u = f (x)

(12.108)

e as condi¸co˜es de contorno n˜ao-homogˆeneas (12.2)-(12.3). Como vimos, para a solu¸ca˜o v exista ´e necess´ario que γ n˜ao seja um autovalor do problema de Sturm-Liouville associado. Caso γ seja um autovalor, s´o teremos solu¸ca˜o se hu γ , hi = 0, ou seja, huγ , f i = huγ , (L + γr)wi .

(12.109)

Vale observar que huγ , (L + γr)wi = huγ , Lwi + hγruγ , wi = huγ , Lwi − hLuγ , wi . Note que o lado direito n˜ao ´e for¸cosamente zero, pois aqui o Lema de Green n˜ao se aplica, j´a que w n˜ao ´e elemento do espa¸co vetorial V(α1 , α2 , β1 , β2 ) das fun¸co˜es que satisfazem as condi¸co˜es de contorno homogˆeneas (12.4)-(12.5). A condi¸ca˜o (12.109) fica, ent˜ao, huγ , f i = huγ , Lwi − hLuγ , wi . Nesse caso de γ ser um autovalor podemos, como j´a observamos, acrescentar a` solu¸ca˜o u ˆ um m´ ultiplo da autofun¸ca˜o uγ , obtendo a solu¸ca˜o mais geral na forma cuγ (x) + u ˆ(x).

JCABarata. Curso de F´ısica-Matem´ atica

12.7

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

634/1304

O M´ etodo dos Determinantes de Fredholm

Vamos nesta se¸ca˜o apresentar a teoria de Fredholm para o tratamento das equa¸co˜es integrais de Fredholm. Historicamante, o trabalho de Fredholm precedeu o estudo de Hilbert daquelas equa¸co˜es integrais, trabalho esse que levou ao desenvolvimento da teorias dos espa¸cos de Hilbert e dos operadores compactos. Apesar de superado pelo de Hilbert, o tratamento de Fredholm ´e de interesse, pois envolve um m´etodo de solu¸ca˜o expl´ıcita das equa¸co˜es integrais de Fredholm em termos de uma s´erie envolvendo determinantes de certas matrizes constru´ıdas com o n´ ucleo k(x, y). Esses determinantes passaram a ser conhecidos como determinantes de Fredholm. Iniciaremos nossa exposi¸ca˜o considerando a equa¸ca˜o de integral de Fredholm linear n˜ao-homogˆenea.

12.7.1

A Equa¸ c˜ ao Integral de Fredholm Linear N˜ ao-Homogˆ enea

Consideremos a equa¸ca˜o integral de Fredholm linear e n˜ao-homogˆenea definida em um intervalo compacto [a, b] ⊂ Z b u(x) = f (x) + λ k(x, y) u(y) dy , (12.110) 

a

f : [a, b] → e k : [a, b] × [a, b] → equa¸ca ˜o integral.

sendo ambas cont´ınuas. A fun¸ca˜o k ´e denominada n´ ucleo da

Vamos supor que k seja da forma k(x, y) =

n X

al (x)bl (y), as fun¸co˜es al e bl sendo igualmente

l=1

cont´ınuas em [a, b]. A equa¸ca˜o (12.110) assume a forma u(x) = f (x) + λ

n X

al (x)hbl , ui ,

(12.111)

l=1

onde, para fun¸co˜es cont´ınuas g e h, definimos hg, hi :=

Rb a

g(y)h(y) dy.

Multiplicando a u ´ ltima express˜ao por bm (x) e integrando em [a, b], ficamos com hbm , ui = hbm , f i + λ ou seja, hbm , ui − λ

n X l=1

n X l=1

hbm , al ihbl , ui ,

hbm , al ihbl , ui = hbm , f i ,

que deve ser encarada como um sistema linear de equa¸co˜es para as quantidades hb j , ui. Isso talvez fique mais transparente definindo-se xj ≡ hbj , ui, yj ≡ hbj , f i e kij ≡ hbi , aj i, i, j = 1, . . . , n, com o que a equa¸ca˜o acima fica xm − λ

n X l=1

kml xl = ym ,

ou seja,

( − λk)x = y ,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

635/1304

 y1   x1  . sendo x = .. , y = ... e k sendo a matriz formada pelos elementos kij . A solu¸ca˜o dessa equa¸ca˜o yn

xn

em forma matricial ´e x = ( − λk)−1 y, caso a inversa de restri¸ca˜o para λ).

− λk exista (o que ser´a encarado como uma

Vamos agora cuidar de encontrar uma forma conveniente de expressar essa rela¸ca˜o com uso da regra de Laplace, express˜ao (3.8), p´agina 145, para o c´alculo de inversa de matrizes: para uma matriz invert´ıvel A vale  Men(A)ji , (12.112) A−1 ij = (−1)i+j det(A) onde Men(A)ij ´e o determinante da matriz (n − 1) × (n − 1) obtida eliminando-se a i-´esima linha e a j-´esima coluna da matriz A. (A matriz Men(A) ´e por vezes denominada matriz dos menores de A). Temos que assim que xi =

n  X j=1

( − λk)

−1



n

X 1 (−1)i+j yj Men( − λk)ji . yj = ij det( − λk) j=1

Por (12.111), a solu¸ca˜o u(x) ´e dada por u(x) = f (x) + λ n

n

Pn

l=1

al (x)xl e, assim,

XX λ u(x) = f (x) + (−1)l+j yj Men( − λk)jl al (x) . det( − λk) l=1 j=1 Portanto, u(x) = f (x) + λ onde

n

Kn (x, y; λ) :=

Z

b

Kn (x, y; λ)f (y) dy ,

(12.113)

a

n

XX 1 (−1)l+j bj (y)Men( − λk)jl al (x) . det( − λk) l=1 j=1

(12.114)

´ bastante claro pelas express˜oes acima que Kn (x, y; λ) ´e a raz˜ao de dois polinˆomios em λ. Mais E especificamente, vale para Kn (x, y; λ) a seguinte express˜ao Kn (x, y; λ) =  k(x, y) k(x, y1 ) · · · k(x, ym ) Z b Z n−1  k(y1 , y) k(y1 , y1 ) · · · k(y1 , ym )  X 1 (−λ)m b   det  ···  dy1 · · · dym , (12.115) .. .. .. det( − λk) m=0 m!   . . . a a k(ym , y) k(ym , y1 ) · · · k(ym , ym ) 

onde

det( − λk) =

n X

(−λ)m m! m=0

Z

b a

···

Z

a



 k(y1 , ym )  ..  dy1 · · · dym . . k(ym , y1 ) · · · k(ym , ym )

k(y1 , y1 ) · · · b  .. det  .

(12.116)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

636/1304

Os determinantes que aparecem nas duas express˜oes acima s˜ao denominados determinantes de Fredholm e as express˜oes acima s˜ao denominadas f´ ormulas dos determinantes de Fredholm, em honra a seu descobridor. Suas demonstra¸co˜es que, infelizmente, s˜ao bastante complexas, podem ser encontradas em toda sua gl´oria no Apˆendice 12.G, p´agina 654. Resumindo nossas conclus˜oes at´e aqui, vimos que a solu¸ca˜o da equa¸ca˜o de Fredholm linear n˜aon X homogˆenea (12.110) para n´ ucleos k na forma de uma soma finita k(x, y) = al (x)bl (y), as fun¸co˜es l=1

al e bl sendo cont´ınuas em [a, b], ´e dada por

u(x) = f (x) + λ

Z

b

Kn (x, y; λ)f (y) dy ,

(12.117)

a

com Kn definida em (12.115) e (12.116). A quest˜ao importante que se coloca agora ´e saber se podemos tomar o limite n → ∞ nas express˜oes ∞ X al (x)bl (y), supondo que essa acima, obtendo solu¸co˜es de (12.110) para n´ ucleos da forma k(x, y) = l=1

s´erie seja uniformemente convergente e que, como acima, as fun¸co˜es al e bl sejam todas cont´ınuas.

A resposta a essa quest˜ao ´e obtida primeiramente mostrando que, sob as hip´oteses acima, os limites n → ∞ de (12.115) e de (12.116) existem e, em seguida, provando que a express˜ao obtida tomando-se o limite n → ∞ no lado direito de (12.117) ´e, de fato, uma solu¸ca˜o da equa¸ca˜o (12.110). Para a prova de convergˆencia necessitamos de uma boa estimativa para o crescimento com n de determinantes de matrizes n × n e a estimativa que se faz u ´ til ´e a estimativa de Hadamard12 , equa¸ca˜o (3.93), enunciada no Teorema 3.27, p´agina 216: para toda matriz A ∈ Mat ( , n) vale  n n/2 . | det(A)| ≤ n max |Aij | ij

Como k(x, y) ´e cont´ınua em [a, b] × [a, b], por hip´otese, ent˜ao seu m´odulo possui um m´aximo k 0 ≥ 0. Com uso da estimativa de Hadamard, conclu´ımos de (12.116) que | det( − λk)| ≤

n X |(b − a)k0 λ|m m/2 m . m! m=0

Pelo crit´erio da raz˜ao, o limite n → ∞ convergir´a se |am+1 /am | < 1 para todo m grande o suficiente, m 0 λ| mm/2 . Agora, sendo am = |(b−a)k m!  1 m/2 am+1 1 + m am ≤ |(b − a)k0 λ| (m + 1)1/2 .

m √ 1 = e, o lado direito aproxima-se de |(b − a)k0 λ| (m+1)e 1/2 para m grande. Segue, Como lim 1 + m→∞ m portanto, que lim |am+1 /am | = 0 para todo λ ∈ . 

m→∞

12

Jacques Salomon Hadamard (1865-1963).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

637/1304

Conclu´ımos que, para todo λ ∈ , o limite lim det( − λk) existe e define uma fun¸ca˜o inteira (ou n→∞

seja, anal´ıtica em toda parte) de λ ∈ . Essa fun¸ca˜o ´e tradicionalmente denotada por D(λ):   k(y , y ) · · · k(y , y ) Z Z 1 1 1 m ∞ b X (−λ)m b   .. .. D(λ) := ··· (12.118) det   dy1 · · · dym . . . m! a a m=0 k(ym , y1 ) · · · k(ym , ym )

De forma totalmente an´aloga prova-se a convergˆencia absoluta para todo λ ∈ da soma do lado direito de (12.115). Assim,   k(x, y) k(x, y1 ) · · · k(x, ym ) Z b Z ∞  k(y1 , y) k(y1 , y1 ) · · · k(y1 , ym )  X (−λ)m b   det  ··· D(x, y; λ) :=  dy1 · · · dym , .. .. ..   m! . . . a a m=0 k(ym , y) k(ym , y1 ) · · · k(ym , ym ) (12.119) existe e ´e uma fun¸ca˜o inteira de λ ∈ , Portanto, para K(x, y; λ) = lim Kn (x, y; λ), tem-se n→∞

K(x, y; λ) = que ´e uma fun¸ca˜o merom´orfica de λ ∈ para todo λ ∈ com D(λ) 6= 0.

D(x, y; λ) , D(λ)

(ou seja, ´e a raz˜ao de duas fun¸co˜es inteiras de λ), definida

Com essa express˜ao, somos estimulados a crer que a solu¸ca˜o da equa¸ca˜o de Fredholm n˜ao-homogˆenea ∞ X (12.110) para k(x, y) = al (x)bl (y), supondo que essa s´erie seja uniformemente convergente e que l=1

as fun¸co˜es al e bl sejam todas cont´ınuas, seja dada por (vide (12.117)) Z b λ D(x, y; λ)f (y) dy . u(x) = f (x) + D(λ) a

(12.120)

Note que a express˜ao acima n˜ao est´a definida nos pontos λ ∈ em que D(λ) = 0. Como D ´e uma fun¸ca˜o inteira, esses pontos formam um conjunto discreto. Que de fato essa ´e a solu¸ca˜o procurada ser´a conseq¨ uˆencia do pr´oximo lema, o qual tamb´em ser´a empregado de forma importante mais adiante quando tratarmos da equa¸ca˜o de Fredholm linear e homogˆenea (Se¸ca˜o 12.7.2, p´agina 638).

Lema 12.2 Com as defini¸co ˜es acima, valem D(x, y; λ) = D(λ)k(x, y) + λ e D(x, y; λ) = D(λ)k(x, y) + λ

Z

Z

b

k(x, z)D(z, y; λ) dz

(12.121)

D(x, z; λ)k(z, y) dz .

(12.122)

a b

a

Essas rela¸co ˜es s˜ ao denominadas rela¸co˜es de reciprocidade entre os n´ ucleos k e D. Al´em disso, vale Z b dD (λ) = − D(z, z; λ) dz . (12.123) dλ a 2

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

638/1304

Prova. A prova de (12.121) ´e imediada se expandirmos os determinantes que ocorrem em (12.119) em rela¸ca˜o a` primeira linha (express˜ao (3.9), p´agina 145). Os coeficientes podem ser identificados sem dificuldades, usando novamente (12.119) e (12.118), ap´os trocas convenientes das linhas das matrizes menores que ocorrem na expans˜ao. A prova de (12.122) segue a mesma id´eia, mas fazendo-se a expans˜ao dos determinantes que ocorrem em (12.119) em rela¸ca˜o a` primeira coluna (express˜ao (3.10), p´agina 145). A rela¸ca˜o (12.123) pode ser provada sem dificuldades calculando-se o lado esquerdo com uso de (12.118) e o lado direito com uso de (12.119) e comparando-se as express˜oes assim obtidas. Podemos agora provar que o lado direito de (12.120) ´e solu¸ca˜o de (12.110). Escrevendo (12.120) Rb λ D(z, y; λ)f (y) dy, multiplicando ambos os lados por λk(x, z), integrando como u(z) = f (z) + D(λ) a em z e somando f (x), temos f (x) + λ

Z

b

k(x, z)u(z)dz = f (x) + λ a (12.121)

= f (x) + λ

Z

Z

b a

λ2 k(x, z)f (z)dz + D(λ)

Z bZ a

b

k(x, z)D(z, y; λ)f (y)dydz a

b

k(x, z)f (z) dz a

λ + D(λ) λ = f (x) + D(λ)

Z

Z b a

 D(x, y; λ) − D(λ)k(x, y) f (y) dy

b

D(x, y; λ)f (y) dy a

= u(x) , provando que u satizfaz (12.110). Devemos notar ainda que a forma k(x, y) =

∞ X

al (x)bl (y) ´e bastante geral. Toda fun¸ca˜o de duas

l=1

vari´aveis reais, cont´ınua em [a, b] × [a, b], pode ser escrita assim para uma escolha conveniente de al ’s e bl ’s cont´ınuas e de modo que a s´erie convirja uniformemente. Por exemplo, al ’s e bl ’s podem ser tomados como polinˆomios ortonormais em algum espa¸co de fun¸co˜es de quadrado integr´avel em [a, b].

12.7.2

A Equa¸ c˜ ao Integral de Fredholm Linear Homogˆ enea

Para o problema de Sturm-Liouville nosso interesse concentra-se na equa¸ca˜o integral de Fredholm linear homogˆenea Z b

u(x) = λ

k(x, y) u(y) dy ,

(12.124)

a

k : [a, b] × [a, b] → cont´ınua. Claramente, trata-se da equa¸ca˜o (12.110) para o caso em que f ´e identicamente nula. Ora, a solu¸ca˜o de (12.110) foi obtida em (12.120) e nela vemos que, caso λ seja tal que D(λ) 6= 0, ent˜ao a u ´ nica solu¸ca˜o para f ≡ 0 ´e a solu¸ca˜o identicamente nula. Conclu´ımos que se λ for tal que a equa¸ca˜o integral de Fredholm homogˆenea possui solu¸ca˜o n˜ao-nula, ent˜ao D(λ) = 0. Isso

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

639/1304

limita o conjunto de valores poss´ıveis de λ ao conjunto de zeros da fun¸ca˜o inteira D(λ), conjunto esse que passa a ter importˆancia significativa na teoria de Fredholm. Como vimos, (12.120) n˜ao fornece a solu¸ca˜o nesse caso (apenas a solu¸ca˜o trivial), mas a chave da solu¸ca˜o encontra-se nas equa¸co˜es (12.121) e (12.123). Seja λn um zero de ordem qn ≥ 1 de D(λ) em . Como D(λ) e D(x, y; λ) s˜ao anal´ıticas em toda parte como fun¸co˜es de λ, valem as expans˜oes de Taylor (absolutamente convergentes para |λ − λ n | suficientemente pequeno), D(λ) =

∞ X

m=qn

m

am (λ − λn ) ,

D(x, y; λ) =

m=pn

com pn ≥ 0 e aqn 6= 0. Agora, por (12.123), tem-se ∞ X

m=qn −1

(m + 1)am+1 (λ − λn )

∞ X

m

= −

∞ Z X

m=pn

dm (x, y)(λ − λn )m ,

b

dm (z, z) dz a

de onde se conclui que pn = qn − 1 e, em particular, que Z b dqn −1 (z, z) dz . qn a qn = −



(λ − λn )m ,

(12.125)

a

O fato de pn = qn − 1 diz-nos que K(x, y; λ) = D(x, y; λ)/D(λ) tem um polo de ordem 1 em λ = λn . Agora, escrevendo (12.121) na forma Z b Z b K(x, y; λ) = k(x, y) + k(x, z)(λ − λn )K(z, y; λ) dz + λn k(x, z)K(z, y; λ) dz , a

a

constatamos que os dois primeiros termos do lado direito s˜ao anal´ıticos em λ = λn , enquanto que o lado esquerdo e o u ´ ltimo termo do lado direito tˆem um polo de ordem 1 nesse ponto. Calculando os res´ıduos de ambos os lados, conclu´ımos que a fun¸ca˜o   1 = wn (x, y) := Res K(x, y; λ) dq −1 (x, y) a qn n λ=λn satisfaz

wn (x, y) = λn

Z

b

k(x, z)wn (z, y) dz . a

Portanto, para um y fixo, a fun¸ca˜o wn (x, y) ´e uma solu¸ca˜o da equa¸ca˜o de Fredholm linear homogˆenea com autovalor λn . Note que dqn −1 (x, y) n˜ao pode ser identicamente nula, devido a (12.125) e ao fato que aqn 6= 0, por hip´otese.

Em resumo, as solu¸co˜es da equa¸ca˜o de Fredholm linear homogˆenea com λ = λn , para cada λn que satisfa¸ca D(λn ) = 0, s˜ao obtidas do primeiro coeficiente n˜ao-nulo da expans˜ao de Taylor de D(z, y; λ) em tormo de λn . • Nota hist´ orica sobre o problema de Fredholm

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

640/1304

O tratamento que apresentamos acima, no qual se obtem a solu¸ Pca˜o (12.120) da equa¸ca˜o n˜aohomogˆenea (12.110), primeiramente para n´ ucleos da forma k(x, y) = nl=1 al (x)bl (y) e depois tomando o limite n → ∞, ´e originalmente devido a Goursat13 . Em seu trabalho original, Fredholm seguira uma estrat´egia ligeiramente distinta14 , primeiro discretizando a equa¸ca˜o (12.110), transformando a integral em uma soma de Riemann, em seguida resolvendo o sistema linear correspondente (quando ent˜ao surgem os determinantes) e, por fim, recuperando o limite do cont´ınuo. Os passos de Fredholm podem ser acompanhados na exposi¸ca˜o de [136]. Esses desenvolvimentos culminaram com os trabalhos de Hilbert e Schmidt15 , entre 1904 e 1910, sobre a equa¸ca˜o de Fredholm linear homogˆenea, levando ao nascimento das no¸co˜es de espa¸cos de Hilbert e de operadores compactos. Em teoria, m´etodo de Fredholm descrito acima fornece as solu¸co˜es desejadas, tanto no caso linear n˜ao-homogˆeneo quanto no linear homogˆeneo, mas na pr´atica h´a grandes dificuldades, tanto num´ericas quanto anal´ıticas, em lidar com a s´erie de determinantes e suas expans˜oes em s´erie de Taylor, o que dificulta tanto a solu¸ca˜o num´erica de equa¸co˜es por esse m´etodo quanto o estudo abstrato de propriedades de suas solu¸co˜es e dos autovalores. Por isso, o m´etodo de Fredholm acabou substituido pelos m´etodos anal´ıtico-funcionais provenientes dos trabalhos de Hilbert, Schmidt e outros. Mais sobre isso ser´a estudado no Cap´ıtulo 26, p´agina 1114, quando desenvolvermos a teoria dos operadores compactos (Se¸ca˜o 26.6, p´agina 1202). Independente disso, os trabalhos de Hilbert e colaboradores engendraram uma s´erie de desenvolvimentos que alcan¸caram de modo marcante a F´ısica quando do advento da Mecˆanica ´ Quˆantica, levando tamb´em ao nascimento da An´alise Funcional e das Algebras de Operadores, a´reas de grande importˆancia na Matem´atica. Para uma hist´oria da An´alise Funcional, vide [32].

12.8

Coment´ arios Finais

12.8.1

O Problema de Sturm-Liouville Singular

Vamos aqui discutir brevemente uma variante do problema de Sturm-Liouville regular que consiste no problema de determinar as solu¸co˜es da equa¸ca˜o diferencial (p(x)u0 )0 + q(x)u + λr(x)u(x) = 0 para u definida no intervalo fechado finito [a, b] ⊂ 

(12.126)

, b > a, com as seguintes condi¸co˜es de contorno

u(a) e u0 (a) s˜ao finitas,

(12.127)

β1 u(b) + β2 u0 (b) = 0 ,

(12.128)

onde o seguinte estar´a sendo suposto: As fun¸co˜es p, q e r s˜ao reais e cont´ınuas em [a, b]. 13

Edouard Jean-Baptiste Goursat (1858-1936). O mencionado trabalho de Goursat ´e “Sur um cas ´el´ementaire de l’equation de Fredholm”. Bull. Soc. math. France, vol. 35, 163-173 (1907). 14 Erik Ivar Fredholm (1866-1927). O mencionado trabalho de Fredholm ´e “Sur une class d’equations fonctionelles”, Acta Math. 27, 365-390 (1903). 15 Erhard Schmidt (1876-1959).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

641/1304

A fun¸ca˜o p ´e diferenci´avel em [a, b] e positiva: p(x) > 0 para x ∈ (a, b] mas se anula em x = a: p(a) = 0 r ´e cont´ınua e estritamente positiva em J, ou seja, r(x) > 0 para todo x ∈ [a, b]. As constantes α1 , α2 , β1 e β2 s˜ao reais e tais que (α1 , α2 ) 6= (0, 0) e (β1 , β2 ) 6= (0, 0). Como se percebe, a distin¸ca˜o b´asica entre este problema e o anteriormente tratado reside no fato de que agora p(x) se anula no ponto a. O fato de p anular-se em a implica que a solu¸ca˜o pode ser singular nesse ponto. Da´ı, nenhuma condi¸ca˜o de contorno pode ser fixada para o ponto x = a, exceto que a solu¸ca˜o e sua derivada n˜ao sejam divergentes naquele ponto (se isso for desejado). Um exemplo f´ısico que conduz a esse tipo de situa¸ca˜o ´e o problema das oscila¸co˜es de uma corda de densidade constante ρ e comprimento L, suspensa verticalmente em um campo gravitacional constante (a acelera¸ca˜o da gravidade sendo g) e presa em uma das suas extremidades, a outra ficando livre. Esse problema ´e resolvido na Se¸ca˜o 10.2.2, p´agina 556. Se x representa a altura e o ponto onde uma as extremidades fica presa ´e x = L, ent˜ao a equa¸ca˜o que descreve o problema ´e   ∂u ∂2u ∂ gx = ∂x ∂x ∂t2 com as condi¸co˜es de contorno u(0, t) e u0 (0, t) finitas e u(L, t) = 0. Usando o m´etodo de separa¸ca˜o de vari´aveis e adotando-se u(x, t) = v(x)w(t), obtem-se para w a equa¸ca˜o w(t) ¨ + λw(t) = 0 e para v (gxv 0 )0 + λv = 0 , com v(L) = 0 e com v(0) e v 0 (0) finitos. Aqui λ ´e√uma constante arbitr´aria a ser determinada pelas condi¸co˜es de contorno. A solu¸ca˜o ´e vn (x) = cn J0 (2 λn x), onde J0 ´e a fun¸ca˜o de Bessel de ordem zero, 0 )2 n , onde αn0 ´e o n-´esimo zero de J0 cn ´e uma constante e λn ´e o n-´esimo autovalor, dado por λn = (α4L no semi-eixo real positivo. Para um tratamento detalhado desse problema, vide Se¸ca˜o 10.2.2, p´agina 556. O problema para v ´e claramente um problema de Sturm-Liouville do tipo mencionado acima, j´a que p(x) = gx se anula em x = 0. Esse tipo de problema de Sturm-Liouville ´e, por vezes, denominado Problema de Sturm-Liouville singular, e para ele nem sempre valem os mesmos resultados que no caso anteriormente tratado, o dos problemas de Sturm-Liouville regulares. Por exemplo, nem sempre pode ser garantida a existˆencia de autovalores e autovetores (ou seja, de solu¸co˜es para o problema). Isso pode ser visto explicitamente no exemplo tratado no Apˆendice 12.D, p´agina 647. Mesmo assim, os problemas de Sturm-Liouville singulares, quando sol´ uveis, compartilham algumas propriedades com os problemas regulares, tais como a realidade dos autovalores e a ortogonalidade das autofun¸co˜es. De fato, ´e f´acil ver que o Lema de Green tamb´em vale nesse caso. Seja V(β1 , β2 ) o espa¸co vetorial de todas as fun¸co˜es f duas vezes diferenci´aveis definidas no intervalo [a, b] tais que β 1 f (b) + β2 f 0 (b) = 0 e que sejam finitas em x = a. Ent˜ao, se u e v s˜ao elementos de V(β1 , β2 ) tem-se hv, Lui = hLv, ui ,

JCABarata. Curso de F´ısica-Matem´ atica

ou seja,

Z

Vers˜ ao de 29 de setembro de 2005.

b

v(x) (Lu)(x) dx = a

Z

Cap´ıtulo 12

642/1304

b

(Lv)(x) u(x) dx .

(12.129)

a

De fato, como em (12.62) e (12.63), p´agina 620, tem-se Z

b

v(x) (Lu)(x) dx = a

Z

b

u(x) (Lv)(x) dx a

    0 0 0 0 + p(b) v(b)u (b) − v (b)u(b) − p(a) v(a)u (a) − v (a)u(a) . (12.130)

Ou ´ ltimo termo ´e zero, pois p(a) = 0 e v(a)u0 (a) − v 0 (a)u(a) ´e finito. O termo v(b)u0 (b) − v 0 (b)u(b) ´e nulo pelo mesmo argumento apresentado quando da primeira demonstra¸ca˜o do Lema de Green, para o caso regular (vide p´agina 620 e seguintes). Uma vez demonstrado o Lema de Green para o problema singular, segue de maneira totalmente an´aloga ao que demonstramos no caso regular que os autovalores s˜ao reais e que autofun¸co˜es de autovalores distintos s˜ao ortogonais entre si em rela¸ca˜o ao produto escalar h·, ·ir : huλ , uλ0 ir =

Z

b a

uλ (x) uλ0 (x) r(x) dx = 0

se λ 6= λ0 . N˜ao repetiremos a demonstra¸ca˜o aqui e remetemos o leitor a` p´agina 621 onde isso foi feito no caso regular. E. 12.19 Exerc´ıcio. Mostre que, assim como no caso regular, os autovalores, se existirem, s˜ao simples. Para isso estude a demonstra¸c˜ao para o caso regular da Se¸c˜ao 12.4.2, p´agina 622, e verifique que a mesma tamb´em se aplica ao caso singular. 6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

643/1304

Apˆ endices 12.A

Prova do Teorema 12.1. Existˆ encia e Unicidade

Abaixo faremos uso da nota¸ca˜o e de resultados do Cap´ıtulo 7, p´agina 306. A equa¸ca˜o u00 + a1 (x)u0 + a0 (x)u = g(x) ´e equivalente a` equa¸ca˜o de primeira ordem Y 0 (x) = A(x)Y (x) + G(x) onde



Y (x) = 

y1 (x) y2 (x)



,



A(x) =  0

0

1

−a0 (x)

−a1 (x)

com as identifica¸co˜es u(x) = y1 (x), u (x) = y2 (x).



 ,



G(x) = 

0



 , g(x)

A solu¸ca˜o ´e da forma Y (x) = D(x, x0 )Yx0 +

Z

x

D(x, y)G(y) dy , x0

onde Yx0 = Y (x0 ), x0 arbitr´ario. ´ f´acil ver da´ı que a solu¸ca˜o geral da equa¸ca˜o u00 + a1 (x)u0 + a0 (x)u = g(x) ´e da forma E u(x) = A1 u1 (x) + A2 u2 (x) + up (x) , onde A1 e A2 s˜ao constantes, u1 e u2 s˜ao solu¸co˜es independentes da equa¸ca˜o homogˆenea u00 + a1 (x)u0 + a0 (x)u = 0 e up ´e uma solu¸ca˜o particular da equa¸ca˜o n˜ao-homogˆenea u00 + a1 (x)u0 + a0 (x)u = g(x). Desejamos impor as condi¸co˜es de contorno α1 u(a) + α2 u0 (a) = ϕ1 ,

(12.A.1)

β1 u(b) + β2 u0 (b) = ϕ2 ,

(12.A.2)

α1 (A1 u1 (a) + A2 u2 (a) + up (a)) + α2 (A1 u01 (a) + A2 u02 (a) + u0p (a)) = ϕ1 ,

(12.A.3)

β1 (A1 u1 (b) + A2 u2 (b) + up (b)) + β2 (A1 u01 (b) + A2 u02 (b) + u0p (b)) = ϕ2 .

(12.A.4)

a` solu¸ca˜o. Isso implica

Esse par de equa¸co˜es pode ser escrito em forma matricial como      ϕ1 − α1 up (a) − α2 u0p (a) A1 α1 u2 (a) + α2 u02 (a) α1 u1 (a) + α2 u01 (a) .   =   0 0 0 ϕ2 − β1 up (b) − β2 up (b) A2 β1 u2 (b) + β2 u2 (b) β1 u1 (b) + β2 u1 (b)

(12.A.5)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

E. 12.20 Exerc´ıcio. Verifique.

644/1304

6

Essa u ´ ltima equa¸ca˜o (cujas inc´ognitas s˜ao A1 e A2 ) tem solu¸ca˜o u ´ nica se e somente se   α1 u1 (a) + α2 u01 (a) α1 u2 (a) + α2 u02 (a)   β1 u2 (b) + β2 u02 (b) β1 u1 (b) + β2 u01 (b)

for uma matriz invert´ıvel, ou seja, se  α1 u1 (a) + α2 u01 (a) det  β1 u1 (b) + β2 u01 (b)

α1 u2 (a) + α2 u02 (a) β1 u2 (b) +

β2 u02 (b)

Isso ´e o que quer´ıamos provar.

12.B



 6= 0 .

Prova da Proposi¸ c˜ ao 12.1

Pelas hip´oteses mencionadas, existem fun¸co˜es u1 e u2 independentes entre si que s˜ao solu¸co˜es de Lu = 0 e satisfazem (12.22). Sejam c11 , c12 , c21 , c22 definidas por      c11 c12 α1 u1 (a) + α2 u01 (a) α1 u2 (a) + α2 u02 (a) 0 −1   :=    0 0 c21 c22 β1 u1 (b) + β2 u1 (b) β1 u2 (b) + β2 u2 (b) 1 0 

= 

α1 u2 (a) + α2 u02 (a)

−(α1 u1 (a) + α2 u01 (a))

β2 u02 (b)

β2 u01 (b))

β1 u2 (b) +

Note-se que    c11 c12 α1 u1 (a) + α2 u01 (a)  = det  det  β1 u1 (b) + β2 u01 (b) c21 c22

−(β1 u1 (b) +

α1 u2 (a) + α2 u02 (a) β1 u2 (b) +

β2 u02 (b)

por (12.22).

Sejam as fun¸co˜es v1 (x) e v2 (x) definidas por    v1 (x) c11   =  v2 (x) c21 Pela defini¸ca˜o,

 

Lv1 Lv2





 = 

c11 c21

c12 c22 

 

u1 (x) u2 (x)





 det 



 .

  0   =   , c22 Lu2 0 c12

Lu1





 .

(12.B.6)

0

−1

1

0



 6= 0 (12.B.7)

JCABarata. Curso de F´ısica-Matem´ atica

pois Lu1 = Lu2 = 0. Al´em disso,    c11 v1 (x) v10 (x)   =  c21 v2 (x) v20 (x)

e como



det 

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

c12 c22

u1 (x)

u01 (x)

u2 (x)

u02 (x)

 

u1 (x)

u01 (x)

u2 (x)

u02 (x)



 

645/1304

(12.B.8)

 6= 0 ,

pois u1 e u2 s˜ao independentes, segue de (12.B.7) que   v1 (x) v10 (x)  6= 0 , det  0 v2 (x) v2 (x)

(12.B.9)

para todo x ∈ [a, b], provando que v1 e v2 s˜ao tamb´em independentes. Tem-se de (12.B.8)    α1 v1 (x) + α2 v10 (x) v1 (x)   =  α1 v2 (x) + α2 v20 (x) v2 (x) 

=  

= 

Logo,  

α1 v1 (a) + α2 v10 (a) α1 v2 (a) +

α2 v20 (a)



c11

v20 (x) c12

c21

c22

c11

c12

c21



 = 



=  

que afirma, em particular, que

v10 (x)

= 

c11

c22

 

 

c12

c21

c22

c11

c12

c21

c22

 

α1 α2

 

u1 (x)

u01 (x)

u2 (x)

u02 (x)

 

α1 u1 (x) + α2 u01 (x) α1 u2 (x) +

 

 

0 c11 c22 − c12 c21

α2 u02 (x)

α1 α2



−c12 c11



 ,

α1 v1 (a) + α2 v10 (a) = 0 .





.

α1 u1 (a) + α2 u01 (a) α1 u2 (a) +



α2 u02 (a)

 

 (12.B.10)

(12.B.11)

JCABarata. Curso de F´ısica-Matem´ atica

Analogamente,  

β1 v1 (x) + β2 v10 (x) β1 v2 (x) +

β2 v20 (x)





 =  

=  

Logo,

=   

β1 v1 (b) + β2 v10 (b) β1 v2 (b) +

β2 v20 (b)



v1 (x) v2 (x)

  β1   v20 (x) β2 c12

c21

c22

c11

c12

c21

 

=  

= 

c11

646/1304

v10 (x)

c11

 = 

que afirma, em particular, que

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

c22

 

 

c12

c21

c22

c11

c12

c21

c22

u1 (x) u2 (x)

  β1   u02 (x) β2

u01 (x)

β1 u1 (x) + β2 u01 (x) β1 u2 (x) +

 

 

β2 u02 (x)



.

β1 u1 (b) + β2 u01 (b) β1 u2 (b) + −c22 c21

−c11 c22 + c12 c21 0



β2 u02 (b)



 



,

(12.B.12)

β1 v2 (b) + β2 v20 (b) = 0 .

(12.B.13)

As rela¸co˜es (12.B.11) e (12.B.13) s˜ao precisamente o que afirmamos em (12.23) e (12.24). Isso demonstra o que quer´ıamos provar sobre a existˆencia e propriedades das fun¸co˜es v 1 e v2 .

12.C

Coment´ ario Sobre o Determinante Wronskiano

Faremos aqui um coment´ario sobre a no¸ca˜o de determinante Wronskiano introduzida no Cap´ıtulo 7, p´agina 7 (vide p´agina 318) e aquele apresentado na defini¸ca˜o. (12.30). Abaixo faremos uso de nota¸ca˜o e de resultados daquelas notas. A equa¸ca˜o Lu = 0 pode ser escrita na forma u00 +a1 (x)u0 +a0 (x)u = 0 que, por sua vez, ´e equivalente a` equa¸ca˜o de primeira ordem Y 0 (x) = A(x)Y (x) , onde



Y (x) = 

y1 (x) y2 (x)



,



A(x) = 

0

1

−a0 (x)

−a1 (x)



 ,

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

647/1304

com as identifica¸co˜es u(x) = y1 (x), u0 (x) = y2 (x). A solu¸ca˜o ´e da forma Y (x) = D(x, x0 )Yx0 , onde Yx0 = Y (x0 ), x0 arbitr´ario. Se Y1 e Y2 s˜ao duas solu¸co˜es independentes da equa¸ca˜o homogˆenea Y 0 (x) = A(x)Y (x), o determinante Wronskiano (segundo a defini¸ca˜o usada no Cap´ıtulo 7, p´agina 7 (vide p´agina 318)) ´e hh ii det Y1 (x), Y2 (x) . Como comentamos acima, Y1 e Y2 s˜ao da forma   u1 (x) , Y1 (x) =  0 u1 (x)



Y2 (x) = 

u2 (x) u02 (x)

onde u1 e u2 s˜ao duas solu¸co˜es independentes de Lu = 0. ´ claro ent˜ao que E hh

det Y1 (x), Y2 (x)

ii



= det 

u1 (x)

u2 (x)

u01 (x)

u02 (x)





 = det 



 ,

u1 (x)

u01 (x)

u2 (x)

u02 (x)



 .

Au ´ ltima igualdade ´e apenas o fato de que o determinante de uma matriz n˜ao muda quando a transpomos. Por outro lado, a rela¸ca˜o (12.B.8) nos diz que       v1 (x) v10 (x) c11 c12 u1 (x) u01 (x)  = det   det   . det  (12.C.14) 0 0 v2 (x) v2 (x) c21 c22 u2 (x) u2 (x)       c11 c12 v1 (x) v10 (x) u1 (x) u01 (x) diferem apenas Como det ´e n˜ao nulo, isso diz que det e det u2 (x) u02 (x) c21 c22 v2 (x) v20 (x)   v (x) v10 (x) ´e o determinante Wronskiano, introduzido em por um fator constante. Agora det 1 v2 (x) v20 (x) (12.30). Com isso mostramos que o determinante Wronskiano do Cap´ıtulo 7, p´agina 7, difere apenas por um fator n˜ao nulo constante daquele introduzido em (12.30).

12.D

Ausˆ encia de Autovalores em um Problema Singular

Considere o seguinte problema de Sturm-Liouville singular definido no intervalo [0, 1]: (x2 u0 )0 + λu = 0 ,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

648/1304

com u(1) = 0 e u finita em x = 0. A equa¸ca˜o diferencial ´e x2 u00 + 2xu0 + λu = 0 , que ´e uma equa¸ca˜o do tipo de Euler, de segunda ordem. A solu¸ca˜o pode ser procurada na forma u(x) = xγ e obtem-se √ −1 ± 1 − 4λ . γ = 2 Assim, para λ 6= 1/4, tem-se √ √ −1+ 1−4λ −1− 1−4λ 2 2 u(x) = Ax + Bx . Como deseja-se u(1) = 0 tem-se A = −B e, assim,   −1+√1−4λ √ −1− 1−4λ 2 2 −x . u(x) = A x Essa solu¸ca˜o s´o ser´a finita em x = 0 se16 √ −1 + Re 1 − 4λ ≥ 0

− 1 − Re

e

√ 1 − 4λ ≥ 0 .

Ambas as condi¸co˜es n˜ao podem ser satisfeitas simultaneamente para nenhum λ (pois somando-se ambas as desigualdades, ter´ıamos −2 ≥ 0, o que ´e obviamente falso). Para λ = 1/4 a solu¸ca˜o ´e u(x) = √1 (A ln x + B) e a condi¸ ca˜o u(1) = 0 implica B = 0 e, portanto, u(x) = A √1x ln x, que n˜ao ´e finita em x x = 0. Logo, o problema tratado n˜ao tem solu¸ca˜o para nenhum autovalor.

12.E

Demonstra¸ c˜ ao do Teorema 12.3

De acordo com (12.71),

λ

Z

a

b 2

|u(x)| r(x) dx =

Z

b a

 |u0 (x)|2 p(x) − |u(x)|2 q(x) dx h



 i 0 + p(a) Re u(a)u (a) − p(b) Re u(b)u (b) . (12.E.15) 0



Afirmamos que existem constantes γ1 e γ2 , independentes de u, tais que   p(a) Re u(a)u0 (a) = γ1 |u(a)|2

e

  p(b) Re u(b)u0 (b) = −γ2 |u(b)|2 .

(12.E.16) (12.E.17)

A demonstra¸ca˜o ´e a seguinte. A fun¸ca˜o u satisfaz no ponto a

α1 u(a) + α2 u0 (a) = 0 . 16

Outra possibilidade seria escolher A = 0, ou seja, u(x) = 0, solu¸ca ˜o trivial que n˜ ao interessa como autofun¸ca ˜o.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

649/1304

Vamos primeiro supor que α2 6= 0. Tomando-se o complexo conjugado e multiplicando-se a express˜ao por u(a) obtem-se α1 u0 (a)u(a) = − |u(a)|2 , α2 ou seja,   α1 Re u0 (a)u(a) = − |u(a)|2 . α2 Nesse caso, ent˜ao, tomamos γ1 = −p(a) αα12 .

Caso α2 = 0, a rela¸ca˜o α1 u(a) + α2 u0 (a) = 0 diz-nos que u(a) = 0. Da´ı, ´e evidente que   p(a) Re u(a)u0 (a) = γ1 |u(a)|2 ,

para qualquer constante γ1 , pois ambos os lados s˜ao nulos. Isso provou (12.E.16). A demonstra¸ca˜o de (12.E.17) ´e an´aloga, escolhendo-se γ2 = +p(b) ββ21 , caso β2 6= 0. Inserindo (12.E.16) e (12.E.17) em (12.E.15) tem-se λ

Z

b 2

a

|u(x)| r(x) dx =

Z

b

 |u0 (x)|2 p(x) − |u(x)|2 q(x) dx + γ1 |u(a)|2 + γ2 |u(b)|2 .

a

(12.E.18)

Essa u ´ ltima express˜ao ser´a nosso ponto de partida para mostrar que os autovalores λ s˜ao limitados inferiormente, ou seja, que existe uma constante M ∈ tal que λ ≥ M . 

Note-se que γ1 e γ2 s˜ao n´ umeros reais que tanto podem ser positivos quanto negativos. Vamos considerar os quatro casos poss´ıveis: 1. γ1 ≥ 0 e γ2 ≥ 0; 2. γ1 < 0 e γ2 ≥ 0; 3. γ1 ≥ 0 e γ2 < 0; 4. γ1 < 0 e γ2 < 0. Caso 1. γ1 ≥ 0 e γ2 ≥ 0.

Nesse caso tem-se de (12.E.18) que λ

Z

2

a

|u(x)| r(x) dx ≥ −

Rb

Z

b a

|u(x)|2 q(x) dx ,

|u0 (x)|2 p(x)dx ≥ 0, pois p(x) > 0. Logo,   Rb Rb q(x) 2 2 r(x) dx |u(x)| − |u(x)| q(x) dx r(x) a = . λ ≥ − Rab Rb 2 r(x) dx 2 r(x) dx |u(x)| |u(x)| a a

pois γ1 |u(a)|2 + γ2 |u(b)|2 ≥ 0 e

Sejam agora

b

a

Q = max q(x), x∈[a, b]

R1 = max r(x), x∈[a, b]

Lembrando que r(x) > 0 para todo x ∈ [a, b], teremos −

Q q(x) ≥ − . r(x) r(x)

e

R2 = min r(x) . x∈[a, b]

(12.E.19)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

650/1304

Se Q = 0 conclu´ımos que −

q(x) ≥ 0. r(x)

Se Q < 0, conclu´ımos que −

Q q(x) ≥ − . r(x) R1



q(x) Q . ≥ − r(x) R2

Se Q > 0, teremos

E. 12.21 Exerc´ıcio. Justifique cuidadosamente as desigualdades acima. Em resumo,



Retornando a (12.E.19)

     

0,

se Q = 0

q(x) − RQ1 , se Q < 0 . ≥ B :=  r(x)     Q − R2 , se Q > 0 Rb a

λ ≥

|u(x)|2 Br(x) dx

Rb a

6

(12.E.20)

= B,

|u(x)|2 r(x) dx

onde B est´a definida em (12.E.20). Adotando M = B para esse caso, obtemos o que se queria provar. Caso 2. γ1 < 0 e γ2 ≥ 0.

Nesse caso tem-se de (12.E.18) que λ

Z

b 2

a

|u(x)| r(x) dx ≥

Z

b a

pois γ2 |u(b)|2 ≥ 0.

 |u0 (x)|2 p(x) − |u(x)|2 q(x) dx + γ1 |u(a)|2 ,

(12.E.21)

No Apˆendice 12.F, p´agina 652, demonstramos a seguinte desigualdade, v´alida para todo x ∈ [a, b] e todo  > 0: Z b Z b 2 0 2 |u(x)| ≤  |u (y)| dy + ξ() |u(y)|2 r(y) dy , (12.E.22) a

onde

a

1 ξ() = R2

R2 sendo definido como acima: R2 = min r(x).



1 1 + b−a 



,

x∈[a, b]

Tomando x = a, temos 2

γ1 |u(a)| ≥ γ1 

Z

b 0

a

2

|u (y)| dy + γ1 ξ()

Z

b a

|u(y)|2 r(y) dy ,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 12

651/1304

sendo que a desigualdade se inverteu pois γ1 < 0, por hip´otese. Inserindo isso em (12.E.21), tem-se Z b Z b Z b 2 0 2 λ |u(x)| r(x) dx ≥ (p(x) + γ1 ) |u (x)| dx + (γ1 ξ()r(x) − q(x)) |u(x)|2 dx . a

a

a

At´e agora n˜ao fixamos o valor de . Vamos agora escolhˆe-lo pequeno o suficiente de modo que p(x) + γ1  ≥ 0 , para todo x ∈ [a, b]. Isso ´e sempre poss´ıvel, pois, por hip´otese p(x) > 0 para todo x ∈ [a, b]. Com Rb essa escolha a integral a (p(x) + γ1 ) |u0 (x)|2 dx ´e positiva e podemos escrever λ

Z

a

b 2

|u(x)| r(x) dx ≥

Z

Z b

b 2

a

(γ1 ξ()r(x) − q(x)) |u(x)| dx =

a

q(x) γ1 ξ() − r(x)



|u(x)|2 r(x) dx .

Com o uso de (12.E.20) isso fica Z b Z b 2 λ |u(x)| r(x) dx ≥ (γ1 ξ() + B) |u(x)|2 r(x) dx , a

a

o que implica λ ≥ (γ1 ξ() + B) . Adotando-se M = (γ1 ξ() + B) para esse caso, obtemos que quer´ıamos provar. Caso 3. γ1 ≥ 0 e γ2 < 0.

Esse caso ´e totalmente an´alogo ao caso 2, e n˜ao precisa ser considerado em detalhe.

Caso 4. γ1 < 0 e γ2 < 0. Esse caso ´e tamb´em an´alogo ao caso 2, mas trataremos dos detalhes. De (12.E.18) temos Z b Z b  2 λ |u(x)| r(x) dx ≥ |u0 (x)|2 p(x) − |u(x)|2 q(x) dx + γ1 |u(a)|2 + γ2 |u(b)|2 . (12.E.23) a

a

Usando novamente a desigualdade (12.E.22) para x = a e x = b, temos Z b Z b 2 2 0 2 γ1 |u(a)| + γ2 |u(b)| ≥ (γ1 + γ2 ) |u (y)| dy + (γ1 + γ2 )ξ() |u(y)|2r(y) dy, a

a

sendo que a desigualdade se inverteu pois γ1 < 0 e γ2 < 0, por hip´otese. Inserindo isso em (12.E.21), tem-se Z b Z b Z b 2 0 2 λ |u(x)| r(x) dx ≥ (p(x) + (γ1 + γ2 )) |u (x)| dx + ((γ1 + γ2 )ξ()r(x) − q(x)) |u(x)|2 dx. a

a

a

At´e agora n˜ao fixamos o valor de . Vamos agora escolhˆe-lo pequeno o suficiente de modo que p(x) + (γ1 + γ2 ) ≥ 0 ,

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 12

Vers˜ ao de 29 de setembro de 2005.

652/1304

para todo x ∈ [a, b]. Isso ´e sempre poss´ıvel, pois, por hip´otese p(x) > 0 para todo x ∈ [a, b]. Com Rb essa escolha a integral a (p(x) + (γ1 + γ2 )) |u0 (x)|2 dx ´e positiva e podemos escrever λ

Z

b

a

2

|u(x)| r(x) dx ≥

Z

b a

((γ1 + γ2 )ξ()r(x) − q(x)) |u(x)|2 dx Z b

=

a

q(x) (γ1 + γ2 )ξ() − r(x)



|u(x)|2 r(x) dx.

Com o uso de (12.E.20) isso fica λ

Z

b 2

a

|u(x)| r(x) dx ≥ ((γ1 + γ2 )ξ() + B)

Z

b

|u(x)|2 r(x) dx ,

a

o que implica λ ≥ ((γ1 + γ2 )ξ() + B) . Adotando-se M = ((γ1 + γ2 )ξ() + B) para esse caso, isto ´e o que quer´ıamos provar. Com isso a demonstra¸ca˜o do Teorema 12.3 est´a completa.

12.F

Prova da Desigualdade (12.E.22)

Seja u uma fun¸ca˜o qualquer duas vezes diferenci´avel definida em [a, b]. Sejam x ∈ [a, b] e x0 ∈ [a, b]. Tem-se Z x 0 2 2 |u(y)|2 dy . |u(x)| = |u(x0 )| + x0

Portanto, tem-se, para quaisquer x, x0 ∈ [a, b],

Z |u(x)| ≤ |u(x0 )| + 2

Agora, Z Z x  2 0 |u(y)| dy = x0

Assim,

x x0

Z  0 u(y)u(y) dy =

x

2

x x0



|u(y)|

x0

0

u0 (y)u(y)

Z |u(x)| ≤ |u(x0 )| + 2 Re 2

dy .

 2 0



+ u(y)u (y) dy = 2

x

2

x0

u0 (y)u(y) dy .

Para qualquer n´ umero complexo z, vale |Re(z)| ≤ |z|. Logo, Z x Z x 0 0 Re . u (y)u(y) dy ≤ u (y)u(y) dy x0

x0

Z

x x0

  Re u0 (y)u(y) dy .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Pela desigualdade de Cauchy-Schwarz, Z Z x 0 u (y)u(y) dy ≤

1/2 Z |u (y)| dy

x0

x

0

x0

x0

653/1304

1/2 . |u(y)| dy

x

2

2

Conseq¨ uentemente, juntando as duas u ´ ltimas desigualdades, 1/2 Z x 2 2 2 |u(y)| dy |u(x)| ≤ |u(x0 )| + 2

Cap´ıtulo 12

x0

Z

x

1/2 |u (y)| dy . 0

x0

2

Como x e x0 s˜ao elementos de [a, b] ´e tamb´em o´bvio que Z x Z b 2 |u(y)| dy ≤ |u(y)|2 dy x0

e que

Z

x

a

Z b |u (y)| dy ≤ |u0 (y)|2 dy , 0

x0

2

a

j´a que ao passarmos de uma integral em [x0 , x] a uma integral em [a, b] estamos em geral aumentando o intervalo de integra¸ca˜o e, em ambos os casos, o integrando ´e positivo. Assim, 2

2

|u(x)| ≤ |u(x0 )| + 2

Z

b 2

a

|u(y)| dy

1/2 Z

b 0

a

2

|u (y)| dy

1/2

.

Para qualquer  > 0 isso pode ser reescrito como  Z b 1/2 1/2  Z b 1 2 2 0 2 2 |u(x)| ≤ |u(x0 )| + 2 |u (y)| dy . |u(y)| dy   a a Se A e B s˜ao dois n´ umeros positivos, ´e f´acil provar a partir de √ √ 2 A B ≤ A+B .

√

√ 2 A − B ≥ 0, que

E. 12.22 Exerc´ıcio. Fa¸ca! Rb 0 2 |u(y)| dy e B =  |u (y)|2 dy, tem-se a a Z Z b 1 b 2 2 2 |u(x)| ≤ |u(x0 )| + |u(y)| dy +  |u0 (y)|2 dy .  a a

Usando isso em (12.F.24) com A =

1 

(12.F.24)

Rb

6

(12.F.25)

At´e aqui x0 era um ponto arbitr´ario do intervalo [a, b]. Vamos escolhˆe-lo agora de modo que x 0 seja o ponto onde |u(x)| assume seu menor valor nesse intervalo: |u(x0 )| = min |u(x)|. Um tal ponto x0 x∈[a, b]

sempre existe, pois |u(x)| ´e cont´ınua e [a, b] ´e um intervalo compacto. Com isso teremos, obviamente, Z b |u(y)|2 dy ≥ (b − a)|u(x0 )|2 , a

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

ou seja, 1 |u(x0 )| ≤ b−a 2

Z

Cap´ıtulo 12

654/1304

b a

|u(y)|2 dy .

Inserindo isso em (12.F.25), ficamos com Z b  Z b 1 1 2 0 2 + |u(y)|2 dy . |u(x)| ≤  |u (y)| dy + b − a  a a

(12.F.26)

Seja agora r uma fun¸ca˜o cont´ınua qualquer definida em [a, b] com r(y) > 0 para todo y ∈ [a, b]. r(y) Definindo-se como antes R2 = min r(y) teremos ≥ 1 , para todo y ∈ [a, b]. Inserindo isso na y∈[a, b] R2 segunda integral de (12.F.26), aquela express˜ao fica  Z b Z b 1 1 1 2 0 2 |u(y)|2r(y) dy . (12.F.27) |u(x)| ≤  + |u (y)| dy + R b − a  2 a a Isso ´e a desigualdade (12.E.22), que quer´ıamos provar.

12.G

Obtendo os Determinantes de Fredholm

As regras de c´alculo de determinantes (rela¸co˜es (3.9)-(3.10), p´agina 145) ensina-nos que a soma n X bj (y)(−1)l+j Men( − λk)jl al (x), que ocorre no lado direito de (12.114), ´e igual ao determinante j=1

da matriz !obtida substituindo-se a l-´esima coluna da matriz − λk pelo vetor-coluna b(y)a l (x) = b1 (y)al (x) .. . Assim, denotando por ki a i-´esima coluna da matriz k e empregando os vetores da base . bn (y)al (x) 1 0 0

0

canˆonica de e1 =  0.  , . . . , en =  ...  para denotar as colunas da matriz , podemos escrever, .. 0 0 1 usando a multilinearidade do determinante (linearidade em rela¸ca˜o a cada coluna), que hh ii X 1 Kn (x, y; λ) = det e1 − λk1 , . . . , b(y)al (x), . . . , en − λkn det( − λk) l=1 n

n X n−1 hh ii X X 1 det e1 , . . . , kj1 . . . , b(y)al (x), . . . , kjm . . . , en , (−λ)m = det( − λk) l=1 m=0 1≤j 0, segue x0 = 1. Assim, R~v0 = ~v0 , ou seja, ~v0 ´e um autovetor de R com autovalor 1. Seja V o sub-espa¸co de 3 formado por todos os vetores ~v que s˜ao autovetores de R com autovalor 1: V = {~v ∈ 3 | R~v = ~v }. Como acabamos de mostrar, V ´e n˜ao-trivial, ou seja, V 6= {0} e sua dimens˜ao pode ser 1, 2 ou 3. 



Notemos de passagem que se v ∈ V ent˜ao vale tamb´em que R T v = v. De fato, se aplicarmos RT a` direita na igualdade v = Rv e lembrarmos que RT R = , segue que RT v = v. Notemos tamb´em que V ⊥ , o sub-espa¸co formado por todos os vetores ortogonais a todos os vetores de V , ´e tamb´em deixado invariante por R, ou seja, se u ∈ V ⊥ ent˜ao Ru ∈ V ⊥ . De fato, se v ∈ V e u ∈ V ⊥ hRu, vi 

= hu, RT vi 

= hu, vi 

= 0.

Como isso vale para todo v ∈ V , conclu´ımos que Ru ∈ V ⊥ , como quer´ıamos.

Como dissemos, a dimens˜ao de V pode ser igual a 1, 2 ou 3. Vamos mostrar que os dois u ´ ltimos casos n˜ao s˜ao poss´ıveis.

Se a dimens˜ao de V fosse 3, V seria idˆentico ao espa¸co vetor ~v ∈ 3 , ou seja, R = , situa¸ca˜o que exclu´ımos.

3 

. Nesse caso ent˜ao R~v = ~v para todo



Vamos supor ent˜ao que a dimens˜ao de V ´e 2. Nesse caso a dimens˜ao de seu complemento ortogonal V ´e 1. Agora, como V ⊥ ´e unidimensional e ´e invariante pela a¸ca˜o de R, teremos para u ∈ V ⊥ que Ru = λu, para algum λ ∈ . Mas isso diz que ⊥



hu, ui 

= hRu, Rui 

= hλu, λui 

= λ2 hu, ui 

e, portanto, λ = ±1. O caso λ = +1 j´a est´a exclu´ıdo (pois a´ı u ∈ V ). Logo λ = −1 e Ru = −u.

Conseq¨ uentemente, se escolhermos em 3 uma base ortonormal formada por trˆes vetores v1 , v2 e u com v1 , v2 ∈ V e u ∈ V ⊥ , a matriz R teria a forma   1 0 0 R = 0 1 0  . 0 0 −1 

Mas com isso ter´ıamos det(R) = −1, uma contradi¸ca˜o! Logo a dimens˜ao de V dever ser igual a 1, e isso completa a prova.

Seja R 6= um elemento de SO(3) e seja VR o sub-espa¸co unidimensional formado pelos vetores deixados invariantes por R e cuja existˆencia foi estabelecida na proposi¸ca˜o que acabamos de provar.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

692/1304

Como tamb´em vimos, R tamb´em deixa invariante o sub-espa¸co bidimensional VR⊥ , que ´e ortogonal a VR . uma base ortonormal v, u1 , u2 com v ∈ VR e ui ∈ VR⊥ , a   0 0 1   0   ,  (13.26) R :=  r    0

Isso significa que se escolhermos em matriz R ter´a a forma

3



onde r ´e uma matriz real 2 × 2. Que propriedades tem r? Como veremos, r ∈ SO(2). De fato, pela defini¸ca˜o de R, teremos para qualquer vetor u, que hu, ui = hRu, Rui , mas se escolhermos u ∈ VR⊥ , teremos Ru = ru em VR⊥ e a rela¸ca˜o acima significa hu, ui = hru, rui . Logo r ∈ O(2). Fora isso, (13.26) mostra que 1 = det(R) = det(r), provando que r ∈ SO(2). Como sabemos a forma geral de uma matriz de SO(2) ´e   cos ϕ − sen ϕ r = , sen ϕ cos ϕ 







com ϕ ∈ (−π, π]. Isso est´a tamb´em dizendo que R representa uma rota¸ca˜o de ϕ em torno do eixo representado por VR . Conclu´ımos ent˜ao o seguinte: Proposi¸ c˜ ao 13.4 Para cada R ∈ SO(3) existe uma base ortonormal de   1 0 0 R =  0 cos ϕ − sen ϕ  0 sen ϕ cos ϕ

3 

onde R ´e da forma (13.27)

com ϕ ∈ (−π, π].

2

Pela discuss˜ao precedente, se considerarmos os elementos de SO(3) que correspondem a rota¸co˜es por um aˆngulo ϕ no sentido hor´ario em torno dos eixos canˆonicos 1, 2 e 3 do espa¸co tridimensional 3 , eixos esses que suporemos orientados positivamente, como usual, teremos que as respectivas matrizes de rota¸ca˜o s˜ao dadas por     1 0 0 cos ϕ 0 sen ϕ 0 1 0 , R2 (ϕ) =  R1 (ϕ) =  0 cos ϕ − sen ϕ  , 0 sen ϕ cos ϕ − sen ϕ 0 cos ϕ 



 cos ϕ − sen ϕ 0 R3 (ϕ) =  sen ϕ cos ϕ 0  , 0 0 1

(13.28)

com ϕ ∈ (−π, π]. ´ um exerc´ıcio elementar (fa¸ca) verificar que cada matriz Ri (θ) representa um sub-grupo unipaE ram´etrico de SO(3): Ri (0) = e Ri (θ)Ri (θ 0 ) = Ri (θ + θ 0 ). Os geradores desses sub-grupos s˜ao dados

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

693/1304

por J1 :=

J2 :=

J3 :=

d R1 (ϕ) dϕ d R2 (ϕ) dϕ d R3 (ϕ) dϕ

ϕ=0

ϕ=0

ϕ=0

   0 0 0 1 0 0 d  0 cos ϕ − sen ϕ  =  0 0 −1  , = dϕ 0 1 0 0 sen ϕ cos ϕ ϕ=0 

   0 0 1 cos ϕ 0 sen ϕ d  0 1 0  = =  0 0 0 , dϕ −1 0 0 − sen ϕ 0 cos ϕ ϕ=0 

   0 −1 0 cos ϕ − sen ϕ 0 d  = =  1 0 0 . sen ϕ cos ϕ 0  dϕ 0 0 0 0 0 1 ϕ=0

E. 13.34 Exerc´ıcio important´ıssimo. comuta¸c˜ao



(13.29)

(13.30)

(13.31)

Verifique que as matrizes J1 , J2 e J3 satisfazem as rela¸co˜es de

[Ja , Jb ] =

3 X

εabc Jc ,

(13.32)

c=1

onde εabc , com a, b, c = 1, 2, 3, ´e o chamado s´ımbolo (ou tensor) de Levi-Civita 9 , definido da seguinte forma:   1, se abc for uma permuta¸c˜ao par de 123 −1, se abc for uma permuta¸c˜ao ´ımpar de 123 . εabc := (13.33)  0, se quaisquer dois ´ındices forem iguais 6 Esse exerc´ıcio nos diz que as matrizes J1 , J2 e J3 formam uma a´lgebra de Lie, denominada a´lgebra de Lie so(3) (com letras min´ usculas), para lembrar sua associa¸ca˜o com o grupo SO(3). E. 13.35 Exerc´ıcio. Sejam α ~ = (α1 , α2 , α3 ) ∈ 3 e β~ = (β1 , β2 , β3 ) ∈ que h i ~ · J, ~ β~ · J~ = (~ ~ α ~ · J, α × β) 

sendo que “×” denota o produto vetorial em 6 9

Tullio Levi-Civita (1873-1941).

3



3 

. Usando (13.32), mostre (13.34)

eα ~ · J~ ´e uma abrevia¸c˜ao sugestiva para α1 J1 + α2 J2 + α3 J3 .

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

E. 13.36 Exerc´ıcio. Verifique que as matrizes J1 , J2 e J3 satisfazem   0 0 0 J12 = −  0 1 0  =: E1 , 0 0 1 J22

J32

694/1304

(13.35)



 1 0 0 = −  0 0 0  =: E2 , 0 0 1

(13.36)



 1 0 0 = −  0 1 0  =: E3 . 0 0 0

(13.37) 6

E. 13.37 Exerc´ıcio. Verifique que com as matrizes E1 , E2 e E3 acima podemos escrever + (1 − cos(ϕ))Ea + sen (ϕ)Ja

Ra (ϕ) =

(13.38)

para a = 1, 2 e 3.

6

Com o uso de (13.35)-(13.37) podemos facilmente provar o seguinte fato: para a = 1, 2 ou 3 tem-se Ra (ϕ) = exp(ϕJa ). Vamos mostrar isso. Por (13.35)-(13.37) ´e evidente que Ja3 = Ea Ja = −Ja (verifique!). Logo, para todo k∈ , Ja2k = (−1)k+1 Ea , ∀k > 0 e Ja2k+1 = (−1)k Ja , ∀k ≥ 0. (13.39) 

Assim, temos para a = 1, 2 ou 3, exp(ϕJa )

=

=

(13.39)

=

∞ X ϕm m + J m! a m=1 ∞ ∞ X ϕ2k 2k X ϕ2k+1 2k+1 + J + J (2k)! a (2k + 1)! a k=1 k=0

+

∞ X (−1)k+1 ϕ2k k=1

= (13.38)

=

(2k)!

!

Ea +

∞ X (−1)k ϕ2k+1 k=0

(2k + 1)!

!

Ja

+ (1 − cos(ϕ))Ea + sen (ϕ)Ja Ra (ϕ),

que ´e o que quer´ıamos mostrar. Vamos agora mostrar que todo elemento de SO(3) pode ser escrito como exponencial de uma combina¸ca˜o linear das matrizes Ja .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Proposi¸ c˜ ao 13.5 Seja R ∈ SO(3). Ent˜ ao existe um vetor η~ ∈ a ˆngulo θ ∈ (−π, π] tais que   R = exp θ~η · J~ ,

3 

Cap´ıtulo 13

695/1304

, ~η = (η1 , η2 , η3 ), com |~η | = 1 e um

onde ~η · J~ := η1 J1 + η2 J2 + η3 J3 . Em particular, toda matriz de rota¸ca ˜o R ∈ SO(3) pode ser expressa na forma    2 R = + (1 − cos(θ)) ~η · J~ + sen (θ) ~η · J~ , (13.40)

ou seja, escrevendo-se explicitamente,   (1 − cos(θ))η12 + cos(θ) (1 − cos(θ))η1 η2 − sen (θ)η3 (1 − cos(θ))η1 η3 + sen (θ)η2     2  . (1 − cos(θ))η η + sen (θ)η (1 − cos(θ))η + cos(θ) (1 − cos(θ))η η − sen (θ)η R =  1 2 3 3 2 1 2     (1 − cos(θ))η1 η3 − sen (θ)η2 (1 − cos(θ))η3 η2 + sen (θ)η1 (1 − cos(θ))η32 + cos(θ) A express˜ ao (13.40) ´e denominada f´ ormula de Rodrigues 10 .

Prova. Se R = podemos escolher θ = 0. Vamos supor R 6= . Pela Proposi¸ca˜o 13.3, existe um sub-espa¸co unidimensional VR que ´e deixado invariante por R. Vamos escolher ~η como sendo um vetor ´ o´bvio que R~η = ~η. Pela Proposi¸ca˜o 13.4, R representa uma de VR com comprimento igual a 1. E rota¸ca˜o de um aˆngulo θ (no sentido hor´ario se θ > 0) em torno de ~η .   O que faremos para demonstrar nossa proposi¸ca˜o ´e mostrar que exp θ~η · J~ mantem ~η invariante e roda os vetores perpendiculares a ~η de um aˆngulo θ (no sentido hor´ario) em torno do eixo definido por ~η. Com isso, podemos identificar R = exp θ~η · J~ , como queremos.   ~ Vamos abaixo calcular de modo mais expl´ıcito o que ´e a matriz exp θ~η · J mas, antes disso, vamos   demonstrar que exp θ~η · J~ ∈ SO(3). Para isso come¸camos com a observa¸ca˜o que



 0 −η3 η2 0 −η1  η~ · J~ := η1 J1 + η2 J2 + η3 J3 :=  η3 −η2 η1 0

(13.41)

~ T = −~η · J~. ´e uma matriz anti-sim´etrica, ou seja, (~η · J) 10

Benjamin Olinde Rodrigues (1794-1851). Rodrigues foi banqueiro e matem´ atico amador, nascido na Fran¸ca, mas de origem judaico-portuguesa. Seu nome ´e mais conhecido por uma identidade sobre polinˆ omios de Legendre.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

696/1304

Assim, h

h ∞ iT iT m m X θ = exp θ~η · J~ ~η · J~ m! m=0 

∞ X (−θ)m ~m = (~η · J) m! m=0

  = exp −θ~η · J~ =

h



i−1 ~ exp θ~η · J .

~ ´e ortogonal, ou seja, sua transposta ´e igual a sua inversa. Resta-nos Isso provou que exp(θ~ η · J)    mostrar que det exp θ~η · J~ = 1. Como exp θ~η · J~ ´e ortogonal, seu determinante ´e ±1. Assim,    como det exp θ~η · J~ depende continuamente de θ (para isso, vide, por exemplo a express˜ao (13.44)    abaixo), temos que det exp θ~η · J~ ´e constante para todo θ ∈ (−π, π]. Calculando em θ = 0, teremos       det exp θ~η · J~ = det exp 0~η · J~ = det( ) = 1.   Logo, exp θ~η · J~ ∈ SO(3) para todo θ e todo η~.   Vamos agora expressar de modo mais expl´ıcito a matriz exp θ~η · J~ . Para isso ser´a importante mostrar que    3 = − ~η · J~ . (13.42) ~η · J~ A maneira pedestre de mostrar isso ´e por verifica¸ca˜o  2 η1 − 1  2 ~η · J~ =  η1 η2 η1 η3

expl´ıcita. De fato, por (13.41),  η 1 η2 η1 η3 η22 − 1 η3 η2  . η3 η2 η32 − 1

(13.43)

~ obtem-se (13.42). Temos, ent˜ao, o seguinte: para todo k ∈ Multiplicando-se novamente por ~η · J, k > 0, vale  2  2k k+1 ~ ~ = (−1) ~η · J ~η · J

e



  2k+1 k ~ ~ = (−1) ~η · J . ~η · J



,

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

697/1304

Logo, 

 ~ exp θ~η · J = =

=

∞ X θ m  ~m + ~η · J m! m=1 ∞ ∞ X θ 2k  ~2k X θ 2k+1  ~2k+1 + + ~η · J ~η · J (2k)! (2k + 1)! k=0 k=1

+

∞ X (−1)k+1 θ 2k

(2k)!

k=1

= Resumindo,

!

 2 ~η · J~ +

∞ X (−1)k θ 2k+1 k=0

(2k + 1)!

!

~η · J~

 2   + (1 − cos(θ)) ~η · J~ + sen (θ) ~η · J~ .

  exp θ~η · J~ =

´ um exerc´ıcio f´acil verificar que E

   2 + (1 − cos(θ)) ~η · J~ + sen (θ) ~η · J~ .

(13.44)

     0 0 −η3 η2 η1   0 −η1  η2  = 0 . ~η · J~ ~η =  η3 0 −η2 η1 0 η3   ~ Assim, conclui-se, tanto pela expans˜ao em s´erie de Taylor de exp θ~η · J quando por (13.44) que   exp θ~η · J~ ~η = ~η,

  ou seja, tal como R, a matriz exp θ~η · J~ mantem ~η invariante para qualquer θ.   1 Para finalizar, vamos ent˜ao escolher uma base em 3 na qual η~ = 0 . Nessa base teremos ~η · J~ = J1 0  2   ~ e ~η · J = E1 . Logo, por (13.44), teremos nessa base que exp θ~η · J~ se expressa como 



 1 0 0 + (1 − cos(θ))E1 + sen (θ)J1 =  0 cos θ − sen θ  0 sen θ cos θ   ~ que ´e a forma (13.27) da matriz R. Isso permite-nos identificar R = exp θ~η · J , completando a prova. 

 exp θ~η · J~ =

Resumindo nossas conclus˜oes, n   SO(3) = exp θ~η · J~ ,

θ ∈ [−π, π], ~η ∈

3 

o com |~η | = 1 .

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

698/1304

A Proposi¸ca˜o 13.5 est´a nos dizendo que todo elemento de SO(3) pode ser escrito como a exponencial de um elemento de sua a´lgebra de Lie. Isso constata um teorema geral (vide, por exemplo, [119]) que diz que se um grupo de Lie ´e compacto e sua a´lgebra de Lie ´e semi-simples, a aplica¸ca˜o exponencial da sua a´lgebra de Lie ´e sobrejetora no grupo. De fato, SO(3) ´e compacto e so(3) ´e semi-simples. Para finalizar esta exposi¸ca˜o sobre o grupo SO(3), vamos descrever sua estrutura enquanto variedade diferenci´avel. Como vimos, os elementos de SO(3) s˜ao parametrizados por pontos θ~η de 3 , sendo que θ ∈ [−π, π] e |~η | = 1. O conjunto de todos os pontos desse tipo compreende a esfera de raio π centrada na origem. Para cada ~η fixo, os dois pontos ant´ıpodas da superf´ıcie dessa esfera que est˜ao na ´ claro, por´em, que tais pontos correspondem a` mesma rota¸ca˜o: uma dire¸ca˜o definida por ~η s˜ao ±π~η . E rota¸ca˜o de π em torno de um eixo ´e o mesmo  que uma rota¸  ca˜o de−π em torno do mesmo eixo. De ~ fato, ´e trivial verificar por (13.44) que exp π~η · J = exp −π~η · J~ . Assim, SO(3) corresponde nessa imagem ao espa¸co obtido tomando-se uma esfera e identificando-se todos os pares de pontos ant´ıpodas. Na linguagem da geometria diferencial, o conjunto que assim se obtem ´e denominado espa¸co projetivo real (em quatro dimens˜oes) e denotado por P 3 . O conjunto P n ´e a variedade diferenci´avel ndimensional formada pelo conjunto de todas as linhas retas de n+1 que passam pela origem. SO(3) ´e homeomorfo, enquanto variedade, ao espa¸co projetivo P 3 . Como veremos na pr´oxima se¸ca˜o, o grupo SU(2), que ´e fortemente aparentado a SO(3), tem outra estrutura: SU(2) ´e homeomorfo a S 3 , a superf´ıcie da esfera de raio 1 em 4 . Para uma introdu¸ca˜o a` geometria diferencial, vide [98]. 











E. 13.38 Exerc´ıcio. Leia [98] e resolva todos os seus exerc´ıcios.

13.3.3

6

O Grupo SU(2)

• As Matrizes de Pauli De grande importˆancia no estudo do grupo SU(2) s˜ao as chamadas matrizes de Pauli 11 , definidas como       0 1 0 −i 1 0 σ1 := , σ2 := e σ3 := . (13.45) 1 0 i 0 0 −1

As matrizes de Pauli satisfazem as seguintes rela¸co˜es alg´ebricas: para todos a, b = 1, 2, 3 valem [σa , σb ] := σa σb − σb σa = 2i

3 X

εabc σc ,

(13.46)

c=1

{σa , σb } := σa σb + σb σa = 2δab , σa σb = δab + i

(13.47) 3 X

εabc σc .

(13.48)

c=1

E. 13.39 Exerc´ıcio important´ıssimo (todo estudante deve fazˆe-lo pelo menos uma vez na vida). Verifique as rela¸co˜es alg´ebricas acima. Note que (13.48) segue diretamente de (13.47) e (13.46). 6 11

Wolfgang Pauli (1900-1958).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

699/1304

Note tamb´em que as matrizes de Pauli s˜ao auto-adjuntas: σi∗ = σi . Note ainda que as quatro matrizes , σ1 , σ2 , σ3 formam uma base em Mat ( , 2): toda matriz complexa 2 × 2 pode ser escrita como uma combina¸ca˜o linear das mesmas. E. 13.40 Exerc´ıcio. Mostre que as matrizes , σ1 , σ2 , σ3 s˜ao ortonormais em rela¸c˜ao ao seguinte 6 produto escalar definido em Mat ( , 2): hA, Bi := 21 Tr (A∗ B). As matrizes de Pauli desempenham um papel importante na Mecˆanica Quˆantica, estando associadas ao operador de spin para part´ıculas de spin 1/2, tais como o el´etron, o pr´oton, o neutron, os quarks e outras. • A Forma Geral das Matrizes de SU(2) Conforme j´a definimos, o grupo SU(2) ´e o grupo das matrizes unit´arias complexas 2 × 2 com determinante igual a 1: SU(2) = {U ∈ Mat ( , 2)| U ∗ = U −1 e det(U ) = 1}. Vamos come¸car estudando a forma geral de tais matrizes, procurando uma parametriza¸ca˜o conveniente para as mesmas que permitir´a estudar as propriedades de SU(2) como um grupo de Lie. Como toda matriz 2 × 2 complexa, uma matriz gen´erica U ∈ SU(2) ´e da forma U = ( ac db ), onde a, b, c, d ∈ . Vamos estudar a condi¸ca˜o U −1 = U ∗ . Podemos calcular U −1 usando a regra de Laplace, express˜ao (3.8), p´agina 145: U −1 ´e dada pela transposta da matriz dos cofatores de U dividida pelo  −1 d −b determinante de U , que ´e 1, neste caso. Ou seja, U = −c a . Assim, U −1 = U ∗ significa nesse caso     a c d −b , = −c a b d  a b ou seja, c = −b e d = a. Logo, U = −b ca˜o det(U ) = 1 implica, portanto, |a|2 + |b|2 = 1. a . A condi¸ Resumindo:

SU(2) =



 a b , onde a, b ∈ −b a

2

2



com |a| + |b| = 1 .

Escrevendo os n´ umeros complexos a e b como soma de suas partes real e imagin´aria: a = a 1 + ia2 e b = b1 + ib2 , com a1 , a2 , b1 , b2 ∈ , poderemos escrever U como uma combina¸ca˜o linear de matrizes de Pauli (e da unidade):   a1 + ia2 b1 + ib2 U = = a1 + i(b2 σ1 + b1 σ2 + a2 σ3 ). (13.49) −b1 + ib2 a1 − ia2 

Essa express˜ao ser´a usada adiante. Vamos agora nos voltar para a condi¸ca˜o |a|2 + |b|2 = 1. A mesma significa a21 + a22 + b21 + b22 = 1. Temos ent˜ao,    a1 + ia2 b1 + ib2 4 2 2 2 2 SU(2) = , onde (a1 , a2 , b1 , b2 ) ∈ com a1 + a2 + b1 + b2 = 1 . (13.50) −b1 + ib2 a1 − ia2 

Lembremos que para todo inteiro n ≥ 1, o conjunto de pontos S n := {(x1 , . . . , xn+1 ) ∈

n+1 

com x21 + · · · + x2n+1 = 1} ⊂

n+1 

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

700/1304

designa a superf´ıcie da esfera unit´aria de n+1 . Assim, vemos que SU(2) ´e homeomorfo a S 3 , a superf´ıcie da esfera unit´aria do espa¸co quadridimensional 4 . Isso ilustra o fato que SU(2) ´e uma variedade diferenci´avel. Como o produto e a inversa s˜ao cont´ınuos em SU(2), o mesmo ´e um grupo de Lie. 



Vamos tentar agora parametrizar de outra forma o vetor (a1 , a2 , b1 , b2 ) ∈ S 3 que aparece do lado direito de (13.50). Claramente, a condi¸ca˜o a21 + a22 + b21 + b22 = 1 diz que a1 , a2 , b1 e b2 s˜ao n´ umeros reais contidos no intervalo [−1, 1]. Podemos assim definir um aˆngulo θ ∈ [−π, π] de forma que a1 = cos θ. Fora isso, para cos(θ) 6= ±1, podemos definir

b2 b1 a2 , η2 := , η3 := . sen θ sen θ sen θ A condi¸ca˜o a21 + a22 + b21 + b22 = 1 implica ent˜ao (verifique!) que η12 + η22 + η32 = 1. Assim, o vetor η~ := (η1 , η2 , η3 ) de 3 ´e um vetor de comprimento 1. Com esses novos parˆametros θ e ~η podemos reescrever (13.49) como U = cos(θ) + i sen (θ)~η · ~σ , η1 :=



onde

η~ · ~σ := η1 σ1 + η2 σ2 + η3 σ3 = Assim, SU(2) =





 η3 η1 − iη2 . η1 + iη2 −η3

cos(θ) + i sen (θ)~η · ~σ , onde θ ∈ [−π, π] e ~η ∈

3 

com |~η | = 1 .

A importˆancia de se expressar U ∈ SU(2) dessa forma, em termos de θ e η~, provem da seguinte identidade: cos(θ) + i sen (θ)~η · ~σ = exp (iθ~η · ~σ ) .

Vamos provar isso expandindo o lado direito e verificando que ´e igual ao lado esquerdo. De fato, pela defini¸ca˜o da exponencial de matrizes, ∞ X (iθ)m exp (iθ~η · ~σ ) = (~η · ~σ )m m! m=0 =

∞ X (iθ)2k k=0

(2k)!

(~η · ~σ )

2k

∞ X (iθ)2k+1 + (~η · ~σ )2k+1 , (2k + 1)! k=0

onde, na u ´ ltima linha, apenas fizemos separar a soma em m da primeira linha nos casos m par e m ´ ´ımpar. E um exerc´ıcio muito f´acil (fa¸ca!) verificar que  2 η3 η1 − iη2 2 (~η · ~σ ) = = . η1 + iη2 −η3 Portanto, (~η · ~σ )2k =

e (~η · ~σ )2k+1 = ~η · ~σ . Logo,

exp (iθ~η · ~σ ) =

∞ X (iθ)2k k=0

(2k)!

!

+

∞ X (iθ)2k+1 (2k + 1)! k=0

= cos(θ) + i sen (θ)~η · ~σ ,

!

~η · ~σ

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

701/1304

que ´e o que quer´ıamos mostrar. Resumindo nossas conclus˜oes,  SU(2) = exp (iθ~η · ~σ ) onde θ ∈ [−π, π] e ~η ∈

3 

com |~η | = 1 .

(13.51)

Se tomarmos ~η1 = (1, 0, 0), ~η2 = (0, 1, 0) ou ~η3 = (0, 0, 1), obtemos trˆes sub-grupos uniparam´etricos distintos de SU(2):   cos θ i sen θ U1 (θ) := exp(iθσ1 ) = , i sen θ cos θ U2 (θ) := exp(iθσ2 ) =

U3 (θ) := exp(iθσ3 ) =





 cos θ sen θ , − sen θ cos θ  eiθ 0 , 0 e−iθ

respectivamente. Isso nos permite identificar as matrizes de Pauli σ1 , σ2 e σ3 como os geradores desses subgrupos uniparam´etricos. As rela¸co˜es (13.46) s˜ao as rela¸co˜es satisfeitas por essas matrizes, como elementos de uma a´lgebra de Lie, que ´e denominada a´lgebra de Lie su(2). Com isso, (13.51) est´a nos dizendo que todo elemento de SU(2) pode ser escrito como exponencial de um elemento de sua a´lgebra de Lie. Isso constata um teorema geral (vide, por exemplo, [119]) que diz que se um grupo de Lie ´e compacto e sua a´lgebra de Lie ´e semi-simples, a aplica¸ca˜o exponencial da sua a´lgebra de Lie ´e sobrejetora no grupo. De fato, tal como SO(3), SU(2) ´e compacto e su(2) ´e semi-simples. E. 13.41 Exerc´ıcio. Mostre que  U(2) = exp (iα + iθ~η · ~σ ) onde α, θ ∈ [−π, π] e ~η ∈

13.3.4

com |~η| = 1 .

3 

6

A Rela¸ c˜ ao entre SO(3) e SU(2)

O leitor que acompanhou com aten¸ca˜o as exposi¸co˜es precedentes sobre os grupos SO(3) e SU(2) certamente apercebeu-se da existˆencia de uma s´erie de semelhan¸cas entre ambos. Vamos agora precis´a-las. Em primeiro lugar, note-se que os geradores de SO(3) s˜ao matrizes 3 × 3 satisfazendo as rela¸co˜es alg´ebricas [Ja , Jb ] = εabc Jc , enquanto que geradores de SU(2) s˜ao matrizes 2×2 satisfazendo as rela¸co˜es alg´ebricas [σa , σb ] = 2iεabc σc . Se por´em definirmos ja := −iσa /2, obtemos [ja , jb ] = εabc jc . Seja

so(3) := {L ∈ Mat ( , 3) : L = α1 J1 + α2 J2 + α3 J3 , αk ∈ 



, k = 1, 2, 3}

a a´lgebra de Lie (real) associada aos geradores de SO(3) e seja su(2) := {l ∈ Mat ( , 2) : l = α1 j1 + α2 j2 + α3 j3 , αk ∈ 

, k = 1, 2, 3}

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

702/1304

a a´lgebra de Lie (real) associada aos geradores de SU(2). ´ muito f´acil constatar que a aplica¸ca˜o linear ϕ : su(2) → so(3) dada por E ϕ(α1 j1 + α2 j2 + α3 j3 ) = α1 J1 + α2 J2 + α3 J3 ´e um isomorfismo de a ´lgebras de Lie, ou seja, ´e bijetora e satisfaz ϕ([la , lb ]) = [ϕ(la ), ϕ(lb )] para todos la , lb ∈ su(2). E. 13.42 Exerc´ıcio importante. Prove as afirmativas acima.

6

E. 13.43 Exerc´ıcio. Mostre que so(3) coincide com a ´algebra de Lie de todas as matrizes reais 3 × 3 anti-sim´etricas. (Vide exerc´ıcio `a p´agina 58). 6 E. 13.44 Exerc´ıcio. Mostre que su(2) coincide com a ´algebra de Lie de todas as matrizes complexas 2 × 2 anti-autoadjuntas. (Vide exerc´ıcio `a p´agina 58). 6 Assim, as a´lgebras de Lie so(3) e su(2) s˜ao isomorfas. Discutiremos agora que implica¸co˜es isso traz sobre as rela¸ca˜o entre os grupos SO(3) e SU(2). por

O isomorfismo ϕ definido acima sugere considerar-se a seguinte aplica¸ca˜o φ : SU (2) → SO(3) dada φ (exp(l)) := exp (ϕ(l)) ,

ou seja, para todos θ ∈ (−2π, 2π], e ~η ∈

∀l ∈ su(2),

     φ exp θ~η · ~j := exp θ~η · J~ , 3



com |~η | = 1.

Que propriedades essa φ possui? Em primeiro  lugar, ´e f´acil ver que φ ´e sobrejetora (por que?), mas n˜ao ´e injetora, pois para U1 := exp −i 20 ~η · ~σ = e U2 := exp −i 2π ~η · ~σ = − tem-se φ(U1 ) = 2 φ(U2 ) = . Verifique! A quest˜ao ´e: como se comporta φ em rela¸ca˜o ao produto dos elementos do grupo? A resposta encontra-se na afirmativa da proposi¸ca˜o seguinte.

Proposi¸ c˜ ao 13.6 A aplica¸ca ˜o φ : SU (2) → SO(3) definida acima ´e um homomorfismo do grupo SU(2) no grupo SO(3), ou seja, φ( ) = e para todos Ua , Ub ∈ SU(2) vale φ(Ua )φ(Ub ) = φ(Ua Ub ). 2 Em verdade, como φ ´e sobrejetora, a proposi¸ca˜o estabelece que φ ´e um epimorfismo de SU(2) em SO(3). Vide defini¸ca˜o a` p´agina 66. Prova. Que φ( ) = Ua e Ub da forma

´e trivial. Provemos que φ(Ua )φ(Ub ) = φ(Ua Ub ) para todos Ua , Ub ∈ SU(2). Sejam Ua = exp

3 X k=1

αk j k

!

,

Ub = exp

3 X k=1

βk j k

!

,

com αk , βk ∈ , k = 1, 2, 3, e limitemos provisoriamente os valores a uma vizinhan¸ca P3dos αk ’s e βk ’sP O suficientemente pequena de zero que as matrizes a = k=1 αk jk e b = 3k=1 βk jk tenham  de modo  

ambas normas menores que 12 ln 2 −

√ 2 2

. Essa restri¸ca˜o provis´oria a`s normas de a e b (vide coment´ario

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

703/1304

a` p´agina 251) ´e u ´ til pois coloca-nos no dom´ınio de validade da f´ormula de Baker-Campbell-Hausdorff (eq. (4.46) a` p´agina 249. Vide tamb´em (4.47)). Isso justifica ent˜ao escrevermos Ua Ub = ea eb = exp (a ∗ b) , onde a ∗ b est´a definida em (4.46). Como a s´erie que define a ∗ b ´e convergente e envolve comutadores m´ ultiplos de elementos da a´lgebra de Lie su(2), ´e evidente que a ∗ b ´e tamb´em um elemento de su(2) e, mais que isso, tem-se a∗b =

3 X

γ k jk =

k=1

3 X

γk (α1 , α2 , α3 , β1 , β2 , β3 )jk ,

(13.52)

k=1

onde cada γk ´e uma fun¸ca˜o anal´ıtica das vari´aveis α1 , α2 , α3 , β1 , β2 , β3 em um aberto suficientemente pequeno pr´oximo zero. A analiticidade se deve ao fato de que a s´erie que define a ∗ b ´e absolutamente convergente e envolve, em cada termo, polinˆomios nas vari´aveis α e β. E. 13.45 Exerc´ıcio. Lance um olhar meditativo sobre a f´ormula de Baker-Campbell-Hausdorff (4.46) e conven¸ca-se da veracidade das afirma¸co˜es feitas no u ´ltimo par´agrafo sobre a analiticidade das fun¸co˜es γk . De modo mais iluminante, mostre usando (4.47) e as rela¸co˜es de comuta¸c˜ao (13.34), que os primeiros termos de ~γ = (γ1 , γ2 , γ3 ) s˜ao      1 1  ~γ = α ~ + β~ + α ~ × β~ + α ~× α ~ × β~ + β~ × β~ × α ~ +··· , 2 12 onde α ~ = (α1 , α2 , α3 ) e β~ = (β1 , β2 , β3 ).

6

Retomando, sejam agora φ(Ua ) = exp

3 X

α k Jk

k=1

e A = ϕ(a), B = ϕ(b), ou seja, A =

P3

k=1

!

,

φ(Ub ) = exp

3 X k=1

α k Jk e B =

P3

k=1

β k Jk

!

,

βk Jk . Novamente, tem-se que

φ(Ua )φ(Ub ) = eA eB = exp (A ∗ B) , mas, como as rela¸co˜es de comuta¸ca˜o entre os jk ’s s˜ao idˆenticas a`s dos Jk ’s, segue que A∗B =

3 X k=1

γ k Jk , =

3 X

γk (α1 , α2 , α3 , β1 , β2 , β3 )Jk ,

k=1

com as mesmas fun¸co˜es γk que em (13.52) (Justifique isso!). Ou seja, vale que A ∗ B = ϕ(a ∗ b). Isso concluiu que, pelo menos quando α1 , α2 , α3 , β1 , β2 , β3 s˜ao suficientemente pr´oximos de zero, vale φ(Ua )φ(Ub ) = exp(ϕ(a ∗ b)) = φ(exp(a ∗ b)) = φ(Ua Ub ).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

704/1304

Tudo que nos falta agora ´e um argumento que justifique que essa igualdade vale n˜ao apenas para α1 , α2 , α3 , β1 , β2 , β3 suficientemente pr´oximos de zero, mas para quaisquer valores desses parˆametros. Esse argumento ´e a analiticidade.  P3 e uma fun¸ca˜o anal´ıtica (inteira) de α1 , α2 e α3 (pois a Cada elemento de matriz de exp k=1 αk Jk ´ s´erie que define a exponencial para os elementos  converge absolutamente em toda parte). O mesmoPvale  P3 P3 3 de matriz de exp β J . Assim, cada elemento de matriz do produto exp k=1 k k k=1 αk Jk exp k=1 βk Jk ´e uma ca˜o anal´  ıtica (inteira) de α1 , α2 , α3 , β1 , β2 , β3 . Igualmente, cada elemento de matriz de Pfun¸ 3 exp γ J e uma fun¸ca˜o anal´ıtica de α1 , α2 , α3 , β1 , β2 , β3 quando esses est˜ao pr´oximos a zero k=1 k k ´ (pois a composi¸ca˜o de fun¸co˜esPanal´ıticas´e tamb´ uma fun¸ provamos acima  ca˜o anal´  Pem P3ıtica). Portanto, 3 3 que as fun¸co˜es anal´ıticas exp k=1 αk Jk exp k=1 βk Jk e exp k=1 γk Jk coincidem em um aberto suficientemente pequeno. Por um teorema geral da teoria de fun¸co˜es de vari´aveis complexas, isso implica que essas fun¸co˜es s˜ao iguais em toda parte. Assim, vale para todos α1 , α2 , α3 , β1 , β2 , β3 reais ou complexos que φ(Ua )φ(Ub ) = φ(Ua Ub ), completando a prova. Note que a aplica¸ca˜o φ n˜ao pode ser um isomorfismo de grupos pois, como vimos, n˜ao ´e bijetora. E. 13.46 Exerc´ıcio. Mostre, por´em, que SO(3) e SU(2)/{ , − } s˜ao isomorfos.

6

* Todas as considera¸co˜es de acima sobre a rela¸ca˜o entre os grupos SO(3) e SU(2) s˜ao de grande importˆancia em f´ısica, particularmente no que concerne a` representa¸ca˜o do grupo de rota¸co˜es SO(3) para part´ıculas de spin 1/2. Ainda mais profunda ´e a rela¸ca˜o entre o grupo SL( , 2) e o grupo de Lorentz, rela¸ca˜o esta que discutiremos na Se¸ca˜o 13.8, p´agina 745.

13.3.5

O Grupo SL( , 2)

Vamos aqui tratar de um grupo fortemente aparentado ao grupo SU(2) e ao grupo de Lorentz, cujo estudo ´e importante na teoria dos spinores, particularmente no estudo de representa¸co˜es do grupo de Lorentz para part´ıculas de spin 1/2. Trata-se do grupo SL( , 2). Mais sobre o grupo SL( , 2), em especial, sua rela¸ca˜o com o grupo de Lorentz, ser´a visto na Se¸ca˜o 13.8, p´agina 745. O grupo SL( , 2) ´e definido como o grupo formado pelas matrizes complexas 2 × 2 de determinante igual a 1. Como as matrizes , σ1 , σ2 , σ3 formam uma base em Mat ( , 2), podemos escrever toda matriz A ∈ SL( , 2) na forma   b4 + b3 b1 − ib2 A = b 4 + b 1 σ1 + b 2 σ2 + b 3 σ3 , = , b1 + ib2 b4 − b3 com b4 , b1 , b2 , b3 ∈ . A condi¸ca˜o det(A) = 1 implica b24 − b21 − b22 − b23 = 1. Assim,

SL( , 2) =



b4 + b3 b1 − ib2 b1 + ib2 b4 − b3



com b4 , b1 , b2 , b3 ∈

e

b24



b21



b22



b23



=1 .

(13.53)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

705/1304

Como b4 ´e um n´ umero complexo arbitr´ario, podemos escrever b4 = cosh z, para algum z ∈ . Fora isso, para z 6= 0, podemos definir trˆes n´ umeros complexos η1 , η2 , η3 por η1 :=

b1 , senh z

η2 :=

b2 , senh z

η3 :=

b3 . senh z

A condi¸ca˜o b24 − b21 − b22 − b23 = 1 implica (verifique!) que os n´ umeros complexos η1 , η2 , η3 satisfazem η12 + η22 + η32 = 1. Com isso vemos que  SL( , 2) = cosh(z) + senh (z) (~η · ~σ ), onde z ∈

e ~η ∈

3

com η12 + η22 + η32 = 1 .

(13.54)

Mesmo para vetores η~ complexos tem-se, como vimos anteriormente quando tratamos de SU(2), que (~η · ~σ )2 = . Portanto, ∞ X zm (~η · ~σ )m exp (z ~η · ~σ ) = m! m=0 ∞ ∞ X X z 2k+1 z 2k 2k (~η · ~σ ) + (~η · ~σ )2k+1 = (2k)! (2k + 1)! k=0 k=0

=

∞ X z 2k (2k)! k=0

!

+

∞ X k=0

z 2k+1 (2k + 1)!

!

(~η · ~σ )

= cosh(z) + senh (z) (~η · ~σ ). Assim, todo elemento A ∈ SL( , 2) ´e da forma exp (z ~η · ~σ ). Em resumo,  SL( , 2) = exp (z ~η · ~σ ) , onde z ∈ e ~η ∈ 3 com η12 + η22 + η32 = 1 .

(13.55)

Como j´a vimos, o sub-grupo SU(2) de SL( , 2) corresponde a z = iθ, θ ∈ , e ~η ∈ 3 . Como vemos, SU(2) e SL( , 2) tˆem ambas a´lgebras de Lie geradas pelas matrizes de Pauli, mas em SU(2) essa a´lgebra ´e real enquanto que em SL( , 2) ´e complexa. 



Mais sobre o grupo SL( , 2), em especial, sua rela¸ca˜o com o grupo de Lorentz, ser´a visto na Se¸ca˜o 13.8, p´agina 745.

13.4

Generalidades sobre os grupos SU(n) e SO(n)

Nesta se¸ca˜o discutiremos algumas qualidades gerais dos grupos SU(n) e SO(n). Para esta se¸ca˜o recomenda-de a leitura pr´evia de partes do Cap´ıtulo 14. Come¸caremos com os grupos SU(n) pois seu tratamento ´e ligeiramente mais simples que o dos grupos SO(n). O caso fisicamente importante do grupo SU(3) ser´a discutido com um pouco de detalhe.

JCABarata. Curso de F´ısica-Matem´ atica

13.4.1

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

706/1304

Os Grupos SU(n)

Ap´os termos adquirido algum conhecimento sobre o grupo SU(2), vamos estudar alguns aspectos gerais dos grupos SU(n), n ≥ 2. Vimos acima de modo expl´ıcito que os elementos de SU(2) podem ser escritos como exponenciais de elementos de sua a´lgebra de Lie. Veremos que esse fato ´e tamb´em v´alido para SU(n). Lembremos a defini¸ca˜o: para n ≥ 2, SU (n) := {U ∈ Mat ( , n)| U ∗ = U −1 e det(U ) = 1}. Comecemos com a seguinte observa¸ca˜o. Proposi¸ c˜ ao 13.7 SU(n) ´e um subgrupo compacto de GL( , n).

2

Prova. Provemos primeiramente que SU (n) ´e um subconjunto (topologicamente) fechado de GL( , n). Seja Un , n ∈ , uma seq¨ uˆencia de matrizes de SU(n) que converge em norma a uma matriz U ∈ Mat ( , n), ou seja, limn→∞ kUn − U k = 0, onde k · k ´e a norma operatorial de matrizes. Desejamos provar que U ∈ SU(n). 





Em primeiro lugar, notemos que podemos escrever

U ∗ U = (U − Un + Un )∗ (U − Un + Un ) = (U − Un )∗ (U − Un ) + Un∗ (U − Un ) + (U − Un )∗ Un + Un∗ Un . Como os Un s˜ao unit´arios, Un∗ Un = (U − Un )∗ Un . Assim kU ∗ U − k

e conclui-se que U ∗ U −

= (U − Un )∗ (U − Un ) + Un∗ (U − Un ) +

= k(U − Un )∗ (U − Un ) + Un∗ (U − Un ) + (U − Un )∗ Un k 



≤ k(U − Un )∗ (U − Un )k + kUn∗ (U − Un )k + k(U − Un )∗ Un k 





≤ k(U − Un )∗ k kU − Un k + kUn∗ k kU − Un k + k(U − Un )∗ k kUn k 



≤ kU − Un k2 + 2kU − Un k 









.



(13.56)

(Ao estudante deve ser claro que acima usamos os fatos que, para quaisquer matrizes A, B, complexas n × n, valem kA + Bk ≤ kAk + kBk , kABk ≤ kAk kBk , kAk = kA∗ k e que kAk = 1 se A ´e unit´aria. Se n˜ao for claro, justifique esses fatos como exerc´ıcio ou leia o Cap´ıtulo 26). 

















Agora, como o extremo direito da seq¨ uˆencia de desigualdades (13.56) pode ser feito arbitrariamente pequeno para n → ∞, conclu´ımos que o extremo esquerdo ´e nulo, ou seja, U ∗ U = . Analogamente, prova-se que U U ∗ = . Isso estabelece que U ´e unit´ario. Para provar que o determinante de U vale 1, notemos que o fato de Un convergir a U na norma operatorial implica que os elementos de matriz da seq¨ uˆencia de matrizes Un convergem aos elementos de matriz de U (por que?). Como o determinante de uma matriz depende continuamente de seus elementos de matriz (por que?), segue que det(U ) = limn→∞ det(Un ) = 1. Isso estabelece que U ∈ SU(n) e isso prova que SU(n) ´e um subconjunto topologicamente fechado de GL( , n), como quer´ıamos.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

707/1304

Para provarmos que SU(n) ´e compacto, resta apenas provar que SU(n) ´e um conjunto limitado (em um espa¸co m´etrico um conjunto ´e compacto se e somente se for fechado e limitado). A condi¸ca˜o U ∗ U = implica Tr(U ∗ U ) = n. Assim, vale n X

a, b=1

|Uab |2 = n,

para todo U ∈ SU(n). Isso mostra que SU(n) ´e limitado e, portanto, compacto. Seja agora {U (t) ∈ SU (n), t ∈ }, um subgrupo uniparam´etrico de SU(n) (ou seja, U (0) = e U (t)U (t0 ) = U (t + t0 ), sendo t 7→ U (t) cont´ınua). Pela Proposi¸ca˜o 14.5, p´agina 782, U (t) = exp(tA) para alguma matriz A. Agora, sejam u, v dois vetores arbitr´arios de n . Temos que, para todo t vale hu, vi = hU (t)u, U (t)vi . Diferenciando essa igualdade em rela¸ca˜o a t, escrevendo-se U (t) = exp(tA) e calculando a derivada em t = 0, tem-se 0 = hAu, vi + hu, Avi , ou seja, hu, (A + A∗ )vi = 0. Como isso vale para todo u, v em n , segue que A∗ = −A. Fora isso12 , como 1 = det(exp(tA)) = exp(tTr(A)), segue que A tem tra¸co nulo. 











Assim, vimos que os geradores dos subgrupos uniparam´etricos de SU(n) s˜ao anti-autoadjuntos e tˆem tra¸co nulo. Podemos nos perguntar se a rec´ıproca ´e v´alida, ou seja, se todas as matrizes antiautoadjuntas e de tra¸co nulo s˜ao geradoras de subgrupos uniparam´etricos de SU(n). Para responder isso, precisamos da seguinte proposi¸ca˜o: Proposi¸ c˜ ao 13.8 Se A ∈ Mat ( , n) ´e anti-autoadjunta (ou seja, A∗ = −A) satisfazendo tamb´em Tr(A) = 0, ent˜ ao a matriz exp(A) ´e um elemento de SU(n). 2 Prova. Precisamos provar que exp(A) ´e unit´aria e que seu determinante ´e igual a 1. Pela defini¸ca˜o da exponencial de matrizes em termos de uma s´erie de potˆencias (a s´erie de Taylor da fun¸ca˜o exponencial), sabe-se que exp(M )∗ = exp(M ∗ ) para qualquer matriz n×n complexa M . Assim, exp(A)∗ = exp(A∗ ) = exp(−A) = exp(A)−1 , provando que exp(A) ´e unit´aria. Assim, para nossa matriz A, tem-se det(exp(A)) = exp(Tr(A)) = exp(0) = 1, o que prova que exp(A) ∈ SU(n), como quer´ıamos. Essa proposi¸ca˜o diz-nos que, se A ∈ Mat ( , n) ´e anti-autoadjunta e tem tra¸co nulo, ent˜ao U (t) = exp(tA), t ∈ ´e um subgrupo uniparam´etrico de SU(n). Em resumo, conclu´ımos que o conjunto de todas as matrizes n × n complexas anti-autoadjuntas e de tra¸co nulo ´e idˆentico ao conjunto de todos os geradores de subgrupos uniparam´etricos de SU(n). 

Como SU(n) ´e um subgrupo fechado de GL( , n), segue do Teorema 14.1 que o conjunto de seus geradores ´e uma a´lgebra de Lie. Essa a´lgebra de Lie ´e dita ser a a´lgebra de Lie de SU(n), e ´e denotada por su(n) (assim, com letras min´ usculas). Como vimos, su(n) coincide com o conjunto de todas as matrizes n × n complexas anti-autoadjuntas de tra¸co nulo. De passagem, notemos que o fato de que o conjunto de todas as matrizes n × n complexas antiautoadjuntas de tra¸co nulo forma uma a´lgebra de Lie real j´a fora visto independentemente nos exerc´ıcios da p´agina 58. 12

Aqui usamos a Proposi¸ca ˜o 4.7, p´ agina 234.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

708/1304

Provemos agora uma outra proposi¸ca˜o, a qual essencialmente diz-nos que todo elemento de SU(n) pode ser obtido como exponencial de um elemento de su(n). No caso de SU(2) isso foi provado explicitamente, quando mostramos que todo elemento de SU(2) ´e da forma exp(iθ~η · ~σ ).

Proposi¸ c˜ ao 13.9 Todo elemento U de SU(n) pode ser escrito na forma U = e A , onde A ∈ Mat ( , n) ´e anti-autoadjunta (ou seja, A∗ = −A) e de tra¸co nulo (ou seja, Tr(A) = 0). 2 Prova. Seja U ∈ SU(n). Como toda matriz unit´aria, U ´e normal, pois vale U U ∗ = U ∗ U (= ). Uma das conseq¨ uˆencias do Teorema Espectral para matrizes diz-nos que toda matriz normal pode ser diagonalizada por uma matriz unit´aria (vide Teorema 3.14 e as p´aginas que o antecedem). Assim, existe V , matriz unit´aria, tal que U = V DV ∗ , onde D = diag (u1 , . . . , un ), e onde os uk s˜ao n´ umeros complexos (os autovalores de U ). Da condi¸ca˜o U U ∗ = segue imediatamente que DD ∗ = , o que implica que cada uk ´e um n´ umero complexo de m´odulo 1: |uk |2 = 1. Assim, podemos escrever uk = eiλk , onde λk ∈ , sendo que cada λk ´e determinado a menos de um termo 2πm, com m inteiro. 

Note-se como UPtem determinante 1, segue que 1 = det(U ) = det(V DV ∗ ) = det(D) =  Pn que, exp i k=1 λk . Assim, nk=1 λk = 2πm0 , com m0 inteiro. Podemos redefinir, digamos, λn , subtraindolhe 2πm0 . Com essa nova escolha teremos n X

λk = 0.

(13.57)

k=1

Definamos agora a matriz L = diag (iλ1 , . . . , iλn ). Note-se que, como os λk s˜ao reais, vale L∗ = −L. ´ claro que D = eL e tamb´em que U = exp(A), onde A = V LV ∗ . E ´ agora elementar constatar que E P A∗ = −A. Fora isso, por (13.57) segue que Tr(A) = Tr(V LV ∗ ) = Tr(L) = i nk=1 λk = 0. Isso completa a prova. A Proposi¸ca˜o 13.9 diz-nos que a exponencia¸ca˜o ´e uma aplica¸ca˜o sobrejetora de su(n) em SU(n). Isso ´e um caso particular de um teorema mais geral que diz que isso ´e v´alido para qualquer grupo de Lie compacto, conexo e cuja a´lgebra de Lie seja de dimens˜ao finita. Pelo que vimos su(2) coincide com a ´algebra de Lie real de todas as matrizes E. 13.47 Exerc´ıcio. complexas 2 × 2, anti-autoadjuntas e de tra¸co zero. Mostre que as matrizes iσ 1 , iσ2 e iσ3 formam uma base nesse espa¸co de matrizes. Conclua que todo elemento de SU(2) ´e da forma exp(iα 1 σ1 + iα2 σ2 + iα3 σ3 ) com αk ∈ . 6 

A Proposi¸ca˜o 13.9 tem o seguinte corol´ario simples: Corol´ ario 13.1 O grupo SU(n) ´e conexo por caminhos e, portanto, ´e um espa¸co conexo.

2

Prova. Pelo que vimos, se U ∈ SU(n), U ´e da forma U = eA , para alguma A ∈ su(n). Logo U pertence ao subgrupo uniparam´etrico de SU(n) gerado por A: {exp(tA), t ∈ }. Esse subgrupo conecta continuamente U a` identidade (que corresponde a t = 0). 

JCABarata. Curso de F´ısica-Matem´ atica

13.4.2

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

709/1304

O Grupo SU(3)

O grupo SU(3) ´e de grande importˆancia na F´ısica das Part´ıculas Elementares, estando associado a` uma simetria aproximada, dita de “sabor”, e a uma simetria exata, dita de “cor”. N˜ao nos deteremos nesses aspectos aqui, e remetemos o estudante aos bons livros sobre F´ısica das Part´ıculas Elementares e Teoria Quˆantica de Campos (por exemplo, [134]-[135]). O grupo SU(3) ´e um grupo a 32 −1 = 8 parˆametros. Pelo que vimos, su(3) coincide com o espa¸co das matrizes complexas 3 × 3, anti-autoadjuntas e de tra¸co zero. Para o estudo do grupo SU(3) no contexto da f´ısica das part´ıculas elementares ´e conveniente introduzir-se uma base expl´ıcita nesse espa¸co. Como toda matriz anti-autoadjunta pode ser escrita como iλ, onde λ ´e autoadjunta, basta-nos procurar uma base no espa¸co das matrizes autoadjuntas de tra¸co zero. Comummente adota-se as chamadas Matrizes de Gell-Mann13 λi , i = 1, . . . , 8, que s˜ao as seguintes matrizes:       1 0 0 0 −i 0 0 1 0 λ3 = 0 −1 0 , λ2 =  i 0 0 , λ1 =  1 0 0  , 0 0 0 0 0 0 0 0 0 

 0 0 1 λ4 =  0 0 0  , 1 0 0 



 0 0 −i λ5 =  0 0 0  , i 0 0

 0 0 0 λ7 = 0 0 −i , λ8 = 0 i 0



 1 0 0 √1 0 1 0 . 3 0 0 −2



 0 0 0 λ6 =  0 0 1  , 0 1 0

Note que todas as matrizes λi s˜ao autoadjuntas e de tra¸co zero, formando uma base no espa¸co das matrizes complexas autoadjuntas e de tra¸co nulo (mostre isso!). As mesmas s˜ao normalizadas de modo que Tr(λa λb ) = 2δab . ´ltimo par´agrafo. E. 13.48 Exerc´ıcio. Prove as afirmativas do u A a´lgebra de Lie de su(3) pode ser expressa para as matrizes de Gell-Mann da seguinte forma: [λa , λb ] = 2i

8 X

fabc λc ,

c=1

onde fabc , as camadas constantes de estrutura de su(3), s˜ao totalmente anti-sim´etricas, ou seja fabc = fbca = fcab = −fbac = −facb = −fcba , 13

Murray Gell-Mann (1929-).

6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

710/1304

sendo f123 = 1, f147 = −f156 = f246 = f257 = f345 = −f367 =

1 , 2



3 , 2

f458 = f678 =

e as demais constantes independentes s˜ao nulas. ao: tire uma tarde livre. E. 13.49 Exerc´ıcio. Verifique isso. Sugest˜

6

Pelo que aprendemos da nossa discuss˜ao geral sobre grupos SU(n), todo elemento U de SU(3) pode ser escrito na forma ! 8 X U = exp i α k λk , k=1

onde os αk ’s s˜ao n´ umeros reais.

13.4.3

Os Grupos SO(n)

Primeiramente lembremos a defini¸ca˜o: para n ≥ 2, SO(n) := {R ∈ Mat ( , n)| RT = R−1 e det(R) = 1}. 

Sob v´arios aspectos os grupos SO(n) podem ser tratados de modo semelhante aos grupos SU(n), exceto por um ponto importante: por agirem em um espa¸co vetorial real ( n ), n˜ao podemos aplicar o teorema espectral a`s matrizes ortogonais, tal como fizemos na prova da Proposi¸ca˜o 13.9. Por isso, um desvio mais longo dever´a ser seguido, ainda que as conclus˜oes sejam as mesmas, em essˆencia. 

Analogamente ao que fizemos no caso SU(n), comecemos com a seguinte observa¸ca˜o. Proposi¸ c˜ ao 13.10 SO(n) ´e um subgrupo compacto de GL( , n).

2



Prova. A prova ´e uma mera imita¸ca˜o da demonstra¸ca˜o correspondente no caso SU(n) e poupamo-nos de reproduz´ı-la. Seja agora {R(t) ∈ SO(n), t ∈ }, um subgrupo uniparam´etrico de SO(n) (ou seja, R(0) = e R(t)R(t0 ) = R(t+t0 )). Pela Proposi¸ca˜o 14.5, p´agina 782, R(t) = exp(tA) para alguma matriz A. Agora, sejam u, v dois vetores arbitr´arios de n . Temos que, para todo t vale hu, vi = hR(t)u, R(t)vi . Diferenciando essa igualdade em rela¸ca˜o a t, escrevendo-se R(t) = exp(tA) e calculando a derivada em t = 0, tem-se 0 = hAu, vi + hu, Avi , ou seja, hu, (A + AT )vi = 0. Como isso vale para todo u, v em n , segue que AT = −A. Assim, A ´e uma matriz anti-sim´etrica, o que implica que seus elementos diagonais s˜ao nulos. Assim, ´e autom´atico que Tr(A) = 0. 















JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

711/1304

Assim, vimos que os geradores dos subgrupos uniparam´etricos de SO(n) s˜ao anti-sim´etricos. Podemos nos perguntar se a rec´ıproca ´e v´alida, ou seja, se todas as matrizes anti-sim´etricas s˜ao geradores de subgrupos uniparam´etricos de SU(n). Para responder isso, precisamos da seguinte proposi¸ca˜o: Proposi¸ c˜ ao 13.11 Se A ∈ Mat ( , n) ´e anti-sim´etrica (ou seja, AT = −A), ent˜ ao a matriz exp(A) ´e um elemento de SO(n). 2 

Prova. Precisamos provar que exp(A) ´e ortogonal e que seu determinante ´e igual a 1. Pela defini¸ca˜o da exponencial de matrizes em termos de uma s´erie de potˆencias (a s´erie de Taylor da fun¸ca˜o exponencial), sabe-se que exp(M )T = exp(M T ) para qualquer matriz n × n real ou complexa M . Assim, exp(A)T = exp(AT ) = exp(−A) = exp(A)−1 , provando que exp(A) ´e ortogonal. Como observamos, Tr(A) = 0. Logo, para nossa matriz A, tem-se det(exp(A)) = exp(Tr(A)) = exp(0) = 1, o que prova que exp(A) ∈ SO(n), como quer´ıamos. Essa proposi¸ca˜o diz-nos que, se A ∈ Mat ( , n) ´e anti-sim´etrica, ent˜ao R(t) = exp(tA), t ∈ ´e um subgrupo uniparam´etrico de SO(n). Em resumo, conclu´ımos que o conjunto de todas as matrizes n × n reais anti-sim´etricas ´e idˆentico ao conjunto de todos os geradores de subgrupos uniparam´etricos de SO(n). 



Como SO(n) ´e um subgrupo fechado de GL( , n), segue do Teorema 14.1 que o conjunto de seus geradores ´e uma a´lgebra de Lie. Essa a´lgebra de Lie ´e dita ser a a a´lgebra de Lie de SO(n), e ´e denotada por so(n). Como vimos, so(n) coincide com o conjunto de todas as matrizes n × n reais anti-sim´etricas. 

De passagem, notemos que o fato de que o conjunto de todas as matrizes n × n reais anti-sim´etricas forma uma a´lgebra de Lie real j´a fora visto independentemente nos exerc´ıcios da p´agina 58.

Provemos agora uma outra proposi¸ca˜o, a qual essencialmente diz-nos que todo elemento de SO(n) pode ser obtido como exponencial de um elemento de so(n). Nos casos de SO(2) e SO(3) isso foi provado explicitamente nas p´aginas acima. Proposi¸ c˜ ao 13.12 Todo elemento R de SO(n) pode ser escrito na forma R = e A , onde A ∈ Mat ( , n) ´e anti-sim´etrica (ou seja, AT = −A). 2 

Prova. Como dissemos n˜ao podemos aqui seguir exatamente os passos da prova da Proposi¸ca˜o 13.9, pois o teorema espectral n˜ao se aplica de modo direto a matrizes reais. Seja R ∈ SO(n), com elementos de matriz reais Rij . Normalmente R age no espa¸co real n , mas podemosP fazˆe-la agir em n da maneira usual: para um vetor u ∈ n com componentes ui ∈ , tem-se (Ru)i = nj=1 Rij uj . Como tal, R ´e uma matriz unit´aria de determinante 1, ou seja, um elemento de SU(n), pois (R∗ )ij = (R)ji = (R)ji = (RT )ij = (R−1 )ij . Aqui usamos que os Rij s˜ao reais e o fato o´bvio (por que?) que a inversa de R em n ´e a mesma que em n . 



Dado que R ´e unit´aria, seus autovalores s˜ao n´ umeros eventualmente complexos mas de m´odulo 1. Notemos, por´em, que os autovalores s˜ao ra´ızes do polinˆomio caracter´ıstico p(x) = det(x − R), x ∈ . ´ um fato elementar e bem conhecido que Como os Rij s˜ao reais, esse polinˆomio tem coeficientes reais. E se x ´e raiz de um polinˆomio com coeficientes reais, ent˜ao seu complexo conjugado x tamb´em o ´e.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

712/1304

Se n ´e par, os autovalores s˜ao, portanto, pares de n´ umeros complexos de m´odulo 1 complexoconjugados: eiθ e e−iθ . Como o determinante de R ´e o produto de seus autovalores, isso automaticamente garante que det(R) = 1 desde que −1, se for autovalor, o seja com multiplicidade alg´ebrica par. Se n ´e ´ımpar, os autovalores s˜ao pares de n´ umeros complexos de m´odulo 1 complexo-conjugados: e±iθ , mas um deles pode ser real, podendo, portanto, ser ±1. Como o determinante de R ´e o produto de seus autovalores, a condi¸ca˜o det(R) = 1 implica que um dos autovalores deve ser +1 e que −1, se for autovalor, o ´e com multiplicidade alg´ebrica par. Em resumo: 1. Se n ´e par, o conjunto de autovalores de R ´e do tipo {e±iθk , k = 1, . . . , n/2, sendo θk ∈ 

}.

2. Se n ´e ´ımpar, o conjunto de autovalores de R ´e do tipo {1}∪{e±iθk , k = 1, . . . , (n−1)/2, sendo θk ∈ }. 

Em ambos os casos −1 pode ser autovalor e, se o for, o ´e com multiplicidade alg´ebrica par. Seja o autovalor eiθk . H´a dois casos a considerar.

Caso I. eiθk 6= ±1, de modo que eiθk ´e n˜ao-real e, portanto, distinto de e−iθk .

Seja vk ∈ n um autovetor de R com autovalor eiθk : Rvk = eiθk vk , normalizado de modo que kvk k2 = hvk , vk i = 1. Segue que Rvk = e−iθk vk , ou seja, vk ´e um autovetor de R com autovalor e−iθk . Como R ´e unit´aria, segue que autovetores que correspondem a autovalores distintos s˜ao ortogonais (em n ). Logo, 



hvk , vk i 

= 0

e, portanto,

hvk , vk i 

= hvk , vk i 

= 0.

(13.58)

Escrevamos vk separando componente a componente suas partes real e imagin´aria: v k = ak + ibk , com ak , bk ∈ n . As rela¸co˜es Rvk = eiθk vk e Rvk = e−iθk vk tornam-se 

Rak = (cos θk )ak − ( sen θk )bk ,

Rbk = ( sen θk )ak + (cos θk )bk . Note-se que, como sen θk 6= 0, essas duas rela¸co˜es implicam que n˜ao se pode ter ak = 0, pois isso implicaria bk = 0 e vice-versa. Por´em, ak e bk s˜ao vetores ortogonais em n . De fato, 

hak , bk i 

= = =

1 k h(v + vk ), (vk − vk )i 4  1 k k hv , v i − hvk , vk i + hvk , vk i − hvk , vk i 4  1 k k hv , v i − hvk , vk i + hvk , vk i − hvk , vk i 4 







=

1 (0 − 1 + 1 − 0) 4

=

0.

por (13.58)











JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

713/1304

k k Assim, conclu´ımos que no  sub-espa¸co realgerado pelos vetores ortogonais n˜ao-nulos a e b , a cos θk sen θk matriz R age como a matriz , elemento de SO(2). − sen θk cos θk

´ importante notar tamb´em que os vetores ak e bk s˜ao tamb´em ortogonais entre si para k’s difeE rentes. Isso ´e mostrado na proposi¸ca˜o seguinte.

Proposi¸ c˜ ao 13.13 Se vj = aj + ibj e vk = ak + ibk s˜ ao vetores de j k k j valerem hv , v i = 0 e hv , v i = 0, ent˜ ao tem-se 

n

com aj , ak , bj , bk ∈

n 

e se



haj , ak i 

= haj , bk i 

= hbj , ak i 

= hbj , bk i

= 0. 

2 Prova. De hvj , vk i = 0 segue facilmente que 

haj , ak i + hbj , bk i 

= 0 

e

hbj , ak i − haj , bk i

e

hbj , ak i + haj , bk i



= 0.



Como vj = aj − ibj , tem-se de hvj , vk i = 0 que 

haj , ak i − hbj , bk i 



= 0





= 0.

Disso, o resultado desejado segue imediatamente. j j O fato demonstrado nessa proposi¸ca˜o mostra que os sub-espa¸cos gerados por pares  a , b s˜ao ortogo cos θj sen θj n nais em . . Na base formada por esses vetores, R tem a forma de blocos diagonais − sen θj cos θj Resta-nos ainda discutir o que se passa com os autovalores reais. 

Caso II. eiθk = ±1.

Como comentamos, o autovalor −1 tem multiplicidade alg´ebrica par em n . Como R ´e unit´aria em n , R ´e simples (vide defini¸ca˜o a` p´agina 152), conclu´ımos que a multiplicidade geom´etrica desse autovalor em n ´e igualmente par. Os autovalores reais de R correspondem a autovetores reais (por que?). Assim, h´a um sub-espa¸co real de dimens˜ao par onde R age como − . Como a dimens˜ao ´e par,  cos θj sen θj podemos escrever R nesse sub-espa¸co como uma s´erie de blocos diagonais como , − sen θj cos θj mas para θj = π. Para o autovalor +1 a conclus˜ao ´e a mesma, exceto que se n for ´ımpar a multiplicidade geom´etrica   cos θj sen θj ´e ´ımpar. Assim, R age nesse sub-espa¸co como uma s´erie de blocos diagonais como , − sen θj cos θj mas para θj = 0 e um bloco 1 × 1 com elemento de matriz 1.

A conclus˜aos˜ao ´e a seguinte: para R ∈ SO(n) existe uma matriz ortogonal 14 V tal que R = V BV −1 , onde B ´e a seguinte matriz: quando n ´e par, ou seja, n = 2m, para algum m > 0 inteiro, B ´e a matriz 14 A matriz ´e ortogonal pois faz a mudan¸ca de base para a base dos vetores a j , bj e dos autovetores de autovalor ±1, os quais s˜ ao todos ortogonais entre si, como provamos acima. Um fato crucial, como se vˆe.

JCABarata. Curso de F´ısica-Matem´ atica

bloco-diagonal dada por  cos θ1 sen θ1  − sen θ1 cos θ1       0   B =    ..  .      0

0

···

cos θ2 sen θ2 − sen θ2 cos θ2 ..

0

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

.

0

714/1304



       0    ,        cos θm sen θm  − sen θm cos θm

(13.59)

que ´e formada por m = n/2 blocos 2 × 2, como indicado acima, sendo os demais elementos de matriz nulos. Quando n ´e ´ımpar, ou seja, n = 2m + 1, para algum m > 0 inteiro, B ´e a matriz bloco-diagonal dada por   cos θ1 sen θ1  0 ··· 0 0   − sen θ1 cos θ1           cos θ2 sen θ2  0 0 0   − sen θ2 cos θ2       B =  (13.60) .. ..  , . .   . . .         cos θ sen θ m m   0 0 0   − sen θm cos θm       0 0 ··· 0 1 que ´e formada por m = (n − 1)/2 blocos 2 × 2, como indicado acima, sendo o elemento B nn igual a 1, e os demais elementos de s˜ao matriz nulos. Definamos agora (tanto para o caso em que n ´e par ou ´ımpar) ∂ R . Jk := ∂θk θ1 =···=θm =0

´ claro que cada Jk ´e a matriz anti-sim´etrica composta pelo bloco 0 1 colocado na k-´esima posi¸ca˜o, E −1 0 os demais elementos de matriz sendo iguais a zero. Deve ser tamb´em claro que Jk Jl = Jl Jk para todos k, l = 1, . . . , m e que B = exp (θ1 J1 + · · · + θm Jm ) .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

715/1304

E. 13.50 Exerc´ıcio. Complete os detalhes.

6

Do comentado acima, temos ent˜ao que R = V BV −1 = exp (A) , onde A := V (θ1 J1 + · · · + θm Jm ) V −1 .

Agora, como V ´e ortogonal e as Jk s˜ao anti-sim´etricas, ´e elementar verificar que AT = −A. Isso completa a prova da Proposi¸ca˜o 13.12. A Proposi¸ca˜o 13.12 diz-nos que a exponencia¸ca˜o ´e uma aplica¸ca˜o sobrejetora de so(n) em SO(n). Isso ´e um caso particular de um teorema mais geral que diz que isso ´e v´alido para qualquer grupo de Lie compacto, conexo e cuja a´lgebra de Lie seja de dimens˜ao finita. A Proposi¸ca˜o 13.12 tem os dois seguintes corol´arios simples: Corol´ ario 13.2 Para n ´ımpar existe para cada R ∈ SO(n) um vetor ~η ∈

n 

tal que R~η = ~η .

2

O vetor ~η ´e o autovetor com autovalor 1. Se n ´e par pode n˜ao haver um tal vetor invariante. Esse corol´ario, junto com a Proposi¸ca˜o 13.12, generaliza a Proposi¸ca˜o 13.5, que era restrita ao caso SO(3). Corol´ ario 13.3 O grupo SO(n) ´e conexo por caminhos e, portanto, ´e conexo.

2

Prova. Pelo que vimos, se R ∈ SO(n), R ´e da forma R = eA , para alguma A ∈ so(n). Logo R pertence ao subgrupo uniparam´etrico de SO(n) gerado por A: {exp(tA), t ∈ }. Esse subgrupo conecta continuamente U a` identidade (que corresponde a t = 0). 

13.5

O Grupo Afim e o Grupo Euclidiano

Seja V um espa¸co vetorial (que, lembremos, ´e um grupo Abeliano em rela¸ca˜o a` opera¸ca˜o de adi¸ca˜o de vetores). Vamos denotar por GL(V ) o conjunto dos operadores lineares bijetores (e, portanto, invert´ıveis) de V em V . Tamb´em sabemos que GL(V ) ´e um grupo. Existe uma a¸ca˜o a` esquerda natural de GL(V ) em V , a saber α : GL(V ) × V → V dada por α(M, v) := M v onde M ∈ GL(V ) e v ∈ V . (Mostre que isso define uma a¸ca˜o a` esquerda).

Dessa forma podemos definir o produto semi-direto de GL(V ) e V , denotado por GL(V )sα V ou simplesmente por GL(V )sV , definindo em GL(V ) × V o produto (M, u) · (M 0 , u0 ) := (M M 0 , M u0 + u) ,

onde M, M 0 ∈ GL(V ) e u, u0 ∈ V . (A no¸ca˜o de produto semi-direto de dois grupos foi definida a` p´agina 73). GL(V )sV ´e denominado o grupo afim do espa¸co vetorial V . Se G for um subgrupo de GL(V ), o produto semi-direto GsV ´e definido analogamente (M, u) · ´ evidente que GsV ´e um subgrupo (M , u0 ) := (M M 0 , M u0 + u) , onde M, M 0 ∈ G e u, u0 ∈ V . E de GL(V )sV . 0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

716/1304

E. 13.51 Exerc´ıcio. Mostre que o conjunto de transla¸co˜es puras formado pelos pares ( , v), v ∈ V ´e um subgrupo normal de GL(V )sV . Sugest˜ao: basta mostrar que trata-se de um subgrupo Abeliano. 6 E. 13.52 Exerc´ıcio. Se G ´e um subgrupo normal de GL(V ), mostre que GsV ´e um subgrupo normal de GL(V )sV . 6 E. 13.53 Exerc´ıcio. Se G ´e um subgrupo de GL(V ), mostre que V 3 u 7→ Ru+v, para (R, v) ∈ GsV , define uma a¸c˜ao `a esquerda de GsV em V . 6

Consideraremos dois exemplos importantes, o grupo Euclidiano15 e o grupo de Poincar´e16 o qual ser´a tratado na Se¸ca˜o 13.7. • O Grupo Euclidiano O chamado grupo Euclidiano em dimens˜ ao n ´e o grupo En := O(n)s

n 

.

O grupo En tem uma a¸ca˜o natural em n dada por n 3 y 7→ Ry + x, para cada elemento (R, x) ∈ En . Assim, En implementa em n transla¸co˜es, rota¸co˜es e reflex˜oes, as chamadas transforma¸co ˜es n Euclidianas de . Essa ´e, em verdade, a pr´opria motiva¸ca˜o da defini¸ca˜o de En . 







E. 13.54 Exerc´ıcio. Mostre que En em n .

n 



H´a um subgrupo de GL(n + 1, 

Ent˜ao, tem-se

   E(R, x) :=   



3 y 7→ Ry + x, para (R, x) ∈ En , define uma a¸c˜ao `a esquerda de 6

) que ´e isomorfo a En . Sejam as matrizes reais (n + 1) × (n + 1)  R

0

 x   ,   1

com R ∈ O(n) e x ∈

n

.



E(R, x) E(R0 , x0 ) := E(RR0 , Rx0 + x) . E. 13.55 Exerc´ıcio importante. Mostre isso.

6

Assim, o conjunto de matrizes {E(R, x) ∈ GL(n + 1, ), com R ∈ O(n) e x ∈ n } forma um subgrupo de GL(n + 1, ) que ´e isomorfo a En . Tamb´em denotaremos esse grupo por En . 





´ltima afirmativa. E. 13.56 Exerc´ıcio. Prove essa u • Os Geradores do Grupo Euclidiano E3 15 16

Euclides de Alexandria (≈ 325 A.C, ≈ 265 A.C.). Jules Henri Poincar´e (1854-1912).

6

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

717/1304

´ poss´ıvel identificar os seguintes sub-grupos uniparam´etricos De particular interesse ´e o caso n = 3. E de E3 , aqueles gerados pelas matrizes E(Rj , 0), j = 1, 2, 3, onde Rj s˜ao as matrizes introduzidas em (13.28) e que geram sub-grupos uniparam´etricos de SO(3) e aqueles gerados pelas matrizes E( , x k ), k = 1, 2, 3, onde x1 = (x, 0, 0), x2 = (0, x, 0) e x3 = (0, 0, x) com x ∈ . Esses subgrupos geram transla¸co˜es nas dire¸co˜es k = 1, 2, 3. 

E. 13.57 Exerc´ıcio importante. Mostre que esses seis subgrupos s˜ao subgrupos uniparam´etricos.

e

Como facilmente se verifica, os geradores desses subgrupos s˜ao as seguintes matrizes:      0 0    0  0  J1 J2 J3           , j := , j := j1 :=  2 3 0  0         0 0 0 0 0 0 0 0 0 0 0 

  p1 :=   

0

1 0 0

0 0 0

0



  ,  



  p2 :=   

0

0 1 0

0 0 0

0



  ,  



  p3 :=   

0 0 0 0

0

0 0 1

0 0 0

0

6

     



  ,  

sendo que J1 , J2 e J3 s˜ao os geradores de SO(3), definidos em (13.29)-(13.31), p´agina 693. Usando a forma das matrizes Jk dada em (13.29)-(13.31), ´e f´acil constatar as seguintes rela¸co˜es de comuta¸ca˜o entre os geradores acima: [ja , jb ] =

3 X

εabc jc ,

[pa , pb ] = 0 ,

c=1

[ja , pb ] =

3 X

εabc pc .

(13.61)

c=1

E. 13.58 Exerc´ıcio. Verifique!

6

As rela¸co˜es (13.61) representam as rela¸co˜es de comuta¸ca˜o da a´lgebra de Lie e 3 do grupo E3 . Note que p1 , p2 e p3 formam uma sub-´algebra Abeliana de e3 e que essa sub-´algebra ´e um ideal de e3 . Esse fato reflete a propriedade que o subgrupo de transla¸co˜es ´e um subgrupo normal de E3 . • Os Geradores do Grupo Euclidiano E2 De maneira an´aloga podemos tratar o caso (mais simples) do grupo E2 . Os elementos de SO(2)s podem ser parametrizados na forma   cos θ − sen θ x1  sen θ cos θ x2  , θ ∈ (−π, π], x1 , x2 ∈ . 0 0 1 

Seus geradores ser˜ao



 0 −1 0 j1 := 1 0 0 , 0 0 0



 0 0 1 p1 := 0 0 0 , 0 0 0



 0 0 0 p2 := 0 0 1 . 0 0 0

2 

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

718/1304

Como ´e f´acil de verificar, as rela¸co˜es de comuta¸ca˜o entre esses geradores s˜ao [j1 , p2 ] = −p1 ,

[j1 , p1 ] = p2 ,

[p1 , p2 ] = 0.

Um elemento gen´erico dessa a´lgebra de Lie ´e da forma    I(J, t) :=   

onde J = θj1 =



0 −θ θ 0





t      0

J

0

0

  t1 t = t 1 p1 + t 2 p2 = t2

e

com −π < θ ≤ π e t1 , t2 ∈ . ´ um exerc´ıcio f´acil (fa¸ca-o) constatar que para todo k ∈ E 

 I(J, t)k = I Jk , Jk−1 t .

Conseq¨ uentemente, vale que

exp (I(J, t)) =

, k ≥ 1, tem-se





 ∞ X   1 I Jk , Jk−1 t =  +  k!  k=1

∞ X 1 I(J, t)k = + k! k=1

onde J

R := e =



cos θ − sen θ sen θ cos θ





t0    ,   1

R 0

0

t0 = f (J)t ,

e

sendo f a fun¸ca˜o anal´ıtica inteira definida pela s´erie de Taylor ∞ X 1 k−1 w , f (w) := 1 + k! k=2

´ f´acil constatar que E

w∈

 w e −1   , w 6= 0 w f (w) =   1, w=0

.

(13.62)

.

A matriz f (J) pode ser calculada facilmente usando-se o fato que 

0 −1 1 0

2k

= (−1)

k

e



0 −1 1 0

2k+1

= (−1)

k



 0 −1 , 1 0

k∈ 

,

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

719/1304

de onde se extrai f (J) :=

=

∞ X 1 k−1 J + k! k=2 ∞ X

∞ X 1 1 2m−1 + J + J2m (2m)! (2m + 1)! m=1 m=1

  X ∞ ∞ X (−1)m θ 2m−1 0 −1 (−1)m θ 2m = + 1 0 (2m)! (2m + 1)! m=1 m=0

Notemos que

  sen θ cos θ − 1 0 −1 + = 1 0 θ θ   sen θ cos θ − 1 −   θ θ   =   .  cos θ − 1 sen θ  θ θ det f (J) = 2



1 − cos θ θ2



6= 0

  x1 para −π < θ ≤ π. Assim, f (J) ´e invert´ıvel e se escolhermos t = f (J) x, para qualquer x = ∈ x2 teremos       cos θ − sen θ x 1 R x     =  sen θ cos θ x2  . exp I(J, f (J)−1 x) =      0 0 1 0 0 1 −1

2 

Isso prova que todo elemento do grupo SO(2)s 2 pode ser escrito como exponencial de um elemento da sua pr´opria a´lgebra de Lie. Essa afirma¸ca˜o ´e igualmente v´alida para todo os grupos SO(n)s n . A demonstra¸ca˜o segue passos an´alogos aos de acima pois, como observamos na Se¸ca˜o 13.4.3, p´agina 710, os elementos de SO(n) podem ser escritos em uma base conveniente na forma de blocos de matrizes de SO(2). Isso implicar´a que tamb´em no caso geral a matriz f (J) ´e invert´ıvel. Deixamos os detalhes da demonstra¸ca˜o como exerc´ıcio ao leitor. 



13.6

O Grupo de Lorentz

Para a leitura desta se¸ca˜o uma certa familiaridade com os rudimentos da teoria da relatividade restrita ´e recomend´avel, mas n˜ao totalmente indispens´avel.

JCABarata. Curso de F´ısica-Matem´ atica

13.6.1

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

720/1304

O Espa¸ co-Tempo, a No¸ c˜ ao de Intervalo e a Estrutura Causal

´ um fato elementar da natureza ser poss´ıvel descrever qualquer evento idealmente pontual e de dura¸ca˜o E instantˆanea por uma cole¸ca˜o de quatro n´ umeros que especificam sua posi¸ca˜o espacial e seu instante de tempo, medidos em algum sistema de referˆencia. A cole¸ca˜o de todos os eventos pontuais de dura¸ca˜o instantˆanea, ´e denominada espa¸co-tempo, no¸ca˜o introduzida por Minkowski 17 . Assim, ´e natural (pelo menos na ausˆencia de campos gravitacionais, que podem alterar a topologia global do espa¸co-tempo) identificar o mesmo com o espa¸co matem´atico 4 . Assim descrito, cada evento pode ser especificado em um sistema de referˆencia que adote coordenadas espaciais cartesianas, por uma quadrupla ordenada (x1 , x2 , x3 , x4 ), onde convencionamos que os trˆes primeiros n´ umeros s˜ao coordenadas espaciais do evento e o u ´ ltimo sua coordenada temporal. O leitor deve ser advertido que muitos autores convencionam escrever as coordenadas espa¸co-temporais de um evento na forma (x0 , x1 , x2 , x3 ), onde x0 ´e a coordenada temporal. Isso alteraria a forma das matrizes que ser˜ao manuseadas abaixo, mas n˜ao a essˆencia dos resultados que apresentaremos. 

Na mecˆanica cl´assica, a primeira lei de Newton18 afirma existirem certos sistemas de referˆencia dotados da seguinte propriedade: se um corpo encontra-se isolado do restante do universo, ou seja, se sobre ele n˜ao atuam for¸cas externas, ent˜ao em rela¸ca˜o a esse sistema de referˆencia esse corpo se move com velocidade constante. Tais sistemas de referˆencia s˜ao denominados sistemas de referˆencia ´ muito f´acil concluir que se um sistema de referˆencia inerciais, pois neles vale o princ´ıpio de in´ercia. E se move com velocidade constante em rela¸ca˜o a um sistema de referˆencia inercial, ent˜ao ele ´e tamb´em um sistema de referˆencia inercial. Sistemas de referˆencia inerciais desempenham um papel central pois neles as Leis da F´ısica assumem ´ um postulado fundamental da F´ısica que suas leis b´asicas s˜ao as mesmas em um caracter universal. E todos os sistemas de referˆencia inerciais. Na mesma linha, ´e um postulado fundamental da F´ısica que tamb´em suas constantes fundamentais, tais como a velocidade da luz c, a constante de Planck 19 ~, a constante de gravita¸ca˜o universal G e outras tenham tamb´em o mesmo valor em todos os sistemas de referˆencia inerciais. Mais que isso, os sistemas de referˆencia inerciais concordam quanto a`s rela¸co˜es de causa e efeito entre todos os eventos ocorridos no espa¸co-tempo. Essa s´erie de princ´ıpios aqui mal-delineados ´e por vezes denominada princ´ıpio da relatividade. O princ´ıpio da relatividade tem sua origem nos trabalhos de Galilei20 sobre a dinˆamica, mas foi com a Teoria da Relatividade de Einstein21 que suas reais conseq¨ uˆencias foram exploradas em sua m´axima extens˜ao. Ao realizarmos transforma¸co˜es entre sistemas de coordenadas inerciais, as coordenadas dos eventos transformam-se linearmente. Esse postulado ´e familiar se nos lembramos da a¸ca˜o do grupo de transla¸co˜es, da a¸ca˜o do grupo de rota¸co˜es no espa¸co tridimensional ou das transforma¸co˜es de Galilei da mecˆanica cl´assica (n˜ao-relativista). Assim, cada transforma¸ca˜o entre sistemas de coordenadas inerciais deve ser representada na forma Lx + t, onde L ´e uma matriz real  4 × 4 e x e t s˜ao vetores de 4 . Aqui, 

x e t s˜ao representados na forma de um vetor coluna, como x =

x1 x2 x3 x4

.

O vetor t representa uma transla¸ca˜o (tanto no espa¸co quanto no tempo) entre os sistemas de

17

Hermann Minkowski (1864-1909). A express˜ ao “espa¸co-tempo” provem do alem˜ ao “Raumzeit”. Isaac Newton (1643-1727). 19 Max Karl Ernst Ludwig Planck (1858-1947). 20 Galileu Galilei (1564-1642). 21 Albert Einstein (1879-1955). 18

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

721/1304

coordenadas. Cada matriz L ∈ Mat ( , 4) deve depender das velocidades relativas entre os sistemas inerciais cuja transforma¸ca˜o descreve, da dire¸ca˜o dessas velocidades e dos aˆngulos relativos entre os eixos cartesianos espaciais dos dois sistemas. L deve tamb´em conter informa¸ca˜o sobre se os eixos cartesianos espaciais dos dois sistemas tˆem a mesma orienta¸ca˜o (positiva ou negativa) e sobre se os rel´ogios dos dois sistemas correm na mesma dire¸ca˜o. 

Dados dois eventos quaisquer x, y no espa¸co-tempo (que doravante identificaremos com 4 ) e cujas coordenadas sejam x = (x1 , x2 , x3 , x4 ) e y = (y1 , y2 , y3 , y4 ) em um determinado sistema de referˆencia inercial, define-se o intervalo entre ambos como sendo a quantidade22 

I(x, y) = I(x − y) := (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 − c2 (x4 − y4 )2 , onde c ´e a velocidade da luz no sistema de referˆencia inercial em quest˜ao. A no¸ca˜o de intervalo entre eventos ´e de grande importˆancia. Para come¸car a explicar isso consideremos a situa¸ca˜o na qual dois eventos distintos x e y representam a produ¸ca˜o e a absor¸ca˜o de um mesmo raio luminoso, respectivamente. Se em um determinado sistema de referˆencia inercial as coordenadas desses eventos s˜ao x = (x1 , x2 , x3 , x4 ) e y = (y1 , y2 , y3 , y4 ), ent˜ao a velocidade de propaga¸ca˜o da luz entre x e y satisfaz (y1 − x1 )2 + (y2 − x2 )2 + (y3 − x3 )2 c2 = (y4 − x4 )2

e, portanto, I(y, x) = I(y − x) = 0. Um dos postulados fundamentais da teoria da relatividade restrita ´e a afirma¸ca˜o que a velocidade de propaga¸ca˜o da luz no v´acuo ´e a mesma para qualquer sistema de referˆencia inercial. Portanto, se em um outro sistema de referˆencia inercial as coordenadas de x e y fossem x0 = (x01 , x02 , x03 , x04 ) e y 0 = (y10 , y20 , y30 , y40 ) ter´ıamos igualmente c2 =

(y10 − x01 )2 + (y20 − x02 )2 + (y30 − x03 )2 (y40 − x04 )2

e, portanto, tem-se igualmente I(y 0 , x0 ) = I(y 0 − x0 ) = 0 com o mesmo valor c para a velocidade de propaga¸ca˜o da luz. Compreendemos ent˜ao que o postulado da constˆancia da velocidade da luz pode ser traduzido matematicamente da seguinte forma: se o intervalo entre dois eventos ´e nulo em um sistema de referˆencia inercial ent˜ ao ´e tamb´em nulo em todos os demais sistemas de referˆencia inerciais. Mais adiante provaremos que, sob certas hip´oteses f´ısicas adicionais, esse fato implica uma condi¸ca˜o ainda mais geral de invariˆancia: o intervalo entre dois eventos quaisquer ´e o mesmo em qualquer sistema de referˆencia inercial, mesmo quando n˜ao ´e nulo. Nota. Independente de ser um postulado te´ orico, a constˆ ancia da velocidade da luz ´e um fato experimental que tem sofrido sucessivas confirma¸co ˜es ao longo de v´ arias d´ecadas. Para uma lista possivelmente parcial de referˆencias recentes (das u ´ltimas quatro d´ecadas) contendo testes experimentais da constˆ ancia da velocidade da luz e testes da velocidade da luz como velocidade limite, vide: 1. T. S. Jaseja, A. Javan, J. Murray and C. H. Townes. “Test of Special Relativity or of the Isotropy of Space by Use of Infrared Masers”. Phys. Rev. A133, A1221-A1125 (1964). 2. T. Alv¨ ager, F. J. M. Farley, J. Kjellman and I. Wallin. “Test of the Second Postulate of Special Relativity in the GeV Region”. Phys. Lett. 12, 260-263 (1964). 22

Novamente supomos a ausˆencia de campos gravitacionais, em cuja presen¸ca a defini¸ca ˜o de intervalo tem que ser modificada.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

722/1304

3. D. I. Blotkhintsev. “Basis for Special Relativity Theory Provided by Experiments in High Energy Physics”. Sov. Phys. Uspekhi, 9, 405 (1966). 4. Z. G. T. Guiragossi´ an, G. B. Rothbart, M. R. Yearian, R. A. Gearhart and J. J. Murray. “Relative Velocity Measurements of Electrons and Gamma Rays at 15 GeV”. Phys. Rev. Lett. 34, 335-338 (1975). 5. K. Brecher. “Is the Speed of Light Independent of the Velocity of the Source?”. Phys. Rev. Lett. 39, 1051-1054, 1236(E) (1977). 6. D. Newman, G. W. Ford, A. Rich and E. Sweetman. “Precision Experimental Verification of Special Relativity”. Phys. Rev. Lett. 40, 1355-1358 (1978). 7. K. M. Baird, D. S. Smith and B. G. Whitford. “Confirmation of the Currently Accepted Value 299 792 458 Metres per Second for the Speed of Light”. Opt. Comm. 31, 367-368 (1979). 8. G. L. Greene, M. Scott Dewey, E. G. Kessler, Jr. and E. Fischbach. “Test of Special Relativity by a Determination of the Lorentz Limiting Velocity: Does E = mc2 ?”. Phys. Rev. D 44, R2216-R2219 (1991). 9. Bradley E. Schaefer. “Severe Limits on Variations of the Speed of Light with Frequency”. Phys. Rev. Lett. 82, 4964 (1999). Para um texto recente, vide [140]23 .

Notemos que o intervalo depende da diferen¸ca x − y. Assim, transla¸co˜es entre sistemas de referˆencia automaticamente mantˆem invariantes os intervalos entre eventos. Por essa raz˜ao vamos por ora interessar-nos apenas por transforma¸co˜es entre sistemas de referˆencia que sejam do tipo Lx, com L ∈ Mat ( , 4). 

Para prosseguirmos precisamos introduzir uma importante classifica¸ca˜o de intervalos.

• Intervalos de Tipo Luz, de Tipo Tempo e de Tipo Espa¸ co Em um sistema de referˆencia, dois eventos distintos x e y s˜ao ditos ser24 1. do tipo luz se I(x, y) = 0, 2. do tipo tempo se I(x, y) < 0, 3. do tipo espa¸co se I(x, y) > 0. Se dois eventos distintos x = (x1 , x2 , x3 , x4 ) e y = (y1 , y2 , y3 , y4 ) s˜ao do tipo luz, ent˜ao (y1 − x1 )2 + (y2 − x2 )2 + (y3 − x3 )2 = c2 . 2 (y4 − x4 )

Se dois eventos distintos x = (x1 , x2 , x3 , x4 ) e y = (y1 , y2 , y3 , y4 ) s˜ao do tipo tempo, ent˜ao (y1 − x1 )2 + (y2 − x2 )2 + (y3 − x3 )2 < c2 . (y4 − x4 )2 Se dois eventos distintos x = (x1 , x2 , x3 , x4 ) e y = (y1 , y2 , y3 , y4 ) s˜ao do tipo espa¸co, ent˜ao (y1 − x1 )2 + (y2 − x2 )2 + (y3 − x3 )2 > c2 . 2 (y4 − x4 ) Com isso entendemos que 23

Agradecemos a ` Profa. Renata Zukanovich Funchal pelas referˆencias acima. As express˜ oes em inglˆes s˜ ao “light-like”, “time-like” e “space-like”, respectivamente. Essa nomenclatura prov´em do alem˜ ao: “lichtartig”, “zeitartig” e “raumartig”. 24

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

723/1304

1. Se dois eventos s˜ao separados por um intervalo do tipo luz pode haver um sinal conectando ambos e que se propagaria com a velocidade da luz. 2. Se dois eventos s˜ao separados por um intervalo do tipo tempo pode haver um sinal conectando ambos e que se propagaria com velocidade menor que a da luz. 3. Se dois eventos s˜ao separados por um intervalo do tipo espa¸co n˜ao pode haver um sinal conectando ambos, pois o mesmo se propagaria com velocidade maior que a da luz. ´ uma cren¸ca da f´ısica atual que as part´ıculas A importˆancia dessas considera¸co˜es ´e a seguinte. E elementares (que compoem toda a mat´eria do universo) n˜ao podem mover-se com velocidade maior que a da luz. Conseq¨ uentemente, se dois eventos s˜ao separados por um intervalo do tipo espa¸co n˜ao pode haver nenhum processo f´ısico que, iniciando-se em um evento, influencie o outro. Diz-se ent˜ao que esses eventos s˜ao causalmente desconectados, ou seja, n˜ao pode haver nenhuma rela¸ca˜o causal (isto ´e, de causa e efeito) entre ambos. Por outro lado, se dois eventos s˜ao separados por um intervalo do tipo tempo ent˜ao pode haver alguma influˆencia causal entre ambos, por exemplo, atrav´es de uma part´ıcula ou corpo material que, movendo-se no espa¸co-tempo com velocidades inferiores a` da luz, parta de um evento e influencie o outro. No caso de intervalos do tipo luz a situa¸ca˜o ´e a mesma mas, ent˜ao, a eventual influˆencia de um no outro deve propagar-se com a velocidade da luz. E. 13.59 Exerc´ıcio. Passe v´arios dias meditando sobre os par´agrafos acima.

6

• A Estrutura Causal. Transforma¸ co ˜es que Preservam a Estrutura Causal Como se percebe, se aceitarmos a id´eia que processos f´ısicos n˜ao podem propagar-se com velocidades superiores a` da luz, a no¸ca˜o de intervalo estabelece as poss´ıveis rela¸co˜es de causalidade entre todos os eventos do espa¸co-tempo, ao dizer quais eventos podem eventualmente influenciar-se (aqueles que s˜ao do tipo tempo ou do tipo luz um em rela¸ca˜o ao outro) e quais n˜ao podem de forma alguma influenciar-se (aqueles que s˜ao do tipo espa¸co um em rela¸ca˜o ao outro). ´ uma cren¸ca da F´ısica atual que essas rela¸co˜es de causalidade devem ser as mesmas para todos os E sistemas de referˆencia inerciais, pois os mesmos descrevem as mesmas leis f´ısicas e devem perceber as mesmas rela¸co˜es de causa e efeito entre os eventos que compoem o universo. E. 13.60 Exerc´ıcio. Mais alguns dias de medita¸c˜ao.

6

Com isso, podemos introduzir a seguinte defini¸ca˜o: dizemos que uma transforma¸ca˜o linear L, que representa uma transforma¸ca˜o entre dois sistemas de referˆencia, preserva a estrutura causal do espa¸cotempo se a mesma satisfizer todas as trˆes condi¸co˜es seguintes: 1. I(Lx, Ly) = 0 sempre que I(x, y) = 0, 2. I(Lx, Ly) < 0 sempre que I(x, y) < 0, 3. I(Lx, Ly) > 0 sempre que I(x, y) > 0.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

724/1304

Em palavras, L preserva o tipo de intervalo que separa todos os eventos do espa¸co-tempo, levando todos os intervalos do tipo luz em intervalos do tipo luz, levando todos os intervalos do tipo tempo em intervalos do tipo tempo e levando todos os intervalos do tipo espa¸co em intervalos do tipo espa¸co. Notemos que a condi¸ca˜o que imp˜oe que I(Lx, Ly) = 0 sempre que I(x, y) = 0 ´e a condi¸ca˜o da invariˆancia da velocidade da luz (j´a mencionada acima), mas as demais representam algo diferente: a invariˆancia das rela¸co˜es de causalidade por mudan¸ca de sistemas de referˆencia inerciais. Um pouco mais abaixo exploraremos as conseq¨ uˆencias matem´aticas que essas imposi¸co˜es tˆem sobre as transforma¸co˜es L e concluiremos que, sob as hip´oteses acima (e sob uma hip´otese adicional de ausˆencia de dilata¸co˜es), vale uma conseq¨ uˆencia mais forte, a saber, que I(Lx, Ly) = I(x, y) para todos os eventos x e y. Assim, transforma¸co˜es que preservam a estrutura causal e n˜ao envolvem dilata¸co˜es preservam o valor do intervalo entre dois eventos quaisquer do espa¸co-tempo. Por fim, apenas a t´ıtulo de ilustra¸ca˜o, exemplifiquemos como seria uma transforma¸ca˜o que preserva os intervalos de tipo luz mas n˜ao os demais, preservando, portanto, a velocidade da luz mas violando a estrutura causal. Consideremos um espa¸co-tempo bidimensional, onde  0 cada  evento ´e descrito por c uma coordenada espacial x1 e uma temporal t. Seja a matriz L = . O intervalo entre os c−1 0   x  0 1 seria I(x, 0) = x21 − c2 t2 . Por´em, pela transforma¸ca˜o L ter´ıamos e 0 = eventos x = t 0  x   ct   0 x1 1 . Assim, = L = −1 0 t c

t

x1

I(Lx, L0) = (x01 )2 − c2 (t0 )2 = c2 t2 − x21 = − I(x, 0).

Logo, como os intervalos I(Lx, L0) e I(x, 0) diferem por um sinal, ter´ıamos para quaisquer eventos x ey 1. I(Lx, Ly) = 0 sempre que I(x, y) = 0, 2. I(Lx, Ly) < 0 sempre que I(x, y) > 0, 3. I(Lx, Ly) > 0 sempre que I(x, y) < 0. Portanto, intervalos tipo luz seriam levados em intervalos tipo luz, mas intervalos tipo espa¸co seriam levados em intervalos tipo tempo e vice-versa. Como se vˆe por esse exemplo, em transforma¸co˜es que violam a estrutura causal deve haver algo como uma permuta¸ca˜o entre coordenadas espaciais e temporais. E. 13.61 Exerc´ıcio. S˜ao tais transforma¸co˜es fisicamente aceit´aveis?

6

• Dilata¸ co ˜es Vamos agora discutir uma classe de transforma¸co˜es que preservam a estrutura causal: as dilata¸co˜es. Para λ ∈ , λ 6= 0, a matriz D(λ) := λ simplesmente transforma cada x ∈ 4 em λx, ou seja, ´ D(λ) representa uma dilata¸ca ˜o ou mudan¸ca de escala das coordenadas espa¸co-temporais de eventos. E 2 evidente que I(D(λ)x, D(λ)y) = λ I(x, y), de modo que dilata¸co˜es s˜ao transforma¸co˜es lineares que preservam a estrutura causal. 



JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

725/1304

S˜ao as dilata¸co˜es aceit´aveis enquanto mudan¸cas de sistemas de referˆencia inerciais? Essa ´e uma quest˜ao muito interessante e sutil e demanda uma certa discuss˜ao. Claramente, mudan¸cas de escala podem ocorrer naturalmente no caso de tratarmos de dois sistemas de referˆencia que adotam sistemas m´etricos diferentes, como no caso em que um sistema mede distˆancias em metros e um outro em jardas (mas de modo que as medidas de tempo em um e outro sejam tais que ambos atribuem o mesmo valor num´erico para c). Essas situa¸co˜es s˜ao triviais e poderiam ser contornadas se ambos os sistemas de referˆencia concordassem no uso de uma mesma escala de distˆancias. Mas para que isso seja poss´ıvel ´e preciso que haja objetos f´ısicos, em repouso em ambos os sistemas de referˆencia, que possuam as mesmas dimens˜oes. Poder´ıamos, por exemplo, adotar como unidade de distˆancia o “tamanho m´edio” do a´tomo de hidrogˆenio25 , ou o comprimento de onda de uma linha de emiss˜ao de um certo a´tomo ou mol´ecula, fixos em cada sistema de referˆencia. Mas o que garante que o tamanho m´edio de um a´tomo de hidrogˆenio parado na Terra ´e o mesmo que o de um a´tomo de hidrogˆenio parado em uma gal´axia distante que se move em rela¸ca˜o a n´os com uma certa velocidade? A princ´ıpio, nada garante, mas a cren¸ca que sistemas de referˆencia inerciais descrevem a mesma f´ısica envolve tamb´em a cren¸ca que certas escalas b´asicas de distˆancia e de tempo, como o tamanho m´edio de um a´tomo em repouso, s˜ao as mesmas em todos os sistemas de referˆencia inerciais. Por exemplo, o tamanho m´edio do a´tomo de hidrogˆenio em repouso depende de propriedades f´ısicas que regem a intera¸ca˜o entre o pr´oton e o el´etron que o constituem (a lei de Coulomb 26 ), das leis da mecˆanica que regem seus movimentos (as leis da mecˆanica quˆantica), assim como dos valores das cargas el´etricas e das massas de repouso dessas part´ıculas. Essas grandezas e leis devem ser as mesmas em quaisquer sistemas de referˆencia inerciais. Intimamente associada a isso est´a a quest˜ao dos valores das massas de repouso das part´ıculas elementares. Isso se deve ao fato seguinte. A f´ısica quˆantica nos ensina que se m 0 ´e a massa de repouso de uma part´ıcula elementar, digamos um el´etron, ent˜ao a quantidade ~/(m0 c) tem dimens˜ao de comprimento (verifique!). Esse ´e o chamado comprimento de onda Compton27 da part´ıcula de massa de repouso m0 . Assim, para qualquer part´ıcula de massa de repouso m0 h´a uma escala de distˆancia a ela associada. ´ parte da cren¸ca associada ao princ´ıpio da relatividade que as massas em repouso das part´ıculas E elementares, como el´etrons, quarks etc., s˜ao as mesmas quer na Terra quer em uma gal´axia distante que se move em rela¸ca˜o a n´os com velocidade constante. At´e onde se sabe, essa hip´otese tem corrobora¸ca˜o experimental, pois sua viola¸ca˜o levaria a conseq¨ uˆencias observacionais em rela¸ca˜o ao comportamento da mat´eria que nunca foram verificadas quer em observa¸co˜es astronˆomicas quer em experimentos com aceleradores de part´ıculas feitos na Terra. Como ~ e c s˜ao constantes f´ısicas, devem tamb´em ser as mesmas em quaisquer sistemas de referˆencia inerciais e, portanto, o comprimento de onda Compton de, digamos, um el´etron em repouso deve ser o mesmo em qualquer sistema de referˆencia inercial e com ele poder´ıamos estabelecer uma escala de distˆancias universal. Em um universo em que n˜ao houvessem escalas de distˆancia ou de massa naturais, como por exemplo no caso de universos em que todas as part´ıculas elementares tˆem massa nula e n˜ao formam estados 25

A no¸ca ˜o de “tamanho m´edio” de um a ´tomo pode ser definida na mecˆ anica quˆ antica, mas n˜ ao entraremos em detalhes aqui. 26 Charles Augustin de Coulomb (1736-1806). 27 Arthur Holly Compton (1892-1962). Compton recebeu o prˆemio Nobel de F´ısica de 1927 “for his discovery of the effect named after him”.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

726/1304

ligados (como a´tomos) que possuam alguma escala de distˆancia t´ıpica, n˜ao haveria maneira de sistemas de referˆencia inerciais concordarem com escalas espaciais e temporais e, a´ı, a inclus˜ao de dilata¸co˜es seria inevit´avel nas transforma¸co˜es entre sistemas de referˆencia. Esse n˜ao ´e o caso do universo em que vivemos, pois nele sabidamente habitam part´ıculas massivas. Assim, apesar de as dilata¸co˜es satisfazerem a condi¸ca˜o de n˜ao violarem a estrutura causal do espa¸co-tempo, as mesmas n˜ao devem ser consideradas como transforma¸co˜es leg´ıtimas de coordenadas espa¸co-temporais entre sistemas de referˆencia inerciais no nosso universo, pois partimos da cren¸ca que esses sistemas podem sempre concordar quanto a certas escalas b´asicas de certos objetos f´ısicos em repouso, tais como as massas de repouso de certas part´ıculas elementares e seus comprimentos de onda Compton. E. 13.62 Exerc´ıcio. Mais medita¸c˜ao.

6

• A Conven¸ c˜ ao que c = 1 Daqui por diante adotaremos a conven¸ca˜o simplificadora que c = 1. Isso pode ser obtido pela escolha de um sistema de unidades m´etricas conveniente. Essa conven¸ca˜o, muito empregada atualmente em textos de f´ısica te´orica28 , tem a vantagem de “limpar” as express˜oes matem´aticas de fatores que dependam de c. Admitidamente, h´a uma certa “pregui¸ca” na ado¸ca˜o dessa conven¸ca˜o, mas a mesma traz vantagens. De qualquer forma, os fatores c omitidos podem ser facilmente recuperados por considera¸co˜es de an´alise dimensional. • Nota¸ c˜ ao Matricial. A M´ etrica de Minkowski ´ muito conveniente escrever o intervalo entre dois eventos x e y com uso da seguinte nota¸ca˜o E matricial: I(x − y) = (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 − (x4 − y4 )2 = h(x − y), η(x − y)i , 

onde



1 0  0 1 η := η(3, 1) =   0 0 0 0





0 0   0 0   =    1 0  0 −1

0 0 0 0 0 0

−1



  .  

E. 13.63 Exerc´ıcio. Verifique.

(13.63)

6

A matriz η ´e freq¨ uentemente denominada m´etrica de Minkowski.

13.6.2

A Invariˆ ancia do Intervalo

No que vimos acima, aprendemos que o postulado da invariˆancia da velocidade de propaga¸ca˜o da luz quando de uma transforma¸ca˜o entre sistemas de referˆencia inerciais implica que se x e y s˜ao dois eventos 28

Em textos te´ oricos de mecˆ anica quˆ antica e teoria quˆ antica de campos, adota-se tamb´em ~ = 1.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

727/1304

tais que I(x, y) = h(x − y), η(x − y)i 

= 0

(13.64)

ent˜ao tem-se tamb´em I(Lx, Ly) = hL(x − y), ηL(x − y)i 

= 0

(13.65)

para qualquer transforma¸ca˜o linear L ∈ Mat ( , 4) que represente uma mudan¸ca entre sistemas de referˆencia inerciais. 

Nesta se¸ca˜o iremos provar uma afirma¸ca˜o, o Teorema 13.7, adiante, que generaliza ainda mais o descrito no u ´ ltimo par´agrafo, a saber, provaremos que se L ∈ Mat ( , 4) representa uma mudan¸ca entre sistemas de referˆencia inerciais que preserva a estrutura causal e n˜ ao envolve dilata¸co ˜es (defini¸co˜es adiante) ent˜ao I(x, y) = I(Lx, Ly) para quaisquer eventos x e y, mesmo aqueles para os quais I(x, y) 6= 0. Esse fato releva a importˆancia da no¸ca˜o de intervalo na teoria da relatividade: o mesmo representa uma grandeza invariante por transforma¸co˜es de sistemas de referˆencia do tipo descrito acima. Dessa propriedade de invariˆancia extrairemos todas as informa¸co˜es importantes sobre as transforma¸co˜es de Lorentz. 

• Transforma¸ co ˜es Lineares e a Estrutura Causal Vamos aqui provar um teorema de importˆancia central no entendimento da rela¸ca˜o entre transforma¸co˜es L ∈ Mat ( , 4) e sua rela¸ca˜o com a estrutura causal do espa¸co-tempo. 

Teorema 13.7 Seja L um elemento de Mat ( , 4) que representa uma mudan¸ca entre sistemas de referˆencia inerciais que preserva os intervalos de tipo luz. Ent˜ ao,  ηLT ηL = − LT ηL 44 = ±| det(L)|1/2 . (13.66) 

Se al´em disso L preserva a estrutura causal, ent˜ ao,  ηLT ηL = − LT ηL 44

= | det(L)|1/2 .

(13.67)

Por fim, se L preserva a estrutura causal e n˜ ao envolve dilata¸co ˜es, ent˜ ao ηLT ηL =

.

(13.68)

Uma conseq¨ uˆencia imediata dessa rela¸ca ˜o ´e que I(Lx, Ly) = I(x, y) para todos x, y ∈ Prova. Para x ∈

4 

4 

.

2

, sejam as formas quadr´aticas

I(x) := hx, ηxi 

e

J(x) := hLx, ηLxi 

= hx, LT ηLxi . 

´ bastante claro que E I(x) = −(x4 )2 + k~xk2 = − [x4 − k~xk] [x4 + k~xk] , p onde ~x = (x1 , x2 , x3 ) e k~xk = x21 + x22 + x23 . Por outro lado,   J(x) = LT ηL 44 (x4 )2 + a(~x)x4 + b(~x) = LT ηL 44 [x4 − y1 (~x)] [x4 − y2 (~x)] ,

(13.69)

(13.70)

JCABarata. Curso de F´ısica-Matem´ atica

onde29 a(~x) := 2

3 X

LT ηL

a=1

sendo que − LT ηL



44



4a

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

xa ,

e

3 X

b(~x) :=

LT ηL

a, b=1

(y1 (~x) + y2 (~x)) = a(~x)

LT ηL

e



44



728/1304

xa xb ,

ab

y1 (~x)y2 (~x) = b(~x).

Sabemos por (13.64)-(13.65) (tomando y = 0) que se L preserva intervalos tipo luz, ent˜ao se tivermos I(x) = 0 para algum x ∈ 4 , valer´a tamb´em J(x) = 0. Para ~x fixo qualquer, vemos por (13.69) e (13.70) que tanto I(x) quanto J(x) s˜ao polinˆomios de segundo grau em x4 e, pelo que acabamos de comentar, tˆem os mesmos zeros. Dessa forma, tamb´em por (13.69) e (13.70), podemos sem perda de generalidade escolher y1 (~x) = k~xk e y2 (~x) = −k~xk. 

Com isso teremos que

J(x) = 4

para todo x ∈ 

LT ηL



44

(x4 − k~xk)(x4 + k~xk) = − LT ηL

. Pela defini¸ca˜o de I(x) e J(x) temos ent˜ao  hLx, ηLxi = − LT ηL 44 hx, ηxi . 

para todo x ∈

4



44

I(x)

(13.71)



, ou seja

   hx, LT ηL + LT ηL 44 η xi = 0  para todo x ∈ 4 . Como LT ηL + LT ηL 44 η ´e uma matriz sim´etrica (verifique!), a Proposi¸ca˜o 2.5,  p´agina 126, implica LT ηL + LT ηL 44 η = 0. Como η 2 = , segue que 





ηLT ηL = − LT ηL



44

.

(13.72)

Como det(η) = −1 e det(L) = det(LT ), obtemos ao tomar o determinante de ambos os lados da igualdade acima que   4 det(L)2 = − LT ηL 44 de onde extra´ımos que

− LT ηL

Com (13.72), isso prova (13.66).



44

= ±| det(L)|1/2 .

(13.73)

Inserindo (13.73) em (13.71) ter´ıamos hLx, ηLxi = ±| det(L)|1/2 hx, ηxi para todo x ∈ 4 . Portanto, se L preserva a estrutura causal, apenas o sinal positivo ´e aceit´avel. Assim, por (13.72), temos nesse caso LT ηLη = | det(L)|1/2 e isso completa a prova de (13.67). 





Seja agora L o conjunto de todas as matrizes L0 ∈ Mat ( , 4) que satisfazem ηLT0 ηL0 = . Afirmamos que se L satisfaz (13.67) ent˜ao L ´e da forma L = λL0 com λ ∈ e L0 ∈ L. De fato, −1 T −1 se L 6= 0 satisfaz (13.67) teremos para qualquer λ 6= 0 que η(λ L) η(λ L) = λ−2 | det(L)|1/2 e escolhendo λ = | det(L)|1/4 conclu´ımos que λ−1 L ∈ L. 



29

Aqui usou-se que LT ηL



4a

= LT ηL



a4

pois LT ηL ´e sim´etrica, ou seja LT ηL

T

= LT ηL.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

729/1304

Assim, se L satisfaz (13.67), L ´e produto de uma transforma¸ca˜o de L com uma transforma¸ca˜o D(λ) = λ , λ ∈ , λ 6= 0. Se L n˜ao envolve dilata¸co˜es ent˜ao L ∈ L. Isso prova (13.68). 

Como vemos, um papel especial ´e desempenhado pelas matrizes de L. Por toda nossa discuss˜ao tais matrizes representam as transforma¸co˜es entre sistemas de referˆencia que respeitam a imposi¸ca˜o f´ısica de preservar a estrutura causal e ignoram dilata¸co˜es. Daqui por diante vamos nos concentrar exclusivamente em tais transforma¸co˜es. Como veremos, o conjunto L introduzido acima tem a estrutura de um grupo, um fato de grande importˆancia. Trata-se do chamado grupo de Lorentz, um objeto de importˆancia central na teoria da relatividade.

13.6.3

O Grupo de Lorentz

O Teorema 13.7 acima diz-nos que se L ∈ Mat ( , 4) representa uma transforma¸ca˜o entre sistemas de referˆencia inerciais que preserva a estrutura causal e n˜ao envolve dilata¸co˜es, ent˜ao ηL T ηL = , o que equivale a dizer que L−1 = ηLT η. Isso tamb´em equivale a dizer que 

hLx, ηLyi 

= hx, ηyi 

para todos x, y ∈ 4 . Esse fato e a particular forma da matriz η mostram que o conjunto de tais matrizes L coincide com o grupo O(3, 1), que previamente definimos (vide p´agina 684). 

Devido a` sua grande importˆancia na f´ısica relativ´ıstica, o grupo O(3, 1) recebe denomina¸ca˜o especial, a saber, ´e denominado grupo de Lorentz30 , em honra ao grande f´ısico holandˆes, pioneiro nos estudos da teoria da relatividade. O(3, 1) ´e tamb´em denotado pelo s´ımbolo L. Os elementos de L s˜ao denominados transforma¸co ˜es de Lorentz. Equivalentemente, o grupo de Lorentz L = O(3, 1) ´e o grupo de todas as matrizes 4 × 4 que satisfazem L−1 = ηLT η. Como todo elemento L do grupo de Lorentz satisfaz LηLT η = , tem-se det(LηLT η) = 1, ou seja, det(L)2 = 1 pois det(LηLT η) = det(L) det(η)2 det(LT ), det(η) = −1 e det(L) = det(LT ). Assim, det(L) = ±1. O subconjunto SO(3, 1) de O(3, 1), formado pelas matrizes L que satisfazem det(L) = +1 ´e um sub-grupo, denotado tamb´em por L+ . A seguinte proposi¸ca˜o sobre o grupo de Lorentz ser´a usada adiante: Proposi¸ c˜ ao 13.14 Se L ∈ L ent˜ ao LT ∈ L.

2

Prova. Sabemos que para qualquer matriz M vale (M T )T = M e que para qualquer matriz invert´ıvel M vale (M T )−1 = (M −1 )T (por que?). Se L ∈ L, tem-se por defini¸ca˜o que L−1 = ηLT η. Assim, como η T = η, segue que T L−1 = ηLη, ou seja,

LT

30

Hendrik Antoon Lorentz (1853-1928).

−1

= η LT

T

η,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

730/1304

que ´e o que se queria provar.

• O Grupo de Poincar´ e Retornemos brevemente a`s transforma¸co˜es afins gerais que preservam intervalos e que, como vimos, s˜ao da forma Lx + t, com t ∈ 4 sendo uma transla¸ca˜o e L ∈ L. A composi¸ca˜o de duas de tais transforma¸co˜es L0 x + t0 e Lx + t, ´e a transforma¸ca˜o L0 (Lx + t) + t0 = L0 Lx + L0 t + t0 . 

Essa u ´ ltima express˜ao naturalmente conduz ao seguinte. Seja P := L × 4 o conjunto de todos os pares ordenados (L, t) com L ∈ L e t ∈ 4 . Ent˜ao P ´e um grupo com o produto definido por 



(L0 , t0 ) · (L, t) := (L0 L, L0 t + t0 ). Como se vˆe, esse produto faz de P o produto semi-direto Ls definido a` p´agina 74.

4 

. O produto semi-direto de grupos foi

E. 13.64 Exerc´ıcio. Verifique que o produto acima ´e de fato associativo. Identifique o elemento neutro e determine a inversa de cada par (L, t) ∈ P. 6 Esse grupo, que combina transforma¸co˜es de Lorentz e transla¸co˜es, ´e denominado grupo de Poincar´e31 em homenagem ao eminente matem´atico francˆes que tamb´em foi um dos pioneiros da teoria da relatividade32 . O grupo de Poincar´e ´e o grupo mais geral de transforma¸co˜es afins do espa¸co-tempo que mantˆem os intervalos invariantes. Mais adiante (p´agina 742) vamos retornar ao grupo de Poincar´e para analisar sua estrutura enquanto grupo de Lie. Antes, por´em, precisamos nos concentrar plenamente no grupo de Lorentz.

13.6.4

Alguns Sub-Grupos do Grupo de Lorentz

Antes de e com o prop´osito de estudarmos a estrutura do grupo de Lorentz, vamos identificar alguns de seus sub-grupos mais importantes. • Troca de Paridade e Revers˜ ao Temporal As seguintes  −1  0 P1 :=   0 0

31

matrizes s˜ao elementos do grupo de Lorentz    0 0 0 1 0 0 0  0 −1 0 0  1 0 0  ,  P2 :=    0 0 1 0 , 0 1 0 0 0 1 0 0 0 1



1  0 P3 :=   0 0

 0 0 0 1 0 0  , 0 −1 0  0 0 1

(13.74)

Jules Henri Poincar´e (1854-1912). V´ arios historiadores da ciˆencia apontaram para o fato que Poincar´e, assim como Lorentz, antecedeu Einstein em alguns aspectos. Poincar´e foi o primeiro (em 1905, o ano da publica¸ca ˜o do trabalho seminal de Einstein, mas independente deste) a estudar o car´ ater de grupo das transforma¸co ˜es de Lorentz, tendo provado que toda transforma¸ca ˜o de Lorentz ´e combina¸ca ˜o de rota¸co ˜es com um “boost”, fato que estabeleceremos no Teorema 13.8, mais adiante. 32

JCABarata. Curso de F´ısica-Matem´ atica

e

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

 −1 0 0 0  0 −1 0 0  , P :=   0 0 −1 0  0 0 0 1





1  0 T :=   0 0

0 1 0 0

 0 0 0 0  . 1 0  0 −1

731/1304

(13.75)

E. 13.65 Exerc´ıcio importante. Verifique que as cinco matrizes acima s˜ao membros do grupo de Lorentz, ou seja, satisfazem LηLT η = . 6 As matrizes P , P1 , P2 e P3 implementam trocas de paridade, ou seja, revers˜ao da orienta¸ca˜o dos ao temporal, ou eixos de coordenadas espaciais de pontos de 4 . A matriz T implementa uma revers˜ seja, invers˜ao da coordenada temporal de pontos de 4 . ´ bastante evidente que (T )2 = (P )2 = (P1 )2 = (P2 )2 = (P3 )2 = e que P = P1 P2 P3 . As matrizes E T, P1 , P2 , P3 geram um sub-grupo do grupo de Lorentz que implementa revers˜oes temporais e de paridade. 



• Os Sub-grupos Rot e SRot Se R ´e uma matriz 4 × 4 da forma



  R :=   

r0

0 0 0

0 0 0

1



  ,  

onde r0 ´e uma matriz 3 × 3 pertencente a O(3), ent˜ao ´e f´acil verificar que R ´e um elemento do grupo de Lorentz, ou seja, satisfaz RηRT η = . E. 13.66 Exerc´ıcio. Verifique isso, usando os fatos que r0 r0T = e que   0  (r0 )T 0    T  = R−1 . R :=  0     0 0 0 1

6

´ f´acil constatar que o conjunto das matrizes da forma de R acima forma um sub-grupo do grupo E de Lorentz. Esse sub-grupo ser´a designado aqui33 por Rot. E. 13.67 Exerc´ıcio. Mostre que Rot ´e isomorfo ao grupo O(3): Rot ' O(3). 33

Essa nota¸ca ˜o n˜ ao ´e uniforme na literatura.

6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

732/1304

Se R ´e da forma acima, ´e evidente tamb´em que det(R) = det(r0 ). Logo, Rot tem um sub-grupo SRot de matrizes R com det(R) = 1 da forma   0  r0 0    R :=  0   ,   0 0 0 1 onde r0 ´e uma matriz 3 × 3 pertencente a SO(3).

E. 13.68 Exerc´ıcio. Mostre que SRot ´e isomorfo ao grupo SO(3): SRot ' SO(3).

6

E. 13.69 Exerc´ıcio. R = P R0 .

Mostre que se R ∈ Rot mas R 6∈ SRot ent˜ao existe matriz R 0 ∈ SRot com 6

E. 13.70 Exerc´ıcio. R = P1 R00 .

Mostre que se R ∈ Rot mas R 6∈ SRot ent˜ao existe matriz R 00 ∈ SRot com 6

de 

As matrizes de SRot implementam rota¸co˜es puras (sem troca de paridade) nas coordenadas espaciais 4 .

• Os “Boosts” de Lorentz Um conjunto muito importante de matrizes de Lorentz ´e formado pelos chamados “boosts 34 ” de Lorentz na dire¸ca˜o 1. Tais matrizes s˜ao da forma   γ(v) 0 0 −vγ(v)   0 1 0 0 , B1 (v) :=  (13.76)   0 0 1 0 −vγ(v) 0 0 γ(v) onde

γ(v) := √ e v ∈ (−1, 1).

1 1 − v2

E. 13.71 Exerc´ıcio muito importante. Verifique que as matrizes B1 (v) acima s˜ao membros do grupo de Lorentz, ou seja, satisfazem B1 (v)ηB1 (v)T η = para todo v ∈ (−1, 1). 6 Outro fato de grande importˆancia ´e o seguinte: o conjunto de todas as matrizes B 1 (v) com v ∈ (−1, 1) forma um sub-grupo do grupo de Lorentz, denominado sub-grupo dos boosts de Lorentz (na dire¸ca˜o 1) e que designaremos aqui por B1 . Isso decorre do seguinte: 1. Para v = 0 B1 (0) = 34

Do inglˆes to boost: impulsionar, propelir, impelir, empurrar.

.

JCABarata. Curso de F´ısica-Matem´ atica

2. Para todo v ∈ (−1, 1)

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

733/1304

B1 (v)−1 = B1 (−v).

3. Para todos v, v 0 ∈ (−1, 1)

0

B1 (v )B1 (v) = B1



v0 + v 1 + v0v



.

E. 13.72 Exerc´ıcio muito importante. Verifique essas trˆes afirma¸co˜es.

(13.77) 6

Observe-se que o item 3, acima, est´a intimamente associado a` regra relativista de composi¸ca˜o de velocidades. Segue tamb´em de (13.77) que B1 ´e um sub-grupo Abeliano: B1 (v 0 )B1 (v) = B1 (v)B1 (v 0 ) para todos v 0 , v ∈ (−1, 1). E. 13.73 Exerc´ıcio. 6

Mostre que det(B1 (v)) = 1 para todo v ∈ (−1, 1) e, portanto, B1 ⊂ SO(3, 1).

Analogamente aos boosts de Lorentz na dire¸ca˜o 1, h´a os boosts de Lorentz nas dire¸co˜es 2 e 3, representados por matrizes como     1 0 0 0 1 0 0 0   0 1  0 γ(v) 0 −vγ(v)  0 0    e B (v) := B2 (v) :=  3  0 0 γ(v) −vγ(v)  . (13.78)   0 0 1 0 0 0 −vγ(v) γ(v) 0 −vγ(v) 0 γ(v)

Todas as afirma¸co˜es feitas sobre as matrizes B1 tˆem seu correspondente an´alogo para as matrizes B2 e B3 . Os respectivos sub-grupos s˜ao aqui denotados por B2 e B3 . Geometricamente as matrizes B2 (v) e B1 (v) est˜ao relacionadas por uma matriz de rota¸ca˜o de SRot que implementa uma rota¸ca˜o de π/2 em torno do eixo 3: B2 (v) = RB1 (v)RT , onde

E. 13.74 Exerc´ıcio. Verifique.



 0 −1 0 0  1 0 0 0   R =   0 0 1 0  ∈ SRot. 0 0 0 1 6

Analogamente, ´e poss´ıvel obter a matriz B3 (v) a partir de B1 (v) ou de B2 (v) atrav´es de rota¸co˜es. E. 13.75 Exerc´ıcio. Boosts de Lorentz em dire¸co˜es distintas n˜ao comutam. Mostre, por exemplo, que B1 (v)B2 (v 0 ) 6= B2 (v 0 )B1 (v), exceto se v = 0 ou v 0 = 0. 6 Adiante, em nosso estudo da estrutura geral do grupo de Lorentz, mostraremos o qu˜ao importantes os boosts de Lorentz s˜ao. A saber, mostraremos que toda matriz de Lorentz ´e obtida por uma sucess˜ao

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

734/1304

de uma rota¸ca˜o, um boost (na dire¸ca˜o 1, por exemplo) e eventualmente uma outra rota¸ca˜o. Eventualmente trocas de paridade e invers˜oes temporais podem ocorrer tamb´em. A afirma¸ca˜o precisa est´a no Teorema 13.8.

13.6.5

A Estrutura do Grupo de Lorentz

Antes de iniciar a leitura desta se¸ca˜o o leitor poder´a apreciar o estudo do grupo O(1, 1) iniciado a` p´agina 688. Vamos aqui tentar caracterizar a forma geral de um elemento do grupo de Lorentz O(3, 1). Como j´a observamos, O(3, 1) possui um sub-grupo SRot ' SO(3) formado por matrizes da forma   0  r0 0    R :=  0   ,   0 0 0 1

onde r0 ´e uma matriz 3 × 3 pertencente a SO(3).

Vamos no que segue demonstrar o seguinte teorema, que nos fornece a forma geral de toda matriz L ∈ L e que ´e de importˆancia em todo estudo detalhado do grupo de Lorentz. Teorema 13.8 Seja L um elemento do grupo de Lorentz O(3, 1). Como matriz 4 × 4, L ´e da forma   L11 L12 L13 L14  L21 L22 L23 L24   L =  (13.79)  L31 L32 L33 L34  . L41 L42 L43 L44 Ent˜ ao vale uma das quatro afirma¸co ˜es seguintes:

Ia. det(L) = +1, L44 ≥ +1 e L ´e da forma L = Ra B1 (v) Rb , para algum v ∈ (−1, 1) e para Ra , Rb ∈ SRot. Ib. det(L) = +1, L44 ≤ −1 e L ´e da forma

L = T P Ra B1 (v) Rb , para algum v ∈ (−1, 1) e para Ra , Rb ∈ SRot. IIa. det(L) = −1, L44 ≤ −1 e L ´e da forma

L = T Ra B1 (v) Rb , para algum v ∈ (−1, 1) e para Ra , Rb ∈ SRot. IIb. det(L) = −1, L44 ≥ +1 e L ´e da forma

L = P Ra B1 (v) Rb , para algum v ∈ (−1, 1) e para Ra , Rb ∈ SRot.

2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

735/1304

A demonstra¸ca˜o detalhada deste teorema encontra-se na Se¸ca˜o 13.A, p´agina 754. • Dois Resultados sobre o Grupo de Lorentz Proposi¸ c˜ ao 13.15 Se L ´e um elemento do grupo de Lorentz O(3, 1) e L−1 ´e sua inversa, ent˜ ao tem-se −1 que (L )44 = L44 . 2 Prova. A prova ´e simples, pois sabemos que L−1 = ηLT η. Ent˜ao, usando-se a representa¸ca˜o (13.A.1) e calculando-se explicitamente, tem-se     0 0  T   l b   0 0      −1     L =   0  0        T 0 0 0 −1 0 0 0 −1 a L44 

   =   

lT

−b

−aT

L44

o que leva a` constata¸ca˜o que (L−1 )44 = L44 .



   ,  

Proposi¸ c˜ ao 13.16 Se L e L0 s˜ ao dois elementos quaisquer do grupo de Lorentz O(3, 1) ent˜ ao tem-se que sinal((LL0 )44 ) = sinal(L44 )sinal(L044 ). 2 Prova. Sejam L e L0 duas transforma¸co˜es de Lorentz que, como em (13.A.1), representamos na forma de blocos        L =   

l

bT

a

L44

   ,  

   0 L =   

l0

b0 T

a0

L044

   ,  

(13.80)

Vamos formar o produto L00 = LL0 e estudar o sinal do elemento L0044 da matriz resultante. Pela regra de produto de matrizes teremos L0044 = L44 L044 + bT a0 . E. 13.76 Exerc´ıcio. Verifique.

6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

736/1304

O produto de matrizes bT a0 representa tamb´em o produto escalar b · a0 dos vetores b e a0 de que?). Assim, L0044 = L44 L044 + b · a0 .

3 

(por

(13.81)

H´a dois casos a considerar: o caso em que sinal(L44 ) = sinal(L044 ) e o caso em que sinal(L44 ) 6= sinal(L044 ). 1. Caso em que sinal(L44 ) = sinal(L044 ). Por (13.81) tem-se L0044 ≥ L44 L044 − |b · a0 |.

Sabemos que b · a0 = kbk ka0 k cos θ, onde kbk ´e o comprimento de b, ka0 k ´e o comprimento de a0 e θ ´e o ´ o´bvio, portanto, que |b · a0 | ≤ kbk ka0 k (desigualdade aˆngulo que esses dois vetores formam entre si. E de Cauchy). Assim, L0044 ≥ L44 L044 − kbk ka0 k. (13.82) √ √ Pela Proposi¸ca˜o 13.21, kbk = |α| e ka0 k = |α0 |. Al´em disso, L44 = ± 1 + α2 e L044 = ± 1 + α0 2 . Assim, por (13.82), p √ L0044 ≥ 1 + α2 1 + α0 2 − |α| |α0| > 0. Portanto,

sinal(L0044 ) = +1 = sinal(L44 ) sinal(L044 ),

como quer´ıamos provar. 2. Caso em que sinal(L44 ) 6= sinal(L044 ).

Por (13.81) tem-se

L0044 ≤ L44 L044 + |b · a0 |.

Sabemos que b · a0 = kbk ka0 k cos θ, onde kbk ´e o comprimento de b, ka0 k ´e o comprimento de a0 e θ ´e o ´ o´bvio, portanto, que |b · a0 | ≤ kbk ka0 k (desigualdade aˆngulo que esses dois vetores formam entre si. E de Cauchy). Assim, L0044 ≤ L44 L044 + kbk ka0 k. (13.83) √ √ Pela Proposi¸ca˜o 13.21, kbk = |α| e ka0 k = |α0 |. Al´em disso, L44 = ± 1 + α2 e L044 = ∓ 1 + α0 2 (pois sinal(L44 ) 6= sinal(L044 )). Assim, por (13.83), p √ L0044 ≤ − 1 + α2 1 + α0 2 + |α| |α0| < 0. Portanto,

como quer´ıamos provar.

sinal(L0044 ) = −1 = sinal(L44 ) sinal(L044 ),

• Os Sub-grupos Pr´ oprio, Ort´ ocrono e Restrito do Grupo de Lorentz Os conjuntos de transforma¸co˜es de Lorentz que satisfazem as condi¸co˜es Ia, Ib, IIa ou IIb acima s˜ao obviamente conjuntos disjuntos. N˜ao ´e dif´ıcil mostrar (mas n˜ao o faremos aqui) que cada um ´e um conjunto conexo. Portanto, o grupo de Lorentz L = O(3, 1) possui quatro componentes conexas. Seguindo a conven¸ca˜o, detonaremos essas quatro componentes da seguinte forma:

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

737/1304

1. L↑+ := {L ∈ L| det(L) = +1 e sinal(L44 ) = +1}, 2. L↑− := {L ∈ L| det(L) = −1 e sinal(L44 ) = +1}, 3. L↓+ := {L ∈ L| det(L) = +1 e sinal(L44 ) = −1}, 4. L↓− := {L ∈ L| det(L) = −1 e sinal(L44 ) = −1}. Note-se tamb´em que apenas L↑+ contem a identidade . L↑− contem a opera¸ca˜o de troca de paridade P . L↓+ contem a opera¸ca˜o de troca de paridade e invers˜ao temporal P T . L↓− contem a opera¸ca˜o de invers˜ao temporal T . Os conjuntos L↑− , L↓+ e L↓− n˜ao s˜ao subgrupos de L. Por´em, pelas Proposi¸co˜es 13.15 e 13.16, ´e muito f´acil constatar as seguintes afirma¸co˜es: 1. L↑+ ´e um sub-grupo de L, denominado grupo de Lorentz pr´ oprio ort´ ocrono ou grupo de Lorentz restrito. 2. L↑ := L↑+ ∪ L↑− ´e um sub-grupo de L, denominado grupo de Lorentz ort´ ocrono. 3. L+ := L↑+ ∪ L↓+ ´e um sub-grupo de L, denominado grupo de Lorentz pr´ oprio. 4. L0 := L↑+ ∪ L↓− ´e um sub-grupo de L, denominado grupo de Lorentz ort´ ocoro. Note-se que os elementos de ambos os conjuntos L↑+ e L↓+ satisfazem det(L) = 1. Portanto, o grupo de Lorentz pr´oprio L+ := L↑+ ∪ L↓+ coincide com SO(3, 1). Em L↑ n˜ao ocorrem revers˜oes temporais35 . Note tamb´em que SRot ´e um sub-grupo de L↑+ . • A Relevˆ ancia de L+ , L↑ e L↑+ na F´ısica ´ uma cren¸ca da F´ısica atual que L↑+ representa uma simetria da natureza (na ausˆencia de campos E gravitacionais). Essa cren¸ca n˜ao se estende aos grupos L+ e L↑ . O problema com esses u ´ ltimos grupos ´e que os mesmos envolvem opera¸co˜es de troca de paridade (representada pela matriz P ) ou de revers˜ao temporal (representada pela matriz T ). ´ um fato bem estabelecido experimentalmente que nas chamadas intera¸co˜es fracas da f´ısica das E part´ıculas elementares a troca de paridade (representada por matrizes como P ou P 1 ) n˜ao ´e uma transforma¸ca˜o de simetria da natureza. No contexto da teoria quˆantica de campos ´e um fato te´orico bem estabelecido que a chamada transforma¸ca˜o CPT36 ´e uma transforma¸ca˜o de simetria. Viola¸co˜es dessa simetria n˜ao foram empiricamente observadas na f´ısica as part´ıculas elementares. Por isso, a constata¸ca˜o que a simetria CP ´e violada, fenˆomeno observado em certos processos da f´ısica das part´ıculas elementares, indica fortemente que 35

Essa a raz˜ ao da uso da flecha apontando para cima no s´ımbolo L↑ , indicando que o tempo corre na mesma dire¸ca ˜o nos sistemas de referˆencia inerciais transformados por L↑ . 36 A chamada transforma¸ca ˜o CPT envolve as opera¸co ˜es sucessivas de troca de carga, ou part´ıcula-antipart´ıcula, (denotada por C), de paridade (denotada por P) e de revers˜ ao temporal (denotada por T).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

738/1304

a revers˜ao temporal tamb´em n˜ao seria uma simetria da natureza. Entretanto, evidˆencias experimentais diretas de que a simetria de revers˜ao temporal ´e violada n˜ao foram ainda encontradas, por serem de dif´ıcil constata¸ca˜o. Para mais informa¸co˜es a respeito de simetrias e suas viola¸co˜es na f´ısica das part´ıculas elementares, vide por exemplo [84] ou outros livros introdut´orios sobre a f´ısica das part´ıculas elementares. • L↑+ ´ e um Sub-grupo Normal de L Vamos aqui provar a seguinte proposi¸ca˜o sobre L↑+ : Proposi¸ c˜ ao 13.17 L↑+ ´e um sub-grupo normal do grupo de Lorentz.

2

Prova. Tudo o que temos que fazer ´e provar que se L ∈ L↑+ e G ∈ L, ent˜ao G−1 LG ∈ L↑+ . Isso equivale a provar que det(G−1 LG) = 1 e que sinal((G−1 LG)44 ) = 1. Como det(L) = 1, tem-se obviamente que det(G−1 LG) = det(G−1 ) det(L) det(G) = det(G−1 ) det(G) = det(G−1 G) = det( ) = 1. Analogamente, pela Proposi¸ca˜o 13.16 vale sinal((G−1 LG)44 ) = sinal((G−1 L)44 ) sinal(G44 ) = sinal((G−1 )44 ) sinal(L44 ) sinal(G44 ) = sinal((G−1 )44 ) sinal(G44 ) = sinal(G44 )2 = 1, onde usamos a Proposi¸ca˜o 13.15 na pen´ ultima igualdade. Isso completa a prova. E. 13.77 Exerc´ıcio. Mostre que o grupo quociente L/L↑+ ´e isomorfo ao grupo gerado por P1 e T .

13.6.6

6

Os Geradores do Grupo de Lorentz

• Os Geradores dos Boosts de Lorentz Vamos reparametrizar os boosts de Lorentz B1 , B2 e B3 , introduzindo um novo parˆametro z = arctanh v, ou seja v = tanh z, com −∞ < z < ∞. Na literatura f´ısica, z ´e por vezes denominado “rapidez”. Definindo Ba (z) = Ba (tanh z), a = 1, 2, 3, temos, explicitamente     cosh z 0 0 − senh z 1 0 0 0     0 1 0 0  , B2 (z) := 0 cosh z 0 − senh z  , B1 (z) =    0  0 0 1 0 0 1 0 − senh z 0 0 cosh z 0 − senh z 0 cosh z 

1 0 B3 (z) :=  0 0

 0 0 0  1 0 0 . 0 cosh z − senh z  0 − senh z cosh z

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

739/1304

As rela¸co˜es de composi¸ca˜o (13.77) ficam Ba (z)Ba (z 0 ) = Ba (z + z 0 ),

a = 1, 2, 3.

E. 13.78 Exerc´ıcio. Mostre isso usando (13.77) e a identidade bem conhecida tanh(x+y) = Alternativamente, use a forma expl´ıcita das matrizes B a (z) dada acima.

tanh(x)+tanh(y) . 1+tanh(x) tanh(y)

6

Como Ba (0) = , constatamos que {Ba (z), −∞ < z < ∞}, a = 1, 2, 3, s˜ao trˆes subgrupos uniparam´etricos do grupo de Lorentz. Seus geradores s˜ao d a = 1, 2, 3, Ma := Ba (z) , dz z=0 explicitamente dados  0 0 0 0 M1 =  0 0 −1 0

por

 0 −1 0 0 , 0 0 0 0



0 0 0 0 M2 =  0 0 0 −1

 0 0 0 −1 , 0 0 0 0



0 0 M3 =  0 0

 0 0 0 0 0 0 . 0 0 −1 0 −1 0

(13.84)

´ tamb´em importante notar que E Ba (z) = exp(zMa ) para a = 1, 2, 3. E. 13.79 Exerc´ıcio. Verifique isso usando as formas expl´ıcitas dos geradores M a dadas acima.

6

• Os geradores de SRot Al´em dos boosts de Lorentz, consideremos tamb´em os trˆes sub-grupos dados por    1 0 0 0 cos φ2  0 cos φ1 − sen φ1 0   0  R1 (φ1 ) =  R2 (φ2 ) =   0 sen φ1 cos φ1 0  ,  − sen φ2 0 0 0 1 0 

uniparam´etricos de SRot 0 sen φ2 1 0 0 cos φ2 0 0

cos φ3 − sen φ3  sen φ3 cos φ3 R3 (φ3 ) =   0 0 0 0

0 0 1 0

 0 0  , 0  1  0 0  , 0  1

que representam rota¸co˜es por aˆngulos φ1 , φ2 e φ3 ∈ (−π, π] no sentido hor´ario em torno dos eixos espaciais 1, 2 e 3, respectivamente. Em completa analogia com o grupo SO(3), seus geradores s˜ao d , a = 1, 2, 3. Ra (φ) Ja := dφ φ=0

JCABarata. Curso de F´ısica-Matem´ atica

´ o´bvio que E

onde Ja s˜ao os geradores de  0 0 0 0 0 −1 J1 =  0 1 0 0 0 0

Vers˜ ao de 29 de setembro de 2005.



  Ja =   

Ja

0 0 0

0 0 0

0

Cap´ıtulo 13

740/1304



  ,  

SO(3) dados em (13.29)-(13.31), p´agina 693. Explicitamente, tem-se      0 −1 0 0 0 0 1 0 0     0  J2 =  0 0 0 0 , J3 = 1 0 0 0 . (13.85)     0 0 0 0 −1 0 0 0 0 0 0 0 0 0 0 0 0 0

E. 13.80 Exerc´ıcio muito importante. Todo estudante tem que fazˆe-lo ao menos uma vez na vida. Mostre que os geradores, Ma e Jb , com a, b = 1, 2, 3, satisfazem as seguintes rela¸co˜es de comuta¸c˜ao: [Ja , Jb ] =

3 X

εabc Jc ,

(13.86)

εabc Jc ,

(13.87)

εabc Mc .

(13.88)

k=1

[Ma , Mb ] = −

[Ja , Mb ] =

3 X k=1

3 X k=1

6

´ claro de (13.86)-(13.88) que os seis geradores Ma e Jb formam uma a´lgebra de Lie, a a´lgebra de E Lie do grupo de Lorentz L↑+ . Sabemos que n˜ao h´a mais geradores independentes pois, como provamos, todo elemento do grupo de Lorentz L↑+ ´e produto de boosts e rota¸co˜es. De (13.87) percebemos o fato not´avel que os trˆes geradores dos sub-grupos de boost por si s´o n˜ao formam uma a´lgebra de Lie! Para tal, ´e preciso incluir os geradores dos sub-grupos de rota¸ca˜o! Isso releva uma rela¸ca˜o insuspeita, mas profunda, entre os boosts (que fisicamente representam transforma¸co˜es entre sistemas de referˆencia inerciais com velocidades relativas n˜ao-nulas) e as rota¸co˜es espaciais, pois indica que as rota¸co˜es espaciais podem ser geradas a partir de boosts. Isso ´e uma caracter´ıstica especial da f´ısica relativista (vide a compara¸ca˜o com o grupo de Galilei, abaixo) e est´a relacionada a alguns fenˆomenos f´ısicos, como a chamada precess˜ ao de Thomas, importante na discuss˜ao do chamado fator giromagn´etico do el´etron. Vide qualquer bom livro sobre Mecˆanica Quˆantica Relativista (por ex. [114]). • Revisitando o Teorema 13.8

Como vimos no Teorema 13.8, p´agina 734, toda L ∈ L↑+ ´e da forma L = Ra B1 (v)Rb , com Ra , Rb ∈ SRot. Escrevendo v = tanh θ, ficamos com L = Ra B1 (θ)Rb ou, usando o gerador M1 , L =

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

741/1304

Ra exp(θM1 )Rb . Isso, por sua vez pode ser reescrito como L = Ra exp(θM1 )RaT R = exp(θRa M1 RaT )R, onde R := Ra Rb ∈ SRot. P Vamos agora escrever Ra na forma Ra = exp(J), onde J = 3k=1 αk Jk para certos αk ’s reais. Pela express˜ao (4.39), p´agina 243 (vide tamb´em a s´erie completa em (4.38)), teremos Ra M1 RaT = exp(J)A exp(−J) = M1 + [J, M1 ] +

1 1 [J, [J, M1 ]] + [J, [J, [J, M1 ]]] + · · · , 2! 3!

sendo a s´erie do lado direito convergente. O fato importante a notar ´e que, por (13.88), os comutadores m´ ultiplos [J, · · · [J, M1 ]] s˜ao combina¸co˜es lineares de M1 , M2 e M3 . A conclus˜ao disso est´a expressa no seguinte teorema. P P Teorema 13.9 Toda L ∈ L↑+ ´e da forma L = exp(M) exp(J), onde J = 3k=1 βk Jk e M = 3k=1 γk Mk , sendo que os βk ’s e γk ’s s˜ ao n´ umeros reais. 2 A interpreta¸ca˜o desse teorema ´e que toda transforma¸ca˜o de Lorentz (de L ↑+ ) pode ser obtida como uma rota¸ca˜o (definida por exp(J) ∈ SRot) seguida de um boost em uma certa dire¸ca˜o (que ´e definida pelas componentes de M). Invertendo ordens na prova acima, o leitor se convence facilmente que P todo L ∈ L↑+ tamb´em pode P ser escrito como L = exp(J0 ) exp(M0 ), para outros J0 = 3k=1 βk0 Jk e M0 = 3k=1 γk0 Mk . Por o estudante do fato que, por (13.87), o conjunto das matrizes da forma  P3fim, 0 advertimos , n˜ao formam um subgrupo de L↑+ . exp k=1 ak Mk , ak ∈ 

• O Grupo de Galilei

E. 13.81 Exerc´ıcio. Mostre que as transforma¸co˜es de Galilei37 da mecˆanica cl´assica podem ser representadas como um grupo de matrizes 4 × 4, da forma   −v1  r0 −v2     G(r0 , ~v ) :=  −v3  ,   0 0 0 1

onde r0 ´e uma matriz 3 × 3 pertencente a O(3) e vj ∈ (−∞, ∞). Mostre que tais matrizes formam um grupo de Lie, determinando tamb´em G(r0 , ~v )−1 e a regra de produto G(r0 , ~v )G(r00 , ~v 0 ). 6 Determine seus trˆes sub-grupos de boost, seus trˆes sub-grupos de rota¸ca˜o e os seis geradores desses sub-grupos. Em seguida calcule as rela¸co˜es de comuta¸ca˜o desses seis geradores. Compare com o que ocorre com o grupo de Lorentz. E. 13.82 Exerc´ıcio. Constate que o grupo de Galilei ´e isomorfo ao grupo O(3)s 37

Galileu Galilei (1564-1642).

3 

.

6

JCABarata. Curso de F´ısica-Matem´ atica

13.7

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

742/1304

O Grupo de Poincar´ e

O chamado grupo de Poincar´e (em 3+1 dimens˜oes) ´e definido como sendo o grupo P := O(3, 1)s 4 . Seus elementos s˜ao, portanto, pares ordenados (L, x) com L ∈ O(3, 1) e x ∈ 4 , sendo o produto dado por (L, x) · (L0 , x0 ) = (LL0 , Lx0 + x). Sua a¸ca˜o no espa¸co-tempo 4 ´e interpretada como uma transforma¸ca˜o de Lorentz seguida de uma transla¸ca˜o. 





H´a um subgrupo de GL( , 5) que ´e isomorfo a P. Sejam as matrizes reais 5 × 5   

   P (L, x) :=   

Ent˜ao, tem-se

 x   ,   1

L

0

com L ∈ O(3, 1) e x ∈

4



.

P (L, x) P (L0 , x0 ) := P (LL0 , Lx0 + x) . E. 13.83 Exerc´ıcio importante. Mostre isso. Assim, o conjunto de matrizes {P (L, x) ∈ GL( , 5), com L ∈ O(3, 1) e x ∈ grupo de GL( , 5) que ´e isomorfo a P. Tamb´em denotaremos esse grupo por P. 

4 

6 } forma um sub-



´ltima afirmativa. E. 13.84 Exerc´ıcio. Prove essa u O chamado grupo de Poincar´e pr´ oprio ort´ ocrono, denotado por P ↑+ ´e o grupo P↑+ := L↑+ s

4 

6 .

• Os Geradores do Grupo de Poincar´ e De maneira totalmente an´aloga ao que fizemos no grupo Euclidiano, podemos determinar os geradores do grupo P↑+ . Este possui 10 geradores. Seis da forma        mk :=   

Mk

0

 0      0

ou

   jk :=   

Jk

0

 0      0

com k = 1, 2, 3,

onde Mk e Jk s˜ao as matrizes 4 × 4 definidas em (13.84) e (13.85), respectivamente, e quatro da forma      pk :=   

0

0

 xk    com k = 1, . . . , 4,   0

JCABarata. Curso de F´ısica-Matem´ atica

onde

  1 0   x1 :=  0  , 0

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

  0 0   x4 :=  0  . 1

  0 0   x3 :=  1  , 0

  0 1   x2 :=  0  , 0

As rela¸co˜es de comuta¸ca˜o associadas ao grupo de Poincar´e s˜ao: 3 X

[ja , jb ] =

743/1304

εabc jc ,

(13.89)

εabc jc ,

(13.90)

εabc mc ,

(13.91)

k=1

[ma , mb ] = −

[ja , mb ] =

3 X k=1

3 X k=1

[pa , pb ] = [ja , pb ] =

0, (1 − δb4 )

(13.92) 3 X

εabc pc ,

(13.93)

k=1

[ma , pb ] = − (δab p4 + δb4 pa ) .

(13.94)

Aqui, os ´ındices dos m’s e j’s variam de 1 a 3 e os ´ındices dos p’s variam de 1 a 4. E. 13.85 Exerc´ıcio importante. Todo estudante deve fazˆe-lo uma vez na vida. Verifique isso.

6

As trˆes primeiras rela¸co˜es acima seguem de (13.86)-(13.88), p´agina 740. A rela¸ca˜o (13.93) diz que os j’s comutam com p4 e, nos demais casos, tem-se a u ´ ltima rela¸ca˜o de (13.61). Novamente constatamos que a sub-´algebra gerada pelos p’s ´e um ideal de a´lgebra de Lie do grupo de Poincar´e. oes • O grupo P↑+ em 1+1-dimens˜ Com base no nosso estudo do grupo O(1, 1) (vide Se¸ca˜o 13.3.1, em especial, p´agina 688), sabemos que o grupo P↑+ em 1+1-dimens˜oes ´e isomorfo ao grupo de matrizes da forma   cosh z − senh z x1 − senh z cosh z x2  0 0 1 com z, x1 , x2 ∈

. Seus geradores ser˜ao   0 −1 0 m1 := −1 0 0 , 0 0 0 



 0 0 1 p1 := 0 0 0 , 0 0 0



 0 0 0 p2 := 0 0 1 . 0 0 0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

744/1304

Como ´e f´acil de verificar, as rela¸co˜es de comuta¸ca˜o entre esses geradores s˜ao [m1 , p1 ] = −p2 ,

[m1 , p2 ] = −p1 ,

[p1 , p2 ] = 0.

Um elemento gen´erico dessa a´lgebra de Lie ´e da forma    I(M, t) :=   

onde M = zm1 = com z, t1 , t2 ∈ 



0 −z −z 0





t      0

M

0

0

  t1 t = t 1 p1 + t 2 p2 = t2

e

´ um exerc´ıcio f´acil (fa¸ca-o) constatar que para todo k ∈ . E  I(M, t)k = I Mk , Mk−1 t .



, k ≥ 1, tem-se

Conseq¨ uentemente, vale que

exp (I(M, t)) =



 ∞ X   1 k k−1 + I M , M t =   k!  k=1

∞ X 1 + I(M, t)k = k! k=1

onde L := e

M

=



cosh z − senh z − senh z cosh z





t0    ,   1

L 0

0

t0 = f (M)t ,

e

sendo f a fun¸ca˜o anal´ıtica inteira definida em (13.62). A matriz f (M) pode ser calculada facilmente usando-se o fato que 

0 −1 −1 0

2k

=

e



0 −1 −1 0

2k+1

=



 0 −1 , −1 0

k∈ 

,

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

745/1304

de onde se extrai f (M) :=

=

∞ X 1 k−1 + M k! k=2 ∞ X 1 1 2m−1 M + M2m + (2m)! (2m + 1)! m=1 m=1 ∞ X

 X  ∞ ∞ X z 2m z 2m−1 0 −1 + = (2m)! −1 0 (2m + 1)! m=0 m=1

Notemos que

  senh z cosh z − 1 0 −1 + = −1 0 z z   senh z cosh z − 1 −   z z   =    cosh z − 1 senh z  − z z 

cosh z − 1 det f (M) = 2 z2

para z ∈ teremos





.

6= 0

  x1 ∈ . Assim, f (M) ´e invert´ıvel e se escolhermos t = f (M) x, para qualquer x = x2 −1



   −1 exp I(M, f (M) x) =   



L 0

2 

0

  cosh z − senh z x 1 x    = − senh z cosh z x2  .   0 0 1 1

Isso prova que todo elemento do grupo P↑+ em 1+1 dimens˜oes pode ser escrito como exponencial de um elemento da sua pr´opria a´lgebra de Lie.

13.8

SL( , 2) e o Grupo de Lorentz

Nesta se¸ca˜o discutiremos com algum detalhe a rela¸ca˜o entre SL( , 2) (introduzido na Se¸ca˜o 13.3.5, p´agina 704) e o Grupo de Lorentz em 3+1 dimens˜oes, rela¸ca˜o esta de grande importˆancia em F´ısica, especialmente no estudo da equa¸ca˜o de Dirac38 para o el´etron e na Teoria Quˆantica de Campos. • Automorfismos de SL( , 2) 38

Paul Adrien Maurice Dirac (1902-1984).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

746/1304

Com o prop´osito de preparar a discuss˜ao sobre a rela¸ca˜o entre SL( , 2) e o Grupo de Lorentz, vamos em primeiro lugar discutir alguns automorfismos do grupo SL( , 2).   0 −1 Seja τ := −iσ2 = ∈ SL( , 2). Definimos ϕτ : SL( , 2) → SL( , 2) por 1 0 ϕτ (A) := τ Aτ −1 . Ent˜ao, ϕτ ´e um automorfismo de SL( , 2). De fato, vˆe-se trivialmente que ϕτ ´e bijetora e que ϕτ (AB) = ϕτ (A)ϕτ (B) para todos A, B ∈ SL( , 2) (prove isso!). por M a matriz obtida tomando-se o complexo Para uma matriz M ∈ Mat ( , 2) denotamos  conjugado dos elementos de matriz de M : M ij = Mij . Sabe-se que det(M ) = det(M ), portanto, se A ∈ SL( , 2) ent˜ao A ∈ SL( , 2). Assim, seja ϕ1 : SL( , 2) → SL( , 2) definida por

ϕ1 (A) := A. Ent˜ao, ϕ1 ´e tamb´em um automorfismo de SL( , 2). De fato, vˆe-se trivialmente que ϕ1 ´e bijetora e que ϕ1 (AB) = ϕ1 (A)ϕ1 (B) para todos A, B ∈ SL( , 2) (prove isso!). Note que ϕ1 (ϕ1 (A)) = A, ou seja, ϕ1 ◦ ϕ1 ´e a identidade.

O grupo SL( , 2) possui um outro automorfismo de interesse. Se det(A) = 1 ´e f´acil ver que igualmente tem-se det ((A∗ )−1 ) = 1. Definimos ent˜ao ϕ2 : SL( , 2) → SL( , 2) por ϕ2 (A) := (A∗ )−1 = (A−1 )∗ . Novamente, ´e f´acil ver que ϕ2 ´e bijetora e que e que ϕ2 (AB) = ϕ2 (A)ϕ2 (B) para todos A, B ∈ SL( , 2) (prove isso!).   a b , H´a uma rela¸ca˜o entre os automorfismos ϕτ , ϕ1 e ϕ2 . Se A ∈ SL( , 2) ´e da forma A = c d   d −c uma conta simples (fa¸ca!) mostra que (A∗ )−1 = . Da´ı, ´e f´acil constatar que (A∗ )−1 = τ Aτ −1 −b a (fa¸ca essa constata¸ca˜o!). Conclu´ımos assim que ϕ2 = ϕτ ◦ ϕ1 . Portanto, vale tamb´em que ϕ2 ◦ ϕ 1 = ϕ τ .

(13.95)

Todos esses fatos ser˜ao usados na Se¸ca˜o 13.8, onde discutiremos em detalhe a importante e surpreendente rela¸ca˜o entre SL( , 2) e o Grupo de Lorentz. • SL( , 2) e o Espa¸ co de Minkowski Por Herm ( , 2) designamos o sub-espa¸co (real) de Mat ( , 2), formado por todas as matrizes ´ f´acil ver que complexas 2 × 2 e Hermitianas: Herm ( , 2) := {M ∈ Mat ( , 2)| M ∗ = M }. E existe uma correspondˆencia biun´ıvoca entre Herm ( , 2) e 4 (e, portanto, entre Herm ( , 2) e o espa¸co-tempo de Minkowski39 quadridimesional). De fato, como , σ1 , σ2 , σ3 formam uma base em 

39

Hermann Minkowski (1864-1909).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

747/1304

Mat ( , 2), podemos escrever toda matriz M ∈ Herm ( , 2) na forma   m4 + m3 m1 − im2 , M = m 4 + m 1 σ1 + m 2 σ2 + m 3 σ3 , = m1 + im2 m4 − m3 com m4 , m1 , m2 , m3 ∈ . Por´em, como as matrizes de Pauli e ser Hermitiana, ou seja, M ∗ = M , significa

s˜ao auto-adjuntas, a condi¸ca˜o de M

m 4 + m 1 σ1 + m 2 σ2 + m 3 σ3 = m 4 + m 1 σ1 + m 2 σ2 + m 3 σ3 , ou seja, mk ∈

, k = 1, . . . , 4. Logo, (   3 X m4 + m3 m1 − im2 Herm ( , 2) = m4 + m k σk , = com m1 , m2 , m3 , m4 ∈ m1 + im2 m4 − m3 

k=1



)

.

(13.96)

Antes de prosseguirmos, fa¸camos algumas observa¸co˜es sobre a rela¸ca˜o entre Herm ( , 2) e SL( , 2). Se A ´e uma matriz qualquer de Mat ( , 2) e M ∈ Herm ( , 2), ´e f´acil constatar que AM A ∗ tamb´em ´ ´e um elemento de Herm ( , 2). De fato (AM A∗ )∗ = AM A∗ , provando que AM A∗ ´e Hermitiana. E claro que isso tamb´em vale para A ∈ SL( , 2). Nesse caso, por´em, tem-se a seguinte proposi¸ca˜o. Proposi¸ c˜ ao 13.18 Se A ∈ SL( , 2) ´e tal que AM A∗ = M para toda M ∈ Herm ( , 2), ent˜ ao A=± . 2

Prova. Como AM A∗ = M para toda M ∈ Herm ( , 2) e ∈ Herm ( , 2), segue que A∗ = A−1 . Logo, AM A−1 = M para toda M ∈ Herm ( , 2), ou seja, AM = M A para toda M ∈ Herm ( , 2). Ocorre, por´em, que toda matriz Q ∈ Mat ( , 2) pode ser escrita como Q = Q1 + iQ2 com Q1 :=

1 (Q + Q∗ ), 2

Q2 :=

1 (Q − Q∗ ) 2i

onde Q1 e Q2 s˜ao ambas Hermitianas (verifique!). Logo, como A comuta com todas as matrizes Hermitianas, A comuta com todas as matrizes de Mat ( , 2). Isso s´o ´e poss´ıvel se A for um m´ ultiplo da matriz identidade: A = λ (vide Proposi¸ca˜o 1.9, p´agina 73). Como det(A) = 1, segue que λ 2 = 1, ou seja, A = ± , que ´e o que quer´ıamos mostrar. Essa proposi¸ca˜o tem a seguinte conseq¨ uˆencia: Proposi¸ c˜ ao 13.19 Se A, B ∈ SL( , 2) s˜ ao tais que AM A∗ = BM B ∗ para todas as matrizes M ∈ Herm ( , 2), ent˜ ao A = ±B. 2 Prova. A rela¸ca˜o AM A∗ = BM B ∗ implica CM C ∗ = M , onde C = B −1 A ∈ SL( , 2). Pela proposi¸ca˜o anterior, C = ± , terminando a prova. Seja x ∈ 

4

x  1

,x=

x2 x3 x4

, e seja M (x) := x4 + x1 σ1 + x2 σ2 + x3 σ3

(13.97)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

748/1304

´ f´acil ver que M : 4 → Herm ( , 2) ´e bijetora e linear: o elemento correspondente de Herm ( , 2). E M (αx + βy) = αM (x) + βM (y) para todos α, β ∈ e todos x, y ∈ 4 . 





E. 13.86 Exerc´ıcio. Mostre que as quatro componentes do vetor x ∈ M (x) pelas seguintes express˜oes: x4 =

1 1 Tr ( M (x)) = Tr (M (x)) 2 2

e

4 

podem ser recuperadas de

1 Tr (σi M (x)), 2

xi =

i = 1, 2, 3. 6

Em resumo, denotando σ4 = , tem-se xµ =

1 Tr (σµ M (x)), 2

µ = 1, . . . , 4.

(13.98)

´ um exerc´ıcio f´acil e importante para o que segue verificar que E   x4 + x3 x1 − ix2 − det(M (x)) = − det = x21 + x22 + x23 − x24 = hx, ηxi , x1 + ix2 x4 − x3 

onde η ´e a matriz 4 × 4 definida em (13.63). Como se vˆe, surge (milagrosamente!) a m´etrica do espa¸co-tempo de Minkowski do lado direito, o que indica a existˆencia de uma conex˜ao insuspeita entre a relatividade restrita e a teoria das matrizes Hermitianas 2 × 2. Vamos explorar as conseq¨ uˆencias desse fato. Em primeiro lugar, notemos que para dois vetores x, y ∈ 4 quaisquer tem-se a seguinte identidade40 : 1 hx, ηyi = [h(x + y), η(x + y)i − h(x − y), η(x − y)i ] . 4 





E. 13.87 Exerc´ıcio. Verifique isso expandindo o lado direito.



6

Assim, podemos escrever hx, ηyi 

1 = − [det(M (x + y)) − det(M (x − y))] . 4

(13.99)

Seja agora A um elemento de SL( , 2). Se M ∈ Herm ( , 2), como j´a observamos, AM A∗ tamb´em ´e um elemento de Herm ( , 2). Como A(BM B ∗ )A∗ = (AB)M (AB)∗ ´e f´acil ver (fa¸ca!) que α : SL( , 2) × Herm ( , 2) → Herm ( , 2) definida por α(A, M ) := AM A∗ ´e uma a¸ca ˜o a ` esquerda de SL( , 2) sobre Herm ( , 2). 40

Chamada de identidade de polariza¸ca ˜o.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

749/1304

Para quaisquer x ∈ 4 e A ∈ SL( , 2) teremos que α(A, M (x)) = AM (x)A∗ ´e Hermitiana. Como o lado direito depende linearmente de x, existe uma matriz real 4 × 4 que denotaremos por L[A] tal que α(A, M (x)) = AM (x)A∗ = M (L[A]x). (13.100) 

Formalmente podemos definir L[A] da seguinte forma. Como M : 4 → Herm ( , 2) ´e bijetora, definimos L[A]x := M −1 ( α(A, M (x)) ) = M −1 ( AM (x)A∗ ), (13.101) 

para todo x ∈

4 

. Em componentes tem-se, usando (13.98), 4 X 1 1 Tr (σµ AM (x)A∗ ) = Tr (σµ Aσν A∗ )xν , 2 2 ν=1

(L[A]x)µ =

(verifique!) e, portanto, L[A] ´e uma matriz 4 × 4 com elementos de matriz 1 Tr (σµ Aσν A∗ ), 2

L[A]µν =

(13.102)

µ, ν = 1, . . . , 4. E. 13.88 Exerc´ıcio importante. Usando a Proposi¸c˜ao 13.19, mostre que L[A] = L[B] se e somente se A = ±B. 6 E. 13.89 Exerc´ıcio importante. Mostre que L[A]L[B] = L[AB] para todos A, B ∈ SL( , 2). Sugest˜ ao: use a defini¸c˜ao (13.101), n˜ao (13.102). 6 E. 13.90 Exerc´ıcio. Mostre que l : SL( , 2)× SL( , 2) sobre 4 . 

4 



4 

definida por l(A, x) = L[A]x ´e uma a¸ca ˜o de 6

O ponto importante de tudo isso, e que iremos mostrar agora, ´e que L[A] ´e uma matriz de Lorentz, ou seja, ´e um elemento de O(3, 1)! Para isso, faremos uso de (13.99). De fato, temos por (13.99) que hL[A]x, ηL[A]yi 

1 = − [det(M (L[A](x + y))) − det(M (L[A](x − y)))] 4 = −

 1 det(M (M −1 ( AM (x + y)A∗ ))) − det(M (M −1 ( AM (x − y)A∗ ))) 4

1 = − [det( AM (x + y)A∗ ) − det( AM (x − y)A∗ )] 4 = −

det(A) det(A∗ ) [det(M (x + y)) − det(M (x − y))] 4

1 = − [det(M (x + y)) − det(M (x − y))] 4 = hx, ηyi . 

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

750/1304

Na pen´ ultima igualdade usamos que det(A∗ ) = det(A) = 1, pois A ∈ SL( , 2).

Ficou estabelecido, ent˜ao, que hL[A]x, ηL[A]yi = hx, ηyi e, portanto, L[A] ∈ O(3, 1), ou seja, L[A] ´e uma transforma¸ca˜o de Lorentz. Isso provou tamb´em que h´a um homomorfismo de SL( , 2) no ´ bom notar que n˜ao se trata de um isomorfismo, pois grupo de Lorentz O(3, 1), a saber, A → L[A]. E L[A] = L[−A], como j´a observamos. 



N˜ao ´e dif´ıcil mostrar, mas n˜ao faremos aqui41 , que L[A] definida acima n˜ao ´e apenas um elemento ´ do grupo de Lorentz completo O(3, 1), mas de seu sub-grupo de Lorentz pr´oprio ort´ocrono L ↑+ . E trivial, por exemplo, constatar usando (13.102) que L[A]44 > 0 para qualquer A ∈ SL( , 2). Como o conjunto de matrizes {L[A], A ∈ SL( , 2)} evidentemente contem a identidade , basta apenas provar que o mesmo ´e conexo. • Os Grupos SL( , 2)/{− , } e L↑+ s˜ ao Isomorfos Um fato muito importante ´e que a aplica¸ca˜o Φ1 : SL( , 2)/{− , } → L↑+ definida por Φ1 (±A) := L[A]

(13.103)

´e um isomorfismo entre os grupos SL( , 2)/{− , } e L↑+ . A prova dessa afirma¸ca˜o, muito importante na teoria dos spinores, ´e apresentada na Se¸ca˜o 13.B, p´agina 764. Notemos que pelos exerc´ıcios da p´agina 749, acima, resta apenas provar que Φ1 ´e sobrejetora, o que ´e feito na Se¸ca˜o 13.B. Φ1 n˜ao ´e o u ´ nico isomorfismo relevante entre esses dois grupos e apresentaremos mais trˆes logo abaixo para em seguida discutir o significado de todos eles. O fato de haver isomorfismos de SL( , 2)/{− , } no grupo de Lorentz pr´oprio ort´ocrono L ↑+ ´e de grande importˆancia na f´ısica relativista, em particular na Teoria Quˆantica de Campos, por mostrar que as transforma¸co˜es de Lorentz (pr´oprias e ort´ocronas) podem ser implementadas para part´ıculas de spin 1/2 (cujas fun¸co˜es de onda vivem em 2 ) atrav´es de elementos de SL( , 2). As rota¸co˜es SRot ⊂ L↑+ , por exemplo, s˜ao implementadas pela imagem por Φ−1 dos elementos do sub-grupo SU(2)/{− , } 1 de SL( , 2)/{− , } (lembre-se que SU(2)/{− , } ´e isomorfo a SO(3), que ´e isomorfo a SRot). O boost de velocidade v na dire¸ca˜o ~η ∈ 3 ´e implementado pela imagem por Φ−1 dos elementos 1 ± exp((tanh v) ~η · ~σ ) ∈ SL( , 2). 

E. 13.91 Exerc´ıcio. Prove os fatos mencionados no par´agrafo precedente. Sugest˜ao: vide [98] ou [46]. 6 • Outros Isomorfismos entre L↑+ e SL( , 2)/{− , } Usando os automorfismos ϕ1 e ϕ2 de SL( , 2) definidos a` p´agina 746 podemos construir mais trˆes a¸co˜es de SL( , 2) sobre Herm ( , 2) com o uso da a¸ca˜o α definida em (13.100). Essas a¸co˜es s˜ao 41

Vide, por exemplo, [98] ou [46].

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

751/1304

denotadas aqui por α, ˙ αc e α˙ c e s˜ao definidas da seguinte forma: ∗

α(A, ˙ M ) := α(ϕ1 (A), M ) = AM A ,

(13.104)

αc (A, M ) := α(ϕ2 (A), M ) = (A∗ )−1 M A−1 ,

(13.105)

α˙ c (A, M ) := α(ϕ2 ◦ ϕ1 (A), M ) = α(ϕτ (A), M ) = τ Aτ −1 M τ A∗ τ −1 .

(13.106)

Na u ´ ltima linha usamos (13.95). Do fato de ϕτ , ϕ1 e ϕ2 serem automorfismos, segue trivialmente que essas s˜ao de fato a¸co˜es de SL( , 2) sobre Herm ( , 2). Analogamente a` defini¸ca˜o de L[A] em (13.101), definimos

´ imediato constatar que E

˙ L[A] x := M −1 ( α(A, ˙ M (x)) ),

(13.107)

Lc [A] x := M −1 ( αc (A, M (x)) ),

(13.108)

L˙ c [A] x := M −1 ( α˙ c (A, M (x)) ).

(13.109)

  ˙ L[A] = L [ϕ1 (A)] = L A ,   Lc [A] = L [ϕ2 (A)] = L (A∗ )−1 ,

  L˙ c [A] = L [ϕτ (A)] = L τ Aτ −1 .

(13.110) (13.111) (13.112)

Do fato de ϕτ , ϕ1 e ϕ2 serem automorfismos, segue igualmente que Φ1 (±A) := L[A],

(13.113)

˙ Φ2 (±A) := L[A],

(13.114)

Φ3 (±A) := Lc [A],

(13.115)

Φ4 (±A) := L˙ c [A]

(13.116)

: L↑+ → s˜ao isomorfismos de SL( , 2)/{− , } em L↑+ . Isso claramente significa que as inversas Φ−1 i SL( , 2)/{− , }, i = 1, . . . , 4, s˜ao representa¸co ˜es de L↑+ em 2 . A representa¸ca˜o Φ−1 e por vezes denominada complexo conjugada e a representa¸ca˜o Φ 4−1 ´e por vezes 2 ´ denominada contra-gradiente.

• Spinores Em termos f´ısicos, se tivermos uma transforma¸ca˜o de Lorentz L ∈ L↑+ podemos implement´a-la em 2 de quatro formas, de acordo com cada uma das quatro representa¸co˜es Φ−1 dadas acima. Quantidades i 2 f´ısicas vivendo em e que se transformem por transforma¸co˜es de Lorentz de acordo com alguma dessas quatro representa¸co˜es s˜ao denominadas spinores. H´a, portanto, quatro tipos de spinores. De acordo com uma conven¸ca˜o (que, segundo Haag [51], foi introduzida por Van der Waerden em [133]) costuma-se denotar suas componentes da seguinte forma:

JCABarata. Curso de F´ısica-Matem´ atica

1. As componentes de spinores Ψ ∈ ´ındices inferiores: Ψr , r = 1, 2.

2

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

752/1304

que se transformam de acordo com Φ−1 ao denotados por 1 s˜

2. As componentes de spinores Ψ ∈ 2 que se transformam de acordo com Φ−1 ao denotados por 2 s˜ ´ındices inferiores com um ponto: Ψr˙ , r = 1, 2. ao denotados por 3. As componentes de spinores Ψ ∈ 2 que se transformam de acordo com Φ−1 3 s˜ r˙ ´ındices superiores com um ponto: Ψ , r = 1, 2. 4. As componentes de spinores Ψ ∈ ´ındices superiores: Ψr , r = 1, 2.

2

que se transformam de acordo com Φ−1 ao denotados por 4 s˜

Spinores com ponto e sem (em inglˆes: “dotted spinors” e “undotted spinors”, respectivamente) podem ser relacionados por conjuga¸ca˜o complexa. E. 13.92 Exerc´ıcio. Justifique essa afirmativa.

6

Para U ∈ SU(2), vale U = τ U τ −1 (verifique), de modo que, no que concerne ao grupo de rota¸co˜es, a diferen¸ca entre “undotted spinors” e “dotted spinors” ´e uma rota¸ca˜o de π em torno do eixo 2. Para um boost B(v, ~η ) = exp((tanh v) ~η · ~σ ) ∈ SL( , 2) com η~ = (η1 , η2 , η3 ) teremos B(v, η~) = B(v, ~η r ), onde ~η r = (η1 , −η2 , η3 ). Isso pois σ1 = σ1 , σ3 = σ3 mas σ2 = −σ2 . Logo, B(v, ~η ) = τ B(−v, ~η )τ −1 . Assim, no que concerne aos boosts de Lorentz, a diferen¸ca entre “undotted spinors” e “dotted spinors” ´e uma revers˜ao temporal (representada aqui pela troca v → −v) seguida de rota¸ca˜o de π em torno do eixo 2. Todas as considera¸co˜es acima sobre “undotted spinors” e “dotted spinors” s˜ao de relevˆancia na mecˆanica quˆantica relativista, particularmente para a c´elebre equa¸ca˜o de Dirac para o el´etron 42 . • Formas invariantes de spinores A seguinte proposi¸ca˜o ´e freq¨ uentemente empregada na teoria dos spinores.   0 −1 Proposi¸ c˜ ao 13.20 Seja τ := −iσ2 = ∈ SL( , 2). Ent˜ ao, para todo A ∈ SL( , 2) tem-se 1 0 AT τ A = τ . 2 Prova. Seja A = exp(α1 σ1 +α2 σ2 +α3 σ3 ) ∈ SL( , 2), com αk ∈ , k = 1, 2, 3. Ent˜ao, AT = exp(α1 σ1 − α2 σ2 + α3 σ3 ), pois σ1T = σ1 , σ3T = σ3 mas σ2T = −σ2 . Assim, AT τ = −iAT σ2 = −iσ2 σ2 AT σ2 = τ exp (σ2 [α1 σ1 − α2 σ2 + α3 σ3 ] σ2 ) = τ exp(−α1 σ1 −α2 σ2 −α3 σ3 ) = τ A−1 onde, na pen´ ultima igualdade, usamos as propriedades de anti-comuta¸ca˜o das matrizes de Pauli. Isso completa a prova. 42

Para um artigo cl´ assico sobre o assunto, vide: O. Laporte and G. E. Uhlenbeck. “Application of spinor analysis for the Maxwell and Dirac equations”. Phys. Rev. 37, 1380 (1931). Outra referˆencia cl´ assica ´e [133]. Vide tamb´em qualquer bom livro moderno sobre Teoria Quˆ antica de Campos.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

753/1304

Uma conseq¨ uˆencia dessa proposi¸ca˜o ´e que se definirmos, para ψ, φ ∈ 2 , a forma bilinear (simpl´etica) ωτ (ψ, φ) := hψ, τ φi , teremos ωτ (Aψ, Aφ) = ωτ (ψ, φ) para todo A ∈ SL( , 2). 

Apesar de invariante por SL( , 2), a forma bilinear ωτ acima n˜ao ´e interessante para a f´ısica quˆantica, pois n˜ao ´e um produto escalar (tem-se, por exemplo, ωτ (ψ, ψ) = 0 ∀ψ ∈ 2 ) e, portanto, n˜ao existe uma interpreta¸ca˜o probabil´ıstica associada a` mesma. Para que a simetria L ↑+ implementada por SL( , 2) represente uma simetria de um sistema quˆantico cujo espa¸co de Hilbert ´e 2 , devemos procurar um produto escalar em 2 que seja invariante por SL( , 2). Veremos, por´em, que um tal produto escalar n˜ao existe.

Vamos estudar a forma mais geral de um produto escalar em 2 . Como j´a observamos a` p´agina 131 e anteriores, a forma mais geral de um produto escalar em 2 ´e hψ, M φi , onde M ´e autoadjunta e positiva. Toda matriz 2 × 2 autoadjunta ´e da forma M (p) para algum p ∈ 4 (M (p) foi definida em (13.97), p´agina 747)). Vamos descobrir para quais p ∈ 4 tem-se M (p) > 0. Para que essa condi¸ca˜o seja satisfeita os dois autovalores λ1 e λ2 de M (p) devem ser positivos. Calculando por (13.97) o tra¸co e o determinante de M (p) , tem-se det(M (p)) = λ1 λ2 = (p4 )2 − (p1 )2 − (p2 )2 − (p3 )2 e ´ f´acil ver da´ı que λ1 = p4 + k~ Tr(M (p)) = λ1 + λ2 = 2p4 . E pk e λ2 = p4 − k~ pk onde p~ = (p1 , p2 , p3 ). Logo, M (p) > 0 se e somente se p4 > k~ pk. 4 ´ f´acil verificar (fa¸ca-o) que V+ ´e mantido invariante por L↑+ . pk}. E Seja V+ := {p ∈ | p4 > k~ 







Para ψ, φ ∈

2

e p ∈ V+ , definamos o produto escalar

hψ, φip := hψ, M (p)φi 

.

Teremos, para todo A ∈ SL( , 2), hAψ, Aφip := hψ, A∗ M (p)Aφi 

= hψ, M (L[A∗ ]p) φi 

= hψ, φiL[A∗ ]p ,

onde, acima, usamos (13.101). No caso do subgrupo SU(2), o produto escalar invariante corresponde a p ∈ V+ com Lp = p para L ∈ SRot. Tais p’s s˜ao da forma p = (0, 0, 0, p4 ), p4 > 0. Assim, hψ, φi ´e, a menos de um m´ ultiplo 2 positivo, o u ´ nico produto escalar invariante em para SU(2). Mas vemos acima que que n˜ao h´a produto escalar invariante para todo o grupo SL( , 2) em 2 , j´a que n˜ao h´a vetor em V+ que seja invariante para todo L ∈ L↑+ . Fisicamante falando, a simetria de Lorentz L↑+ n˜ao pode, portanto, ser implementada em espa¸cos de Hilbert bidimensionais, apenas a simetria de rota¸ca˜o. 

Adiante discutiremos como implementar a simetria de Lorentz (e a de Poincar´e) em campos de spinores, aumentando a dimens˜ao do espa¸co de Hilbert dos estados.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

754/1304

Apˆ endices 13.A

Prova do Teorema 13.8

Aqui a demonstra¸ca˜o do Teorema 13.8 ser´a apresentada. Seja L um elemento do grupo de Lorentz O(3, 1), representada como matriz da forma (13.79). Vamos definir vetores coluna (ou seja, matrizes 3 × 1) a e b por     L41 L14 b :=  L42  . a :=  L24  , L43 L34 ´ evidente que podemos escrever L na forma de blocos E     L =   

l

bT



a

L44

   ,  

(13.A.1)

onde bT , a transposta de b, ´e o vetor linha (matriz 1 × 3) dado por bT = matriz 3 × 3 dada por   L11 L12 L13 l :=  L21 L22 L23  . L31 L32 L33

Vamos agora considerar duas matrizes Ra e Rb pertencentes a SRot, ou    0   0  ra rb       Ra :=  , R := b 0      0 0 0 0 0 0 1

L41 , L42 , L43



e l ´e a

seja,  0 0   0  ,  1

com ra e rb matrizes 3 × 3 pertencentes a SO(3). Precisamos estudar a forma da matriz Ra LRbT . A regra de produto de matrizes nos diz que      Ra L =   

ra l

bT

ra a

L44

   ,  

(13.A.2)

JCABarata. Curso de F´ısica-Matem´ atica

e que, conseq¨ uentemente,

Ra LRbT



   =   

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

ra lrbT



   .  

ra a

(rb b)T

L44

755/1304

(13.A.3)

E. 13.93 Exerc´ıcio importante. Verifique essas afirma¸co˜es. Se vocˆe n˜ao conseguir procure ajuda, pois n˜ao ser´a poss´ıvel entender o que segue. A maneira pedestre de provar (13.A.2) ´e escrever explicitamente R a e L como matrizes 4 × 4, fazer o produto de ambas e ent˜ao constatar a validade de (13.A.2). Para (13.A.3) proceda de modo an´alogo. 6 As express˜oes acima s˜ao v´alidas de modo bastante geral, para quaisquer que sejam as matrizes de rota¸ca˜o ra e rb . Vamos agora, por´em, considerar matrizes de rota¸ca˜o ra e rb particulares. Escolhemos ra da forma ra = sa ta , onde ta ∈ SO(3) ´e a matriz de rota¸ca˜o que roda o vetor a de modo que apenas a primeira componente do vetor resultante seja n˜ao nula:   α a  0 . t a = (13.A.4) 0 A matriz sa ∈ SO(3), por sua vez, ´e uma matriz de rota¸ca˜o em torno do eixo 1, e que, portanto, deixa o vetor 10 invariante. sa ´e da forma 0

  1 1 0 0  a a  a  0 s22 s23 =:  0 s = 0 sa32 sa33 0 

com

s Assim, temos tamb´em

a0

:=



sa22 sa23 sa32 sa33



0 0 s

a0



 ,

(13.A.5)

∈ SO(2).



 α s a ta a =  0  . 0

Analogamente, escolhemos rb da forma rb = sb tb , onde tb ∈ SO(3) ´e a matriz de rota¸ca˜o que roda o vetor b de modo que apenas a primeira componente do vetor resultante seja n˜ao nula:   β b  0 . tb = (13.A.6) 0 A matriz sb ∈ SO(3), por sua vez, ´e uma matriz de rota¸ca˜o em torno do eixo 1, e que, portanto, deixa

JCABarata. Curso de F´ısica-Matem´ atica

o vetor

  1 0 0

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

756/1304

invariante. sb ´e da forma

com

  1 1 0 0  b b b s =  0 s22 s23  =:  0 0 sb32 sb33 0 

s

b0

:=

Pela defini¸ca˜o de sb acima, tamb´em temos



sb22 sb23 sb32 sb33



0 0 s

b0



 ,

(13.A.7)

∈ SO(2).



 β s b tb b =  0  . 0

Daqui por diante as matrizes ta e tb estar˜ao fixas. As matrizes sa e sb s˜ao ainda arbitr´arias, mas ser˜ao fixadas mais adiante. Com essas escolhas temos agora

Ra LRbT

onde lt := ta l(tb )T .



  =   

sa lt (sb )T

α 0 0

β 0 0

L44



  ,  

(13.A.8)

A matriz L0 = Ra LRbT ´e certamente um elemento do grupo de Lorentz O(3, 1), pois Ra , L e RbT o

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

757/1304

s˜ao. Assim, L0 satisfaz L0 η(L0 )T η = . Calculemos o lado esquerdo dessa igualdade:     α 0 β   sb lT (sa )T   sa l (sb )T 0  0  0         t t    L0 η(L0 )T η =  0 0 0         β 0 0 0 0 0 −1 α 0 0 0 0 0 L44 L44 

  =    

  =   



onde

e

   =   

sa lt (sb )T

α 0 0

β 0 0

L44

sa lt (sb )T

α 0 0

β 0 0

L44

           

f

g

−g T

L244 − β 2

0 0 0 −1

0 0 0

     

sb ltT (sa )T

−β 0 0

−α 0 0

L44



sb ltT (sa )T

−β 0 0

α 0 0

−L44





0 0 0 −1

    

    

   ,   

 −α2 0 0 f = sa lt (lt )T (sa )T +  0 0 0  0 0 0 

   1 1 a b T    0 g = −βs lt (s ) + L44 α 0  . 0 0

E. 13.94 Exerc´ıcio importante. Verifique as express˜oes acima. Sugest˜ao: exer¸ca a virtude da Paciˆencia. 6 Como mencionamos, L0 η(L0 )T η = . Portanto, devemos ter f = g = 0 L244 − β 2 = 1

,

(13.A.9) e

(13.A.10) (13.A.11)

     

JCABarata. Curso de F´ısica-Matem´ atica

(por que?). Logo,

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13



 1 + α2 0 0 sa lt (lt )T (sa )T =  0 1 0 , 0 0 1     1 1 a b T    0 βs lt (s ) = L44 α 0  . 0 0

Devido a` forma de sa e sb em (13.A.5) e (13.A.7) essas rela¸co˜es implicam   1 + α2 0 0 lt (lt )T =  0 1 0 , 0 0 1     1 1    βlt 0 = L44 α 0  . 0 0 E. 13.95 Exerc´ıcio. Certo?

758/1304

(13.A.12)

(13.A.13)

(13.A.14)

(13.A.15)

6

Das rela¸co˜es acima extrairemos v´arias conclus˜oes sobre a estrutura do grupo de Lorentz. A primeira ´e a seguinte proposi¸ca˜o: Proposi¸ c˜ ao 13.21 Para qualquer transforma¸ca ˜o de Lorentz L vale L244 − β 2 = 1,

(13.A.16)

L244 − α2 = 1

(13.A.17)

α2 = β 2 .

(13.A.18)

e, conseq¨ uentemente, Fora isso, a2 = α 2 = β 2 = b 2 , onde a2 e b2 s˜ ao os m´ odulos ao quadrado dos vetores a e b, respectivamente, ou seja, a2 = (L14 )2 + (L24 )2 + (L34 )2

e

b2 = (L41 )2 + (L42 )2 + (L43 )2 .

Portanto, L244 = 1 + (L14 )2 + (L24 )2 + (L34 )2 = 1 + (L41 )2 + (L42 )2 + (L43 )2 . 2 Prova. (13.A.16) ´e o mesmo que (13.A.11). Para provar (13.A.17), notemos que, pela Proposi¸ca˜o 13.14, LT ´e tamb´em uma transforma¸ca˜o de Lorentz. Logo, para LT a rela¸ca˜o (13.A.16) significa L244 − α2 = 1, pois ao passarmos de L para LT o elemento L44 n˜ao muda, mas ocorre a troca α ↔ β. (13.A.18) segue

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

759/1304

  de (13.A.16) e (13.A.17). Para provar que a2 = α2 , notemos que, por (13.A.4), o vetor α0 ´e obtido 0 de a por uma rota¸ca˜o ta ∈ SO(3), que n˜ao altera o comprimento de vetores. De modo an´alogo prova-se que b2 = β 2 . Segue dessa proposi¸ca˜o que, para prosseguirmos, teremos que considerar dois casos: o caso α = β = 0 e o caso em que α 6= 0 e β 6= 0. Caso α = β = 0

Como comentamos, nesse caso temos a = b = 0. Podemos adotar sa = sb = ta = tb = L ´e simplesmente da forma   0  l 0    L =  0  .    0 0 0 L44

e, portanto,

Com α = 0 e sa = sb = ta = tb = , a rela¸ca˜o (13.A.14) reduz-se a ll T = , ou seja, l ∈ O(3). Como det(L) = ±1 e det(l) = ±1 h´a quatro situa¸co˜es a considerar: Ia. det(L) = 1 e det(l) = 1.

Nessa situa¸ca˜o tem-se l ∈ SO(3) e L44 = 1. Portanto, L ∈ SRot.

Ib. det(L) = 1 e det(l) = −1.

Nessa situa¸ca˜o l ∈ O(3) mas l 6∈ SO(3) e L44 = −1. Assim L ´e da forma L = P1 T R com R ∈ SRot. (Justifique). IIa. det(L) = −1 e det(l) = 1.

Nessa situa¸ca˜o l ∈ SO(3) e L44 = −1. Assim L ´e da forma L = T R com R ∈ SRot. (Justifique).

IIb. det(L) = −1 e det(l) = −1.

Nessa situa¸ca˜o l ∈ O(3) mas l 6∈ SO(3) e L44 = 1. Assim L ´e da forma L = P1 R com R ∈ SRot. (Justifique). Resumindo, vimos para o caso a = b = 0 que nas quatro situa¸co˜es poss´ıveis L consiste apenas de uma simples rota¸ca˜o, seguida eventualmente de uma invers˜ao de paridade (Ib e IIb) e/ou de uma revers˜ao temporal (Ib e IIa.). Como veremos, o caso α 6= 0 e β 6= 0 envolve tamb´em um “boost de Lorentz”, ou seja, uma mudan¸ca de entre dois sistemas de referˆencia inerciais com uma velocidade relativa eventualmente n˜ao-nula. Caso α 6= 0 e β 6= 0

Como β 6= 0, (13.A.15) pode ser escrita como     1 1 L44 α     0 0 , lt = (13.A.19) β 0 0   α ou seja, 10 ´e um autovetor de lt com autovalor ω := L44 . De (13.A.19) podemos extrair uma 0  β informa¸ca˜o importante sobre a forma da matriz lt . Como 10 ´e um vetor da base canˆonica de 3 , a 

0

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

760/1304

matriz lt deve ser da forma 





ω

ω (lt )12 (lt )13  lt =  0 (lt )22 (lt )23  =   0 0 (lt )32 (lt )33 0 onde φ ´e o vetor coluna φ =



(lt )12 (lt )13



e

lt0



φT

 , 

lt0

´e a matriz 2 × 2 dada por

lt0

:=



(lt )22 (lt )23 (lt )32 (lt )33



.

E. 13.96 Exerc´ıcio. Por quˆe?

6

Ocorre que tamb´em vale que φ = 0. Para ver isso, notemos que (13.A.14) diz-nos que      2 ω φT 0 0 ω 1 + α 0 0     0 1 0 , lt (lt )T =   =   0  0T 0 lt 0 0 1 lt φ 0

ou seja,

  

Logo,

ω 2 + φT φ

(lt0 φ)T

lt0 φ

lt0 (lt0 )T





 1 + α2 0 0  0 1 0 .  =  0 0 1

lt0 (lt0 )T =

,

(13.A.20)

lt0 φ = 0

(13.A.21)

ω 2 + φT φ = 1 + α 2 .

(13.A.22)

e Agora, (13.A.20) afirma que lt0 ´e uma matriz ortogonal e (lt0 )−1 = (lt0 )T . Aplicando, portanto, (lt0 )−1 a` esquerda em (13.A.21) segue que φ = 0. Chegamos assim a` conclus˜ao que 

  ω ω 0 0    0 (lt )22 (lt )23 lt = = 0 0 (lt )32 (lt )33 0

com ω 2 = 1 + α2 (por (13.A.22)). Segue da´ı que  0

ω

 sa lt (sb )T =  0 0

0

0

0 sa0 lt0 (sb )T

0 0 lt0



,



 ,

(sa0 e sb est˜ao definidos em (13.A.5) e (13.A.7)). Neste momento vamos fixar sa e sb , adotando 0

0

sa0 = sb (lt0 )−1 = sb (lt0 )T .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Com isso, obviamente

0

sa0 lt0 (sb )T = Logo, sa lt (sb )T Retornando a (13.A.8) Ra LRbT onde, recordando, ω =

Cap´ıtulo 13

761/1304

.



 ω 0 0 =  0 1 0 . 0 0 1 

ω  0 =   0 β

L44 α β

e

0 1 0 0

 0 α 0 0   1 0  0 L44 ω 2 = 1 + α2 .

(13.A.23)

(13.A.24)

Resta-nos mostrar que a matriz do lado direito de (13.A.23) tem a forma de um boost de Lorentz, ´ o que acompanhado eventualmente de uma opera¸ca˜o de troca de paridade e/ou revers˜ao temporal. E faremos agora. Como Ra LRbT ´e um elemento do grupo de Lorentz O(3, 1), tem-se que det(Ra LRbT ) = ±1. Calculando o determinante da matriz do lado direito (13.A.23) tem-se ent˜ao ωL44 − αβ = ±1. Multiplicando-se por α/β teremos ω ou seja,

L44 α α − α2 = ± , β β α ω 2 − α2 = ± . β

Pela segunda equa¸ca˜o em (13.A.24) isso implica β = ±α

e

L44 = ±ω,

√ os dois sinais ± acima sendo iguais ao sinal de det(Ra LRbT ). ω, por´em, ´e dado por ± 1 + α2 ( por (13.A.24)), mas a escolha do sinal dessa raiz quadrada ´e independente do sinal de det(R a LRbT ). H´a, portanto, quatro situa¸co˜es poss´ıveis que deveremos considerar separadamente: √ Ia. Escolhendo det(Ra LRbT ) = +1 e ω = + 1 + α2 , (13.A.23) fica  √  1 + α2 0 0 α   0 1 0 0  Rb . L = (Ra )T  (13.A.25)   0 0 1 √ 0 1 + α2 α 0 0 Ra e Rb s˜ao elementos de SRot ' SO(3), temos det(Ra ) = det(Rb ) = 1. Logo, neste caso temos det(L) = 1. Fora isso L44 ≥ 1.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

762/1304

´ conveniente escrever (13.A.25) de outra forma. Como α ´e um n´ E umero real arbitr´ario, vamos definir v ∈ (−1, 1) por v := − √ Teremos

onde

 √   

1 + α2 0 0 α

0 1 0 0

α , 1 + α2

α = −√

de modo que

  0 α γ(v)   0 0 0  =    1 √ 0 0 2 −vγ(v) 0 1+α γ(v) := √

0 1 0 0

v . 1 − v2

(13.A.26)

 0 −vγ(v)  0 0  =: B1 (v),  1 0 0 γ(v)

1 . 1 − v2

Como se vˆe, chegamos dessa forma aos boosts de Lorentz B1 (v) utilizando apenas as propriedades definidoras do grupo de Lorentz. Compare com o estudo do grupo O(1, 1), p´agina 688. Com essa parametriza¸ca˜o, (13.A.25) fica L = (Ra )T B1 (v)Rb , para Ra , Rb ∈ SRot.

√ Ib. Escolhendo det(Ra LRbT ) = +1 e ω = − 1 + α2 ,  √ − 1 + α2  0 Ra LRbT =   0 α

(13.A.23) fica 0 1 0 0

 0 α  0 0 .  1 0 √ 2 0 − 1+α

Logo, usando-se as matrizes P1 e T definidas em (13.74) e  √ 1 + α2 0  0 1 P1 Ra LRbT T =   0 0 α 0

como facilmente se verifica. Da´ı, lembrando que T e temos  √ 1 + α2  0 L = (P1 Ra )T   0 α Assim, com a parametriza¸ca˜o (13.A.26),

(13.75), segue  0 α  0 0 ,  1 √ 0 1 + α2 0

(13.A.28)

(13.A.29)

Rb comutam (por que?), conclui-se que nesse caso  0 0 α  1 0 0  Rb T. (13.A.30)  0 1 √ 0 0 0 1 + α2

L = (P1 Ra )T B1 (v)Rb T, para Ra , Rb ∈ SRot.

(13.A.27)

(13.A.31)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

Por fim, note-se que neste caso temos det(L) = 1 com L44 ≤ −1 (por que?). √ IIa. Escolhendo det(Ra LRbT ) = −1 e ω = + 1 + α2 , (13.A.23) fica  √  1 + α2 0 0 α   0 1 0 0 . Ra LRbT =    0 0 1 0 √ −α 0 0 − 1 + α2 Assim,

T Ra LRbT

 √ 1 + α2  0 =   0 α

como facilmente se verifica. Nesse caso, ent˜ao,  √ 1 + α2  0 L = T (Ra )T   0 α

0 1 0 0

0 1 0 0

Assim, com a parametriza¸ca˜o (13.A.26),

763/1304

(13.A.32)

 0 α  0 0 ,  1 √ 0 0 1 + α2

(13.A.33)

 0 α  0 0  Rb .  1 √ 0 2 0 1+α

(13.A.34)

L = T (Ra )T B1 (v)Rb ,

(13.A.35)

para Ra , Rb ∈ SRot.

Por fim, note-se que neste caso temos det(L) = −1 com L44 ≤ −1 (por que?). √ IIb. Escolhendo det(Ra LRbT ) = −1 e ω = − 1 + α2 , (13.A.23) fica   √ − 1 + α2 0 0 α   0 1 0 0 . Ra LRbT =    0 0 1 √ 0 2 1+α −α 0 0 Assim,

 √ 1 + α2  0 Ra LRbT P1 =   0 α

como facilmente se verifica. Nesse caso, ent˜ao,  √ 1 + α2  0 L = (Ra )T   0 α

0 1 0 0

0 1 0 0

 0 α  0 0 ,  1 √ 0 2 1+α 0

 0 α  0 0  P1 R b .  1 √ 0 1 + α2 0

(13.A.36)

(13.A.37)

(13.A.38)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

764/1304

Assim, com a parametriza¸ca˜o (13.A.26), L = (Ra )T B1 (v)P1 Rb ,

(13.A.39)

para Ra , Rb ∈ SRot.

Por fim, note-se que neste caso temos det(L) = −1 e L44 ≥ 1 (por que?).

A demonstra¸ca˜o do Teorema 13.8 est´a assim completa.

13.B

Um Isomorfismo entre SL( , 2)/{ , − } e L↑+ Esta se¸ca ˜o ´e de autoria de Daniel A. Cortez

Vamos provar que a aplica¸ca˜o Φ1 : SL( , 2)/{ , − } → L↑+ definida por Φ1 (±A) := L[A]

(13.B.40)

´e um isomorfismo entre os grupos SL( , 2)/{ , − } e L↑+ . Para isso, come¸caremos resolvendo dois dos exerc´ıcios propostos a` p´agina 749. O primeiro deles afirma que L[A] = L[B] se e somente se A = ±B. Isso pode ser visto facilmente a partir da Proposi¸ca˜o 13.19. De fato, se L[A] = L[B], ent˜ao para qualquer x ∈ 4 , vale que L[A]x = L[B]x. Usando (13.101), resulta M −1 (AM (x)A∗ ) = M −1 (BM (x)B ∗ ). Portanto, AM (x)A∗ = BM (x)B ∗ e, como M (x) ∈ Herm( , 2) para qualquer x ∈ 4 , segue da Proposi¸ca˜o 13.19 que A = ±B. Por outro lado, ´e claro que se A = ±B, ent˜ao L[A] = L[B], como se pode constatar, por exemplo, a partir de (13.102). Note que o resultado desse exerc´ıcio implica o fato da aplica¸ca˜o Φ1 definida em (13.B.40) ser injetora. Realmente, se Φ1 (A) = Φ1 (B), segue que L[A] = L[B] e, portanto, A = ±B, que correspondem ao mesmo elemento em SL( , 2)/{ , − }. Dessa forma, acabamos de estabelecer o seguinte resultado: 



Proposi¸ c˜ ao 13.22 A aplica¸ca ˜o Φ1 : SL( , 2)/{ , − } → L↑+ definida em (13.B.40) ´e injetora.

2

Passemos agora a mostrar que vale a seguinte regra de composi¸ca˜o: L[A]L[B] = L[AB] para quaisquer matrizes A, B, ∈ SL( , 2). De fato, para qualquer x ∈ 4 , usando (13.101), temos 

L[A]L[B]x = L[A]M −1 (BM (x)B ∗ )

  = M −1 AM M −1 (BM (x)B ∗ )) A∗ = M −1 ( ABM (x)B ∗ A∗ )

= M −1 ( ABM (x)(AB)∗ ) = L[AB]x .

(13.B.41)

Como x ´e arbitr´ario, conclu´ımos que L[A]L[B] = L[AB]. Desse resultado, segue que Φ 1 (±A)Φ1 (±B) = Φ1 (±AB), ou seja, que Φ1 ´e um homomorfismo de SL( , 2)/{ , − } em L↑+ . Como Φ1 ´e uma aplica¸ca˜o injetora, vale, em verdade, o seguinte:

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

765/1304

Proposi¸ c˜ ao 13.23 A aplica¸ca ˜o Φ1 : SL( , 2)/{ , − } → L↑+ definida em (13.B.40) ´e um monomorfismo, ou seja, um homomorfismo injetor. 2 Note agora que para provarmos que Φ1 ´e um isomorfismo entre SL( , 2)/{ , − } e L↑+ , s´o precisamos verificar que Φ1 ´e sobrejetor, isto ´e, que qualquer transforma¸ca˜o de Lorentz do grupo L ↑+ ´e imagem por Φ1 de alguma matriz em SL( , 2)/{ , − }. Como qualquer Λ ∈ L↑+ pode ser escrita em termos de uma composi¸ca˜o de rota¸co˜es e de um boost ao longo da dire¸ca˜o 1, s´o precisamos encontrar as matrizes em SL( , 2)/{ , − } que correspondem a essas opera¸co˜es em L↑+ . De fato, seja Λ ∈ L↑+ , ent˜ao, de acordo com o Teorema 13.8, Λ ´e da forma RaT B1 Rb , onde Ra , Rb ∈ SRot e B1 ´e um boost apropriado ao longo da dire¸ca˜o 1. Se ±b1 ∈ SL( , 2)/{ , − } for tal que Φ1 [±b1 ] = B1 e ±r ∈ SL( , 2)/{ , − } for tal que Φ1 [±r] = R, para qualquer R ∈ SRot, ent˜ao ter´ıamos Φ1 [±raT b1 rb ] = Φ1 [±raT ]Φ1 [±b1 ]Φ1 [±rb ] = RaT B1 R = Λ ,

(13.B.42)

uma vez que Φ1 ´e um homomorfismo. A rela¸ca˜o (13.B.42) mostra que Φ1 ´e uma aplica¸ca˜o sobrejetora, j´a que toda transforma¸ca˜o de Lorentz Λ ∈ L↑+ pode ser obtida como imagem de alguma matriz apropriada de SL( , 2)/{ , − }. Para que o nosso racioc´ınio seja v´alido, precisamos apenas encontrar as matrizes ±b1 e ±r em SL( , 2)/{ , − } com as propriedades mencionadas acima, ou seja, tais que Φ1 [±b1 ] = L[b1 ] = B1 e que Φ1 [±r] = L[r] = R, para qualquer R ∈ SRot. Vamos fazer isso nos par´agrafos seguintes. Em primeiro lugar, escrevemos v = tanh z em B1 (v), de  cosh z  0 B1 (z) = B1 (tanh z) =   0 − senh z

maneira que 0 1 0 0

 0 − senh z  0 0 .  1 0 0 cosh z

As matrizes de SRot, por sua vez, podem ser escritas como   0  ~ 0  eθ~η·J    Rη~ (θ) =  0   ∈ SRot ,   0 0 0

(13.B.43)

(13.B.44)

1

com θ ∈ [−π, π] e ~η ∈ 3 tal que k~ηk = 1. Acima, J~ = (J1 , J2 , J3 ) s˜ao os geradores do grupo de rota¸co˜es SO(3). Com as observa¸co˜es acima, provaremos o seguinte resultado: 

Proposi¸ c˜ ao 13.24 Sejam z ∈ de Pauli. Ent˜ ao,  z  (a) L e− 2 σ1 = B1 (z); h θ i (b) L e−i 2 η~·~σ = Rη~ (θ).



, θ ∈ [−π, π], ~η ∈

3 

tal que |~η | = 1 e ~σ = (σ1 , σ2 , σ3 ) as trˆes matrizes

2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

766/1304

2 z

Prova. Demonstraremos primeiramente (a). Observe que e− 2 σ1 pertence a` SL( , 2) uma vez que (13.B.45) SL( , 2) = { exp (z~η · ~σ ) , onde z ∈ e ~η ∈ 3 com η12 + η22 + η32 = 1 } .  z  Dessa forma L e− 2 σ1 est´a bem definido e podemos usar (13.102) para computar explicitamente seus elementos de matriz. Esse c´alculo ser´a facilitado com o aux´ılio do seguinte Lema 13.1 Sejam σ1 , σ2 , σ3 as trˆes matrizes de Pauli. Ent˜ ao, (a) Tr(σk σ` ) = 2δk` , onde δk` ´e o delta de Kr¨ onecker43 ; (b) Tr(σj σk σ` ) = 2ijk` , onde jk` ´e o s´ımbolo totalmente anti-sim´etrico de Levi-Civita; (c) Tr(σi σk σj σ` ) = 2δi` δkj − 2δij δk` + 2δik δj` .

2 2

Prova do lema. A demonstra¸ca˜o consiste em usar repetidamente os fatos de que o tra¸co de qualquer matriz de Pauli ´e nulo (isto ´e, Trσj = 0, j = 1, 2, 3) e que σk σ` = δk` + ik`j σj , onde a conven¸ca˜o de soma impl´ıcita em ´ındices repetidos foi usada. Assim, para provar (a), temos Tr(σk σ` ) = Tr(δk` + ik`j σj ) = δk` Tr = 2δk` . Para provar (b), usamos o resultado acima e os fatos j´a mencionados. Conseq¨ uentemente, Tr(σj σk σ` ) = Tr[ σj (δk` + ik`m σm ) ] = ik`m Tr(σj σm ) = 2ik`m δjm = 2ik`j = 2ijk` . 43

Leopold Kr¨ onecker (1823-1891).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

767/1304

Finalmente, para provar (c), usamos novamente (a). Com efeito, Tr(σi σk σj σ` ) = Tr[ (δik + iikm σm )(δj` + ij`n σn ) ] = δik δj` Tr − ikm j`n Tr(σm σn ) = 2δik δj` − 2ikm j`n δmn = 2δik δj` − 2ikm j`m . Aplicando a bem conhecida identidade ikm j`m = δij δk` − δi` δkj , obtemos Tr(σi σk σj σ` ) = 2δik δj` − 2δij δk` + 2δi` δkj , completando a prova do lema. Retornemos agora a` prova do item (a) da Proposi¸ca˜o 13.24. Como ´e bem sabido, podemos escrever z

e− 2 σ1 = cosh

z z − σ1 senh . 2 2

(13.B.46)

 z  Para calcular os elementos de matriz L e− 2 σ1 µν , com µ, ν = 1, 2, 3, 4, usamos a rela¸ca˜o (13.102), lembrando que σ4 ≡ . Assim, com o aux´ılio de (13.B.46), temos  − z σ1  z z 1 h z z ∗ i 2 Tr cosh L e = − σ1 senh cosh − σ1 senh 44 2 2 2 2 2 z  1  z z z = − 2 cosh senh σ1 + senh 2 σ12 Tr cosh2 2 2 2 2 2  1 2 z 2z = cosh + senh Tr 2 2 2 = cosh2

z z + senh 2 = cosh z , 2 2

(13.B.47)

 z  onde usamos que σ12 = , Trσ1 = 0 e cosh2 x + senh 2 x = cosh 2x. Calculemos agora L e− 2 σ1 4j com j = 1, 2, 3. Usando (13.102) e (13.B.46), obtemos  z  1 h z  z z ∗ i z L e− 2 σ1 4j = − σ1 senh σj cosh − σ1 senh Tr cosh 2 2 2 2 2  z 1  z z z z = Tr − cosh senh σj σ1 − senh cosh σ1 σj + senh 2 σ1 σj σ1 . 2 2 2 2 2 2 Aplicando o Lema 13.1, resulta imediatamente que  z  z z L e− 2 σ1 4j = −2δj1 cosh senh = −δj1 senh z , 2 2

(13.B.48)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

768/1304

 z  onde a identidade 2 senh (x) cosh(x) = senh (2x) foi usada. O c´alculo de L e− 2 σ1 j4 , j = 1, 2, 3 ´e feito de forma semelhante. Explicitamente,  z  z z z z ∗ i 1 h  L e− 2 σ1 j4 = Tr σj cosh − σ1 senh cosh − σ1 senh 2 2 2 2 2 i  1 h  z z 2 z 2z = Tr σj cosh + senh − 2 cosh senh σj σ1 2 2 2 2 2

z z senh = −δj1 senh z . (13.B.49) 2 2 Observe  − que  novamente utilizamos o Lema 13.1 para o c´alculo do tra¸co. Resta, finalmente, o cˆomputo z σ 1 de L e 2 ij , com i, j = 1, 2, 3. Esse tamb´em pode ser feito de forma simples com o aux´ılio do Lema 13.1. De fato,  z  z  z ∗ i 1 h  z z − σ1 senh − σ1 senh σj cosh L e− 2 σ1 ij = Tr σi cosh 2 2 2 2 2    = −2δj1 cosh

=

z z 1   z z  Tr σi cosh2 σj − cosh senh (σj σ1 + σ1 σj ) + senh 2 σ1 σj σ1  {z } 2 2 2 2| 2 2δj1

=

z 1 z 1 cosh2 Tr(σi σj ) + senh 2 Tr(σi σ1 σj σ1 ) {z } 2 2 2 2| 4δ1i δ1j −2δij

= δij cosh2

z z + senh 2 (2δ1i δ1j − δij ) 2 2

z = δij + 2δ1i δ1j senh 2 , (13.B.50) 2 onde a identidade fundamental cosh2 x − senh 2 x = 1 foi utilizada na u ´ ltima igualdade. Observe da rela¸ca˜o acima que quando i = j = 1, obt´em-se  z  z L e− 2 σ1 11 = 1 + 2 senh 2 2  z z z = cosh2 − senh 2 + 2 senh 2 2 2 2 = cosh2  z  caso contr´ario, L e− 2 σ1 ij = δij .

z z + senh 2 = cosh z , 2 2

(13.B.51)

Usando oes (13.B.47)-(13.B.51), podemos escrever explicitamente a forma completa da   −asz σ express˜ 1 2 para µ, ν = 1, 2, 3, 4. N˜ao ´e dif´ıcil constar (fa¸ca!) que matriz L e µν   cosh z 0 0 − senh z    z  0 1 0 0 . L e− 2 σ1 µν =    0 0 1 0 − senh z 0 0 cosh z

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 13

Vers˜ ao de 29 de setembro de 2005.

769/1304

 z  Comparando com (13.B.43), vemos que L e− 2 σ1 = B1 (z), provando o item (a) da proposi¸ca˜o.

A prova da segunda parte da proposi¸ca˜o segue, essencialmente, a mesma id´eia da primeira, embora −i θ2 η ~·~ σ seja um pouco mais htrabalhosa. Em primeiro lugar, observamos que e ∈ SL( , 2) em virtude de i θ (13.B.45). Assim, L e−i 2 η~·~σ est´a bem definida e podemos calcular seus elementos de matriz usando a θ

f´ormula (13.102). Antes disso, por´em, ´e conveniente expressarmos e−i 2 η~·~σ usando a identidade θ

e−i 2 η~·~σ = cos

θ θ − i~η · ~σ sen . 2 2

Assim, de acordo com (13.102), lembrando sempre que σ4 ≡ , temos   ∗  h θ i θ 1 θ θ θ −i 2 η ~ ·~ σ Tr cos L e = − i~η · ~σ sen − i~η · ~σ sen cos 2 2 2 2 2 44   1 2 2 θ 2θ Tr cos + (~η · ~σ ) sen . = 2 2 2 Escrevendo ~η · ~σ = ηj σj e usando o Lema 13.1, resulta h θ i θ θ 1 1 cos2 Tr + sen 2 ηk ηj Trσk σj L e−i 2 η~·~σ = 2 2 2 2 44 = cos2

θ θ + sen 2 ηk ηj δkj 2 2

= cos2

θ θ + sen 2 ηk ηk = 1 , 2 2

(13.B.52)

h θ i uma vez que ηk ηk = ~η 2 = 1. Prosseguindo, devemos agora calcular os elementos de matriz L e−i 2 η~·~σ , 4j

com j = 1, 2, 3. Como sempre, o c´alculo ´e feito com base na express˜ao (13.102) e com o aux´ılio do Lema 13.1. Assim,    ∗  h θ i θ 1 θ θ θ −i 2 η ~·~ σ Tr cos L e − iηk σk sen σj cos − iη` σ` sen = 2 2 2 2 2 4j =

1 1 θ θ θ θ i cos sen η` Tr(σj σ` ) − i cos sen ηk Tr(σk σj ) 2 2 2 | {z } 2 2 2 | {z } 2δj`

+

1 θ sen 2 ηk η` Tr(σk σj σ` ) | {z } 2 2

2δkj

2ikj`

= i cos

θ θ θ θ θ sen ηj − i cos sen ηj + i sen 2 ηk η` kj` = 0 , 2 2 2 2 2

(13.B.53)

h θ i uma vez que ηk η` ´e sim´etrico pela troca de k com ` e kj` ´e anti-sim´etrico. O c´alculo de L e−i 2 η~·~σ

j4

´e bastante an´alogo ao realizado acima e ´e deixado como exerc´ıcio para o leitor. O resultado obtido

JCABarata. Curso de F´ısica-Matem´ atica

dever´a ser

Vers˜ ao de 29 de setembro de 2005.

h θ i L e−i 2 η~·~σ

Cap´ıtulo 13

770/1304

(13.B.54) h θ i assim como em (13.B.53). Resta, finalmente, calcularmos os elementos de matriz L e−i 2 η~·~σ para j4

= 0,

ij

i, j = 1, 2, 3. Isso ´e feito de forma usual, a partir da express˜ao (13.102) e dos resultados do Lema 13.1. Temos,   ∗    h θ i θ θ θ θ 1 −i 2 η ~·~ σ L e − iηk σk sen σj cos − iη` σ` sen Tr σi cos = 2 2 2 2 2 ij =

1 i θ θ θ i θ θ cos2 Tr(σi σj ) + cos sen η` Tr(σi σj σ` ) − cos sen ηk Tr(σi σk σj ) 2 2 | {z } 2 2 2 | {z } 2 2 2 | {z } 2iij`

2δij

+

1 θ sen 2 ηk η` 2 2

2iikj

Tr(σi σk σj σ` ) {z } |

2(δi` δkj −δij δk` +δik δj` )

= cos2

θ θ θ θ δij − 2 cos sen η` ij` + sen 2 ηk η` (δi` δkj − δij δk` + δik δj` ) . 2 2 2 2

Usando no u ´ ltimo termo que ηk η` δk` = ηk ηk = ~η 2 = 1 e que 2 sen x cos x = sen 2x; cos2 x − sen 2 x = cos 2x, resulta h θ i θ = δij cos θ − η` ij` sen θ + 2ηi ηj sen 2 . L e−i 2 η~·~σ 2 ij Observando ainda que 2 sen 2 x = 1 − cos 2x, ficamos com h θ i = δij cos θ − η` ij` sen θ + ηi ηj (1 − cos θ) . L e−i 2 η~·~σ

(13.B.55)

ij

As express˜oes (13.B.52)-(13.B.55) devem ser diretamente comparadas com (13.B.44). Notamos que todos os elementos da quarta linha e da quarta coluna s˜ao coincidentes. Resta saber se a express˜ao (13.B.55) obtida acima ´e equivalente a` (13.B.44) para as demais linhas e colunas. Isso pode ser verificado calculando os elementos ij da matriz Rη~ (θ). Para tanto, usamos a identidade dada na Proposi¸ca˜o 13.5 a` p´agina 695. Assim,      2  θ~ η ·J~ Rη~ (θ)ij = e + (1 − cos θ) ~η · J~ + sen θ ~η · J~ = ij

= δij + (1 − cos θ)

ij



2    ~ ~ ~η · J + sen θ ~η · J . ij

Agora, conforme visto em (13.41), p´agina 695, tem-se   ~η · J~ = −ijk ηk . ij

ij

(13.B.56)

(13.B.57)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 13

771/1304

Portanto, 

2  ~ ~η · J

ij

=

    ~η · J~ η~ · J~ ik

kj

= ik` η` kjm ηm = (δim δ`j − δij δ`m )η` ηm = ηi ηj − δij η` η` = ηi ηj − δij ,

(13.B.58)

j´a que |~η | = 1. Inserindo (13.B.57) e (13.B.58) em (13.B.56), resulta Rη~ (θ)ij = δij + (1 − cos θ)(ηi ηj − δij ) − sen θ(ijk ηk ) = δij cos θ − ijk ηk sen θ + ηi ηj (1 − cos θ) , que ´e justamente (13.B.55). Isso completa a demonstra¸ca˜o do item (b) da proposi¸ca˜o. Conforme discutido nos par´agrafos que precedem a Proposi¸ca˜o 13.24, a existˆencia de matrizes ±b1 e ±r em SL( , 2)/{ , − } tais que Φ1 [±b1 ] = B1 e Φ1 [±r] = R, para qualquer R ∈ SRot, ´e suficiente para garantir que a aplica¸ca˜o Φ1 seja sobrejetora em L↑+ . Ocorre que a Proposi¸ca˜o 13.24 nos θ z diz justamente que as matrizes procuradas em SL( , 2)/{ , − } s˜ao b1 = e− 2 σ1 e r = e−i 2 η~·σ , com θ ∈ [−π, π] e ~η ∈ 3 tal que k~η k = 1. Dessa forma, para qualquer transforma¸ca˜o de Lorentz Λ ∈ L ↑+ , a rela¸ca˜o (13.B.42) pode ser sempre satisfeita, evidenciando o fato de que Φ 1 ´e sobrejetora. Juntando a` essa conclus˜ao o resultado da Proposi¸ca˜o 13.23, temos demonstrado o seguinte teorema fundamental: 

Teorema 13.10 A aplica¸ca ˜o Φ1 : SL( , 2)/{ , − } → L↑+ definida em (13.B.40) ´e um isomorfismo, ↑ 2 ou seja, SL( , 2)/{ , − } ∼ = Φ1 L+ .

Cap´ıtulo 14 ´ Grupos de Lie e Algebras de Lie. Uma Breve Introdu¸c˜ ao Conte´ udo 14.1 Variedades e Grupos de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . 773 14.2 Breves Considera¸ co ˜es sobre Grupos Topol´ ogicos . . . . . . . . . . . . . . . 775 14.3 Grupos de Lie Matriciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 778 14.3.1 Uma Topologia M´etrica em GL( , n) . . . . . . . . . . . . . . . . . . . . . . 778 14.3.2 O Grupo de Lie GL( , n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779 14.3.3 Sub-Grupos Uniparam´etricos e seus Geradores . . . . . . . . . . . . . . . . . 782 ´ 14.3.4 Sub-Grupos Uniparam´etricos e Algebras de Lie . . . . . . . . . . . . . . . . . 785 14.3.5 Subgrupos Fechados de GL( , n) . . . . . . . . . . . . . . . . . . . . . . . . . 790 ´ 14.4 A Rela¸ ca ˜o entre Grupos de Lie Matriciais e suas Algebras de Lie . . . . 794 ´ 14.4.1 Algebras de Lie Nilpotentes, Sol´ uveis, Simples e Semi-Simples . . . . . . . . . 795 ´ 14.4.2 Quest˜oes sobre a Exponencia¸ca˜o de Algebras de Lie . . . . . . . . . . . . . . 799 14.4.3 Alguns Exemplos Especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 802

ste cap´ıtulo tenciona ser uma modesta introdu¸ca˜o ao estudo de grupos de Lie. Com particular destaque discutiremos grupos de Lie matriciais. Algumas observa¸co˜es pr´evias s˜ao necess´arias. Para a discuss˜ao do conceito geral de grupo de Lie s˜ao indispens´aveis algumas no¸co˜es b´asicas sobre espa¸cos topol´ogicos mas, de importˆancia especial ´e a no¸ca˜o de variedade diferenci´avel. Esse importante conceito, proveniente da geometria, desempenha um papel importante em v´arias a´reas de F´ısica, tais como a Teoria da Relatividade Geral e as Teorias de Calibre. O conceito de variedade diferenci´avel nasceu inspirado na no¸ca˜o mais familiar de superf´ıcie em espa¸cos n e n˜ao se desvincula totalmente daquela. N˜ao pressuporemos da parte do leitor conhecimento pr´evio do conceito de variedade diferenci´avel e, por isso, vamos introduz´ı-lo adiante. N˜ao iremos, no entanto, desenvolver esse assunto em detalhe e, para tal, remetemos o estudante aos (in´ umeros) bons livros sobre Geometria Diferencial, por exemplo [98]. 

Iremos nos concentrar em exemplificar o conceito de grupo de Lie tratando primordialmente de grupos de Lie matriciais. Isso simplifica um pouco o tratamento e reduz um tanto o escopo destas notas introdut´orias. No entanto, a grande maioria dos grupos de Lie de interesse (especialmente em F´ısica) ´e formada por grupos de Lie matriciais. Para o tratamento de grupos de Lie matriciais discutiremos com certo detalhe aspectos alg´ebricos e topol´ogicos de grupos de matrizes. Mais de 100 anos de pesquisa intensa nos separam dos prim´ordios do estudo dos grupos e a´lgebras de Lie e nossas pretens˜oes aqui s˜ao a de uma modesta introdu¸ca˜o a esse vast´ıssimo assunto. Para tratamentos gerais e abrangentes de grupos de Lie recomendamos as referˆencias [101], [97], [20], [73], [130], [63] ou [119], . Para a´lgebras de Lie, recomendamos [69] e [115]. 772

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

773/1304

V´arios grupos de Lie s˜ao importantes na F´ısica e seu tratamento ´e particularmente importante na Mecˆanica Quˆantica e nas Teorias Quˆanticas de Campos. Exemplos de grupos de Lie importantes para a F´ısica s˜ao discutidos com certo detalhe no Cap´ıtulo 13, tais como os grupos SO(3), SU(2) e o grupo de Lorentz.

14.1

Variedades e Grupos de Lie

• Variedades Diferenci´ aveis Uma variedade diferenci´ avel real de dimens˜ao n ´e um espa¸co topol´ogico Hausdorff V dotado de uma fam´ılia de abertos F = {Uα , α ∈ Λ} com as seguintes propriedades: 1. V =

S

α∈Λ

Uα .

2. Para cada Uα ∈ F existe um conjunto aberto Cα de cont´ınua φα : Uα → Cα .

n 

e uma bije¸ca˜o cont´ınua com inversa

3. Para todo par Uα , Uβ ∈ F com Uα ∩ Uβ 6= ∅ a fun¸ca˜o φα ◦ φ−1 β : φβ (Uα ∩ Uβ ) → φα (Uα ∩ Uβ ) ´e infinitamente diferenci´avel como fun¸ca˜o de (um sub-conjunto de)

n 

em

n 

.

Uma variedade anal´ıtica complexa de dimens˜ao n ´e definida analogamente, substituindo-se n por e substituindo-se a condi¸ca˜o de diferenciabilidade infinita do item 3, acima, por analiticidade. 

n

Observa¸ca ˜o 1. Acima, Λ ´e apenas um conjunto de ´ındices usados para rotular os elementos de F e n˜ao tem nenhum papel especial. Λ pode ser finito ou n˜ao, cont´avel ou n˜ao. ao denominadas fun¸co ˜es de transi¸ca ˜o. Em uma Observa¸ca ˜o 2. As fun¸co˜es φα ◦ φ−1 β de acima s˜ variedade k-diferenci´ avel exige-se apenas que as fun¸co˜es de transi¸ca˜o sejam k-vezes diferenci´aveis. Esses objetos tˆem, por´em, interesse relativamente limitado. Observa¸ca ˜o 3. Os pares (φα , Uα ) s˜ao freq¨ uentemente denominados cartas locais da variedade ou simplesmente cartas. A cole¸ca˜o das cartas ´e freq¨ uentemente denominada atlas. Vamos a` interpreta¸ca˜o das condi¸co˜es acima. A condi¸ca˜o 1 diz apenas que a fam´ılia {U α , α ∈ Λ} ´e um recobrimento de V , ou seja, todo elemento de V pertence a pelo menos um aberto Uα , podendo naturalmente ocorrer que alguns pontos de V perten¸cam a v´arios elementos da fam´ılia F, ou seja, os elementos de F podem ter intersec¸co˜es n˜ao-vazias. A condi¸ca˜o 2 ´e importante e diz que os elementos de cada Uα podem ser rotulados (univocamente) por uma n-upla de n´ umeros reais (ou complexos). Ou seja, podemos dotar cada Uα de um sistema de coordenadas. Note que esses sistemas podem ser diferentes para Uα ’s diferentes. Como dissemos, pontos de V podem pertencer a v´arios Uα ’s e, portanto, podem ter a si atribu´ıdas coordenadas diferentes, uma para cada Uα ao qual pertence. Assim, os pontos de Uα ∩ Uβ tˆem a si atribu´ıdos pelo menos dois sistemas de coordenadas: as coordenadas Cα de Uα e as

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

774/1304

coordenadas Cβ de Uβ . A condi¸ca˜o 3 diz-nos como esses sistemas de coordenadas devem relacionar-se, a saber, o que se deseja ´e que a passagem das coordenadas Cβ para as coordenadas Cα , a qual ´e definida pela fun¸ca˜o φα ◦ φ−1 avel (ou anal´ıtica). β , seja infinitamente diferenci´

Como mencionamos, a conceito de variedade foi inspirado na no¸ca˜o de superf´ıcie em conjuntos como e n . Sem entrarmos em detalhes t´ecnicos, toda superf´ıcie em n convenientemente definida (tais como a superf´ıcie da esfera e o toro, em 3 ) ´e uma variedade, ou seja, tem um sistema de coordenadas local. Isso pode ser garantido, por exemplo, pelo conhecido teorema da fun¸ca˜o impl´ıcita da an´alise real. Note-se por´em que variedades n˜ao s˜ao apenas conjuntos de pontos, como as superf´ıcies de n o s˜ao, podendo ser tamb´em conjuntos de outros tipos de objetos, como fun¸co˜es, curvas, vetores, matrizes etc. A id´eia intuitiva b´asica em torno da no¸ca˜o de variedade ´e que a mesma representa uma cole¸ca˜o cont´ınua de objetos que podem ser rotulados por sistemas de coordenadas e de tal forma que possamos, ao menos localmente, manipular essas coordenadas de modo (infinitamente) diferenci´avel, como se faz em n .   a b com det(R) = 1 ´e E. 14.1 Exerc´ıcio. Mostre que o conjunto de matrizes R = −b a , a, b ∈ uma variedade diferenci´avel de dimens˜ao 1. 6 n













• Grupos Topol´ ogicos Vamos agora apresentar a defini¸ca˜o de grupo topol´ ogico, da qual precisaremos para discutir grupos de Lie. Seja G um grupo. Para cada g ∈ G podemos definir uma fun¸ca˜o λg : G → G por λg (h) = gh. Fora isso tem-se tamb´em em G a fun¸ca˜o inv : G → G definida por inv(h) = h−1 . ogico em rela¸ca˜o a uma topologia τ definida em G Defini¸ c˜ ao. Um grupo G ´e dito ser um grupo topol´ se nessa topologia a fun¸ca˜o inv e todas as fun¸co˜es λg forem cont´ınuas. Coment´ ario. Podemos definir tamb´em para cada g ∈ G a fun¸ca˜o µg : G → G por µg (h) = hg, que ´ f´acil de se ver, por´em, que µg = inv ◦ λg−1 ◦ inv. Assim, representa a multiplica¸ca˜o a` direita por g. E em um grupo topol´ogico as fun¸co˜es µg s˜ao tamb´em cont´ınuas. Coment´ ario. Um grupo pode ser topol´ogico em rela¸ca˜o a uma topologia mas n˜ao em rela¸ca˜o a outra. Veremos exemplos. Informalmente, um grupo G ´e topol´ogico se as opera¸co˜es de produto por elementos do grupo e invers˜ao forem cont´ınuas. Em termos mais precisos um grupo topol´ogico ´e formado por um grupo G e uma cole¸ca˜o G de subconjuntos de G, G ⊂ (G), satisfazendo as condi¸co˜es definidoras de um Espa¸co Topol´ogico (vide Cap´ıtulo 18): 1. ∅ ∈ G e G ∈ G, 2. Se A ∈ G e B ∈ G ent˜ao A ∩ B ∈ G, 3. Se I ´e um conjunto arbitr´ario de ´ındices e Aλ ∈ G para todo λ ∈ I ent˜ao

[

λ∈I

Aλ tamb´em ´e um

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

775/1304

elemento de G, e tais que para todo O ∈ G as imagens inversas inv −1 (O) e λ−1 ao igualmente g (O), para todo g ∈ G, s˜ elementos de G. Os elementos de G s˜ao ditos ser os conjuntos abertos de G. Como em geral se faz em espa¸cos topol´ogicos, um conjunto F ⊂ G ´e dito ser fechado se seu complementar G \ F for aberto. • Grupos de Lie Um grupo topol´ogico que, enquanto espa¸co topol´ogico, seja uma variedade real diferenci´avel (complexa anal´ıtica) ´e dito ser um Grupo de Lie1 real (complexo) se as opera¸co˜es de multiplica¸ca˜o a` direita e invers˜ao forem infinitamente diferenci´aveis (anal´ıticas). E. 14.2 Exerc´ıcio. Verifique que ( , +) (o grupo aditivo dos reais) e ( cativo dos reais n˜ao-negativos) s˜ao grupos de Lie reais. 

E. 14.3 Exerc´ıcio. 6

 Verifique que R =

a b −b a



, a, b ∈ 



+

\ {0}, ·) (o grupo multipli6

com det(R) = 1 ´e um grupo de Lie real.

Na Se¸ca˜o 14.3.2, p´agina 779, mostraremos com detalhe que GL( , n) ´e um grupo de Lie. Para mais exemplos, vide a discuss˜ao sobre os grupos SO(3), SU(2) etc. do Cap´ıtulo 13.

14.2

Breves Considera¸ co ˜es sobre Grupos Topol´ ogicos

Nesta se¸ca˜o nos limitaremos a apresentar alguns poucos resultados sobre grupos topol´ogicos, dos quais faremos uso adiante ao tratarmos de grupos de Lie. O estudo de grupos topol´ogicos gerais ´e bastante vasto e para um texto cl´assico recomendamos fortemente [101]. Introduzimos aqui a seguinte nota¸ca˜o. Seja G um grupo topol´ogico. Se U ´e algum subconjunto de G e g ∈ G definimos gU = {x ∈ G| x = gu para algum u ∈ U }. Analogamente, U g = {x ∈ G| x = ug para algum u ∈ U }. E. 14.4 Exerc´ıcio. Se U ´e um conjunto aberto de G mostre que para todo g ∈ G os conjuntos gU e U g s˜ao tamb´em conjuntos abertos de G. 6 • Grupos Topol´ ogicos Conexos e Desconexos 1

Marius Sophus Lie (1842-1899). Lie introduziu esse conceito em cerca de 1870 em seus estudos de propriedades de invariˆ ancia de equa¸co ˜es diferenciais parciais.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

776/1304

Um grupo topol´ogico H ´e dito ser desconexo se for a uni˜ao disjunta de dois conjuntos A e B, ambos n˜ao-vazios e ambos simultaneamente abertos e fechados. Ou seja, H = A ∪ B, A ∩ B = ∅ com A 6= ∅, B 6= ∅, onde A e B s˜ao abertos e fechados. Um grupo topol´ogico H ´e dito ser conexo se n˜ao for desconexo.

• Alguns Fatos sobre Grupos Topol´ ogicos Vamos aqui provar alguns fatos b´asicos sobre grupos topol´ogicos gerais. Faremos uso da Proposi¸ca˜o 14.3 abaixo quando falarmos da rela¸ca˜o entre a´lgebras de Lie matriciais e a´lgebras de Lie. Seja H um grupo topol´ogico e G ⊂ H um subgrupo de H. Dizemos que G ´e um subgrupo aberto de H se G for um subconjunto aberto de H. Analogamente, dizemos que G ´e um subgrupo fechado de H se G for um subconjunto fechado de H. A seguinte proposi¸ca˜o ´e relevante nesse contexto. Proposi¸ c˜ ao 14.1 Seja H um grupo topol´ ogico e G um subgrupo aberto de H. Ent˜ ao G ´e igualmente um subgrupo fechado de H. 2 Prova. Seja g 0 ∈ G, onde G ´e o fecho de G. Ent˜ao, se Ug0 ´e qualquer aberto de H que cont´em g 0 , tem-se Ug0 ∩ G 6= ∅ (Proposi¸ca˜o 18.5, p´agina 936). Vamos escolher cuidadosamente um tal aberto U g0 . Seja Ue um aberto de H que contem a identidade. Como G ´e aberto, V = Ue ∩ G ´e igualmente aberto. Escolhemos Ug0 = g 0 V := {x ∈ H, x = g 0 v para algum v ∈ V }. Ent˜ao, como Ug0 ∩ G 6= ∅ existe algum elemento g ∈ G que ´e tamb´em elemento de Ug0 , ou seja, g = g 0 v para algum elemento v ∈ V . Mas isso implica que g 0 = gv −1 . Agora, v ∈ V = Ue ∩ G ⊂ G e, portanto, g 0 ∈ G por ser o produto de dois elementos de G, que ´e um grupo. Proposi¸ c˜ ao 14.2 Seja H um grupo topol´ ogico conexo e G um subgrupo aberto de H. Ent˜ ao G = H. 2 Prova. Vamos supor que G 6= H, ou seja, H \ G 6= ∅. Como G ´e um conjunto aberto e fechado (pela proposi¸ca˜o anterior) H \ G = H ∩ Gc ´e um conjunto aberto e fechado. Assim, H ´e a uni˜ao disjunta de dois conjuntos abertos e fechados, a saber G e H \ G. Isso ´e uma contradi¸ca˜o com o fato de H ser conexo. Logo G = H. Proposi¸ c˜ ao 14.3 Seja H um grupo topol´ ogico conexo e U um aberto de H que contem a identidade e que seja tal que para todo u ∈ U tem-se u−1 ∈ U . Ent˜ ao, H =

∞ [

U n,

n=1

onde U 1 := U e U n := {x ∈ H| x = un · · · u1 para ui ∈ U, i = 1, . . . , n},

n > 1. 2

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

777/1304

Prova. Todos os conjuntos U n s˜ao conjuntos abertos. Isso ´e f´acil de se ver. De fato, [ U2 = u2 U u2 ∈U

e, assim, U 2 ´e aberto, pois ´e uma uni˜ao de abertos (vide exerc´ıcio a` p´agina 775). Analogamente, [ Un = un U n−1 , n > 2. (14.1) un ∈U

Por indu¸ca˜o, segue facilmente que todo U n ´e aberto. S n Assim U := ∞ e igualmente um conjunto aberto (por ser uma uni˜ao de abertos). Se provarmos n=1 U ´ que U ´e um grupo, a proposi¸ca˜o anterior garante a prova desejada. ´ evidente que U contem a identidade e (que est´a contida em U ). Fora isso, se g1 ∈ U n1 e g2 ∈ U n2 , E ent˜ao g1 = un1 · · · u1 e g2 = u0n2 · · · u01 para certos ui e u0i ∈ U. Logo, g1 g2 = un1 · · · u1 u0n2 · · · u01 , −1 mostrando que g1 g2 ∈ U n1 +n2 ⊂ U. Finalmente, se g ∈ U n e g = un · · · u1 , ent˜ao g −1 = u−1 1 · · · un ∈ n U ⊂ U. Isso completa a prova que U ´e um grupo. Informalmente, essa proposi¸ca˜o diz que se H ´e um grupo topol´ogico conexo, ent˜ao qualquer aberto U que contem a identidade gera o grupo H, ou seja, todo elemento de H pode ser escrito como o produto finito de elementos de U. Observa¸ca ˜o. Como a identidade e ´e um elemento de U , segue facilmente de (14.1) que U n−1 ⊂ U n para todo n ≥ 1.

Seja H um grupo topol´ogico. Dizemos que uma cole¸ca˜o de conjuntos abertos A λ ∈ H, λ ∈ Λ, ´e um recobrimento de H se [ H = Aλ . λ∈Λ

Um grupo topol´ogico ´e dito ser compacto se possuir a seguinte propriedade: para todo recobrimento Aλ ∈ H, λ ∈ Λ, de H existir um subconjunto finito Aλ1 , . . . , Aλn de conjuntos abertos que tamb´em ´e um recobrimento de H: H = A λ1 ∪ · · · ∪ A λn . A seguinte proposi¸ca˜o ´e imediata: Proposi¸ c˜ ao 14.4 Seja H um grupo topol´ ogico conexo e compacto e seja U um aberto de H que contem a identidade e que seja tal que para todo u ∈ U tem-se u−1 ∈ U . Ent˜ ao, existe um n tal que H = U n. 2 S n Prova. Como H ´e conexo, pela Proposi¸ca˜o 14.3 tem-se H = ∞ e, portanto, n=1 U . O lado direito ´ um recobrimento de H por abertos. Assim, como H ´e compacto, H tem um recobrimento finito pelos abertos U n : existem n1 < n2 < · · · < nk tais que H = U n1 ∪ · · · ∪ U nk . Como U n1 ⊂ · · · ⊂ U nk , tem-se H = U nk , como quer´ıamos provar.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

778/1304

Coment´ ario. Na proposi¸ca˜o acima, a igualdade H = U n afirma que todo elemento de H ´e obtido por um produto de no m´aximo n elementos de U . O n´ umero n ´e dependente de U e ´e intuitivo dizer que quanto “menor” for o aberto U que contem a identidade, maior ser´a n.

14.3

Grupos de Lie Matriciais

Nosso objetivo nesta se¸ca˜o e nas que se seguem ´e introduzir os grupos de Lie matriciais e discut´ı-los. Trataremos de alguns exemplos ilustrativos com algum detalhe, come¸cando com o grupo GL( , n). Comentemos que essencialmente todas as nossas afirma¸co˜es adiante sobre GL( , n) s˜ao tamb´em v´alidas para o grupo real GL( , n). 

14.3.1

Uma Topologia M´ etrica em GL( , n)

Como prepara¸ca˜o, fa¸camos alguns coment´arios topol´ogicos sobre GL( , n). A topologia m´etrica de Mat ( , n) discutida na Se¸ca˜o 4.1, p´agina 223, pode ser introduzida naturalmente em GL( , n), que afinal ´e um subconjunto de Mat ( , n), ao definirmos para A, B ∈ GL( , n) a m´etrica d(A, B) = kA − Bk, sendo k · k a norma operatorial de Mat ( , n). Mostremos que GL( , n) ´e um conjunto aberto e denso de Mat ( , n). e um Conjunto Aberto de Mat( , n) • GL( , n) ´ ´ relevante notarmos que GL( , n) n˜ao ´e um subconjunto fechado de Mat ( , n). Isso se vˆe tomando E   1/m 0 o exemplo da seq¨ uˆencia de matrizes diagonais 2 × 2 da forma Am = , m ∈ , seq¨ uˆencia 0 1/m essa formada por elementos de GL( , 2) mas que converge para a matriz nula, que obviamente n˜ao ´e elemento de GL( , 2). 

Em verdade, GL( , n) ´e um conjunto aberto de Mat ( , n). Para mostrar isso temos que provar 2 que se A ∈ GL( , n) e B ´e uma matriz tal que kB−Ak ´e suficientemente pequena, ent˜ao B ´e invert´ıvel e, portanto, tamb´em pertence a GL( , n). Observemos que B = A ( + A−1 (B − A)). Se provarmos −1 que +A−1 (B −A) ´e invert´ıvel ent˜ao teremos que B −1 existe, sendo dada por ( + A−1 (B − A)) A−1 . 

Escolhendo B pr´oximo o suficiente de A de modo que kB − Ak < 1/kA−1 k ent˜ao A−1 (B − A) ter´a norma menor que 1 e, portanto, + A−1 (B − A) tem uma inversa dada pela s´erie de Neumann3 convergente4 ∞ X −1 m −1 + A (B − A) = + (−1)m A−1 (B − A) . 



m=1

Isso prova que B tem inversa e completa a prova que GL( , n) ´e um conjunto aberto. 2

Vide a defini¸ca ˜o de conjunto aberto em espa¸cos m´etricos dada a ` p´ agina 845. Karl Neumann (1832-1925). 4 A justificativa dessa express˜ ao foi apresentada na Se¸ca ˜o 4.2. Note que a expans˜ ao de Taylor da fun¸ca ˜o anal´ıtica P∞ para |z| < 1 em torno de z = 0 ´e precisamente 1 + m=1 (−1)m z m . 3

1 1+z

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

779/1304

E. 14.5 Exerc´ıcio. H´a uma maneira alternativa “r´apida” de provar que GL( , n) ´e um conjunto aberto. Mostre que det(A) ´e cont´ınua como fun¸c˜ao dos elementos de matriz de A. Mostre que isso implica que det(A) ´e cont´ınua na topologia induzida em Mat ( , n) pela norma operatorial (em, verdade, por qualquer norma, pois s˜ao todas equivalentes). Conclua que GL( , n) ´e um conjunto aberto, observando para tal que trata-se do conjunto de todas as matrizes complexas com determinante n˜ao-nulo e notando que \ {0} ´e um conjunto aberto em . 6 • GL( , n) ´ e denso em Mat( , n) Provemos que todo elemento de Mat ( , n) pode ser aproximado em norma por uma matriz invert´ıvel. Isso equivale a dizer que GL( , n) ´e denso em Mat ( , n). Seja A ∈ Mat ( , n) e seja ´ claro que se α 6∈ σ(A) ent˜ao σ(A) = {λ1 , . . . , λr } o conjunto de seus autovalores distintos (r ≤ n). E det(α − A) 6= 0 e A − α tem inversa (recorde que os autovalores de A s˜ao os zeros do polinˆomio caracter´ıstico de A). Seja agora, αn , n ∈ , uma seq¨ uˆencia de n´ umeros complexos tais que αn 6∈ σ(A) para todo n, e tais que αn → 0 para n → ∞. Teremos que as matrizes An := A − αn s˜ao todas invert´ıveis e d(A, An ) = kA − An k = |αn | k k = |αn | → 0 para n → ∞. Isso prova nossa afirma¸ca˜o. 

14.3.2

O Grupo de Lie GL( , n)

Nesta se¸ca˜o mostraremos que GL( , n) ´e um grupo de Lie. Para isso mostraremos primeiro que GL( , n) ´e um grupo topol´ogico e depois que ´e uma variedade anal´ıtica, para ent˜ao mostrar que o produto e a invers˜ao s˜ao anal´ıticos. Esses resultados, al´em de importantes em si, servem ao prop´osito pedag´ogico de ilustrar os conceitos de grupo topol´ogico e de variedade. • GL( , n) ´ e um Grupo Topol´ ogico Para provarmos que GL( , n) ´e um grupo topol´ogico precisamos mostrar que o produto em GL( , n) e a invers˜ao de matrizes em GL( , n) s˜ao opera¸co˜es cont´ınuas. Sejam G, G0 , H ∈ GL( , n). Temos que kG0 H − GHk 

= k(G0 − G)Hk 

≤ kG0 − Gk kHk , 



mostrando que kG0 H − GHk → 0 se kG0 − Gk → 0. Assim, o produto a` esquerda ´e cont´ınuo. 



Sejam agora G, H ∈ GL( , n). Fixemos H e tomemos kG − Hk <  com  > 0 escolhido pequeno ´ claro que G = H + (G − H) = H( + H −1 (G − H)), de o suficiente de modo que kH −1 k < 1. E −1 maneira que G−1 = [ + H −1 (G − H)] H −1 . Logo, n o −1 − G−1 − H −1 = + H −1 (G − H) H −1 . 



Assim, como pela escolha de  temos kH −1 (G − H)k ≤ kH −1 k < 1, podemos escrever " ∞ # X   m G−1 − H −1 = (−1)m H −1 (G − H) H −1 . 

m=1



JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

780/1304

A justificativa dessa express˜ao5 foi apresentada na Se¸ca˜o 4.2. Tem-se, ent˜ao, " ∞ # X kH −1 k2 kG−1 − H −1 k ≤ . kH −1 km kG − Hkm kH −1 k ≤ −1 k 1 − kH m=1 











Portanto kG−1 − H −1 k → 0 quando kG − Hk → 0, provando a continuidade da opera¸ca˜o de invers˜ao de matrizes. Isso completa a prova que GL( , n) ´e um grupo topol´ogico. 



E. 14.6 Exerc´ıcio. H´a uma maneira alternativa “r´apida” de provar que a opera¸c˜ao de invers˜ao ´e cont´ınua: use a regra de Laplace, express˜ao (3.8), p´agina 145, para calcular a inversa de uma matriz e evoque o fato que o determinante ´e cont´ınuo. 6 • GL( , n) ´ e uma Variedade Anal´ıtica Vamos agora mostrar que GL( , n) ´e uma variedade anal´ıtica. Seja, para cada  > 0, o sub-conjunto C de

n2

definido por

C := {(x11 , . . . , x1n , x21 , . . . , x2n , . . . , xn1 , . . . , xnn ) ∈

n2

com |xij | <  para todos i, j = 1, . . . , n}. Para x = (x11 , . . . , x1n , x21 , . . . , x2n , . . . , xn1 , . . . , xnn ) ∈ C , denotemos por X a matriz cujo elemento ij ´e Xij = xij e denotemos + X por A(x). Obviamente A(x)ij = δij + xij , i, j = 1, . . . , n. ´ bem claro que cada C ´e um sub-conjunto aberto de n2 . Seja tamb´em U := {A(x) ∈ Mat ( , n)| x ∈ E C }. E. 14.7 Exerc´ıcio. Mostre que cada U ´e um sub-conjunto aberto de Mat ( , n).

6

´ bem claro que para toda matriz A(x) como acima tem-se det(A(x)) = 1 + p(x), onde p(x) ´e E um polinˆomio nas vari´aveis xij que se anula quanto todas as xij s˜ao nulas. Assim, se x ∈ C vˆe-se que det(A(x)) 6= 0 caso  seja pequeno o suficiente, pois isso garante que |p(x)| < 1. Portanto, se escolhermos  pequeno o suficiente, teremos que U ´e um sub-conjunto aberto de GL( , n), o que suporemos daqui por diante. Seja agora g uma matriz arbitr´aria de GL( , n) e seja Ug = {gA(x), com A(x) ∈ U }. Pela nota¸ca˜o que apresentamos quando discutimos grupos topol´ogicos, Ug = gU , e Ug ´e um aberto de GL( , n). Fora isso, g ∈ Ug , pois = A(0) ∈ U . Conclu´ımos que [ GL( , n) = Ug , g∈GL( , n) 5 Note que a expans˜ ao de Taylor da fun¸ca ˜o anal´ıtica P∞ m m (−1) z . m=1

1 1+z

− 1 para |z| < 1 em torno de z = 0 ´e precisamente

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

781/1304

ou seja, GL( , n) possui um recobrimento por abertos. n2

Vamos agora mostrar que cada Ug ´e bijetivamente mapeado em um aberto de simples pois, se para cada g ∈ GL( , n) definirmos fun¸co˜es φgij : Ug → por φgij (gA(x)) = φgij (g + gX)) := (gX)ij , ou seja, φgij (gA(x))

:=

n X

gik xkj ,

. Isso ´e bem

i, j = 1, . . . , n,

i, j = 1, . . . , n,

k=1

vemos facilmente que todo h P ∈ Ug ´e da forma hij = gij + φgij (gA(x)). Assim, o conjunto Cg ⊂ formado pelas vari´aveis xij = nk=1 gik xkj com xij ∈ C ´e um sistema de coordenadas para Ug .

n2

Por fim, para todo h ∈ Ug ∩ Ug0 , teremos h = gA(x) = g 0 A(x0 ), ou seja, A(x0 ) = (g 0 )−1 gA(x) e x0ij

n X  0 −1  = −δij + (g ) g ik (δkj + xkj ) = k=1

0 −1

(g ) g −



ij

+

n X 

(g 0 )−1 g

k=1



ik

xkj ,

o que mostra que as coordenadas x0 s˜ao expressas em termos de polinˆomios nas vari´aveis x. Portanto, a mudan¸ca nas coordenadas de Ug para as de Ug0 ´e expressa em termos de fun¸co˜es anal´ıticas (em verdade, polinˆomios). Isso provou que GL( , n) ´e uma variedade anal´ıtica. e Grupo de Lie • GL( , n) ´ Para finalmente provarmos que GL( , n) ´e um grupo de Lie, resta-nos provar que a multiplica¸ca˜o a` direita e a invers˜ao s˜ao anal´ıticas. A primeira parte ´e elementar. Tomemos g, h ∈ GL( , n). Os elementos de Uh s˜ao da forma hA(x) e os de gUh s˜ao da forma ghA(x) ∈ Ugh . Agora, as fun¸co˜es de C em dadas por C 3 x 7→

φgh ij (ghA(x))

=

n X

(gh)ik xkj

i, j = 1, . . . , n,

k=1

s˜ao polinˆomios nas vari´aveis xij e, portanto, anal´ıticas. Assim, o produto ´e anal´ıtico. Para provar que a invers˜ao ´e anal´ıtica tomemos g ∈ GL( , n). Um elemento gen´erico de U g ´e da forma gA(x) = g( + X). Agora, (gA(x))

−1

−1 −1

= ( + X) g

−1

−1

= g ( + gY (x)g ),

com Y (x) :=

∞ X

(−1)m X m .

m=1

Cada elemento de matriz de Y (x) ´e uma fun¸ca˜o anal´ıtica dos xij , pois a s´erie de Neumann6 acima converge absolutamente (claramente, temos que escolher  pequeno o suficiente). Agora, as fun¸co˜es    −1 −1 C 3 x 7→ φgij (gA(x))−1 = φgij g −1 ( + gY (x)g −1 ) = gY (x)g −1 ij s˜ao fun¸co˜es anal´ıticas dos xij , provando que a aplica¸ca˜o de invers˜ao ´e anal´ıtica. Isso estabelece finalmente que GL( , n) ´e um grupo de Lie de dimens˜ao n2 . 6

Karl Neumann (1832-1925).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

782/1304

E. 14.8 Exerc´ıcio. H´a uma maneira alternativa “r´apida” de provar que a opera¸c˜ao de invers˜ao ´e anal´ıtica: use a regra de Laplace, express˜ao (3.8), p´agina 145, para calcular a inversa de uma matriz e evoque o fato que o determinante ´e anal´ıtico. 6

14.3.3

Sub-Grupos Uniparam´ etricos e seus Geradores

Sub-grupos uniparam´etricos s˜ao muito importantes na teoria dos grupos de Lie. Vamos apresent´a-los no caso de matrizes. Defini¸ c˜ ao. Um sub-grupo uniparam´etrico de GL( , n) ´e um homomorfismo cont´ınuo 7 do grupo ( , +) em GL( , n). Em outras palavras, ´e uma fun¸ca˜o que a cada t real associa continuamente uma matriz invert´ıvel γ(t) de modo que γ(t)γ(t0 ) = γ(t + t0 ) (14.2) 

para todos t, t0 ∈



. Note que de (14.2) segue automaticamente que γ(0) =

(por que?).

A importˆancia dos sub-grupos uniparam´etricos reside na seguinte proposi¸ca˜o, a qual tamb´em come¸ca a revelar a relevˆancia das exponenciais de matrizes na teoria dos grupos de Lie.

Proposi¸ c˜ ao 14.5 Seja γ : → GL( , n) um sub-grupo uniparam´etrico. Ent˜ ao existe uma matriz M ∈ Mat ( , n), univocamente definida, tal que γ(t) = exp(tM ) para todo t ∈ . Esse fato, em particular, mostra que γ ´e real-anal´ıtica (e, portanto, diferenci´ avel) e que M = γ 0 (0). A matriz M ´e dita ser o gerador do sub-grupo uniparam´etrico γ. 2 



Prova.8 Se supus´essemos que γ ´e uma matriz diferenci´avel pr´oximo a t = 0, ter´ıamos que para qualquer t   1 1 0 γ (t) = lim (γ(t + s) − γ(t)) = γ(t) lim (γ(s) − γ(0)) = γ(t)γ 0 (0). s→0 s s→0 s

Definindo M := γ 0 (0), concluir´ıamos que γ satisfaz a equa¸ca˜o diferencial γ 0 (t) = γ(t)M , cuja solu¸ca˜o ´e u ´ nica (vide Cap´ıtulo 7) e dada por γ(t) = exp(tM ), como quer´ıamos provar. A demonstra¸ca˜o estaria completa, n˜ao fosse o fato de que no enunciado supomos apenas que γ ´e ´ no entanto, poss´ıvel cont´ınua, o que em geral n˜ao implica que γ seja tamb´em diferenci´avel em t = 0. E, provar que se γ ´e cont´ınua, ent˜ao pelo fato de ser um homomorfismo de ( , +) segue que γ ´e tamb´em diferenci´avel pr´oximo a t = 0! A id´eia ´e construir a partir de γ uma fun¸ca˜o γ˜ infinitamente diferenci´avel e posteriormente mostrar que γ pode ser recuperada de γ˜ por opera¸co˜es diferenci´aveis. 

Para tal seja θ uma fun¸ca˜o real, positiva infinitamente diferenci´avel, com suporte compacto contendo t = 0 e tal que Z ∞

θ(s)ds = 1.

−∞

7

Vide nota a ` p´ agina 785. Extra´ıda de [63]. A observa¸ca ˜o de que no enunciado da Proposi¸ca ˜o 14.5 ´e suficiente supor-se que o sub-grupo uniparam´etrico γ ´e apenas cont´ınuo (dispensando uma condi¸ca ˜o de diferenciabilidade) ´e devida a von Neumann. 8

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

Um exemplo de uma tal fun¸ca˜o seria (para a < 0 < b)  (  K exp − (s−a)21(s−b)2 , θ(s) = 0,

783/1304

para s ∈ (a, b) de outra forma,

que tem suporte [a, b] 3 0. Uma escolha conveniente da constante K garante que

R∞

−∞

θ(s)ds = 1.

Assim, seja uma tal fun¸ca˜o θ desse tipo e com suporte em, digamos, [−a, a] para algum a > 0, e seja Z ∞ θ(t − s)γ(s)ds. γ˜(t) := −∞

´ f´acil (Exerc´ıcio!) ver que γ˜ assim definida ´e infinitamente diferenci´avel. Fora isso, E Z

γ˜ (t) =

∞ −∞

θ(t − s)γ(s)ds =

Z

∞ −∞

θ(u)γ(t − u)du =

Z



θ(u)γ(t)γ(−u)du

−∞

= γ(t) R∞

com Y :=

pois

R∞

−∞

−∞

Z



θ(u)γ(−u)du = γ(t)Y,

−∞

θ(u)γ(−u)du. Temos que Y −

=

Z

∞ −∞

θ(u)(γ(−u) − )du,

θ(u)du = 1, por hip´otese. Logo

kY − k 



Z



θ(u) kγ(−u) − k du = 

−∞

Z

a

θ(u) kγ(−u) − k du 

−a

≤ c

Z

a

θ(u) du = c −a

Z



θ(u) du = c ,

−∞

onde c := supu∈[−a, a] kγ(−u) − k . Como γ ´e cont´ınua e γ(0) = , podemos fazer c arbitrariamente pequena, escolhendo Mas isso diz que Y = − ( − Y ) ´e invert´ıvel, com Y −1 dado pela P∞a pequeno. m s´erie convergente m=0 ( − Y ) . Assim, com a pequeno teremos γ(t) = γ˜ (t)Y −1 , o que prova que γ(t) ´e infinitamente diferenci´avel. 

Defini¸ c˜ ao. O que essa proposi¸ca˜o provou ´e que todo sub-grupo uniparam´etrico de GL( , n) ´e da forma exp(tM ) para alguma matriz M ∈ Mat ( , n). Essa matriz M ´e dita ser o gerador do sub-grupo uniparam´etrico em quest˜ao. Comentemos brevemente que a Proposi¸ca˜o 14.5, que acabamos de provar, tem generaliza¸co˜es importantes na teoria dos espa¸cos de Hilbert e de Banach, onde ´e conhecida como Teorema de Stone 9 . Vide, por exemplo, [103]. 9

Marshall Harvey Stone (1903-1989).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

784/1304

• A Cole¸ c˜ ao de todos os Geradores de Sub-grupos Uniparam´ etricos Seja G um sub-grupo de GL( , n). Seja definido o seguinte conjunto: L(G) := {M ∈ Mat ( , n)| exp(tM ) ∈ G,

∀t ∈

} . 

Analogamente, seja G um sub-grupo de GL( , n). Seja definido o seguinte conjunto: 

L(G) := {M ∈ Mat ( , n)| exp(tM ) ∈ G, ∀t ∈ 



} .

Em palavras, L(G) ´e a cole¸ca˜o de todos os geradores de todos os sub-grupos uniparam´etricos de ´ claro, pela defini¸ca˜o, que L(G) contem sempre pelo menos a matriz nula (pois exp(t0) = ∈ G, G. E ∀t ∈ ), mas n˜ao ´e nem um pouco evidente que esse n˜ao seja o u ´ nico elemento de L(G). Por exemplo, se G for um grupo discreto ent˜ao L(G) = {0}. Mesmo no caso de G ser um grupo cont´ınuo n˜ao ´e nada o´bvio que G possua sub-grupos uniparam´etricos n˜ao-triviais. Logo abaixo estudaremos essa quest˜ao no caso do grupo GL( , n) e, um pouco mais adiante, no caso de sub-grupos fechados (n˜ao-discretos) de GL( , n). Em tais casos veremos que L(G) n˜ao consiste apenas da matriz nula. 

Chamamos a aten¸ca˜o do estudante para o fato que, para um grupo G gen´erico, n˜ao ´e necessariamente verdade que todo elemento de G pode ser escrito na forma exp(tM ) para algum M ∈ L(G) e algum t ∈ . Ou seja, existem grupos G nos quais encontram-se elementos que n˜ao pertencem a nenhum sub-grupo uniparam´etrico de G. Na Proposi¸ca˜o 4.10, p´agina 236, vimos que isso ocorre no grupo real GL( , n), pois esse grupo n˜ao ´e conexo, mas esse fenˆomeno pode ocorrer mesmo em grupos conexos. Um exemplo ser´a discutido na p´agina 803, adiante. 



* A cole¸ca˜o de todos os geradores de todos os sub-grupos uniparam´etricos de um dado grupo G ´e um objeto muito importante, especialmente na teoria dos grupos de Lie. Discutiremos esse fato adiante. No caso do grupo GL( , n) podemos facilmente identificar o que ´e L(GL( , n)). Faremos isso agora. ´ • Sub-grupos Uniparam´ etricos de GL( , n) e a Algebra de Lie Associada a GL( , n) A cole¸ca˜o de todos os geradores de todos os subgrupos uniparam´etricos do grupo GL( , n) ser´a denotada aqui por L(GL( , n)) ou por gl( , n). Vamos identificar esse conjunto. Na Proposi¸ca˜o 4.11, p´agina 236, demonstramos que todo elemento A ∈ GL( , n) pode ser escrito na forma A = exp(B) para algum B ∈ Mat ( , n). Conseq¨ uentemente, A pertence ao subgrupo uniparam´etrico composto pelas matrizes da forma exp(tB), t ∈ . Assim, GL( , n) possui subgrupos uniparam´etricos n˜ao-triviais. Reciprocamente, para todo B ∈ Mat ( , n) o conjunto de matrizes da forma exp(tB), t ∈ , forma um subgrupo uniparam´etrico de GL( , n). Conclu´ımos disso que L(GL( , n)) = Mat ( , n). 



J´a discutimos por diversas vezes (vide p´agina 57 e seguintes) que o conjunto Mat ( , n) ´e uma a´lgebra de Lie com rela¸ca˜o ao produto definido pelo comutador de matrizes. Um pouco mais adiante, veremos que esse fato ´e geral: o conjunto de todos os geradores de um subgrupo fechado (n˜ao-discreto) de um grupo de Lie ´e tamb´em uma a´lgebra de Lie. Esse fato ´e de importˆancia central na teoria dos grupos de Lie.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

785/1304

E. 14.9 Exerc´ıcio. Para a, b = 1, . . . , n e α ∈ , sejam γαab (t), matrizes definidas da seguinte forma:  para a 6= b  + αtE ab , ab , com t ∈ . γα (t) :=  + (eαt − 1)E aa , para a = b  Aqui E ab ´e a matriz cujos elementos ij s˜ao dados por E ab ij = δi a δj b , ou seja, E ab ´e a matriz cujos elementos de matriz s˜ao todos nulos, exceto o elemento ab, que vale 1. Mostre que as matrizes γ αab s˜ao subgrupos uniparam´etricos de GL( , n), ou seja, que γαab (t) s˜ao cont´ınuas e que γαab (t)γαab (t0 ) = γαab (t + t0 ) 2 para todo a, b e todo α. (Sugest˜ ao: mostre que E ab = δab E ab e use esse fato). Mostre que seus  6 geradores s˜ao as matrizes αE ab . Constate tamb´em explicitamente que γαab (t) = exp αtE ab . 

Note que a cole¸ca˜o formada por todas combina¸co˜es lineares reais dos geradores dos subgrupos uniparam´etricos γαab de GL( , n) coincide com Mat ( , n) (por que?). E. 14.10 Exerc´ıcio. Como s˜ao as rela¸co˜es de comuta¸c˜ao das matrizes E ab ?

6

• Homomorfismos N˜ ao-Cont´ınuos de ( , +) 

Contemplando a defini¸ca˜o de sub-grupo uniparam´etrico que apresentamos acima, como sendo um homomorfismo cont´ınuo de ( , +) em um grupo G, o estudante pode legitimamente questionar se existem, afinal, homomorfismos n˜ao-cont´ınuos desse grupo que justifiquem a necessidade de evocar a condi¸ca˜o de continuidade na Proposi¸ca˜o 14.5. Talvez um tanto surpreendentemente, a resposta ´e positiva. H´a at´e mesmo automorfismos n˜ao-cont´ınuos de ( , +) em si mesmo, os quais foram apresentados a` p´agina 98, onde discutimos a existˆencia de fun¸co˜es descont´ınuas de em que satisfazem f (t) + f (t0 ) = f (t + t0 ) para todos t, t0 ∈ . Assim, com o uso de uma tal fun¸ca˜o f , ´e relativamente f´acil construir um homomorfismo n˜ao-cont´ınuo de ( , +) em um grupo G dado, caso conhe¸camos um homomorfismo cont´ınuo de ( , +) em G. De fato, se γ(t), t ∈ , ´e um homomorfismo cont´ınuo de ( , +) em G ent˜ao γ(f (t)), t ∈ , ´e um homomorfismo de ( , +) em G, mas que n˜ao ´e cont´ınuo. Dada a “artificialidade” daquelas fun¸co˜es f , tais exemplos s˜ao um tanto patol´ogicos, mas explicam a necessidade de incluir a condi¸ca˜o de continuidade na defini¸ca˜o de sub-grupo uniparam´etrico e na Proposi¸ca˜o 14.5. 















14.3.4







´ Sub-Grupos Uniparam´ etricos e Algebras de Lie

• Sub-Grupos Uniparam´ etricos em Sub-Grupos Fechados Defini¸ c˜ ao. Seja H um subgrupo fechado mas n˜ao discreto de GL( , n). Definimos  L(H) := X ∈ Mat ( , n) tais que etX ∈ H para todo t ∈ . 

´ claro, Como se vˆe, trata-se do conjunto dos geradores de todos os subgrupos uniparam´etricos de H. E pela defini¸ca˜o acima, que L(H) possui pelo menos um elemento, a saber a matriz nula, pois, obviamente et0 = ∈ H para todo t ∈ . N˜ao ´e nem um pouco o´bvio, por´em, que haja outros elementos em L(H) 

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

786/1304

que n˜ao o elemento nulo. N˜ao ´e sequer o´bvio que existam subgrupos uniparam´etricos n˜ao-triviais 10 em H. Na Proposi¸ca˜o 14.6 adiante, provaremos que L(H), de fato, ´e n˜ao-trivial e que h´a, de fato, subgrupos uniparam´etricos n˜ao-triviais em H. Para demonstrarmos a Proposi¸ca˜o 14.6 precisamos de algumas defini¸co˜es e de alguns resultados preparat´orios. Seguiremos muito proximamente a exposi¸ca˜o de [97] (vide todo o 2 do Cap´ıtulo XI daquela referˆencia), mas com ligeiras corre¸co˜es e aperfei¸coamentos. Para simplificar a nota¸ca˜o denotaremos aqui o grupo GL( , n) por G e sua a´lgebra de Lie Mat ( , n) por g. Fixemos doravante um n´ umero r > 0, arbitr´ario mas conveniente, e seja wr a bola fechada de raio r centrada na origem em g: wr := {X ∈ g| kXk ≤ r} . (14.3) Notemos que wr ´e sim´etrica, ou seja, se X ∈ wr ent˜ao −X ∈ wr . Denotaremos por wO r a bola aberta de raio r centrada na origem em g: wO r := {X ∈ g|

kXk < r} .

(14.4)

Vamos denotar por Wr a imagem de wr pela exponencia¸ca˜o: Wr := {exp(X), X ∈ wr } .

(14.5)

´ claro que Wr ⊂ G e ´e claro que Wr ´e sim´etrico, ou seja, se Y ∈ Wr ent˜ao Y −1 ∈ Wr . E

Como H ´e um subconjunto fechado de G, o conjunto H ∩ Wr ´e fechado. Seja fr o subconjunto de wr formado pelos elementos cuja exponencial est´a em H ∩ Wr : fr := {X ∈ wr | exp(X) ∈ H ∩ Wr }.

(14.6)

Comentemos que, pela Proposi¸ca˜o 4.11, p´agina 236, todo elemento de H ´e uma exponencial de algum elemento de g = Mat ( , n). Portanto, todo h ∈ H ∩ Wr ´e da forma h = exp(f ) para algum f ∈ fr . Simbolicamente, podemos escrever exp(fr ) = H ∩ Wr . (14.7) ´ bastante claro que fr ´e tamb´em sim´etrico. Como exp ´e cont´ınua, fr ´e tamb´em fechado (vide Se¸ca˜o E 22.2, p´agina 993). Fora isso, fr ⊂ wr , por defini¸ca˜o. Logo, fr ´e limitado. Por ser fechado e limitado, fr ´e compacto. Definamos M(H, Wr ) ≡ Mr por Mr := {X ∈ g tais que, para algum  > 0, tem-se exp(tX) ∈ H ∩ Wr sempre que |t| < } . (14.8) Alternativamente, ´e claro que Mr = {X ∈ g tais que, para algum  > 0, tem-se tX ∈ fr sempre que |t| < } . Note-se que Mr contem sempre ao menos um elemento, a saber, 0. N˜ao ´e nada o´bvio, por´em, se esse ´e o u ´ nico elemento de Mr . No Corol´ario 14.1, adiante, provaremos que tal n˜ao ´e o caso, ou seja, Mr n˜ao ´e trivial. Antes disso precisamos de dois lemas preparat´orios. 10

Um subgrupo uniparam´etrico γ(t) ´e trivial se γ(t) for igual ao elemento neutro para todo t ∈

.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

787/1304

Lema 14.1 Com as defini¸co ˜es acima, valem as seguintes afirma¸co ˜es. I. Se X ∈ M r ent˜ ao λX ∈ Mr para todo λ ∈ . II. wr ∩ Mr ⊂ fr . 2 

Prova do Lema 14.1. Se X ∈ Mr ent˜ao, para algum  > 0 tem-se tX ∈ fr sempre que |t| < . Mas, ent˜ao, se λ 6= 0, vale t(λX) ∈ fr sempre que |t| < /|λ|. Isso prova a afirmativa I.

Seja agora X ∈ wr ∩ Mr . Queremos provar que X ∈ fr . Como X ∈ Mr ent˜ao, para algum  > 0 tem-se exp(tX) ∈ H ∩ Wr sempre que |t| < . Assim, para n ∈ grande o suficiente (n > −1 ) teremos exp(n−1 X) ∈ H ∩ Wr o que, em particular, diz que exp(n−1 X) ∈ H. Como H ´e um grupo, tem-se que (exp(n−1 X))n ∈ H. Mas o lado esquerdo ´e exp(X) e, portanto, conclu´ımos que exp(X) ∈ H. Agora, por hip´otese, X ∈ wr , o que implica, pela defini¸ca˜o de Wr , que exp(X) ∈ Wr . Logo, mostramos que exp(X) ∈ H ∩ Wr , o que significa que X ∈ fr . Provamos, assim, que wr ∩ Mr ⊂ fr . Isso completa a prova do Lema 14.1. 

Podemos agora demonstrar o seguinte lema, de importˆancia central no presente contexto e, talvez, o resultado preparat´orio tecnicamente mais dif´ıcil. uˆencia de elementos de fr tais que Xn 6= 0. Suponhamos que Lema 14.2 Seja Xn , n ∈ , uma seq¨ Xn → 0 para n → ∞ e que Xn /kXn k → Y para algum Y ∈ Mat ( , n). Ent˜ ao11 Y ∈ Mr . 2 

Prova do Lema 14.2. Notemos antes de mais nada que se Yn := Xn /kXn k → Y ∈ Mat ( , n) ent˜ao Y 6= 0. Em verdade, kY k = 1 pois, fazendo uso da desigualdade (2.19), p´agina 123, temos | kY n k − kY k | ≤ kYn − Y k. Como o lado direito vai a zero quando n → ∞, segue que kY k = 1, pois kYn k = 1. Fixemos tamb´em um n´ umero m ∈



n˜ao nulo. Podemos escrever wr como a uni˜ao wr =

m [

sk

k=1

onde

  k−1 k sk ≡ := X ∈ wr r ≤ kXk ≤ r , m m ou seja, podemos escrever wr como uma uni˜ao de “fatias”, ou cascas esf´ericas, de vetores com normas k re m r. Note-se que s1 ´e a bola fechada de raio r/m centrada em 0: entre k−1 m n r o s1 = X ∈ wr kXk ≤ . m srk

Como Xn converge a 0, existe um n´ umero Nm (que pode depender de m) tal que Xn ∈ s1 para todo n > Nm . Seja agora um k0 ∈ fixo, escolhido de modo que 1 < k0 ≤ m. Vamos mostrar que para cada n > Nm podemos encontrar um n´ umero inteiro jn (eventualmente dependente de n) de modo que jn Xn ∈ sk0 , ou seja, tal que (k0 − 1)r k0 r ≤ kjn Xn k ≤ . m m 

11

Ap´ os a demonstra¸ca ˜o do Lema 14.2, discutiremos a ` p´ agina 789 que de fato existem seq¨ uˆencias satisfazendo essas hip´ oteses.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

788/1304

Para isso, ´e suficiente escolhermos um jn inteiro satisfazendo (k0 − 1)r k0 r ≤ |jn | ≤ . mkXn k mkXn k Haver´a inteiros no intervalo entre intervalo ´e

(k0 −1)r mkXn k

e

k0 r ? mkXn k

Para ver isso, notemos que o comprimento desse

k0 r (k0 − 1)r r − = ≥ 1, mkXn k mkXn k mkXn k

pois kXn k ≤ mr , dado que Xn ∈ s1 . Ent˜ao, uma tal escolha de jn ´e sempre poss´ıvel para cada n (pois todo intervalo fechado de comprimento igual ou maior que 1 contem ao menos um inteiro). (k ) ´ evidente que Yn(k0 ) ∈ sk0 ⊂ wr . Isso implica Vamos jn Xn por Yn 0 (com k0 fixo). E  denominar  (k ) (k ) que exp Yn 0 ∈ Wr . Fora isso, exp Yn 0 = exp(jn Xn ) = (exp(Xn ))jn . Como exp(Xn ) pertence ao   (k ) grupo H (pois Xn ∈ fr ), segue pela propriedade de grupo que tamb´em tem-se exp Yn 0 ∈ H (´e por   (k0 ) essa raz˜ao que escolhemos jn inteiro). Com isso, provamos que exp Yn ∈ H ∩ Wr , o que significa (k0 )

que12 Yn

∈ fr .

O conjunto fr ´e fechado e limitado e, portanto, compacto. Isso significa que existe uma sub(k ) seq¨ uˆencia Ynl 0 , l ∈ , que ´e convergente em fr . Agora, como Yn = Xn /kXn k converge a Y , isso (k ) (k ) significa que Ynl 0 converge a um m´ ultiplo de Y , digamos λ(k0 ) Y , pois Ynl 0 ´e um m´ ultiplo de Ynl , a (k0 ) (k0 ) (k0 ) saber, Ynl = jnl kXnl kYnl . Portanto, para um tal λ temos λ Y ∈ fr . Note que tamb´em tem-se (k0 ) −λ Y ∈ fr , bastando para tal trocar Xn por −Xn na argumenta¸ca˜o acima, o que ´e permitido pois fr ´e sim´etrico. 

Assim, λ(k0 ) = lim jnl kXnl k e, conseq¨ uentemente, l→∞

(k0 − 1)r k0 r ≤ λ(k0 ) ≤ . m m

O que provamos acima vale para cada k0 ∈ com 1 < k0 ≤ m.h Resumindoi nossas conclus˜oes, provamos que para todo m ∈ n˜ao-nulo, cada intervalo Ik0 , m := (k0m−1) r, km0 r com 1 < k0 ≤ m 



contem pelo menos um λ(k0 ) tal que ±λ(k0 ) Y ∈ fr . m [   A uni˜ao Ik0 , m ´e o conjunto m1 r, r . Esses intervalos Ik0 , m podem ser feitos mais finos e em k0 =2  [ 1 maior n´ umero, fazendo m → ∞, sendo que r, r = (0, r]. m m∈ 

Conclu´ımos disso que existe um conjunto cont´avel denso de n´ umeros λ no intervalo (0, r] tais que ±λY ∈ fr . Como fr ´e fechado, isso implica que λY ∈ fr para todo λ ∈ [−r, r]. Agora, isso significa precisamente que Y ∈ Mr , que ´e o que quer´ıamos provar. A prova do Lema 14.2 est´a completa.

12

(k0 )

Em [97] o argumento que prova que Yn

∈ fr n˜ ao est´ a correto, lamentavelmente.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

789/1304

Podemos nos perguntar agora, ser´a que existem seq¨ uˆencias Xn satisfazendo as hip´oteses do Lema ´ f´acil ver que sim. Notemos para isso que 14.2, ou seja, tais que Xn /kXn k convirja para algum Y ? E para qualquer seq¨ uˆencia Xn ∈ fr com Xn → 0 a seq¨ uˆencia Yn = Xn /kXn k est´a contida no conjunto compacto formado pelos vetores de norma 1. Assim, Yn sempre tem uma sub-seq¨ uˆencia convergente a algum Y , que tamb´em tem norma 1. A essa sub-seq¨ uˆencia aplica-se ent˜ao o Lema 14.2 e tem-se Y ∈ Mr . Isso, em particular, mostra-nos que Mr ´e n˜ao-trivial, ou seja, contem elementos n˜ao-nulos. Provamos ent˜ao: Corol´ ario 14.1 O conjunto Mr definido acima contem elementos diferentes de 0.

2

Esse simples corol´ario ´e crucial para o que segue13 , pois tem a seguinte conseq¨ uˆencia. Proposi¸ c˜ ao 14.6 Seja H um subgrupo fechado e n˜ ao-discreto de GL( , n)). Ent˜ ao valem as seguintes afirmativas. I. Mr = L(H) para qualquer r > 0. II. L(H) ´e n˜ ao-trivial, ou seja, n˜ ao consiste apenas da matriz nula. H´ a, portanto, subgrupos uniparam´etricos n˜ ao-triviais em H. 2 Prova. Seja o conjunto Mr ≡ M(H, Wr ) definido em (14.8), com Wr definido em (14.3)-(14.5) para algum r > 0. Provaremos que M(H, Wr ) = L(H). Em primeiro lugar, ´e claro (por defini¸ca˜o!) que se X ∈ L(H) teremos exp(tX) ∈ H, ∀t ∈ . Se X = 0 ent˜ao X ∈ M(H, Wr ) trivialmente. Se X 6= 0 ent˜ao, se escolhermos |t| < r/kXk, teremos que tX ∈ wr . Logo, X ∈ M(H, Wr ). Isso mostra que L(H) ⊂ M(H, Wr ). 

Seja X ∈ M(H, Wr ) com X 6= 0. Pelo Corol´ario 14.1, um tal X existe. Assim, existe um  > 0 tal que exp(t0 X) ∈ H para todo t0 ∈ (−, ). Seja agora t ∈ qualquer. Se escolhermos n ∈ com |n| grande o suficiente, teremos |t/n| < . Da´ı, exp((t/n)X) ∈ H e, como H ´e um grupo, exp(tX) = (exp((t/n)X))n ∈ H. Como isso vale para qualquer t ∈ provamos que X ∈ L(H). 



Com isso provamos que M(H, Wr ) ⊂ L(H) e, portanto, M(H, Wr ) = L(H). Assim, pelo Corol´ario 14.1, L(H) ´e n˜ao-trivial. Conseq¨ uentemente existem em H subgrupos uniparam´etricos n˜ao-triviais, a saber aqueles que tˆem como geradores os elementos n˜ao-nulos de M(H, Wr ).

* Chegamos agora ao ponto em que boa parte do que fizemos ser´a unificado e revelaremos a importˆancia de sub-grupos uniparam´etricos para os grupos de Lie matriciais. ´ • Sub-Grupos Uniparam´ etricos e Algebras de Lie Seja H um sub-grupo fechado e n˜ao-discreto de GL( , n). O seguinte teorema, o qual ´e uma conseq¨ uˆencia das f´ormulas de Lie-Trotter e do comutador (vide Cap´ıtulo 4), ´e de importˆancia fundamental: 13

Infelizmente, alguns textos como [119], [130] e mesmo (surpreendentemente) [101], n˜ ao provam que M r ´e n˜ ao-trivial, o que torna suas demonstra¸co ˜es do Teorema 14.2 incompletas. Mesmo [97], que prova os Lemas 14.1 e 14.2, n˜ ao menciona o Corol´ ario 14.1, embora o mesmo fique impl´ıcito pela sua an´ alise. A referˆencia [63], que segue outra e muito interessante linha de racioc´ınio, ´e expl´ıcita quanto ao Corol´ ario 14.1.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

790/1304

Teorema 14.1 Se H ´e um sub-grupo fechado e n˜ ao-discreto de GL( , n) ent˜ ao L(H), definida acima, ´e uma a ´lgebra de Lie real14 . 2 Prova. Vamos primeiramente mostrar que L(H) ´e um espa¸co vetorial real. Para tal, precisamos mostrar que se X e Y s˜ao geradores de dois sub-grupos uniparam´etricos de H, ent˜ao αX + βY tamb´em o ´e, para quaisquer α, β ∈ . Comecemos observando que γ(t) := exp(t(αX + βY )) ´e um sub-grupo uniparam´etrico cont´ınuo de GL( , n) cujo gerador ´e obviamente αX + βY . Tudo o que precisamos fazer ´e mostrar que γ(t) ∈ H para todo t ∈ . Pela f´ormula de Lie-Trotter (vide Cap´ıtulo 4),   m   tβ tα X exp Y exp(t(αX + βY )) = lim exp . (14.9) m→∞ m m   X e exp tβ Y pertencem ao grupo Observemos ent˜ao o seguinte. Pela hip´otese, as matrizes exp tα m m H, pois supomos que   X e Y s˜ao geradores de subgrupos uniparam´etricos de H. Portanto os produtos tβ X exp Y s˜ao tamb´em elementos de H, pois H ´e um grupo. Ora, o lado direito de (14.9) ´e, exp tα m m portanto, o limite de uma seq¨ uˆencia de elementos de H. Como supomos que H ´e fechado, segue que o limite ´e igualmente um elemento de H, como quer´ıamos mostrar. Isso provou ent˜ao que αX + βY ∈ L(H) para quaisquer α, β ∈ e, portanto, L(H) ´e um espa¸co vetorial real. 





Vamos mostrar agora que L(H) ´e uma a´lgebra de Lie. Se X, Y ∈ L(H) temos, pela f´ormula do comutador (vide Cap´ıtulo 4), e usando [tX, Y ] = t[X, Y ], que exp(t[X, Y ]) = lim

m→∞



exp



      m2 t 1 1 t X exp Y exp − X exp − Y . m m m m

(14.10)

Racioc´ınio idˆentico ao que empregamos acima conclui que exp(t[X, Y ]) ∈ H para todo t ∈ , mostrando que [X, Y ] ´e o gerador de um sub-grupo uniparam´etrico cont´ınuo de H, ou seja, [X, Y ] ∈ L(H). Isso provou que L(H) ´e uma a´lgebra de Lie. 

Coment´ ario. Se para todo X ∈ L(H) tivermos tamb´em αX ∈ L(H) para todo α ∈ demonstra¸ca˜o acima que L(H) ´e uma a´lgebra de Lie complexa.

14.3.5

, conclui-se pela

Subgrupos Fechados de GL( , n)

Nesta Se¸ca˜o provaremos o seguinte teorema: Teorema 14.2 Se H ´e um subgrupo topologicamente fechado de GL( , n) (na topologia m´etrica induzida de GL( , n)) e H n˜ ao ´e discreto, ent˜ ao H ´e tamb´em um grupo de Lie (na topologia m´etrica induzida de GL( , n)). 2 O Teorema 14.2 ´e particularmente importante pois muitos grupos encontrados em aplica¸co˜es s˜ao sub-grupos fechados (n˜ao discretos) de GL( , n) ou de GL( , n). Tal ´e o caso, por exemplo, dos 

14 ´

Algebras de Lie foram definidas a ` p´ agina 57.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

791/1304

grupos U(n), U(p, q), SU(n), SU(p, q), O(n), SO(n) e outros. Assim, o Teorema 14.2 nos informa que tais grupos s˜ao grupos de Lie. A prova desse teorema ser´a oferecida a` p´agina 793. Antes de chegarmos l´a precisaremos apresentar v´arios teoremas preparat´orios. Chamamos a aten¸ca˜o do leitor para o fato que as demonstra¸co˜es de alguns desses resultados preparat´orios s˜ao bastante t´ecnicas e talvez devam ser omitidas em uma primeira leitura. Seja H um subgrupo fechado n˜ao-discreto de G = GL( , n). Sabemos pelo Teorema 14.1 que L(H) ´e um sub-espa¸co de L(G) = Mat ( , n). Seja L(H)⊥ seu complemento ortogonal (em rela¸ca˜o a algum produto escalar em Mat ( , n), por exemplo hA, Bi = Tr(A∗ B)). Todo elemento A ∈ Mat ( , n) pode ser escrito de modo u ´ nico na forma A = Ak + A⊥ , com Ak ∈ L(H) e A⊥ ∈ L(H)⊥ . Seja assim a fun¸ca˜o ΦH : L(G) → G definida por

  ΦH (A) := exp Ak exp A⊥ .

Lema 14.3 Para H, subgrupo fechado e conexo de GL( , n), existe r0 > 0 tal que a aplica¸ca ˜o ΦH O 0 0 definida acima ´e um homeomorfismo do aberto wO em um aberto Φ (w ) ⊃ W para um certo r H r0 r0 r0 0 > 0. 2 Acima, wO e a bola aberta de raio r0 em torno da matriz nula. Vide (14.4). r0 ´ Prova. Escolhamos r0 pequeno o suficiente para que valha a f´ormula de Baker-Campbell-Hausdorff15 . Considere-se a aplica¸ca˜o φH : L(G) → L(G) definida por φH (A) = ln (ΦH (A)), ou seja,   φH (A) := ln exp Ak exp A⊥ = Ak ∗ A⊥ = A + ϕH (A) , (lembre-se que Ak + A⊥ = A) onde ϕH (A) :=

1  k ⊥ 1  k  k ⊥   ⊥  ⊥ k  A, A + A, A , A + A , A , A +··· . 2 12

H (A)k → 0 para kAk → 0. Assim, φH ´e cont´ınua e diferenci´avel em uma Como facilmente se constata, kϕkAk vizinhan¸ca de 0 e e sua derivada em 0 ´e a identidade. Assim, pelo bem conhecido Teorema da Aplica¸ca˜o Inversa (vide, Se¸ca˜o 17.4, p´agina 907, ou por exemplo, [88]), φH ´e um homeomorfismo entre wO r0 e sua imagem. Como ΦH = exp ◦ φH e a exponencial ´e tamb´em um homeomorfismo local (Proposi¸ca˜o 4.4, p´agina 231), a prova do Lema 14.3 est´a completa.

Seja H um subgrupo fechado de GL( , n). Vimos acima que L(H) ⊂ Mat ( , n) ´e uma a´lgebra ´ evidente que se A ∈ L(H) ent˜ao exp(A) ∈ de Lie real e, como tal, um sub-espa¸co de Mat ( , n). E e o subgrupo de H cujos elementos s˜ao produtos finitos de exponenciais de H. Vamos denotar por H elementos de L(H): e := {h ∈ H, h = exp(A1 ) · · · exp(Am ) para algum m ∈ H

e ´e de fato um grupo, pois H 15



}.

Vide Cap´ıtulo 4, p´ agina 222. A f´ ormula de Baker-Campbell-Hausdorff ´e dada em (4.46) a ` p´ agina 249.

JCABarata. Curso de F´ısica-Matem´ atica

1.

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

792/1304

e ∈ H,

e ent˜ao h−1 = exp(−Am ) · · · exp(−A1 ) ∈ H e e 2. se h = exp(A1 ) · · · exp(Am ) ∈ H

e ent˜ao tem-se, evidentemente, hh0 = 3. se h = exp(A1 ) · · · exp(Am ) e h0 = exp(A01 ) · · · exp(A0m0 ) ∈ H 0 0 e exp(A1 ) · · · exp(Am ) exp(A1 ) · · · exp(Am0 ) ∈ H.

e ´e denominado subgrupo gerado por L(H). Vamos provar o seguinte teorema: O grupo H

e = H. Teorema 14.3 Se H ´e fechado e conexo ent˜ ao H

2

e ⊂ H, de modo que queremos apenas provar que H ⊂ H. e Prova. J´a ´e evidente, pela defini¸ca˜o, que H Seja r > 0, fixo. O que faremos ´e provar que fr ⊂ L(H) ∩ wr0 para algum r 0 > 0. Se isso for verdadeiro, ent˜ao, pela defini¸ca˜o de fr em (14.6) e por (14.7), os elementos de H ∩ Wr s˜ao da forma exp(A) com A ∈ L(H) ∩ wr0 . Agora, pelo fato de H ser conexo, sabemos pela Proposi¸ca˜o 14.3, que todo elemento de H pode ser escrito como um produto finito de elementos do interior de H ∩ Wr . Logo, todo elemento de H pode ser escrito como um produto finito exp(A1 ) · · · exp(Am ), para algum m ∈ , e que ´e o que quer´ıamos provar. com Ak ∈ L(H) ∩ wr0 . Ora, isso est´a precisamente dizendo que H ⊂ H, 

Vamos ent˜ao mostrar que fr ⊂ L(H) ∩ wr0 para algum r 0 > 0. A demonstra¸ca˜o ser´a feita por absurdo, ou seja, supondo que n˜ao existam r e r 0 > 0 tais que fr ⊂ L(H) ∩ wr0 e chegando-se da´ı a uma contradi¸ca˜o. ´ muito f´acil ver pela defini¸ca˜o dos conjuntos fr em (14.6) que fr1 ⊂ fr2 sempre que r1 ≤ r2 . Al´em E \ disso, fr = {0}. r>0

Para um r 0 arbitr´ario, fixo, vamos ent˜ao supor que n˜ao haja nenhum fr com fr ⊂ L(H) ∩ wr0 . Isso implica que fr \ (L(H) ∩ wr0 ) 6= ∅ para todo r. Fixando r, poder´ıamos escolher uma seq¨ uˆencia rn < r, rn → 0 com frn \ (L(H) ∩ wr0 ) 6= ∅. Escolhendo para cada n um elemento Xn ∈ frn \ (L(H) ∩ wr0 ), teremos que Xn ∈ fr \ (L(H) ∩ wr0 ) para todo n e Xn → 0 quando n → ∞.

Como Xn → 0, teremos exp(Xn ) ∈ Wr00 para para todo n grande o suficiente, onde r00 ´e referido no enunciado do Lema 14.3. Assim, pelo mesmo lema, existir´ de tais n’s um elemento  cada um a para  k k ⊥ ⊥ Zn ∈ wr0 , Zn = Zn + Zn , tal que exp (Xn ) = ΦH (Zn ) = exp Zn exp Zn . k

Antes de prosseguirmos, fa¸camos algumas observa¸co˜es sobre Zn e Zn⊥ . Como Xn → 0, deve valer tamb´em Zn → 0 j´a que, pelo Lema 14.3, ΦH e sua inversa s˜ao cont´ınuas. Assim, tem-se igualmente k Zn → 0 e Zn⊥ → 0. Pela parte II do Lema 14.1 e pela parte I da Proposi¸ca˜o 14.6, segue que w r ∩L(H) ⊂ k fr . Da´ı, para n grande o suficiente, ter-se-´a Zn ∈ fr . Note-se tamb´em que, como n 6∈ L(H) para  X k ⊥ n grande, teremos Zn 6= 0, pois, se assim n˜ao fosse, valeria exp (Xn ) = exp Zn e, tomando-se k

o logaritmo (o que ´e permitido para n grande, j´a que kXn k e kZn k est˜ao ambos pr´oximos a zero), k obter´ıamos Xn = Zn ∈ L(H), o que ´e imposs´ıvel.    k ⊥ Como conseq¨ uˆencia das observa¸co˜es acima, teremos que exp Zn = exp −Zn exp (Xn ). Sucede     k k que exp (Xn ) ∈ H ∩ Wr e exp −Zn ∈ H ∩ Wr . Assim exp Zn ∈ H e, kZn⊥ k ≤ kZn k < r0 . Logo,  exp Zn⊥ ∈ H ∩ Wr0 . Portanto, Zn⊥ ∈ fr0 .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

793/1304

Como conseq¨ uˆencia do Lema 14.2, da parte I da Proposi¸ca˜o 14.6 e da compacidade de f r0 , a seq¨ uˆencia de vetores de norma 1 dada por Zn⊥ /kZn⊥ k tem uma sub-seq¨ uˆencia que converge a um elemento de Mr0 = L(H). Por´em, como Zn⊥ ∈ L(H)⊥ , isso ´e imposs´ıvel e tem-se a´ı uma contradi¸ca˜o. Logo, deve valer fr ⊂ L(H) ∩ wr0 para certos r, r 0 > 0. Isso completa a prova do Teorema 14.3. Podemos agora reunir os resultados que provamos acima e passar a` Prova do Teorema 14.2. Seja H um subgrupo fechado de GL( , n). Como veremos, ´e suficiente provarmos o teorema considerando apenas a componente de H que ´e conexa ao elemento neutro, componente essa que denominaremos H0 . Isso pois se provarmos que H0 ´e uma variedade, a demonstra¸ca˜o facilmente se estender´a para todo H. Esse ponto ser´a discutido com mais detalhe ao final da demonstra¸ca˜o, de modo que, por ora, nos limitamos a considerar o caso em que H ´e conexo (o que, no caso geral, equivale a nos restringirmos a H0 ). e ´e um grupo de Lie. Pelo Teorema 4.4, podemos encontrar Pelo Teorema 14.3, basta provarmos que H uma vizinhan¸ca aberta de V de 0 em Mat ( , n) e uma vizinhan¸ca aberta W de em GL( , n) tais que exp : V → W ´e um difeomorfismo. Seja VH a vizinhan¸ca de 0 em L(H) definida por VH = V ∩ L(H) e e pela exponencial. A aplica¸ca˜o exp : VH → WH ´e tamb´em um difeomorfismo, seja WH sua imagem em H pois ´e a restri¸ca˜o de um difeomorfismo (a saber exp : V → W ) por uma fun¸ca˜o suave (a proje¸ca˜o V → VH ). Existe naturalmente um sistema de coordenadas em VH , pois L(H) ´e um espa¸co vetorial e, portanto, isomorfo a k , k sendo a dimens˜ao de L(H). Dessa forma como exp : VH → WH ´e uma bije¸ca˜o, exp−1 : WH → VH estabelece um sistema de coordenadas em WH . Para estabelecer um e por exemplo, em torno de um elemento h ∈ H, e podemos transladar sistema de coordenadas em todo H, o sistema de coordenadas de WH para uma vizinhan¸ca de h, a saber, hWH . As cartas locais assim obtidas ser˜ao compat´ıveis (infinitamente diferenci´aveis ou anal´ıticas) devido ao fato de exp : V H → WH ser um difeomorfismo e pelo fato de a multiplica¸ca˜o por um h constante n˜ao alterar esse car´ater. O argumento de transla¸ca˜o pode ser aplicado mesmo a elementos de H que n˜ao est˜ao na componente conexa a` identidade, de modo que todo H se torna uma variedade de dimens˜ao k. O produto e a inversa s˜ao cont´ınuas e infinitamente diferenci´aveis por o serem em GL( , n) e tamb´em devido ao fato de exp : VH → WH ser um difeomorfismo. A demonstra¸ca˜o do Teorema 14.2 est´a ent˜ao completa Coment´ ario. Segundo [97], o Teorema 14.2 ´e devido a Cartan16 . Demonstra¸co˜es desse importante teorema podem ser encontradas em v´arios livros-texto, como por exemplo [97] ou [101]. Devemos, por´em, notar ao leitor e advertir o estudante que alguns textos (inclusive alguns cl´assicos) apresentam certas falhas tanto no enunciado do teorema quanto na sua demonstra¸ca˜o, falhas essas que procuramos corrigir e evitar nas demonstra¸co˜es acima. Por exemplo, muitos autores esquecem-se de excluir do enunciado o caso (trivial) em que H ´e fechado mas discreto (grupos discretos obviamente n˜ao podem ser grupos de Lie), por vezes ressalvando isso apenas no correr da demonstra¸ca˜o. V´arios textos apresentam demonstra¸co˜es incompletas (por exemplo, [119], [130] e mesmo parcialmente [101]), pois deixam por exemplo, de provar que o conjunto Mr , definido acima, n˜ao ´e apenas formado pelo elemento nulo, um ponto crucial. A demonstra¸ca˜o que apresentamos ´e essencialmente (mas n˜ao exatamente) a de [97] (vide todo 2 do Cap´ıtulo XI daquela referˆencia). Um outro tratamento excelente (mas talvez n˜ao acess´ıvel a todo estudante) ´e o de [63]. 16

Elie Joseph Cartan (1869-1951). E. J. Cartan foi um dos mais importantes contribuidores a ` teoria de grupos de Lie.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

794/1304

Um ponto importante do Teorema 14.2 ´e que o subgrupo fechado H ´e um grupo de Lie com a topologia induzida em H por G. Em verdade, vale para grupos de Lie um teorema mais ainda forte que o Teorema 14.2: Teorema 14.4 Todo subgrupo n˜ ao-discreto H de um grupo de Lie G ´e tamb´em um grupo de Lie, mas n˜ ao necessariamente em rela¸ca ˜o a ` topologia induzida por G em H. 2 Como se vˆe, esse teorema generaliza o Teorema 14.2 pois n˜ao ´e necess´ario requerer que H seja um subgrupo fechado de G. Por´em, a topologia na qual H ´e um grupo de Lie pode n˜ao ser a topologia induzida em H por G. Um exemplo ilustrativo ser´a discutido na Se¸ca˜o 14.4.3. A demonstra¸ca˜o do Teorema 14.4 teorema est´a al´em dos limites dessas notas e pode ser encontrada em textos como [101] ou [63]. * O Teorema 14.1, p´agina 790, revela um sentido da rela¸ca˜o fundamental entre grupos de Lie e a´lgebras de Lie. Ele mostra que ´e poss´ıvel construir uma a´lgebra de Lie a partir de um grupo de Lie fechado. A teoria geral dos grupos de Lie revela que muitas propriedades importantes de grupos de Lie podem ser estudadas a partir das a´lgebras de Lie associadas a seus sub-grupos uniparam´etricos. Essa ´ poss´ıvel rela¸ca˜o se mostra particularmente relevante no estudo de representa¸co˜es de grupos de Lie. E provar (e faremos isso no exemplo do grupo SO(3) no Cap´ıtulo 15) que existe uma correspondˆencia um-a-um entre as representa¸co˜es de um grupo de Lie e as representa¸co˜es de sua a´lgebra de Lie. Sucede que (devido a` estrutura linear) ´e muito mais simples estudar as representa¸co˜es de uma a´lgebra de Lie do que de um grupo de Lie. Infelizmente ainda est´a fora do modesto alcance destas notas explorar completamente esse vasto terreno e remetemos o estudante aos bons livros supra-citados sobre grupos e a´lgebras de Lie. Iremos no que segue deste cap´ıtulo limitar-nos a discutir algumas quest˜oes as quais s˜ao importantes para um estudo mais abrangente. Particularmente nos deteremos na quest˜ao de identificar algumas situa¸co˜es nas quais podemos prosseguir no caminho inverso ao que apontamos acima, ou seja, na quest˜ao de quando um grupo de Lie pode ser recuperado a partir da a´lgebra de Lie dos seus geradores por aplica¸ca˜o da exponencia¸ca˜o.

14.4

´ A Rela¸ c˜ ao entre Grupos de Lie Matriciais e suas Algebras de Lie

Vimos nas se¸co˜es anteriores que se H ´e um subgrupo n˜ao-discreto fechado de GL( , n) existe associada ao mesmo uma a´lgebra de Lie a qual ´e (obviamente) uma sub-´algebra de da a´lgebra de Lie de GL( , n) que ´e Mat ( , n). Ser´a a rec´ıproca verdadeira, ou seja, se A ´e uma sub-´algebra de Lie de Mat ( , n) haver´a um grupo de Lie fechado associado a A? A reposta, em geral, ´e n˜ao. Um contra-exemplo (para n = 2) ´e o seguinte: a um n´ umero real irracional e seja a a´lgebra de Lie formada pelas matrizes  Seja  it 0 2 × 2 dadas por com t ∈ R. Exponenciando os elementos dessa a´lgebra de Lie obtemos 0 iat

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

795/1304



 eit 0 as matrizes com t ∈ R. Esse conjunto de matrizes forma certamente um grupo. Sucede, 0 eiat por´em, que n˜ao se trata de um sub-grupo topologicamente fechado de GL( , 2), como veremos com um pouco mais de detalhe na Se¸ca˜o 14.4.3 (a qual o leitor poder´a passar sem perdas). Felizmente ´e poss´ıvel dizer um pouco mais se enfraquecermos a condi¸ca˜o de H ser um subgrupo fechado. Tem-se, por exemplo, o seguinte: Proposi¸ c˜ ao 14.7 Seja G um subgrupo fechado n˜ ao-discreto de GL( , n) cuja a ´lgebra de Lie ´e L(G) e seja H um subgrupo (n˜ ao discreto) de G. Seja L(H) := {M ∈ Mat ( , n)| exp(tM ) ∈ H, ∀t ∈ } e suponha que se saiba que L(H) ´e um sub-espa¸co de L(G). Ent˜ ao L(H) ´e tamb´em uma sub-´ algebra de L(G). 2 

Prova. Sejam A, B ∈ L(H). Ent˜ao ´e claro que para todos t e s ∈ teremos esAetB e−sA ∈ H pois sA tA sA tB −sA H ´e um grupo e e , e ∈ H. Podemos escrever e e e = exp tesA Be−sA e isso prova que esA Be−sA ∈ L(H) para todo s ∈ . Como por hip´otese L(H) ´e um sub-espa¸co de L(G), L(H) ´e fechado (pois estamos em dimens˜ao finita). Logo  d sA −sA  1 sA −sA = [A, B], L(H) 3 lim e Be −B = e Be s→0 s ds s=0 



completando a prova.

Comparando a demonstra¸ca˜o acima com a do Teorema 14.1, vemos que a diferen¸ca ´e que n˜ao supomos que H seja fechado. Podemos ir mais um pouco al´em e estabelecer o seguinte: Teorema 14.5 Seja G um subgrupo fechado de GL( , n) cuja a ´lgebra de Lie ´e L(G) e seja h uma sub-´ algebra de Lie real de L(G). Ent˜ ao existe um u ´nico sub-grupo conexo H de G cuja a ´lgebra de Lie ´e h. H ´e um grupo de Lie (em uma certa topologia). 2 N˜ao apresentaremos a demonstra¸ca˜o dessa afirma¸ca˜o aqui no caso geral, a qual ´e uma conseq¨ uˆencia da f´ormula de Baker-Campbell-Hausdorff. Mais adiante (p´agina 799) discutiremos como H pode ser constru´ıda a partir de h no caso dessa u ´ ltima ser uma a´lgebra de Lie nilpotente, o caso mais f´acil de tratar.

14.4.1

´ Algebras de Lie Nilpotentes, Sol´ uveis, Simples e Semi-Simples

J´a comentamos anteriormente que se A e B s˜ao matrizes n × n reais ou complexas tais que AB = BA, ent˜ao exp(A) exp(B) = exp(A + B). O que ocorre caso A e B n˜ao comutem entre si? A resposta a esta quest˜ao ´e dada por uma express˜ao conhecida como f´ ormula de Baker-Campbell-Hausdorff, a qual foi discutida e demonstrada no Cap´ıtulo 4, p´agina 222. Essa f´ormula permite expressar o produto exp(A) exp(B) para duas matrizes A e B ∈ Mat ( , n) (ou ∈ Mat ( , n)) novamente como uma exponencial de matrizes: exp(A) exp(B) = exp(A ∗ B), 

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

796/1304

onde A ∗ B ´e uma express˜ao um tanto complexa envolvendo somas de comutadores m´ ultiplos das matrizes A e B, e cujos primeiros termos s˜ao os seguintes: 1 1 1 A ∗ B = A + B + [A, B] + [A, [A, B]] + [B, [B, A]] + · · · . 2 12 12 A express˜ao completa encontra-se em (4.46) a` p´agina 249. Vamos agora fazer uma pausa e, antes de entrarmos na discuss˜ao das conseq¨ uˆencias da f´ormula de Baker-Campbell-Hausdorff e da exponencia¸ca˜o de a´lgebras de Lie e sua rela¸ca˜o com grupos de Lie, vamos nos dedicar a discutir alguns aspectos alg´ebricos das a´lgebras de Lie (com o perd˜ao do pleonasmo). A f´ormula de Baker-Campbell-Hausdorff nos chama a aten¸ca˜o para a importˆancia de comutadores m´ ultiplos de elementos de uma a´lgebra de Lie. Vamos aproveitar a oportunidade para introduzir algumas no¸co˜es alg´ebricas muito empregadas no estudo de a´lgebras de Lie. Falaremos da sua relevˆancia adiante. No que segue trataremos apenas de a´lgebras de Lie sobre o corpo dos n´ umeros reais ou complexos. Seja L uma a´lgebra de Lie e A, B dois subconjuntos de L. Por [A, B] denotamos o conjunto de todos os elementos de L que s˜ao iguais ao comutador de algum elemento de A por algum elemento de B. Em s´ımbolos: [A, B] = {[a, b], a ∈ A, b ∈ B} . (14.11) ´ • Algebras de Lie Nilpotentes Seja uma a´lgebra de Lie L. Com a nota¸ca˜o acima, denotaremos por L[n] , n = 0, 1, 2, . . ., a seq¨ uˆencia [0] [n] [n−1] de conjuntos obtida da seguinte forma: L := L e L = [L, L ], n = 1, 2, . . .. Ou seja, L[0] := L, L[1] := [L, L[0] ] = [L, L], L[2] := [L, L[1] ] = [L, [L, L]], L[3] := [L, L[2] ] = [L, [L, [L, L]]], .. . etc. Defini¸ c˜ ao. Uma a´lgebra de Lie ´e dita ser nilpotente se L[m] = {0} para algum m.

O menor m para o qual L[m] = {0} ´e dito ser o grau ou ´ındice da a´lgebra de Lie nilpotente. Note-se 0 que se L[m] = {0} ent˜ao L[m ] = {0} para todo m0 > m.

Um exemplo de a´lgebra de Lie nilpotente ´e a a´lgebra de Heisenberg tri-dimensional gh3 , com geradores p, q e ~, satisfazendo [p, ~] = 0, [q, ~] = 0 e [p, q] = −i~. Para ela vale (gh3 )[2] = {0}. Essa a´lgebra foi apresentada e discutida na Se¸ca˜o 13.2.2 a` p´agina 676.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

797/1304

H´a v´arias raz˜oes por que as a´lgebras de Lie nilpotentes s˜ao relevantes. Uma delas est´a no fato de as a´lgebras de Lie nilpotentes serem igualmente a´lgebras de Lie sol´ uveis (vide o que segue) e a importˆancia destas ser´a discutida. O leitor pode reconhecer uma outra raz˜ao da importˆancia das a´lgebras de Lie nilpotentes na seguinte observa¸ca˜o: para uma a´lgebra de Lie nilpotente a s´erie de Baker-Campbell-Hausdorff em (4.46) e (4.47) ´e uma s´erie finita! Voltaremos a isso quando retomarmos adiante a discuss˜ao da f´ormula Baker-Campbell-Hausdorff. ´ • Algebras de Lie Sol´ uveis Em paralelo a` no¸ca˜o de a´lgebra de Lie nilpotente que apresentamos acima, existe a no¸ca˜o de a ´lgebra de Lie sol´ uvel. Para uma a´lgebra de Lie L, denotaremos por L(n) , n = 0, 1, . . ., a seq¨ uˆencia de conjuntos obtida da seguinte forma: L(0) := L e L(n) := [L(n−1) , L(n−1) ], n = 1, 2, . . .. Ou seja, L(0) := L, L(1) := [L(0) , L(0) ] = [L, L], L(2) := [L(1) , L(1) ] = [[L, L], [L, L]], .. . etc. uvel se L(m) = {0} para algum m. Defini¸ c˜ ao. Uma a´lgebra de Lie ´e dita ser sol´

Para qualquer a´lgebra de Lie L ´e bastante evidente, pelas defini¸co˜es, acima que L (n) ⊂ L[n] . De fato, L(0) = L[0] e L(1) = L[1] e, se L(n) ⊂ L[n] para algum n, segue que L(n+1) = [L(n) , L(n) ] ⊂ [L, L(n) ] ⊂ [L, L[n] ] = L[n+1] , provando a afirmativa por indu¸ca˜o. Segue dessa observa¸ca˜o que toda a´lgebra de Lie nilpotente ´e tamb´em sol´ uvel.

A rec´ıproca dessa u ´ ltima afirma¸ca˜o ´e falsa: nem toda a´lgebra de Lie sol´ uvel ´e nilpotente. Considerese com exemplo a a´lgebra de Lie bidimensional com geradores λ1 e λ2 satisfazendo [λ1 , λ2 ] = λ2 . Essa a´lgebra n˜ao ´e nilpotente, pois [λ1 , [λ1 , [· · · , [λ1 , λ2 ]]]] = λ2 . Por´em, essa a´lgebra ´e sol´ uvel, pois [[λ1 , λ2 ], [λ1 , λ2 ]] = [λ2 , λ2 ] = 0. Essa a´lgebra aparecer´a concretamente no exemplo discutido a` p´agina 803. H´a v´arias raz˜oes por que as a´lgebras de Lie sol´ uveis s˜ao relevantes. Uma delas ser´a discutida ap´os apresentarmos o Teorema de Levi, abaixo. ´ • Algebras de Lie Simples e Semi-Simples Se L ´e uma a´lgebra de Lie, dizemos que ´e um sub-espa¸co vetorial J de L ´e uma sub-´ algebra (de Lie) se [J, J] ⊂ J. Se L ´e uma a´lgebra de Lie, dizemos que um sub-espa¸co vetorial I de L ´e um ideal se [L, I] ⊂ I.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

798/1304

Pela defini¸ca˜o, todo ideal de L ´e uma sub-´algebra de Lie de L. As a´lgebras de Lie nilpotentes e as sol´ uveis possuem “muitos” ideais. Contrapostas a`s mesmas est˜ao as chamadas a´lgebras de Lie simples e semi-simples, que possuem “poucos” ideais. Defini¸ c˜ ao. Uma a´lgebra de Lie L ´e dita ser simples se seus u ´ nicos ideais forem {0} e a pr´opria L. Defini¸ c˜ ao. Uma a´lgebra de Lie L ´e dita ser semi-simples se n˜ao possuir ideais sol´ uveis (que n˜ao {0}). ´ bem claro que toda a´lgebra de Lie simples ´e semi-simples. E

H´a v´arias raz˜oes por que as a´lgebras de Lie semi-simples s˜ao relevantes. Uma delas ser´a discutida ap´os apresentarmos o Teorema de Levi, abaixo. ´ • Soma Direta e Soma Semi-Direta de Algebras de Lie Defini¸ c˜ ao. Uma a´lgebra de Lie L ´e dita ser a soma direta de duas de suas sub-´algebras L 1 e L2 se [L1 , L2 ] = 0 e se todo elemento x ∈ L puder ser escrito de modo u ´ nico da forma x = x1 + x2 com x1 ∈ L1 e x2 ∈ L2 . Se L for a soma direta de L1 e L2 denotamos isso por L = L1 ⊕ L2 .

Defini¸ c˜ ao. Uma a´lgebra de Lie L ´e dita ser a soma semi-direta de duas de suas sub-´algebras L 1 e L2 se [L1 , L2 ] ⊂ L2 e se todo elemento x ∈ L puder ser escrito de modo u ´ nico da forma x = x1 + x2 com x1 ∈ L1 e x2 ∈ L2 . Se L for a soma semi-direta de L1 e L2 denotamos isso por L = L1  L2 . Note que L2 deve ser um ideal de L. Nesse contexto ´e importante o seguinte teorema, cuja demonstra¸ca˜o est´a al´em das pretens˜oes destas notas (vide e.g. [97, 69]): Teorema 14.6 (Teorema de Levi) Toda a ´lgebra de Lie L de dimens˜ ao finita ´e uma soma semidireta L = SR onde S ´e semi-simples e R sol´ uvel.

2

A sub-´algebra R acima ´e denominada radical de L. Exemplos. O chamado grupo Euclidiano17 em trˆes dimens˜oes E3 possui seis geradores J1 , J2 , J3 (geradores de rota¸co˜es) e P1 , P2 , P3 (geradores de transla¸co˜es), satisfazendo as rela¸co˜es [Ji , Jj ] =

3 X

ijk Jk

[Ji , Pj ] =

k=1

17

Euclides, de Alexandria (ci. 325 A.C., ci. 265 A.C.).

3 X k=1

ijk Pk

[Pi , Pj ] = 0,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

799/1304

onde ijk ´e o s´ımbolo anti-sim´etrico de Levi-Civita definido em (13.33), p´agina 693. Se denominarmos por P a sub-´algebra gerada por P1 , P2 , P3 e por J a sub-´algebra gerada por J1 , J2 , J3 , veremos que ´ tamb´em imediato que P ´e sol´ uvel (pois ´e Abeliana) e que J ´e simples (e, portanto, semi-simples). E L = P  J. * O teorema de Levi nos diz que o estudo geral de a´lgebras de Lie, e conseq¨ uentemente, de grupos de Lie, reduz-se ao estudo das a´lgebras de Lie sol´ uveis (dentre as quais est˜ao as nilpotentes) e das a´lgebras de Lie semi-simples. Um dos resultados mais importantes da teoria das a´lgebras de Lie ´e uma c´elebre classifica¸ca˜o completa de todas as a´lgebras de Lie semi-simples, feito devido a Killing 18 e a Cartan19 . Para o caso das a´lgebras sol´ uveis uma classifica¸ca˜o completa est´a ainda longe de ser alcan¸cada.

14.4.2

´ Quest˜ oes sobre a Exponencia¸ c˜ ao de Algebras de Lie

Apesar de sua importˆancia, a f´ormula de Baker-Campbell-Hausdorff apresenta uma restri¸ca˜o quanto a` norma das matrizes A e B, necess´aria para garantir a convergˆencia da s´erie que ocorre em (4.46). H´a, por´em, uma classe de a´lgebras de Lie para a qual essa quest˜ao n˜ao ´e importante, as chamadas a´lgebras de Lie nilpotentes, das quais trataremos agora. • Grupos de Lie Nilpotentes A importˆancia das a´lgebras de Lie nilpotentes no contexto da f´ormula de Baker-Campbell-Hausdorff (4.46), p´agina 249, ´e a seguinte. Se L ⊂ Mat ( , n) ´e uma a´lgebra de Lie nilpotente de grau m de matrizes, ent˜ao para quaisquer A, B ∈ L teremos que A ∗ B definida em (4.46) ´e uma soma finita, contendo no m´aximo comutadores m´ ultiplos de ordem m. Com isso, vemos que para uma a´lgebra de Lie nilpotente de matrizes L ⊂ Mat ( , n) n˜ao existe o problema da convergˆencia da s´erie de (4.46), e a mesma vale para todo A, B ∈ L, independente da norma desses elementos. Fora isso A ∗ B ∈ L, j´a que ´e dado por uma soma finita de elementos de L. Uma conseq¨ uˆencia ´e a seguinte proposi¸ca˜o. Proposi¸ c˜ ao 14.8 Seja G um subgrupo de Lie de GL( , n) e LG ⊂ Mat ( , n) sua a ´lgebra de Lie. Vamos supor que LG seja nilpotente. Ent˜ ao o produto ∗ definido pela f´ ormula de Baker-CampbellHausdorff ´e associativo. Fora isso, a a ´lgebra de Lie LG ´e, ela mesma, um grupo com o produto ∗. 2 Prova. Sejam P A1 , A2 e A3 trˆes elementos de LG . Se L1 , . . . , Lm formam uma base em LG podemos i i i ao n´ umeros complexos. Como a soma de comutadores que ocorre escrever A = m k=1 αk Lk , onde αk s˜ na f´ormula de Baker-Campbell-Hausdorff ´e finita, conclu´ımos que 1

2

3

(A ∗ A ) ∗ A = 18 19

m X k=1

Wilhelm Karl Joseph Killing (1847-1923). Elie Joseph Cartan (1869-1951).

pk (α)Lk

e

1

2

3

A ∗ (A ∗ A ) =

m X k=1

qk (α)Lk ,

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

800/1304

onde pk (α) e qk (α) s˜ao polinˆomios nas vari´aveis αji , i = 1, 2, 3, j = 1, . . . , m. Desejamos provar que para cada k tem-se pk = qk . Como ambos s˜ao polinˆomios, ´e suficiente provar isso para quando as vari´aveis αji est˜ao restritas a algum aberto de . Sejam Gi = exp(Ai ), i = 1, 2, 3, elementos de G. Como o produto do grupo ´e associativo, temos (G1 G2 )G3 = G1 (G2 G3 ) e, portanto, exp((A1 ∗ A2 ) ∗ A3 ) = exp(A1 ∗ (A2 ∗ A3 )). Se escolhermos as vari´aveis αji suficientemente pr´oximas de zero, teremos pk (α) e qk (α) igualmente pr´oximas de zero (conven¸ca-se disso checando a f´ormula de Baker-Campbell-Hausdorff) e, portanto, k(A 1 ∗ A2 ) ∗ A3 k e kA1 ∗ (A2 ∗ A3 )k podem ser ambas feitas menores que ln 2. Pela Proposi¸ca˜o 4.5, p´agina 231, podemos tomar o logaritmo das exponenciais acima e concluir que (A1 ∗ A2 ) ∗ A3 = A1 ∗ (A2 ∗ A3 ). Assim, 



m X k=1

pk (α)Lk =

m X

qk (α)Lk

k=1

pelo menos para αji pequenos o suficiente. Como os elementos Lk da base s˜ao linearmente independentes, conclu´ımos que pk (α) = qk (α) para todo k = 1, . . . , m, pelo menos quando os αji s˜ao pequenos o suficiente. Como pk e qk s˜ao polinˆomios, isso vale para todos αji ∈ . Isso provou a associatividade.

Para provar que LG ´e um grupo, devemos mostrar que h´a um elemento neutro em LG para o produto ∗ e que para cada elemento de LG existe uma inversa. Pela f´ormula de Baker-Campbell-Hausdorff ´e f´acil constatar que A∗0 = 0∗A = A

para todo A ∈ LG . Assim o zero ´e o elemento neutro procurado. Fora isso, tamb´em pela f´ormula de Baker-Campbell-Hausdorff ´e f´acil constatar que A ∗ (−A) = A + (−A) + comutadores de A com − A = 0. Logo, (LG , ∗) ´e um grupo. Esses fatos tˆem ainda uma conseq¨ uˆencia importante. Seja L ⊂ Mat ( , n) uma a´lgebra de Lie nilpotente de matrizes. Definamos por exp(L) o conjunto de todas as matrizes que s˜ao exponenciais de elementos de L: exp(L) = {G ∈ Mat ( , n)| G = exp(A) para algum A ∈ L} . Afirmamos que exp(L) ´e um grupo (em rela¸ca˜o ao produto usual de matrizes), em verdade um subgrupo de GL( n). De fato, ∈ exp(L), pois, 0 ∈ L. Se G = exp(A) com A ∈ L, ent˜ao sua inversa ´e G−1 = exp(−A), que tamb´em pertence a exp(L) pois −A ∈ L. Por fim, se G1 = exp(A1 ) e G2 = exp(A2 ) com A1 e A2 dois elementos quaisquer de ∈ L, ent˜ao, pela f´ormula de Baker-CampbellHausdorff, G1 G2 = exp(A1 ∗ A2 ) ∈ exp(L), pois A1 ∗ A2 ∈ L. A conclus˜ao ´e que a partir de uma a´lgebra de Lie nilpotente L podemos construir um grupo, ´ importante denominado grupo de Lie associado a `a ´lgebra L pelo procedimento de exponencia¸ca˜o. E notar que L ´e um conjunto conexo. Portanto, como a exponencial ´e cont´ınua, o grupo exp(L) ´e igualmente conexo. Interessantemente vale tamb´em a rec´ıproca. Seja G um grupo de Lie conexo fechado (de matrizes) e LG sua a´lgebra de Lie e vamos supor que LG seja nilpotente. Considere, para algum  > 0

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

801/1304

suficientemente pequeno, o subconjunto V de LG definido por ( m ) X V := λk Lk , com |λi | <  para todo i = 1, . . . , m , k=1

e o subconjunto U de G definido por ( ! ) m X U := exp λk Lk , com |λi | <  para todo i = 1, . . . , m , k=1

onde L1 , . . . , Lm formam uma base em LG . ∈ U e que se g = Note-se aberto Pm que V ´e um subconjunto Pmde LG . Note-se tamb´em que −1 exp ( k=1 λk Lk ) ∈ U ent˜ao g = exp (− k=1 λk Lk ) ∈ U . Assim, se provarmos que U ´e aberto poderemos usar a Proposi¸ca˜o 14.3, p´agina 776. P Se  for pequeno o suficiente poderemos garantir que k m i | <  para k=1 λk Lk k < ln P2msempre que |λP todo i = 1, . . . , m e, pela Proposi¸ca˜o 4.5, p´agina 231, teremos ln (exp ( k=1 λk Lk )) = m k=1 λk Lk . Logo U ´e a imagem inversa pela fun¸ca˜o ln do conjunto aberto V . Como ln ´e uma fun¸ca˜o cont´ınua (Proposi¸ca˜o 4.3, p´agina 229) conclu´ımos que U ´e igualmente aberto. 

Logo, pela Proposi¸ca˜o 14.3, cada elemento g de G pode ser escrito como um produto de n elementos de U : g = g1 · · · gn , onde gi = exp(li ) com li ∈ V . Agora, como a a´lgebra ´e nilpotente, vale exp(l1 ) · · · exp(ln ) = exp(l1 ∗ · · · ∗ ln ). Com isso, fica demonstrada a seguinte afirma¸ca˜o: se G ´e um subgrupo conexo fechado de GL( , n) e se sua a´lgebra de Lie LG ´e nilpotente, ent˜ao todo elemento de G pode ser escrito como exponencial de um elemento de LG . Um exemplo dessa situa¸ca˜o ´e o grupo de Heisenberg GH3 , tratado a` p´agina 677. Observa¸ca ˜o 1. O n´ umero n mencionado no u ´ ltimo par´agrafo pode n˜ao ser o mesmo para todo g ∈ G (vide o enunciado da Proposi¸ca˜o 14.3), podendo eventualmente crescer arbitrariamente quando g varia no grupo. Por´em, como a a´lgebra LG ´e nilpotente, o produto l1 ∗ · · · ∗ ln est´a sempre definido para qualquer n. Observa¸ca ˜o 2. Nas circunstˆancias descritas acima, ´e f´acil constatar que a fun¸ca˜o exponencial exp : LG → G ´e um isomorfismo do grupo (LG , ∗) em G.

Grupos de Lie com a´lgebras de Lie nilpotentes n˜ao s˜ao os u ´ nicos grupos de Lie para os quais vale que ´ poss´ıvel todo seu elemento pode ser escrito como exponencial de um elemento da sua a´lgebra de Lie. E mostrar que grupos de Lie compactos com a´lgebras de Lie semi-simples tamb´em tˆem essa propriedade. Para uma demonstra¸ca˜o vide, por exemplo, [119]. Vimos isso de modo expl´ıcito quando tratarmos dos grupos SO(3), SU(2), SL( , 2), SU(n) e SO(n) no Cap´ıtulo 13. Para grupos de Lie n˜ao-conexos tipicamente ocorre que n˜ao se pode escrever todos os seus elementos como exponenciais de elementos de sua a´lgebra de Lie. Tal ´e, por exemplo, o caso do grupo de Lie GL( , 2), cuja a´lgebra de Lie ´e Mat ( , 2). A exponencial de matrizes reais 2 × 2 ´e sempre formada por matrizes com determinante positivo (pela Proposi¸ca˜o 4.7, p´agina 234), enquanto que GL( , 2) possui tamb´em matrizes com determinante negativo. Vide Proposi¸ca˜o 4.10, p´agina 236. 





Por´em, como veremos no exemplo discutido em detalhe a` p´agina 803, n˜ao basta que um grupo de Lie seja conexo para que todos os seus elementos possam ser escritos como exponenciais de elementos

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

802/1304

de sua a´lgebra de Lie. Em v´arios casos, todavia, os elementos do grupo podem ser escritos como um produto finito de exponenciais. Tal tamb´em ocorre no exemplo da p´agina 803. Para um grupo de Lie conexo G ´e poss´ıvel, sob hip´oteses adequadas que n˜ao discutiremos aqui, construir um grupo de Lie simplesmente conexo a partir de sua a´lgebra de Lie, usando um procedimento semelhante ao que empregamos quando discutimos acima o caso de a´lgebras de Lie nilpotentes. Constr´oi-se primeiramente uma vizinhan¸ca U da identidade que seja sim´etrica (ou seja, se g ∈ U ent˜ao g −1 ∈ U ) –por exemplo a vizinhan¸ca na qual a f´ormula de Baker-Campbell-Hausdorff converge, no caso de matrizes– e em seguida considera-se o conjunto formado por produtos finitos de elementos de U , o chamado grupo gerado por U . Esse conjunto ´e em geral um grupo de Lie simplesmente conexo que ´e um recobrimento do grupo original G.

14.4.3

Alguns Exemplos Especiais

• Um subgrupo conexo n˜ ao-fechado de GL( , 2) Exibiremos aqui um exemplo de um sub-grupo conexo n˜ao-fechado de GL( , 2) o qual ´e um grupo de Lie mas n˜ao ´e um subgrupo de Lie de GL( , 2). Isso significa que a topologia que faz desse subgrupo Ha um grupo de Lie n˜ao ´e a topologia induzida por GL( , 2) em Ha . Esse exemplo ´e bastante instrutivo e ilustra o porquˆe de haver certas dificuldades sutis de natureza topol´ogica na teoria dos grupos de Lie (e na geometria diferencial, em geral). O grupo em quest˜ao ´e o seguinte grupo de matrizes a um parˆametro real:   it  e 0 , Ha := , t∈ 0 eiat 

onde a ´e um n´ umero real irracional fixo arbitr´ario. Para mostrar que esse grupo n˜ao ´e fechado, vamos exibir uma seq¨ uˆencia convergente de matrizes de Ha que n˜ao converge a um elementode Ha . Considere  −1 0 tn = (2n+1)π com n ∈ . As matrizes de Ha correspondentes a esses valores de t s˜ao . 0 ei2πa(2n+1) Sucede que, como a ´e irracional, os n´ umeros complexos da forma ei2πa(2n+1) , com n ∈ , formam um conjunto denso em todo o c´ırculo unit´ario do plano complexo20 . Assim, existe uma sub-seq¨ uˆencia nk tal que ei2πa(2nk +1) converge a −1 quando k → ∞. Isso mostra que a matriz − est´a no fecho de Ha . Sucede, por´em, que − 6∈ Ha pois, para a irracional, n˜ao existe nenhum t real tal que valham simultaneamente eit = −1 e eiat = −1 (prove isso). Isso mostra que Ha n˜ao ´e fechado.  it  e 0 Por outro lado, ´e claro que h´a uma aplica¸ca˜o bijetora de em Ha dada por 3 t 7→ ,a 0 eiat qual induz a topologia usual de em Ha , topologia essa na qual Ha ´e um grupo de Lie, como facilmente se vˆe. Essa topologia n˜ao coincide com a topologia induzida em Ha pela norma de matrizes em Ha . 









H´a uma maneira geom´etrica de entender o que est´a acontecendo nesse grupo. Considere o seguinte 20

O leitor para o qual esse fato n˜ ao ´e familiar poder´ a encontrar demonstra¸co ˜es em bons livros sobre teoria de n´ umeros, por exemplo [55].

JCABarata. Curso de F´ısica-Matem´ atica

grupo de Lie de matrizes 2 × 2: T :=



Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

 eit 0 , t, s ∈ 0 eis





803/1304

.

Esse grupo de Lie (a dois parˆametros reais) pode ser visualizado como um toro bidimensional (pois ´e o produto cartesiano de dois c´ırculos: o c´ırculo eit com t ∈ e o c´ırculo eis com s ∈ ). Cada grupo Ha ´e um subgrupo de T e, nessa imagem, corresponde a uma curva (pois cada Ha ´e unidimensional) que preenche densamente o toro sem auto-cruzamentos. Dessa forma entende-se que o fecho de H a na topologia da norma das matrizes ´e o grupo T . 



Se imaginarmos um aberto no toro, veremos que este intercepta a curva que corresponde a H a em infinitos segmentos. Assim, Ha n˜ao ´e uma sub-variedade de T e, portanto, apesar de ser um subgrupo de T , Ha n˜ao pode ser um subgrupo de Lie de T na topologia de T . • Exponencia¸ c˜ ao e ´ algebras de Lie matriciais. Um contra-exemplo Vamos agora apresentar um exemplo de um grupo de Lie conexo no qual n˜ao podemos escrever todos os seus elementos como exponenciais de elementos de sua a´lgebra de Lie, ou seja, a exponencial de sua a´lgebra de Lie n˜ao ´e sobrejetora no grupo. Seja α um n´ umero real irracional21 fixo. Vamos considerar o seguinte conjunto de matrizes complexas 2 × 2: Hα := {h(t, z), t ∈ , z ∈ } , 

onde



 eit z h(t, z) := . 0 eiαt Afirmamos que Hα ´e um sub-grupo de GL( , 2). De fato,

(14.12)

= h(0, 0) ∈ Hα , 0

h(t, z)h(t0 , z 0 ) = h(t + t0 , zeiαt + z 0 eit ) ∈ Hα

e

h(t, z)−1 = h(−t, −ze−i(1+α)t ) ∈ Hα . E. 14.11 Exerc´ıcio. Verifique!

6

Hα ´e um grupo de Lie conexo parametrizado por t ∈ e z ∈ . De fato, o grupo Hα ´e homeomorfo a` variedade conexa × . O homeomorfismo de × em Hα ´e dado pela fun¸ca˜o h definida em (14.12), isto ´e, h : × → Hα ,  it  e z (t, z) 7→ h(t, z) := . 0 eiαt 







Claramente, h ´e cont´ınua (certo?). Vamos mostrar que h ´e bijetora. Suponha que existam (t, z) e (t0 , z 0 ) ∈ × tais que h(t, z) = h(t0 , z 0 ), ou seja,    it0  it z0 e e z . = 0 0 eiαt 0 eiαt 

21

Como veremos abaixo, ´e crucial para a constru¸ca ˜o desejada que α n˜ ao seja racional.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

804/1304

Isso implica as trˆes seguintes condi¸co˜es simultˆaneas: eit = eit

0

eiαt = eiαt

(14.13) 0

(14.14)

z = z0 .

(14.15)

As rela¸co˜es (14.13) e (14.14) implicam t = t0 + 2πk respectivamente, para k, l ∈ da segunda, ter´ıamos

αt = αt0 + 2πl,

e

. Assim, multiplicando-se a primeira igualdade por α e subtraindo-se αk = l

para k, l ∈ . Mas isso ´e imposs´ıvel se α for um n´ umero irracional, a menos que k = l = 0. Com isso, 0 conclu´ımos que t = t , fato esse que, juntamente com (14.15), prova que h ´e uma bije¸ca˜o. Mais ainda, ´e bem claro que h ´e infinitamente diferenci´avel e, portanto, ´e um difeomorfismo. Vamos determinar os geradores de Hα , que denotaremos por λ1 , λ2 :   ∂ i 0 λ1 = , h(t, z) = 0 iα ∂t t=z=0 λ2 =

E. 14.12 Exerc´ıcio. Verifique!

  ∂ 0 1 h(t, z) = . 0 0 ∂z t=z=0

6

Um elemento gen´erico da a´lgebra de Lie L(Hα ) associada a Hα ´e, portanto, da forma   iτ w h(τ, w) := τ λ1 + wλ2 = , 0 iατ com τ ∈ 

ew∈ .

E. 14.13 Exerc´ıcio. Constate que [λ1 , λ2 ] = i(1 − α)λ2 . Conclua da´ı que a ´algebra de Lie L(Hα ) associada a Hα n˜ao ´e nilpotente, n˜ao ´e simples e n˜ao ´e semi-simples, mas ´e sol´uvel. 6 ´ muito f´acil provar que Vamos nos dedicar agora a calcular exp(h(τ, w)). E   (iτ )2 w(iτ )(1 + α)  h(τ, w)2 =  2 0 (iατ )

e que



h(τ, w)3 = 

(iτ )3 0

w(iτ )2 (1 + α + α2 ) (iατ )

3



.

JCABarata. Curso de F´ısica-Matem´ atica

Por indu¸ca˜o, vˆe-se tamb´em que  h(τ, w)

n

(iτ )  =   0

n

w(iτ )

n−1

n−1 X

Cap´ıtulo 14

Vers˜ ao de 29 de setembro de 2005.

α

p

p=0

!



 (iτ )   =    0

(iατ )n

805/1304



 1 − αn w(iτ ) 1−α  ,  n (iατ ) n−1

n

para todo n ≥ 1. Na u ´ ltima igualdade usamos a bem conhecida f´ormula da progress˜ao geom´etrica. E. 14.14 Exerc´ıcio importante. Mostre isso!

6

Dessa forma, obtemos exp(h(τ, w)) =

∞ X 1 h(τ, w)n + n! n=1



∞ X 1 (iτ )n 1 + n!  n=1  =    0



onde

= 

eiτ 0

 wf (τ ) , iατ e

  ∞ X 1 − αn 1 n−1 w (iτ ) n! 1−α   n=1    ∞ X 1  n (iατ ) 1+ n! n=1

  ∞ X 1 − αn 1 n−1 (iτ ) . f (τ ) := n! 1−α n=1

Vamos agora expressar melhor a fun¸ca˜o f (τ ). Note-se que f (0) = 1 e que, para τ = 6 0, !   ∞ ∞ ∞ n X X X 1 1 1 − α 1 1 (iτ )n−1 = (iτ )n−1 − α (iατ )n−1 n! 1 − α 1 − α n! n! n=1 n=1 n=1 1 = 1−α 1 = 1−α eiατ = 1−α

  

eiτ − 1 iτ



eiτ − eiατ iτ





ei(1−α)τ − 1 iτ





.

eiατ − 1 iτ



JCABarata. Curso de F´ısica-Matem´ atica

Assim,

 1,   

f (τ ) =

Cap´ıtulo 14

806/1304

para τ = 0,

eiατ    1−α

e, finalmente,

Vers˜ ao de 29 de setembro de 2005.



ei(1−α)τ − 1 iτ 

exp(h(τ, w)) = 



, para τ 6= 0

eiτ

wf (τ )

0

iατ

e



.

(14.16)

A quest˜ao que agora se p˜oe ´e: ser´a o conjunto de matrizes exp(L(H α )) := {exp(h(τ, w)), τ ∈ , w ∈ } 2π , z com z 6= 0 igual a Hα ? A resposta ´e n˜ ao! Para provar isso mostraremos que as matrizes h 1−α n˜ ao s˜ao elementos do conjunto exp(L(Hα )). Se tal n˜ao fosse o caso, existiriam τ ∈ e w ∈ tais que   2π , z = exp(h(τ, w)), h 1−α 



ou seja,

  



ei 1−α

z

0

ei 1−α

2πα





  = 

eiτ 0

 wf (τ ) . iατ e

Isso s´o ´e poss´ıvel se as seguintes trˆes condi¸co˜es forem satisfeitas simultaneamente: 2π

ei 1−α = eiτ ,

(14.17)

2πα

ei 1−α = eiατ ,

(14.18)

z = wf (τ ).

(14.19)

As condi¸co˜es (14.17) e (14.18) implicam τ = e

2π + 2πk 1−α

2πα + 2πl, 1−α . Das duas conclu´ı-se (multiplicando a primeira por α) que ατ =

respectivamente, com k, l ∈

2πkα = 2πl,

ou seja,

kα = l.

Por´em, como α foi suposto ser um n´ umero irracional, isso s´o ´e poss´ıvel se k = l = 0. Portanto τ =

2π . 1−α

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 14

807/1304

Ocorre agora, por´em, que inserindo-se esse valor de τ no lado direito de (14.19) obtemos !  2πi    2π 2πα 2πα e −1 ei(1−α) 1−α − 1 ei 1−α 2π i 1−α wf = we = w = 0 2π 1−α 1−α 2πi i 1−α e, conseq¨ uentemente, (14.19) n˜ao pode ser satisfeita para z 6= 0.

Esse exemplo ilustra bem o fato mencionado de haver situa¸co˜es nas quais a imagem pela exponencia¸ca˜o da a´lgebra de Lie L(G) associada a um grupo de Lie G n˜ao coincide com o grupo G. E. 14.15 Exerc´ıcio. Seja um grupo de Lie simplesmente conexo G, cuja ´algebra de Lie ´e L. Um teorema devido a Dixmier [63] afirma, entre outras coisas, que exp(L) = G se exp for injetora. Mostre que (τ, w) 7→ exp(h(τ, w)) definida em (14.16) n˜ao ´e injetora. 6 No exemplo acima vale, por´em, a seguinte afirma¸ca˜o: todo elemento de Hα pode ser escrito como produto de duas exponenciais de elementos da a´lgebra de Lie L(Hα ), a saber, da forma exp(h(τ, 0)) exp(h(0, w)) . De fato, ´e bem f´acil ver que  it   it   e z e 0 1 e−it z h(t, z) = = = exp(h(t, 0)) exp(h(0, e−it z)). 0 eiαt 0 eiαt 0 1

Cap´ıtulo 15 Uma Breve Introdu¸c˜ ao ` a Teoria das Representa¸co ˜es de Grupos Conte´ udo 15.1 Representa¸ co ˜es de Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 808 15.2 Representa¸ co ˜es Irredut´ıveis de SO(3) . . . . . . . . . . . . . . . . . . . . . 815 15.3 A Medida de Haar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 819 15.4 Representa¸ co ˜es de Grupos Compactos . . . . . . . . . . . . . . . . . . . . . 821 15.5 O Teorema de Peter-Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . 822

rupos desempenham um papel importante na F´ısica em geral devido a sua rela¸ca˜o com transforma¸co˜es de simetria. Na F´ısica Quˆantica (na Mecˆanica Quˆantica ou na Teoria Quˆantica de Campos), onde o conjunto de estados puros de um sistema f´ısico ´e descrito por um espa¸co linear, torna-se particulamente relevante estudar a a¸ca˜o de grupos de simetria em espa¸cos vetoriais. Essa ´e a motiva¸ca˜o b´asica do estudo de representa¸co˜es de grupos.

15.1

Representa¸ co ˜es de Grupos

Uma representa¸ca ˜o de um grupo G em um espa¸co vetorial V ´e uma aplica¸ca˜o que a cada g ∈ G associa um operador linear invert´ıvel Π(g) : V → V de modo que as seguintes condi¸co˜es sejam satisfeitas: 1. Π(e) = . 2. Π(g)Π(h) = Π(gh), ∀g, h ∈ G. 3. Π(g −1 ) = Π(g)−1 , ∀g ∈ G. Acima e ´e a unidade de G e

o operador identidade em V .

H´a outras formas equivalentes de caracterizar ou definir o conceito de representa¸ca˜o de um grupo. Podemos dizer que uma representa¸ca˜o de um grupo em um espa¸co vetorial V ´e um homomorfismo de G no grupo dos operadores lineares invert´ıveis de V em V , ou ainda, que ´e uma a¸ca˜o a` esquerda de G em V atrav´es de operadores lineares invert´ıveis. • A Representa¸ c˜ ao Trivial A representa¸ca˜o que associa todo g ∈ G ao operador identidade em V , ou seja, tal que π(g) = , ∀g ∈ G, ´e denominada representa¸ca ˜o trivial. 808

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

809/1304

• Intertwiners Seja G um grupo e V1 , V2 dois espa¸cos vetoriais (sobre o mesmo corpo) onde atuem duas representa¸co˜es de G: Π1 e Π2 , respectivamente em V1 e V2 . Um operador U : V1 → V2 tal que U Π1 (g) = Π2 (g)U, para todo g ∈ G, ´e dito ser um operador de entrela¸camento de Π1 e Π2 . Operadores de entrela¸camento s˜ao mais freq¨ uentemente designados intertwiners. Voltaremos a falar sobre intertwiners quando tratarmos do importante Lema de Schur adiante. • Representa¸ co ˜es Equivalentes As duas representa¸co˜es s˜ao ditas equivalentes se existir um operador invert´ıvel U : V 1 → V2 tal que U Π1 (g) = Π2 (g)U para todo g ∈ G, ou seja, se Π1 e Π2 possu´ırem um intertwiner invert´ıvel.

´ muito f´acil mostrar que a equivalˆencia de duas representa¸co˜es ´e uma rela¸ca˜o de equivalˆencia (no E sentido usual) e que, portanto, a classe de todas as representa¸co˜es de um grupo pode ser quebrada em classes de representa¸co˜es equivalentes. Um grupo pode ter v´arias representa¸co˜es distintas (e inequivalentes) em um mesmo espa¸co vetorial. E. 15.1 Exerc´ıcio. Seja G = ( , +) e V = 2 . Mostre que       1 x 1 0 cos x − sen x T1 (x) := , T2 (x) := e R(x) := , 0 1 x 1 sen x cos x 



ao: tome U = ( 01 10 )). x ∈ , s˜ao trˆes representa¸co˜es de G. Mostre que T1 e T2 s˜ao equivalentes (sugest˜ Mostre que R e T1 (ou T2 ) n˜ao s˜ao equivalentes (sugest˜ ao: se o fossem, veja o que ocorreria para x = 2π). 6 

• Sub-Espa¸ cos Invariantes Seja G um grupo, V um espa¸co vetorial e Π uma representa¸ca˜o de G em V . Seja V 0 um sub-espa¸co de V . V 0 ´e dito ser um sub-espa¸co invariante por Π se Π(g)v 0 ∈ V 0 para todo v 0 ∈ V 0 e todo g ∈ G, ou seja, se Π(G)V 0 ⊂ V 0 . Qualquer representa¸ca˜o possui sempre pelo menos dois sub-espa¸cos invariantes: aquele formado apenas pelo vetor nulo V 0 = {0} e aquele formado pelo espa¸co todo V 0 = V . Esses sub-espa¸cos invariantes s˜ao ditos triviais.

E. 15.2 Exerc´ıcio. 1. Mostre que a representa¸c˜ao T1 , definida acima, tem um sub-espa¸co invariante de dimens˜ao 1, a saber, o sub-espa¸co formado pelos vetores da forma ( a0 ), a ∈ . Mostre que nenhum outro sub-espa¸co de dimens˜ao 1 de 2 ´e invariante por T1 . 2. Mostre que a representa¸c˜ao T2 , definida acima, tem um sub-espa¸co invariante de dimens˜ao 1, a saber, o sub-espa¸co formado pelos vetores da forma ( 0b ), b ∈ . Mostre que nenhum outro sub-espa¸co de dimens˜ao 1 de 2 ´e invariante por T2 . 3. Mostre que a representa¸c˜ao R, definida acima, n˜ao tem nenhum sub-espa¸co invariante n˜ao-trivial. 6 







JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 15

Vers˜ ao de 29 de setembro de 2005.

810/1304

E. 15.3 Exerc´ıcio. Verifique que as express˜oes abaixo definem representa¸co˜es de G = ( , +) em V = e identifique seus sub-espa¸cos invariantes. 



1 0 Π1 (x) =  0 0

x 1 0 0

0 0 1 0

 0 0 , x 1

 1 0 Π2 (x) =  0 0

x 1 0 0

 0 0 0 0  , cos x − sen x sen x cos x



cos x − sen x  sen x cos x Π3 (x) =   0 0 0 0

4 

 0 0 0 0  . cos x − sen x sen x cos x

6

• Representa¸ co ˜es Irredut´ıveis De grande importˆancia ´e o conceito de representa¸ca ˜o irredut´ıvel de um grupo G em um espa¸co vetorial V . Uma representa¸ca˜o Π de um grupo G em um espa¸co vetorial V ´e dita ser irredut´ıvel se os seus u ´ nicos sub-espa¸cos invariantes forem os triviais. Uma representa¸ca˜o que n˜ao ´e irredut´ıvel ´e dita ser redut´ıvel. E. 15.4 Exerc´ıcio. Mostre que as representa¸co˜es T1 e T2 , definidas `a p´agina 809, s˜ao redut´ıveis. Mostre que a representa¸c˜ao R ´e irredut´ıvel. 6 Vamos supor que V seja um espa¸co de dimens˜ao finita, digamos n, e que Π seja uma representa¸ca˜o de um grupo G em V que possua um sub-espa¸co invariante n˜ao-trivial V 0 (ou seja, Π ´e redut´ıvel). Seja m ≤ n a dimens˜ao de V 0 . Ent˜ao ´e poss´ıvel encontrar uma base em V tal que Π(g) possui a representa¸ca˜o matricial em blocos   π1 (g) α(g) Π(g) = 0 π2 (g) para todo g ∈ G, onde π1 (g) ´e uma matriz m × m, π2 (g) ´e uma matriz (n − m) × (n − m), e α(g) ´e uma matriz m × (n − m). Mostrar isso ´e bem simples, basta representar cada v ∈ V em uma base e1 , . . . , en , onde e1 . . . , em formam uma base de V 0 . O seguinte exerc´ıcio revela uma propriedade importante dos blocos π1 e π2 : E. 15.5 Exerc´ıcio. Mostre que π1 e π2 definidos acima s˜ao tamb´em representa¸co ˜es de G.

6

Uma representa¸ca˜o Π de um grupo G em um espa¸co vetorial V ´e dita ser totalmente redut´ıvel se for redut´ıvel e se V puder ser escrita como uma soma direta de sub-espa¸cos invariantes por Π: V = V1 ⊕ · · · ⊕ Vk . Em tal caso Π(g) pode ser escrita em uma base conveniente na forma de blocos   π1 (g)   .. Π(g) =   . πk (g)

para todo g ∈ G, onde cada πi (g) ´e uma representa¸ca˜o de G agindo no espa¸co invariante Vi de Π. Em um tal caso denotamos Π da forma Π = π1 ⊕ · · · ⊕ πk .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

811/1304

Particularmente importante ´e a situa¸ca˜o em que Π ´e totalmente redut´ıvel e cada π i ´e irredut´ıvel. Em tal caso dizemos que Π ´e maximalmente redut´ıvel ou completamente redut´ıvel. E. 15.6 Exerc´ıcio. Sejam as representa¸co˜es T1 e T2 definidas `a p´agina 809. Mostre que T1 e T2 n˜ao s˜ao totalmente redut´ıveis. 6 E. 15.7 Exerc´ıcio. Sejam as representa¸co˜es Π1 , Π2 e Π3 definidas `a p´agina 810. Mostre que Π1 e Π2 s˜ao totalmente mas n˜ao maximalmente redut´ıveis. Mostre que Π 3 ´e maximalmente redut´ıvel. 6 Nesse contexto a seguinte proposi¸ca˜o ´e importante: Proposi¸ c˜ ao 15.1 Seja V um espa¸co vetorial complexo de dimens˜ ao finita, dotado de um produto interno h·, · · · i, e seja Π uma representa¸ca ˜o de um grupo G por operadores unit´ arios (em rela¸ca ˜o ao produto interno). Ent˜ ao ou Π ´e irredut´ıvel ou ´e maximalmente redut´ıvel. 2 Para provar essa proposi¸ca˜o, vamos antes demonstrar o seguinte lema, o qual tem importˆancia por si s´o, como veremos mais adiante. Lema 15.1 Seja V um espa¸co vetorial complexo, dotado de um produto interno h·, · · · i, e seja Π uma ˜o ao produto interno). Se W ´e um representa¸ca ˜o de um grupo G por operadores unit´ arios (em rela¸ca sub-espa¸co invariante por Π ent˜ ao seu complemento ortogonal W ⊥ (em rela¸ca ˜o ao produto interno) tamb´em o ´e. 2 Prova. Como Π ´e unit´ario, vale Π(g)∗ = Π(g)−1 = Π(g −1 ) para todo g ∈ G. Seja w 0 ∈ W ⊥ e w ∈ W . Ent˜ao, para qualquer g ∈ G hΠ(g)w 0 , wi = hw 0 , Π(g)∗ wi = hw 0 , Π(g −1 )wi = 0 pois Π(g −1 )w ∈ W , j´a que W ´e invariante, e w 0 ´e ortogonal e todo elemento de W . Como w ´e um elemento arbitr´ario de W , isso mostrou que Π(g)w 0 ∈ W ⊥ para todo g ∈ G, provando assim que W ⊥ ´e invariante. Vamos agora provar a proposi¸ca˜o. Se Π ´e unit´aria e ´e redut´ıvel, ent˜ao V possui um sub-espa¸co invariante n˜ao trivial V1 e, pelo lema acima, V2 = V1⊥ ´e tamb´em invariante. Logo, Π ´e totalmente redut´ıvel, V = V1 ⊕ V2 e Π = π1 ⊕ π2 . Agora, ´e f´acil ver que cada π1 ´e tamb´em uma representa¸ca˜o unit´aria (por quˆe?). Assim, podemos aplicar a mesma conclus˜ao a cada πi e, se πi for redut´ıvel, podemos tornar a quebrar o sub-espa¸co Vi em sub-espa¸cos invariantes ainda menores e πi em uma soma de representa¸co˜es unit´arias menores. Como a dimens˜ao de V ´e finita, esse procedimento ter´a for¸cosamente um fim e cada representa¸ca˜o menor a que se chegar ser´a for¸cosamente irredut´ıvel. E. 15.8 Exerc´ıcio. Mostre que as mesmas conclus˜oes valem para representa¸co˜es ortogonais em espa¸cos vetoriais reais. 6 • Representa¸ co ˜es Irredut´ıveis para Operadores

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

812/1304

Um outro conceito importante ´e o seguinte. Uma representa¸ca˜o Π de um grupo G em um espa¸co vetorial V ´e dita ser irredut´ıvel para operadores se valer a seguinte propriedade: os u ´ nicos operadores A : V → V tais que AΠ(g) = Π(g)A para todo g ∈ G s˜ao da forma A = λ , ou seja, s˜ao m´ ultiplos da identidade.

Podemos nos perguntar qual a rela¸ca˜o entre essa no¸ca˜o e a de representa¸ca˜o irredut´ıvel. Vamos demonstrar adiante os seguintes fatos: 1) toda representa¸ca˜o irredut´ıvel complexa de dimens˜ao finita ´e irredut´ıvel para operadores. 2) toda representa¸ca˜o unit´aria que seja irredut´ıvel para operadores ´e tamb´em irredut´ıvel. V´arias das conseq¨ uˆencias mais importantes da teoria das representa¸co˜es de grupos s˜ao extra´ıdas dessas observa¸co˜es. Como vemos elas nos dizem que para representa¸co˜es unit´arias complexas e de dimens˜ao finita (de particular interesse na f´ısica quˆantica) os conceitos de representa¸ca˜o irredut´ıvel e representa¸ca˜o irredut´ıvel para operadores s˜ao coincidentes. Vamos come¸car demonstrando a afirma¸ca˜o 2). Proposi¸ c˜ ao 15.2 Se Π ´e uma representa¸ca ˜o unit´ aria que ´e irredut´ıvel para operadores, ent˜ ao Π ´e tamb´em irredut´ıvel. 2 Prova. Vamos supor W seja um sub-espa¸co invariante por Π. Seja P o projetor sobre W . Ent˜ao, − P ´ evidente que ´e o projetor sobre W ⊥ , que ´e tamb´em invariante, pois Π ´e unit´aria. E Π(g)P x = P Π(g)P x, pois Π(g)P x ∈ W . Por outro lado, como x = P x + ( − P )x, ent˜ao P Π(g)x = P Π(g)P x + P Π(g)( − P )x = P Π(g)P x, pois P Π(g)( − P )x = 0, j´a que W ⊥ ´e invariante. Comparando-se, conclu´ımos que Π(g)P x = P Π(g)x para todo x e todo g ∈ G, ou seja, Π(g)P = P Π(g) para todo g ∈ G. Por´em, como Π ´e irredut´ıvel para operadores, isso s´o ´e poss´ıvel se P = λ . Como P 2 = P , tem-se λ = 0 ou λ = 1. No primeiro caso P = 0, no segundo, P = , ou seja, no primeiro caso W = {0} e no segundo W ´e o espa¸co todo. Ora, isso diz precisamente que Π ´e irredut´ıvel. Vamos agora passar a demonstra¸ca˜o da afirma¸ca˜o 1), acima. A mesma ´e corol´ario de um lema alg´ebrico de grande importˆancia. O chamado lema de Schur1 . • Lema de Schur Lema 15.2 (Schur) Se Π1 e Π2 s˜ ao duas representa¸co ˜es irredut´ıveis de um grupo G em espa¸cos vetoriais V1 e V2 , respectivamente, e A : V1 → V2 ´e um intertwiner de Π1 e Π2 , ou seja, AΠ1 (g) = Π2 (g)A para todo g ∈ G, ent˜ ao ou A ´e invert´ıvel ou A = 0. Caso A seja invert´ıvel e V 1 e V2 sejam 1

Issai Schur (1875-1941).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

813/1304

espa¸cos vetoriais complexos de dimens˜ ao finita, ent˜ ao A e u ´nico, a menos de multiplica¸ca ˜o por escalar. 2 Prova. Sejam M1 := Ker(A) ⊂ V1 M2 := Ran(A) ⊂ V2

´ f´acil ver que M1 e M2 s˜ao sub-espa¸cos invariantes de Π1 o n´ ucleo e a imagem de A, respectivamente2 . E e Π2 , respectivamente. De fato, se x ∈ M1 tem-se Ax = 0. Logo, AΠ1 (g)x = Π2 (g)Ax = 0, provando que Π1 (g)x ∈ M1 para todo g ∈ G, ou seja, M1 ´e invariante por Π1 . Analogamente, se y ∈ M2 temos que y = Ax para algum x ∈ V1 . Assim, Π2 (g)y = Π2 (g)Ax = AΠ1 (g)x ∈ Ran(A), mostrando, assim, que M2 ´e invariante por Π2 . Pelas hip´oteses do lema, Π1 e Π2 s˜ao irredut´ıveis e s´o possuem sub-espa¸cos invariantes triviais. Valem, portanto, os seguintes quatro casos apenas: 1. M1 = V1 e M2 = V2 . 2. M1 = {0} e M2 = V2 . 3. M1 = V1 e M2 = {0}. 4. M1 = {0} e M2 = {0}. Os casos 1 e 4 s˜ao imposs´ıveis: se Ker(A) = V1 n˜ao se pode ter Ran(A) = V2 ; se Ker(A) = {0} n˜ao se pode ter Ran(A) = {0}. Assim, valem apenas os casos 2 e 3. No caso 2 tem-se que A ´e invert´ıvel. No caso 3, tem-se que A = 0. Resta-nos provar que, caso A seja invert´ıvel e V1 e V2 sejam espa¸cos vetoriais complexos de dimens˜ao finita, ent˜ao A ´e u ´ nico, a menos de multiplica¸ca˜o por escalar. Se A ´e invert´ıvel, ent˜ao a dimens˜ao de V1 ´e igual a` de V2 e A pode ser visto como uma matriz quadrada. Seja B um outro intertwiner de Π1 e Π2 . Ent˜ao, para qualquer λ ∈ tem-se (A − λB)Π1 (g) = Π2 (g)(A − λB). Portanto, ou (A − λB) = 0 ou ´e invert´ıvel. Podemos, por´em, escolher λ de modo que det(A − λB) = 0. Isso ´e sempre poss´ıvel, pois det(A − λB) ´e um polinˆomio em λ e polinˆomios sempre tˆem ra´ızes complexas. Para uma tal escolha de λ, a matriz A − λB n˜ao ´e invert´ıvel e, portanto, ´e nula e A = λB. O Lema de Schur tem v´arias conseq¨ uˆencias importantes. A primeira ´e o seguinte: Corol´ ario 15.1 Se Π ´e uma representa¸ca ˜o irredut´ıvel complexa de dimens˜ ao finita de um grupo G ent˜ ao Π ´e irredut´ıvel para operadores. 2 Prova. Seja A tal que AΠ(g) = Π(g)A para todo g ∈ G. Sabemos tamb´em que Π(g) = Π(g) , trivialmente. Pela unicidade afirmada no Lema de Schur, A = λ . Outro corol´ario importante ´e o seguinte: 2

Para os esquecidos, Ker(A) := {x ∈ V1 | Ax = 0}. Ran(A) := {y ∈ V2 | y = Ax para algum x ∈ V1 }.

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

814/1304

Corol´ ario 15.2 As representa¸co ˜es irredut´ıveis complexas de dimens˜ ao finita de um grupo Abeliano s˜ ao unidimensionais. 2 Prova. Se G ´e Abeliano e Π uma representa¸ca˜o de G, vale Π(h)Π(g) = Π(g)Π(h) para quaisquer g, h ∈ G. Assim, se Π ´e irredut´ıvel complexa e de dimens˜ao finita, segue do corol´ario anterior que Π(h) = λ(h) , ou seja, Π(h) ´e uma matriz diagonal com λ(h) na diagonal. Como Π ´e irredut´ıvel, a dimens˜ao do espa¸co s´o pode ser igual a 1.

• Exemplos E. 15.9 Exerc´ıcio. ao N , N ≥ 2, s˜ a∈

N,

Mostre que as representa¸co˜es irredut´ıveis complexas de dimens˜ao finita do grupo   2πik Πk (a) = exp a , N

k = 0, , . . . N − 1.

E. 15.10 Exerc´ıcio. SO(2) s˜ao

6

Mostre que as representa¸co˜es irredut´ıveis complexas de dimens˜ao finita do grupo Πp (φ) = exp (ipφ) ,

φ ∈ [0, 2π), p ∈

.

6

Note que o grupo SO(2) tem representa¸co˜es irredut´ıveis reais que n˜ao s˜ao unidimensionais. Por cos(φ) − sen (φ) exemplo, aquela que define o pr´oprio grupo SO(2): R(φ) = , φ ∈ [0, 2π). sen (φ) cos(φ) E. 15.11 Exerc´ıcio. ( , +) s˜ao

Mostre que as representa¸co˜es irredut´ıveis complexas de dimens˜ao finita do grupo



Πz (x) = exp (zx) , x∈

,z∈ . 

E. 15.12 Exerc´ıcio. ( , +) s˜ao

6 Mostre que as representa¸co˜es irredut´ıveis unit´arias de dimens˜ao finita do grupo



Πk (x) = exp (ikx) , x∈ (

,k∈ 



.

E. 15.13 Exerc´ıcio. ao + , ·) s˜

6 Mostre que as representa¸co˜es irredut´ıveis complexas de dimens˜ao finita do grupo



x∈ 

+,

z∈ .

Πz (x) = exp (z ln(x)) =: xz , 6

JCABarata. Curso de F´ısica-Matem´ atica

(

E. 15.14 Exerc´ıcio. ao + , ·) s˜

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

815/1304

Mostre que as representa¸co˜es irredut´ıveis unit´arias de dimens˜ao finita do grupo



x∈ 

+,

15.2

k∈ 

Πk (x) = exp (ik ln(x)) = xik ,

.

6

Representa¸ co ˜es Irredut´ıveis de SO(3)

Um cap´ıtulo importante das aplica¸co˜es da teoria de grupos a` F´ısica envolve a classifica¸ca˜o das representa¸co˜es irredut´ıveis de dimens˜ao finita (unit´arias ou ortogonais) do grupo de rota¸co˜es SO(3). ~ onde Como j´a vimos, o grupo SO(3) ´e formado por matrizes da forma R(θ, ~η) = exp(θ~η · J), 3 ´e um vetor unit´ario e J1 , J2 , J3 s˜ao matrizes 3 × 3 tais que [Ja , Jb ] = abc Jc . As θ ∈ [0, 2π), ~η ∈ matrizes Ja s˜ao geradores de sub-grupos uniparam´etricos R1 , R2 e R3 de SO(3), representando rota¸co˜es em torno dos eixos 1, 2 e 3, respectivamente. ´ f´acil concluir que se Π ´e uma representa¸ca˜o de dimens˜ao finita de SO(3), Π ´e da forma E 

~ Π(R(θ, η~)) = exp(θ~η · Π(J)), onde Π(J1 ), Π(J2 ), Π(J3 ) s˜ao matrizes tais que [Π(Ja ), Π(Jb )] = abc Π(Jc ) e que s˜ao os geradores da representa¸ca˜o por Π dos sub-grupos uniparam´etricos R1 , R2 e R3 . Vamos definir La = iΠ(Ja ). Ficamos com ~ Π(R(θ, ~η )) = exp(−iθ~η · L),

(15.1)

com [La , Lb ] = iabc Lc . ´ importante notar que se Π(g) ´e unit´aria para todo g ∈ SO(3), ent˜ao cada L a ´e auto-adjunta: E L∗a = La . E. 15.15 Exerc´ıcio. Prove isso.

6

• Operador de Casimir Um fato muito importante, v´alido para qualquer representa¸ca˜o de SO(3) como acima, ´e que a matriz denotada por L2 e definida por L2 = L21 + L22 + L23 comuta com todos os trˆes geradores La : [L2 , La ] = 0, para todo a = 1, 2, 3. E. 15.16 Exerc´ıcio muito importante. Verifique essa afirma¸c˜ao. Sugest˜ ao: prove (e use) a identidade [A2 , B] = A[A, B] + [A, B]A, v´alida para quaisquer matrizes n × n A e B. 6 Um operador com essa propriedade, a de comutar com todos os geradores de uma a´lgebra de Lie, ´e dito ser um operador de Casimir. Por um teorema devido a Racah, L2 ´e o u ´ nico operador de Casimir 2 de SO(3) (os demais s˜ao combina¸co˜es lineares de potˆencias de L ). A importˆancia dos operadores de

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

816/1304

Casimir ´e a seguinte. Como L2 comuta com cada La , segue facilmente de (15.1) que L2 Π(g) = Π(g)L2 para todo g ∈ SO(3). Assim, pelo Lema de Schur, se Π ´e uma representa¸ca˜o irredut´ıvel, L 2 deve ser um m´ ultiplo da identidade. Isso abre o caminho para classificar as representa¸co˜es irredut´ıveis de SO(3): estudando os poss´ıveis autovalores de L2 . Em cada sub-espa¸co formado por autovetores com um dado autovalor fixo, teremos uma representa¸ca˜o irredut´ıvel. • Autovalores de L2 Sejam La , a = 1, 2, 3, matrizes complexas auto-adjuntas agindo em um espa¸co vetorial de dimens˜ao finita, satisfazendo [La , Lb ] = iabc Lc e L2 definida como acima. Vamos estudar os poss´ıveis autovalores de L2 . Comecemos mostrando que os autovalores de L2 s˜ao n´ umeros reais n˜ao-negativos. Seja Ψ um autovetor de L2 com autovalor λ: L2 Ψ = λΨ. Ent˜ao, λhΨ, Ψi = hΨ, L2 Ψi = hΨ, L21 Ψi + hΨ, L22 Ψi + hΨ, L23 Ψi = hL1 Ψ, L1 Ψi + hL2 Ψ, L2 Ψi + hL3 Ψ, L3 Ψi. Na u ´ ltima igualdade usamos o fato que L∗a = La . Como hLa Ψ, La Ψi ≥ 0, conclu´ımos que λ ≥ 0, como quer´ıamos. Todo n´ umero λ ≥ 0 pode ser escrito na forma λ = l(l + 1) com l ≥ 0. Por futura conveniˆencia, escreveremos doravante os autovalores de L2 na forma l(l + 1) com l ≥ 0.

Recordemos agora o fato que, como [L2 , L3 ] = 0, podemos escolher uma base ortogonal formada por vetores que s˜ao simultaneamente autovetores de L2 e L3 . Denotaremos esses vetores por Ψl,m , tendo-se L2 Ψl,m = l(l + 1)Ψl,m e L3 Ψl,m = mΨl,m . Iremos em breve fazer uso dessa base. ´ conveniente definir L± = L1 ± iL2 . Tem-se que L∗ = L∓ . Como L1 = (L+ + L− )/2 e L2 = E ± (L+ − L− )/(2i), podemos reescrever as rela¸co˜es alg´ebricas [La , Lb ] = iabc Lc em termos de L± e L3 . Obtemos [L3 , L± ] = ±L± ,

(15.2)

[L+ , L− ] = 2L3 .

(15.3)

L2 = L+ L− + L3 (L3 − ) ,

(15.4)

L2 = L− L+ + L3 (L3 + ) .

(15.5)

E. 15.17 Exerc´ıcio muito importante. Prove as rela¸co˜es acima.

6

Fora isso,

Vamos usar essas rela¸co˜es para provar v´arios fatos sobre os autovalores de L 2 e L3 . De (15.5) tem-se L− L+ ψl,m = [l(l + 1) − m(m + 1)]ψl,m = (l − m)(l + m + 1)ψl,m .

(15.6)

L+ L− ψl,m = [l(l + 1) − m(m − 1)]ψl,m = (l + m)(l − m + 1)ψl,m .

(15.7)

De (15.4) tem-se

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

817/1304

Assim, e

hψl,m , L− L+ ψl,m i = (l − m)(l + m + 1)kψl,m k2

(15.8)

hψl,m , L+ L− ψl,m i = (l + m)(l − m + 1)kψl,m k2 .

(15.9)

Por´em, como L∗± = L∓ , segue que

hψl,m , L− L+ ψl,m i = hL+ ψl,m , L+ ψl,m i ≥ 0

e

hψl,m , L+ L− ψl,m i = hL− ψl,m , L− ψl,m i ≥ 0.

Logo, conclu´ımos de (15.8) e de (15.9) que (l − m)(l + m + 1) ≥ 0,

(15.10)

(l + m)(l − m + 1) ≥ 0.

(15.11)

De (15.10), segue que a) l − m ≥ 0 e l + m + 1 ≥ 0, ou b) l − m ≤ 0 e l + m + 1 ≤ 0.

No caso b) se somarmos ambas as desigualdades teremos 2l + 1 ≤ 0. Isso ´e imposs´ıvel, pois l ≥ 0. Assim, vale a) que, em particular, diz que m ≤ l. Por (15.11), isso implica l + m ≥ 0, ou seja, m ≥ −l. Conclu´ımos ent˜ao que

−l ≤ m ≤ l.

(15.12)

Assim, para cada l, os valores de m n˜ao podem ser maiores que l nem menores que −l. Vamos agora provar a seguinte proposi¸ca˜o, que utilizaremos logo abaixo.

Proposi¸ c˜ ao 15.3 Seja ψl,m um autovetor de L2 e de L3 com autovalores l(l + 1) e m, respectivamente. Ent˜ ao se L+ ψl,m = 0 segue que m = l. Analogamente, se L− ψl,m = 0 segue que m = −l. 2 Prova. Se L+ ψl,m = 0 segue, evidentemente, que L− L+ ψl,m = 0. Por (15.6) isso implica (l − m)(l + m + 1) = 0. Assim, ou m = l ou m = −(l + 1). Esse u ´ ltimo caso ´e proibido por (15.12) e, portanto, m = l. Se L− ψl,m = 0 segue, evidentemente, que L+ L− ψl,m = 0. Por (15.7) isso implica (l + m)(l − m + 1) = 0. Assim, ou m = −l ou m = l + 1. Esse u ´ ltimo caso ´e proibido por (15.12) e, portanto, m = −l. Vamos agora prosseguir tentando estabelecer mais alguns fatos sobre os poss´ıveis valores de l e m. Usando as rela¸co˜es de comuta¸ca˜o entre L3 e L+ , ´e f´acil ver que L3 L+ ψl,m = [L3 , L+ ]ψl,m + L+ L3 ψl,m = (m + 1)L+ ψl,m . Analogamente, usando as rela¸co˜es de comuta¸ca˜o entre L3 e L− , tem-se L3 L− ψl,m = [L3 , L− ]ψl,m + L− L3 ψl,m = (m − 1)L− ψl,m . Essas duas rela¸co˜es dizem-nos que L± ψl,m ´e um autovetor de L3 com autovalor m ± 1. Note-se que, como L2 comuta com L± , tem-se tamb´em L2 L± ψl,m = l(l + 1)L± ψl,m . Assim, aplicar o operador L± a ψl,m aumenta (diminui) de uma unidade o autovalor de L3 sem alterar o de L2 .

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

818/1304

Percebemos disso que caso m = l teremos L3 L+ ψl, l = (l + 1)L+ ψl, l o que, em fun¸ca˜o de (15.12), s´o ´e poss´ıvel se L+ ψl, l = 0. Analogamente, caso m = −l teremos L3 L− ψl, −l = −(l + 1)L− ψl, −l o que, em fun¸ca˜o de (15.12), s´o ´e poss´ıvel se L− ψl, −l = 0. Junto com a Proposi¸ca˜o 15.3 isso conduz ao Corol´ ario 15.3 Seja ψl,m um autovetor n˜ ao-nulo de L2 e de L3 com autovalores l(l + 1) e m, respectivamente. Ent˜ ao tem-se L+ ψl,m = 0 se e somente se m = l. Analogamente, L− ψl,m = 0 se e somente se m = −l. 2 Precisamos mostrar que existem autovetores n˜ao-nulos de L3 com autovalores ±l. Certamente existe um autovetor n˜ao-nulo ψl,m para algum m satisfazendo (15.12). Pelo que vimos acima, Lp+ ψl,m ´e um autovetor de L3 com autovalor m + p. Suponhamos que m < l e seja p0 ≥ 0 o maior inteiro n˜ao-negativo tal que m + p0 ≤ l. Ent˜ao m + p0 + 1 > l, o que implica que 0 = Lp+0 +1 ψl,m = L+ Lp+0 ψl,m . Pelo corol´ario 15.3 isso implica que ou Lp+0 ψl,m ´e nulo ou ´e autovetor de L3 com autovalor l. Se p0 = 0 ent˜ao ψl,m 6= 0, por hip´otese. Se p0 > 0, ent˜ao, caso Lp+0 ψl,m = 0, concluir´ıamos tamb´em pelo corol´ario 15.3 que Lp+0 −1 ψl,m ´e autovetor n˜ao-nulo de L3 com autovalor l. A repeti¸ca˜o desse argumento conduz a` conclus˜ao que h´a um autovetor n˜ao-nulo de L3 com autovalor l. Analogamente, conclui-se que existe autovetor n˜ao-nulo de L3 com autovalor −l. Estamos agora preparados para chegar a uma importante conclus˜ao sobre os poss´ıveis valores de l, a saber, que l s´o pode assumir valores inteiros ou semi-inteiros.

Ao aplicarmos repetidamente o operador L+ , ao vetor n˜ao-nulo ψl,−l obtemos sucessivos vetores Lp+ ψl,−l com autovalores −l + p de L3 . Chegar´a um momento em que a desigualdade −l ≤ m ≤ l ser´a violada, ou seja, existe p tal que Lp+1 + ψl,−l seria o primeiro autovetor de L3 com autovalor maior que p l. Como isso ´e imposs´ıvel, segue que Lp+1 + ψl,−l = 0 e L+ ψl,−l deve ser autovetor de L3 com autovalor m´aximo l. Mas o autovalor de L3 em Lp+ ψl,−l ´e −l + p. Logo −l + p = l, ou seja, 2l = p. Como p ´e um n´ umero inteiro, segue que l ´e ou um inteiro (caso p seja par) ou um semi-inteiro (caso p seja ´ımpar). Como os autovalores m s˜ao da forma −l + p, para p inteiro, segue que m ser´a inteiro se l o for ou semi-inteiro, caso l o seja. A conclus˜ao importante ´e que os autovalores de L2 s˜ao n´ umeros da forma l(l + 1) com l ≥ 0 inteiro ou semi-inteiro. Cada representa¸ca˜o irredut´ıvel de SO(3) ´e caracterizada por um autovalor de L 2 e podemos, portanto, classificar as representa¸co˜es irredut´ıveis de SO(3) pelo ´ındice l: Π l . Esse fato ´e de grande importˆancia na F´ısica Quˆantica pois os n´ umeros l(l + 1) e m s˜ao associados aos autovalores dos 2 operadores de momento angular L e L3 . • Elementos de Matriz dos Geradores L1 , L2 e L3 ´ poss´ıvel fixar a forma dos geradores La em cada representa¸ca˜o irredut´ıvel Πl . Para isso, escolhemos E como base os 2l +1 vetores ψl,m com −l ≤ m ≤ l. Nessa base L3 ´e diagonal tendo elemento de matriz m na m-´esima posi¸ca˜o da diagonal. Para obter os elementos de matriz de L1 e L2 , obtemos primeiramente os elementos de matriz de L± . Os mesmos podem ser fixados a partir de (15.8)-(15.9), que nos dizem que, kL+ ψl,m k2 = (l − m)(l + m + 1) = [l(l + 1) − m(m + 1)] (15.13) e kL− ψl,m k2 = (l + m)(l − m + 1) = [l(l + 1) − m(m − 1)]

(15.14)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

819/1304

para kψl,m k = 1. Sabemos que L± ψl,m deve ser m´ ultiplo de ψl,m±1 . Com as rela¸co˜es acima, podemos convencionar (fixando os fatores de fase como sendo iguais a 1) p L+ ψl,m = l(l + 1) − m(m + 1) ψl, m+1 , p l(l + 1) − m(m − 1) ψl, m−1 . L− ψl,m = Isso fornece os elementos de matriz de L± na base ψl,m e com os mesmos podemos obter os elementos de matriz de L1 e L2 .

E. 15.18 Exerc´ıcio. Obtenha explicitamente as matrizes L1 , L2 e L3 nos casos l = 1/2, l = 1 e l = 3/2. No primeiro caso, obtˆem-se, a menos de um fator 1/2, as matrizes de Pauli. 6 Com as express˜oes acima,´e at´e mesmo  poss´ıvel escrever de modo mais expl´ıcito a forma das repre~ . senta¸co˜es Πl (R(θ, ~η)) = exp −iθ~η · L

15.3

A Medida de Haar

Seja G um grupo finito e seja f : G → uma fun¸ca˜o que a cada elemento g do grupo associa um n´ umero complexo f (g). Podemos definir a m´edia de f em G por µ(f ) :=

1 X f (g), #G g∈G

onde #G ´e o n´ umero de elementos de G. Essa no¸ca˜o de m´edia de uma fun¸ca˜o em um grupo finito possui algumas propriedades importantes. Seja h um elemento fixo mas arbitr´ario de G e definamos as fun¸co˜es fhe (g) := f (hg), fhd (g) := f (gh) e f i (g) = f (g −1 ). Ent˜ao vale que para qualquer h ∈ G µ(fhe ) = µ(fhd ) = µ(f i ) = µ(f ), ou seja, a m´edia ´e invariante por multiplica¸ca˜o a` direita ou a` esquerda por elementos de G ou pela invers˜ao do argumento de f . E. 15.19 Exerc´ıcio. Mostre isso.

6

Note-se tamb´em que a m´edia acima foi normalizada de modo que se f (g) = 1 para todo g ∈ G, ent˜ao µ(f ) = 1. Por fim, note-se tamb´em que a m´edia acima ´e positiva: se f ≥ 0 ent˜ao µ(f ) ≥ 0. Fora isso, se f ≥ 0 e µ(f ) = 0, ent˜ao f (g) = 0 para todo g ∈ G. Grupos finitos n˜ao s˜ao os u ´ nicos a possuir m´edias invariantes positivas. Vamos a alguns exemplos. Para o grupo SO(2) podemos definir 1 µ(f ) = 2π

Z



f (θ)dθ, 0

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

820/1304

´ f´acil ver que as propriedades de invariˆancia observadas no caso de grupos caso a integral seja finita. E finitos s˜ao v´alidas aqui tamb´em, inclusive a normaliza¸ca˜o e a positividade. Para o grupo ( , +) podemos definir Z 



µ(f ) =

f (x)dx,

−∞

caso a integral seja finita. Como se vˆe essa m´edia ´e positiva, invariante por transla¸co˜es f (x) → f (x + y) e pela troca do argumento da f por seu inverso: f (x) → f (−x), em analogia ao caso de grupos finitos. Note-se, por´em, que essa m´edia n˜ao pode ser normalizada, pois o grupo n˜ao ´e compacto. Outro exemplo ´e o grupo ( + , ·). Aqui a m´edia invariante ´e Z ∞ 1 µ(f ) = f (x) dx, x 0 

caso a integral seja finita. E. 15.20 Exerc´ıcio. f (1/x).

Mostre que essa m´edia ´e invariante por f (x) → f (xy), y ∈

Novamente, note-se que essa m´edia n˜ao ´e normalizada, pois 

+



+,

e por f (x) → 6

n˜ao ´e compacto.

Podemos nos perguntar, quais grupos possuem m´edias invariantes positivas como nos exemplos acima? Uma resposta parcial foi dada por Haar3 . O teorema de Haar afirma que se G ´e um grupo compacto ent˜ao existe uma medida de integra¸ca˜o dµ(g) em G, denominada medida de Haar, tal que se a m´edia Z µ(f ) = f (g)dµ(g) G

´e bem definida, ent˜ao tem-se Z Z Z Z f (g)dµ(g) = f (hg)dµ(g) = f (gh)dµ(g) = f (g −1 )dµ(g) G

G

G

G

R

para todo h ∈ G. ForaR isso, a m´edia ´e normalizada: G dµ(g) = 1 e positiva: se f ≥ 0 ent˜ao sendo que se f ≥ 0 e G f dµ = 0, ent˜ao f (g) = 0 para quase todo g ∈ G.

R

G

f dµ ≥ 0

O teorema de Haar pode ser parcialmente extendido para grupos localmente compactos (como ( , +) e ( + , ·)): Se G ´e localmente compacto existem medidas positivas de integra¸ca˜o dµe (g) e dµd (g) em G tais que Z Z Z e e f (g)dµ (g) = f (hg)dµ (g) = f (g −1 )dµe (g) 



G

e

Z

G

d

f (g)dµ (g) = G

Z

G

d

f (gh)dµ (g) = G

Z

f (g −1 )dµd (g), G

para quaisquer h ∈ G. Ou seja, existem uma medida invariante a` esquerda e uma outra invariante a` direita. Em alguns casos essas medidas coincidem (por exemplo, para grupos Abelianos), mas tal nem sempre ´e o caso para grupos n˜ao-Abelianos. Note que no caso de grupos compactos a medida 3

Alfr´ed Haar (1885-1933).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

821/1304

invariante a` esquerda e a medida invariante a` direita tamb´em coincidem. No caso de grupos localmente compactos nem sempre se pode normalizar as medidas invariantes. Na presente vers˜ao destas notas n˜ao iremos nos estender mais no estudo da medida de Haar. O estudante ´e convidado aqui a procurar os cl´assicos do assunto (p.e. “The Haar Measure”, de Leopoldo Nachbin4 ). Como veremos, a medida de Haar de grupos compactos desempenha um papel muito importante no estudo das representa¸co˜es desses grupos.

15.4

Representa¸ co ˜es de Grupos Compactos

Seja G um grupo compacto e seja dµ sua medida invariante. Vamos supor que Π seja uma representa¸ca˜o de G em um espa¸co vetorial complexo V no qual esteja definido um produto escalar h·, ·i. Com o uso de Π e dµ podemos definir em V um outro produto escalar h·, ·iG por Z hx, yiG := hΠ(g)x, Π(g)yi dµ(g), G

x, y ∈ V .

O fato importante sobre esse produto escalar ´e o seguinte: para todo h ∈ G e todo x, y ∈ V hΠ(h)x, Π(h)yiG = hx, yiG .

E. 15.21 Exerc´ıcio. Mostre isso.

6

No caso de V ser um espa¸co vetorial complexo de dimens˜ao finita, essa u ´ ltima igualdade afirma que cada Π(h) ´e um operador unit´ario em rela¸ca˜o ao produto escalar h·, ·iG . Como conseq¨ uˆencia, temos a seguinte

Proposi¸ c˜ ao 15.4 Toda representa¸ca ˜o de um grupo compacto em um espa¸co vetorial complexo de dimens˜ ao finita ´e equivalente a uma representa¸ca ˜o unit´ aria e, conseq¨ uentemente, ´e ou irredut´ıvel ou maximalmente redut´ıvel. 2 Mais forte ´e o seguinte teorema, que n˜ao provaremos aqui: Teorema 15.1 Toda representa¸ca ˜o de um grupo compacto ´e equivalente a uma soma direta de representa¸co ˜es irredut´ıveis de dimens˜ ao finita. Esse teorema nos diz que no caso de grupos compactos as representa¸co˜es irredut´ıveis de dimens˜ao finita s˜ao os tijolos com os quais se constroem todas as representa¸co˜es. Note-se que o teorema acima afirma que toda representa¸ca˜o de um grupo compacto Abeliano ´e equivalente a uma soma direta de representa¸co˜es de dimens˜ao 1. 4

Leopoldo Nachbin (1922-1993). Vide http://www.dmm.im.ufrj.br/doc/nachbin.htm

JCABarata. Curso de F´ısica-Matem´ atica

15.5

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

822/1304

O Teorema de Peter-Weyl

Um dos resultados mais profundos da teoria de representa¸co˜es de grupos compactos ´e um teorema sobre a ortogonalidade das representa¸co˜es irredut´ıveis unit´arias que em v´arios aspectos generaliza o c´elebre teorema de Fourier5 da An´alise Harmˆonica. Como veremos, esse teorema ´e tamb´em um corol´ario do Lema de Schur. • O Teorema de Peter-Weyl. Rela¸ co ˜es de Ortogonalidade Dentro da cole¸ca˜o de todas as representa¸co˜es unit´arias de dimens˜ao finita de um grupo compacto (ou finito) G podemos estabelecer uma rela¸ca˜o de equivalˆencia, como j´a observamos, dizendo que duas representa¸co˜es s˜ao equivalentes se possu´ırem um intertwiner invert´ıvel. Podemos tomar em cada classe um representante Πα e formar assim uma cole¸ca˜o {Πα , α ∈ Λ}, de todas as representa¸co˜es unit´arias de dimens˜ao finita n˜ao-equivalentes entre si do grupo compacto (ou finito) G. Acima Λ designa o conjunto de ´ındices que rotulam as representa¸co˜es. Cada Πα age em um espa¸co vetorial complexo Vα . No que segue designaremos por dα a dimens˜ao de Vα . O importante teorema de Peter6 e Weyl7 afirma que os elementos de matriz Πα (g)ij , i, j = 1, . . . , dα s˜ao ortogonais entre si em rela¸ca˜o ao produto escalar definido pela medida de Haar do grupo compacto (ou finito) G. Mais que isso, elas formam uma base ortogonal completa no espa¸co de Hilbert L 2 (G, dµ). Teorema 15.2 Seja {Πα , α ∈ Λ} a cole¸ca ˜o de todas as representa¸co ˜es unit´ arias irredut´ıveis de dimens˜ ao finita n˜ ao-equivalentes entre si de um grupo compacto (ou finito) G. Sejam Π α (g)ij , i, j = 1, . . . , dα seus elementos de matriz. Seja dµ a medida de Haar de G. Ent˜ ao Z 1 Πα (g)ij Πβ (g)kl dµ(g) = δαβ δik δjl . (15.15) dα G Por fim, as fun¸co ˜es Πα (g)ij , i, j = 1, . . . , dα formam uma base ortogonal completa no espa¸co de Hilbert L2 (G, dµ). Com isso, toda fun¸ca ˜o f ∈ L2 (G, dµ) pode ser escrita na forma f (g) =

dα X X

aαij Πα (g)ij ,

α∈Λ i, j=1

onde aαij

= dα

2

Z

Πα (g)ij f (g) dµ(g). G

Finalmente, para f ∈ L (G, dµ) vale a identidade de Parseval8 : Z

5

dα X 1 X α 2 a . |f (g)| dµ(g) = ij d α i, j=1 G α∈Λ 2

Jean Baptiste Joseph Fourier (1768-1830). F. Peter (?). 7 Hermann Klaus Hugo Weyl (1885-1955). 8 Marc-Antoine Parseval des Chˆenes (1755-1836). Parseval deduziu esta identidade no contexto das s´eries de Fourier, que correspondem aqui ao caso do grupo SO(2). 6

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

823/1304

2 As rela¸co˜es acima afirmam que as fun¸co˜es Πα (g)ij , i, j = 1, . . . , dα s˜ao ortogonais em rela¸ca˜o ao produto escalar R P definido pela medida de Haar. No caso de G ser um grupo finito devemos substituir 1 dµ → #G g∈G , de modo que, por exemplo, as rela¸co˜es de ortogonalidade ficam G 1 X α 1 Π (g)ij Πβ (g)kl = δαβ δik δjl . #G g∈G dα

Prova. Demonstraremos aqui as rela¸co˜es de ortogonalidade. Como veremos a prova das mesmas faz belo uso do Lema de Schur.  Seja E [i, j] a matriz dα × dβ tal que seu elemento de matriz ab seja E [i, j] ab = δia δjb . Aqui i ∈ {1, . . . , dα } e j ∈ {1, . . . , dβ }. Considere-se a matriz Z [i, j] A := Πα (g −1 ) E [i, j] Πβ (g) dµ(g) G

=

Z

Πα (g)∗ E [i, j] Πβ (g) dµ(g). G

Usando as propriedades de invariˆancia da medida dµ, ´e f´acil provar que Πα (h) A[i, j] = A[i, j] Πβ (h) para todo h ∈ G. (Exerc´ıcio!). Pelo Lema de Schur, ou A[i, j] = 0 ou A[i, j] ´e invert´ıvel. No caso de termos α 6= β, sabemos, por constru¸ca˜o, que Πα e Πβ s˜ao inequivalentes. Portanto, nesse caso temos for¸cosamente A[i, j] = 0. Isso obviamente implica que todos os elementos de matriz de A[i, j] s˜ao nulos, ou seja, XZ   [i, j] 0 = A = Πα (g)∗ak E [i, j] kl Πβ (g)lb dµ(g) ab G

k, l

=

XZ k, l

= =

Z

Z

G

G

Πα (g)∗ak δik δjl Πβ (g)lb dµ(g)

Πα (g)∗ai Πβ (g)jb dµ(g) Πα (g)ia Πβ (g)jb dµ(g).

G

Note que essa rela¸ca˜o vale para α 6= β mas i, j, a, b arbitr´arios. Isso provou (15.15) para α 6= β.

Vamos agora tratar o caso em que α = β. Nesse caso, como vimos Πα (h) A[i, j] = A[i, j] Πα (h) para todo h ∈ G. Aqui A[i, j] s˜ao matrizes dα × dα . Pelo Corol´ario 15.1, A[i, j] = λ[i, j] . Vamos determinar

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 15

Vers˜ ao de 29 de setembro de 2005.

824/1304

as constantes λ[i, j] . Por um lado, tomando-se o tra¸co de A[i, j] tem-se Tr(A[i, j] ) = dα λ[i, j] . Por outro lado, pela defini¸ca˜o de A[i, j] tem-se Z   [i, j] Tr A = Tr Πα (g −1 ) E [i, j] Πα (g) dµ(g) G

Z

=

Z

=

Tr Πα (g)Πα (g −1 ) E [i, j] G

G

= δij

 Tr E [i, j] dµ(g)

Z



dµ(g)

dµ(g) G

= δij ,  pois Tr E [i, j] = δij . Logo, Assim,

1 δij dα

λ[i, j] =

= A

[i, j]

=

Z

1 δij . dα

Πα (g)∗ E [i, j] Πα (g) dµ(g). G

Considerando-se o elemento de matriz ab de ambos os lados da u ´ ltima express˜ao, tem-se XZ  1 δij δab = Πα (g)∗ak E [i, j] kl Πα (g)lb dµ(g) dα k, l G =

XZ k, l

= =

Z

Z

G

G

Πα (g)∗ak δik δjl Πα (g)lb dµ(g)

Πα (g)∗ai Πα (g)jb dµ(g) Πα (g)ia Πα (g)jb dµ(g).

G

Isso prova (15.15) para α = β, completando a prova das rela¸co˜es de ortogonalidade. A demonstra¸ca˜o que as fun¸co˜es Πα (g)ij formam uma base ortogonal completa em L2 (G, dµ) n˜ao ser´a apresentada na presente vers˜ao destas notas. As demais afirma¸co˜es s˜ao conseq¨ uˆencia das rela¸co˜es de ortogonalidade.

• Car´ ateres e Fun¸ co ˜es Centrais

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

825/1304

Dada uma representa¸ca˜o Π de dimens˜ao finita de um grupo G, define-se o car´ ater de Π como sendo a fun¸ca˜o χΠ (g) := Tr (Π(g)) , g∈G Um fato relevante sobre car´ateres ´e a seguinte identidade:    χΠ (hgh−1 ) = Tr Π(hgh−1 ) = Tr Π(h)Π(g)Π(h−1 ) = Tr Π(h−1 )Π(h)Π(g) = Tr (Π(g)) = χΠ (g)

para quaisquer g, h ∈ G. Isso sugere a seguinte defini¸ca˜o: uma fun¸ca˜o f : G → ´e dita ser central se f (g) = f (hgh−1 ) para todos g, h ∈ G. Equivalentemente, podemos definir fun¸co˜es centrais como sendo as fun¸co˜es tais que f (gh) = f (hg) para todos g, h ∈ G. E. 15.22 Exerc´ıcio. Mostre a equivalˆencia dessas defini¸co˜es.

6

Car´ateres s˜ao fun¸co˜es centrais. Das rela¸co˜es (15.15), tomando-se i = j, k = l e somando-se nesses ´ındices, obtˆem-se facilmente que os car´ateres χα das representa¸co˜es irredut´ıveis unit´arias de dimens˜ao finita Πα satisfazem as seguintes rela¸co˜es de ortogonalidade: Z χα (g)χβ (g) dµ(g) = δαβ . G

E. 15.23 Exerc´ıcio. Verifique.

6

Como conseq¨ uˆencia do Teorema de Peter-Weyl podemos igualmente provar que os car´ateres das representa¸co˜es irredut´ıveis unit´arias de dimens˜ao finita formam uma base ortogonal no espa¸co de Hilbert das fun¸co˜es centrais de quadrado integr´avel de um grupo finito ou compacto. N˜ao apresentaremos a demonstra¸ca˜o aqui. Notemos apenas que no caso do grupo SO(2) os car´ateres das representa¸co˜es irredut´ıveis unit´arias de dimens˜ao finita s˜ao χp (θ) = eipθ , p ∈ . Assim, a afirma¸ca˜o de acima, que os car´ateres formam uma base no espa¸co das fun¸co˜es centrais de quadrado integr´avel, ´e nesse contexto um bem conhecido resultado da teoria das s´eries de Fourier. • Classe de Conjuga¸ c˜ ao Seja G um grupo. Podemos estabelecer uma rela¸ca˜o de equivalˆencia em G da seguinte forma. Se x, y ∈ G, dizemos que x ∼ y se existir algum elemento h ∈ G tal que x = hyh−1 . E. 15.24 Exerc´ıcio. Verifique que isso, de fato, define uma rela¸c˜ao de equivalˆencia.

6

As classes de equivalˆencia de G por essa rela¸ca˜o s˜ao denominadas classe de conjuga¸ca ˜o, ou classes de elementos conjugados. E. 15.25 Exerc´ıcio. Verifique que a identidade ´e o u ´nico elemento de sua classe de equivalˆencia.

6

O fato importante sobre fun¸co˜es centrais e classes conjugadas ´e a seguinte afirma¸ca˜o: toda fun¸ca˜o central de um grupo G ´e constante nas classes conjugadas de G. A prova ´e elementar: se x, y pertencem a` mesma classe ent˜ao existe h tal que x = hyh−1 . Logo, f (x) = f (hyh−1 ) = f (y).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 15

Vers˜ ao de 29 de setembro de 2005.

826/1304

Assim, para determinar uma fun¸ca˜o central, como um car´ater de uma representa¸ca˜o, por exemplo, basta determinar seus valores nas classes de conjuga¸ca˜o. Essa observa¸ca˜o desempenhar´a um papel abaixo. • Car´ ateres de Grupos Finitos Car´ateres desempenham um papel especial no caso de grupos finitos. Se G ´e finito, as rela¸co˜es de ortogonalidade acima ficam 1 X α χ (g)χβ (g) = δαβ . (15.16) #G g∈G No caso e grupos finitos os car´ateres possuem uma propriedade de ortogonalidade adicional que ´e muito u ´ til no estudo de propriedades desses grupos. Vamos apresent´a-la. Se f ´e uma fun¸ca˜o central de um grupo finito, ent˜ao f ´e automaticamente de quadrado integr´avel (pois o grupo ´e finito) e, pelo teorema de Peter-Weyl, podemos escrevˆe-la como X f (h) = cα χα (h), α∈Λ

onde cα =

1 X α χ (g)f (g). #G g∈G

Como tanto χα quanto f s˜ao constantes nas classes de equivalˆencia Ck , k = 1, . . . , K, de G, podemos escrever essa u ´ ltima express˜ao como K



1 X = (#Ck )χα (Ck )f (Ck ), #G k=1

onde #Ck ´e o n´ umero de elementos do grupo que pertencem a` classe Ck e f (Ck ) ´e o valor de f em Ck . Assim, K X 1 X (#Ck )χα (Ck )f (Ck )χα (h) f (h) = #G α∈Λ k=1

"

K X

#Ck X α = f (Ck ) χ (Ck )χα (h) #G α∈Λ k=1 Tomando h ∈ Cj , teremos

#

"

# #Ck X α f (Cj ) = f (Ck ) χ (Ck )χα (Cj ) . #G α∈Λ k=1 K X

Como f ´e arbitr´aria, segue que 

#Ck #G

X α∈Λ

χα (Ck )χα (Cj ) = δjk .

(15.17)

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 15

827/1304

Essa rela¸ca˜o de ortogonalidade especial tem v´arias conseq¨ uˆencias relevantes para o estudo de representa¸co˜es irredut´ıveis unit´arias de grupos finitos. Uma delas ´e a seguinte: Proposi¸ c˜ ao 15.5 Se G ´e um grupo finito, o n´ umero de representa¸co ˜es irredut´ıveis unit´ arias de G ´e igual ao n´ umero de de classes de conjuga¸ca ˜o de G. 2 Prova. Seja G um grupo finito e Ck , k = 1, . . . , K suas classes de conjuga¸ca˜o. Sabemos que as fun¸co˜es centrais s˜ao constantes nas classes de conjuga¸ca˜o e, portanto, vale para toda fun¸ca˜o central f a seguinte identidade K X f (g) = fk δCk (g), k=1

onde fk ´e o valor que f assume em Ck e

δCk (g) :=



1, se g ∈ Ck 0, se g 6∈ Ck

.

Isso significa que o espa¸co vetorial C(G) das fun¸co˜es centrais de G tem uma base formada pelas fun¸co˜es δCk , k = 1, . . . , K, e, portanto, tem dimens˜ao K. Por (15.16) as fun¸co˜es χα , α ∈ Λ, formam uma base ortogonal no espa¸co C(G). Portanto, o n´ umero #Λ de representa¸co˜es irredut´ıveis de G ´e menor ou igual a` dimens˜ao de C(G), que ´e K, como acabamos de ver: #Λ ≤ K.

Por outro lado, (15.17) diz-nos que o espa¸co vetorial de todas as fun¸co˜es Λ → , o qual tem dimens˜ao #Λ (por que?), possui um conjunto de K fun¸co˜es ortogonais, a saber, as fun¸co˜es hk (α) = χα (Ck ), α ∈ Λ. Logo, K ≤ #Λ. Isso completa a prova que K = #Λ ` luz desta proposi¸ca˜o podemos rescrever (15.17) como A   K #Ck X a χ (Ck )χa (Cj ) = δjk . #G a=1

(15.18)

j, k = 1, . . . , K.

Outra conseq¨ uˆencia de (15.18) ´e a seguinte. Tomando-se Cj = Ck = C1 , onde C1 ´e a classe de conjuga¸ca˜o da identidade, a qual s´o possui um elemento, conclu´ımos que K X

d2a = #G,

(15.19)

a=1

a

a

pois χ (C1 ) = Tr(Π (e)) = da .

Essa curiosa express˜ao nos mostra uma rela¸ca˜o entre as dimens˜oes das representa¸co˜es irredut´ıveis de G e a ordem de G. Em muitos casos ´e poss´ıvel extrair informa¸co˜es sobre as representa¸co˜es irredut´ıveis do grupo a partir da mesma. Isso pois (15.19) n˜ao pode ser satisfeita por quaisquer n´ umeros inteiros K, da e #G. Por exemplo, um grupo que possua 6 elementos e 3 classes de conjuga¸ca˜o s´o pode ter duas representa¸co˜es irredut´ıveis unidimensionais e uma bidimensional, pois 6 = 12 + 12 + 22 e n˜ao h´a outra forma de escrever o n´ umero 6 como soma de trˆes quadrados. Esse, ali´as, ´e precisamente o caso do grupo de permuta¸co˜es de 3 elementos, S3 , o qual possui 6 elementos e 3 classes de conjuga¸ca˜o (identifique-as!).

Parte V Topologia Geral, Teoria da Medida e Integra¸c˜ ao

828

Cap´ıtulo 16 Espa¸cos M´ etricos Conte´ udo 16.1 M´ etricas e Espa¸ cos M´ etricos . . . . . . . . . . . . . . . . . . . . . . . . . . . 831 16.2 Topologia de Espa¸ cos M´ etricos . . . . . . . . . . . . . . . . . . . . . . . . . 845 16.3 Pseudo-M´ etricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 848 16.4 Espa¸ cos de Banach e de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . 850 16.4.1 Espa¸cos de Seq¨ uˆencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 852 16.A Algumas Desigualdades B´ asicas . . . . . . . . . . . . . . . . . . . . . . . . . 866 16.B N´ umeros reais e p-´ adicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 868 16.C Aproxima¸ co ˜es para π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 875

odos estamos familiarizados com a no¸ca˜o usual e intuitiva de distˆancia entre pontos da reta real , do plano bidimensional 2 ou do espa¸co tridimensional 3 . O estudante h´a de reconhecer que boa parte do material tratado em cursos de c´alculo de fun¸co˜es de uma ou v´arias vari´aveis, reais ou complexas, como as no¸co˜es de deriva¸ca˜o e integra¸ca˜o, assenta-se sobre no¸co˜es como as de convergˆencia e limite, as quais, por suas vez, assentam-se sobre a no¸ca˜o intuitiva de distˆancia entre pontos. Assim, por exemplo, dizemos que uma seq¨ uˆencia xn de pontos na reta real converge a um ponto x se a distˆancia |xn − x| entre xn e x torna-se menor e menor a` medida que n cresce. Mais adiante faremos essas id´eias mais precisas e gerais. 





Ao longo do seu desenvolvimento, especialmente ap´os o s´eculo XIX, a Matem´atica reconheceu a importˆancia de abstrair e generalizar a no¸ca˜o intuitiva de distˆancia de modo a aplic´a-la a outros tipos de conjuntos que n˜ao os familiares espa¸cos de dimens˜ao finita , 2 ou 3 . Esse desenvolvimento conduziu a`s no¸co˜es de m´etrica, de espa¸cos m´etricos e de espa¸cos m´etricos completos, as quais definiremos mais adiante, e permitiu aplicar muitas das no¸co˜es geom´etricas e instrumentos anal´ıticos, originalmente desenvolvidos em espa¸cos mais familiares, para conjuntos menos acess´ıveis a` intui¸ca˜o, como por exemplo espa¸cos vetoriais de dimens˜ao infinita, tais como espa¸cos de fun¸co˜es ou de seq¨ uˆencias. Uma importante aplica¸ca˜o dessas id´eias e no¸co˜es a` teoria das equa¸co˜es diferenciais e integrais ser´a vista no Cap´ıtulo 17, quando trataremos do Teorema do Ponto Fixo de Banach. 





Lembramos ao estudante que o estudo de espa¸cos de dimens˜ao infinita n˜ao ´e uma mera abstra¸ca˜o desprovida de uso ou interesse pr´atico. Ao se decompor uma fun¸ca˜o f , cont´ınua, diferenci´avel e peri´odica de per´ıodo 2π, em sua s´erie de Fourier1 , f (t) =

∞ X

n=−∞ 1

Jean Baptiste Joseph Fourier (1768-1830).

829

eint an √ 2π

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 16

830/1304

tal como ocorre, por exemplo, no problema da corda vibrante, o que estamos fazendo ´e precisamente expressar uma tal fun¸ca˜o em termos de componentes em uma base de um espa¸co de dimens˜ao infinita, eint no caso a base formada pelas infinitas fun¸co˜es √ com n ∈ . 2π

Para o estudo de espa¸cos de dimens˜ao infinita, como o desse exemplo, seria muito importante se pud´essemos reter algumas das no¸co˜es geom´etricas familiares em espa¸cos de dimens˜ao finita. O emprego de id´eias geom´etricas an´alogas a`quelas encontradas nos espa¸cos , 2 ou 3 ´e de grande importˆancia na tarefa de explorar espa¸cos de dimens˜ao infinita, como o espa¸co das fun¸co˜es cont´ınuas peri´odicas de per´ıodo 2π, justamente por trazerem tais espa¸cos para mais perto da nossa intui¸ca˜o. Por raz˜oes evolutivas, o c´erebro humano s´o ´e capaz de produzir e desenvolver imagens em uma, duas ou trˆes dimens˜oes e, portanto, para o estudo de espa¸cos com mais dimens˜oes faz-se necess´ario dispor de instrumentos abstratos que permitam desenvolver racioc´ınios o mais pr´oximo poss´ıvel daqueles empregados em espa¸cos de dimens˜ao 1, 2 ou 3. 





Devido a`s bem-conhecidas “rela¸co˜es de ortogonalidade” Z 2π 1 ei(n−m)t dt = δn, m 2π 0 sabemos que, as constantes an da decomposi¸ca˜o de Fourier acima s˜ao dadas por Z 2π −int e √ f (t) dt , an = 2π 0 e podem ser interpretadas geometricamente como as proje¸co˜es, ou componentes, da fun¸ca˜o f na −int “dire¸ca˜o” das fun¸co˜es e√2π . (A no¸ca˜o de proje¸ca˜o, ou componente, de um vetor ´e familiar em 2 ou em 3 ). Como ´e bem sabido (para a teoria das s´eries de Fourier, vide [33]), vale tamb´em a rela¸ca˜o, conhecida como Identidade de Parseval2 , v s u ∞ Z 2π u X 2 |an |2 . |f (t)| dt = t 



0

n=−∞

Sendo o lado direito a raiz quadrada da soma do quadrado das componentes ortogonais de f , podemos interpretar o lado esquerdo como o “m´odulo” ou “comprimento” da fun¸ca˜o f (entendida como vetor no espa¸co de dimens˜ao infinita das fun¸co˜es peri´odicas de per´ıodo 2π), tal como no Teorema de Pit´agoras 3 em 2 ou 3 . 



Se levada adiante, essa analogia geom´etrica nos permite definir uma poss´ıvel no¸ca˜o de distˆ ancia entre duas fun¸co˜es cont´ınuas peri´odicas f e g, que denotaremos por4 d2 (f, g), como o m´odulo (ou “comprimento”) da diferen¸ca entre duas fun¸co˜es, tal como se faz em espa¸cos de dimens˜ao finita: s Z 2π d2 (f, g) := |f (t) − g(t)|2 dt . 0

2

Marc-Antoine Parseval des Chˆenes (1755-1836). Pit´ agoras de Samos (ci. 569 A.C. - ci. 475 A.C.). 4 A raz˜ ao de empregarmos o sub-´ındice “2” na defini¸ca ˜o de d2 (f, g) ser´ a esclarecida mais adiante.

3

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 16

831/1304

Com esse instrumento em m˜aos podemos agora empregar conceitos como o de convergˆencia e limite de seq¨ uˆencias no espa¸co de dimens˜ao infinita das fun¸co˜es cont´ınuas peri´odicas e, eventualmente, prosseguir desenvolvendo em tais espa¸cos outros ingredientes do C´alculo e da An´alise. Para implementar tais desenvolvimentos, vamos no presente cap´ıtulo introduzir algumas importantes no¸co˜es gerais, como as de m´etrica, de espa¸co m´etrico, de seq¨ uˆencias de Cauchy em espa¸cos m´etricos, de completamento de espa¸cos m´etricos e de topologia de espa¸cos m´etricos, no¸co˜es essas que provaram ser de grande importˆancia na tarefa de levar os instrumentos familiares de abordagem matem´atica de espa¸cos de dimens˜ao finita a espa¸cos de dimens˜ao infinita e outros.

16.1

M´ etricas e Espa¸ cos M´ etricos

• M´ etricas Uma quest˜ao importante que se coloca ´e a de identificar quais propriedades b´asicas a no¸ca˜o intuitiva de distˆancia possui para permitir seu emprego em v´arias instˆancias. O desenvolvimento da Matem´atica conduziu a uma identifica¸ca˜o desses ingredientes em um conjunto de quatro propriedades, as quais resumem tudo o que ´e essencialmente necess´ario na demonstra¸ca˜o de resultados nos quais a no¸ca˜o de distˆancia ´e empregada. Surgiu da identifica¸ca˜o dessas propriedades a no¸ca˜o matem´atica de m´etrica, a qual abstrai e generaliza a no¸ca˜o intuitiva de distˆancia. Vamos a essa defini¸ca˜o. Seja X um conjunto (entendido doravante como n˜ao-vazio). Uma fun¸ca˜o d : X × X → ser uma m´etrica em X se possuir as seguintes propriedades: 

´e dita

1. Positividade: d(a, b) ≥ 0 para todos a, b ∈ X. 2. Condi¸ca˜o de distˆancia nula: d(a, b) = 0 se e somente se a = b. 3. Simetria: para todos a e b ∈ X vale d(a, b) = d(b, a). 4. Desigualdade triangular: para todos a, b e c ∈ X vale d(a, b) ≤ d(a, c) + d(c, b). A quarta propriedade acima ´e particularmente importante e ´e denominada desigualdade triangular devido a seu significado geom´etrico nos espa¸cos 2 e 3 com a m´etrica usual. (Justifique!) 



As quatro propriedades listadas acima s˜ao aquelas identificadas como essenciais na no¸ca˜o intuitiva de distˆancia e qualquer fun¸ca˜o d que as satisfa¸ca, ou seja, qualquer m´etrica, pode potencialmente ser empregada como equivalente a` no¸ca˜o intuitiva de distˆancia. Um ponto importante da defini¸ca˜o de m´etrica ´e a condi¸ca˜o que afirma que d(x, y) = 0 se e somente se x e y forem iguais. Compare com a defini¸ca˜o de pseudo-m´etrica a` p´agina 848. Mencionamos en passant que a condi¸ca˜o de positividade acima ´e, em verdade, conseq¨ uˆencia da desigualdade triangular e da condi¸ca˜o de simetria. De fato, usando essas duas condi¸co˜es, pode-se provar o seguinte fato mais forte: para todos x, y, z ∈ M vale d(x, y) ≥ |d(x, z) − d(z, y)|,

(16.1)

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 16

Vers˜ ao de 29 de setembro de 2005.

832/1304

o que, em particular, garante que d(x, y) ≥ 0. Para provar isso, note-se que pela desigualdade triangular d(x, z) ≤ d(x, y) + d(y, z). Logo, d(x, y) ≥ d(x, z) − d(y, z).

(16.2)

Trocando-se x por y e usando-se a condi¸ca˜o de simetria, obtemos tamb´em d(x, y) = d(y, x) ≥ d(y, z) − d(x, z).

(16.3)

Ambas as rela¸co˜es (16.2) e (16.3) dizem que d(x, y) ≥ |d(x, z) − d(y, z)|, como quer´ıamos mostrar.

O exemplo mais b´asico de uma m´etrica ´e oferecido, no caso X = , pela fun¸ca˜o d(x, y) = |y − x|, x, y ∈ . Outro exemplo essencialmente idˆentico em X = , ´e oferecido pela fun¸ca˜o d(z, w) = |z − w|, z, w ∈ . Essas s˜ao as chamadas m´etricas usuais em e , respectivamente. Deixamos ao leitor a tarefa simples de verificar que essas fun¸co˜es satisfazem a defini¸ca˜o de m´etrica. 





• Espa¸ cos m´ etricos e outros exemplos b´ asicos Se X ´e um conjunto e d ´e uma m´etrica em X, dizemos que o par (X, d) ´e um espa¸co m´etrico. Ou seja, um espa¸co m´etrico vem a ser um conjunto munido de uma m´etrica. Nota. A no¸ca˜o de Espa¸co M´etrico foi introduzida por Fr´echet5 em sua disserta¸ca˜o de 1906. A express˜ao “espa¸co m´etrico”, no entanto, n˜ao foi sua inven¸ca˜o, tendo sido cunhada por Hausdorff 6 em 1914. Como mencionamos, as quatro propriedades requeridas na defini¸ca˜o de m´etrica, acima, foram enunciadas sob inspira¸ca˜o do exemplo familiar do pr´oximo exerc´ıcio. p Verifique que a fun¸c˜ao d2 (x, y) := (y1 − x1 )2 + · · · + (yn − xn )2 , onde x = E. 16.1 Exerc´ıcio. 6 (x1 , . . . , xn ) e y = (y1 , . . . , yn ), ´e uma m´etrica em n (chamada de m´etrica Euclidiana). 

´ importante que o estudante familiarize-se desde cedo com o fato que um conjunto X pode ter E v´arias m´etricas. O exemplo anterior e os dois abaixo ilustram isso.

E. 16.2 Exerc´ıcio. Verifique que a fun¸c˜ao d∞ (x, y) := max{|y1 − x1 |, . . . , |yn − xn |}, onde x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ), ´e uma m´etrica em n . 6 

E. 16.3 Exerc´ıcio. Verifique que a fun¸c˜ao d1 (x, y) := |y1 − x1 | + · · · + |yn − xn |, onde x = (x1 , . . . , xn ) 6 e y = (y1 , . . . , yn ), ´e uma m´etrica em n . 

Mais adiante mostraremos que todas as fun¸co˜es dp (x, y) := [|y1 − x1 |p + · · · + |yn − xn |p ]1/p , com p ≥ 1 s˜ao m´etricas em

n 

.

Uma caracter´ıstica importante da no¸ca˜o abstrata de m´etrica ´e que a mesma aplica-se tamb´em a espa¸cos outros que n˜ao os familiares espa¸cos n . Os exerc´ıcios abaixo ilustram isso no caso do conjunto X = C0 ([0, 1]), que vem a ser o conjunto das fun¸co˜es cont´ınuas reais definidas no intervalo [0, 1]. 

5 6

Maurice Ren´e Fr´echet (1878-1973). Fr´echet tamb´em introduziu a no¸ca ˜o de compacidade. Felix Hausdorff (1868-1942).

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 16

Vers˜ ao de 29 de setembro de 2005.

833/1304

E. 16.4 Exerc´ıcio. Seja X = C0 ([0, 1]) o conjunto de todas as fun¸co˜es reais cont´ınuas definidas em [0, 1]. Considere a seguinte fun¸c˜ao d∞ : X × X → : 

d∞ (f, g) = sup |f (x) − g(x)|. x∈[0, 1]

Mostre que d∞ uma m´etrica em X.

6

E. 16.5 Exerc´ıcio. Seja X = C0 ([0, 1]) o conjunto de todas as fun¸co˜es reais cont´ınuas definidas em [0, 1]. Considere a seguinte fun¸c˜ao d1 : X × X → : Z 1 d1 (f, g) = |f (x) − g(x)| dx. 

0

Mostre que d1 uma m´etrica em X.

6

E. 16.6 Exerc´ıcio. Seja X = C0 ([0, 1]) o conjunto de todas as fun¸co˜es reais cont´ınuas definidas em [0, 1]. Considere a seguinte fun¸c˜ao d2 : X × X → : s Z 1 d2 (f, g) = |f (x) − g(x)|2 dx. 

0

Mostre que d2 uma m´etrica em X.

6

Mais adiante mostraremos que em C0 ([0, 1]) todas as fun¸co˜es dp (f, g) =

Z

1 p

0

|f (x) − g(x)| dx

1/p

.

com p ≥ 1 s˜ao igualmente m´etricas. • Seq¨ uˆ encias Antes de prosseguirmos, lembremos uma defini¸ca˜o b´asica. Se X ´e um conjunto, uma fun¸ca˜o a : → X ´e dita ser uma seq¨ uˆencia em X. Como ´e familiar ao estudante, o valor de a em n ∈ ´e freq¨ uentemente denotado por an ao inv´es de a(n). Analogamente, uma seq¨ uˆencia a : → X ´e freq¨ uentemente denotada por {an }n∈ , por {an , n ∈ }, ou ainda, com um certo abuso de linguagem, simplesmente por an . Essa u ´ ltima nota¸ca˜o ´e, talvez, a mais freq¨ uente, mas pode, em certas ocasi˜oes, causar alguma confus˜ao pois, como mencionamos, a n designa, estritamente falando, o valor de a em n, n˜ao a seq¨ uˆencia toda. 









Vamos agora introduzir v´arias no¸co˜es fundamentais, as quais provˆem de defini¸co˜es bem conhecidas no contexto da reta real. • Sub-seq¨ uˆ encias

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 16

834/1304

Seja X um conjunto e seja a : → X uma seq¨ uˆencia em X. Seja tamb´em κ : → uma fun¸ca˜o estritamente crescente (ou seja, k(m) < k(n) se m < n). Ent˜ao a ◦ κ : → X ´e dita ser uma subseq¨ uˆencia de a. 







• Convergˆ encia em espa¸ cos m´ etricos Seja (X, d) um espa¸co m´etrico. Dizemos que uma seq¨ uˆencia a em X converge para um elemento x ∈ X em rela¸ca˜o a` m´etrica d se para todo  > 0 existir um n´ umero natural N () (eventualmente dependente de ) tal que d(x, an ) <  para todo n > N (). A seguinte proposi¸ca˜o ´e fundamental, pois nos diz que, em um espa¸co m´etrico, uma seq¨ uˆencia, se for convergente, s´o pode convergir a um ponto: Proposi¸ c˜ ao 16.1 Seja (X, d) um espa¸co m´etrico e seja b uma seq¨ uˆencia em X. Suponha que b converge a um elemento x ∈ X e a um elemento y ∈ X. Ent˜ ao x = y. 2 Prova. Pela desigualdade triangular, temos que d(x, y) ≤ d(x, bn ) + d(bn , y) para qualquer n. Agora, como b converge a x sabemos que, para qualquer  > 0 teremos d(x, b n ) <  para todo n grande o suficiente, ou seja, para todo n maior que um certo inteiro Nx (). Analogamente, como bn converge a y sabemos que, para qualquer  > 0 teremos d(y, bn ) <  para todo n grande o suficiente, ou seja, para todo n maior que um certo inteiro Ny (). Assim, para todo n maior que max{Nx (), Ny ()} teremos d(x, y) < 2. Ora, como  ´e um n´ umero positivo arbitr´ario, uma tal desigualdade s´o pode ser v´alida se d(x, y) = 0. Como d ´e uma m´etrica, isso implica x = y. O estudante pode constatar que a demonstra¸ca˜o acima faz uso de todas as propriedades definidoras da no¸ca˜o de m´etrica, o que ilustra a importˆancia de no¸co˜es abstratas como aquela. Um pouco de nota¸ca˜o. Se uma seq¨ uˆencia a em X converge a x ∈ X em rela¸ca˜o a` m´etrica d ent˜ao x ´e dito ser o d-limite de a, ou simplesmente o limite de a, se a m´etrica d estiver subentendida. Denotamos esse fato escrevendo x = d−lim an , ou simplesmente x = lim an (se a m´etrica d estiver subentendida). n→∞ n→∞

d

Outra nota¸ca˜o freq¨ uentemente empregada para dizer que x ´e o d-limite de a ´e a n −→ x. • Seq¨ uˆ encias de Cauchy Seja um espa¸co m´etrico X com uma m´etrica d. Uma seq¨ uˆencia a de elementos de X ´e dita ser 7 uma seq¨ uˆencia de Cauchy em rela¸ca˜o a` m´etrica d se para todo  > 0 existir um n´ umero natural N () (eventualmente dependente de ) tal que d(ai , aj ) <  para todo i e j tais que i > N () e j > N (). A seguinte proposi¸ca˜o ´e fundamental: Proposi¸ c˜ ao 16.2 Seja um espa¸co m´etrico X com uma m´etrica d e seja b uma seq¨ uˆencia convergente em rela¸ca ˜o a ` m´etrica d a um elemento x ∈ X. Ent˜ ao b ´e uma seq¨ uˆencia de Cauchy em rela¸ca ˜o a ` m´etrica d. 7

Augustin Louis Cauchy (1789-1857).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 16

835/1304

Prova. Sejam m e n arbitr´arios. Pela desigualdade triangular, vale d(bn , bm ) ≤ d(bn , x) + d(x, bm ). Agora, como b converge a x sabemos que para todo  > 0 teremos d(bn , x) < /2 e d(bm , x) < /2 desde que ambos m e n sejam maiores que algum N (/2). Nesse caso, ent˜ao, d(bn , bm ) ≤ /2 + /2 = . Isso completa a prova. Uma quest˜ao de fundamental importˆancia que agora se coloca ´e a seguinte: ser´a v´alida a rec´ıproca da proposi¸ca˜o acima, ou seja, ser´a toda seq¨ uˆencia de Cauchy em um espa¸co m´etrico uma seq¨ uˆencia convergente? A importˆancia dessa quest˜ao ´e a seguinte. Dada uma seq¨ uˆencia concreta x n em um espa¸co m´etrico X, n˜ao sabemos a priori se xn convergir´a ou n˜ao a menos que encontremos um elemento x em X com a propriedade desejada (para todo  > 0, existe N () tal que d(xn , x) <  sempre que n > N ()). Nem sempre pode ser f´acil ou poss´ıvel encontrar explicitamente tal x, e gostar´ıamos de possuir um crit´erio baseado apenas em propriedades verific´ aveis da seq¨ uˆencia x n que nos permita dizer se ela converge ou n˜ao. A propriedade de uma seq¨ uˆencia ser de Cauchy ´e uma propriedade cuja validade ou n˜ao depende apenas da seq¨ uˆencia e, portanto, em face a` Proposi¸ca˜o 16.2, ´e um o´timo candidato a ser um tal crit´erio de convergˆencia. Sucede, por´em, que, em geral, a resposta a` pergunta acima ´e negativa: existem espa¸cos m´etricos nos quais h´a seq¨ uˆencias de Cauchy que n˜ao convergem. Isso ´e ilustrado pelos seguintes exemplos. Considereumeros racionais e adotemos em a m´etrica usual: d(r, s) = |r − s|, com se o conjunto X = dos n´ r, s ∈ . H´a, sabidamente, exemplos de seq¨ uˆencias de que s˜ao de Cauchy em rela¸ca˜o a` m´etrica d que convergem em . Um exemplo ´e encontrado no exerc´ıcio seguinte. E. 16.7 Exerc´ıcio. Seja r um n´umero racional com r > 1. Prove que a seq¨uˆencia de n´umeros racionais n X 1 r sn = , ´ e uma seq¨ u ˆ e ncia de Cauchy e que a mesma converge ao n´ u mero racional , n ∈ 6 a r r − 1 a=0 

O ponto, por´em, ´e que h´a tamb´em exemplos de seq¨ uˆencias de que s˜ao de Cauchy em rela¸ca˜o a` m´etrica d mas que n˜ ao convergem em . Um exemplo famoso, e que pode ser tratado com detalhe, ´e o da seq¨ uˆencia 1 1 1 , sn = 1 + + + · · · + 1! 2! n! que ´e uma seq¨ uˆencia de Cauchy de racionais, mas que n˜ ao converge a um n´ umero racional 8 . Tratamos esse exemplo com detalhe no pr´oximo t´opico. A leitura do mesmo pode ser dispensada pelo estudante j´a familiarizado com esses fatos, mas pode ser instrutiva para os demais. Por um teorema de Lambert 9 (vide [55]), sabe-se que se r ´e um n´ umero racional n˜ao-nulo ent˜ao er n˜ao ´e racional. Assim, as seq¨ uˆencias r r2 rn de racionais sn = 1 + 1! + 2! + · · ·+ n! convergem a irracionais. Analogamente, esse teorema de Lambert P∞ (−1)n rn+1 implica que ln(r) n˜ao pode ser racional se r o for, Assim, para −1 < r < 1, a s´erie n=0 n+1 converge ao irracional ln(1 + r). P k Outro exemplo ´e a seq¨ uˆencia pn = 4 nk=0 (−1) , que converge ao irracional π. Uma prova que π ´e 2k+1 irracional pode ser encontrada em [123] ou em [55]. Vide p´agina 42 para mais coment´arios. Para uma 8

O estudante bem sabe que essa seq¨ uˆencia converge no conjunto dos reais ao n´ umero e. Abaixo provaremos que esse n´ umero n˜ ao ´e racional. 9 Johann Heinrich Lambert (1728-1777).

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 16

836/1304

breve discuss˜ao sobre aproxima¸co˜es para π recheada de digress˜oes hist´oricas, vide Se¸ca˜o 16.C, p´agina 875. Esses exemplos, que est˜ao longe de ser u ´ nicos, ilustram um fato muito importante: existem espa¸cos m´etricos nos quais n˜ao vale a rec´ıproca da Proposi¸ca˜o 16.2, ou seja, existem espa¸cos m´etricos nos quais seq¨ uˆencias de Cauchy n˜ao s˜ao necessariamente convergentes. De grande importˆancia s˜ao os espa¸cos m´etricos onde vale a rec´ıproca da Proposi¸ca˜o 16.2. Tais espa¸cos m´etricos s˜ao denominados completos e deles falaremos no p´os-pr´oximo t´opico, a` p´agina 838. • O n´ umero e ´ e um n´ umero irracional Seja a seq¨ uˆencia de n´ umeros racionais 1 1 1 + +···+ , 1! 2! n! Vamos provar que essa seq¨ uˆencia ´e de Cauchy em rela¸ca˜o a` m´etrica usual em converge a um n´ umero racional. sn = 1 +

, mas que a mesma n˜ao

Primeiro provemos que esta seq¨ uˆencia ´e de Cauchy. Vamos supor j > i. Como a seq¨ uˆencia s n ´e crescente, segue que d(si , sj ) = |si − sj | = sj − si (por que?). Temos, ent˜ao, d(si , sj ) = sj − si = 1 = (i + 1)! 1 ≤ (i + 1)!
0. (i + 1)! i + 1 (i + 1)!

(16.4)

2 pode ser feito arbitrariamente pequeno tomando-se i grande, fica provado que (i + 1)! a seq¨ uˆencia sn ´e de Cauchy. Como o n´ umero

E. 16.8 Exerc´ıcio. Justifique cada passagem acima.

6

Vamos agora provar que essa seq¨ uˆencia n˜ao converge a um n´ umero racional. Para isso vamos supor o contr´ario e constatar que isso leva a um absurdo. Vamos ent˜ao supor que a seq¨ uˆencia converge a um racional e. Como e ´e suposto ser racional, e seria da forma e = p/q onde p e q s˜ao n´ umeros inteiros primos entre si. Da desigualdade triangular segue que d(e, si ) ≤ d(si , sj ) + d(e, sj )
0, desde que j seja escolhido grande o suficiente (pois sj converge a e). Assim, como a desigualdade vale para qualquer  > 0, conclu´ı-se que d(e, si ) ≤

2 . (i + 1)!

Como si ´e uma seq¨ uˆencia crescente e si 6= sj para i 6= j, segue que d(e, si ) = e − si . Logo, 0 < e − si = e, portanto,

p 2 − si ≤ q (i + 1)!

2 p ≤ si + q (i + 1)! . Para i = 2 a rela¸ca˜o (16.5) fica (verifique!) si
1.

Os primeiros s˜ao B0 = 1, B1 = −1/2, B2 = 1/6, B4 = −1/30, B6 = 1/42, B8 = −1/30. O leitor interessado poder´a encontrar mais detalhes sobre os fatos acima envolvendo n´ umeros de Bernoulli em v´arios textos, por exemplo em [123] e [33]. Nesse u ´ ltimo texto, a rela¸ca˜o (16.C.10) ´e provada usando s´eries de Fourier. Como os termos da s´erie do lado esquerdo de (16.C.10) decaem muito rapidamente quando n → ∞, exceto o termo com k = 1, inferimos que π = lim

n→∞



(−1)n+1 (2n)! 22n−1 B2n

 2n1

.

7. Aproxima¸ca˜o de Ramanujan48 para π, de 191449 : π = lim

n→∞

9.801 √

8

n X k=0

(4k)! [1.103 + 26.390 k] (k!)4 3964n

.

√ Devido a` presen¸ca do fator 8, esta n˜a√ o ´e uma aproxima¸ca˜o a π por racionais. Isso, por´em, pode ser facilmente√ remediado substituindo 8 acima por an , sendo an alguma seq¨ uˆencia de racionais aproximando 8. 1 , onde n→∞ pn

8. Aproxima¸ca˜o de Borwein e Borwein50 para π, de 1987: π = lim

pn

h “ ”i √ √ n (−1)k (6k)! 212.175.710.912 61 + 1.657.145.277.365 + k 13.773.980.892.672 61 + 107.578.229.802.750 X := 12 . h “ √ ”i3k+3/2 k=0 (k!)3 (3k)! 5.280 236.674 + 30.303 61

√ umero Aqui aplica-se o mesmo coment´ario de acima: devido a` presen¸ca do n´ umero 61 e do n´ √ 3/2  , a aproxima¸ca˜o acima n˜ao ´e uma aproxima¸ca˜o a π por racionais. 5.280 236.674 + 30.303 61 Isso, por´em, pode ser remediado substituindo esses n´ umeros por aproxima¸co˜es racionais. A aproxima¸ca˜o de Borwein e Borwein converge a π de modo impressionantemente r´apido. J´a a primeira aproxima¸ca˜o, 1/p0 , fornece corretamente os primeiros 24 d´ıgitos de π na base decimal! Cada termo seguinte da seq¨ uˆencia acrescenta aproximadamente 25 d´ıgitos corretos ao valor de π na 48

Srinivasa Aiyangar Ramanujan (1887-1920). A aproxima¸ca ˜o de Ramanujan surgiu em “Modular Equations and Approximations to π”. S. Ramanujan. The Quarterly Journal of Pure and Applied Mathematics. 45, 350-372 (1914). 50 Jonathan M. Borwein e Peter B. Borwein s˜ ao irm˜ aos. Para mais detalhes sobre seu trabalho sobre a aproxima¸ca ˜o de π, vide “Pi and the AGM. A Study in Analytic Number Theory and Computational Complexity”. Jonathan M. Borwein e Peter B. Borwein. Editora John Willey and Sons. inc. 1986. 49

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Cap´ıtulo 16

880/1304

base decimal. No caso da aproxima¸ca˜o de Ramanujan a convergˆencia ´e um pouco mais lenta: cada termo da seq¨ uˆencia acrescenta aproximadamente 8 d´ıgitos corretos ao valor de π na base decimal. As aproxima¸co˜es de Wallis e Gregory s˜ao extremamente lentas. Usando-as, um super-computador do in´ıcio dos anos 1990 levaria cerca de 100 anos para computar apenas os primeiros 100 d´ıgitos corretos de π na base decimal. A aproxima¸ca˜o de Borwein e Borwein baseia-se em trabalhos de Ramanujan sobre as chamadas equa¸co˜es modulares. A f´ormula de Machin (e ligeiras variantes da mesma) converge mais rapidamente que as de Wallis e Gregory (por que?) e foi usada desde o s´eculo XVIII at´e a d´ecada de 1970 para c´alculos de π (manuais ou com computadores). Em 1844, Dase51 calculou corretamente, usando a f´ormula de Machin, as primeiras 205 casas decimais de π. O c´alculo foi feito a` m˜ao (!) e durou alguns meses. O feito de Dase foi superado em 1853 por Shanks52 , que calculou 607 casas decimais de π. O c´alculo tamb´em foi feito a` m˜ao e custou-lhe alguns anos de trabalho. Infelizmente, por´em, Shanks cometeu erros que resultaram em que seus u ´ ltimos 80 d´ıgitos estavam incorretos. Isso s´o foi percebido 92 anos depois (!), em 1946, por Ferguson, que computou corretamente os primeiros 620 d´ıgitos decimais de π. Com o advento dos computadores eletrˆonicos tais c´alculos deixaram de ser feitos por meios romˆanticos. Em 1987, usando a aproxima¸ca˜o de Borwein e Borwein, π foi calculado por um super-computador com uma precis˜ao de cem milh˜oes de casas decimais. Essa precis˜ao foi aumentada desde ent˜ao. Em 1999, π era conhecido com 3 × 236 = 206.158.430.208 (cerca de duzentos bilh˜oes) de d´ıgitos decimais. O feito ´e de Y. Kanada e D. Takahashi. Este ainda ´e o recorde atual (2003) e foi alcan¸cado com dois algoritmos distintos (para compara¸ca˜o), o dos irm˜aos Borwein e outro denominado Gauss-Legendre. O primeiro consumiu 46 horas de computa¸ca˜o em um super-computador e o segundo 37 horas. Em 1996 Bailey, Borwein e Plouffe publicaram um algoritmo que permite determinar o n-´esimo d´ıgito hexadecimal de π sem o conhecimento dos precedentes. Em 1997 Plouffe descobriu um algoritmo para determinar o n-´esimo d´ıgito de π em qualquer base. Outras informa¸co˜es hist´oricas, especialmente sobre esses desenvolvimentos mais recentes, podem ser encontradas em “The quest for Pi”, de D. H. Bailey, J. M. Borwein, P. B. Borwein e S. Plouffle. The Mathematical Intelligencer 19, 50-57 (1997). Ainda que no passado a determina¸ca˜o de valores aproximados de π tivesse importˆancia em a´reas como a F´ısica, a Astronomia e a Engenharia, dificilmente c´alculos ultra-precisos de π podem ter relevˆancia em aplica¸co˜es: com apenas 37 d´ıgitos decimais ´e poss´ıvel computar o per´ımetro de um c´ırculo com o raio do universo conhecido (cerca de 1, 3 × 1026 m) com uma precis˜ao equivalente ao diˆametro do um a´tomo de hidrogˆenio (cerca de 1, 0 × 10−10 m). H´a, por´em, um certo interesse matem´atico em tais c´alculos, envolvendo conjecturas sobre a distribui¸ca˜o dos d´ıgitos decimais de π. Valores precisos de π s˜ao tamb´em u ´ teis em simula¸co˜es num´ericas. Ainda assim, hoje em dia a pr´atica de c´alculos ultra-precisos de π tem motiva¸ca˜o predominantemente esportiva.

51 52

Zacharias Dase (1824-1861). Willian Shanks (1812-1882).

Cap´ıtulo 17 O Teorema do Ponto Fixo de Banach e Algumas de Suas Conseq¨ uˆ encias Conte´ udo 17.1 O Teorema de Ponto Fixo de Banach . . . . . . . . . . . . . . . . . . . . . 882 17.1.1 Aplica¸ca˜o a Equa¸co˜es Num´ericas. O M´etodo de Newton . . . . . . . . . . . . 884 17.1.2 Uma Generaliza¸ca˜o do Teorema de Ponto Fixo de Banach . . . . . . . . . . . 888 17.2 As Equa¸ co ˜es Integrais de Fredholm e de Volterra . . . . . . . . . . . . . . 889 17.3 Aplica¸ co ˜es a ` Teoria das Equa¸ co ˜es Diferenciais Ordin´ arias . . . . . . . . . 897 17.3.1 O Teorema de Picard-Lindel¨of

. . . . . . . . . . . . . . . . . . . . . . . . . . 897

17.3.2 Generalizando o Teorema de Picard-Lindel¨of. Solu¸co˜es Globais . . . . . . . . 902 17.3.3 Um Teorema de Compara¸ca˜o de Solu¸co˜es de EDO’s . . . . . . . . . . . . . . 903 17.4 O Teorema da Fun¸ ca ˜o Impl´ıcita e o Teorema da Fun¸ ca ˜o Inversa . . . . . 907 17.4.1 O Teorema da Fun¸ca˜o Impl´ıcita . . . . . . . . . . . . . . . . . . . . . . . . . . 907 17.4.2 O Teorema da Fun¸ca˜o Inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . 912 17.A O Lema de Gr¨ onwall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 913

eja X um conjunto qualquer e f : X → X uma fun¸ca˜o de X em X. Muitas vezes, em problemas pr´aticos e te´oricos, estamos interessados em encontrar os pontos x que s˜ao levados em si mesmos pela fun¸ca˜o f , ou seja, os pontos x tais que x = f (x). Os pontos que satisfazem essa equa¸ca˜o s˜ao chamados de pontos fixos da transforma¸ca˜o f e a equa¸ca˜o acima ´e denominada equa¸ca ˜o de ponto fixo. Veremos v´arios exemplos abaixo de equa¸co˜es desse tipo, tanto no contexto de equa¸co˜es num´ericas quanto no de equa¸co˜es integrais e diferenciais. Na pr´atica, dada uma fun¸ca˜o f , pode afigurar-se dif´ıcil saber se sequer existe um ponto fixo para ela. Muitas vezes estamos interessados em saber quantos pontos fixos h´a e, freq¨ uentemente, gostar´ıamos de garantir que h´a um e apenas um ponto fixo de uma dada fun¸ca˜o (a chamada “unicidade da solu¸ca˜o”). Teoremas que nos garantem existˆencia e, por vezes, unicidade de solu¸co˜es de equa¸co˜es de ponto fixo s˜ao chamados de teoremas de ponto fixo. H´a v´arios teoremas de tal tipo na literatura matem´atica, como por exemplo, o Teorema de Ponto Fixo de Banach1 , o Teorema de Ponto Fixo Brouwer2 , o teorema do ponto fixo de Schauder3 e v´arios outros, todos com pressupostos distintos sobre o conjunto X e sobre a fun¸ca˜o f . 1

Stefan Banach (1892-1945). Luitzen Egbertus Jan Brouwer (1881-1966). 3 Juliusz Pawel Schauder (1899-1943).

2

881

JCABarata. Curso de F´ısica-Matem´ atica

Vers˜ ao de 29 de setembro de 2005.

Seja por exemplo o disco fechado Dn de n :  Dn := (x1 , . . . , xn ) ∈

Cap´ıtulo 17

882/1304





n

q  2 2 x1 + · · · + x n ≤ 1 .

O chamado Teorema do Ponto Fixo de Brouwer afirma que toda fun¸ca˜o cont´ınua (na topologia usual) de Dn em Dn tem pelo menos um ponto fixo. Aqui a unicidade nem sempre pode ser garantida: pense no exemplo das rota¸co˜es em 3 em torno de um eixo que passa pela origem. Todo ponto ao longo do eixo de rota¸ca˜o ´e levado em si mesmo pela rota¸ca˜o e ´e, portanto, um ponto fixo da mesma. 

O Teorema do Ponto Fixo de Schauder afirma que se X ´e um subconjunto convexo e compacto de um espa¸co de Banach ent˜ao toda fun¸ca˜o cont´ınua (na topologia da norma) de X em X tem um ponto fixo. Aqui trataremos de um teorema de ponto fixo extremamente u ´ til conhecido como Teorema de Ponto Fixo de Banach, que funciona em espa¸cos m´etricos completos. De fato, este ´e de longe o teorema de ponto fixo com mais aplica¸co˜es pr´aticas, sendo que sua influˆencia se estende aos dom´ınios das equa¸co˜es integrais, das equa¸co˜es diferenciais, das equa¸co˜es num´ericas em , da An´alise Num´erica e de muitas outras a´reas da Matem´atica pura e aplicada. Uma das raz˜oes de sua importˆancia reside no fato de o Teorema de Ponto Fixo de Banach fornecer, junto com seu enunciado, um m´etodo aproximativo para a determina¸ca˜o do ponto fixo, m´etodo este que ´e muito eficiente. Vamos ao seu enunciado.

17.1

O Teorema de Ponto Fixo de Banach

Teorema 17.1 (Teorema de Ponto Fixo de Banach) Seja M um conjunto dotado de uma m´etrica d e suponha M completo em rela¸ca ˜o a d. Seja A um subconjunto fechado de M e seja T uma fun¸ca ˜o de A em A, T : A → A. Vamos ent˜ ao supor que exista um n´ umero q com 0 ≤ q < 1 tal que para todos os pontos x e y de A valha d(T (x), T (y)) ≤ q d(x, y). (17.1) Ent˜ ao, a equa¸ca ˜o de ponto fixo x = T (x),

(17.2)

tem solu¸ca ˜o em A e essa solu¸ca ˜o ´e u ´nica. Al´em disso, para qualquer x 0 ∈ A, a seq¨ uˆencia xn = T (xn−1 ), n ≥ 1, obtida aplicando-se repetidamente T a partir de x0 , converge (rapidamente) ao ponto fixo x na m´etrica d. A saber, tem-se que qn d(xn , x) ≤ d(x1 , x0 ). (17.3) 1−q 2 Uma fun¸ca˜o T : A → A tal que existe um n´ umero q com 0 ≤ q < 1 e tal que para todos os pontos x e y de A valha a desigualdade (17.1) ´e dita ser uma contra¸ca˜o. O teorema acima afirma ent˜ao que toda contra¸ca˜o em um espa¸co m´etrico completo tem um e somente um ponto fixo. Esse teorema fornece um m´etodo iterativo de determinar aproximadamente o ponto fixo, sendo que, por (17.3), a aproxima¸ca˜o ´e tanto melhor quanto mais itera¸co˜es forem feitas.

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 17

Vers˜ ao de 29 de setembro de 2005.

883/1304

Vamos primeiro provar o teorema e depois veremos v´arios exemplos de seu uso. Prova do Teorema 17.1. Como A ´e um subconjunto fechado de um espa¸co m´etrico completo, ent˜ao A ´e tamb´em completo em rela¸ca˜o a` mesma m´etrica (vide Proposi¸ca˜o 18.7, p´agina 937). Para simplificar a nota¸ca˜o denotaremos por T n a n-´esima composi¸ca˜o de T consigo mesma: T · · ◦ T}. | ◦ ·{z

Definimos ent˜ao para um x0 ∈ A arbitr´ario xn = T n (x0 ), n ∈

n



, n > 0.

Vamos agora provar que {xn } ´e uma seq¨ uˆencia de Cauchy em A. Para isso sejam m e n dois n´ umeros naturais quaisquer tais que m < n. Ent˜ao, usando a desigualdade triangular n − m vezes temos o seguinte: d(xm , xn ) ≤ d(xm , xm+1 ) + d(xm+1 , xn ) ≤ d(xm , xm+1 ) + d(xm+1 , xm+2 ) + d(xm+2 , xn ) .. . ≤ d(xm , xm+1 ) + d(xm+1 , xm+2 ) + · · · + d(xn−1 , xn ). Pela propriedade de contra¸ca˜o, temos que d(xa , xa+1 ) = d(T (xa−1 ), T (xa )) ≤ q d(xa−1 , xa ) ≤ · · · ≤ q a d(x0 , x1 ). Da´ı d(xm , xn ) ≤

e, portanto, d(xm , xn ) ≤ q

m

1+q +...+q

n−1−m

 q m + q m+1 + . . . + q n−1 d(x0 , x1 ) 

d(x0 , x1 ) ≤ q

m

∞ X a=0

q

a

!

d(x0 , x1 ) =

qm d(x0 , x1 ). 1−q

Isso prova que {xn } ´e uma seq¨ uˆencia de Cauchy, pois q m pode ser feito arbitrariamente pequeno tomando m grande, para qualquer n > m. Como {xn } ´e uma seq¨ uˆencia de Cauchy em A e A ´e completo, deve haver x em A u ´ nico ao qual a seq¨ uˆencia converge. Temos sempre, usando a desigualdade triangular, que d(x, xm ) ≤ d(x, xn ) + d(xn , xm ). Tomando n > m, temos

qm d(x, xm ) ≤ d(x, xn ) + d(x0 , x1 ). 1−q Como xn se aproxima de x para n grande, podemos fazer o termo d(x, xn ) arbitrariamente pequeno, tomando n grande, sem alterar os demais. Da´ı, conclu´ımos que d(x, xm ) ≤

qm d(x0 , x1 ). 1−q

(17.4)

Essa u ´ ltima desigualdade mostra que xm de fato se aproxima exponencialmente r´apido de x. Vamos agora provar que x, o limite da seq¨ uˆencia {xn }, ´e um ponto fixo. Para isso calculemos d(x, T (x)). Teremos, pela desigualdade triangular d(x, T (x)) ≤ d(x, xm+1 ) + d(xm+1 , T (x)),

JCABarata. Curso de F´ısica-Matem´ atica

Cap´ıtulo 17

Vers˜ ao de 29 de setembro de 2005.

884/1304

para todo m. Usando (17.4) e a contratividade de T teremos, d(x, T (x))