Dove va la matematica

927 127 5MB

Italian Pages 316 Year 1994

Polecaj historie

Dove va la scienza? La questione del realismo 8822001893

Una quindicina di scienziati e filosofi italiani interessati a discipline diverse presentano le loro opinioni sul proble

176 46 117MB Read more

Dove va la scienza? La questione del realismo

200 67 10MB Read more

Dove va l'America 9788815286567, 9788815361332

Un declino economico ormai riconosciuto, una situazione sociale difficile che fa prevedere nuove tensioni e forse anche

159 33 2MB Read more

Ipermodernità. Dove va la narrativa contemporanea 9788815251688, 9788815321282

Che cosa sta accadendo nella narrativa contemporanea? Possiamo ancora leggerla con le categorie elaborate dal postmodern

132 32 681KB Read more

Dove va la Russia? Dal comunismo al panslavismo

196 12 10MB Read more

Partita a tre. Dove va l'economia del mondo 9788815292582, 9788815369130

Punto a capo. L'economia mondiale scrive una nuova pagina. La posta in gioco è molto alta. Che ruolo avranno l'

153 43 1MB Read more

Il mare in un imbuto. Dove va la lingua italiana 8806200445, 9788806200442

"Che lingua fa", dove sta andando l'italiano? Come si parla, come si scrive? Si governa male la sintassi,

404 100 345KB Read more

Dove va la cultura europea? Relazione sulle cose di Ginevra 9788874624171

"È ingenuità riunire un congresso sullo "spirito europeo" per poi consigliargli di espungere la politica

370 106 97KB Read more

La matematica in Platone

660 29 13MB Read more

La matematica come resistenza

Albert Lautman traccia in questi tre testi minori, scritti in occasione dei due Congrès de philosophie scientifique (193

451 5 734KB Read more

Dove va la matematica

Author / Uploaded
Keith Devlin

Table of contents :
Dove va la matematica......Page 1
Colophon......Page 6
Indice......Page 7
Fonti delle figure......Page 9
Ringraziamenti......Page 10
Prefazione......Page 11
Il più grande numero primo del mondo......Page 15
Numeri primi......Page 16
I test di primalità......Page 20
I numeri primi di Mersenne......Page 24
Scomposizione in fattori......Page 27
I numeri di Fermat......Page 29
Una mente matematica strabiliante......Page 32
Numeri perfetti......Page 33
Codici segreti......Page 36
Nuovi orizzonti......Page 43
Il metodo assiomatico......Page 44
Un esempio: gli interi......Page 47
Consistenza, completezza, verità......Page 49
I teoremi di incompletezza di Gödel......Page 51
La teoria assiomatica degli insiemi......Page 52
Insiemi infiniti......Page 56
I transfiniti e il problema del continuo di Cantor......Page 60
Il teorema di Cantor......Page 63
Le notevoli proprietà del numero 163......Page 68
I primi sistemi numerici......Page 73
I numeri negativi......Page 75
I numeri reali......Page 76
I numeri complessi......Page 78
I quaternioni......Page 83
Gli interi di Gauss......Page 84
Il problema del numero di classi......Page 85
La bellezza in matematica......Page 90
Quanto è lunga la linea costiera della Gran Bretagna?......Page 92
Nuove dimensioni......Page 96
Alla scoperta di un nuovo mondo......Page 101
Ordine e caos......Page 102
Gli insiemi di Julia......Page 108
L’insieme di Mandelbrot......Page 110
Il teorema enorme......Page 117
Évariste Galois......Page 118
La simmetria......Page 122
Il concetto di gruppo......Page 124
Altri esempi di gruppi......Page 132
I gruppi semplici......Page 137
Il problema della classificazione......Page 140
Le diciotto famiglie e i gruppi sporadici......Page 142
Una breve rassegna storica......Page 149
Le equazioni diofantee e l’algoritmo euclideo......Page 151
Algoritmi e macchine di Turing......Page 154
Insiemi calcolabili......Page 157
Il decimo problema di Hilbert......Page 162
I conigli di Fibonacci e la risoluzione di Matjasevic......Page 165
La matematica con il calcolatore diventa adulta......Page 169
Il problema di Guthrie......Page 171
Mappe, grafi e topologia......Page 174
La formula di Eulero......Page 179
Il teorema di de Morgan......Page 182
Il teorema dei cinque colori......Page 183
Il metodo di Kempe......Page 188
La formula di Heawood......Page 190
Verso il teorema dei quattro colori......Page 192
Il metodo della carica di Heesch......Page 194
La dimostrazione del teorema dei quattro colori......Page 196
Il problema più famoso della matematica......Page 199
Le terne pitagoriche......Page 203
Il caso n=4......Page 205
Il caso n=3......Page 210
Altri due casi: n = 5 e n = 7......Page 212
Gli interi ciclotomici e l’annuncio di Lamé......Page 213
Kummer e i numeri ideali......Page 215
I numeri primi regolari......Page 216
La situazione attuale......Page 218
Il futuro......Page 221
Un argomento complesso......Page 223
Divertimenti con i numeri......Page 227
Il più importante tra i problemi irrisolti......Page 229
L’ipotesi di Riemann......Page 235
La congettura di Mertens......Page 238
La congettura di Bieberbach......Page 244
Boy scout, fisici, e un altro libro......Page 251
Cos’è la topologia?......Page 252
Come si fa topologia?......Page 258
Topologia dei nodi......Page 261
Oltre la superficie......Page 272
La congettura di Poincaré......Page 279
La teoria delle varietà......Page 281
Ancora algoritmi......Page 286
Il problema del commesso viaggiatore......Page 290
P e NP......Page 292
Ritorno alla realtà: la programmazione lineare......Page 296
Letture di approfondimento......Page 303
Indice dei nomi......Page 307
Indice analitico......Page 311

Citation preview

Saggi scientifici

Keith Devlin

Dove va la matematica

Bollati Boringhieri

Prima edizione marzo 1 9 94 © 1 9 9 4 Bollati Boringhieri editore s.r. l . , Torino, corso Vittorio Emanuele 86 I diritti di memorizzazione elettronica, di riproduzione e di adattamento totale o parziale con qualsiasi mezzo (compresi i microfilm e le copie fotostatiche) sono riservati Stampato in Italia dalla Stampatre di Torino CL 6 1 -980 1 -5 ISBN 88-339-08 4 0-2

Titolo originale Mathematics: The New Golden Age Penguin Books 1 988 © 1988 Keith Devlin Traduzione di Annarosa Giannetti e Agnese Manassero

Indice

7

Fonti delle figure

8

Ringraziamenti

9

Prefazione

Dove va la matematica IJ

r.

Numeri primi, scomposizione in fattori e codici segreti Il più grande numero primo del mondo, 13 Numeri primi, 14 I test di pri malità, 18 I numeri primi di Mersenne, 2 2 Scomposizione in fattori, 2 5 I numeri di Fermat, 27 Una mente matematica strabiliante, 30 Numeri perfetti, 3 1 Codici segreti, 3 4

4I

2.

Gli insiemi, l'infinito e la non-decidibilità Nuovi orizzonti, 41 Il metodo assiomatico, 4 2 Un esempio: gli interi, 45 Consistenza, completezza, verità, 47 I teoremi di incompletezza di Godei, 49 La teoria assiomatica degli insiemi, 5 0 Insiemi infiniti, 54 I transfiniti e il problema del continuo di Cantor, 58 Il teorema di Cantor, 6 1

66

3.

I sistemi numerici e il problema del numero di classi La soluzione di un problema che ha 1 80 anni, 66 Le notevoli proprietà del nu mero 1 63 , 66 I primi sistemi numerici, 71 I numeri negativi, 73 I numeri reali, 74 I numeri complessi, 76 I quaternioni, Br Gli interi di Gauss, 82 Il problema del numero di classi, 83

88

4.

Bellezza dal caos La bellezza in matematica, 88 Quanto è lunga la linea costiera della Gran Bre tagna?, 90 Nuove dimensioni, 94 Alla scoperta di un nuovo mondo, 99 Ordine e caos, r oo Gli insiemi di Julia, 1 05 L'insieme di Mandelbrot, 1 08

II5

5·

I gruppi semplici É variste Galois, I I6 Il teorema enorme, I I 5 La simmetria, I 20 Il concetto di gruppo, I 2 2 Altri esempi di gruppi, I 3 0 I gruppi semplici, I 3 5 I l problema della classificazione, I 3 8 L e diciotto famiglie e i gruppi spora dici, I 40

r47

6 . Il decimo problema di Hilbert Una breve rassegna storica, I 4 7 Le equazioni diofantee e l'algoritmo eucli deo, I 49 Algoritmi e macchine di Turing, I 5 2 Insiemi calcolabili, I 5 5 I l decimo problema d i Hilbert, I 6o I conigli d i Fibonacci e l a risoluzione di Matjasevic, I 63

r67

7.

Il problema dei quattro colori La matematica con il calcolatore diventa adulta, I 6 7 Il problema di Guth rie, I 69 Mappe, grafi e topologia, I 7 2 La formula di Eulero, I 7 7 Il teo rema di de Morgan, I 8o Il teorema dei cinque colori, I 8 I Il metodo di Kempe, I 86 La formula di Heawood, I 88 Verso il teorema dei quattro colori, I 90 Il metodo della carica di Heesch, I 9 2 La dimostrazione del teorema dei quattro colori, I 94

I97

8. L'ultimo teorema di Fermat Il problema più famoso della matematica, I97 Le terne pitagoriche, 20I Il caso n=4, 203 Il caso n= 3, 208 Altri due casi: n= 5 e n = 7 , 2 I O Gli interi ciclotomici e l' annuncio di Lamé, 2 rr Kummer e i numeri ideali, 2 I 3 I numeri primi regolari, 2 I 4 La situazione attuale, 2 I 6 Il futuro, 2 I 9

22r

9 · Problemi difficili sui numeri complessi Un argomento complesso, 2 2 I Divertimenti con i numeri, 225 tante tra i problemi irrisolti , 227 L'ipotesi di Riemann, 2 3 3 tura d i Mertens, 2 3 6 L a congettura d i Bieberbach, 242

249

I O.

Il più impor La conget-

Nodi e altre questioni topologiche Boy scout, fisici, e un altro libro , 249 Cos'è la topologia?, 2 5 0 Come si fa topologia?, 2 56 Topologia dei nodi, 2 5 9 Oltre la superficie, 2 70 La congettura di Poincaré, 2 7 7 La teoria delle varietà, 279

284

I I.

L'efficienza degli algoritmi Ancora algoritmi, 284 Il problema del commesso viaggiatore, 288 Ritorno alla realtà: la programmazione lineare, 293

30r

Letture di approfondimento

305

Indice dei nomi

30 9

Indice analitico

P e NP, 290

Fonti delle figure

Figure 4 . 1 , 4 . 1 0-4 . 1 6: H. O. Peitgen e P. H Richter, La bellezza dei frattali, Bollati Boringhieri, Torino 1 987 . Figure 4 . 2 , 4 . 3 : B. Mandelbrot , Fractals: Form, Chance and Dimension, W. H. Freeman and Co. , New York 1 9 7 7 . Figura 4 . 7 : L. M. Blumenthal e K . Menger, Studies i n Geometry, W. H . Freeman and Co. , New York 1 970. Figure 7·4 e 7 . 1 : « Scientific American>>, W. H . Freeman and Co., New York. Figura 1 0 . 1 0 : Cordon Art BV.

RINGRAZIAMENTI

Come tutti i matematici d ' oggi, posso definirmi esperto in un' area minima di un campo vasto e in continuo sviluppo . Quindi, nel tentativo di offrire un rendiconto esauriente, son dovuto ricorrere all ' aiuto di altri studiosi per eliminare gli errori inevitabilmente presenti nella prima stesura. I miei rin graziamenti spettano perciò a Sir Michael Atiyah, Amanda Chetwynd, David Nelson, S tephen Power, Hermann te Riele, Morwen Thistlethwaite e David Towers, che hanno letto tutto o parte del manoscritto e mi hanno dato pre ziosi suggerimenti. Grazie anche alla Penguin Books che fin dall ' inizio ha dimostrato vivo interesse per quello che poteva sembrare un compito impos sibile, la compilazione di un testo « divulgativo » sulla materia più impene trabile concepita dall' uomo. Eventuali omissioni ed errori sono imputabili esclusivamente a me .

Prefazione

Al giorno d'oggi, la matematica sembra attraversare una nuova età dell'oro. «Nuova», certo; ma quale è stata la prima? Forse il periodo degli antichi geometri greci intorno al3oo a. C.? O piuttosto il secolo XVII, quando Newton e Leibniz sviluppavano il calcolo infinitesimale e Fermat lavorava alla teoria dei numeri? O forse la carriera matema tica di Gauss da sola (r7n-r855) merita il titolo di età dell'oro. O, più tardi ancora, lo merita il periodo che vide il lavoro di Riemann, Poincaré, Hilbert e altri. Effettivamente, tra la metà dell'Ottocento e l'inizio della seconda guerra mondiale la produzione matematica fu veramente portentosa. Come per qualsiasi altro settore della ricerca umana, non è possi bile stabilire in modo categorico quale sia stato il «periodo più grande». Ogni generazione costruisce sul lavoro delle precedenti, e si può dire che la nostra epoca è erede di tutta la ricerca matematica del passato. Nell'Annuario internazionale dei matematici compaiono circa 2 5 500 nomi di matematici professionisti di tutto il mondo, il che rappresenta solo una piccola parte del numero reale, senza contare poi la schiera dei «dilettanti» (alcuni dei quali hanno comunque fatto scoperte signifi cative). Stando a questi dati (criterio peraltro poco attendibile, poi ché, soprattutto in matematica, quantità e qualità non sono necessa riamente sinonimi), la nostra dovrebbe essere una nuova età dell'oro. Il mio intento è quello di far conoscere ai non addetti ai lavori, che pure abbiano un qualche interesse a questi problemi, gli sviluppi più recenti nel campo della matematica. Per ragioni di spazio ho dovuto essere molto rigoroso nella scelta degli argomenti. Innanzitutto mi sono limitato alle vicende dei venticinque anni che vanno dal r96o al r985,

IO

PREFAZIONE

con maggior attenzione alla seconda parte di questo periodo. Poiché il libro è destinato a un vasto pubblico, ho trattato solo argomenti che hanno meritato l'attenzione della stampa mondiale e che meglio si prestano alla divulgazione. Naturalmente, le scelte sono state anche condizionate dai miei gusti e preferenze personali. Al lettare si richiede solo interesse e un po ' di pazienza: capire la matematica, anche a livello superficiale, richiede tempo. Inevitabil mente, alcune parti saranno più facilmente comprese da chi abbia una discreta preparazione matematica, ma mi sono sforzato di contenerle. (Comunque, in una prima lettura si potrà sempre sorvolare su qual che punto che risulti difficile). Sebbene i capitoli siano per la maggior parte indipendenti l'uno dall 'altro, sono ordinati in modo che la let tura dei primi faciliti la comprensione di quelli seguenti. Nonostante le limitazioni di cui si è detto e il poco spazio a disposi zione, ho cercato di presentare un po ' della ricca varietà della matema tica odierna, ma temo che quanto qui esposto rappresenti solo la punta di un iceberg. Pur consapevole delfatto che un libro come questo possa non colpire nel segno, spero almeno che non se ne discosti troppo. Lancaster, maggio 1986

Dove va la matematica

C apitolo

1

Numeri primi, scomposizione in fattori e codici segreti

Il più grande numero primo del mondo Il più grande numero primo>'' conosciuto al mondo è un gigante che per essere espresso nella notazione decimale standard richiede 6 5 050 cifre. Usando una notazione esponenziale, cioè sotto forma di potenza, esso acquista una dimensione più maneggevole: 0 2 2 16 9 1_ I . Ciò significa che il numero in questione si ottiene moltiplicando 2 per se stesso 2 I 6 090 volte, e quindi sottraendo I dal risultato . La notazione esponenziale è ingannevole . Per tentare di farsi un'idea della sua capacità di rappresentare grandi numeri, imma giniamo di prendere una normale scacchiera di 8 caselle per 8 e di collocarvi delle pile di gettoni spessi due millimetri, per esem pio monete da I oo lire, in base alla seguente regola. Numeriamo le caselle da I a 64 . Sulla prima casella collochiamo due gettoni; sulla casella due ne mettiamo quattro; sulla casella tre, otto e così via, collocando su ciascuna casella esattamente due volte il numero di gettoni di quella precedente . Sulla casella n avremo allora una pila di 2" gettoni. In particolare, sull'ultima casella avremo una pila di 2 64 gettoni. Quanto sarà alta questa pila? Un metro? Cento metri? Un chilometro? Niente affatto ! Che ci crediate o no, la nostra pila di gettoni si estenderà oltre la Luna (lontana solo 400 ooo chilometri) e il Sole (I 50 milioni di chilometri) , e di fatto raggi un*

Vedi oltre per la spiegazione di questo termine.

CAPITOLO PRIMO

gerà quasi la stella più vicina, Proxima Centauri, che dista qual cosa come quattro anni luce dalla Terra. Nella notazione decimale, il numero 2 64 è I 8 446 744 073 709 55 I 6 I 6 . Questo solo per 2 64 • Per ottenere il numero 2 216091 che compare nell'espressione del numero primo record avremmo bisogno di una scacchiera di 465 caselle per 465 ! Come si fa a trattare numeri di queste dimensioni? Per comin ciare potremmo usare un calcolatore, e non uno qualsiasi: il numero primo record visto poc' anzi è stato scoperto utilizzando una delle macchine più potenti del mondo (un mostro capace di eseguire due cento miliardi di operazioni aritmetiche al secondo) , e anche così il calcolo ha richiesto più di tre ore . Ma la sola potenza di calcolo non è sufficiente: occorre anche l'abilità del matematico . Nel seguito di questo capitolo parleremo di come si sia sviluppata que sta abilità, e degli altri campi ai quali può essere applicata.

Numeri primi « L' azione migliore è quella che procura la massima felicità per il maggior numero », scriveva nel I 7 25 Francis Hutcheson, nella sua Inquiry into the Origina l of our Ideas of Beauty and Virtue. Sembra inverosimile che pensasse al « numero » nel senso matematico del « più grande numero primo conosciuto » e via dicendo, ma ciò nono stante la sua affermazione si applica abbastanza bene all'eterno fascino esercitato sull'uomo dagli oggetti matematici più basilari: i numeri naturali, quelli che servono per contare: I , 2 , 3 , . . . Questi oggetti matematici astratti sono fondamentali non solo per la nostra vita quotidiana, ma praticamente per tutta la matematica, tanto che Leopold Kronecker, un matematico del secolo scorso , scrisse: « Dio creò i numeri naturali e tutto il resto è opera dell'uomo ». I numeri naturali godono di varie proprietà, rispetto alle quali i numeri stessi si dividono in due classi: quelli che ne sono dotati e quelli che ne sono privi . Per esempio esiste la proprietà di essere pari, la quale ripartisce i numeri naturali nella classe dei numeri che sono appunto pari (2 , 4, 6 ecc .) e in quella dei numeri che non lo sono (i numeri dispari: I , 3 , 5 , 7 ecc . ) . Oppure la proprietà di

15

NUMERI PRIMI

essere divisibili per 3 (Qui e altrove, in questo libro, quando affer miamo che un numero divide un altro intendiamo dire che lo fa esattamente, senza ottenere alcun resto; quindi 3 , 6, 9, I 2 sono tutti divisibili per 3 , mentre I , 2 , 4, 5 , 7 non lo sono) . La ripar tizione pari-dispari è naturale e importante, quella tra i numeri divisibili per 3 e i numeri che non lo sono non è così naturale e neppure così importante. Un altro esempio di classificazione naturale (e importante) è data dalla proprietà di essere un qua drato perfetto, come I = I 2 , 4 = 2 2 , 9 = 3 2 , I 6 , 2 5 , 3 6 , . . . . E ce ne sono altre . Ma la suddivisione di gran lunga più importante dei numeri naturali è quella tra i numeri che sono primi e quelli che non lo sono . Un numero naturale n si dice primo se i soli numeri per cui è divisibile sono I e n stesso . Il numero I è un caso speciale, e per convenzione non lo si considera primo . Così 2 , 3 , 5 , 7 , r r , I 3 , q, I 9 sono tutti numeri primi; I , 4 , 6, 8 , 9 , I o , I 2 , I 4 , I 5 , I 6, I 8 , 2 0 non lo sono ( i numeri che non sono primi sono talvolta chiamati composti) . Per esempio, 7 è primo, perché nessuno dei numeri 2 , 3 , 4, 5 , 6 lo divide; I 4 non è primo, poiché è divisibile sia per 2 sia per 7 . Il motivo principale per cui i numeri primi sono così importanti era già noto al matematico greco Euclide (ca 350-300 a. C .) , il quale nel libro IX dei suoi Elementi (una summa in tredici volumi di tutto lo scibile matematico di allora) dimostrò quello che oggi è noto come il teorema fondamentale dell 'aritmetica : ogni numero naturale maggiore di I è primo, oppure può essere espresso in modo unico come prodotto di numeri primi, a prescindere dall'ordine in cui questi sono disposti . Per esempio, il numero 75 900 è il prodotto di sette /attori primi (due dei quali fattori ripetuti) :

7 5 900 = 2

X

2

X

3

X

5

X

5

X

II

X

23 .

L'espressione a destra del segno d'uguaglianza è la scomposizione in fattori primi del numero 7 5 900 . Il teorema fondamentale dell' aritmetica ci dice che i numeri primi sono i « mattoni » con cui sono costruiti tutti i numeri natu rali: come tali, essi equivalgono agli elementi della chimica e alle particelle elementari della fisica. La conoscenza della scomposi-

16

CAPITOLO PRIMO

zione in fattori primi di un numero qualsiasi offre al matematico informazioni quasi complete su quel numero, come sarà bene illu strato più oltre in questo capitolo (vedi il paragrafo sui codici segreti) . Ma per il momento, cosa possiamo dire sui numeri primi in quanto tali? Il primo quesito che ci si può porre a proposito dei numeri primi è quanto siano frequenti . Esiste, per esempio, un massimo tra i numeri primi, oppure essi proseguono all'infinito, diventando sem pre più grandi? A prima vista sembrano essere davvero molto fre quenti. Dei primi dieci numeri dopo I (cioè, da 2 a I I inclusi) , cinque sono primi: 2 , 3 , 5 , 7 , I I , esattamente la metà del totale . Dei successivi dieci numeri, da I 2 a 2 I , ce ne sono tre primi ( I 3 , I 7 , I 9) , cioè il 3o per cento circa. Tra 2 2 e 3 I la percentuale dei primi è di nuovo del 3o per cento, mentre nei due gruppi suc cessivi di dieci numeri scende al 20 per cento . Sembra così che i numeri primi diminuiscano man mano che si avanza lungo la serie dei numeri naturali . La tabella I . I mostra il numero dei primi minori di n (denotato da :rr: ( n)) per alcuni valori di n, e fornisce in ciascun caso la misura della « densità » :rr:( n )/n . Abbiamo visto che i primi diventano sempre più rari man mano che si procede nella sequenza dei numeri . Ma finiscono per esau rirsi completamente? La risposta è no . Anche questo fatto fu dimo strato da Euclide, usando un argomento che a tutt'oggi rimane un modello di eleganza del ragionamento matematico. Innanzitutto, immaginiamo i numeri primi disposti in ordine crescente: Pt , P2 , p , , ··· Così P 1 = 2 , p 2 = 3 , p, = 5 e così via. Si tratta di dimostrare che questa successione deve continuare all'infinito, ovvero, in altre Tabella 1 . 1 La distribuzione dei numeri primi; :n:(n) è il numero di primi minori di n n

:n:(n)

:n:(n)/n

I 000 1 0 000 1 00 000 I 000 000

1 68 229 9 59 2 78 498

o, r 68 0,1 23 0,096 0,078

l

17

NUMERI PRIMI

parole, che per ogni n, avendo enumerato P�> p2 , , Pm deve esserci, oltre Pn , un ulteriore numero primo nella lista. Il trucco consiste nel considerare il numero • • •

N = P 1P2 P3 . . . pn + I ottenuto moltiplicando tra loro tutti i numeri primi p1, p2 , p 3 e così via fino a Pn , e poi sommando I al risultato . Ovviamente N è maggiore di Pn , cosicché se N fosse primo sapremmo che esiste un numero primo oltre Pn , che è quanto vogliamo dimostrare. D ' altro canto, se N non fosse primo, sarebbe divisibile per qual che primo, diciamo p. Ma se si prova a dividere N per uno qualun que tra i numeri primi p1, p2 , . . . , Pn si ottiene sempre il resto di I , il medesimo I che era stato aggiunto nella costruzione di N. Così il nostro p deve essere un numero primo diverso da quelli della lista. Dunque, in ogni caso ci sarà un numero primo maggiore di Pn , il che ci consente di concludere che la lista dei primi continua all'infinito . Si tenga presente che non sappiamo se il numero N sopra otte nuto è primo o no. Facendo qualche prova, scopriremo che i numeri costruiti in modo analogo sono spesso primi: per esempio, Nl N2 N3 N4 N5

= = = = =

2 + I = 3. 2 x 3 + I = 7. 2 X 3 X 5 + I = 3I, 2 x 3 x 5 x 7 + I = 2!!, 2 x 3 x 5 x 7 x I I + I = 23 I I '

sono tutti primi . Ma i tre successivi non lo sono : N6 = 2 x 3 x 5 x 7 x I I N7 = I9 x 97 x 2 7 7 , Ns = 3 4 7 X 2 7 953 ·

x

I 3 + I = 3 0 03 I = 59

x

509,

In effetti, nessuno sa se ci sia un numero infinito di primi della forma Nn = P1P2 . . . pn + I , né, viceversa, se ci sia un numero infinito di numeri composti della stessa forma (sebbene almeno una delle due possibilità deve natu ralmente essere vera) . Questo è soltanto uno dei tanti quesiti sui

18

CAPITOLO PRIMO

numeri primi, tutti formulati in modo elementare, di cui è scono sciuta la risposta. Uno dei più famosi quesiti irrisolti sui numeri primi è la conget tura di Golbach . In una lettera a Eulero scritta nel I 74 2 , Chri stian Goldbach ipotizzò che ogni numero pari maggiore di 2 fosse una somma di due primi. Per esempio : 4 6 8 IO 12

= = = = =

2 3 3 5 5

+ + + + +

2, 3. 5. 5, 7.

Grazie ai calcolatori, la congettura di Goldbach è stata verificata per tutti i numeri pari fino a I oo milioni, ma a tutt'oggi non ne è stata dimostrata definitivamente la verità o la falsità.

I test di primalità Sebbene la maggior parte dei problemi classici relativi ai numeri primi siano rimasti insoluti, gli ultimi anni hanno visto un note vole sviluppo di metodi che consentono di appurare se un numero è primo o no . « Metodi per verificare la primalità? - ci si può chiedere - Ma è ovvio come si fa! » In effetti, c'è un modo natu rale e diretto per stabilire se un numero è primo oppure no . Dato un numero, diciamo n, vediamo in primo luogo se è divisibile per 2 ; se lo è, allora n non è primo, e il problema è risolto . Poi pro viamo con 3 ; se 3 divide n, allora n non è primo, e di nuovo il problema è risolto . Poi proviamo a dividere n per 5 (possiamo tra lasciare 4: dal momento che 2 non divide n se siamo arrivati a questo punto, neppure 4 può dividerlo) . Se 5 non divide n, proviamo con 7 (di nuovo possiamo tralasciare 6, poiché né 2 né 3 dividono n) ; e così via . Se arriviamo a .Jn senza trovare un numero che divida n, allora sappiamo che n deve essere primo (se n non fosse primo, sarebbe il prodotto di due numeri u e v compresi tra I e n, che non possono essere entrambi maggiori di .Jn). Il processo di cui sopra è noto come il metodo della divisione per tentativi. Quantunque funzioni abbastanza bene per numeri rela-

NUMERI PRIMI

tivamente piccoli, esso diventa di difficile applicazione quando entrano in gioco numeri molto grandi. Per rendersi conto di quanto risulti poco pratico, supponiamo di dover scrivere un programma che realizzi il metodo della divisione per tentativi sul più veloce calcolatore esistente (ne abbiamo fatto cenno all'inizio di questo stesso capitolo) . Per un numero di I o cifre il programma termine rebbe il calcolo all'istante e la risposta apparirebbe immediatamente. Per un numero di 20 cifre ci impiegherebbe due ore. Per un numero di 50 cifre richiederebbe dieci miliardi di anni . Un numero di I oo cifre richiederebbe I 000 000 000 000 000 000 000 000 000 000 000 000 anni, un numero con trentasei zeri . Questo non è solo un inutile calcolo di un numero molto grande: come sarà spiegato più avanti in questo capitolo, una delle tecniche crittografiche più sicure oggi in uso richiede primi costituiti da un numero di cifre che va da 6o a I oo . Come s i può stabilire, dunque, s e u n numero d i I oo cifre è primo? Il miglior metodo attualmente disponibile è una tecni ca molto sofisticata, sviluppata intorno al I 98o dai matematici Adleman, Rumely, Cohen e Lenstra, e spesso indicata con le loro iniziali come test ARCL. Quando questo test viene programmato su un calcolatore veloce come quello menzionato prima, i tempi di elaborazione sono I o secondi per un numero di 20 cifre, I 5 secondi per un numero di 5 0 cifre e 4 0 secondi per un numero di I oo cifre . Il computer sarà anche in grado di trattare un numero di I ooo cifre se gli sarà concessa una settimana di tempo per risol vere il problema. Come funziona il test? Bene, dipende da una quantità non in differente di sofisticati procedimenti matematici (di livello ben superiore a quello di un tipico corso universitario) , sicché non è possibile dare qui una risposta esauriente . Non è tuttavia diffi cile spiegare l'idea chiave del metodo, che si basa su una sem plice ma acuta scoperta matematica del grande Pierre de Fermat ( I 60 I - I 665) . Pur essendo un matematico dilettante (era infatti giurista di pro fessione) , Fermat giunse ad alcuni tra i più profondi risultati mai

20

CAPITOLO PRIMO

visti in matematica. Egli dimostrò che se p è un numero primo, allora per qualunque numero a minore di p, il numero a P -i- I è divisibile per p. Per esempio, supponiamo che p sia uguale a 7 e che a sia uguale a 2 . Allora ap-l_

I = 26 - I = 64 - I = 63 ,

e in effetti 63 è divisibile per 7 . Provate voi stessi per qualun que valore di p (primo) e a (minore di p) : il risultato è sempre lo stesso . Disponiamo dunque di un metodo per verificare se un numero n è primo o no . Calcolate il numero 2 n-i - I e verificate se è divi sibile per n: se non lo è, allora n non può essere primo (infatti, se n fosse primo, secondo il teorema di Fermat, 2 n-i - I sarebbe divisibile per n) . Ma che cosa si può concludere se 2 •- i _ I risulta essere invece divisibile per n? Sfortunatamente non possiamo con cludere che n è primo, anche se è molto probabile che lo sia. Il guaio è che, mentre il risultato di Fermat ci dice che 2 •- i - I è divisibile per n ogniqualvolta n è primo, esso non dice che non esistano numeri composti aventi la stessa proprietà (è come dire che tutte le automobili hanno le ruote, ma ciò non vieta che altri veicoli le abbiano: le biciclette, per esempio) . In effetti, ci sono numeri non primi che godono della proprietà di Fermat . Il più pic colo è 3 4 I , che non è primo essendo il prodotto di I I e 3 I ; ma se lo verificassimo, troveremmo che 2 3 40 - I è in effetti divisibile per 3 4 I (vedremo tra poco che non è necessario arrivare a calco lare 2 3 4 0 ) . I numeri composti che si comportano come primi per quanto si riferisce alla proprietà di Fermat sono chiamati pseudo primi. Così se, quando verifichiamo la primalità usando il risul tato di Fermat, scopriamo che 2 n - i - I è veramente divisibile per n, allora possiamo concludere che n è o primo o pseudoprimo, anche se la probabilità che n sia primo è molto alta. Infatti, seb bene gli pseudoprimi siano infiniti, essi sono molto meno frequenti dei primi autentici: per esempio, ce ne sono solo due minori di I ooo e solo 245 al di sotto del milione. Detto per inciso , non cambia molto se invece di 2 usiamo qual che altro numero, per esempio 3 o 5 , nella verifica della proprietà di Fermat . Qualunque numero si usi, ci sarà qualche pseudoprimo

21

NUMERI PRIMI

che ci impedirà di ottenere una risposta inappellabile al nostro que sito sulla primalità. Usando il test di cui sopra, non è necessario calcolare il numero 2n-t, numero che abbiamo già notato essere molto grande per valori anche modesti di n. Tutto quanto dobbiamo fare è stabilire se 2n-t_ I è divisibile per n. Ciò significa che possiamo ignorare i multipli di n in qualunque passaggio del calcolo . In altre parole, ciò che dobbiamo calcolare è il resto che otter remmo se 2n-t_ I fosse diviso per n. Lo scopo è di vedere se questo resto è zero o no, ma poiché i multipli di n sono ovvia mente ininfluenti nel calcolo del resto, possiamo ignorarli . Mate matici e programmatori hanno un modo standard per indicare il resto : il resto di a diviso b viene scritto a mod b . Così, per esempio, 5 mod 2 = I , 7 mod 4 = 3 , e 8 mod 4 = O . Per esemplificare il test di Fermat, applichiamolo alla verifica della primalità del numero 6 I . Dobbiamo calcolare il numero ( 260- I ) mod 6 r .

Se questo non è zero, 6 I non è primo; se è zero, 6 I è o primo o pseudoprimo (in realtà è un autentico primo, come già sappia mo) . Cercheremo di evitare di calcolare l'ingombrante numero 260• Incominciamo constatando che 26 = 64, e di conseguenza 26 mod 6 I = 3 . Allora, poiché 230 = ( 26 ) 5, otteniamo : 230

mod 6 I = ( 26 mod 6 I ) 5 mod 6 I = 3 5 mod 6 I = 243 mod 6 I = 6o .

Così : 260 mod 6 I

Quindi:

= ( 230) 2 mod 6 I = ( 230 mod 6 I ) 2 mod 6 I = = 6o 2 mod 6 I = 3 6oo mod 6 I = r . ( 260- I ) mod 6 I = O .

Poiché il risultato finale qui è O , concluderemo che 6 I è o primo o pseudoprimo, come abbiamo premesso . A questo punto può darsi che vogliate cimentarvi da soli con qualche calcolo . Provate a verificare che 210 mod 3 4 I

= I,

22

CAPITOLO PRIMO

e poi servitevi di questa uguaglianza per dimostrare che 2 H0 mod 3 4 I = r . Questo risultato vi dice che il numero 3 4 I è o primo o pseudo primo (in questo caso, come prima accennato, 3 4 I è in realtà uno pseudoprimo) . Il test ARCL agisce in modo da modificare il test di Fermat, così che non possa essere « ingannato » da uno pseudoprimo . È questa modifica che richiede conoscenze matematiche tanto profonde .*

I numeri primi di Mersenne Il test ARCL è il più veloce test di primalità di impiego generale attualmente disponibile, dove l'espressione « di impiego generale » sta a significare che esso funziona con qualsiasi numero dato n . M a per numeri con strutture particolari ci sono spesso metodi alter nativi molto più veloci, che sfruttano proprio le particolarità dei numeri in esame . L'esempio più eclatante riguarda i numeri della forma 2 n - I . Tali numeri sono oggi chiamati numeri di Mersenne dal nome di un monaco francese del secolo xvii, Marin Mersenne . Nella prefazione della sua opera Cogitata Physica-Mathematica ( I 644) , Mersenne affermò che il numero Mn = 2 n -I è primo per n = 2 , 3 , 5 , 7 , I3 , I7 , I 9, 3I , 67 , I27 , 257 , ed è compo sto per ogni altro n minore di 257 . Come se ne rese conto? Nessuno lo sa. Comunque, era sorprendentemente vicino alla verità. Solo nel I 947 , quando comparvero le calcolatrici da tavolo, fu finalmente pos sibile verificare la sua asserzione. Aveva fatto solo cinque errori: M67 e M257 non sono primi, M61 , M89 e M107 sono primi . I numeri di Mersenne offrono un ottimo metodo per ottenere numeri primi molto grandi. La rapida crescita della funzione 2 n all' aumentare di n ci garantisce che i numeri di Mersenne Mn diventano in fretta molto grandi; l'idea, quindi, è di cercare valori * Se davvero volete controllare per conto vostro, potete consultare l' articolo di Cohen e Lenstra, Primality testing and Jacobi sums, « Mathematics of Computation », XLII (r 984) , pp. 297•330.

23

NUMERI PRIMI

di n per i quali M. è primo . Tali numeri primi sono chiamati primi di Mersenne. Basta un po ' di algebra elementare per capire che M. non è primo se non lo è n, cosicché bisogna considerare solo valori primi di n. Ma persino quando n è primo dà origine quasi sempre a un numero di Mersenne M. composto, ragion per cui la ricerca di valori appropriati di n non è semplice. Ciò non emerge affatto dai primi casi, poiché M2 = 2 2 - I = 3 , M} = 2 3 - I = 7 , M5 = 2 5 - I = 3 I , M7 = 2 7 - I = I 2 7 sono tutti primi. Ma la serie si interrompe con Mu = 2047 = 23 X 8 9 . Seguono altri tre valori primi : Mu = 8 I 9 I ,

M 17 = I 3 I 07 I ,

M19 = 5 2 4 2 87 .

D a questo punto diventa più difficile trovare i numeri primi di Mersenne . I successivi cinque valori di n per i quali M. è primo sono 3 I , 6 I , 89, I 07 , I 2 7 . Vedendo tali numeri per la prima volta, siamo facilmente por tati a concludere che se p è un primo di Mersenne, allora anche MP è primo . Questo è senz' altro vero all'inizio : 3 è un primo di Mersenne e lo è anche M3 ; 7 è un primo di Mersenne e lo è anche M7 ; altrettanto vale per M3 1 e M 1 2 7 . Ma qui la sequenza si arresta: sebbene 8 I 9 I sia un primo di Mersenne (poiché corrisponde a Mu) , M8191 (che ha 2 466 cifre) è composto . Questo fatto fu sco perto nel I 95 3 utilizzando uno dei primi calcolatori (vedi il para grafo sui numeri perfetti in questo stesso capitolo) . In effetti, a tutt'oggi sono noti solo trenta primi di Mersenne. I dodici valori di n su elencati, per i quali M. è primo, erano tutti conosciuti fin dai primi anni di questo secolo . I successivi cinque (n = 5 2 I , 6o7 , I 2 79, 2 2 03 , 2 2 8 ! ) furono tutti trovati nel I 95 2 da Raphael Robinson con il calcolatore SWAC. Il valore n = 3 2 I 7 fu scoperto nel I 957 da Hans Riese! usando un BESK. Nel I 96 I Alexander Hurwitz usò un IBM 7090 per ottenere i valori 4253

CAPITOLO PRIMO

e 4423 e, nel I 963 , Donald Gillies con l 'ILLIAC-11 trovò 9689, 994 I e I I 2 I 3 . Bryant Tuckerman su un IBM 360-9 I scoprì n= I 9 9 3 7 nel I 97 I . Nel I 978, i numeri primi record fecero notizia sui gior nali: dopo un lavoro di tre anni, che aveva richiesto 3 5 0 ore di tempo di elaborazione sul CYBER I 74 della California State Uni versity a Hayward, due liceali diciottenni, Laura Nickel e Curt Noli, avevano trovato il primo di Mersenne M2 1 70 1 di 65 3 3 cifre . Un anno dopo Noli migliorò il record con il primo M2 3 2 09 di 6987 cifre . Più tardi nello stesso anno il record spettò a David Slowin ski, un giovane programmatore del Cray Research di Chippewa Falls nel Wisconsin che, servendosi del potentissimo CRAY-I, trovò il primo M44 497 di I 3 3 95 cifre . Nel I 9 8 2 , sulla stessa macchina, Slowinski mostrò che M86 2 4 3 (con 25 962 cifre) è primo . Poi, pas sando all' ancor più potente CRAY-XMP, arrivò a scoprire il primo M1 3 2 049 di 39 75 I cifre . Infine, nel settembre I 985 , a Houston, nel Texas, un CRAY-XMP di proprietà della Chevron Geosciences trovò l' attuale detentore del record, cioè il numero M2 1 6 091 di 65 050 cifre. Poiché la Chevron usava il programma « Prime Fin der » di Slowinski, il merito della scoperta in realtà spetta a que st'ultimo . La compagnia utilizzava quel programma perché costi tuisce un valido metodo per evidenziare la presenza di qualunque errore nel sistema del computer . Finisce qui la storia? Probabilmente no . Si suppone che non ci sia un limite ai numeri di Mersenne, ma che ce ne sia un numero infinito . Tuttavia, questo non è stato dimostrato, e tutto ciò che sappiamo è che ce ne sono almeno trenta, cioè quelli identificati fino a ora. Il metodo adottato per verificare la primalità dei numeri di Mer senne è molto semplice, sebbene non lo sia la matematica che ne costituisce la base. È conosciuto come il test di Lucas-Lehmer, dai nomi di Edouard Lucas, che scoprì l'idea di fondo nel I 876, e di Derrick Lehmer, che perfezionò il metodo nel I 93 0 . Per verifi care se il numero di Mersenne M" è primo (assumendo che si sap pia già che n è primo) , calcoliamo i numeri U (O) , U ( I ) , . . . , U (n - 2) secondo le regole seguenti: U (O) = 4 , U (k + I ) = ( U (k) 2 - 2) modM" .

25

NUMERI PRIMI

Se alla fine troviamo che U (n - 2 ) = O, allora Mn è primo; se U (n - 2) ;é O, allora Mn non è primo . Per esempio, supponiamo di voler usare il test di Lucas-Lehmer per stabilire se M5 è primo . È un calcolo superfluo, poiché noi sappiamo già che M5 = 3 I è primo, ma è tuttavia utile per illu strare il metodo . Abbiamo quindi: U (O) U(I) U(2) U(3)

= = = =

4, (4 2 - 2) mod 3 I = I4 mod 3 I = 1 4 , ( I 4 2 - 2 ) mod 3 I = I 94 mod3 I = 8 , (8 2 - 2) mod 3 I = 62 mod 3 I = O .

Poiché U (3 ) = O, M5 deve essere primo . Se volete cimentarvi voi stessi con qualche calcolo, provate con M7 = I 2 7 , che è primo, e M11 = 2047, che non lo è (vedi sopra) .

Scomposizione in fattori Al convegno dell'ottobre I 903 della prestigiosa American Mathe matical Society, il matematico Frederick Nelson Cole compariva nella lista degli oratori con una relazione dal titolo senza pretese: « Sulla scomposizione in fattori di grandi numeri ». Quando venne il suo turno, Cole si diresse alla lavagna e, senza pronunciar parola, eseguì il calcolo di 2 elevato a 67, sottraendo poi I dal risultato . Sempre senza profferir parola, su una parte sgombra della lavagna moltiplicò tra loro i due numeri I 93 707 7 2 I e 7 6 I 83 8 25 7 2 8 7 . I l risultato dei due calcoli risultò identico. Cole ritornò a sedere sempre in perfetto silenzio e (unico caso del genere documentato) l'intero uditorio presente al convegno dell'American Mathemati cal Society si alzò e applaudì in modo entusiastico l' « oratore ». Cole aveva trovato (pare dedicandoci i pomeriggi delle dome niche per vent' anni) i fattori primi del numero di Mersenne M67• Fin dal I 876 si sapeva che M67 è un numero composto, ma ciò era stato scoperto (da Edouard Lucas stesso) usando il test di Lucas Lehmer, che, sebbene fornisca una risposta al quesito se un numero dato di Mersenne sia primo o composto, non dà alcuna informa zione sui fattori di un numero di cui già si sappia che è composto .

CAPITOLO PRIMO

Lo stesso vale per il test ARCL, come si può capire dalla breve descri zione che ne abbiamo dato, e per qualunque test di primalità attual mente disponibile. Come si possono trovare i fattori di un numero che sappiamo essere composto? Il procedimento per tentativi è chiaramente fuori discussione, per lo stesso motivo per cui non è praticabile come test per la primalità. Ma, in pratica, le divisioni successive com paiono in tutte le attuali realizzazioni dei test di primalità e dei metodi di scomposizione. Dal momento che ciò può essere fatto velocemente, è sensato incominciare con le divisioni successive, diciamo per il primo milione di numeri primi . Se si trova un divi sore, allora sia il problema della primalità, sia quello della scom posizione in fattori sono risolti. Se non lo si trova, allora sappiamo almeno che il numero o è primo o, se composto, ha solo fattori primi grandi. Quest'ultimo fatto viene usato in un semplice metodo di scomposizione dovuto a Fermat, che adesso descriveremo . Supponiamo che n = uv, dove u e v sono entrambi numeri dispari grandi, e, per esempio, che u � v . Poiché noi sappiamo che n ha solo fattori primi grandi, questa è la situazione che ci si presenta quando vogliamo trovarli . Poniamo x= Allora O � y

�

( u + v) ,

Y

) =� 2 (u - v .

< x � n,

e u = x + y, v= x - y, per cui n = (x + y) (x - y) = x 2 - y 2 ,

che può essere riscritto come y 2= x 2

_

n2.

Viceversa, se x e y soddisfano l'equazione [ r ], allora n si scompone così: n = (x + y) (x - y) . Di conseguenza, scomporre n in un prodotto di due numeri equi vale a trovare i numeri x e y che soddisfano l'equazione [ r ], nel qual caso la scomposizione in fattori che ne risulta è data dall'e quazione [z]. Si tenga presente che tale procedimento non dà neces sariamente la scomposizione in fattori primi di n; ma una volta

27

NUMERI PRIMI

che un numero è stato scomposto in due fattori, questi a loro volta possono essere scomposti, compito senza dubbio molto più age vole, poiché sono numeri più piccoli. Per trovare x e y come nell'equazione [ r ], iniziamo dal più pic colo numero k tale che k � Vn; poi proviamo ciascuno dei valori x = k, x = k + r , x = k + 2 , . . . , controllando ogni volta se x 2 - n è un quadrato perfetto . Una volta trovata questa x, la scomposi zione è in effetti completa. Ammesso che n abbia due fattori pressappoco della stessa grandezza (e perciò vicini a Vn, da cui il metodo prende avvio) , la soluzione si dovrebbe trovare abbastanza in fretta. Se a questo punto volete sperimentare voi stessi il metodo, i numeri 1 0 3 7 9 e 93 343 costituiscono un buon esempio . Ci sono vari modi per sveltire questo processo . Per esempio, se fate i calcoli a mano, non è necessario estrarre la radice qua drata di x 2 n ogni volta, per vedere se è un numero intero. Poi ché nessun quadrato perfetto finisce con 2 , 3 , 7 o 8, ogniqualvolta trovate che x 2 - n finisce con una di queste cifre potete immedia tamente ignorare quel valore di x. Lo stesso Fermat usò questo metodo per ottenere la scomposi zione in fattori -

2 0 2 7 65 r 2 8 r = 44 o2 r X 46 o6 r . I programmi per i calcolatori usano alcuni metodi piuttosto sofi sticati per « eliminare all'istante » valori impossibili di x (processo noto, per evidenti motivi, con il nome di setacciatura) . Nel 1 974, alcuni matematici dell'Università della California a Berkeley costruirono un dispositivo elettronico ideato espressamente per setacciare i numeri, lo SRS- r 8 r , che può trattare 20 milioni di numeri al secondo .

I numeri di Fermat L'n-esimo numero di Fermat Fn si ottiene elevando 2 alla poten za n, elevando ancora 2 al numero ottenuto, e aggiungendo r al risultato : Fn = 2 2 " + I . Così F0 = 3 , Ft = 5 , F2 = 1 7 , F3 = 2 5 7 (è evidente la rapida ere-

CAPITOLO PRIMO

scita di questi numeri, dovuta all' applicazione ripetuta della fun zione esponenziale) e F4= 2 1 6 + I= 65 53 7 . S i cominciò a provare interesse per questi numeri in seguito a una dichiarazione fatta da Fermat in una sua lettera a Mersenne nel I 64o. Avendo notato che ciascuno dei numeri compresi tra F e F4 è primo, Fermat scrisse: « Ho trovato che i numeri della 0 forma 2 2" + I sono sempre primi, e da allora ho sostenuto con gli analisti la validità di questo teorema ». Tale osservazione do vrebbe servire come avvertimento a tutti coloro che giungono a una conclusione basandosi su poche informazioni, perché, nono stante la sua grande dimestichezza con i numeri, Fermat era in errore . Ciò fu dimostrato per la prima volta in modo inequi vocabile dal grande matematico svizzero Eulero nel I 73 2 : F5= = 4 2 94 967 2 9 7 non è primo . Sebbene Eulero sia giunto a que sto risultato applicando il metodo delle divisioni successive, l'i ronia della sorte vuole che un calcolo diretto che si serve proprio del test di Fermat dimostri la non primalità di F5• V ediamolo : se p è primo, allora 3 p-I modp = I , ma per p= F5 otteniamo 3 p-I modp= 3 0 2 9 0 2 6 I 6o, quindi F5 non può essere primo . Ulteriori studi hanno dimostrato quanto Fermat fosse in errore: ora sappiamo che F. è composto per tutti i valori di n da 5 a 2 I , come pure per vari altri valori, e l'ipotesi più diffusa è che F. sia composto per tutti i valori di n superiori a 4 · I numeri di Fermat offrono un altro esempio di numeri di forma particolare la cui primalità può essere verificata velocemente . Un metodo comune è fornito dal teorema di Proth : il numero di Fer mat F. è primo se e solo se 3 !F,- 0'2 m od F.=

-

r.

Questo risultato fornisce un test di primalità molto valido per i numeri di Fermat . Come probabilmente avete già intuito, esso è strettamente collegato con il test di Fermat trattato prima. Ma adesso non ci interessa tanto la verifica della primalità dei numeri di Fermat , quanto la scomposizione in fattori dei numeri che sap piamo essere composti. Infatti, è in questo campo che negli ultimi anni si sono registrati sviluppi significativi, sviluppi che hanno tro vato impieghi anche al di fuori della matematica (vedi il paragrafo sui codici segreti in questo stesso capitolo) .

NUMERI PRIMI

Come abbiamo già visto, Eulero dimostrò che il numero di Fer mat F5 è composto, e ne calcolò anche un fattore primo: 64 r . Nel I 88o Landry dimostrò che F6 è composto, e anche questa volta si trovò subito un fattore primo : 2 7 4 I 7 7 · Per F7 la trafila fu un po ' diversa: nel I 905 Morehead e Western dimostrarono che era composto, ma solo nel I 97 I Brillhart e Morrison (dotati di un IBM 3 60-9 I ) trovarono la scomposizione in fattori

F7 = 21 2 S + I = 340 2 8 2 3 66 9 2 0 938 463 463 374 6o7 43 I 768 2 I I 45 7 = 59 649 589 I 2 7 497 2 I 7 x 5 704 689 2 00 685 I 2 9 054 7 2 ! . Essi applicarono un metodo proposto molto prima da Lehmer e Powers che comportava l'impiego di frazioni continue, e il calcolo richiese circa un'ora e mezza. Versioni migliorate del metodo delle frazioni continue, come è oggi chiamato, costituiscono alcuni dei metodi più efficaci attualmente disponibili per la ricerca dei fattori. Gli stessi Morehead e Western dopo aver dimostrato nel I 905 che F7 è composto, scoprirono nel I 909 che anche Fs è composto . Fu solo nel I 98 I che Brent e Pollard ne trovarono la scomposi zione in fattori, e ci vollero due ore di calcoli su un UNIVAC uoo/42 . Il metodo escogitato da Pollard era a quel tempo insolito, in quanto, diversamente dalla maggior parte dei metodi adottati in matema tica, non garantiva di produrre un risultato . Si sapeva solo che, se si fosse eseguito un certo calcolo, allora sarebbe stato molto pro babile trovare una scomposizione in fattori del numero entro un lasso di tempo ragionevole, ma esisteva una piccola possibilità di insuccesso . (In questo si distingueva dal metodo delle divisioni suc cessive, nel quale è piccola la probabilità di ottenere un risultato entro un miliardo di anni ! ) Nonostante l' elemento di casualità, il vantaggio del metodo di Pollard era dato dal fatto che la probabi lità di successo nella scomposizione era assai alta. La tecnica della scomposizione in fattori di Pollard è un esempio di metodo Monte Carlo ; questi metodi, comparsi recentemente, non offrono la cer tezza di un risultato, ma un'alta probabilità di successo in un tempo molto minore . I due fattori primi di Fs (che ha 78 cifre) sono I 2 3 8 9 2 6 3 6 I 5 5 2 897

30

CAPITOLO PRIMO

e Fino al momento in cui sto scrivendo, nessuno è riuscito a scom porre F9• Se il matematico tedesco Karl Friedrich Gauss fosse ancora in vita nel nostro tempo, in cui disponiamo di veloci calco latori, forse potrebbe essere di aiuto . Egli giunse a quello che sen z' altro deve essere considerato il più strabiliante risultato sui numeri di Fermat, collegandoli a un problema classico della geometria greca. A questo punto non possiamo non fare una presentazione partico lare di una delle menti matematiche più geniali che il mondo abbia mai conosciuto.

Una mente matematica strabiliante Karl Friedrich Gauss nacque a Brunswick, in Germania, nel r 777 . Il padre, muratore, sperava che il figlio potesse aiutarlo nel suo lavoro, sia come manovale sia nella contabilità. Il giovane Gauss sembrò molto idoneo a quest'ultimo compito quando, a soli tre anni, fu in grado di correggere i calcoli per le paghe fatti dal padre. Fortunatamente per il futuro della matematica, per non parlare della fisica e dell' astronomia, il duca di Brunswick venne a sapere del bambino prodigio e si assunse l'impegno di provvedere alla sua istruzione . All'età di quindici anni, avendo sorpassato di molto i suoi stessi insegnanti, Gauss frequentò il Collegium Carolinum, dove, nel giro di tre anni, superò anche i suoi professori . Nel 1 796, quando era ancora studente, Gauss giunse alla sor prendente dimostrazione della relazione tra la geometria classica e i numeri di Fermat . Il risultato apparve nella settima e ultima parte della sua opera colossale Disquisitiones Arithmeticae (pubbli cata ancora oggi) , apparsa nel r 8o r quando Gauss aveva solo ven tiquattro anni, che costituisce la base della teoria dei numeri. Il contenuto di questo capitolo è una piccola parte di tale settore della matematica, che tratta delle proprietà dei numeri naturali. Uno dei problemi preferiti dai matematici della Grecia antica era la costruzione di figure piane (cerchi, triangoli, parallelogrammi

31

NUMERI PRIMI

e così via) servendosi solo di una riga (non graduata, e quindi adatta solo per tracciare linee rette) e di un compasso (usato solamente per disegnare archi di circonferenza, e non per riportare una lun ghezza) . Servendosi, a volte, di procedimenti ingegnosi, è possi bile costruire un gran numero di figure geometriche usando solo questi due strumenti rudimentali . Fino alla metà degli anni ses santa, tali costruzioni costituivano una parte significativa dell'in segnamento matematico nelle scuole di tutto il mondo . Già i Greci sapevano costruire poligoni regolari di n lati per n = 3 , 4, 5 , 6, 8 , Io, 1 2 , I 5 , I6 (un poligono è regolare se tutti i suoi lati hanno la stessa lunghezza e tutti i suoi angoli interni sono uguali) . Il diciannovenne Gauss dimostrò che un poligono regolare coò. n lati può essere costruito usando solo riga e compasso se e solo se n = 2 k per qualche valore di k, oppure n = 2 k p1p 2 . . . p, (per qualche k) dove p 1 , p2 p, sono numeri primi di Fermat distinti . In particolare, per un qualsiasi primo p di Fermat si può costruire un poligono regolare di p lati . Per il primo numero di Fermat, F0 = 3, si ottiene un triangolo equilatero che è facile da costruire, e per quello successivo, F1 = 5 , si ottiene un pentagono regolare . Poiché F2 = 1 7 è anch'esso un primo di Fermat, il risultato di Gauss mostra che anche un poligono regolare di I 7 lati può essere costruito usando riga e compasso . Questo fu il primo e l'unico passo in avanti nella costruzione di poligoni regolari dal tempo dei Greci, e Gauss fu così orgoglioso della sua scoperta che pre tese che sulla sua tomba venisse inciso un poligono regolare di I 7 lati . Sebbene la sua richiesta non sia mai stata soddisfatta, un tale poligono è scolpito su un lato del monumento eretto in sua memoria a Brunswick . • • •

Numeri perfetti Come rilevarono i pitagorici (i seguaci di Pitagora, matematico del secolo VI a. C .) , il numero 6 possiede una proprietà abbastanza singolare : è uguale alla somma dei suoi divisori propri, cioè diversi dal numero stesso : 6 = I + 2 + 3· Il numero successivo dotato di questa proprietà è 2 8 : gli unici

CAPITOLO PRIMO

numeri che lo dividono sono I , 2 , 4, 7 , I 4 e 2 8 , e 2 8 = I + 2 + 4 + 7 + J4 . I pitagorici chiamarono perfetti questi numeri. Nella sua Introductio Arithmeticae (sec . I d . C .) il matematico greco Nicomaco elencò quattro numeri perfetti conosciuti, e cioè 6, 2 8 , 496 e 8 1 2 8 . Da questo dato di fatto scaturirono due ipo tesi: che il numero perfetto n-esimo contenesse n cifre e che i numeri perfetti finissero alternativamente per 6 o per 8 . Entrambe le ipotesi sono errate. Per cominciare, non esistono numeri perfetti di cinque cifre . Inoltre, sia il quinto sia il sesto dei numeri per fetti terminano per 6, essendo rispettivamente 33 550 3 3 6 e 8 589 869 056. È vero, tuttavia, che qualsiasi numero perfetto pari termina o per 6 o per 8 : ciò può essere dimostrato direttamente, e non dipende dal sapere o no quali numeri siano veramente perfetti . Nel libro IX dei suoi Elementi, Euclide, intorno al 3o0-350 a. C . , dimostrò che se 2 n - I è primo, allora il numero 2 n - 1 (2 n - I ) è perfetto . Duemila anni dopo, Eulero dimostrò che ogni numero perfetto pari è di questo tipo . Così fu provata la stretta relazione tra i primi di Mersenne e i numeri perfetti, il che comporta che al momento si conoscono esattamente trenta numeri perfetti pari. Non si conoscono numeri perfetti dispari, e si congettura che non ne esista alcuno . Quantunque ciò non sia stato dimostrato, vi è tuttavia qualche prova a favore di tale ipotesi . Si sa che un even tuale numero perfetto dispari dovrebbe essere più grande di I o 100 e avere almeno I I fattori primi distinti . D ' altro canto, se la storia può essere maestra, si dovrebbe andare cauti nel fare ipotesi sui numeri perfetti. Nel suo libro Theory of Numbers del I 8 I I , Peter Barlow, a proposito dell' ottavo numero perfetto 2 30 (2 31- I ) , un numero di I 9 cifre scoperto da Eulero nel I 77 2 , scrisse: «È il più grande che sarà mai scoperto; poiché questi numeri sono sempli cemente una curiosità priva di qualunque utilità pratica, è impro babile che qualcuno in futuro prosegua la ricerca ». Barlow aveva ragione nel dire che i numeri perfetti hanno valore di semplice curiosità, ma sottovalutava il fascino che le curiosità possono suscitare, come illustra fin troppo bene la prima parte di

33

NUMERI PRIMI

questo capitolo . I numeri perfetti sono senz' altro singolari . Per esempio, ogni numero perfetto (pari) è triangolare, il che significa che può essere rappresentato da un numero di biglie sistemate in modo da formare un triangolo equilatero (cioè è della forma � n (n + I ) per qualche valore di n) . Altra particolarità: se pren diamo un qualsiasi numero perfetto diverso da 6 e sommiamo tutte le cifre che lo compongono otteniamo un multiplo di nove aumen tato di un'unità . Collegato a questo fatto è il risultato che la radice numerica di qualsiasi numero perfetto è I . (Per ottenere la radice nu merica si sommano tutte le cifre del numero, poi tutte le cifre del numero così ottenuto e così via, fino a giungere a un numero di una sola cifra) . E ancora, ogni numero perfetto è la somma di numeri dispari consecutivi elevati al cubo . Per esempio : 2 8 = I3 + 3\ 496 = I 3 + 3 3 + 5 3 + 7 3 •

Ancora un esempio : se n è perfetto, allora la somma dei reciproci di tutti i divisori di n è sempre uguale a 2 . Per esempio, 6 ha come divisori I , 2 , 3 , 6 e ...!.._

I

+ ...!.._ + ...!.._ + ...!.._ = 2 • 6 3 2

In effetti, tale è stato lo sforzo compiuto per la ricerca di que sti numeri « curiosi » che, nonostante l' affermazione di Barlow sulla loro inutilità, il loro calcolo è diventato un punto di riferimento per la misurazione della potenza dei calcolatori. Per esempio, pren diamo il numero di Mersenne M819t> primo numero a interrom pere la catena dei primi di Mersenne che a loro volta danno ori gine a primi di Mersenne (vedi sopra) . Per dimostrare con il test di Lucas-Lehmer che questo numero di 2 466 cifre non è primo (e quindi non dà un numero perfetto) ci vollero I OO ore la prima volta, quando il test venne eseguito nel I 95 3 , sull'ILLIAC-1. Nel corso degli anni il tempo di calcolo è sceso drasticamente: da 5 a 2 ore su un IBM 7090, 40 minuti su un ILLIAC-11, da 3 a I minuto su un IBM 3 60-9I, e I O secondi su un CRAY- r .

34

CAPITOLO PRIMO

Codici segreti Nell' autunno del 1 98 2 , durante un convegno scientifico a Win nipeg, in Canada, due matematici e un ingegnere informatico usci rono a bere una birra. I due matematici portarono subito il discorso sulla scomposizione in fattori di grandi numeri, e sul relativo pro blema di calcolo . Il programmatore intervenne dicendo che il tipo di macchina su cui egli lavorava avrebbe facilmente risolto uno dei principali problemi in cui si erano imbattuti. Così un incontro casuale in un bar ebbe una ripercussione non indifferente nel campo della sicurezza dei dati, perché la difficoltà di scomporre in fat tori sta alla base di una delle forme più avanzate di codice segreto . La storia di come una teoria matematica apparentemente inutile ed esoterica sia divenuta la base di sistemi moderni di sicurezza è uno dei racconti matematici più interessanti di questo secolo e allo stesso tempo un serio ammonimento per chi sostiene che una sin gola e limitata ricerca scientifica sia priva di applicazioni pratiche. Gli stessi matematici sono tra i maggiori detrattori, quando si tratta di sminuire l'utilità delle loro ricerche. Nel suo brillantis simo Apologia di un matematico, il grande matematico inglese God frey H. Hardy dice: « La vera matematica non ha alcun effetto sulla guerra . Nessuno ha ancora scoperto un uso bellico della teo ria dei numeri o della relatività, e sembra molto improbabile che se ne scopra uno ancora per molti anni ».* Questa affermazione è del 1 940. Nel 1 945 il mondo poté vedere l'orribile smentita dell'af fermazione di Hardy sugli usi bellici della relatività, sotto forma di bomba atomica. Per quanto riguarda l'altro suo esempio, la teoria dei numeri, questo oggetto « inutile » ora fornisce i sistemi di sicu rezza che sono usati per il controllo (e forse un giorno lo saranno anche per il lancio) delle centinaia di missili nucleari proliferati dopo la prima bomba atomica di Hiroshima. Tanta basti per quanto riguarda le previsioni sulle applicazioni (o meno) delle scoperte matematiche nel mondo reale. Il campo di ricerca di Hardy era, guarda caso, proprio la teoria dei numeri, e parte del suo lavoro si è rivelata di utilità pratica, nonostante la sua affermazione: « Non *

[G. H. Hardy, Apologia di un matematico, Garzanti, Milano 1 989, p. 99] .

NUMERI PRIMI

35

ho mai fatto nulla di "utile" . Nessuna mia scoperta ha aggiunto qualcosa, né verosimilmente aggiungerà qualcosa, direttamente o indirettamente, nel bene o nel male, alle attrattive del mondo ».* Naturalmente non c'è nulla di nuovo nell'idea dei codici segreti. Giulio Cesare li usò per garantire la sicurezza degli ordini che inviava ai suoi generali durante le guerre galliche. Oggigiorno non sono solo le forze armate ad adottare tecniche crittografiche per rendere sicure le loro comunicazioni: anche per motivi commer ciali e politici è opportuno garantire la sicurezza dell'informazione. Come elaborare un sistema crittografico? « Con grande cura », si potrebbe rispondere, celiando ma non troppo . L'ipotetico crit toanalista (cioè il « nemico » che sta cercando di decifrare il vostro codice) dispone di molte armi, da potenti calcolatori a sofisticate tecniche matematiche e statistiche. Certamente i crittogrammi ele mentari usati da Cesare sono del tutto inadeguati . In un codice cesareo il messaggio originale viene trasformato sostituendo cia scuna lettera con un'altra secondo una determinata regola, ad esem pio rimpiazzandola sempre con la terza lettera successiva dell' al fabeto, sicché A viene sostituita da D, G da J, Y da B e così via: la parola « matematica » diventerebbe « pdwhpdwlfd ». A un esame superficiale, un messaggio crittografato in questo modo appare inde cifrabile per chi non conosca la regola applicata, ma ciò non è affatto vero . Ci sono infatti solo 25 possibili slittamenti di cifra, e un nemico che sospetti che ne stiate usando uno può provarli tutti uno dopo l'altro, finché trova: quello giusto . E d' altro canto, anche se si ricorre a un altro criterio meno ovvio per la sostituzione delle lettere, il codice che ne risulterà non sarà sicuro . Il problema è che ci sono frequenze ben precise con cui le singole lettere ricor rono in italiano, come in qualunque altra lingua; contando il numero di ricorrenze di ciascuna lettera nel vostro testo cifrato, un nemico può facilmente dedurre il vostro criterio di sostituzione, special mente se impiega un calcolatore per sveltire il processo . Escluso il metodo della sostituzione, che altro possiamo ten tare? Qualunque soluzione adottiate presenta gli stessi pericoli . Se al vostro testo è applicato uno schema in qualche modo ricono scibile, un' analisi statistica sofisticata è solitamente in grado di *

[lbid. , p. 1 05] .

CAPITOLO PRIMO

accedere al codice con discreta facilità. A questo punto emerge la vera difficoltà: affinché il vostro messaggio sia decodificabile dal destinatario (probabilmente a mille chilometri di distanza) la trasformazione operata sul messaggio dal vostro schema crittogra fico, chiaramente, non deve cambiare del tutto l'ordine; il mes saggio deve rimanere inalterato dietro allo schema adottato, qua lunque esso sia. Tuttavia questo ordine deve restare occultato in modo tale da impedire che un nemico riesca a scoprirlo . Tutti i sistemi di codice moderni si servono dei calcolatori . Si può presumere che il nemico possegga potenti mezzi elettronici per analizzare il vostro messaggio, ai quali il vostro sistema deve essere in grado di resistere . A causa della difficoltà di progettare e di rendere sicuri i sistemi cifrati, essi sono invariabilmente co stituiti da due componenti: una procedura crittografica e una « chiave ». La prima è di norma un programma o eventualmente un calcolatore progettato a quel preciso scopo . Per cifrare un mes saggio il sistema richiede sia il messaggio che la chiave scelta, di solito un dato numero segreto . Il programma crittografico codifi cherà il messaggio secondo un criterio che dipende dalla chiave scelta, cosicché solo conoscendo quest 'ultima sarà possibile deco dificare il testo cifrato prodotto (fig. I . r ) . Dato che la sicurezza dipende dalla chiave, il medesimo programma crittografico può essere usato da molte persone per molto tempo, e ciò significa che vale la pena di impiegare tempo e fatica per la sua realizzazione. Un' analogia utile è data dal fatto che i fabbricanti di casseforti e serrature riescono a rimanere sul mercato realizzando un tipo di serratura che possa essere venduto a centinaia di clienti, ognuno dei quali confida sulla unicità della propria chiave a garanzia della sicurezza . (In questo caso la « chiave » potrebbe essere una parti colare combinazione, il che mostrerebbe l'affinità fra i due usi della parola « chiave » in questo contesto) . Proprio come un estraneo non è in grado di accedere alla vostra cassaforte se non conosce la com binazione, pur sapendo come è stata progettata la vostra serratura, così il nemico può sapere quale sistema crittografico state usando senza tuttavia riuscire a penetrare nei vostri messaggi cifrati, passo per il quale è indispensabile conoscere la vostra chiave . In un tipico crittosistema a chiave privata, il mittente e il desti natario si accordano preventivamente su una qualche chiave segreta

37

NUMERI PRIMI

che poi usano per scambiarsi messaggi. Finché tengono segreta tale chiave, il sistema, se ben strutturato, dovrebbe essere sicuro . Un esempio è dato dal sistema di ideazione americana Data Encryp tion Standard (DES) , la cui chiave è formata da un numero di 56 cifre in rappresentazione binaria (in altre parole una lista di 56 zeri e uno) . Perché una chiave tanto lunga? Perché il funziona mento del DES non è un segreto per nessuno. Tutti i particolari sono stati pubblicati, e in teoria un nemico potrebbe decifrare i vostri messaggi semplicemente provando tutte le possibili chiavi una dopo l' altra finché ne trova una che funziona. Con il DES ci sono 2 56 chiavi, un numero così grande da rendere l'impresa vir tualmente impossibile. In realtà questa cifra non è ancora suffi cientemente grande per fornire una sicurezza assoluta, ma in qua lunque sistema cifrato si deve accettare un compromesso tra la sicurezza e la convenienza per l'utente. Più complessa è la chiave, più ingombrante diventa il processo . Sebbene al momento attuale il DES sia ampiamente diffuso, sistemi come questo hanno un ovvio svantaggio . Prima di poterlo usare, il mittente e il destinatario devono accordarsi sulla chiave

Mittente

Destinatario

Figura 1 . 1 Un tipico sistema in codice. Il programma di codifica (che può essere un dispositivo ad hoc, o un programma per un calcolatore qualsiasi) utilizza una chiave segreta scelta da chi produce il testo in codice. Un sistema analogo opera all'altra estremità. I sistemi tradizionali impiegano la stessa chiave sia per la codifica che per la decodifica, e il pro gramma di decodifica compie semplicemente le operazioni del programma di codifica invertendone l'ordine. I sistemi a chiave pubblica utilizzano due chiavi diverse e la relazione tra la codifica e la decodifica dipende dalla matematica implicata nel codice.

CAPITOLO PRIMO

che useranno e, poiché non potranno trasmettersela su un qual siasi canale di comunicazione, dovranno incontrarsi per scegliere la chiave (o, come minimo, servirsi di un corriere fidato) . Un tale sistema non è opportuno per comunicazioni tra individui che non si conoscano già. In particolare, non si presta a essere utilizzato per scambi internazionali in campo bancario o commerciale, dove spesso si rivela necessario inviare messaggi in giro per il mondo a destinatari non conosciuti dal mittente. Nel 1 975 Whitfield Diffie e Martin Hellman proposero un nuovo tipo di sistema cifrato, la crittografia a chiave pubblica, in cui sono richieste non una ma due chiavi, una per cifrare e l' altra per decifrare : in pratica, è una serratura con una chiave per chiu dere e una per aprire . Un siffatto sistema funziona così : un nuovo utente acquista il programma usato da tutti gli appartenenti alla rete di comunicazione. Quindi, tramite il programma, genera due chiavi : una delle due, la sua chiave di decodifica, la tiene segreta; l'altra, quella che sarà usata per cifrare messaggi inviati a lui da chiunque altro nella rete, la pubblica in una guida degli utenti . Per inviare un messaggio a un utente della rete, basta cercare la sua chiave pubblica, cifrare il messaggio usando quella chiave e spedirlo . Per decifrare il messaggio non serve conoscere la chiave di codifica, che è nota a tutti: occorre la chiave di decodifica, cono sciuta soltanto dal destinatario. Con questo sistema neppure il mit tente è più in grado di decifrare il proprio messaggio, una volta che lo abbia codificato ! Tutto questo in teoria, ma come costruire, in pratica, un tale sistema? Sembrerebbe impossibile . La chiave, se mi è concesso di usare questa parola, consiste nello sfruttare i punti forti e i punti deboli di quegli stessi calcolatori la cui esistenza rende tanto diffi cile il compito del crittografo . Come è stato detto prima in questo capitolo, trovare numeri primi grandi (diciamo dell'ordine di 50 cifre) è relativamente facile, come pure moltiplicarne due per atte nerne uno solo di un centinaio di cifre o più . Ma scomporre un tale numero nei suoi due fattori primi è praticamente impossibile . Questa è l'idea che sta alla base del sistema a chiave pubblica mag giormente in uso oggi, il sistema RSA, dalle iniziali dei suoi idea tori Ronald Rivest, Adi Shamir e Leonard Adleman del Massa chusetts Institute of Technology. La chiave segreta di decodifica

NUMERI PRIMI

39

consiste essenzialmente in due grandi numeri primi scelti dall'u tente con l' aiuto di un computer (e non certo da un qualunque elenco di primi, al quale un nemico potrebbe avere accesso) . La chiave pubblica di codifica è il prodotto di questi due primi . Poi ché non c'è un metodo veloce di scomposizione di grandi numeri, è praticamente impossibile recuperare la chiave di decodifica dalla chiave pubblica di codifica. La cifratura di un messaggio corri sponde alla moltiplicazione di due grandi numeri primi (processo relativamente facile) , la decifrazione al processo opposto di scom posizione in fattori (processo decisamente non facile) . In realtà, il sistema non è così semplice . Occorre un minimo di conoscenze matematiche, tutte note dal tempo di Fermat . Il punto importante è che, poiché decifrare un messaggio è esattamente l'opposto che cifrarlo, lo stesso deve valere per la relazione tra le due chiavi . Ecco perché oggigiorno la sicurezza di grandi reti internazio nali di dati fa affidamento sull'incapacità dei matematici di tro vare un metodo valido di scomposizione in fattori di grandi numeri, in grado allo stesso tempo di produrre facilmente grandi numeri primi. Ovviamente, la sicurezza di tali sistemi dipende dalla diffi coltà non ancora superata di scomposizione in fattori, oltre che da altri elementi qui non menzionati. E questo è il punto in cui si è inserito l'incontro di Winnipeg . Gli ideatori del sistema soste nevano all'origine che due numeri primi di circa 50 cifre fossero sufficientemente sicuri (come sempre con sistemi del genere, più grandi sono i numeri usati, più costoso diventa farli funzionare, e quindi si cerca un punto di compromesso) . Fino al 1 982 i migliori metodi di scomposizione sviluppati erano in grado di trattare numeri di circa 50 cifre, servendosi di grandi macchine come il CRAY- r . Avendo capito come la struttura particolare delle unità aritmetiche del CRAY- r poteva essere sfruttata per superare uno dei problemi su cui erano bloccati, il progettista di computer Tony Warnock fornì agli esperti di scomposizione in fattori Marvin Wun derlich e Gus Simmons proprio le informazioni di cui avevano biso gno per estendere i loro modelli di calcolo a numeri da 6o a 70 cifre . Di colpo i sistemi RSA risultarono meno sicuri . Sebbene la contromossa sembrasse ovvia (usare numeri primi di r oo cifre cia scuno per produrre una chiave pubblica di 200 cifre) , questo avan zamento inatteso causò un'ondata di incertezza nel settore della

CAPITOLO PRIMO

sicurezza delle comunicazioni. Questa sensazione di insicurezza è stata ancora aumentata da ulteriori progressi nella scomposizione in fattori; sebbene numeri di 90 cifre sembrino essere l' attuale limite massimo di scomposizione, la quantità di matematica sofi sticata che viene comunemente usata per affrontare il problema potrebbe in qualsiasi momento sfondare tale limite.

C apitolo

2

Gli insiemi, l'infinito e la non-decidibilità

Nuovi orizzonti T alvolta la risoluzione di un annoso problema segna la fine di un' area di ricerca in matematica, e il risultato di anni di studi sem bra chiudere un'era; in altri casi, invece, può dischiudere orizzonti del tutto nuovi e imprevisti. Questo è quanto accadde nel 1 963 con la soluzione del problema del continuo di Cantor da parte di Paul Cohen, matematico ventinovenne della Stanford University. Non solo la natura della soluzione era rivoluzionaria, ma anche i metodi sviluppati da Cohen per ottenerla erano del tutto nuovi. Si vide subito che tali metodi avevano una vasta gamma di appli cazione, e nei venti anni seguenti molte ricerche presero spunto dalla scoperta di Cohen. In riconoscimento di questo lavoro, al giovane ricercatore venne assegnata nel 1 966 la medaglia Fields, la più alta onorificenza che si possa concedere a un matematico, equivalente al premio Nobel per le altre scienze. Prima del 1 963 , un matematico, posto di fronte al problema di determinare la natura di un'ipotesi, aveva due possibilità: pro varne la verità o la falsità. L'esperienza e l'intuizione sono spesso le sole guide per capire quale delle due possibilità merita lo sforzo più grande; una scelta sbagliata può causare un'enorme perdita di tempo nello sforzo di ottenere l'impossibile. Ma, prima del 1 963 , si aveva sempre la sensazione che alla fine della giornata si sarebbe arrivati a una risposta. Cohen distrusse per sempre questa convinzione confortante, dimostrando che ci sono propo sizioni matematiche che non sono né vere né false, ma indecidibili.

CAPITOLO SECONDO

A onor del vero, l'esistenza di proposizioni indecidibili era già stata stabilita da Kurt Godei nel I 93 I ma, come spiegheremo più avanti, non si pensava che questo fatto potesse influenzare la matematica « quotidiana », come fu invece con il risultato di Cohen. Per spiegare esattamente ciò che avvenne nel I 963 è necessa rio risalire alla natura intrinseca della matematica, e ad un'idea pionieristica dell'inizio del secolo . Il

metodo assiomatico

Di fronte al problema di determinare la verità o la falsità di un'ipotesi, fisici, chimici, biologi, insomma, quasi tutti gli scien ziati approntano qualche esperimento o, come minimo, fanno uso di qualche ragionamento che dipenda dall'evidenza sperimentale. Deve essere così, perché queste scienze studiano vari aspetti del mondo fisico, il quale è l' arbitro finale tra « ciò che è » e « ciò che non è » . Ma cosa avviene in matematica? Al livello più elementare, la matematica è molto simile a qual siasi altra scienza fisica, in quanto sceglie alcuni aspetti del mondo attorno a noi per studiarli in dettaglio . Così facendo, la realtà che ci circonda può fornirci qualche informazione. Se si vuole verificare che la somma degli angoli interni di un triangolo è pari a I 8o gradi, si può andare in giro a misurare gli angoli di un'e norme quantità di triangoli . Questa verifica sarebbe certo accet tata da un fisico o da un chimico, ma non da un matematico; né un tale procedimento costituirebbe una verifica matematica dell' asserzione che la somma degli angoli di qualsiasi triangolo è I 8o gradi . La ragione per cui un metodo puramente sperimentale non è adeguato per determinare la verità matematica sta nella natura stessa della matematica, e in ciò che si vuole che sia. Benché le sue radici affondino nel mondo fisico, la matematica è una disci plina precisa e formalizzata. Punti, rette, piani e altri concetti mate matici non hanno un'esatta contropartita nella realtà (il cap . 4 fornisce alcune interessanti delucidazioni su questo punto) . Il mate matico si fa una visione del mondo del tutto astratta e idealizzata, e ragiona con le sue astrazioni in modo assolutamente preciso e

GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ

43

rigoroso . Il semplice (ma importante) esempio che segue potrà ser vire a chiarire le idee . Una delle astrazioni matematiche più elementari è quella di numero . È attraverso i numeri che la maggior parte di noi ha fatto il suo primo incontro, di solito in tenera età, con le astrazioni mate matiche. Con un processo che sembra quasi un miracolo quando ci si rifletta, già nei primi anni di vita arriviamo tutti a ricono scere che c'è qualcosa in comune tra una collezione di tre mele, una collezione di tre zii, una collezione di tre fiori e così via. Que sta astrazione dell' « idea di tre » induce la formazione del concetto mentale del numero tre . Ciò che fa apparire questo miracoloso è il fatto che il numero tre non esiste affatto in natura; è un concetto puramente astratto, con cui però siamo talmente familiari che non ci sentiamo a disagio quando parliamo di « numero tre » o di qual siasi altro numero . Ci si rende davvero conto del grado di astra zione quando si prova a spiegare cos'è il numero tre senza usare la parola « tre »: non ci si riesce, eppure nessuno di noi se ne preoc cupa. La stessa cosa vale per tutte le altre astrazioni matematiche: sebbene possano avere le loro origini nel mondo reale, le astra zioni in quanto tali sono concetti puri, che non esistono al di fuori della nostra mente. Il concetto di numero sta alla base di quel settore della mate matica che è la teoria dei numeri, di cui abbiamo parlato nel capi tolo precedente. Come possiamo maneggiare dei concetti astratti, in modo che risultino utili anche nel mondo fisico? Iniziamo ad elencare qualche regola di base . Per i numeri, questo equivale a formulare dei postulati (o assiomi) universalmente validi, per poi procedere con successive deduzioni dai postulati iniziali serven dosi solo di ragionamenti logici e rigorosi. (È anche possibile sta bilire postulati che regolino le deduzioni logiche stesse; questo è il compito della logica matematica, una disciplina strettamente con nessa con l' argomento di questo capitolo) . Per esempio, sappiamo per esperienza che quando due numeri sono sommati tra di loro l'ordine con cui sono presi è senza importanza; così 5 + 3 è lo stesso di 3 + 5 · Un primo assioma « ragionevole » da includere in un sistema per l'aritmetica è l' affermazione: per ogm m e n ,

m + n = n + m.

44

CAPITOLO SECONDO

Questa particolare proposizione è la cosiddetta proprietà commu tativa dell'addizione. Un altro esempio è la proprietà associativa del l'addizione: per ogni m, n e k,

(m + n) + k = m + (n + k) .

Anche questo postulato deriva dall'osservazione del modo di fare le addizioni nella pratica . Per esempio, se si vogliono addizionare i tre numeri 3 , 5 e I O , non ha importanza se si sommano prima 3 e 5 (ottenendo 8) e poi si aggiunge I O al risultato, oppure si addi zionano 5 e I o (ottenendo I 5) e poi si somma 3 : sia in un caso che nell' altro si ottiene I 8 . Adottando i due assiomi precedenti abbiamo già fatto un grande passo, un passo che equivale a un atto di fede. Entrambi gli assiomi possono essere verificati « sperimentalmente » esaminando molti numeri, ma non esiste neppure la possibilità teorica di verificare tutti i casi possibili, poiché sono infiniti . Possiamo allora essere sicuri che i due assiomi rimangano veri quando i numeri coinvolti sono molto grandi, per esempio dell'ordine di milioni di cifre? Sem bra ragionevole, probabilmente anche ovvio . Ma la matematica (e la maggior parte delle altre discipline) è piena di esempi di « verità ovvie » che risultano false: sulla base dell'esperienza corrente sembra persino ovvio che il Sole giri intorno alla Terra! Le prove di cui di sponiamo possono solo suggerire che i due assiomi siano veri. Non sarà mai possibile dimostrarlo definitivamente: la loro verità deve essere assunta a priori. Questo è il motivo per cui tali affermazioni sono chiamate assiomi, dalla parola latina axioma che significa « principio ». In un certo senso, è possibile « dimostrare » i due prece denti assiomi, formulando postulati « più fondamentali » per i numeri naturali da cui dedurre le più note regole dell' aritmetica; ma que sto sposta solamente l'atto di fede un passo indietro, non lo elimina. Per sottolineare il punto principale del capoverso precedente, vale la pena forse di ricordare che, sebbene entrambe le proprietà considerate siano accettate come assiomi per l'aritmetica degli interi, la proprietà commutativa è falsa per determinati sistemi di numeri infiniti (vedi oltre in questo capitolo) e la proprietà asso ciativa non vale quando è applicata all' aritmetica del calcolatore (ciò accade quando numeri molto grandi sono addizionati ad altri molto piccoli) .

45

GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ

A questo punto è bene dare uno sguardo un po' più in dettaglio allo sviluppo assiomatico di una teoria matematica. Poiché abbiamo già visto alcuni aspetti dell' aritmetica degli interi (cioè i numeri interi positivi e negativi) , continuiamo su questa strada.

Un esempio: gli interi Gli assiomi seguenti permettono uno studio adeguato dell' arit metica di base (cioè addizione e moltiplicazione) degli interi . ( I ) Per ogni m, n, m + n = n + m e mn = nm (proprietà commu tativa dell' addizione e della moltiplicazione) . (z) Per ogni m, n, k, (m + n) + k = m + (n + k) e (mn) k = m (nk) (proprietà associativa dell' addizione e della moltiplicazione) . (3 ) Per ogni m, n, k, m (n + k) = (mn) + (mk) (proprietà distribu tiva della moltiplicazione rispetto all' addizione) . (4) Esiste un numero O tale che, per qualsiasi numero n, n + O = n (esistenza dell'elemento neutro additivo) . (5) Esiste un numero I tale che per qualsiasi numero n, n x I = I (esistenza dell'elemento neutro moltiplicativo) . (6) Per ogni numero n esiste un numero k tale che n + k = O (esi stenza dell'elemento simmetrico additivo) . (7) Per ogni m, n, k, se k è diverso da O e km = kn, allora m = n (legge di cancellazione) . Partendo da questi assiomi, è possibile dimostrare tutte le pro prietà usuali dell' aritmetica degli interi . A titolo di esempio, c'è una regola analoga all' assioma 7 che si riferisce all' addizione: se

k + m = k + n,

allora

m = n.

Per provare questo, si parta dalla relazione k + m = k + n . Allora, per l' assioma I , m + k = n + k. Per l' assioma 6, sia l un numero tale che k + l = O . Addizionando l ad entrambi i membri della precedente equazione, otteniamo :

(m + k) + l = (n + k) + l.

46

CAPITOLO SECONDO

Così, per l' assioma 2 :

m + (k + l) = n + (k + l) . In altre parole, tenendo conto della scelta di l

m + O = n + O. Usando l' assioma 4, segue subito da quest'ultima equazione che

m=n come richiesto . Ancora, per dimostrare che x x O = O per ogni numero x, ragio mamo come segue . x + O = x (per l' assioma 4, con n = x) , = x X I (per l' assioma 5 , con n = x) , = x x ( I + O) (per l' assioma 4, con n = I ) , = (x X I ) + (x X O) (per l'assioma 3 , con m = x, n = I , k = O), = x + (x X O) (per l'assioma 5, con n = x) . Così dalla proprietà analoga all' assioma 7, valida per l' addizione, appena provata (con k = x, m = O , n = x X O) :

O=x

x

O.

A questo punto può darsi che il lettore voglia verificare ciascuna delle seguenti proprietà di base dell' aritmetica degli interi. In cia scun caso, si dovrebbe assicurare di usare solamente proprietà già conosciute, o perché sono assiomi o perché sono già state provate. ( I ) Esiste uno e un solo elemento O che soddisfa le condizioni dell' assioma 4, vale a dire: se O ' ha la proprietà che n + O ' = n per ogni numero n, allora O ' = O (unicità dello O) . ( 2 ) Esiste uno e un solo elemento I che soddisfa le condizioni del l' assioma 5 (unicità di I ) . (3) Per ogni coppia m, n esiste uno e un solo numero k tale che n + k = m.

Si noti che l'ultimo dei risultati precedenti garantisce che la sot trazione è sempre possibile negli interi (poiché l'unico numero k sarà m - n) , anche se questa operazione non è stata menzionata negli assiomi veri e propri. Un caso particolare è quello in cui m = O, il che prova l'unicità di k nell' assioma 6.

GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ

47

Naturalmente, se in matematica fosse necessario dimostrare ogni affermazione in modo così dettagliato il compito del ricercatore sarebbe praticamente impossibile. Le cose sono semplificate dal fatto che la conoscenza matematica è cumulativa: una volta che una proprietà è stata dimostrata, da quel momento può essere usata senza difficoltà, come abbiamo fatto in precedenza per provare che x X O = O. Di conseguenza, queste dimostrazioni minuziose sono necessarie solo per le parti iniziali di una teoria assiomatica. Nella maggior parte dei casi il ragionamento matematico è molto più simile a una versione rigorosa della « logica di base » impiegata in qualsiasi altra scienza.

Consistenza, completezza, verità La maggior parte della matematica moderna consiste nel fare deduzioni da assiomi, che non si riferiscono necessariamente ad alcunché di fisico . Gli assiomi per l' aritmetica degli interi, dati nel precedente paragrafo, sono stati ottenuti esaminando il com portamento delle operazioni di addizione e moltiplicazione su quegli interi che ci sono familiari (ciò equivale a dire interi piccoli, seb bene sia utile ricordare che i numeri negativi sono stati definiti vamente accettati solo nel secolo XVIII, come vedremo nel cap . 3 ) . Una volta stabiliti gli assiomi, ogni domanda sulla loro « verità » diventa irrilevante, così come lo diviene il problema di quali siano gli oggetti ai quali gli assiomi si riferiscono . Ad esempio, in nessuno degli assiomi dati nel precedente paragrafo è fatta alcuna menzione di cosa sia esattamente un numero . Esistono infatti molte altre collezioni di oggetti matematici che pure, come conseguenza della loro definizione formale, risultano soddisfare questi assiomi. Poiché i sistemi di assiomi si applicano spesso a situazioni diverse tra loro, i matematici introducono termini specifici per descrivere le strutture che soddisfano un particolare sistema assiomatico . Qualsiasi struttura matematica che soddisfi gli assiomi del para grafo precedente è detta dominio di integrità (anello, se manca l' assioma 7) . Così, per richiedere che gli interi, insieme con le loro operazioni aritmetiche di addizione e moltiplicazione, soddisfino questi assiomi, è sufficiente dire che essi costituiscono un dominio

CAPITOLO SECONDO

di integrità. I numeri razionali (cioè le frazioni) , i numeri reali e i numeri complessi offrono altri esempi di domìni di integrità. Qualsiasi risultato ottenuto tramite deduzioni logiche a partire da un dato sistema di assiomi sarà vero per le strutture astratte che soddisfano quel sistema assiomatico; però non solo sarebbe impossibile rispondere a quesiti sulla « verità » del risultato nel mondo reale, ma i medesimi non avrebbero significato . Se gli assiomi forniscono una buona immagine di un fenomeno del mondo reale, allora anche le conseguenze di quegli assiomi avranno sen z' altro corrispondenza con il mondo reale e potranno persino offrire qualche informazione utile, in modo da giovare alla razza umana (o forse causarne la distruzione) . Per quanto concerne la matema tica, la pertinenza o meno degli assiomi iniziali è senza importanza. Alcuni sistemi assiomatici che hanno dato vita a campi di ricerca molto interessanti non sembrano avere alcun tipo di relazione con il mondo fisico; tuttavia questo non vuoi dire che non se ne potrà scoprire una in futuro . A costo di isolarsi dalla realtà, il matema tico è capace di lavorare in un mondo di assoluta certezza, con la potenziale ricompensa che il suo risultato trovi applicazioni estese (in primo luogo all'interno della matematica stessa) , perché il suo sistema di assiomi si adatta a strutture diverse da quella che aveva, o che poteva avere, in mente . Se allora il criterio non può essere quello della « verità», quali considerazioni regolano la formulazione di un sistema di assiomi? Un requisito essenziale è la consistenza: non si deve poter dedurre dagli assiomi due conseguenze tra loro contraddittorie . Questo requisito deve essere soddisfatto da tutti i sistemi assiomatici, anche se vedremo che provare la consistenza di un sistema è non solo difficile, ma implica persino considerazioni filosofiche . Un altro requisito d'obbligo per qualsiasi sistema assiomatico che voglia rappresentare una particolare struttura matematica (come l'aritmetica degli interi) è la completezza: il sistema assiomatico deve essere abbastanza ricco da permettere la dimostrazione di tutti i « fatti veri » relativi alla struttura in questione. Soddisfare entrambi i requisiti precedenti comporta una delicata azione di equilibrio : per ottenere la completezza, può essere necessario aggiungere nuovi assiomi, rischiando così di pregiudicare la consistenza.

GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ

49

I teoremi di incompletezza di Godet All'inizio del secolo il matematico tedesco di fama mondiale David Hilbert propose un programma per lo sviluppo della mate matica all'interno del formalismo rigoroso del metodo assiomatico . Secondo la convinzione di Hilbert, tutta la matematica può essere vista come la manipolazione logico-formale di simboli, basata su assiomi predefiniti . Questo significa che, in teoria, si potrebbe « produrre tutta la matematica » con un calcolatore. Nel 1 93 1 , però, il giovane matematico austriaco Kurt Godei, con due teoremi sor prendenti e del tutto inaspettati, dimostrò che il programma di Hilbert non poteva aver successo . Godei provò che ogni sistema assiomatico consistente, che sia abbastanza esteso da permettere lo sviluppo dell' aritmetica ele mentare degli interi, contiene sempre asserzioni che non possono essere né dimostrate né smentite a partire dagli assiomi di base (primo teorema di incompletezza) . Inoltre, la consistenza del sistema è tra quelle asserzioni indimostrabili a partire dagli assiomi, per cui la nozione di consistenza, fondamentale per il programma di Hilbert, è destinata a rimanere per sempre ambigua (secondo teorema di incompletezza) . Sebbene i risultati di Godei indicassero che il metodo assioma tico non avrebbe potuto essere elevato alla posizione di onnipo tenza immaginata da Hilbert, non si deve pensare che essi ne abbiano decretato la morte: il metodo assiomatico era ed è tut tora praticato all'interno della matematica ordinaria. Al contra rio, in questo secolo esso ha assunto una posizione preminente. Ciò che Godei ci ha costretto ad abbandonare è la convinzione o la speranza che un sistema assiomatico sia in grado di rispon dere a tutte le richieste che noi potremmo ragionevolmente fargli. Di fatto, con il crescente successo del metodo assiomatico, gli anni dopo l' annuncio di Godei videro gradualmente crescere la convinzione che soltanto alcune proposizioni molto tecniche non potevano essere provate . Ad esempio, Godei giunse al primo teo rema di incompletezza mostrando che nella teoria elementare dei numeri è possibile formulare un' asserzione analoga a questa, ovvia-

CAPITOLO SECONDO

mente paradossale, in italiano :

la frase inclusa nel riquadro in questa pagina

è falsa .

Nell' analoga proposizione sulla teoria dei numeri di Godei, « falso » è sostituito da « non dimostrabile ». Proprio perché l'aritmetica ele mentare è necessaria a formulare una tale proposizione, il risul tato di Godei si applica solamente a sistemi assiomatici capaci di svilupparla (ma naturalmente qualsiasi sistema assiomatico desti nato ad adempiere agli scopi del programma di Hilbert dovrebbe metterei in grado di ottenere l' aritmetica elementare) . Inoltre, tornando al secondo teorema di incompletezza di Godei, sebbene la consistenza di un sistema assiomatico sia un aspetto importante, il fatto che questa non possa essere provata a partire dagli assiomi non è poi così grave . Quando si cominciano a fissare gli assiomi, la loro consistenza viene data quasi per scontata, e l'in teresse principale sta nelle loro conseguenze . Ad esempio, l'ipo tesi che gli assiomi dell' aritmetica siano consistenti non è del tipo di cui in genere si preoccupano i teorici dei numeri, per i quali i risultati di Godei sull'incompletezza non sono poi così rilevanti. Perlomeno così sembrava prima che un giovane americano pro vasse il contrario. Il sorprendente risultato di Paul Cohen del 1 963 cancellò la gradevole sensazione che l'incompletezza non influen zasse i problemi « veri », colpendo proprio quella parte della mate matica che ne costituisce il fondamento: la teoria degli insiemi .

La teoria assiomatica degli insiemi Alla fine del secolo XIX, lo sviluppo della matematica pura (in particolare dei vari argomenti derivati dal calcolo infinitesimale di Newton e di Leibniz) portò il matematico tedesco Georg Fer dinand Ludwig Philipp Cantor a formulare una teoria generale che sarebbe servita come fondamento di tutta la matematica. La for mulazione di Cantor è tuttora un valido punto di partenza, ed è conosciuta come teoria degli insiemi. I suoi concetti e metodi per vadono praticamente tutta la matematica moderna, ma il suo svi luppo fin dalle origini è stato assai travagliato, come si vedrà nelle

GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ

51

pagine seguenti . Prima, comunque, è necessario soffermarci un attimo sulla logica formale . Mentre Cantar sviluppava le sue idee sulla teoria degli insiemi, e in particolare su un sistema di numeri adatti a misurare la « dimen sione » degli insiemi infiniti, Gottlob Frege ideava quella che ora è conosciuta come logica dei predicati. In linea di massima, essa fornisce un linguaggio formale universale che si adatta all'espres sione di un qualunque concetto matematico, anche se la sua impor tanza non è dovuta al reale bisogno o desiderio da parte dei mate matici di portare avanti il loro lavoro usando tale linguaggio. Invero, proprio per la sua struttura elementare, l'espressione di un con cetto o ragionamento matematico nell' ambito della logica di Frege sarà il più delle volte estremamente lunga e ingombrante . Il lavoro di Frege è importante per due motivi: primo, perché dimostra abba stanza chiaramente che tutti i vari settori della matematica sono parte di un'unica totalità coerente; secondo, molto più importante, perché ci mette in grado di fare un'analisi corretta dei metodi dedut tivi usati dai matematici nel costruire le dimostrazioni . (Si deve notare che, recentemente, è stato fatto largo uso della logica dei predicati nel tentativo di sviluppare programmi di calcolo che otten gano, o aiutino a ottenere, teoremi matematici . Ovviamente per presentare la matematica in una forma adatta al calcolatore si deve usare un linguaggio preciso e abbastanza semplice, e la logica dei predicati si presta bene allo scopo) . Il concetto di insieme introdotto da Cantar è estremamente sem plice . Un insieme è una collezione di oggetti o, almeno, una colle zione di oggetti matematici. L'idea nuova consiste nel considerare la collezione un unico oggetto a tutti gli effetti. Gli insiemi più pic coli possono essere descritti enumerando i loro membri (o elementi) , di solito racchiudendo la lista tra parentesi graffe . Così la scrittura: [ 1 , 3, 5. 9 } denota l'insieme i cui elementi sono i numeri I, 3 , 5, 9· Per insiemi più grandi (anche infiniti) , non è possibile elencare tutti gli ele menti, e allora si deve fare assegnamento su qualche proprietà per determinare l'insieme al quale si sta pensando . La notazione con venzionale per denotare l'insieme degli oggetti x per cui la pro-

52

CAPITOLO SECONDO

prietà P (x) è valida è:

( x [ P (x) ) . Allora, l'insieme di tutti i numeri primi (insieme infinito) può essere denotato con ( x [ x è numero primo ) . Vi saranno anche insiemi per i quali non esiste una proprietà defi nitoria, i quali non possono essere descritti per mezzo dei loro elementi, ma questo punto non è veramente rilevante per una discussione a livello elementare. (Grosso modo, tali insiemi nascono « per difetto », poiché la nozione di insieme non implica l'esistenza di una proprietà che lo determini; ma questo è un problema sot tile, di livello avanzato) . Ignoriamo per il momento questi insiemi ambigui a favore di quelli ben definiti, e chiediamoci quali pro prietà possano essere ritenute valide nella definizione di un insieme. La risposta di Cantar fu (come ormai possiamo aspettarci) : qual siasi proprietà che può essere espressa tramite la logica dei predi cati di Frege, che, proprio per la sua natura formale, è precisa, e include tutte le proposizioni della matematica. A questo punto le cose non potrebbero apparire più rosee . La teoria degli insiemi fornisce un adeguato modello di riferimento sul quale costruire tutte le strutture e gli oggetti matematici e la logica dei predicati di Frege offre un linguaggio universale per defi nire e trattare questi oggetti, ivi inclusa la nozione stessa di insieme. Anche Frege fece un uso estensivo dei concetti della teoria degli insiemi nei suoi Grundgesetze der Arithmetik, opera che costitui sce il punto di arrivo della sua ricerca. Proprio mentre il secondo volume del suo libro era in stampa, Frege ricevette una lettera, datata 1 6 giugno 1 90 2 , da Bertrand Russell. « C 'è un solo punto in cui io ho incontrato una difficoltà », scriveva Russell, dopo un primo paragrafo di lodi al lavoro del col lega; tale « difficoltà » distruggeva completamente l'intera teoria di Frege . L'idea, nota come paradosso di Russell, è tanto semplice quanto profonda. Secondo il principio fondamentale della teoria degli insiemi di Cantar, se P (x) è una qualsiasi proprietà (esprimibile con la logica dei predicati) applicabile all'oggetto matematico x, allora esiste un insieme corrispondente formato da tutti gli x per

53

GU INSIEMI , L ' INFINITO E LA NON-DECIDIBIUTÀ

i quali

P(x)

è vera, cioè l'insieme

{ x i P(x) } . Niente impedisce che gli oggetti x qui implicati siano a loro volta

insiemi, giacché un insieme è un ente matematico come qualsiasi altro (anzi, quando la teoria degli insiemi è presa a fondamento della matematica, ogni ente matematico risulta essere un insieme di un tipo o di un altro) . Russell prese in considerazione la propo sizione (applicabile agli insiemi x)

R (x) :

x

non è un elemento di

x.

Il simbolo convenzionale per l' appartenenza a un insieme è E , di modo che x E y significa che x è membro di y, e la non apparte nenza è denotata con x f/. y. Così la proprietà di Russell R (x) può essere scritta come x f/. x. Diamo ora un nome all'insieme determinato dalla proprietà R (x), ad esempio y. In questo modo y

=

{ x l x f/. x } .

Poiché y è un insieme, è ragionevole domandarsi se y è un ele mento di se stesso . Se è così, allora y deve soddisfare la proprietà che lo definisce, che è come dire y f/. y, cioè y non è elemento di se stesso . D ' altro canto, se y non è elemento di se stesso, allora non può soddisfare la proprietà che lo definisce; quindi y E y, e y è elemento di se stesso . Così siamo arrivati a una situazione con traddittoria, dove se y è un elemento di se stesso, allora non lo è, e se non è elemento di se stesso, allora lo è . Un vero paradosso . Ciò che rendeva il paradosso di Russell così profondo era la sua assoluta semplicità. Esso utilizzava solamente i concetti fondamen tali dai quali dipende praticamente tutta la matematica. Una soluzione al dilemma provocato dal paradosso di Russell fu proposta dal matematico tedesco Ernst Zermelo, il cui lavoro sulle equazioni integrali (un' area della matematica che ha molte possibilità di applicazione) lo aveva portato a studiare alcuni pro fondi problemi relativi alla natura degli insiemi infiniti. Nel 1 908, allo scopo di stabilire un solido impianto insiemistico per il suo lavoro, pubblicò una ricerca in cui sviluppò un sistema di assiomi per la teoria degli insiemi. Modificata in seguito da Abraham Fraen-

54

CAPITOLO SECONDO

kel, la teoria degli insiemi di Zermelo-Fraenkel fu gradatamente accet tata come l'approccio assiomatico « corretto » alla teoria degli insiemi astratti. Una sua trattazione completa richiederebbe più spazio di quanto noi disponiamo; la si può però trovare in molti testi ele mentari (vedi in fondo al volume le Letture d'approfondimento) . In virtù dei teoremi di incompletezza di Godei, non c'è possibili tà, naturalmente, di provare che gli assiomi di Zermelo-Fraenkel per la teoria degli insiemi sono consistenti, ma essi sembrano sfug gire a paradossi del tipo di quello di Russell e la maggior parte dei matematici è convinta che non condurranno ad alcuna contraddizio ne; tale convinzione si è rafforzata man mano che la teoria ha mostrato di resistere alla prova del tempo e ad usi diversificati. Questo per quanto riguarda la consistenza. E la completezza? I teoremi di incompletezza ci garantiscono l'esistenza di proposi zioni sugli insiemi che non possono essere né provate né confu tate sulla base degli assiomi adottati. Questa impossibilità assume un'importanza maggiore del solito a causa della particolare natura della teoria degli insiemi . Poiché l'intero edificio della matema tica moderna può essere (e in larga misura lo è in modo esplicito) costruito su tale teoria, si corre il rischio di fornire basi instabili a molte importanti aree di ricerca. Nonostante questa possibilità, gli assiomi di Zermelo-Fraenkel apparvero idonei a fornire una « buona » teoria degli insiemi, e la maggioranza dei ricercatori ignorò tranquillamente il pericolo dando per scontato che ciò non li riguar dasse . Questo fu vero fino al 1 963 , quando Cohen uscì alla ribalta con la sua scoperta. Sebbene il risultato di Cohen trovi ora applicazione in nume rosi settori, inizialmente interessò in modo particolare un problema che implicava i numeri « transfiniti » di Cantor, la cui teoria si rivelò ben fondata dopo la formulazione degli assiomi di Zermelo Fraenkel. È giusto quindi il momento di inoltrarci nell'infinito e di dare uno sguardo alla teoria di Cantor .

Insiemi infiniti Anche se il mondo in cui viviamo è finito, la matematica che ci serve per studiarlo coinvolge l'infinito quasi ad ogni passo: l'in-

GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ

55

sieme di tutti i numeri naturali è un insieme infinito, la scrittura precisa del numero :n richiede infinite cifre decimali, il numero di punti sulla più piccola delle linee è infinito e così via. Si sono fatti dei tentativi per evitare l'uso dell'infinito, ma la matematica che ne risulta viene ad essere assai ingombrante e pesante. Mal grado la sua completa astrazione, l'infinito è un mondo estrema mente semplice. Andare dal finito all'infinito è come allontanarsi dallo schermo televisivo : quando si è abbastanza lontani, la com plessità indecifrabile delle numerose e minuscole macchie luminose che occupano lo schermo assume la forma di un'immagine coerente; andando all'infinito, la complessità del finito si perde. Questo feno meno non è limitato alla matematica pura. In economia, ad esem pio, si preferisce studiare sistemi economici idealizzati con un numero infinito di operazioni piuttosto che i sistemi circoscritti ma molto complessi del mondo reale, e in fisica si usa la nozione di volumi infiniti per studiare alcuni concetti relativi al calore e all'energia elettrica. Il lavoro pionieristico di Cantor sulla teoria degli insiemi giunse a completamento proprio grazie allo sviluppo del sistema dei cosid detti numeri (o cardinali) transfiniti e della loro aritmetica. Ci si potrebbe domandare: « Perché abbiamo bisogno di tali numeri? » Per la stessa ragione per cui abbiamo bisogno di numeri finiti: per contare il numero di elementi di un insieme. I numeri naturali ser vono per misurare la dimensione di un insieme finito, mentre per misurare la dimensione di un insieme infinito sono necessari i trans finiti (vedremo tra poco che un solo « tipo » di infinito non è suffi ciente) . Avendo accettato questo punto, ci si potrebbe domandare che cos 'è un numero transfinito . Una buona risposta potrebbe essere: « Cosa è un numero finito? » Come dicevamo all'inizio di questo capitolo, i numeri naturali sono semplici prodotti dell'im maginazione, per cui postulare l'esistenza di numeri infiniti non dovrebbe essere poi tanto diverso . Ciò che importa è come questi numeri infiniti si comportino, e questo è il punto chiave della teo ria di Cantor . I numeri naturali vengono astratti da insiemi finiti, siano essi di tipo matematico o reali, come insiemi di mele, insiemi di per sone e così via: il numero tre è ciò che tutti gli insiemi di tre ele menti hanno in comune. Questa sembrerebbe a prima vista una

CAPITOLO SECONDO

definizione « tautologica », che non è affatto una definizione, ma Cantor osservò che le cose non stavano così. Piuttosto, prima di parlare di transfiniti dobbiamo spiegare il concetto di cardinalità degli insiemi, che ora vedremo . Due insiemi, chiamiamoli A e B , hanno la stessa dimensione o cardinalità se è possibile accoppiare i loro elementi in modo tale che ogni elemento di A sia associato esattamente a un elemento di B e viceversa. Così per esempio, gli insiemi

A = ( I, 2, 3, 4 ) ,

B = I OO ,

:n ,

..J2,

�

hanno la stessa cardinalità, come si può vedere dalla corrispon denza (che non è l'unica possibile) : 2

I I OO

3

4

t

t I 2

..J2

:n

Allo stesso modo gli insiemi

A = ( a, b, c ) ,

B = ( piede, calza, scarpa )

hanno la stessa dimensione in virtù della corrispondenza

a

b

c

t piede

calza scarpa.

Si noti che in nessuno dei due casi emerge il concetto di « numero di elementi » nell'insieme: per parlare di « uguale cardinalità » non è necessario avere a priori la nozione di « cardinalità », né c'è alcun bisogno di considerare solo insiemi finiti. Le stesse idee sono appli cabili a insiemi infiniti (anche se in questo caso non è possibile descrivere esplicitamente la corrispondenza) . Quando passiamo agli insiemi infiniti, tuttavia, ci troviamo subito di fronte a qualche risultato inaspettato . Ad esempio, sia A l'insieme dei numeri natu rali e sia B l'insieme dei numeri pari . Intuitivamente, B dovrebbe essere « la metà » di A, ma secondo la nostra definizione questi due insiemi hanno la stessa cardinalità, come è testimoniato dalla

57

GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ

corrispondenza

I

2

3

4

5

t

t

t

t

t

2

4

6

8

IO

t

Non c'è comunque contraddizione, o , se c'è, è solamente con i nostri preconcetti . Non bisogna dimenticare che gli insiemi infi niti non sempre si comportano nello stesso modo di quelli finiti. Una simpatica illustrazione del genere di comportamento che si presenta con gli insiemi infiniti è fornita dall'albergo di Hilbert. Questa istituzione puramente astratta ha un numero di stanze infi nito, numerate con I , 2 , 3 e così via per tutti i numeri naturali. Una notte accade che tutte le stanze sono occupate da un numero infinito di ospiti. Tuttavia, un ritardatario può essere ancora allog giato senza che nessuno venga messo fuori: basta sistemare il nuovo arrivato nella stanza I , spostando il suo occupante nella stanza 2 , l'occupante di quella nella 3 e così via . Tutti gli ospiti sono spo stati nella camera successiva, permettendo così al nuovo arrivato di occupare la camera I (in effetti è possibile sistemare infiniti ritar datari; riuscite a vedere come?) Sebbene l'idea di un albergo infi nito possa sembrare assurda, non c'è niente di sbagliato rispetto alla logica interna della discussione. Anche se contrario all'intui zione, questo è il genere di cose che succede quando si comincia ad esplorare il mondo dell'infinito . L'esempio dei numeri naturali e dei naturali pari potrebbe indurci a ipotizzare che tutti gli insiemi infiniti abbiano la stessa cardinalità, il che significherebbe che non occorre un sistema di numeri transfiniti . In realtà, ciò accade per molti insiemi infiniti che si incontrano comunemente in matematica: ne sono un esem pio l'insieme dei numeri primi, l'insieme dei numeri naturali, l'in sieme dei numeri interi e l'insieme dei numeri razionali. Gli insiemi aventi la stessa cardinalità dei naturali sono spesso chiamati nume rabili, poiché mettendoli in corrispondenza con i naturali è possi bile contare i loro elementi; ma, come scoprì C antor, non tutti gli insiemi infiniti hanno la stessa cardinalità, perché c'è un'intera gerarchia infinita di infiniti, che diventano sempre più grandi. La dimostrazione di Cantor di questo punto centrale è allo stesso

CAPITOLO SECONDO

tempo semplice ed elegante, e utilizza solo le nozioni fondamen tali della teoria degli insiemi . È nondimeno molto astratta, e pro prio per questo motivo sarà trattata a fine capitolo per chi voglia approfondire l' argomento . Qui ci limiteremo a dire che l'insieme dei reali non ha la stessa cardinalità dell'insieme dei naturali, pur avendo la stessa cardinalità dell'insieme dei punti del piano e del l'insieme dei punti dello spazio tridimensionale .

I transfiniti e il problema del continuo di Cantor Una volta che si sia afferrato il concetto di cardinalità si può procedere a sviluppare un sistema di « numeri » che può essere usato per « misurare » qualsiasi insieme, sia esso finito o infinito (i numeri in sé saranno solo delle astrazioni, naturalmente) . Il punto impor tante è che se due insiemi hanno la stessa cardinalità (vale a dire se i loro elementi possono essere associati nel modo descritto nel paragrafo precedente) , allora il numero di elementi di ciascun insieme deve essere uguale. Così ad esempio, quando si misura la cardinalità dei due insiemi

{ Fred, Elsie, Fido ) ,

{ a , b, c ) ,

si trova che entrambi hanno lo stesso numero di elementi, per l'esat tezza tre . Analogamente, quando si misura la cardinalità dei due insiemi infiniti

{ I,

2 , 3 , 4, 5 , . . ) , .

{ 2 , 4, 6, 8,

I O, . . . ) ,

si trova di nuovo che essi hanno lo stesso numero di elementi; in questo caso tale numero è il più piccolo dei transfiniti, indicato da Cantar con il simbolo �0, (si legge aleph-zero : « aleph » è la prima lettera dell' alfabeto ebraico; il motivo per cui si sottoscrive lo zero sarà chiaro tra un momento) . Cosa è il « numero tre »? Ciò che tutti gli insiemi di tre elementi hanno in comune o, per dirla in altro modo, è ciò che è comune a tutti gli insiemi aventi la stessa cardinalità dell'insieme { a, b, c ) : « tre » è un' astrazione che emerge dalla nozione di cardinalità. Ci sono vari metodi in matematica per rendere precisa questa affer mazione, ma qui non ne prenderemo in esame nessuno . Il punto

GLI INSIEMI, L ' INFINITO E LA NON-DECIDIBILITÀ

59

principale è che la finitezza non è affatto rilevante. Così se si accetta il concetto di « numero tre » non si dovrebbe avere difficoltà ad accettare il « numero 1'\ 0 », che accomuna tutti gli insiemi aventi la stessa cardinalità dell'insieme degli interi positivi . Come detto prima, non tutti gli insiemi infiniti hanno la stessa cardinalità: esiste una intera gerarchia infinita di infiniti; proprio come c'è una serie infinita di numeri finiti I , 2 , 3 , . . . , così pure c'è una serie infinita di transfiniti 1'\0, 1'\ 1 , 1'\ 2 , 1'\ 3 , . . . , ciascuno maggiore di quello precedente . L' addizione e la moltiplicazione degli aleph di Cantor vengono ad essere particolarmente semplici (e quasi sorprendenti, a prima vista) . In tutti e due i casi il risultato è dato dal maggiore tra i due transfiniti . Così ad esempio 1'\ o + 1'\ 1 = 1'\ 1 , 1'\ 1 x 1'\ 3 = 1'\ 3 . La proprietà dell'albergo di Hilbert corrisponde al fatto che 1'\ 0 + + I = 1'\0; per far « traboccare » l' albergo dovrebbero arrivare 1'\ 1 ospiti. Molti degli insiemi infiniti che si incontrano in matematica hanno cardinalità 1'\ 0 : l'insieme degli interi positivi, l'insieme di tutti i numeri interi (cioè positivi e negativi) , l'insieme dei razionali e l'in sieme dei numeri primi. Ma, come Cantor mostrò, l'insieme di tutti i numeri reali ha senza dubbio più di 1'\0 elementi. Il quesito che ne scaturisce è quale sia la dimensione di questo insieme. Poiché non è 1'\0, deve essere uno degli 1'\ 1 , 1'\ 2 , 1'\3, . . . , ma quale? Malgrado ripetuti tentativi, neppure Cantor fu in grado di rispondere a que sta domanda apparentemente semplice, così come non vi riuscirono altri valenti matematici . Infatti il problema del continuo di Cantar (è questo il nome con cui è noto) ha resistito a tanti e tali tentativi di risoluzione, che David Hilbert, quando tenne un'allocuzione intro duttiva al Congresso internazionale dei matematici nel I900 a Parigi, la incluse in un elenco di problemi che egli vedeva come le sfide più importanti per i matematici nel nuovo secolo che iniziava. Il nome del problema deriva dal fatto che si chiede di determinare la cardinalità del continuo reale, essendo questa la parola usata per descrivere l'insieme dei numeri reali quando siano considerati come i punti che costituiscono la retta reale.

6o

CAPITOLO SECONDO

Fu fatto qualche progresso nel 1 93 8 , quando Kurt Godei usò nuove tecniche di logica matematica per dimostrare che, partendo dagli assiomi di Zermelo-Frenkel, non è possibile provare in modo definitivo che l'insieme dei numeri reali non ha dimensione � 1 • Questo però non risolse il problema, poiché non s i escludeva l'ipo tesi che gli assiomi fossero, semplicemente, insufficienti per deci dere in un senso o nell'altro . Tuttavia, nonostante questa possibilità, negli anni che seguirono il risultato di Godei tutti sembravano convinti del fatto che il pro blema del continuo fosse in realtà decidibile all'interno della teoria di Zermelo-Fraenkel. Nel qual caso, poiché Godei aveva mostrato che non si poteva dimostrare che la risposta fosse diversa da � 1 , il continuo doveva avere cardinalità � 1 ; con il tempo, ciò sarebbe stato provato in modo definitivo . Di conseguenza, non fu conside rato del tutto irragionevole assumere questa tesi proposta da Godei, ogni volta che un problema matematico richiedesse la conoscenza della cardinalità del continuo, e molti risultati furono provati con l'assunto che l'ipotesi del continuo fosse vera (cioè che il continuo avesse cardinalità � 1 ) . Nel 1 963 giunse l a notizia che Paul Cohen della Stanford Uni versity aveva sviluppato una nuova tecnica logica con la quale era riuscito a provare che l'ipotesi del continuo non poteva essere dedotta dagli assiomi di Zermelo-Fraenkel. Sommato al risultato di Godei, questo confermò che l'ipotesi del continuo era di fatto non decidibile nel sistema di Zermelo-Fraenkel. Che altro dire? Dal risultato di Cohen si possono dedurre due conclusioni. Innanzitutto, esso dimostra l'inadeguatezza degli assiomi di Zermelo-Fraenkel, inadeguatezza che risulta molto grave. Un conto è sapere che il sistema è inadeguato, come era stato antici pato dai teoremi di incompletezza di Godei, ma il fatto che il sistema si riveli incapace di rispondere a un quesito basilare quale: « quanti sono i numeri reali? » è assai più grave. Qualche matematico cercò di parare il colpo sostenendo che si sarebbero dovuti formulare altri assiomi per ovviare all'inadeguatezza che era emersa. Se si intra prende questa strada, ci si trova a dover affrontare il problema di ricercare altri assiomi adatti. Poiché la teoria degli insiemi ha una natura sostanzialmente semplice e occupa una posizione basilare in matematica, qualsiasi assioma si introduca dovrà essere « credi-

GU INSIEMI, L ' INFINITO E LA NON-DECIDIBIUTÀ

61

bile ». Gli assiomi credibili sono quelli che, anche se a prima vista non appaiono ovvi (come del resto alcuni degli assiomi di Zermelo Fraenkel) , sembrano perlomeno naturali quando ci si accinge a stu diarli. Questa considerazione vieta di intraprendere la strada più facile, cioè di adottare semplicemente l'ipotesi del continuo come un assioma della teoria degli insiemi: nulla giustificherebbe tale com portamento . Il fatto che i matematici lavorino alla teoria assioma tica degli insiemi da oltre mezzo secolo senza aver trovato alcun altro principio simile induce la maggior parte degli esperti a con cludere che in realtà non esiste un assioma « mancante ». Rimane da considerare l'altra conclusione che si può trarre dalla scoperta di Cohen: per quanto poco piacevole la cosa possa appa rire, non esiste una sola teoria degli insiemi, bensì parecchie. (Pro prio come è successo per la geometria: nel secolo XIX si è giunti alla conclusione che non esiste una sola geometria « esatta », ma esi stono tre geometrie alternative, ciascuna con i suoi assiomi e i suoi teoremi) . In alcune teorie degli insiemi l'ipotesi del continuo sarà vera, e in altre sarà falsa. Il lettore avrà notato l'uso dell'espressione « parecchie » teorie degli insiemi, invece di « due ». Infatti, l'ipotesi del continuo non è la sola indecidibile partendo dagli assiomi di Zermelo-Fraenkel. Dopo la scoperta di Cohen nel 1 963 , risultò evidente che il suo nuovo metodo (detto di forcing) era applicabile a molte situazioni, non solo alla teoria degli insiemi. Nei due decenni seguenti si giunse a dimostrare la indecidibilità di numerosi problemi classici irrisolti. Si abbandonò per sempre la vecchia idea che, con sufficiente tempo e abilità, qualsiasi problema ben posto potesse in qualche modo essere risolto : alle asserzioni vere e a quelle false si affiancarono quelle indecidibili, che non sono né vere né false. Il metodo di Cohen fornì perlomeno un mezzo per stabilire l'appartenenza o meno di un pro blema a questa terza classe, sicché il suo risultato diede un contri buto positivo alla matematica. Il

teorema di Cantar

Come fece Cantor a dimostrare l'esistenza di un'intera gerar chia di infiniti? Per i lettori che volessero vedere un esempio di

CAPITOLO SECONDO

ragionamento matematico puramente astratto, ecco una versione moderna dell'argomentazione di Cantar. Essa prende avvio dalla nozione di sottoinsieme. Se X è un insieme qualsiasi, una qualunque collezione di oggetti estratti da X è detta sottoinsieme di X. Così, la collezione

{ a, c, d ) è un sottoinsieme della collezione

{ a, b , c, d, e, f ) . L'insieme dei numeri primi è un sottoinsieme dell'insieme di tutti i numeri interi. Si consideri ora l'insieme costituito da tutti i sottoinsiemi del l'insieme X. Esiste tale insieme? Reminiscenze del paradosso di Rus sell dovrebbero essere sufficienti ad invitare alla cautela nel postu lare l'esistenza di insiemi. In questo caso non ci sono problemi, per quanto se ne sa. Uno degli assiomi della teoria degli insiemi di Zermelo-Fraenkel dà per certa l'esistenza di un insieme di questo tipo, detto insieme delle parti (o insieme potenza di X), e indicato con fJ' (X) . Ad esempio, se X = { a, b ) , allora .9l (X) è costituito dagli insiemi 0, { a ) , { b ) , { a , b ) . Cos'è il simbolo 0? Rappresenta l'insieme vuoto o insieme nullo, l'insieme privo di elementi. Se questo è davvero un insieme, allora sarà sicuramente un sottoinsieme di qualsiasi altro insieme, dal momento che, in modo apparentemente banale, ma non di meno logicamente valido, un insieme senza elementi possiede la proprietà secondo la quale tutti i suoi « elementi » si trovano in qualunque insieme X si scelga. Basandosi esclusivamente su questo ragiona mento, si potrebbe pensare che non sia opportuno inserire tra le altre « finzioni » della matematica la nozione di insieme vuoto . Del resto, neanche zero è un vero numero . Ecco perché l'insieme vuoto è considerato un insieme a tutti gli effetti, non meno di tutti gli altri insiemi. È un elemento neutro proprio come il numero O. (In verità, O è il numero di elementi dell'insieme 0) . Un altro esempio: se X = { I , 2, 3 ) , allora .9l (X) è l'insieme i cui elementi sono gli insiemi: 0,

{ I ) , { 2 ) , { 3 ) , { I, 2 ) , { I, 3 ) , { 2, 3 ) , { I, 2, 3 ) .

GLI INSIEMI, L'INFINITO E LA NON-DECIDIBILITÀ

I due esempi dati dovrebbero essere sufficienti a mostrare che sembra essere un insieme molto più grande di X. Quando X ha due elementi, f!I (X) ne ha quattro, e quando X ne ha tre, f!I (X) ne ha otto . In verità, una dimostrazione matematica abba stanza semplice mostra che se un insieme finito X ha n elementi, allora f!I (X) ha zn elementi. Il lettore avrà capito dalla discussione sulla funzione esponenziale 2 n fatta nel capitolo r come la dimen sione di !!l (X) aumenti molto rapidamente al crescere del numero di elementi di X. Questa differenza nei ritmi di crescita continua fino all'infinito, anche se, come ha dimostrato l'albergo di Hilbert, tali spostamenti dal finito all'infinito non dovrebbero mai essere dati per scontati. Cantor ha dimostrato l'esistenza di un numero infinito di infiniti facendo vedere che, per qualsiasi insieme X, f!I (X) ha cardinalità maggiore di X. Di qui si giunge facilmente al con cetto di quantità infinita di infiniti: se X indica l'insieme dei numeri naturali, allora X1 = !!l (X) è un insieme di grandezza infinita mag giore di X, X2= f!I (X1 ) è più grande di X1 , X3 = f!I (X2 ) è più grande di x2 e così via. Per verificare il risultato di Cantor supponiamo « per assurdo » che f!I (X) abbia la stessa cardinalità di X. Il nostro compito è di ricavare una contraddizione da questa ipotesi. Ammesso che il ragio namento sia valido dal punto di vista logico, la conclusione inelut tabile sarà che l' assunto iniziale deve essere falso, dal momento che un assunto vero non può portare a un risultato falso o contraddit torio. Poiché X e f!I (X), per ipotesi, hanno la stessa dimensione, esisterà una corrispondenza tra questi due insiemi: per ogni elemento x di X ci sarà in !!l (X) un elemento in corrispondenza biunivoca con x, cioè tale che x non corrisponde a nessun altro elemento di X; inoltre ogni elemento di !!l (X) sarà il corrispondente di un elemento di X. Poiché questo ragionamento vuole essere valido per qualsiasi insieme X, finito o infinito, non è possibile raffigurare questa cor rispondenza servendosi di frecce come si è fatto altrove (si veda l'inserto A) . Ora si consideri un elemento arbitrario x di X. Allora il suo cor rispondente, che chiameremo A, è un elemento di f!I (X), cioè A è un sottoinsieme di X, costituito da alcuni degli elementi di X. Ci chiediamo se anche x sia compreso tra questi elementi, cioè se sia un elemento di A . È una domanda del tutto sensata. Per alcuni !!l (X)

CAPITOLO SECONDO

elementi x di X la risposta sarà presumibilmente « SÌ », per altri « no ». Sia U l'insieme di tutti quegli elementi x di X per cui x non è un elemento del suo corrispondente. L'insieme U consiste di elementi di X, quindi anche U è un sottoinsieme di X, cioè è un elemento di [!> (X) . Così U sarà il corrispondente di qualche elemento di X, che chiameremo w . Ora si ponga la domanda: « W è un elemento di U? » Se lo è, allora w soddisfa la proprietà che definisce U, cioè w non è elemento del suo corrispondente U; d'altro canto, se w non è un elemento di U, allora w non soddisfa la proprietà che definisce U, ed è quindi un elemento del suo corrispondente U. Questa è una situazione inso stenibile, una contraddizione. Come si è detto prima, l'unica con clusione possibile è che la congettura iniziale deve essere falsa: X e [!> (X) non possono avere la stessa dimensione, e il risultato di Cantor è dimostrato. Questo è uno straordinario esempio di come un disastro possa diventare molto proficuo. Al lettore non sarà sfuggito il paralleli smo tra il ragionamento di prima e il paradosso di Russell; ma in questo caso tutti i passaggi possono essere giustificati con assiomi di Zermelo-Fraenkel, e anziché ottenere una contraddizione costi tuita da un paradosso che demolisce un'intera teoria, si arriva alla dimostrazione desiderata, cioè che l'ipotesi iniziale è falsa. Lo sviluppo della teoria degli insiemi è stato un grande successo della matematica moderna, e oggi non c'è parte della matematica che non sia in qualche misura influenzata da idee e metodi tratti da questa teoria. Bertrand Russell definì il successo di Cantor « forse il più grande di cui la nostra epoca possa vantarsi »; e David Hil bert disse: « Nessuno ci potrà cacciare dal paradiso creato per noi da Cantor ».

GU INSIEMI, L' INFINITO E LA NON-DECIDIBILITÀ

Inserto

A

-

Dimostrazione del teorema di Cantor

Dato un insieme infinito X, si dimostra che g; (X) non ha la stessa cardinalità di X, ed è quindi maggiore. Il punto cen trale della dimostrazione consiste nel provare che la presunta esistenza di una corrispondenza tra gli elementi di X e quelli di g; (X) porta a una contraddizione. Se indichiamo gli ele menti di X con le lettere dell'alfabeto (che è un insieme finito, naturalmente, ma comunque adeguato a illustrare il procedi mento) , allora la presunta corrispondenza potrebbe essere così rappresentata: Elemento di X y

z

Sottoinsieme di X ( a, b, c, d ) = A ( y) ( b, d, p, q, z ) = A (z) .

In questo caso y non è un elemento dell'insieme A(y) con cui è in corrispondenza, mentre z è un elemento del suo insieme corrispondente A (z) . Sia U l'insieme di tutti gli elementi di X che non sono elementi del loro insieme corrispondente: U= ( x l x � A (x) ) . Dal momento che U è un sottoinsieme di X, U deve essere messo in corrispondenza con un elemento di X, ad esempio w : w +-+

U= A(w ) .

Cercando di stabilire se w sia o no un elemento dell'insieme A(w) , si arriva a una contraddizione. Se w è elemento di A(w) allora w non può essere in U, ma poiché U è proprio A(w) , questa è una contraddizione. D'altro canto, se w non è un elemento di A (w) , allora w sarà un elemento di U, e ancora, poiché U= A (w ) , arriviamo a una contraddizione.

C apitolo 3 I sistemi numerici e il problema del numero di classi

La soluzione di un problema che ha r Bo anni Nel 1 983 Don Zagier dell'Università del Maryland e del Max Planck Institut di Bonn, e Benedict Gross, della Brown Univer sity di Providence, annunciarono di aver risolto il problema del numero di classi, un problema famoso tra i matematici, proposto da Karl Friedrich Gauss nel r 8o r . Anche se la loro dimostrazione non era affatto la più lunga nella storia della matematica (questa sarà vista nel cap . 5) , con le sue 3 00 pagine era più lunga di molte altre . Quello che affascinò i matematici non fu tanto la lunghezza della dimostrazione, quanto la sua natura: era molto indiretta e collegava due aree della matematica apparentemente distinte in modo davvero notevole . Sebbene il problema e la sua soluzione siano altamente astratti e implichino alcuni concetti matematici molto difficili, in fondo tutto ha a che fare con sistemi numerici di vario tipo, ed è certa mente possibile descrivere gli aspetti generali della teoria. Questo sarà l'argomento del presente capitolo, nel quale si farà anche cenno allo sviluppo storico della matematica odierna.

Le notevoli proprietà del numero r63 Nel secolo XVIII il grande matematico svizzero Eulero scoprì, non si sa come, che la formula

/(n) = n 2 + n + 4 1

I SISTEMI NUMERICI

ha una proprietà abbastanza particolare: se si pone n uguale a un qualunque numero compreso tra O e 3 9 , il valore risultante di /(n) è un numero primo . Ad esempio /(O) = 4 1 è primo, come lo sono / ( r ) = 43 e /(2) = 4 7 · Non è stata scoperta nessun' altra formula quadratica che produca altrettanti numeri primi, partendo da n = O e operando con successivi valori di n. Sebbene la sequenza dei numeri primi si arresti per n = 40, perché /(40) = 4 1 2 , la formula produce ancora molti numeri primi. Tra i primi r o milioni di valori di f(n) la proporzione di primi è circa uno su tre, un rapporto molto più alto di quello di ogni altra formula quadratica (si veda il cap. 6 per un'ulteriore discussione sulle formule generatrici di numeri primi) . Poiché la formula di Eulero sembra così insolita nella sua copiosa produzione di numeri primi, è probabile che abbia qualcosa di par ticolare . Che cosa? Le proprietà delle formule relative agli interi spesso risultano strettamente collegate con le proprietà delle stesse formule considerate come formule per numeri reali, o anche per numeri complessi. C ' è un'intera branca della matematica, cono sciuta come teoria analitica dei numeri, che utilizza questo feno meno (si veda il cap . 9) . Cosa avviene quando la formula di Eulero è considerata una formula per i numeri reali? Per prima cosa riscriviamo la formula con x, simbolo usato soli tamente per un numero reale, al posto di n, usato piuttosto per un intero; allora si ha: / (x) = X 2 + x + 4 1 . A chiunque ricordi l' algebra imparata a scuola dovrebbero venire in mente le equazioni quadratiche: equazioni della forma

ax 2 + bx + c = O, che devono essere risolte rispetto a x, quando i valori di a, b, c sono noti. Il lettore potrebbe anche ricordare che esiste una for mula che dà le due soluzioni : - b ± ..J b 2 - 4 ac x= 2a (le due soluzioni dell'equazione si hanno scegliendo il segno + o il segno - ) .

68

CAPITOLO TERZO

Poiché non è possibile calcolare la radice quadrata di un numero negativo (quando si considerano i numeri reali) , il segno del l'espressione b 2 - 4 ac è molto importante . Se è positivo , l'equa zione quadratica avrà due soluzioni; se è negativa, non ci saranno soluzioni (reali) ; se risulta uguale a zero, allora ci sarà una sola solu zione, ma questo è un caso particolare . Tale espressione è chia mata il discriminante dell' equazione quadratica. Qual è il valore del discriminante della forma quadratica di Eulero X2 + X + 4I? Qui a

=

I, b = I,

C =

4 I , COSÌ

b 2 - 4 aC = I - I 64= - I 63 . Poiché il discriminante è negativo sappiamo immediatamente che l'equazione quadratica X 2 + x + 4 I= O non ha soluzioni (reali) . Ci sono due soluzioni complesse: x = - .l.. 2

±

l_ ...r;c;3 ;. ,

2

ma di numeri complessi si parlerà più avanti in questo capitolo . Qui, che lo si creda o no, sta la ragione del comportamento spe ciale della formula di Eulero come generatrice di numeri primi. La sua particolarità non sta nel fatto che il discriminante sia nega tivo (parecchie formule hanno questa proprietà) , ma che il suo valore sia esattamente - I 63 . « Cosa ha di strano il numero I 63 ? », ci si potrebbe domandare. Procedendo nella lettura si vedrà che è un numero davvero molto particolare, strettamente correlato ad alcune costanti matematiche fondamentali . Quali sono le più frequenti « costanti » della matematica, cioè quei numeri che continuano a saltar fuori nei posti più imprevi sti? La più nota è n , il rapporto tra la misura della circonferenza e il suo diametro . Questa definizione indica già che n è partico lare: perché mai si dovrebbe ottenere la stessa risposta per ogni cerchio, qualunque sia la sua dimensione? Già dalla fine del secolo XVIII si sapeva che n è irrazionale, vale a dire che la sua rappresentazione decimale continua indefinita-

I SISTEMI NUMERICI

mente, senza stabilizzarsi in alcun ciclo periodico . Con venti cifre decimali, n si scrive: n = 3 , I 4 I 592 653 589 793 2 3 8 46 . Grazie ai calcolatori, ora si conoscono più di 30 milioni di cifre di n . Oltre che nella geometria del cerchio, n ricorre in molte altre situazioni . Ad esempio la somma dei termini della successione infinita I __!__ + __!__ __!__ + __!__ _I_ + . . . 3 5 7 9 II -

-

-

vale n/4 . Lo sviluppo di metodi per il trattamento di somme infi nite come questa fu uno dei risultati più significativi conseguiti nel secolo xvm . Un altro esempio : la somma di I +I +I +I + ..., I+I6 4 9 25 dove l'n-esimo termine della successione è il reciproco di n 2 , è n 2/6 . n compare in quest' altra sorprendente situazione: se si lancia un fiammifero su una tavola sulla quale sono tracciate alcune linee parallele distanti tra loro quanto la lunghezza del fiammifero, la probabilità che il fiammifero vada a toccare una delle linee è 2/n . Dopo n, la costante matematica più frequente è e, la base dei logaritmi naturali. Anche il numero e è irrazionale e la sua rappre sentazione decimale è infinita. Con venti cifre decimali e si scrive: e = 2 , 7 I 8 2 8 I 8 2 8 459 045 2 3 5 3 6 . Anche e , come n , può essere definito i n vari modi: ad esempio, è quel numero per il quale il grafico della funzione y

= ex

ha la proprietà che il gradiente in ogni punto è uguale al valore di y nello stesso punto. Quindi, se una popolazione p cresce secondo la legge seguente p = e', dove t è il tempo, allora il tasso di crescita a ogni istante è esatta mente uguale alla dimensione della popolazione in quell'istante .

CAPITOLO TERZO

Un'altra definizione di e è la seguente: è quel numero tale che l'area delimitata dalle curve y = I/x, y = O, x = I , x = e è esattamente uguale a I (fig. 3 . I ) . Espressa in termini di integrale, questo equi vale a dire che

r�

dx = I .

Un' altra definizione ancora comporta una somma infinita: I +I +I +I + ..., e=I+2! 3! 4! I! dove N ! (da leggere « N fattoriale ») denota il prodotto I X 2 X 3 X 4 X . . . X N. In realtà, questo è un caso particolare della formula 2

}

4

ex = I + _!S_ + ..?S._ + ..?S._ + ..?S._ + . . . I! 2! 3! 4! Anticipando per un momento una teoria che sarà trattata più avanti in questo capitolo , osserviamo che la formula precedente

Figura J . I Definizione della costante e come il numero tale che l'area tratteggiata è esattamente 1 .

7I

I SISTEMI NUMERICI

è valida anche s e il numero x è complesso, cioè se h a l a forma a + ib, dove i = � . Questo porta a qualche sorprendente risultato; ad esempio, Eulero scoprì che

e.-i = - I . In altre parole, quando il numero irrazionale e è innalzato alla potenza di n (numero irrazionale) volte il numero immaginario r-r_ , il risultato è il numero intero - r . Un altro risultato ugual mente sorprendente che mette in relazione e, n e r-r_ è : i i = e - "12 = 0 , 2 07 879 5 76 3 . . . E ora veniamo al punto focale di questa discussione sulle costanti matematiche . I tre numeri n, e, ..{;63 sono tutti irrazionali. Tut tavia, con dodici cifre decimali, e" ..[[6j = 2 6 2 5 3 7 4 I 2 64o 768 744,ooo ooo ooo ooo . In realtà questo numero non è un intero; un valore più accurato è 2 6 2 5 3 7 4 I 2 640 768 743 . 999 999 999 999 250 che è corretto alla quindicesima cifra decimale . Dunque, e" ..J 1 6 ' è « quasi » un intero, cosa che non avviene per la maggior parte delle espressioni di tipo e" ..J" con k numero naturale. Ecco saltare di nuovo fuori il numero I 63 ; e se pensate che la cosa non sia casuale, ma che ci sia qualcosa sotto, siete nel giusto . Cosa ci sia di particolare nel numero I 63 sarà rivelato nel resto del capitolo . La storia comincia nella Grecia antica.

I primi sistemi numerici Sembra che i greci antichi siano stati i primi a sviluppare una teoria matematica dell' aritmetica. Sia la scuola ionica (fondata da Talete intorno al 6oo a. C . ) sia quella pitagorica (fondata da Pita gora circa cinquant' anni più tardi) diedero ampio sviluppo alla geometria e, in particolare i pitagorici, all' aritmetica. Furono i greci a rendersi conto per primi del fatto che i numeri naturali I , 2 , 3 , . . . formano una collezione infinita sulla quale si possono

CAPITOLO TERZO

eseguire le operazioni aritmetiche di base di addizione e moltipli cazione. Benché essi non conoscessero i numeri negativi come tali, sapevano come adoperare il segno meno in espressioni del tipo: (7 - 2 ) x (6 - 3 )

=

(7

x

6) - (7

x

3) - (2

x

6) + (2

x

3) .

Probabilmente il loro modo di affrontare il problema non era dis simile da quello espresso dalla vecchia cantilena di scuola: Meno per meno uguale più, la ragione non domandarla tu. Tuttavia c'era una buona ragione perché i greci rifiutassero di con siderare come numero un'entità come - 5 : essi pensavano ai numeri come a misure di distanze, aree e volumi. Le loro regole algebriche erano pensate in termini geometrici, come se, ad esempio, per som mare due numeri si sommassero insieme due aree (fig. 3 . 2 ) . S e i greci non s i servirono di numeri negativi, ebbero certamen te bisogno delle frazioni, o numeri razionali, come li chiamano

Figura 3 . 2 L'algebra greca. I greci consideravano identità algebriche del tipo (a - b)1 = a 1 - 2 ab + b1

in termini puramente geometrici. Per ottenere l'area tratteggiata cioè (a - b) 1, si può cominciare con il quadrato intero (a1), sottrarre il rettangolo formato dalle regioni I e III (ab) e quello formato dalle regioni II e III (ancora ab) e aggiungere il quadrato piccolo (b1) per compensare il fatto che questa area è inclusa in entrambi i rettangoli sottratti. Questo dà l'identità precedente.

I SISTEMI NUMERICI

73

Figura 3 · 3 I l teorema d i Pitagora. Per qualunque triangolo rettangolo avente lati a e b e ipote nusa h, vale l'identità h > = a > + b>.

Quando a= b = 1, questa identità dà h = ..f2, quantità irrazionale non esprimibile come quoziente di due numeri interi.

i matematici. Un numero razionale positivo è un numero della forma dove a e b sono entrambi numeri naturali . Poiché b può valere I , i numeri razionali includono i numeri naturali, cioè, uti lizzando la terminologia del capitolo 2 , i numeri naturali formano un sottoinsieme dei numeri razionali. Fino al secolo VI a. C . i greci credevano che il sistema dei numeri razionali positivi fosse ade guato ai loro scopi geometrici. In seguito essi si accorsero che questo non era sempre vero: in particolare, scoprirono che la radice qua drata di 2 non era un numero razionale; questo significa che, ad esempio, i numeri razionali sono inadeguati per misurare l'ipote nusa di triangolo rettangolo, la cui base e la cui altezza misurino una unità (fig. 3 .3 ) . Per poter misurare tutte le lunghezze geometri che sono necessari i numeri reali, sui quali ci soffermeremo tra breve . Questa scoperta segnò effettivamente la fine di qualsiasi passo avanti in aritmetica da parte dei greci, i quali da quel mo mento limitarono la loro matematica alle costruzioni geometriche.

a/b,

I numeri negativi La prima algebra sistematica che fece uso dello zero e dei numeri negativi fu sviluppata nel secolo vn d . C . dai matematici indiani, che si servirono di numeri negativi e positivi per descrivere tran sazioni finanziarie che coinvolgevano crediti e debiti. Oltre a essere

74

CAPITOLO TERZO

i primi a usare lo zero in modo moderno, essi scrissero equazioni con numeri negativi simbolizzati da un punto sopra il numero (un primo precursore del nostro segno meno) e formularono esplicita mente una legge dei segni (più per più è più, più per meno è meno, meno per meno è più) . Gli indiani, inoltre, si resero conto del fatto che ogni numero positivo ha due radici quadrate, una positiva e l' altra negativa. Tuttavia, questi primi sviluppi in India non influenzarono i mate matici europei del Rinascimento, tra il secolo XIV e il secolo XVI . Seguendo la tradizione greca, questi si divertivano a manipolare i segni meno, ma non riconoscevano i numeri negativi come tali. Le radici negative delle equazioni erano chiamate « radici fittizie ». Nel secolo xvn, alcuni matematici incominciarono a usare i numeri negativi, ma questa tendenza incontrò forti opposizioni, talvolta da parte di matematici eminenti . Cartesio parlava delle radici negative come di « false radici » e anche Blaise Pasca! pen sava che non potesse esistere un numero più piccolo di zero. Gott fried Leibniz, pur concordando sul fatto che i numeri negativi avrebbero potuto condurre a delle assurdità, li difese come un utile strumento nell'esecuzione di calcoli. Eulero accettò i numeri nega tivi, credendo però che fossero più grandi dell'infinito (il cui sim bolo è oo ) . Egli ragionava così: poiché a/O = oo , allora se noi divi diamo a per un numero più piccolo di zero il risultato deve essere più grande dell'infinito . Fu durante il secolo XVIII che finalmente si diffuse l'uso alge brico dei numeri negativi (indicati con il segno meno), benché anche allora molti matematici fossero perplessi e, se fosse stato possi bile, ne avrebbero volentieri evitato l'uso . In verità, è solo quando si adotta una teoria assiomatica dei numeri (vedi cap. 2) che i nega tivi acquistano davvero senso. Questa osservazione si applica altret tanto bene ai numeri complessi; prima, però, dovremmo dire qual cosa sui numeri reali .

I numeri reali Benché questa trattazione dei sistemi numerici sia divisa in para grafi secondo i differenti tipi di numeri, dal punto di vista storico

75

I SISTEMI NUMERICI

una tale distinzione è arbitraria, perché le teorie dei numeri nega tivi, dei numeri reali e dei numeri complessi si sono sviluppate più o meno nello stesso periodo . La sistemazione rigorosa dei reali fu senz' altro il risultato più importante. Era una questione molto deli cata, tanto che, sebbene nella teoria dei numeri complessi sia data per scontata l'esistenza dei numeri reali, furono proprio questi ultimi a essere formalizzati per ultimi. Per tutti gli scopi pratici i numeri razionali sono più che suffi cienti . Nel mondo reale (opposto a quello matematico) questi sono i soli numeri ad essere usati, dal momento che le soluzioni ai pro blemi sono date al massimo con alcune cifre decimali . Tuttavia, i numeri razionali possiedono anche alcune piacevoli proprietà mate matiche. Se si sommano, si sottraggono, si moltiplicano o si divi dono (tranne che per zero) due numeri razionali, il risultato è ancora un numero razionale; inoltre l' aritmetica dei numeri razionali sod disfa tutti gli assiomi per un dominio di integrità esposti nel capi tolo 2 (p. 45) . Il matematico riassumerebbe tutto questo dicendo che i numeri razionali costituiscono un campo . Cosa è un campo? È un dominio di integrità in cui è possibile la divisione, cioè una struttura che soddisfa i sette assiomi di pagina 45 più il seguente: (8) Per un qualsiasi numero x diverso da O, esiste un numero y tale che xy = r (esistenza dell'inverso rispetto alla moltipli cazione) .

È facile verificare che y, la cui esistenza è garantita dall'assioma 8, è unico per ogni x dato . Normalmente scriviamo x - i , o talvolta r/x, per indicare questo unico inverso . L' assioma 8 rende possi bile la divisione poiché, naturalmente, afb è lo stesso di ab - 1 • In sintesi, un campo è una struttura che permette di eseguire tutte le usuali operazioni aritmetiche con le comuni proprietà. Il campo dei numeri razionali, però, non può, come è stato scoperto dai Pitagorici, fornire le soluzioni di equazioni del tipo Usando i numeri razionali, si può trovare una soluzione con ogni grado di accuratezza: I2

=

r;

( r ,4) 2 = 1 ,96;

( I ,4 I ) 2 = 1 ,998 1 ;

( 1 ,4 1 4) 2 = 1 ,999 3 96;

CAPITOLO TERZO

e così via, ma non esiste alcun numero razionale il cui quadrato sia esattamente uguale a 2 . I numeri reali, d'altro canto, costitui scono un campo che include i numeri razionali, e sono abbastanza « ricchi » da poter risolvere equazioni del tipo di quella precedente. L'idea chiave è offerta dal processo di approssimazioni successive relativo all'esempio precedente. I numeri r ; r ,4; r ,4 r ; r ,4 r 4 ; . . . forniscono approssimazioni sempre migliori di un numero il cui quadrato è 2 ; se fosse possibile utilizzare infinite cifre decimali, saremmo in grado di scrivere un numero il cui quadrato è esatta mente uguale a 2, cioè r ,4 r 4 2 1 3 . . . (ad in/initum) . Poiché, ovviamente, non è possibile scrivere una sequenza infi nita di cifre decimali, come si procede in pratica? Lasciando che la matematica si sostituisca al senso comune nel trattare questi con cetti necessariamente infiniti, il che significa che i numeri reali devono essere sviluppati in modo assiomatico . Ne risulta un pro cesso estremamente difficile, molto al di là del livello di un libro come questo. In realtà, la formulazione di un sistema di assiomi per i numeri reali fu uno delle più importanti conquiste della mate matica, raggiunta negli anni tra il r 87o e il r 88o. I numeri reali includono tutti i razionali (proprio come gli interi formano un sottoinsieme dei numeri razionali) ma anche molti altri numeri . Un numero reale che non è razionale è chiamato numero irrazionale. Esempi di numeri irrazionali sono :n , e, .Jk per un qual siasi numero naturale k che non sia un quadrato perfetto .

I numeri complessi Nel secolo XVI i matematici europei, e in particolare l'italiano Raffaele Bombelli, cominciarono a capire che nella risoluzione di problemi algebrici è spesso utile assumere che i numeri negativi ammettano radici quadrate. Possiamo capire, considerando il clima culturale del tempo, che tali numeri fossero chiamati numeri imma ginari, anche se per il matematico moderno tutti i numeri sono con cetti « immaginari », le radici quadrate di quantità negative né più né meno di tanti altri. Tuttavia, è ancora in uso parlare delle radici

I SISTEMI NUMERICI

77

quadrate dei numeri reali negativi come di numeri immaginari, dando quindi in questo contesto alla parola «immaginario » un signi ficato tecnico particolare . In effetti, per poter disporre di radici quadrate di numeri reali negativi è necessario solamente postulare l'esistenza di una solu zione per l'equazione x2 + I = O . Se indichiamo con « i » una soluzione di questa equazione (i 2 = - I ), allora, dato un qualunque numero reale positivo a , la radice qua drata di - a sarà i ..fa. In effetti, ci saranno due radici quadrate: i ..fa e - i ..fa. Analogamente, ci saranno due soluzioni dell'equa zione x 2 + I = O, cioè i e - i. I numeri della forma ia, con a reale, sono i numeri immaginari. La lettera « i » fu usata per la prima volta in questo contesto da Eulero . Un numero complesso è un numero della forma a + i b , dove a e b sono numeri reali . Il segno + qui non indica la consueta ope razione di addizione (e come potrebbe?) , ma serve a separare la parte reale a del numero complesso dalla parte immaginaria i b . Si noti che se b = O allora a + i b = a, perciò i numeri reali formano un sottoinsieme dei numeri complessi; allo stesso modo, se a = O allora a + i b = i b , perciò anche i numeri immaginari formano un sottoinsieme dei numeri complessi. A questo punto si potrebbe pensare che non sia giustificato chia mare numero qualcosa della forma a + i b , anche se si è disposti in linea di principio ad ammettere l'esistenza di i = � - Ma ciò che importa è come i numeri si comportano, non ciò che sono : se i numeri complessi hanno un' aritmetica utile e sfruttabile, sia in matematica sia in un contesto più ampio, e se formano un campo, allora essi hanno lo stesso diritto di essere chiamati « numeri » quanto tutti gli altri . Qual è quindi l' aritmetica dei numeri com plessi? Le regole verranno date qui appresso . Per la maggior parte delle persone, questo è il primo sistema numerico che venga loro presentato da un punto di vista assiomatico . Gli interi, i razionali e i reali sono concetti già familiari ai più, quando sono affrontati assiomaticamente. La regola per sommare due numeri complessi è decisamente sem plice: si sommano rispettivamente le loro parti reali e le loro parti

CAPITOLO TERZO

immaginarie . Quindi:

(a + i b) + (c + id) = (a + c) + i (b + d ) . Così a d esempio, (2 + 3 i) + ( 7 + i) = 9 + 4 i ( - 3 + 4 i) + (4 - 2 i) = I + 2 i. La moltiplicazione di numeri complessi è un po ' più complicata. Usiamo le regole ordinarie dell' algebra per moltiplicare le due somme dentro le parentesi e poi poniamo i 2 = - I , per cui :

(a + i b) · (c + id) = ac + i ad + i bc + i 2 bd = ac + i ad + i bc - bd = (ac - bd) + i (ad + be) . Così, ad esempio (2 + 3 i) . (5 + 7 i) = I o + I 4 i + I 5 i + 2 I F = IO + J4i + 15i - 2 1 = - I I + 29i. Può forse sorprendere il fatto che i numeri complessi possano essere divisi . La regola è questa:

a + i b = a c + bd + i be - a d . c 2 + d2 c 2 + d2 c + id Così, ad esempio: 3XI+5X2 5XI -3 X 2 . + l I+4 I+4 3 + IO 5-6 . = + 5 1 5 I3 I =5 1. 5 --

-

--

·

In effetti, i numeri complessi formano un campo : il lettore potrebbe verificarlo per esercizio. Per quanto insolita possa appa rire la nozione di numero complesso, essa consente dunque un tipo di aritmetica « normale ». In realtà il campo complesso ha una pro prietà importantissima, non valida per alcun altro sistema nume-

79

I SISTEMI NUMERICI

rico : nel campo dei numeri complessi ogni equazione polinomiale può essere risolta; ciò equivale a dire che se a0, a 1 , , a. _ 1 , a. sono numeri complessi, allora ci sarà un numero complesso x che risolve l'equazione a.x " + a. _ 1 x" - 1 + . . . + a1 x + a0 = O • • •

.

Questo non è vero per i numeri reali, come attesta l'equazione x2 + r = O Il risultato appena ricordato è conosciuto come il teorema fon damentale dell'algebra. Fu formulato per la prima volta da Girard nel r 62 9 , e poi dimostrato in modo ancora imperfetto da D' Alem bert nel 1 746 e da Eulero nel 1 749 . La prima dimostrazione inte ramente corretta fu data da Gauss nel 1 799 nella sua tesi di dot torato . Gauss fu così impressionato dal risultato che in seguito ne diede altre tre dimostrazioni completamente diverse . Il teorema fondamentale dell' algebra è solo una delle molteplici ragioni per cui il sistema dei numeri complessi è così « bello ». Un altro motivo importante è che il campo dei numeri complessi per mette lo sviluppo di un tipo di calcolo differenziale che porta alla fertile teoria delle funzioni di variabile complessa (se ne accen nerà nel cap . 9) . La teoria dei numeri complessi non solo è affascinante da un punto di vista matematico, ma risulta anche estremamente utile. Il primo a fare dei numeri complessi un uso scientifico significa tivo fu Charles Steinmetz, che se ne servì in modo massiccio per eseguire calcoli riguardanti le correnti alternate. In effetti, oggi giorno un ingegnere elettrotecnico non potrebbe fare a meno dei numeri complessi, come non potrebbe farne a meno chiunque lavori nel campo dell' aerodinamica o della dinamica dei fluidi. Nella teoria della relatività, Einstein ha fatto uso dei numeri complessi: le tre dimensioni spaziali sono considerate reali e la dimensione tempo immaginaria; anche nella meccanica dei quanti il fisico ha a che fare con numeri complessi. Però, a dispetto del fatto che essi costituiscano un campo e siano molto utili, e a dispetto del fatto che anche gli altri sistemi nume rici siano astratti, pure costruzioni ideali, molte person� provano ancora un certo disagio davanti ai numeri complessi . E in larga misura, o forse esclusivamente, una questione di familiarità. I numeri reali, ad esempio, possono apparire oggetti matematici estre.

8o

CAPITOLO TERZO

Figura 3 · 4 La retta reale. Gli assiomi per i numeri reali garantiscono che essa è continua, non ha >, neppure quelli infinitamente piccoli dove viene saltato un singolo punto (nel senso che la retta razionale ha un « buco » dove dovrebbe esserci ...h ) .

asse immaginario

asse reale

Figura 3 · 5 I l piano complesso. I l numero complesso a + i b corrisponde a l punto d i coordinate (a, b) . I numeri reali si trovano sull' asse orizzontale e i numeri immaginari puri sul l' asse verticale.

mamente complicati quando sono posti sotto il « microscopio » del l' analista, ma c'è sempre l'immagine semplice e confortante della retta reale a cui ricorrere, cioè di una linea retta infinita con O nel mezzo (fig. 3 . 4) . La buona notizia è che c'è un'immagine egualmente confortante dei numeri complessi. Proprio come i numeri reali possono essere pensati come punti della retta reale, così i numeri complessi pos-

I SISTEMI NUMERICI

sono essere identificati con i punti del piano a due dimensioni (fig . 3 .5) . Il primo a proporre questa visualizzazione dei numeri complessi fu Caspar Wessel, un ispettore norvegese autodidatta, che tenne una conferenza sulle sue idee in proposito nel I 7 97· La stessa idea fu riproposta, oltre che da Gauss, da Jean-Robert Argand, un contabile svizzero che nel r 8o6 pubblicò un libro sul l' argomento . Questo ebbe un successo immediato, e il piano com plesso , come è chiamato il piano bidimensionale quando è inteso come rappresentazione dei numeri complessi, è talvolta indicato come il diagramma di Argand.

I quaternioni Prendendo spunto dalla rappresentazione dei numeri complessi come punti sul piano, il matematico irlandese William Rowan Hamilton ( r 8o5- r 865) sviluppò una interpretazione algebrica (essenzialmente assiomatica) dei numeri complessi in termini di coppie di numeri reali . Egli proseguì le sue ricerche passando allo spazio tridimensionale, e scoprì che non in tre, ma in quattro dimen sioni è possibile sviluppare un sistema di « numeri ipercomplessi » analogo a quello per il piano . Non fu facile arrivare ai quaternioni, come Hamilton chiamò i suoi nuovi numeri, e fu solamente dopo parecchi anni di studio che egli riuscì a ottenere un risultato significativo . Come accade spesso nella ricerca matematica, l'intuizione risolutiva non lo colpì mentre era seduto alla scrivania. Un giorno del r 843 , al crepu scolo, egli passeggiava con la moglie lungo il Royal Canal di Du blino, quando capì che, se avesse trascurato la proprietà commu tativa per la moltiplicazione, tutto il resto avrebbe funzionato : avrebbe ottenuto un sistema numerico diverso, ma accettabile. Era così esaltato per questa intuizione che si fermò al Brougham Bridge per incidere le formule di base su una pietra. Il graffito originale è da tempo consumato, ma sul ponte ora compare una targa com memorativa. In breve, un quaternione è un numero della forma

a + i b + j c + kd

CAPITOLO TERZO

dove a, b, c, d, sono numeri reali e i, j , k sono numeri « immagi nari » che soddisfano l'equazione F = j 2= k 2 = - 1 . Le equazioni fondamentali che Hamilton scrisse sul ponte sono : ij = k, j i= - k ,

jk = i, kj = - i ,

ki = j , ik = - j.

Usando queste regole, due quaternioni qualunque possono essere moltiplicati tra loro con le ordinarie regole dell' algebra, per dare un terzo quaternione, mentre l' addizione si esegue termine a ter mine come per i numeri complessi. Il sistema numerico risultante soddisfa tutti gli assiomi per un dominio di integrità (p. 45) eccet tuata la proprietà commutativa della moltiplicazione . I quaternioni hanno trovato applicazioni considerevoli nella fisica moderna, così come altri numeri ancora più bizzarri, gli ottonioni, un sistema numerico a otto dimensioni in cui, oltre alla proprietà commutativa, si è persa anche la proprietà associativa della molti plicazione. Ora è opportuno tornare ai numeri naturali e in parti colare al lavoro di Gauss sulla teoria dei numeri.

Gli interi di Gauss Nel 1 796 Gauss dimostrò un complesso teorema di teoria dei numeri, chiamato legge di reciprocità quadratica, che riguarda le solu zioni di equazioni del tipo cioè della forma

x 2 mod 7

=

3,

x 2 mod p

=

q,

dove p e q sono numeri primi . Nel tentativo di generalizzare il suo teorema per equazioni di ordine superiore (x 3 modp = q, e così via) , egli trovò che i suoi calcoli erano facilitati se si lavo rava con numeri della forma a + i b, dove a e b sono interi e i = � come al solito, piuttosto che con i soli interi . Ora tali « interi complessi » sono conosciuti come interi di Gauss. Sono particolarmente utili quando è richiesta una scomposizione in fattori : infatti, proprio come gli interi ordinari ammettono la

I SISTEMI NUMERICI

scomposizione

a 2 - b 2 = (a + b) (a - b) , così gli interi di Gauss danno

a 2 + b 2 = (a + i b) (a - i b) . Ad un primo sguardo, gli interi di Gauss sembrerebbero occu pare la stessa posizione all'interno del campo dei numeri com plessi di quella che occupano gli interi ordinari all'interno del campo dei numeri reali . Ma quanto gli interi di Gauss assomigliano agli interi? Come si è detto nel capitolo I , il fatto più significativo relativo agli interi è racchiuso nel teorema fondamentale dell' aritmetica: ogni intero è esprimibile come prodotto di un unico insieme di primi, moltiplicato eventualmente per - I . Gauss dimostrò che tra gli interi di Gauss vi sono dei numeri che sono « primi » (cioè non scomponibili) e che in rapporto a questi « primi » vale un ana logo del teorema fondamentale dell'aritmetica, il teorema della fat torizzazione unica. I primi, qui, non sono numeri della forma a + i b , dove entrambi a e b sono primi : i primi di Gauss sono definiti come quegli interi di Gauss che non possono essere ridotti a un prodotto di altri interi di Gauss . Per questa ragione i matematici spesso li chiamano irriducibili. Il

problema del numero di classi

Gli interi di Gauss si rivelarono utili in altri contesti, oltre che nelle leggi di reciprocità; in particolare, emerse il loro rapporto con l'ultimo teorema di Fermat , del quale si parlerà più diffusa mente nel capitolo 8. Risultarono così utili che si pensò di esami nare altri sistemi numerici simili, ed è proprio quanto fece Gauss . Tra i vari sistemi possibili, particolarmente significativi sono quelli di forma a + b �, dove d è un intero positivo diverso da uno . A questo punto si profila ancora una sorpresa. Per ottenere un sistema « ragionevole », che abbia qualche somiglianza con gli interi ordinari, nel caso in cui d mod 4 = 3 si deve ammettere che a e b

CAPITOLO TERZO

possano anche essere divisi per due; così ad esempio 2_ +

2

2 �3 '

saranno numeri nel sistema che corrisponde a d = 3 . Se d mod 4 :f: 3 , allora, come per gli interi di Gauss, a e b devono essere interi. Una volta che si sia introdotta la piccola modifica di cui sopra, ci si può domandare per quale valore di d si ottenga anche una teoria dei numeri « ragionevole ». In particolare, per quale valore di d si ottiene un teorema di fattorizzazione unica? Per d = I lo si ottiene, così pure per d = 2 e d = 3 , ma per d = 5 non lo si ottiene. In questo sistema, ad esempio, il numero 6 ha due distinte fatto rizzazioni in termini irriducibili:

6 = 2 X 3 , 6 = ( I + .../5) X (I - r-j) . Gauss si conoscevano nove valori di d per

Ai tempi di i quali il sistema dei numeri a + b � (con a e b che variano come indi cato sopra) possiede un teorema di fattorizzazione unica. Essi sono :

d = I , 2 , 3 , 7, I I , I 9, 43 , 67 , I 63 . Ci sono altri valori? Nonostante sforzi considerevoli da parte di Gauss e di altri nei decenni che seguirono , nessuno riuscì a tro varne . Il risultato successivo è dovuto a Heilbronn e Linfoot; nel I 934 essi dimostrarono che poteva esistere al più un decimo valore, enormemente grande . Ma esisteva davvero? Nel I 95 2 una sola persona conosceva la risposta (negativa) a questa domanda. In quell'anno Kurt Heegner, uno scienziato sviz zero in pensione che si dedicava alla matematica per hobby, pub blicò quella che egli riteneva la dimostrazione della non esistenza di un decimo d, ma nessuno gli credette; il suo articolo era molto difficile da seguire, e il resto del mondo dovette aspettare altri quindici anni prima di conoscere la verità. Nel I 967 Harold Stark del Massachusetts Institute of Technology e Alan Baker dell'Uni versità di Cambridge, ognuno per conto proprio e con metodi dif ferenti, dimostrarono anch'essi che non esisteva un decimo d, e la comunità matematica se ne convinse. Motivati dalla loro sco perta, Stark e Baker cominciarono a esaminare il preesistente lavoro di Heegner e, con loro stupore, trovarono che era sostanzialmente corretto : il povero svizzero aveva visto giusto, nonostante tutto .

I SISTEMI NUMERICI

Ecco il motivo per cui il numero I 63 è così particolare e genera quei risultati curiosi menzionati all'inizio del capitolo: è il più grande valore di d per cui il sistema di numeri a + b � ammette una fattorizzazione unica. Sfortunatamente, non è possibile dare qui alcuna indicazione su come questa proprietà di I 63 sia collegata a quanto detto in precedenza, poiché ciò richiederebbe una prepa razione matematica specifica. Chiuso il discorso sui sistemi di numeri a + b "- d che ammet tono una fattorizzazione unica, che cosa si può dire di quelli che non l'ammettono? Ancora una volta fu Gauss a indicare la via da seguire. A ciascun sistema di numeri di tipo a + b � egli asso ciò un numero naturale h(d ) , chiamato numero di classi di quel sistema. Questo numero di classi dà una misura del margine con cui la fattorizzazione unica viene a mancare : se il numero di classi è I (come per ciascun valore di d nella lista di Gauss) , allora vale la fattorizzazione unica; se h(d) = 2 (come è ad esempio per d = 5 , 6, I O , I 3 ) , allora non esiste una fattorizzazione unica; quando il numero di classe è 3 (per d = 2 3 , 3 I , 59, ad esempio) la fattoriz zazione è « ancor meno unica »; quando è 4 (per d = 1 4 , I 7 , 2 I , ad esempio) lo è ancora di meno, e così via. Più grande è il numero di classe, più modi esistono di scomporre in fattori i numeri del sistema. Nel paragrafo 303 delle sue Disquisitiones Arithmeticae (il menu mentale lavoro citato nel cap. I ) , Gauss presentò alcuni calcoli molto lunghi di numeri di classi, e osservò che per ogni numero di classi k sembrava esistere un valore massimo di d per cui h(d) = k. Il massimo d per cui h(d) = I era (per quanto ne sapeva) d = I 63 , il più grande d per cui h(d) = 2 sembrava essere d = 4 2 7 , e il mas simo d per cui h(d) = 3 era apparentemente d = 907 . Gauss non riuscì a dimostrare nulla di definitivo su questi valori, ma era con vinto del fatto che esistesse un d massimo per ogni valore di k. Il problema del numero di classi, che ha senso se si assume come vera la congettura di Gauss , consiste nel determinare per ciascun numero di classe k il più grande d per cui h(d)= k. Il risultato di Heegner del I 9 5 2 risolveva il problema del numero di classi per il caso h = 1 . Dal tempo di Gauss al nostro secolo non fu fatto alcun pro gresso sul problema del numero di classi . Nel I 9 I 6 Hecke dimo-

86

CAPITOLO TERZO

strò che se una particolare asserzione piuttosto complessa, cono sciuta come ipotesi di Riemann generalizzata, fosse stata vera, allora lo sarebbe stata anche la congettura di Gauss. Poiché nessuno sapeva (o meglio, nessuno sa) , se l'ipotesi generalizzata di Riemann sia vera o no, il risultato di Hecke non disse molto. Nel 1 934, lavo rando su un articolo appena pubblicato di Deuring e Mordell, Heil bronn dimostrò la congettura di Gauss assumendo che l'ipotesi di Riemann generalizzata fosse falsa. Poiché l'ipotesi in questione dovrà certamente essere vera o falsa, anche se noi non lo sappiamo, o magari (tenendo a mente i risultati di cui si è parlato al cap . 2 ) non possiamo saperlo, i lavori di Hecke e di Heilbronn presi insieme dimostrarono finalmente la congettura di Gauss. Una volta confermata la validità della congettura di Gauss, fu finalmente chiaro il modo per risolvere il problema del numero di classi. Ma i progressi furono estremamente lenti . Dapprima appare il risultato di Heegner del 1 9 5 2 per il caso h = I . Nel 1 967 mentre lavoravano allo stesso caso, Beker e Stark risolsero il caso h = 2 . Nessuno dei metodi sviluppati, però, si dimostrò utile in altri casi . La grande vittoria avvenne nel 1 97 5 , quando Dorian Golfeld, all'Università del Texas a Austin, ottenne una soluzione parziale . Con una lunga e complessa argomentazione nell' ambito della teo ria analitica dei numeri complessi, Goldfeld mostrò che, qualora si fosse disposto di uno strumento matematico abbastanza sofisti cato, ne sarebbe seguita la soluzione completa del problema del numero di classi. L'oggetto richiesto era una curva geometrica di una determinata forma, * avente alcune insolite proprietà. Il pro blema non era trovare curve della forma desiderata, ma piuttosto attenerne una con le proprietà particolari richieste. Goldfeld fallì, nonostante tutti i suoi tentativi, come del resto tutti gli altri che si dedicarono al problema. Nel 1 983 , finalmente, ci riuscirono Zagier e Gross . La loro idea chiave fu di cercare alcuni punti speciali sulla curva, che in onore *

In particolare si tratta di una curva ellittica, la cui equazione è della forma y2

=

ax 3 + bx2 + ex + d.

Le curve ellittiche hanno molte applicazioni nella teoria dei numeri, oltre a quella descritta qui.

I SISTEMI NUMERICI

del lungamente trascurato Heegner furono chiamati punti di Hee gner. La dimostrazione consisteva in un'enorme equazione: il solo calcolo dei due termini dell'equazione occupò r oo pagine; poi si dovettero confrontare i termini in ogni membro per provare che l'equazione era corretta (nonostante la lunghezza, un matematico definirebbe « di routine » questa parte della dimostrazione) . Quello che è veramente notevole è il fatto che una singola curva, in qual che modo, controlli il comportamento di una famiglia infinita di numen . Dopo r 83 anni, il problema del numero di classi di Gauss era stato finalmente archiviato .

C apitolo 4 Bellezza dal caos

La bellezza in matematica Bertrand Russell scrisse nel

1918:

La matematica, giustamente considerata, non contiene soltanto la verità, ma la bellezza suprema, una bellezza fredda e austera, come quella della scultura. *

U n altro famoso matematico inglese,

G . H . Hardy, affermò :

Le forme create dal matematico, come quelle create dal pittore o dal poeta,

devono essere belle; le idee, come i colori o le parole, devono legarsi armonio samente . La bellezza è il requisito fon qamentale : al mondo non c'è un posto perenne per la matematica brutta. ( . ) E senza dubbio molto difficile definire la bellezza matematica, ma questo è altrettanto vero per qualsiasi genere di bellezza. Possiamo anche non sapere che cosa intendiamo per « bella poe sia », ma questo non ci impedisce di riconoscerne una quando la leggiamo . * * . .

Tutti e due pensavano a una forma di bellezza estremamente astrat ta, una bellezza recondita nota ai matematici di professione , ma che la grande maggioranza di noi è destinata a non vedere mai, e molto probabilmente neppure a sospettare . È una bellezza ele gante, dalla forma e dalla struttura logica, una bellezza che si può cogliere solo dopo un lungo e arduo apprendistato . Diciamo piuttosto che questa era la situazione fino all'inizio degli anni ottanta, quando lo sviluppo degli elaboratori elettronici, e in particolare delle loro potenzialità grafiche, segnò l'inizio di nuove * [B. Russell, Lo studio della matematica, in Misticismo e logica e altri scritti, Longanesi, Milano 1 964, pp. Bx sg.] ** [G. H. Hardy, Apologia di un matematico, Garzanti, Milano 1 989, pp. 67 sg.]

BELLEZZA DAL CAOS

tecniche matematiche, foriere di cambiamenti radicali . I calcola tori hanno dischiuso le porte a una nuova area di ricerca, quella della dinamica caotica; sebbene parte della matematica implicata in questo settore non sia meno ardua e astratta di quella conte nuta in altri campi di ricerca, la bellezza intrinseca delle strutture che ne risultano può essere mostrata sullo schermo di un calcola tore, in modo che tutti la possano ammirare, professionisti e non. Stampe di immagini prodotte dal calcolatore costituivano il nucleo di una mostra organizzata dal Goethe Institut, che incominciò a

Figura 4 . r L'arte dei frattali : uno sguardo sul mondo di Mandelhrot.

CAPITOLO QUARTO

girare il mondo nel I 985 e che trovò pari ospitalità presso i dipar timenti universitari di matematica e presso le gallerie d'arte. Anche l'industria cinematografica non tardò a rendersi conto delle poten zialità della nuova matematica, e oggi molte idee rubate alla dina mica dei sistemi complessi (altra espressione usata per indicare il medesimo campo) sono usate per le immagini dei film di fanta scienza. La figura 4 . I mostra solo un esempio delle numerose realizza zioni grafiche delle strutture comuni in questo nuovo campo; molte di queste possono essere riprodotte a colori per dar risalto a motivi non apprezzabili in bianco e nero . Per quanto possa sembrare sor prendente, la complessità della figura 4 . I è il risultato dell' applica zione di nozioni matematiche abbastanza semplici, sebbene un' ana lisi dettagliata possa richiedere metodi molto complessi . Tutto ciò sarà spiegato nel corso del capitolo .

Quanto

è

lunga la linea costiera della Gran Bretagna?

Questo era il titolo di un articolo che ha fatto epoca; comparve nella rivista « Science » nel I 96 7 , ad opera di Benoit Mandelbrot, un brillante matematico francese che lavorava al Thomas J . Wat son Research Center dell'IBM di Yorktown Heights, nello Stato di New York . A prima vista la domanda sembra abbastanza inno cua, per cui ci si può aspettare una risposta soddisfacente, data con l'aiuto di una carta geografica o di una ricognizione aerea. Il guaio è che, per quanto accuratamente l'operazione venga eseguita, non è possibile ottenere una risposta esatta, e ciò per un motivo molto semplice: non esiste « una » risposta « esatta »! Mandelbrot giunse a questa sorprendente conclusione ragionando nel seguente modo . Supponiamo di eseguire la nostra misurazione sorvolando la linea costiera a bordo di un aeroplano a un' altezza di I O ooo metri, scattando fotografie in continuazione; poi, usando la scala oppor tuna, calcoliamo la lunghezza totale che risulterà dal grande numero di fotografie fatte. Quanto è precisa questa risposta? Non molto : da una distanza di I o ooo metri molti piccoli promontori e baie non si possono distinguere. Se dovessimo ripetere la misurazione

BELLEZZA DAL CAOS

da un piccolo aereo che vola a 500 metri di altezza, i particolari visibili sarebbero molto più numerosi e di conseguenza il risultato sarebbe molto maggiore del precedente: ciò che sulla prima foto grafia appariva come un tratto di costa uniforme risulterà ora costi tuito da numerose piccole insenature, baie e promontori . Ora supponiamo di partire a piedi per misurare la linea costiera con l'ausilio, ad esempio, di un compasso con apertura di un metro. Dettagli della costa invisibili dall'aria daranno luogo a un risul tato ancora maggiore. Se si ripeterà la misurazione con il compasso con apertura di I o centimetri, il risultato sarà più grande ancora, e così via: più piccola sarà l'unità di misura adottata, maggiore sarà la quantità di dettagli rilevati e maggiore il risultato . In breve tempo rileveremo i ciottoli, quindi i granelli di sabbia, le mole cole e così via. Il risultato diventerà sempre più grande. Naturalmente, nel mondo fisico questo processo di misurazione sempre più minuta deve a un certo punto finire . I limiti umani ci farebbero probabilmente interrompere con il compasso di aper tura pari a un metro, mentre il fisico potrebbe obiettare che il pro cedimento ha un limite teorico a livello atomico . Ma dal punto di vista astratto del matematico il processo di rilevamento di misure sempre più fini può continuare indefinitamente . Poiché ciò signi fica che la corrispondente sequenza di misure aumenta all'infinito, ne deriva che non esiste una risposta precisa dal punto di vista matematico del problema della lunghezza della linea costiera, ma solo risposte arbitrarie, che non possono neppure ritenersi appros simazioni della realtà. Un'entità matematica analoga alla linea costiera non misurabile di Mandelbrot è offerta da una figura geometrica studiata per la prima volta da Helge von Koch nel 1 904, che noi chiameremo isola di Koch . La figura 4 . 2a mostra l'isola di Koch vista da un razzo nello spazio interplanetario; da questa distanza ha esattamente l'aspetto di un triangolo equilatero . Man mano che il razzo si avvi cina alla Terra, appare chiaro che ciascuno dei tre lati in realtà contiene un promontorio a forma di triangolo equilatero, che occupa la parte centrale del lato per un terzo della sua lunghezza (fig. 4 . 2b) ; s e la lunghezza del perimetro nella figura 4 . 2a è di 3 unità, quella nella figura 4 . 2 b sarà 3 X j unità. Avvicinandoci ancora di più, ci

CAPITOLO QUARTO

(b)

(a)

Figura 4 . 2 Costruzione dell'isola

di

(c)

Koch.

accorgeremo che, allo stesso modo, ciascuno dei dodici lati che vede vamo prima contiene un promontorio a forma di triangolo equila tero che ne occupa la terza parte centrale (fig. 4. 2c) ; la lunghezza del perimetro adesso è 3

X

j x j unità. La figura 4·3 mostra l'isola vi

sta da una distanza molto ravvicinata, con una rilevazione di dettagli

Figura 4·3 L'isola di Koch prende forma.

93

BELLEZZA DAL CAOS

sempre più particolareggiati, e offre qualche indicazione sulla reale forma dell' isola di Koch . Per il matematico, l' aspetto più interes sante della questione

è

la

regolarità con cui appaiono i dettagli ai livelli successivi: a ogni sta dio , la parte centrale di ogni segmento della costa

è

rimpiazzata da

due segmenti, ciascuno della medesima lunghezza della parte sosti tuita, come si vede nella figura

4·4·

Come si può dedurre osservando le figure

4.2 e 4.3, l'isola di Koch,

dal punto di vista matematico, ha una forma ben definita, di cui la figura

4·3 offre una buona approssimazione per quanto l'occhio umano

riesce a distinguere . La linea costiera dell'isola di Koch, se la si vuole definire da un punto di vista matematico,

è la « curva » che corrisponde

al limite della successione infinita di approssimazioni, le prime tre delle quali sono mostrate nella figura

4. 2.

A

questo punto la mate

matica si sostituisce alla cartografia: matematicamente parlando, questa curva limite

è definita in modo preciso e,

come qualunque altra curva,

consiste in un numero infinito di punti allineati in modo da formare una linea continua. Il processo per arrivare alla curva limite logo a quello per arrivare al numero

sione infinita di decimali

j

è

ana

come limite della succes

0,3 0,33 0,333 0 , 3 3 3 3 0 , 3 3 3 3 3 . . . . Poiché l'isola di Koch è una porzione definita del piano , essa avrà un' area definita . Il reale valore numerico della sua superficie dipenderà naturalmente dalle unità di misura che verranno impie gate, ma sarà senz ' altro finito . Esso può essere calcolato come il limite di una successione di numeri, in maniera molto simile

(a)

Figura 4 · 4 Generazione della linea costiera d i Koch.

(b)

94

CAPITOLO QUARTO

all'esempio del numero f , ed è in realtà esattamente 1 ,6 volte l' area del triangolo della figura 4 . 2a . Ma qual è la lunghezza della linea costiera che delimita questa superficie finita? Ebbene, ciascu no stadio successivo del processo aumenta la lunghezza della linea costiera di .j- , e quindi quando si raggiungerà la curva di Koch (nome dato alla curva perimetrale) questo aumento di .j- si sarà verificato un numero infinito di volte: dunque la lunghezza della curva di Koch è infinita. Come può una superficie finita avere un perimetro infinito? Le stesse figure 4 . 2 e 4·3 forniscono la risposta. Ad ogni approssima zione successiva, la curva perimetrale si deforma da un lato all' al tro per l'intera lunghezza. Queste deformazioni possono essere dise gnate in dettaglio, purché si usi una scala adatta, ma quando si arriva alla curva di Koch la deformazione è avvenuta infinite volte. Si verifica allora qualcosa di molto strano : interviene una nuova dimensione.

Nuove dimensioni Le curve che di solito incontriamo in geometria sono tutte uni dimensionali: un essere costretto a vivere su una linea retta o su un cerchio può muoversi in una sola direzione (se il movimento all'indietro è considerato semplicemente un movimento in avanti negativo) . Le superfici geometriche solite, come i piani e le super fici sferiche, sono bidimensionali: hanno due direzioni indipendenti di movimento, spesso indicate in termini di avanti/indietro e destra/sinistra. Gli oggetti solidi sono tridimensionali, poiché am mettono tre direzioni di movimento . Ad esempio, un treno può muoversi solo in una direzione, le navi possono viaggiare in due direzioni sulla superficie del mare e un aereo può muoversi in tre direzioni . Per quanto attiene all'esperienza umana, l'universo in cui viviamo ha solo tre dimensioni, anche se la teoria della relatività considera il tempo come una « quarta dimensione », e alcune moderne teorie fisiche arrivano ad attribuire undici dimensioni all'universo (le tre che percepiamo fisicamente più altre otto che

95

BELLEZZA DAL CAOS

si manifestano come le forze basilari della natura: gravità, magne tismo e così via) . Ma per il matematico la tridimensionalità non occupa un posto privilegiato . È possibile prendere in considera zione spazi di quattro o più dimensioni, cosa che avviene abitual mente. Sebbene non possano essere rappresentati dalla geometria tradizionale, questi spazi multidimensionali possono essere di reale uso pratico; un esempio pertinente sarà dato dalla programmazione lineare, di cui parleremo nel capitolo I I . Si noti comunque, che tutte queste dimensioni sono ancora numeri interi . Che cosa c'entra la linea costiera di Koch con tutto ciò? Essendo una curva, la si potrebbe pensare unidimensionale; ma questo non è vero: per quanto ciascuna delle approssimazioni alla curva di Koch che si ottengono con il processo sopra descritto sia unidimensio nale, la curva limite non lo è. Quando la direzione di percorrenza cambia un numero infinito di volte, non ci troviamo più in un mondo a noi familiare; in realtà, nemmeno l'uso della parola « dire zione » è qui del tutto giustificato . Quindi non possiamo sperare di attribuire una dimensione alla curva di Koch parlando di dire zione del movimento, ma dobbiamo trovare un modo nuovo di giungere al concetto di dimensione che non dipenda dalla direzione. È opportuno utilizzare un metodo che si adatti alla natura della curva di Koch. La sua caratteristica basilare è l'autosomiglianza : le parti, in scala ridotta, sono simili al tutto . Supponiamo di prendere una figura D-dimensionale e di divi derla in N parti del tutto simili. Allora il rapporto di similitudine r tra l'intera figura e una singola parte sarà dato da

r=

�N .

Poiché la figura è D-dimensionale e r deve essere calcolato « lungo una dimensione », occorre prendere la radice D-esima di N. Per esempio, supponiamo di avere una linea retta e di spezzarla in N segmenti uguali (fig. 4 . 5 ) . Ciascun segmento è esattamente I/N dell'intera lunghezza, quindi il rapporto di similitudine sarà N. Questo è proprio il valore ottenuto dalla formula quando si prenda D = I . Oppure potremmo prendere un rettangolo (D = 2) e sezionarlo in N parti, dividendolo in senso orizzontale e verticale in k seg menti (fig . 4 . 6) . Allora l'intero rettangolo è diviso esattamente

CAPITOLO QUARTO

N

segmenti

Figura 4 · 5 Autosomiglianza per una linea retta.

in N = k 2 « copie » più piccole del tutto, e il rapporto lineare r tra il tutto e la parte è dato da

Ancora una volta si ottiene il risultato che ci si aspettava. In entrambi i casi sembra di aver girato in tondo , ma stavamo esaminando casi molto familiari e per nulla problematici. Quando applichiamo la medesima analisi alla curva di Koch, giungiamo a una conclusione decisamente più sorprendente. Per questa curva non conosciamo D, ma i valori di N e r si determinano facilmente : basta osservare il processo di riproduzione che dà origine alla curva. Come prima cosa, consideriamo un tratto della linea costiera (vedi fig. 4 . 4a) ; uno qualunque, dal momento che sono tutti uguali. Nel processo di riproduzione (vedi fig. 4.4b) , il singolo segmento è sosti-

k

segmenti

Figura 4 .6. Autosomiglianza per un rettangolo.

97

BELLEZZA DAL CAOS

tuito da quattro segmenti (quindi N = 4) , ciascuno corrispondente a un terzo della lunghezza del segmento originale (quindi r = 3 ) . Poiché questo è vero per qualunque tratto della linea costiera, sarà vero per l'intera curva di Koch. Quindi, secondo la formula cal colata sopra, Che valore ha D? Certamente non è un numero intero . L'unico modo per determinarlo è usare i logaritmi. Se prendiamo i loga ritmi di entrambi i membri di questa equazione, otterremo log 3 = D log 4 . D può essere calcolato consultando l e tavole dei logaritmi o ser vendosi di una calcolatrice; con quattro cifre decimali il risultato è D = r ,26r8. Quindi la curva di Koch è un'entità matematica la cui dimensione è frazionaria. Non solo le curve possono avere dimensioni frazionarie; si pos sono costruire anche « superfici » e « solidi » altrettanto originali adottando procedure di autoriproduzione . Per esempio, partendo da un cubo e rimuovendo successivamente le parti centrali si arriva alla fine, cioè dopo un numero infinito di ripetizioni, a un oggetto noto come la spugna di Sierpinski (D = 2 , 7 268), la cui struttura appare nella figura 4· 7 . Questo oggetto incredibile ha un volume zero racchiuso da una superficie infinita. Ciascuna faccia esterna è nota come tappeto di Sierpinski, e ha una superficie zero delimi tata da un perimetro infinito . La dimensione del tappeto di Sier pinski è D = r , 2 6 r 8, la stessa della curva di Koch. Noi dovremmo essere in grado di confermare tutti e due i valori di D associati alla spugna osservando la figura 4· 7 e servendoci della formula

r = V'N ' o, mediante logaritmi, D=

log N . log r

Le figure con dimensione frazionaria sono state chiamate frat tali da Mandelbrot nel r 977 . La geometria frattale studia tali oggetti.

CAPITOLO QUARTO

Figura 4 · 7 L a spugna d i Sierpinski prende forma.

Nel resto di questo capitolo parleremo di frattali di tipo diverso dalla curva di Koch e dalla spugna di Sierpinski. Questi ultimi sono estremamente regolari, perché il processo di autoriproduzione è lo stesso a ogni livello, e l'osservazione ravvicinata di un parti colare della figura per cogliere più dettagli non procura sorprese: si tratta di una riproduzione del medesimo ad infinitum. A partire dal 1 980, grazie ai calcolatori, si sono esaminati frattali in cui il modulo di riproduzione cambia continuamente (anche se, come risulterà chiaro, spesso lo si può ancora definire « autoriprodu zione ») . Con figure di questo tipo, l'osservazione ravvicinata può dare risultati del tutto inaspettati, un esempio dei quali è dato dalla figura 4· I . L'esame di questi frattali riguarda in parte la mate matica, in parte la sperimentazione elettronica, e porta il ricerca tore in un nuovo mondo pieno di fascino e spesso estremamente bello . Come per molti altri « nuovi mondi », la sua scoperta fu in parte dovuta al caso .

BELLEZZA DAL CAOS

99

Alla scoperta di un nuovo mondo Già nel 1 978, il lavoro di Mandelbrot sui frattali aveva visto notevoli sviluppi . L' anno precedente era stato pubblicato il suo libro Gli oggetti frattali: forma, caso e dimensione, dove egli dimo strava come molti fenomeni quotidiani nel campo della fisica, della biologia e della matematica diano origine a frattali . Tutti i frattali che egli aveva preso in considerazione si erano rivelati, come la curva di Koch, autosimili . Essi davano origine a sviluppi matema tici interessanti e talvolta a conclusioni sorprendenti, nonché a figure affascinanti e perfettamente simmetriche, molte delle quali illustrate nel libro di Mandelbrot . Però, tutti gli esempi erano intrin secamente prevedibili, cosa che non si verifica nei frattali della vita reale : la linea costiera della Gran Bretagna, ad esempio, mani festa un comportamento frattale molto meno regolare della curva di Koch . Questo estremo ordine e totale prevedibilità nascevano dal fatto che i frattali in esame erano autosimili per cambiamenti di scala e per traslazioni (in linguaggio matematico, invarianti per trasformazioni lineari) . Mentre lavorava con Mark Laff alla IBM nel 1 978-79, Mandelbrot incominciò a esplorare frattali invarianti per trasformazioni non lineari, in cui, invece di una semplice variazione di scala, si possono eseguire operazioni più complicate, quali il qua drato , il cubo e cosl via . In casi come questi, l' unico modo per farsi un' idea dell' aspetto del frattale corrispondente è farlo gene rare da un elaboratore. In effetti, all'inizio di questo secolo, il lavoro di Gaston Julia e Pierre Fatou in Francia sugli stessi concetti si era arrestato , in gran parte, a causa dell 'impossibilità di rappre sentare gli oggetti in esame; Mandelbrot era venuto a conoscenza di questo lavoro quando era studente all' É cole Polytechnique a Parigi, dove Julia era stato suo insegnante. Alla fine del 1 979 Mandelbrot era giunto alla conclusione che valesse la pena esaminare, servendosi di un calcolatore, il compor tamento della particolare funzione x 2 + c, in cui sia la variabile x sia il parametro costante c sono numeri complessi . Quale tipo di comportamento fosse esattamente considerato sarà spiegato più avanti, ma basti per ora dire che è possibile usare i calcolatori per tracciare diagrammi che mettano in relazione questo comporta mento con i valori variabili del parametro c.

I OO

CAPITOLO QUARTO

Per ironia della sorte, Mandelbrot non era all'IBM in quello che doveva essere l' anno cruciale, il 1 979-80, ma era in visita alla Har vard University, e quindi non aveva la possibilità di accedere quo tidianamente alle famose strutture di calcolo dell'IBM nel momento in cui più che mai il suo lavoro lo richiedeva. Ma nello scanti nato dello Science Center di Harvard egli trovò un piccolissimo calcolatore Vax appena arrivato, a cui erano collegati un visore Tektronix piuttosto vecchio e una stampante Versatec che poteva fornire delle copie su carta. Un assistente di Harvard, di nome Peter Moldave, offrì gratuitamente i suoi servizi come program matore del progetto, e così il lavoro andò avanti . La prima immagine che ottennero fu una rozza versione della doppia macchia simile a uno scarafaggio mostrata, in modo molto più particolareggiato, nella figura 4 . 1 3 . Era quanto si aspettavano, la teoria lo aveva previsto . Più sconcertanti erano alcune macchie più piccole staccate dalla figura principale; un esame più attento di queste rivelò che esse erano versioni più piccole dello « scara faggio » principale ! Ancora una volta sembrava manifestarsi il con sueto comportamento autoriproduttivo dei frattali. Eseguendo cal coli più rigorosi si ottenevano figure migliori, con più dettagli, finché improvvisamente le figure incominciavano ad assumere un aspetto sempre più confuso . Forse la loro vetusta attrezzatura per la stampa era difettosa? Per sincerarsene, Mandelbrot si portò a casa a Yorktown Heights il programma, per provarlo su un IBM. Non solo la confusione non sparì, ma una figura di qualità migliore rivelò che tale confusione nascondeva un motivo ricorrente pre ciso . Osservando ancora più da vicino, Mandelbrot e Moldave tro varono che alcune delle macchie piccole come granelli di polvere non erano versioni ridotte dello scarafaggio, come avevano imma ginato, ma erano piuttosto dei bei motivi complessi, spirali, fami glie di figure dall' aspetto di cavallucci marini, e simili (figg. 4· I e 4· 1 6) . Mandelbrot aveva intravisto il suo nuovo mondo .

Ordine e

caos

Ordine e caos. Nel corso della storia, e all'interno dell'universo, sono loro a contendersi la supremazia . Spesso solo una lama di col-

IOI

BELLEZZA DAL CAOS

tello li separa: una piccola variazione di pressione può trasformare il regolare flusso dell' acqua da un rubinetto in un complesso caos di vortici; comunità animali ordinate, comprese quelle umane, pos sono essere trasformate con incredibile facilità in anarchie incon trollabili . Al polo opposto l'ordine può emergere dal caos, come testimonia l'evoluzione della vita dal caos formale dell'universo, ultimo gradino il genere umano. Come vedremo, il passaggio dal l'ordine al caos, e il successivo emergere dell'ordine dall'interno di quel caos, viene rivelato in modo evidente dallo studio di sem plici circuiti retroattivi. L' aspetto essenziale del meccanismo di retro azione è questo : esiste una certa quantità x che varia (nel tempo o in relazione a qualche altra variabile) in modo tale che il valore di x in qualsiasi istante dipende con andamento regolare dal suo valore nell'istante precedente (fig. 4 . 8) . Procedimenti di questo tipo permeano tutte le scienze esatte e la maggior parte, se non tutte, delle scienze spe rimentali. Molta della matematica moderna è stata sviluppata per trattare tali procedure; ad esempio, il caso in cui l'incremento tra la vecchia x e la nuova x è infinitesimale portò allo sviluppo di varie tecniche per la risoluzione delle equazioni differenziali. Per studiare un processo di retroazione dal punto di vista mate matico, si assume che la regola per generare il nuovo valore di x a partire dal precedente sia data da una funzione /(x) . Quindi, par tendo da un valore iniziale x0 di x, i valori successivi x1, x2 , X3 , sono generati secondo la regola illustrata nella figura 4 · 9 · Non è necessario porre restrizioni sulla funzione/(x) , sebbene il processo di retroazione conseguente non risulti molto interessante a meno che la/(x) scelta sia diversa da una funzione lineare, cioè della forma • • •

/(x) = ax + b,

Figura 4 . 8 Il meccanismo d i retroazione cambia i l valore d i x .

102

CAPITOLO QUARTO

Figura 4 · 9 Valori successivi d i

x

generati dal meccanismo d i retroazione.

per a e b costanti. Ci occuperemo in modo particolare del caso in cui /(x) contenga un parametro . La scelta di quel parametro può avere un effetto determinante sul comportamento del processo di retroazione che ne consegue. Si è soliti considerare un meccanismo di retroazione come un sistema dinamico, il quale manda un punto iniziale x0 successiva mente nei punti x 1 , x2 , x}, . . . La sequenza dei punti nei quali x0 è mandato è detta traiettoria o orbita di x0• Se questa traiettoria è ordinata possiamo parlare di dinamica classica; se non lo è, siamo nel caso della dinamica caotica . Dovrebbe bastare questa nomen clatura a indicare quanto questo studio sia collegato con molti feno meni della vita di tutti i giorni . Per fare un esempio, consideriamo la crescita di una popola zione su un arco di un certo numero di anni. Supponiamo che la dimensione iniziale della popolazione sia x0, e che x. sia la popo lazione dopo n anni. Il tasso di crescita durante l'anno ( n + r )-esimo è allora X + l - Xn :. ... . r = ____:n .:..:. x._..::. Se il tasso di crescita è costante di anno in anno, questa equazione sarà valida per ogni valore di n; possiamo allora modificarla per esprimere la legge dinamica lineare x. + 1 = /(x.) = (r + r) x

•.

Dopo n anni, la popolazione sarà x. = ( r + r) • X0, espressione ottenuta procedendo a ritroso a partire da x. =

BELLEZZA DAL CAOS

1 03

= ( I + r) x. _ 1 , x. _ 1 = ( I + r) x. _ 2 e così via, fino a x1 = ( I + r) x0 • Questo è un esempio di crescita esponenziale, tipica di molti feno meni della vita reale oltre che dell'accrescimento della popolazione. Come dovrebbe essere chiaro da quanto abbiamo visto nel capi tolo I , una dinamica di crescita di questo tipo, se protratta senza controllo per un certo numero di anni, condurrà a popolazioni ster minate . In realtà, tale crescita si verificherà solo per un periodo limitato, dopo di che si giungerà a una stabilizzazione. Nel I 845 P . F . Verhulst formulò una legge di crescita che tiene conto del l'esistenza di una dimensione massima possibile di popolazione, che chiameremo X. La legge di Verhulst dice che il tasso di cre scita scende da r a O man mano che la popolazione si avvicina a X. Un modo semplice per rappresentarlo dal punto di vista matema tico consiste nel sostituire il tasso costante di crescita r con il tasso variabile di crescita r - ex. , dove c è una costante. Dal momento che la crescita della popolazione dovrebbe diventare zero quando X11 = X, il valore della costante c dovrà essere r/X. Dunque con questo valore la legge dinamica per il processo di Verhulst è x. + 1 = /(x.) = ( I + r - ex. ) x. = ( I + r) x. - ex; . Una volta che si è raggiunto il valore X, la popolazione rimarrà costante: /(X) = X. Se la popolazione è minore di X aumenterà; se è maggiore dimi nuirà. Se si fa una prova, a mano o con un calcolatore, si vedrà che il procedimento di Verhulst porterà la popolazione ad evolversi, fino a stabilizzarsi sul valore X, indipendentemente dalle condi zioni iniziali . O meglio, questo accade a patto che r sia minore di 2 , cioè se il tasso di crescita è minore del 2oo per cento, limita zione senza dubbio valida per la crescita delle popolazioni umane. Ma, come osservò il meteorologo E . N . Lorenz nel I 963 , per valori di r più grandi di 2 la legge di Verhulst descrive determinati aspetti dei flussi turbolenti; inoltre ne esistono anche applicazioni nel l' ambito della fisica dei laser, dell'idrodinamica e della teoria delle reazioni chimiche, sicché il comportamento dei sistemi di Verhulst per valori di r maggiori di 2 non è privo di interesse. Ed è proprio in questo caso che si riscontrano i risultati più affascinanti.

1 04

CAPITOLO QUARTO

Ponendo c = r/X, la relazione precedente diventa Xn + 1 = (I + r) Xn -

; x: .

Cambiando opportunamente le unità di misura possiamo assumere che X = I , sicché la legge si semplifica ancora in Xn + l = ( I + r) xn - rx: = Xn + rxn ( I - xn ) . Chi possiede u n calcolatore può facilmente eseguire qualche prova per vedere come varia la legge di Verhulst per valori diffe renti di r, partendo in ciascun caso da un valore iniziale, ad esem pio, di x0 = o, I . Il programma dovrebbe leggere il valore scelto di r, porre x = o, I , ripetere l'operazione x = x + r * x * ( I - x) , 500 volte, per dar tempo al processo di stabilizzarsi, e poi calco lare e stampare i successivi 20 valori di x. Per valori di r minori di 2 il processo si stabilizza in fretta sul valore di equilibrio di x = I ; per r appena maggiore di 2 il processo si stabilizza in una oscillazione regolare tra due valori (r = 2 , I dà i valori o,82 e I , I 3 ) . Questo comportamento continua per tutte l e scelte d i r fino a r = 2 ,5 , quando si ha una ricorrenza ciclica di quattro punti (0,54; I , I 6; o,7o; I , 23) . Ciò continua fino a r = 2 ,55, quando incomin cia un ciclo di otto valori. Per r = 2 ,5 65 , il ciclo raddoppia ancora una volta giungendo a sedici valori sui quali il procedimento si ripete poi all'infinito; i raddoppiamenti continuano con frequenza sem pre maggiore, fintanto che a r = 2 ,5 7 l'effetto di duplicazione si è verificato un numero infinito di volte. A questo punto il com portamento del sistema dinamico diviene caotico, e i punti si spo stano di qua e di là in tutte le direzioni senza uno schema apparente. I vari cicli ai quali tende il processo di Verhulst per valori di r minori di 2 ,57 sono detti attrattori. Quindi per r minore di 2 l ' at trattore consiste in un punto, vale a dire x = I ; per r compreso tra 2 e 2 , 5 , l'attrattore è costituito da una coppia di valori; per r compreso tra 2 ,5 e 2 ,55, l'attrattore è un ciclo di 4 punti, e cosl via. Un'immagine più chiara di ciò che avviene si può ottenere dise gnando un grafico che lega il comportamento del processo, dopo la fase iniziale di assestamento, ai vari valori di r. Il grafico più

BELLEZZA DAL CAOS

grosso nella figura 4 . 1 0 mostra che cosa si ottiene prendendo valori di r da 1 , 9 a 3 , 0 , misurati lungo l' asse orizzontale, e tracciando r 20 valori successivi di x dopo una fase iniziale di 5000 ripetizioni. Un' analisi attenta della regione caotica al di sopra di r = 2 ,5 7 dimostra che u n tale caos apparente nasconde u n grande ordine . Per esempio , vicino a r = 3 , 0 c ' è una sola regione caotica; per r = 2 ,679 questa si suddivide in due regioni caotiche, per r = 2 ,59 3 in quattro, poi in otto, in sedici e così via, duplicandosi ogni volta, finché a r = 2 , 5 7 questa duplicazione è avvenuta molte volte, sic ché l'intero processo sembra riprodurre il comportamento del sistema dinamico . In effetti c ' è una costante universale secondo la

Figura 4 . 1 0 Il procedimento di Verhulst ( r , 9 < r < J ,o), con un ingrandimento dell'area evidenziata, che illustra l' autoriproduzione. Lungo l'asse orizzontale sono tracciati i valori di r da 1 , 9 a 3 , 0 . Per ogni valore di r, lungo l'asse verticale, sono tracciati 1 2 0 valori successivi di x dopo un numero iniziale di 5000 ripetizioni (fatte per permettere al processo di stabilizzarsi) . Per valori di r inferiori a 2 è generato un solo valore di x . Per r compreso tra 2 e 2 ,5 ci sono due valori, per r tra 2 , 5 e 2 , 5 5 ce ne sono quattro, poi fino a 2 , 5 65 ce ne sono otto. Questo processo di raddoppiamento continua sempre più rapidamente fino a r= 2 , 5 7 , dove subentra il caos . Ma all'interno del caos incomincia a emergere un nuovo ordine, autoriproduzione compresa.

r o6

CAPITOLO QUARTO

quale si susseguono i raddoppiamenti, associata non soltanto ai due processi di duplicazione incontrati finora, ma anche a tutti gli altri esempi di questo fenomeno : è il così detto numero di Feigenbaum, il cui valore fino a dieci decimali è 4 , 669 2 0 ! 6609 . Molto più appariscente è la comparsa nella regione caotica di fasce dove sembra regnare l'ordine . Per esempio, vicino a r = 2 , 83 il caos improvvisamente cede il posto a un ciclo a tre punti (o 3 -ciclo) ; e, nelle zona circostante il punto centrale, scopriamo un piccolissimo duplicato dell'intero diagramma di Verhulst, completo delle sue fasce ordinate circondate dal caos. Il riquadro nella figura 4 . 1 0 mostra un ingrandimento di questa zona, dilatata nel senso orizzontale. Ancora una volta siamo di fronte a un comportamento frattale ! E non è che l'inizio . . .

Gli insiemi di Julia Gli studi di Mandelbrot menzionati prima presero le mosse dal lavoro compiuto da P . J. Myrberg negli anni sessanta sulla legge di Verhulst. Ciò che caratterizzò il lavoro di Mandelbrot fu soprat tutto l' ammettere che la variabile e il parametro costante fossero numeri complessi piuttosto che semplici numeri reali . Così il suo procedimento, invece di mandare numeri in numeri sulla retta reale, manda punti in punti nel piano complesso bidimensionale (il dia gramma di Argand) . Per semplificare un po' le cose, invece di considerare la funzione / (x) = x + rx ( I - x) = - rx 2 + ( I + r) x, vista prima, Mandelbrot usò la formula lievemente più semplice /(x) = x 2 + c. Supponiamo di incominciare con un valore x0, un numero com plesso; poi vediamo che cosa accade quando si ripete la funzione f per generare una sequenza di punti x0, x1, x2 , secondo la regola • • •

xn + ! = /(xn) .

BELLEZZA DAL CAOS

107

I risultati ottenuti per il processo di Verhulst fanno presumere che la scelta della costante c sia fondamentale. Partiamo dal caso più semplice, c = O. La legge dinamica allora è solo Ci sono tre possibili soluzioni, a seconda della scelta di x0 • Primo, se x0 dista dall'origine meno di un'unità i numeri nella succes sione diventano sempre più piccoli, cioè sempre più vicini a 0: O è dunque un attrattore per il sistema . Secondo, se X0 dista da O più di un'unità i numeri nella successione diventano sempre più grandi, nel qual caso diciamo che l'infinito è un attrattore (quantunque, non essendo l'infinito un punto nel piano complesso, questo uso della parola « attrattore » è del tutto convenzionale) . L'ultima possi bilità si ha quando X0 dista dall'origine esattamente un'unità, cioè appartiene al cerchio unitario di centro in O; in questo caso la successione non abbandona mai il cerchio medesimo, che viene ad essere la frontiera tra le due sfere di attrazione, una regolata da O , l' altra dall'infinito . Questo comportamento è tipico di tutti i casi esaminati da Man delbrot, in quanto divide il piano complesso in due distinte aree di attrazione separate da una curva che le delimita. Ma Mandel brot scoprì che, per valori del parametro c diversi da zero, non soltanto l' attrattore finito può consistere in più di un punto, ma la frontiera tra le regioni dei due attrattori può essere incredibil mente complessa ed estremamente bella. Per c = o,3 r + o,o4 i, ad esempio, l' attrattore finito è un punto singolo, ma la frontiera tra la sua regione e quella regolata dall'in finito non è un cerchio perfetto, ma un cerchio deformato nel l'immagine affascinante che si può osservare nella figura 4· r r a . S i tratta d i una deformazione frattale: osservando più d a vicino ciascuna parte della frontiera, usando come « microscopio » un cal colatore, si troverà l' autosomiglianza tipica delle curve frattali, che si ripete all'infinito . Sebbene solo l' avvento del calcolatore abbia reso possibile l'esame di tali figure, Julia e Fatou avevano dimostrato che qual siasi tratto della frontiera, non importa quanto breve, contiene tutte le informazioni necessarie per determinare l'intera curva, in quanto l'intera frontiera può essere generata sottoponendo ripe-

108

CAPITOLO QUARTO

(a)

(b) Figura 4 . 1 1 Insiemi di Julia con i loro attrattori .

tutamente quel tratto alla trasformazione che genera il sistema (in questo caso /(x) = x2 + c) . In onore di Julia, questi insiemi di frontiera sono oggi noti come insiemi di Julia . La figura 4 . 1 1 b mostra un insieme di Julia associato a un proces so dinamico con un attrattore finito che consiste in un 3 -ciclo . La legge dinamica in questo caso è /(x) = x 2 + c, con c = - o, I 2 + + o , 7 4 i . La figura 4 . I 2 mostra altri esempi di insiemi di Julia che obbediscono alla legge / (x) = x2 + c, non esclusi alcuni esempi limite in cui le zone degenerano in « polvere » o « dendriti » (vedi più avanti per i dettagli) . La diversità di struttura presentata dagli insiemi di Julia a seconda della scelta del parametro c fa capire quanto questa sia decisiva. Una domanda che viene spontaneo porsi è se sia possi bile individuare una qualche struttura nei valori di c che corrispon dono allo stesso sistema dinamico, e quindi agli stessi insiemi di Julia. Tentando di rispondere a questa domanda, Mandelbrot scoprì nel I 980 il sottoinsieme del piano complesso che ora porta il suo nome : l'insieme di Mandelbrot .

L 'insieme di Mandelbrot La macchia nera a forma di scarafaggio mostrata nella figura 4 · I 3 è nota con il nome di insieme di Mandelbrot. È stato dimostrato che questo insieme è strettamente collegato con il comportamento

BELLEZZA DAL CAOS

Figura 4 . 1 2 Insiemi di Julia derivanti dalla frontiera dell'insieme di Mandelbrot.

Figura 4 . 1 3 L'insieme d i Mandelbrot ( - 2 , 2 5 < Rec < o , 7 5 , - r , 5 < Ime < r ,5 ) .

1 09

I lO

CAPITOLO QUARTO

di tutti i processi dinamici e non soltanto con l'esempio preso ora in considerazione; come tale, occupa un posto speciale di prima ria importanza in matematica, insieme ad altre figure particolari come il cerchio e i poligoni regolari . Come dovrebbe apparire evidente da un rapido sguardo alle figure 4 . 1 1 e 4 . 1 2 , un processo dinamico complesso o suddivide il piano in una o più aree interne e una sola area esterna che si estende all' infinito (figg . 4 . 1 1 a , b; 4 . 1 2a, b, c) , oppure fa degene rare l'insieme di Julia in un insieme che non delimita alcuna area interna (figg . 4 . 1 2d, e, /) . Il comportamento esatto dipende dalla posizione del parametro c rispetto all'insieme di Mandelbrot . Con siderando sempre la funzione / (x) = x 2 + c, ci occuperemo per prima cosa dei casi in cui l' insieme di Julia non è degenere , cioè in cui esiste un attrattore diverso dall'infinito. Se c è scelto all'interno del corpo centrale dell' insieme di Man delbrot, allora il corrispondente sistema dinamico ha un attrattore finito consistente in un unico punto , un punto fisso x che soddi sfa la condizione / (x) = x. L'insieme di Julia in questo caso è un cerchio con una deformazione frattale , come nella figura 4· u a , i n cui l a costante c è situata vicino a l margine destro del corpo principale a forma di cardioide dell'insieme di Mandelbrot . S e , d' altro canto, c è scelto all'interno di una delle gemme attac cate al corpo principale dell'insieme di Mandelbrot, allora l'insieme di Julia consiste in un numero infinito di cerchi con deformazioni frattali situati intorno ai punti di un attrattore ciclico . Nella figura 4 · 1 1 b , ad esempio, c è stato scelto dal centro della macchia grande all'estremità superiore dell'insieme di Mandelbrot; i tre punti indi cati formano il 3 -ciclo che funge da attrattore finito per il sistema . Un punto scelto entro una qualunque delle tre aree contenenti que sto attrattore tende a muoversi direttamente verso il 3 -ciclo ; punti scelti nelle altre aree si dirigeranno verso un attrattore « locale » che viene poi mandato al 3 -ciclo . Se c è il punto di germinazione di una gemma sull' insieme di Mandelbrot , l'insieme di Julia risulta avere dei cirri che si proten dono verso un attrattore marginalmente stabile, come nella figura 4 . 1 2a , che si stabilizza in un 2 o-ciclo (c = 0 , 2 7 3 3 4 + o , oo742i) , oppure nella figura 4 . 1 2 b, che h a u n 4-ciclo (c = - 1 , 2 5 ) . Infine, se c è un qualunque altro punto del contorno dell' in-

BELLEZZA DAL CAOS

III

Figura 4 . 1 4 I l disco di Siegel.

sieme di Mandelbrot, l'insieme di Julia risulta essere ciò che è noto come il disco di Siegel, un esempio del quale si vede nella figura 4 . 1 4 (c = - 0 , 3 90 54 - 0 , 5 8 6 7 9 i) , dove un punto fisso è circon dato da cerchi invarianti. Ciò che accade in questo caso è che un punto entro l' area circoscritta dall'insieme di Julia tenderà verso il disco contenente il punto fisso, dopo di che orbiterà per sempre intorno al punto fisso sul suo cerchio invariante . I quattro tipi d i insiemi d i Julia visti sopra sono i soli possibili per il processo /(x) = x 2 + c. Nel 1 98 3 Dennis Sullivan dimostrò l' esistenza di un altro tipo di insieme di Julia non degenere deri vato da altri tipi di sistemi dinamici complessi, detto anello di

Herman.

Questo è quanto per gli insiemi non degeneri di Julia. E per gli altri, come quelli delle figure 4 . 1 2d, e, / ? Ingrandimenti del l' insieme di Mandelbrot rivelano che esso è circondato da sottili antenne che si diramano dal corpo principale . Se c è scelto su una di queste antenne, si otterrà un insieme di Julia dalla forma simile . La figura 4 . 1 2e mostra l'esempio per c = i; qui si ha un unico attrat tore infinito , a cui tendono tutti i punti, tranne quelli che si tro vano proprio sul tenue insieme di Julia (detto dendrite) . La figura 4 . 1 3 non è sufficientemente particolareggiata per

II2

CAPITOLO QUARTO

mostrare anche le suddette antenne, ma è possibile individuare la posizione di alcune dalla presenza di macchioline sulla loro traiet toria. Macchioline? Da un esame attento, con un ingrandimento al calcolatore, risultano essere nient ' altro che minuti duplicati dello stesso insieme di Mandelbrot ! A loro volta, esse presentano piccolissime antenne, sulle quali si possono individuare . . . e così via, ad in/initum . (Le aree ordinate nella zona caotica del dia gramma della fig . 4 · 1 0 corrispondono alla posizione di questi « ger mogli » sull ' asse reale) . Se c è scelto su uno di questi germogli , si otterrà un insieme di Julia dato dalla combinazione di una den drite e di un numero infinito di copie dell 'insieme di Julia del corrispondente valore di c sul corpo principale dell'insieme di Mandelbrot (fig . 4 · 1 5) . L'unica possibilità che ci rimane è scegliere c all'esterno del l' insieme di Mandelbrot , con tutte le sue gemmazioni . In questo caso l'infinito è l'unico attrattore, e l' insieme di Julia si dissolve in punti isolati detti polvere di Fatou; questa polvere diventa sem pre più fine a mano a mano che c si allontana dall'insieme di Man delbrot . Se c è scelto su un punto vicino alla frontiera dell' insieme di Mandelbrot , la polvere è abbastanza fitta da creare dei motivi affascinanti, come nelle figure 4 . 1 2d, f. Nella figura 4 . 1 2/, c è vicino al valore che genera la figura 4 . 1 2c, e c ' è una notevole somi-

Figura 4 . 1 5 U n insieme di Julia d a una gemma di Mandelbrot.

BELLEZZA DAL CAOS

I IJ

Figura 4 . 1 6 Viaggio nella regione di frontiera dell ' insieme d i Mandelbro t .

glianza tra i due insiemi di Julia. Tali « ricami » di polvere hanno sempre un aspetto frattale, cioè sono autosimili , con una dinamica caotica . N o n c i s i stupirà quindi s e l a frontiera dell 'insieme d i Mandel brot, che ha un ruolo così determinante nella dinamica dei sistemi associati , è essa stessa un oggetto di grande interesse . Come pro babilmente ci si aspetterà, a questo punto , la frontiera risulta avere

I I4

CAPITOLO QUARTO

una complicata superfice frattale . La figura 4 . 1 6 offre solo una percezione fugace di questo mondo straordinario , accessibile solo tramite i calcolatori, in cui la quantità di particolari che si pos sono scorgere dipende dalla potenza della macchina. Se esiste un' a rea della matematica « figlia » dell' era dei calcolatori, questa è pro prio la teoria dei frattali .

C apitolo 5 I gruppi semplici

Il teorema enorme Nell' estate del 1 980 il matematico Ronald Solomon dell ' Ohio State University depose la penna dopo aver risolto un problema tecnico di algebra : quel semplice atto segnò la fine di una ricerca iniziata negli anni quaranta, che aveva coinvolto oltre cento mate matici negli Stati Uniti , in Gran Bretagna, Germania, Australia, C anada e Giappone . Infatti, il risultato conseguito da Solomon riempl l'ultimo spazio vuoto di un puzzle enorme ed estremamente complesso : la classificazione dei gruppi finiti semplici . *

Il teorema di classificazione è senz ' ombra di dubbio il più grande teorema che la matematica abbia mai conosciuto . La dimostrazione originale , che occupa quasi 1 5 ooo pagine disseminate in 500 arti coli su riviste di matematica, ha richiesto il contributo di oltre r oo matematici. Nel corso delle ricerche furono fatte scoperte che por tarono ad avanzamenti nella teoria degli algoritmi, nella logica mate matica, in geometria e nella teoria dei numeri , ed è stata avanzata l'ipotesi che ci possano essere anche applicazioni nella formula zione di una teoria unificata dei campi in fisica. Tuttavia, come per molti risultati importanti in matematica, l'ori gine del problema è molto semplice; in questo caso si tratta della nota formula

*

Tutti i termini tecnici saranno spiegati a tempo debito.

u6

CAPITOLO QUINTO

per le radici dell'equazione quadratica

ax 2 + bx + c = O , e dei tentativi per ottenere soluzioni simili per equazioni d i grado maggiore, cioè che comportino potenze di x maggiori di 2 , come ad esempio l'equazione cubica che vedremo tra poco . Per « solu zione simile » si intende una soluzione che comporti solo le opera zioni algebriche di addizione, sottrazione, moltiplicazione e divi sione, nonché l'estrazione di radici; tali soluzioni sono talvolta dette soluzioni per radicali .

Évariste Galois Dall'esame di antiche tavolette, risulta che i matematici babi lonesi del 1 6oo a. C . sapevano risolvere le equazioni quadratiche, sebbene non possedessero alcuna notazione algebrica per esprimere le loro equazioni e soluzioni come facciamo noi oggi. Si giunse alla soluzione per radicali di un'equazione cubica della forma

ax 1 + bx 2 + ex + d = O , solo nel secolo XVI, quando i matematici italiani Scipione d e Ferro e Nicola Fontana, ognuno per conto proprio, trovarono il metodo per risolverla. Girolamo Cardano pubblicò la soluzione di Fon tana nella sua Ars Magna del 1 545 , che conteneva anche il metodo di Ludovico Ferrari per risolvere un'equazione di quarto grado, riducendola a una di terzo grado . Ma a quel punto ci si fermò : nonostante gli sforzi di molti matematici, tra cui anche il grande Eulero a metà del secolo XVIII, nessuno fu in grado di trovare una soluzione per l'equazione di quinto grado ax 5 + bx 4 + cx 1 + dx 2 + ex + f = O .

Nel 1 770 Joseph Louis Lagrange ipotizzò che le soluzioni non fos sero esprimibili tramite radicali; nel 1 8 24 il matematico norvegese Niels Henrick Abel dimostrò che le cose stavano proprio così . Se non esiste un metodo generale, cioè una formula, per risolvere un'equazione di quinto grado, è naturale chiedersi se ci sia un modo per decidere se un'equazione di quinto grado data possa o no essere

I GRUPPI SEMPLICI

II]

risolta per radicali. Abel era alle prese con questo problema quando morì nel r 82 9 , all'età di 26 anni. Nello stesso periodo, come spesso accade, anche colui che alla fine avrebbe risolto il problema ci stava lavorando intensamente . Ma i notevoli risultati ottenuti dal gio vane É variste Galois sarebbero stati riconosciuti dalla comunità dei matematici solo dopo circa undici anni dalla sua morte, avve nuta in un duello . A questo proposito c'è una lunga storia, dalla quale il giovane è proprio l'unico a uscire a testa alta. Galois era nato vicino a Parigi nell'ottobre r 8 r r . Incomin ciò a interessarsi alla matematica all'età di I 4 anni, quando fu costretto a ripetere il terzo anno di liceo dopo essere stato boc ciato agli esami. Scoprì che la matematica aiutava a mitigare la noia che provava per il resto delle materie scolastiche. Sfortuna tamente, la sua passione crescente per la matematica fece ancora peggiorare il suo andamento scolastico, e quando all'età di 1 5 anni sostenne l' esame di ammissione alla prestigiosa É cole Polytechni que riportò un insuccesso e dovette iscriversi alla più modesta É cole Normale . Fu lì che l' anno seguente scrisse il suo primo trattato di matematica: un lavoro valido, sebbene di poco rilievo, sulle fra zioni continue . Un inizio promettente, ma subito seguito da una serie di sfortunate circostanze che dovevano concludersi con il suo completo abbandono della materia che tanto amava. I due trattati che seguirono, sulle equazioni polinomiali, furono respinti dall'Accademia francese delle scienze . Peggio, tutti e due i manoscritti furono inspiegabilmente smarriti. Poi, nel luglio r 829, ancora una volta non riuscì a. entrare all' É cole Polytechnique, forse a causa di una sua risposta a una domanda particolare fat tagli dall'esaminatore. Infatti, quando gli fu chiesto di esporre la teoria dei logaritmi aritmetici nelle sue linee essenziali, Galois rispose, molto propriamente ma dimostrando una incredibile man canza di tatto e di opportunismo, che non esistono logaritmi « arit metici ». Dopo questa delusione, all'inizio del r 83o Galois presentò ancora un altro saggio all'Accademia, questa volta per concorrere al Gran premio per la matematica. Il segretario, Fourier, si portò il manoscritto a casa per leggerlo, ma morì prima di aver steso la sua relazione, e il saggio non fu mai ritrovato . Il fatto che per la terza volta un suo lavoro andasse smarrito, sommato al fatto che di nuovo gli fu negata l' ammissione all' É cole Polytechnique,

I I8

CAPITOLO QUINTO

convinse Galois a rifiutare la comunità accademica e a diventare ciò che oggi chiameremmo un contestatore. In quell' anno era stato espulso da scuola, ed era costretto a vivere dando lezioni private . Sebbene non si distinguesse in questa attività, proseguì gli studi matematici, e proprio in quel periodo produsse quello che era desti nato a diventare il suo saggio più famoso, Sur les conditions de réso lubilité des équations avec les radicaux, presentato all'Accademia nel gennaio I 8 3 1 . Questo fu l'ultimo tentativo che fece per ottenere un ricono scimento al suo lavoro . A marzo, non avendo avuto notizie dal l' Accademia, scrisse al presidente per sapere che fine avesse fatto il suo scritto . Non avendo ricevuto risposta a quella lettera, final mente mise il cuore in pace: non si sarebbe più occupato di mate matica. Si arruolò allora nella Guardia Nazionale. Ma qui non sem brò avere più fortuna di quanta ne avesse avuta con la matematica. Subito dopo il suo ingresso, la Guardia si sciolse in seguito ad accuse di cospirazione . A un banchetto organizzato in segno di protesta il 9 maggio, Galois propose un brindisi al re brandendo un col tello, gesto che fu, come ci si può immaginare, interpretato dai suoi compagni come una minaccia alla vita del re; il giorno dopo fu arrestato . Al processo sostenne di avere in realtà pronunciato la frase « A Luigi Filippo , se diventa un traditore », ma che il bru sio aveva coperto le sue ultime parole. Vero o falso che fosse, egli fu scagionato e liberato il 1 5 giugno . Il I 4 luglio, finalmente, seppe cosa era successo al saggio che aveva inviato all'Accademia. Definendolo « incomprensibile », Pois son lo aveva respinto, concludendo così la sua relazione: Abbiamo compiuto ogni sforzo per comprendere la dimostrazione di Galois . Il suo ragionamento non è sufficientemente chiaro, sufficientemente svilup pato, per permetterei di valutarne la correttezza, e non siamo in grado di darne un parere in questa relazione . L' autore annuncia che il teorema che cos tituisce l ' oggetto precipuo di questa dissertazione appartiene a una teo ria generale suscettibile di molte applicazioni . Forse risulterà che le diverse parti della teoria si chiariscono a vicenda e che è più facile cogliere il signifi cato del tutto che delle singole parti . Noi riteniamo quindi che l ' autore dovrebbe pubblicare l ' intero lavoro per un giudizio definitivo. Nella forma in cui è stato attualmente sottoposto all' Accademia non possiamo proporne l ' approvazione .

Chi ha esperienza di risposte negative formulate con tono di suf-

I GRUPPI SEMPLICI

ficienza avverte subito che questa relazione è un classico del suo genere, ma non sappiamo se questo ennesimo rifiuto abbia o no influito su ciò che Galois fece dopo . Il 14 luglio fu arrestato per essere comparso in pubblico indossando l'uniforme della ormai disciolta Guardia Nazionale e condannato a sei mesi di reclusione. Poco dopo la sua scarcerazione sulla parola, si innamorò di una certa Stephanie D. (non se ne conosce il cognome, che pure appa riva in un manoscritto di Galois, ma che fu poi cancellato furiosa mente, forse in seguito a un rifiuto) . Questo fatto doveva portarlo a morte precoce: in qualche modo, l' affaire fu responsabile della sua partecipazione a un duello . Alexandre Dumas insinuò che il duello fosse un complotto per mascherare un assassinio a sfondo politico . Il 29 maggio, alla vigilia del duello, Galois scrisse una lunga lettera all' amico Auguste Chevalier in cui riassunse le sue teorie, dando così al mondo dei matematici soltanto un'idea di ciò che stava per perdere . Nel duello del giorno seguente, Galois fu colpito al ventre , e ventiquattro ore dopo morì . Che ne fu del suo trattato respinto? Il 4 luglio 1 843 , Joseph Liouville scrisse all'Accademia francese esordendo con queste parole: � pero di suscitare l' interesse dell 'Accademia annunciando che tra le carte di Evariste Galois ho trovato una soluzione , tanto precisa quanto profonda, di questo bel problema: se sia o no risolvibile per radicali . . .

Il concetto di gruppo, che Galois aveva lasciato al mondo doveva rivelarsi uno dei più significativi di tutti i tempi, con applicazioni in molti campi della matematica, della fisica, della chimica e dell'inge gneria. È un concetto totalmente astratto . Ciò che lo rende così impor tante è il fatto che molte strutture, spesso di natura del tutto dif ferente, possono essere considerate gruppi . La nozione di gruppo, proprio per la sua versatilità, può essere introdotta in modi diversi; qui abbiamo scelto quello che sfrutta le proprietà di simmetria delle figure geometriche piane, semplicemente perché offre esempi che si visualizzano facilmente . Più avanti in questo capitolo incontre remo altri tipi di gruppi.

! 20

CAPITOLO QUINTO

La simmetria Consideriamo il triangolo isoscele della figura 5 . I ; nel linguag gio corrente questa figura geometrica è simmetrica rispetto all' asse verticale tratteggiato . Con l' affermazione che il triangolo ABC è simmetrico intendiamo dire che la parte del triangolo a sinistra dell' asse (cioè il triangolo più piccolo ABD) è l'immagine speculare della parte a destra (cioè il triangolo A CD) rispetto a uno specchio immaginario posto perpendicolarmente al piano lungo l' asse AD. Se dovessimo scambiare di posto (o « riflettere ») le due metà della figura, il risultato sarebbe un triangolo in tutto e per tutto simile ed esattamente nella medesima posizione, ma con i lati AB e A C invertiti di posto e i l lato B C rovesciato . In termini generali, per qualsiasi figura geometrica S del piano e per qualsiasi retta l del piano, la riflessione di S rispetto all'asse l è l' atto di spostare ogni punto di S nella sua immagine speculare rispetto a l, cioè nel punto che sta a una distanza uguale da l sulla perpendicolare a l stessa passante per il punto dato . Si noti che è l' azione di trasformazione della figura a esser detta riflessione e non il risultato di tale azione (per motivi che risulteranno ovvi ci occuperemo delle azioni piuttosto che dei loro risultati) . La figura

Figura 5 · r Simmetria di un triangolo isoscele.

121

I GRUPPI SEMPLICI

ottenuta applicando l a riflessione a una figura S è detta l' imma gine di S in quella riflessione . La figura 5 . 2 mostra qualche esem pio di riflessioni . Usando la nozione di riflessione, il matematico dice che una figura S sul piano è simmetrica rispetto a un asse di simmetria l se il risultato della riflessione di S rispetto a l è una immagine che occupa esattamente la medesima posizione di S sul piano . La figura 5 . 2d mostra un esempio di simmetria rispetto a un asse. La sim metria rispetto a un asse talvolta è detta simmetria assiale. La simmetria assiale è ciò che comunemente si intende quando si usa il termine « simmetria » (per figure sul piano) , ma per il mate matico esiste un altro tipo di simmetria, illustrata nella figura 5 . 3 .

(a)

(b)

(c)

(d)

Figura 5 . 2 Riflessioni rispetto a un asse. I n ciascun caso l a figura i n neretto è riflessa rispetto all'asse indicato dalla linea tratteggiata e produce l' immagine meno marcata. In (d ) l'immagine e la figura originale coincidono .

122

CAPITOLO QUINTO

(a)

Figura 5 · 3 Riflessioni successive.

(b)

(c)

Se la figura mostrata viene ruotata di un angolo di I 2 0 ° in una direzione o nell' altra rispetto al punto centrale, finirà per occu pare esattamente la medesima posizione sul piano . Questo è un esempio di simmetria di rotazione. Si tenga presente che ci stiamo occupando di rotazione rispetto a un punto: anche se ruotiamo il triangolo della figura 5 . I di I Bo 0 rispetto alla linea AD presa come asse, la figura viene a trovarsi nella medesima posizione, ma il risultato è lo stesso della riflessione rispetto ad AD.

Il concetto di gruppo Consideriamo ancora il triangolo isoscele della figura 5 . I Quante simmetrie ha? Vale a dire, quali sono le riflessioni (rispetto ad assi) e le rotazioni (rispetto a punti) che mandano il triangolo in un'im magine che occupa esattamente la medesima posizione del trian golo originale? Innanzitutto, c'è la riflessione rispetto all' asse AD, che chiameremo r. Esistono altre simmetrie? Chiaramente non esi stono altre simmetrie assiali, ma che cosa si può dire per le rota zioni? Certamente una rotazione di 3 60 ° rispetto a un punto qual siasi riporterà la figura al punto di partenza, ma non ha molto senso considerarla, poiché in questo caso il risultato non porterebbe ad .

1 23

I GRUPPI SEMPUCI

alcun cambiamento (mentre nel caso della riflessione r i punti B e C vengono a occupare posizioni diverse rispetto a quelle iniziali) . Quindi trascureremo , o quasi, esempi così banali. Ma così come è utile considerare il numero O (che non modifica il risultato in una addizione) e il numero r (che non incide su una moltiplica zione) , allo stesso modo risulta utile annoverare tra le simmetrie la trasformazione identica I che lascia tutti i punti del piano inva riati; I può essere considerata una rotazione di 0 ° . Supponiamo di prendere il triangolo ABC (fig. 5 . 4a) e di appli care la riflessione r, per dare origine al triangolo ACB della figura 5 . 4b. Che cosa accade quando applichiamo di nuovo r ad ACB? Chiaramente ci ritroviamo un' altra volta nella configurazione ori ginale ABC (fig . 5 . 4c) ; quindi, applicare r due volte consecutive equivale esattamente a non fare nulla, o, per dirla in altri termini, equivale ad applicare la trasformazione identica I. Questa idea può essere espressa simbolicamente scrivendo

r �' r = I, dove l'asterisco 1, significa « applica ancora »; se a e b sono due sim metrie, a �' b indica l'operazione che consiste nell'applicare prima a, e poi b al risultato . Usando la stessa notazione , possiamo descri-

Figura 5 - 4 Simmetria d i rotazione.

1 24

CAPITOLO QUINTO

vere gli effetti (in questo caso insignificanti) che si ottengono appli cando altre sequenze di simmetrie, cioè:

r* I = r, I * r = r, I* I = I. Queste quattro identità si possono riassumere in una tabella:

Triangolo isoscele: *

I

r

I

I

r

r

r

I

Per vedere l'effetto dell' applicazione della simmetria x seguita da un' altra simmetria y , scorriamo la riga della x della tabella finché troviamo la colonna delle y e leggiamo il valore di x * y , cioè il risul tato delle due simmetrie combinate . Si tenga presente che abbiamo sempre dato per scontato che il risultato ottenuto eseguendo due simmetrie di seguito fosse anch'esso una simmetria. Le cose stanno proprio così, e il lettore se ne renderà conto se ci pone mente un attimo . Che cosa accade quando si procede allo stesso modo con la con figurazione a tre punte della figura 5 . 3 ? In questo caso ci sono tre simmetrie : una rotazione di r 2o 0 in senso antiorario che chia meremo v, una rotazione di 240 ° in senso antiorario che chiame remo w e l'identità I. Ci si potrebbe chiedere che cosa accade con rotazioni in senso orario . Il risultato di una rotazione di 1 2 0 ° in senso orario è identico a w, e quello di una di 240 ° gradi equivale a v, sicché abbiamo davvero elencato tutte le possibilità. Poiché due rotazioni successive di r 2o 0 danno lo stesso risultato di una di 240 ° , chiaramente si ha che:

V * V = W. Allo stesso modo, due rotazioni di 240 ° equivalgono a una rota-

I GRUPPI SEMPLICI

zio ne di r 2 0 ° , cosicché La tabella completa della composizione di simmetrie è:

Tripode: 1
.

CAPITOLO SETTIMO

Impiegando sostanzialmente lo stesso tipo di ragionamento usato per dimostrare il teorema dei cinque colori per le mappe disegnate su una sfera, Heawood dimostrò che per una superficie con caratte ristica di Eulero pari a n, con n :::;;; I , il numero di colori sufficienti per colorare tutte le mappe disegnate sulla superficie è uguale a

� (7 + -../ 4 9 - 2 4 n) . Sfortunatamente, l'unica superficie per la quale n è maggiore di I è la sfera, per la quale n = 2 ; il pur notevole risultato di Heawood non comprendeva proprio il caso di interesse più generale. (Osser viamo che se poniamo n = 2 nella formula di Heawood, otteniamo proprio 4) . Così per il toro, per il quale n = O, sono sufficienti sette colori, e poiché non è difficile disegnare una mappa sul toro che non possa essere colorata con sei colori, questo conferma il « teorema dei sette colori » per mappe disegnate su un toro: sette colori sono suffi cienti e meno colori non lo sono . In effetti, nel I 968 Ringel e Youngs dimostrarono che la formula di Heawood dà l'esatto numero minimo di colori richiesti in ogni caso tranne che per la sfera, per la quale allora non si conosceva la risposta, e per la bot tiglia di Klein, per la quale n = O e la formula dà 7, ma si è dimo strato che in realtà occorrono solo sei colori . *

Verso il teorema dei quattro colori Dopo il lavoro di Heawood, numerosi matematici e un numero ancor maggiore di dilettanti studiarono il problema dei quattro colori, sviluppando nel corso delle ricerche numerose tecniche che si rivelarono poi applicabili in altri settori della matematica. Col senno di poi, si può ritenere che parte dello sforzo compiuto abbia contribuito alla risoluzione finale del problema. Ecco in breve che cosa accadde. Nel I 9 I 3 George Birkhoff migliorò la tecnica della riduzione di Kempe riuscendo a dimostrare che determinate configurazioni * Come conseguenza del teorema dei quattro colori oggi si sa che la bottiglia di Klein è la sola superficie per la quale la formula di Heawood non dà la risposta minima esatta.

IL PROBLEMA DEI QUATTRO COLORI

maggiori di quelle di Kempe sono riducibili. Nel 1 9 2 2 Franklin si servì di alcuni dei risultati di Birkhoff per dimostrare che ogni mappa con 2 5 o meno paesi può essere colorata con quattro colori. Nel 1 9 2 6 Reynolds superò questo risultato portando i paesi a 2 7 , e nel 1 93 8 Franklin s i aggiudicò nuovamente il « primato » arri vando a 3 1 paesi. Nel 1 940 Winn giunse a quota 3 5 , e qui ci si fermò fino al 1 970, quando Ore e Stemple dimostrarono il teo rema dei quattro colori per tutte le mappe con meno di 40 paesi. Si arrivò a 96 prima che la dimostrazione finale di Appel e Haken rendesse superflui tutti questi risultati. Anche se questo lavoro ha mostrato che molte configurazioni sono riducibili, l'insieme di tutte le configurazioni che entro il 1 970 erano risultate riducibili era ben lontano dal formare un insieme inevitabile, condizione indispensabile per provare la congettura dei quattro colori . Erano stati costruiti svariati insiemi, ma nes suno sembrava potesse condurre a un insieme inevitabile di confi gurazioni riducibili: la riducibilità escludeva l'inevitabilità e vice versa. Nel 1 950 il matematico tedesco Heinrich Heesch, che lavorava al problema dei quattro colori dal 1 93 6 , stimò che un insieme inevitabile di configurazioni riducibili avrebbe dovuto con tenere circa r o ooo configurazioni distinte. Sebbene questa stima dovesse infine risultare eccessiva, Heesch aveva ragione nel segna lare che il problema sarebbe stato risolto solo con l' aiuto di calco latori molto potenti in grado di trattare una sterminata quantità di dati. Rendendosi conto che la chiave per arrivare alla soluzione stava nella capacità di maneggiare grandi insiemi di configurazioni, Heesch fu il primo a sostenere la necessità di affrontare il pro blema con l'aiuto di un calcolatore e a sperimentare questo metodo . Egli incominciò col formalizzare i vari metodi conosciuti per la dimostrazione di configurazioni riducibili e rilevò che almeno uno di questi (una semplice generalizzazione del metodo di Kempe) era sufficientemente meccanico per essere eseguito da un calcola tore. Karl Durre, uno studente di Heesch, scrisse un programma per dimostrare la riducibilità, usando la rappresentazione della mappa in termini di grafo duale, che costituiva un modo più sem plice per affrontare il problema al calcolatore . C 'era un problema da superare: se un metodo per provare la riducibilità di una particolare configurazione avesse dato esito nega-

CAPITOLO SETTIMO

tivo, ciò non avrebbe necessariamente implicato la non riducibi lità della configurazione; un altro metodo avrebbe potuto riuscire là dove il primo aveva fallito. Per superare questa difficoltà si ren deva necessario sviluppare quello che potremmo chiamare un pic colo « arsenale » di tecniche per provare la riducibilità. Entro la fine degli anni sessanta, Heesch aveva attrezzato un arsenale abba stanza vasto perché Appel e Haken lo usassero quando partirono all' assalto del problema nel I 976. Nella costruzione di un insieme inevitabile di configurazioni, però, il progresso non era stato altrettanto consistente . Heesch tentò un metodo che prendeva spunto dallo spostamento di una carica su un circuito elettrico, ma non lo adottò per molto . Forse avrebbe fatto bene a insistere, perché era quello lo stratagemma che avrebbe portato alla risoluzione finale .

Il metodo della carica di Heesch Il grafo duale associato a una mappa normale minimale che richiede cinque colori (in conformità con il lavoro di Kempe) è un grafo in cui ogni faccia è un triangolo e in cui in ciascun ver tice convergono almeno cinque lati (il numero di lati convergenti in un vertice è detto grado del vertice) . L'idea consiste nel consi derare la rete come un circuito elettrico e assegnare una carica a ciascun vertice secondo questa regola: se un vertice ha grado k, gli si dà carica 6 - k. Così i vertici di grado 5 hanno una carica positiva pari a + I , i vertici di grado 6 non hanno carica, i vertici di grado 7 hanno carica - I e così via. Dal lavoro di Kempe deriva che la somma delle cariche sull'intero circuito è sempre I 2 . Non è importante il valore di I 2 in sé, quanto il fatto che la somma delle cariche sia sempre positiva. Ora supponiamo di incominciare a muovere le cariche positive lungo il circuito, anche in quantità frazionarie . Questo non por terà ad alcuna perdita o guadagno netti nella carica totale del cir cuito, ma alcuni vertici di grado 5 potranno finire per perdere tutta la loro carica, cioè diventare scarichi, mentre alcuni vertici di grado superiore a 6 potranno finire con una carica positiva, cioè diven tare carichi . L'esatta situazione finale dipenderà solo dalla proce-

1 93

IL PROBLEMA DEI QUATTRO COLORI

dura di scaricamento adottata. Tuttavia (e qui sta il nocciolo della questione) , poiché è possibile determinare la disposizione di pic cole porzioni di una mappa senza conoscere l'intera mappa, allora, data una determinata procedura di scaricamento, è possibile gene rare un elenco finito di tutte le configurazioni che risulteranno con carica positiva netta. Ora, poiché la carica totale sul circuito è positiva, ci sarà sem pre qualche vertice con carica positiva. Così, poiché tutti i possi bili accettori di carica positiva sono compresi nell'elenco finito di configurazioni generato dalla procedura di scaricamento, ogni cir cuito del tipo che stiamo considerando deve contenere almeno una di queste configurazioni. In altre parole, l'elenco di configurazioni generato costituirà un insieme inevitabile, che è quanto stiamo cer cando . L'insieme inevitabile originario di Kempe può essere con siderato come l'insieme derivato dalla procedura « banale », che con siste nel non muovere affatto alcuna carica. Così il metodo dello scaricamento è una generalizzazione del metodo di Kempe, ed es sendo più generale dovrebbe avere maggiore probabilità di successo. Un semplice esempio dovrebbe aiutare a chiarire le idee, anche se è probabile che il lettore dovrà riflettere un po ' per capire che cosa accade . Si parta dal presu pposto che la procedura di scarica mento consista nel trasferire 5 dell'unità di carica da ogni vertice di grado 5 a ciascun vertice contiguo avente grado uguale o mag giore di 7 . Allora l'insieme inevitabile consiste nelle due sole con figurazioni della figura 7 . I 5 . Per vedere come ci si giunge, si tenga presente per prima cosa che un vertice di grado 5 può risultare positivo solo se ne ha almeno uno contiguo di grado 5 (fig. 7 . I 5a) o di grado 6 (fig . 7 . I 5 b) . Un vertice di grado 6 parte senza nes suna carica, e non ne riceve nessuna con questo procedimento . Un vertice di grado 7 può diventare positivo solo se ne ha almeno sei contigui di grado 5; se questo si verifica, allora, poiché ogni faccia è un triangolo, due di questi contigui sono uniti da un lato (quindi la fig. 7 . I 5a si riferisce a quella coppia di contigui) . Un vertice di grado uguale o maggiore di 8 non può diventare positivo anche se tutti i suoi contigui hanno grado 5 . Muovere solo -} di carica non basterà: ad esempio, per un vertice di grado 8 con otto con tigui di grado 5 la carica originaria sarà 2 , la carica ricevuta sarà 8 X -} = f unità, lasciando una carica finale di f. -

1 94

CAPITOLO SETTIMO

(a)

(b)

Figura 7 . 1 5 L'insieme inevitabile generato dalla semplice procedura d i scaricamento descritta nel testo. L' insieme inevitabile è costituito dalle configurazioni (a) e (b) . In (a) la configu razione è costituita da due vertici di grado 5 collegati tra loro, in (b) da un vertice di grado 5 collegato a un vertice di grado 6. Le coppie di vertici sono raffigurate da tondi neri collegati da una linea marcata. Il resto di ciascuna delle due configurazioni è deter minato dal grado dei vertici della coppia d'origine e dal fatto che il grafo è triangolare. Non esiste alcuna limitazione per il grado dei vertici esterni, raffigurati da cerchi bian chi . « Inevitabile >> significa che si troverà sempre almeno una delle due reti (a) e (b) .

Quindi le due configurazioni mostrate in figura formano un in sieme inevitabile, cioè si troveranno sempre in qualsiasi tipo di grafo . L'idea di usare il metodo della carica per dimostrare la conget tura dei quattro colori è motivata dalla speranza di trovare una procedura di scaricamento tale che l'insieme inevitabile che ne deriva sia costituito esclusivamente da configurazioni riducibili. Se questo si può fare, ne consegue immediatamente il teorema. (Detto per inciso, nessuna delle due configurazioni presentate nel l'esempio di prima è riducibile) .

La dimostrazione del teorema dei quattro colori Nel 1 970 Wolfgang Haken si imbatté per caso in alcuni nuovi metodi per migliorare le procedure di scaricamento e, sebbene l'im presa sembrasse ardua e tale da richiedere un tempo di calcolo immenso, egli incominciò a sperare che si sarebbe infine arrivati alla dimostrazione della congettura dei quattro colori . Nel 1 9 7 2 ,

IL PROBLEMA DEI QUATTRO COLORI

1 95

insieme a Kenneth Appel, si mise a lavorare seriamente nel tenta tivo di trasformare questa speranza in realtà. Il loro scopo era individuare un procedimento che portasse a un insieme inevitabile di configurazioni riducibili . Questo com portava due cose: trovare la procedura di scaricamento e dimo strare che le configurazioni inevitabili così originate erano riduci bili . In un primo tempo lavorarono su tipi di grafi molto limitati che, in base al precedente lavoro di Heesch e altri, dovevano essere più facili da trattare . La strategia di massima era chiara: partire da una procedura di scaricamento che sembrasse promettente e cercare di dimostrare che ciascuna delle configurazioni inevitabili risultanti era riducibile . Se una o più configurazioni dell'elenco non fossero risultate riducibili, si sarebbe dovuta modificare la pro cedura di scaricamento in modo che quella configurazione, o quelle configurazioni, non comparissero più. Sebbene si tratti di una stra tegia semplice da descrivere, attuarla non fu affatto un'impresa facile. Occorsero molte settimane di « dialogo » uomo-macchina per provare uno dopo l' altro vari procedimenti di scarica, ma gradual mente si fecero progressi . Un simile metodo « sperimentale » al cal colatore, costellato di interventi umani, fu adottato simultanea mente dai due ricercatori nel tentativo di trovare metodi sempre più perfezionati per la dimostrazione della riducibilità . Dopo tre anni di lavoro di questo tipo, e cioè all'inizio del 1 976, essi final mente capirono di avere sufficienti informazioni per affrontare il problema nella sua interezza. Il risultato di tutto il loro lavoro spe rimentale fu lo sviluppo di una procedura di scaricamento che sem brava in grado di produrre un insieme inevitabile di configurazioni riducibili, e la stesura di una sequenza di passaggi per la dimostra zione della riducibilità che sembrava funzionare sui tipi di confi gurazioni che avrebbero incontrato. Il loro programma era in grado di automodificarsi in modo che, quando si fosse imbattuto in una configurazione di cui non poteva dimostrare la riducibilità, avrebbe mosso una carica positiva lungo il circuito per ovviare alla diffi coltà. Ma il tutto avrebbe funzionato? Il solo modo per verificarlo consisteva nel far partire il programma e vedere che cosa sarebbe successo, e questo è quanto fecero . Sei mesi dopo, nel giugno 1 976, ottennero la risposta. Il loro programma era riuscito, con notevole aiuto da parte dei suoi due

CAPITOLO SETTIMO

ideatori ormai molto esperti, a dimostrare il teorema dei quattro colori . Erano occorsi quattro anni di intenso lavoro e I 200 ore di impiego del calcolatore. La procedura iniziale di scaricamento aveva subìto circa 500 modifiche prima di giungere a quella finale, modifiche suggerite man mano dal risultato dei vari tentativi. I due matematici dovettero analizzare a mano qualcosa come I O ooo vertici dotati di carica positiva, e il calcolatore dovette esaminare oltre 2ooo configurazioni e dimostrare la riducibilità di un totale di 1 482 configurazioni dell'insieme inevitabile. Tutto funzionò . Gli sforzi di cent' anni di ricerche erano giunti al termine . La matematica, da quel momento, non sarebbe mai più stata la stessa.

C apitolo 8 L' ultimo teorema di Fermat

Il

problema più famoso della matematica*

All'inizio del 1 983 , Gerd Faltings, un matematico tedesco di ventinove anni, ha dimostrato un risultato che rappresenta il primo importante passo avanti compiuto negli ultimi cento anni verso la soluzione del più famoso problema matematico irrisolto. Si tratta naturalmente dell'ultimo teorema di Fermat, che da trecento anni costituisce un rompicapo famoso, e non solo in campo matema tico: qualsiasi persona istruita ne avrà perlomeno sentito parlare. La sua origine risale a un' annotazione scarabocchiata nel margine di un libro . Quando morì, il 1 2 gennaio 1 665 , Pierre de Fermat era uno dei matematici più famosi d'Europa. Sebbene oggi il suo nome sia sempre associato alla teoria dei numeri, gran parte del lavoro da lui svolto in quell' ambito era così avanzato per quel tempo che i contemporanei lo conoscevano piuttosto per i suoi studi sulla geo metria delle coordinate (che egli inventò indipendentemente da Cartesio) , sul calcolo infinitesimale (portato a termine da Newton e Leibniz) e sulla teoria delle probabilità (le cui basi furono get tate essenzialmente da Fermat e da Pascal) . Malgrado tutto, egli non era un matematico di professione, bensì avvocato e magistrato presso il parlamento provinciale di Tolosa, posizione da lui rag giunta nel 1 63 1 all'età di trent' anni. * [L'intero capitolo va letto alla luce del fatto che, nel giugno 1 993 , il matematico inglese Andrew Wiles ha reso pubblica una sua dimostrazione del teorema di Fermat. Sebbene molti dettagli restino da chiarire, come ha ammesso lo stesso Wiles nel gennaio 1 994, gli esperti sono convinti in massima parte dell'esattezza della dimostrazione di Wiles , che risolverebbe defini tivamente la questione] .

CAPITOLO OTTAVO

Fermat incominciò a dedicare il suo tempo libero alla mate matica dopo aver accettato la carica di giurista. Pur non avendo ricevuto una preparazione specifica in questa materia, rivelò pre sto una predisposizione innata. Non rivelò invece predisposizio ne a presentare il suo lavoro in forma sistematica: salvo qual che eccezione di poca importanza, non pubblicò praticamente nulla durante tutta la sua attività di matematico . Tenne invece una copiosa corrispondenza con i più grandi matematici del suo tempo . In un'epoca popolata da giganti della matematica quali Desargues, Cartesio, Pasca!, Wallis e Jacques Bernoulli, il fran cese Pierre de Fermat, il « principe dei dilettanti », per il quale la matematica era un passatempo, poteva considerarsi pari a chiun que altro . Il percorso che condusse alla formulazione di questo famoso teo rema è lungo e interessante. Quando Costantinopoli cadde sotto i turchi nel 1 453 , gli studiosi bizantini fuggirono in Occidente, recando con sé antichi manoscritti greci, tra cui una copia di quanto era rimasto dell'Aritmetica di Diofanto . Quest'opera si salvò, ma fu poco letta fino al 1 62 1 , quando Claude Bachet pubblicò una nuova edizione del testo originale greco, unitamente a una tradu zione in latino contenente note e commenti. Il libro si impose allora all' attenzione dei matematici europei, e pare che proprio la let tura dell'Aritmetica abbia suscitato in Fermat il primo interesse per la teoria dei numeri . L'Aritmetica, l'opera principale di Diofanto, risale al secolo m d. C . , ed è uno dei primi libri di algebra mai scritti . La maggior parte del trattato riguarda le soluzioni razionali di equazioni a due o più variabili aventi coefficienti interi. I matematici odierni, quando lavorano a questo tipo di problemi, di solito si limitano a trovare radici intere, ma le due cose spesso si equivalgono . Ad esempio, per un'equazione lineare a tre variabili come

2 X + 3 Y + 4Z = 0, l a soluzione razionale x = { , y = 1� , z= f può essere conver tita nella soluzione intera x = 5 , y = 2 , z = 4 moltiplicando tutto per 20, minimo comune multiplo di 4, I o e 5 · Un procedimento simile può essere adottato in molti altri casi per convertire una -

-

1 99

L' ULTIMO TEOREMA DI FERMAT

soluzione razionale in una costituita esclusivamente da numeri interi. Quanto detto vale sicuramente per tutte le equazioni esa minate in questo capitolo, quindi, in linea di massima, anche qui si prenderanno in considerazione soltanto radici intere. Durante la lettura della sua copia dell'Aritmetica nell'edizione di Bachet, Fermat aveva l' abitudine di fare brevi annotazioni in margine. Quando, cinque anni dopo la sua morte, il figlio Samuel si accinse a raccogliere tutte le annotazioni e le lettere del padre per pubblicarle, si imbatté nella copia annotata dell'Aritmetica e decise di pubblicare una nuova edizione del libro, includendo le note scritte in margine da Fermat sotto forma di appendice . La seconda di queste Osservazioni su Diofanto, come Samuel le chiamò, era stata scritta da Fermat nel libro 11 , di fianco al problema 8 : « Dividere u n quadrato dato i n due quadrati ». L' annotazione di Fermat, in latino, diceva: N o n è, invece, possibile dividere un cubo i n due cubi, o u n biquadrato in due biquadrati, né, in generale, dividere alcun ' altra potenza di grado supe riore al secondo in due altre potenze dello stesso grado : della qual cosa ho scoperto una dimostrazione veramente mirabile , che non può essere conte nuta nella ristrettezza del margine . *

I n termini algebrici, il problema di Diofanto chiede di trovare tre numeri razionali x , y , z che soddisfino l'equazione x2 + y 2 = z2,

cosa che risulta abbastanza facile . Il commento scritto in margine da Fermat sostiene che, se n è un numero naturale maggiore di 2 , allora l'equazione non ha radici razionali . Come si è detto nel capitolo 3 , al tempo di Diofanto, e in certo qual modo anche al tempo di Fermat, lo zero non era considerato un numero, sicché le radici ottenute ponendo una delle variabili uguale a O sono in questo caso escluse. Il problema riguarda solo le radici razionali positive . Si noti che, grazie alla semplice osservazione fatta prima, non cambia nulla se restringiamo il problema di Diofanto e di Fermat *

[P. de Fermat, Osseroazioni su Diofanto, Boringhieri, Torino 1 95 9 , p . 1 8] .

200

CAPITOLO OTTAVO

per riferirlo a radici intere (in realtà a radici intere positive) piut tosto che a radici razionali, poiché qualsiasi radice razionale por terà immediatamente a una radice intera e, viceversa, qualsiasi radice intera è chiaramente una radice razionale. Così l'ultimo teo rema di Fermat (come viene chiamata l'annotazione da lui fatta in margine) può essere inteso come l' asserzione che, per qualsiasi numero naturale n maggiore di 2 , l'equazione xn

+

yn

=

zn

non ha soluzioni intere positive. Perché si parla di « ultimo teorema di Fermat »? L'origine di que sta denominazione è abbastanza oscura. Sebbene non si sappia per certo quando Fermat abbia scritto la famosa annotazione, sembra probabile che l' abbia fatto nel periodo in cui per la prima volta si accostava all'opera di Diofanto intorno al 1 63 0 , all'inizio cioè della sua attività matematica, per cui quel teorema non fu certa mente il suo ultimo . Molto più probabilmente la denominazione deriva dal fatto che, di tutte le congetture che lasciò formulate alla sua morte, questa è l'ultima che rimane da dimostrare, ammesso che sia dimostrabile . Questo fatto potrebbe spiegare l'uso della parola « ultimo ». Come si spiega la parola « teorema »? Fermat aveva davvero la « dimo strazione veramente mirabile » di cui parlava? Sebbene glielo si debba concedere come possibilità, l'evidenza dei fatti suggerisce che egli fosse in errore, anzi, che lui stesso più tardi se ne sia reso conto . Gli altri suoi teoremi compaiono con formulazioni diverse nelle numerose lettere con le quali sollevava problemi pro ' ponendoli ad altri matematici, e i due casi particolari x 3 + y ' z e x 4 + y 4 z 4 dell'ultimo teorema si trovano anche altrove, men tre l'ultimo teorema vero e proprio è menzionato esclusivamente in quella breve nota scritta in margine. Molto probabilmente egli capì come dimostrarlo per n = 4, e probabilmente anche per n 3 (due esponenti per i quali oggi è definitivamente accertata la verità del teorema) e pensò che il procedimento potesse essere generaliz zato a tutti gli altri numeri interi n, ma in seguito si rese conto che le cose non stavano così. Poiché non prevedeva che le note scritte in margine venissero pubblicate, non ritenne il caso di doverle rivedere e modificare . Anzi, è probabile che abbia com pletamente dimenticato di aver scritto quella annotazione . =

=

=

201

L' ULTIMO TEOREMA DI FERMAT

Nonostante tutto, qualcuno ancora crede che Fermat conoscesse la dimostrazione . Dopo tutto è una storia affascinante: un dilet tante del secolo XVII arriva a un risultato che per i successivi 350 anni è destinato a vanificare gli sforzi d i matematici di professione. Il fatto che si tratti di un problema così facile da enunciare rende la storia ancora più piacevole, naturalmente, e c'è sempre la possi bilità che Fermat avesse ragione. Avesse o no Fermat una dimostrazione, rimane il fatto che nes sun altro è riuscito in qualche modo a risolvere questo problema allettante e apparentemente semplice. E gli sforzi sono stati impo nenti: molti matematici di fama hanno trascorso anni cimentan dosi con questa congettura, e il lavoro svolto a tale proposito ha fatto sviluppare settori totalmente nuovi della matematica (si veda più avanti) . Sull' argomento sono stati scritti libri interi. A dire il vero, i risultati conseguiti nel tentativo di dimostrare l'ultimo teorema superano di molto il teorema stesso per l'importanza che essi hanno per la matematica. Se l'ultimo teorema di Fermat dovesse essere dimostrato domani, di fatto non ne deriverebbe alcun risul tato matematico nuovo . La sua importanza poggia unicamente su due fattori: la sua fama e il fatto che nessuno sia riuscito a risolverlo. Che cosa si sa dell'ultimo teorema e in cosa consiste l'impor tante avanzamento compiuto da Faltings nel r 983 ? Le risposte si troveranno in questo capitolo .

Le teme pitagoriche Il problema emerso dall'Aritmetica di Diofanto che ha portato alla formulazione dell'ultimo teorema di Fermat consiste nel tro vare un metodo per risolvere l'equazione

x2

+

y 2 = z2

nell' ambito dei razionali, sebbene noi ci limiteremo a considerare radici intere. A causa dell'evidente rapporto con il teorema di Pita gora, tre numeri interi x, y, z qualsiasi che soddisfino la prece dente equazione sono detti una tema pitagorica. Ad esempio, i numeri 3 , 4 , 5 formano una terna pitagorica perché

32

+

42 = 52·

202

CAPITOLO OTTAVO

Da una terna pitagorica se ne possono ottenere infinite altre mol tiplicando i tre numeri della terna originaria per un coefficiente qualsiasi: ad esempio, moltiplicando la terna 3 , 4, 5 per 2 si ottiene 6, 8, I o , che è una terna pitagorica perché

62 + 8 2 = I o 2 ; moltiplicandola per 3 si ha la terna pitagorica 9 , I 2 , I 5 , e così via. In un certo senso la soluzione è una sola, cioè 3 , 4 , 5 , mentre le altre sono solamente « variazioni sul tema ». La terna 5 , I 2 , I 3 , d'altro lato, è una soluzione completamente diversa (che a sua volta darà origine a una famiglia infinita di soluzioni) . Ciò che distin gue le soluzioni 3 , 4, 5 e 5, I 2 , I 3 dalle infinite soluzioni che da queste derivano moltiplicandole per una costante è il fatto che que ste soluzioni originarie non hanno fattori comuni : 3 , 4 e 5 non hanno alcun divisore comune, così come non lo hanno 5 , I 2 e I 3 . In generale, se a , b, c è una qualsiasi terna pitagorica, allora lo è anche qualsiasi multiplo ma, mb, mc; viceversa, se u, v, w è una qualsiasi terna pitagorica e se d è un fattore comune di u, v, w, allora anche ufd, v/d, w/d è una terna pitagorica. Per sottoli neare la natura particolare delle terne di base come 3 , 4, 5 e 5 , I 2 , I 3 , i matematici chiamano primitive le terne pitagoriche che non hanno alcun fattore comune (diverso da I ) . Dunque il pro blema di Diofanto consiste nel trovare un metodo per determi nare tutte le terne pitagoriche primitive. Un ragionamento matematico molto semplice porta alla seguente formula per generare tutte le possibili terne pitagoriche primitive

x, y , z:

x = 2 st,

y = s 2 - t2,

z = s 2 + t2,

dove s e t sono numeri naturali qualsiasi tali che s è maggiore di t, s e t non hanno alcun fattore comune, uno dei due è pari e l' al tro dispari . Così, ad esempio, s = 2 e t = I danno la terna x = 4 , y = 3 , z = 5 ; s = 3 e t = 2 danno x = I 2 , y = 5 , z = I 3 ; s = 4 e t = I danno x = 8, y = I 5 , z = I 7 e così via.

Questa soluzione completa del problema di Diofanto appariva già negli Elementi di Euclide .

203

L' ULTIMO TEOREMA DI FERMAT

Il caso

n=4

Chiarito il problema di Diofanto, che cosa si può dire sull' ul timo teorema di Fermat? Questo asserisce che per ogni numero naturale n maggiore di 2 , l'equazione

x• + y • = z• non ha radici intere (positive) . Come si può procedere per dimo strare, o piuttosto per tentare di dimostrare, una asserzione di que sto tipo? Un primo passo ragionevole è considerare alcuni casi partico lari, come ad esempio n = 3 , n = 4 e n = 5 ; se si riesce a risolvere questi, è probabile che si riesca a capire come dimostrare l'intero teorema. Sembra che questo sia proprio il modo in cui Fermat abbia affrontato la questione. L'unica testimonianza concreta che ci rimane è il lavoro da lui compiuto su un problema strettamente collegato al caso n = 4· In pratica, è l'unico ragionamento mate matico di Fermat che ci sia pervenuto, ed è contenuto in un' altra nota a margine dell'Aritmetica . Sorprende il fatto che, come la nota in cui è enunciato l'ultimo teorema, anche questa finisca con le parole: « L'esiguità del margine impedisce di inserirvi una dimo strazione completa e più ampiamente spiegata » . * Prima di vedere il ragionamento di Fermat e i n che modo que sto risolva il caso n = 4, è probabile che il lettore si chieda come, in termini generali, potrebbe affrontare il problema. Magari inco minciare provando alcuni valori per x, y , z per vedere se qualcuno di essi soddisfa l'equazione corrispondente, cioè

x4 + y 4 = z4 . Presumibilmente, egli si aspetterà di non trovare alcuna soluzione, come sostenne anche Fermat . Dopo aver provato diversi valori, senza peraltro trovare una soluzione, potrebbe essere tentato di scrivere un programma per ampliare la ricerca di soluzioni e con durre la medesima in modo più sistematico, ad esempio provando tutti i valori di x, y , z da r a r oo . Dopo parecchie ore di lavoro *

[P. de Fermat, op. cit. , pp. r o6 sg. ] .

204

CAPITOLO OTTAVO

al calcolatore, non approderebbe a nessun risultato positivo, il che dimostra l'inefficacia di questo tipo di tentativi. Per quanto potente la macchina e per quanto valido il metodo, questa strategia non riuscirà mai a dimostrare l'asserzione di Fermat (nel caso speci fico n = 4) . Il caso n = 4 del teorema, infatti, prevede che nessuna terna possa essere la soluzione di x 4 + y 4 = z\ asserzione che si riferisce a una collezione infinita di terne: nessuna quantità di cal coli potrà permettere di trattare un numero infinito di casi . Que sto tipo di strategia potrebbe riuscire a confutare l'ultimo teorema, dal momento che la scoperta di una sola soluzione dell'equazione di Fermat avrebbe questo effetto, ma non potrebbe mai dimostrare il teorema stesso . Per dimostrare l'ultimo teorema o qualsiasi suo caso singolo occorre un metodo matematico più sofisticato . Come accade spesso in matematica, il modo migliore consiste nel cercare una dimostrazione per assurdo . Se si vuole dimostrare che non c'è soluzione per l'equazione x 4 + y 4 = z 4 , si inizia col supporre l'esistenza di una soluzione X, Y, Z, e poi, sulla base di questo assunto, si procede con un ragionamento matematico per dedurne una contraddizione. Una volta trovata la contraddizione, lo scopo è raggiunto, dal momento che conclusioni contradditto rie si ottengono solo da assunti falsi (nel nostro caso, l'assunto che una soluzione esista davvero) . Il problema è ora come arrivare a una contraddizione. Un metodo particolarmente utile per i problemi che, come l'ultimo teorema, implicano i numeri naturali è il cosiddetto metodo del regresso all'in finito, inventato da Fermat e, come egli sosteneva, da lui usato come base di tutte le sue dimostrazioni nella teoria dei numeri . Una illustrazione del metodo è costituita proprio dalla dimostra zione che Fermat scarabocchiò in un margine dell'Aritmetica . Que sto metodo implica i cosiddetti triangoli pitagorici. Vedremo subito quale relazione esista con il caso n = 4 dell'ultimo teorema. Per ovvi motivi, un triangolo è detto pitagorico se è rettangolo e se tutti e tre i lati hanno una lunghezza esprimibile con numeri interi: in altre parole, un triangolo pitagorico è un triangolo i cui lati formano una terna pitagorica. Fermat dimostrò che l' area di un triangolo di questo tipo non può mai essere un quadrato, cioè il quadrato di un numero intero. Il suo ragionamento procede come segue.

205

L ' ULTIMO TEOREMA DI FERMAT

Supponiamo che esista un triangolo pitagorico che abbia per area un quadrato . Siano x , y , z le lunghezze dei lati del triangolo e sia z l'ipotenusa (fig . 8 . r ) . Così, per il teorema di Pitagora, x, y , z soddisfano l'uguaglianza

x2 + y 2

=

z2 .

Sia u 2 l' area del triangolo, dove u è u n numero intero . Usando la formula secondo la quale l' area di un triangolo è metà del pro dotto della base per l' altezza, troviamo che

u 2 = __!__ 2 xy . Con un ragionamento davvero geniale, * Fermat riuscì a rica vare un altro insieme di numeri interi positivi X, Y, Z e U tale che

U 2 = __!__ 2 XY'

Z < ...."" .

La contraddizione ricercata ne deriva facilmente . I numeri X, Y, Z, U hanno tutte le proprietà possedute da x, y, z , u, sicché si può ripetere lo stesso ragionamento per ottenere un altro insieme di

Figura 8 . r I l risultato di Fermat per i triangoli pitagorici. Grazie al teorema di Pitagora, s i ha che x2 + y 2 = z2; l' area del triangolo è u = ..!.. xy . Fermat usò il metodo del regresso all'in2 finito per dimostrare che, se x, y, z sono interi, u non può essere il quadrato di un intero. * Per i dettagli, si veda il cap. r di H. M. Edwards . Fermat's Last Theorem, Springer, New York 1 97 7 .

206

CAPITOLO OTTAVO

quattro numeri interi positivi X 1 , Y1 , Z1 , U1 tale che

X 12 + Y12 = z l2 ,

ul2 = 2I xl Yl >

zl

< z;

allo stesso modo, deve esistere un altro insieme di quattro numeri interi positivi X2 , Y2 , Z2 , U2 tale che

X22 + Y22 = z22 ,

u22 = 2I x2 Y2 >

z2 < z l ;

e così via ad infinitum. Questo processo è noto come regresso all'in finito perché i numeri interi positivi z, Z, Z1 , Z2 , diventano ogni volta più piccoli (cioè z > Z > Z 1 > Z2 > . . . ) . Ed ecco la contraddi zione: non può esistere una sequenza decrescente infinita di numeri interi positivi, perché prima o poi si arriverà a I e ci si dovrà fer mare. La conclusione è che non può esistere un triangolo pitago rico la cui area sia il quadrato di un numero intero . Sebbene non esista alcuna prova concreta che Fermat abbia vera mente rilevato la connessione, sembra probabile che egli abbia usato questa dimostrazione per provare il caso n = 4 del suo ultimo teo rema. Per collegare le due cose è sufficiente un'idea semplice sep pur ingegnosa. Supponiamo che esista una soluzione intera per l'equazione 4 x + y 4 = z 4 . Si pongano a = y 4 , b = 2 x 2 z 2 , c = z 4 + x\ d = y 2 xz. Allora, usando ripetutamente la nota identità algebrica • • •

(r + s) 2 = r2 + 2 rs + s 2 , si ottiene, come il lettore potrà verificare da sé,

Così pure,

a 2 + b 2 = (z 4 - x 4 ) 2 + 4 X 4 z 4 = z s - 2 X4 z4 + xs + 4 X4 z4 = (z 4 + x 4 ) 2 = c2 .

Ma allora, a 2 + b 2 = c 2 , e -} ab = d 2 , e abbiamo appena dimostra-

L' ULTIMO TEOREMA DI FERMAT

to che questa relazione è impossibile. Quindi l'ipotesi che l'equa zione x 4 + y 4 = Z 4 abbia una soluzione è falsa, e questo completa la dimostrazione. Come conseguenza immediata, si ha la validità dell'ultimo teo rema per n uguale a qualsiasi multiplo di 4· Infatti se l'equazione

x4k

+

y 4 k = z4 k

avesse una soluzione x = a, y = b, z = c, allora a k , b k , c k sarebbe una soluzione dell'equazione x 4 + y 4 = z\ ma abbiamo appena dimostrato che questo è impossibile. In termini più generali, se l'ultimo teorema è dimostrabile per qualsiasi esponente dato m, allora sarà vero per tutti i multipli di m. Così, poiché ogni numero intero maggiore di 2 è divisibile per un numero primo maggiore di 2 o per 4, o per entrambi, allora quando si tenta di dimostrare l'ultimo teorema si devono conside rare solo quei casi per i quali n è un numero primo maggiore di 2 , cioè un primo dispari, oppure n = 4· Dal momento che il caso n = 4 è appena stato risolto, il problema si riduce al caso in cui n è un numero primo dispari p . Esaminando il problema, spesso s i scinde il caso del numero primo dispari in due sottocasi. Innanzitutto si noti che, come per n = 2 (terne pitagoriche) , se x, y , z è una soluzione dell'equazione

x• + y• = z•, allora qualsiasi multiplo di x, y, z sarà anch'esso una soluzione; quindi il vero nocciolo della questione è se, per un n dato, esista o no una soluzione primitiva, cioè una soluzione in cui x, y, z, non hanno un fattore comune . Ora, per un numero primo dispari p dato, il primo sottocaso dell'ultimo teorema afferma che non esi ste una soluzione primitiva per l'equazione

Xp + yP = zP per cui nessuno dei numeri x, y , z sia divisibile per p. Il secondo sottocaso afferma che non esiste una soluzione primitiva per cui p divida uno dei numeri x, y, z. Ovviamente, per un p dato, la validità dell'ultimo teorema per quel p è equivalente a quella di entrambi i sottocasi . La scissione del problema in due sottocasi consente notevoli progressi (con una strategia di divide et impera) , come vedremo più avanti in questo stesso capitolo .

208

CAPITOLO OTTAVO

Come si è già detto, non abbiamo la prova che Fermat abbia dimostrato l'ultimo teorema per n = 4 · La sua dimostrazione rela tiva ai triangoli pitagorici a cui abbiamo accennato lascia sup porre che probabilmente lo abbia fatto: ne aveva le capacità, e i più sono propensi a riconoscergli questo merito . Anche la dimo strazione del caso n = 3 è avvolta da una nube di incertezza. Quan tunque sia universalmente accreditata a Eulero, l'unica versione pubblicata della sua dimostrazione contiene anch'essa un'inesat tezza . Il

caso n = 3

In una lettera a Christian Goldbach del 4 agosto I 75 3 , Eulero sosteneva di essere riuscito a provare l'ultimo teorema di Fermat per n = 3, senza tuttavia fornire la dimostrazione esplicita. La prima versione comparirà solo nel suo libro Wollstéindige Anleitung zur Algebra, pubblicato nel I 7 70 a Pietroburgo . Non sappiamo se la dimostrazione di cui egli parla nel I 7 53 fosse o no corretta, ma è certo che la dimostrazione apparsa nel I 770 conteneva un grave errore . Come risultò poi, per n = 3 lo sbaglio è rimediabile, ma in altri casi si rivela un ostacolo insormontabile . Sebbene le argo mentazioni di Eulero siano troppo lunghe per esporle per intero, vale la pena di accennarvi per sommi capi, tanto da far capire in che cosa consistesse l'errore e perché doveva rivelarsi così grave nei successivi tentativi fatti per dimostrare altri casi dell'ultimo teorema. Come nella dimostrazione di Fermat del caso n = 4, Eulero si servì del metodo del regresso all'infinito . Partendo dall'ipotesi che esista una soluzione x, y , z dell'equazione x3

+ y3 = z\

egli riuscì a dedurre l'esistenza di un' altra soluzione X, Y, Z tale che Z < z. Il punto centrale del suo ragionamento è dato dalla seguente proposizione: se p e q sono due numeri privi di fattori comuni, e se p 2 + 3 q 2 è un cubo, allora devono esistere due nu meri a e b tali che p = a 3 - 9 ab 2 e q = 3 a 2 b - 3 b 2 • Questo è un fatto vero, e può essere dimostrato applicando alcune tecniche

L' ULTIMO TEOREMA DI FERMAT

209

che compaiono altrove nel lavoro di Eulero . Nella dimostrazione dell' ultimo teorema che Eulero pubblicò, egli decise di impiegare un'originale argomentazione che comportava i numeri della forma a + b� (dove a e b sono interi) , e qui commise un errore . Possiamo capire perché Eulero trovò utili i numeri a + b� se sviluppiamo l'espressione (a + b�) 3 • Essa equivale a

a 3 + 3 a 2 b � - 9 ab 2 - 3 b 3 �, che possiamo riscrivere come

(a 3 - 9 ab2) + (3 a 2 b - 3 b 3) �. Così se p = a 3 - 9 ab2 e q = 3 a 2 b - 3 b2 (come nella proposizione

citata prima) , allora

p + q � = (a + b �) 3 . Se p 2 + 3 q 2 è un cubo, allora lo è anche (p + q�) (p - q�);

quindi la proposizione precedente può essere riformulata come s �e: se p e q non hanno fattori comuni, e se (p + q�) (p - qv - 3) è un cubo, nel sistema dei numeri a + b�, allora p + q� deve essere u n cubo, cioè p + q� = (a + b�) 3 per qualche coppia di interi a, b. Per dimostrare la proposizione riformulata in questo modo, Eulero ragionò così. I numeri a + b� formano un sistema di numeri molto simili agli interi (per una spiegazione esaustiva di questo argomento si veda il cap . 3) . Se m e n sono due numeri interi dati senza un fattore comune, e se mn è un cubo, allora m e n sono due cubi . Per analogia, Eulero sostenne la stessa cosa per il sistema dei numeri a + b� . Poiché, come Eulero corretta mente dimostrò, l'ipotesi che p e q non abbiano fattori comuni comporta che anche i numeri p + q� e p - q� non ne abbiano tra i numeri di tipo a + b� , ne conseguiva immediata mente la validità della proposizione. Il grosso neo di questa argomentazione è che l' analogia con i numeri interi non è completa. Solo perché il sistema numerico a + b� assomiglia per molti versi ai numeri interi (tutti e due i sistemi formano un dominio di integrità, come si ricorderà dal cap . 3), non vuoi dire che questo sistema ne abbia tutte le pro-

210

CAPITOLO OTTAVO

prietà. Una proprietà determinante per la dimostrazione di Eulero, che vale per i numeri interi in virtù del teorema fondamentale del l' aritmetica, è la fattorizzazione unica: ogni intero è un prodotto di un unico insieme di numeri primi (a cui è possibile aggiungere anche r ) . Chi ha letto il capitolo 3 sa che il sistema numerico a + br-3 possiede questa proprietà, e quindi la conclusione di Eulero è valida. Ma nel capitolo 3 si è anche appreso che r-3 è una tra le sole nove radici di numeri interi che portano alla pro prietà della fattorizzazione unica; quindi fu solo per un colpo di fortuna che il ragionamento analogico di Eulero portò a una conclu sione corretta. Se egli avesse tentato di dimostrare il caso n= 5 dell'ultimo teorema, usando i numeri a + br-5 , questo metodo non avrebbe funzionato . Come si vedrà adesso, la mancanza della fattorizzazione unica doveva far crollare molti tentativi di dimo strazione. -

Altri due casi: n = 5 e n = 7 Nel r 8 25, l' appena ventenne Peter Gustav Lejeune Dirichlet e il settantenne Adrien-Marie Legendre dimostrarono l'ultimo teo rema per il caso n= 5 . Il metodo da loro usato era sostanzialmente un'estensione di quello usato da Eulero per il caso n = 3 , in cui l' analoga dell'equazione era data da:

p + q r-3 = (a + b r-3P p + q r-5 = (a + b r-5) 5. dimostrare che p + qr-5 è una potenza di grado 5

Tuttavia, per (per cui il ragionamento per analogia con i numeri interi non è certamente valido) dovettero non solo assumere che p 2 5 q 2 fosse una potenza di grado 5 e che p e q non avessero fattori comuni (come è per n = 3 ) , ma anche che solo uno tra p e q fosse pari e che q fosse divisibile per 5 . La proprietà della scomposizione unica, peraltro non valida in questo caso, non viene utilizzata. Risolto il caso n = 5 , il metodo usato fino ad allora incominciò a mostrare qualche crepa, poiché richiedeva tecniche algebriche -

211

L' ULTIMO TEOREMA DI FERMAT

sempre più complesse . Nel I 83 2 , Dirichlet, che non era riuscito a far funzionare il metodo per n = 7, vi riuscì con n = I 4, risul tato molto meno significativo, naturalmente. Quando nel I 839 Gabriel Lamé finalmente dimostrò il caso n = 7, dovette ricorrere ad alcuni espedienti molto ingegnosi, strettamente legati alle pro prietà specifiche del numero 7 . Sembrava quasi impossibile che si potesse passare al caso successivo, n = I I , se non adottando tec niche radicalmente diverse. Fu proprio Lamé a proporre, nel I 847, questa linea di azione.

Gli interi ciclotomici e l'annuncio di Lamé La proposta di Lamé consisteva nel tentare di dimostrare l'in tero ultimo teorema utilizzando una radice n-esima complessa del l'unità, cioè un numero complesso r per cui r• = I ma rk * I per qualsiasi numero intero positivo k inferiore a n (tutto questo vale per qualsiasi primo n dispari) . Per qualsiasi primo n dispari (anzi per qualsiasi numero dispari n) , il numero I ha n - I radici n-esime complesse: ad esempio, per n = 3 le due radici cubiche complesse di I sono

I ../3 . -2 + 2 1' --

I

../3 .

-2 1 2 - --

(lo si può verificare elevando al cubo ciascuno di questi numeri complessi) . Lo scopo di introdurre queste radici complesse è il seguente. Le dimostrazioni dei casi n = 3, 4, 5, 7 a cui si era giunti fino a quel momento dipendevano tutte da una scomposizione algebrica, come ad esempio, per n = 3 ,

x 3 + y 3 = (x + y ) (x 2 - xy + y 2 ) . Lamé intuì che la difficoltà aumentava col crescere di n , perché in questo tipo di scomposizione uno dei fattori diventa di grado sempre maggiore . Introducendo r, è possibile scomporre comple tamente x• + y • in n fattori ciascuno di grado I . Per ottenere la scomposizione, si noti che i numeri complessi I , r, r2 , . . . , r• - l sono le radici dell'equazione complessa

z• - I =

O

212

CAPITOLO OTTAVO

così che

z• - r = (z - r ) (z - r) (z - r 2)

• • •

(z - r• - 1 ) .

S e adesso poniamo z = - x/y e moltiplichiamo tutti e due i mem bri dell'equazione per y•, con n dispari, otteniamo x• + y • = (x + y ) (x + yr) (x + y r 2 ) (x + y r• - 1 ) . • • •

Ciascuno dei fattori complessi di x " + y • nella precedente espres sione è un numero avente la forma generale a 0 + a1 r + a 2 r 2 + . . . + a. _ 1 r• - t , dove a0, a 1 , , a. _ 1 sono interi . Numeri di questo tipo, c10e numeri costituiti da interi e da potenze di r, oggi sono conosciuti come interi ciclotomici. C ome gli interi gaussiani o i numeri della forma a + br-j di cui si è già parlato, gli interi ciclotomici danno origine a un sistema numerico che per certi versi assomiglia ai numeri interi ordinari, perché forma un anello (si consulti il cap. 3 per le relative definizioni) . Il r 0 marzo r 84 7 , rivolgendosi ai membri dell'Accademia fran cese, Lamé sostenne con vigore di essere riuscito a dimostrare l'ultimo teorema di Fermat . Il suo lavoro si fondava sull'uso degli interi ciclotomici, il che gli permise di fornire una dimostrazione basata sul regresso all'infinito, con un ragionamento molto simile a quello di Eulero per il caso n = 3 · Un passaggio critico nel suo procedimento era quello di dimostrare che se i fattori (x + y ) , (x + y r) , . . . , (x + y r" - 1 ) di x• + y • non hanno fattori comuni, allora l'eguaglianza x" + y • = z• implica che ciascuno dei fattori debba essere un'n-esima potenza. Dopo aver descritto per intero la sua presunta dimostrazione, Lamè concluse ammettendo che l'idea di usare i numeri complessi in quel modo gli era stata suggerita dal collega Joseph Liouville qualche mese prima. Dopo Lamé fu proprio Liouville a parlare, chiedendosi come il collega potesse concludere che ciascun fattore di x" + y " fosse una potenza n-esima, dal momento che era riu scito a dimostrare solo che nessuna coppia di questi fattori aveva un divisore comune. Fece notare che la veridicità di questo pas saggio per i numeri interi ordinari dipendeva dal teorema della scomposizione unica, mentre non gli risultava che si potesse giun gere a tale conclusione per gli interi ciclotomici . • • •

L' ULTIMO TEOREMA DI FERMAT

213

Non s i s a s e Liouville sapesse già dell' analogo errore d i Eulero . Comunque, la sua osservazione colpì proprio il nocciolo del ragio namento di Lamé che, dopo strenui tentativi di salvare la sua dimo strazione, dovette infine ammettere, suo malgrado, l'enormità del l'errore. Al suo amico Dirichlet che si trovava a Berlino scrisse: « Se solamente tu fossi stato a Parigi o io fossi stato a Berlino, tutto questo non sarebbe accaduto ». In realtà, Lamé avrebbe potuto evi tare quella situazione imbarazzante se solo fosse stato al corrente di un lavoro pubblicato circa tre anni prima da un certo Ernst Eduard Kummer, anche se, a dire il vero, questi aveva scelto di pubblicare il suo saggio nell'oscura rivista « Gratulationschrift der Universitat Breslau zur Jubelfeier der Universitat Konigsberg ».

Kummer e i numeri ideali Nel suo scritto del 1 844, Kummer aveva dimostrato che la scom posizione unica è solitamente falsa per gli interi ciclotomici, con clusione che distruggeva completamente la presunta dimostrazione di Lamé . Nel 1 84 7 , quando Lamé e gli altri matematici vennero a conoscenza di questi risultati, Kummer aveva sviluppato una nuova teoria in base alla quale era possibile modificare il concetto di scomposizione unica, tanto da ottenere una ragionevole « teo ria dei numeri » per gli interi ciclotomici. La base della sua teoria consisteva nell'introdurre nell' aritmetica degli interi ciclotomici quelli che egli chiamò i fattori ideali primi, qualcosa di analogo all'in troduzione del numero immaginario « i » nell' aritmetica dei numeri interi ordinari. Usando i numeri ideali di Kummer, molte delle con seguenze della scomposizione unica per gli interi possono essere dimostrate per gli interi ciclotomici e per altri sistemi numerici, quali a + b� , che emergono nella dimostrazione dei vari casi dell'ultimo teorema di Fermat . Il lavoro di Kummer segnò il maggiore passo avanti compiuto nello studio dell'ultimo teorema di Fermat dal suo nascere, fino al risultato del 1 983 di cui si è fatto cenno all'inizio del capitolo . I risultati da lui ottenuti nel I 84 7 dimostrarono l'ultimo teorema per tutti gli esponenti primi minori di 3 7 (anzi per tutti gli espo nenti minori di 3 7 ) , e per tutti gli esponenti primi minori di 1 00

214

CAPITOLO OTTAVO

ad eccezione di 3 7 , 59 e 67. Tutto questo accadeva pochi anni dopo che i matematici si erano cimentati con ardue dimostrazioni relative a n = 5 e n = 7 . Inoltre, il suo nuovo concetto di numeri ideali s i rivelò molto importante e con vaste possibilità di applicazione; esso diede vita al concetto più generale di ideale e ad un'intera branca della mate matica, la teoria degli ideali, i cui rudimenti oggi rientrano nei pro grammi universitari degli studenti di matematica. Per quanto rivo luzionaria sia stata l' applicazione dei numeri ideali di Kummer all'ultimo teorema di Fermat, l' aspetto più importante del suo lavoro, per quanto riguarda gli altri settori della matematica, è pro prio costituito dal concetto di ideale . In effetti, il lavoro di Kummer non è rilevante per l'ultimo teo rema di Fermat, e non scaturiva neppure da un tentativo di dimo strarlo. Come Gauss (si veda il cap. 3 ) , anche Kummer si era dedi cato al problema delle leggi di reciprocità di grado superiore per generalizzare la legge di reciprocità quadratica di Gauss, lavoro che si sarebbe concluso nel r 859 con la conferma di un risultato generale sul problema. Detto questo, si dovrebbe rilevare che c ' è una stretta relazione tra l'ultimo teorema d i Fermat e l e leggi di reciprocità di grado superiore.

I numeri primi regolari Il lavoro di Kummer fu particolarmente importante, in quanto egli giunse a una condizione aritmetica che un numero primo dispari p deve soddisfare perché l'ultimo teorema sia vero per l'esponente p. Se p soddisfa la cosiddetta « condizione di Kummer », allora l'equazione Xp + yP = zP non ha soluzione . Oggi i numeri primi che soddisfano la condi zione di Kummer sono conosciuti come primi regolari. Tra i primi inferiori a r oo, solo 3 7 , 59 e 67 non sono regolari, come dimostrò Kummer nel r 84 7 . Che cos'è dunque un primo regolare? È un concetto strettamente collegato con quello di numero di classi, descritto nel capitolo 3 . Un primo regolare è un primo che non divide il numero di classi

215

L' ULTIMO TEOREMA DI FERMAT

del campo di numeri ciclotornici associato. Tale definizione richiede rebbe una spiegazione complessa, ma per fortuna esiste una defini zione alternativa ed equivalente che comporta concetti molto più semplici. Si ricordi dal capitolo 3 che e è una costante matematica con una espansione decimale infinita, pari a 2 , 7 I 828 . . . , tale che per qualsiasi numero t il valore di et è dato dalla somma infinita

et = I + _L + _f_ + _l!_ + . . . I! 2! 3! I numeri di Bernoulli, Bk, sono definiti come i coefficienti della somma infinita t2 + B) t = I + Bit +B t} + . . . 2 et - I I! 2! 3! I numeri di Bernoulli hanno un comportamento del tutto irrego lare: Bk è zero per tutti i k dispari tranne che per k = I , per il quale B 1 = - -} . I primi valori di Bk per k pari sono --

B 4 = _ _I_ , B s = - _I_ ' B 2 = __!__ ' B 6 = -I- , 42 30 6 30 7 _1_ - - � ' B i4 = - . B 12 B IO = 6 2730 66 ' 36I7 B 16 - . 5IO Con le definizioni precedenti, si può dire che un primo p è regolare se non divide i numeratori di ciascuno dei numeri B 2 , B 4 , , Bp - J · Così p sarà irregolare s e divide il numeratore di almeno uno dei numeri di Bernoulli . La definizione di regolarità in termini di numeri di Bernoulli costituisce un modo per verificare per mezzo di calcoli la regola rità di un primo dato, anche se l'uso diretto della definizione pre cedente non è molto efficace: in pratica, si usano vari aspetti del comportamento dei numeri di Bernoulli per ricavare metodi più efficienti. Un problema che si presenta nella verifica della regola rità è il fatto che i numeratori dei numeri di Bernoulli possono essere molto grandi . Ad esempio, • • •

2 5 7 7 687 858 367 6 si può ancora calcolare a mano, ma B 22 0 ha 250 cifre.

B 34 =

zr6

CAPITOLO OTTAVO

Come abbiamo già detto, Kummer stesso eseguì i primi calcoli per determinare i primi regolari e irregolari. Arrivò fino a I 64 e trovò che i soli primi irregolari al di sotto di questo numero erano 3 7 , 5 9 , 6 7 , I O I , I 03 , I 3 I , I 49 e I 5 7 · In ciascun caso Kummer dovette dimostrare che il primo in questione divideva il numera tore di un numero di Bernoulli appropriato: ad esempio, 3 7 divide il numeratore di B 3 2 , 59 divide il numeratore di B 44 , I 5 7 divide il numeratore di B 62 e di B 11 0 • Negli anni trenta Stafford e Vandiver usarono le calcolatrici (nonché alcuni nuovi metodi per verificare la regolarità e l'irrego larità) per controllare tutti i primi fino a 6 I 7 . Nel I 954, con l' ar rivo dei calcolatori elettronici, Lehmer e Vandiver spinsero il cal colo fino a 400 I , e altri in seguito contribuirono ad arrivare a 30 ooo . Nel I 976, usando un IBM 3 60-65 e un IBM 3 70 , Samuel Wagstaff dell'Università dell'Illinois determinò la regolarità o meno di tutti i primi al di sotto di I 25 ooo . Basandosi sui risultati ottenuti finora, pare che circa il 6o per cento dei primi sia regolare. Per l'esattezza, per un valore elevato di N il rapporto osservato è Numero di primi irregolari inferiori a N = 0,39 · Numero dt prtmt mfertort a N .

.

.

.

.

.

Nel I 964 Siegel addusse un ragionamento plausibile, anche se poco rigoroso, in base al quale quel rapporto dovrebbe essere pari a I - I/....le , valore che, con una approssimazione di due cifre deci mali, risulta essere 0,39. Nonostante l' apparente predominanza d i primi regolari, non si sa ancora per certo se ne esista un numero infinito . Si sa invece che esistono infiniti primi irregolari, come ha dimostrato Jensen nel I 9 I 5 . Così l'insieme apparentemente più grande potrebbe risul tare finito, mentre è accertato che l'insieme apparentemente più piccolo è infinito .

La situazione attuale Il risultato di Kummer del I 847 mostrò che l'ultimo teorema di Fermat è vero per tutti gli esponenti primi regolari. Cosa accade

2!7

L' ULTIMO TEOREMA DI FERMAT

quando p è un primo irregolare? I n questo caso il risultato di Kum mer non ci è di nessun aiuto. Questo non significa naturalmente che l'ultimo teorema sia falso in questo caso; semplicemente, non si può più applicare l'argomentazione specifica addotta da Kum mer, anche se il risultato in sé potrebbe ancora essere vero, per qualche altra ragione. Più tardi Kummer trovò condizioni più gene rali rispetto alla regolarità, anche se meno concise, le quali impli cano comunque l'ultimo teorema. Queste condizioni sono soddi sfatte dai primi irregolari 3 7, 59 e 67, sicché Kummer, poté giustamente rivendicare tutti i casi dell'ultimo teorema fino a I oo . Da allora s i sono trovate condizioni ancora più generali, tanto che i calcoli eseguiti da W agstaff nel I 976 in realtà verificarono l' ul timo teorema per tutti i primi, e quindi per tutti gli esponenti, fino a I 2 5 ooo . Sappiamo che ciascun caso dell'ultimo teorema è suddiviso in due sottocasi, come si è già detto: dato un primo dispari p, nel primo sottocaso si sostiene l'impossibilità di una soluzione primi tiva x, y, z per l'equazione

Xp + y P = z P tale che nessuno dei numeri x, y , z sia divisibile per p, mentre nel secondo sottocaso la soluzione primitiva è tale che uno dei tre numeri della soluzione sia divisibile per p. Nel corso degli anni si sono fatti progressi di una certa importanza per il secondo sottocaso. Nel I 83 2 , ben prima che Lamé e Kummer lavorassero a questo problema, la studiosa francese Sophie Germain dimostrò che se p è un primo dispari tale che 2 p + I è anche primo, allora il primo sottocaso dell'ultimo teorema vale per p. (Questo significa che l'equazione di Fermat per p potrebbe avere una soluzione, ma p dovrebbe dividere uno dei numeri della soluzione) . Sebbene ci siano molti primi p per cui 2 p + I è primo (ad esempio p = 3 , 5 , I I ) , ai quali si può applicare il teorema di Germain, non s i s a s e ce ne siano un numero infinito . In seguito, Legendre sviluppò le idee di Germain per dimostrare il primo sottocaso per qualsiasi primo p tale che uno dei numeri 4P + I ,

8p + I ,

I op + I ,

I 4P + I ,

I 6p + I

sia primo . Questo era sufficiente per provare definitivamente il

218

CAPITOLO OTTAVO

primo sottocaso per ogni esponente p primo minore di I oo, risul tato che fu però superato da Kummer. Altri risultati conseguiti nel corso degli anni mostrano che il primo sottocaso vale per tutti i primi che soddisfano vari criteri. Uno di questi, ottenuto nel I 9 I O da Mirimanoff, è che p sia della forma 2 " 3 h ± I o della forma ± 2 " ± 3 h , dove a e b sono interi non negativi . Poiché questo comprende il caso dei primi di Mersenne (vedi cap. I ) , sappiamo che il primo sottocaso vale per il piu grande numero primo conosciuto, il numero 2 2 1 6 09 1 - I di 65 050 cifre. Nel I 98 2 Lehmer aveva già dimostrato che il primo sottocaso vale per tutti i primi al di sotto dei 6 miliardi. Nel I 985 l' americano Adleman, il francese Fouvry e l'inglese Heath-Brown, usando una generalizzazione del criterio di Germain, dimostrarono per la prima volta che il primo sottocaso dell'ultimo teorema vale per un numero infinito di primi. Ma, nonostante tutti i progressi fatti, è tuttora possibile che l'ultimo teorema valga solo per un numero finito di esponenti . Che dire poi dell'eclatante risultato di Faltings del I 983 men zionato all'inizio del capitolo? Questi dimostrò che per ogni espo nente n maggiore di 2, l'equazione di Fermat ha al massimo un numero finito di soluzioni primitive . La dimo strazione gli valse una medaglia Fields nel I 986. Rimane da vedere se questa serie di scoperte condurrà infine a una dimostrazione completa dell'ultimo teorema, ma l'essere pas sati da una quantità infinita di soluzioni a un numero finito, anche se sconosciuto, costituisce un enorme passo avanti . Si noti l'uso della parola « sconosciuto »: il risultato di Faltings non indica il numero massimo di soluzioni possibili, ma dice solo che si tratta di un numero finito . In realtà il risultato di cui abbiamo appena parlato è un caso particolare di un'ipotesi più generale dimostrata da Faltings, nota come la congettura di Mordell. Nel I 9 2 2 Lewis Mordell ipotizzò che qualsiasi polinomio irriducibile in due variabili con coefficienti razionali, di genere maggiore o uguale a due, avesse al massimo un numero finito di soluzioni razionali (l'uso della parola « genere » fa capire che la congettura di Mordell appartiene alla topologia,

219

L' ULTIMO TEOREMA DI FERMAT

trattata nel cap. I o) . Poiché il polinomio x" + y " = I ,

[I]

con n ;;::: 3 , soddisfa l'ipotesi della congettura di Mordell, n e segue immediatamente che questa equazione ha al massimo un numero finito di soluzioni razionali . Ma poiché qualsiasi soluzione intera dell'equazione produrrà una soluzione razionale dell'equazione [ I ] (si dividano entrambi i membri dell'equazione [2] per z•), con soluzioni pri mitive diverse per l'equazione [2] che danno soluzioni razionali diverse per l'equazione [ I ] , questo comporta che l'equazione [2] ha solo un numero finito di soluzioni intere primitive. Il futuro

A che punto ci troviamo, dunque? L'ultimo teorema di Fermat è vero per tutti gli esponenti fino a I 2 5 ooo, ma non sappiamo se lo sia per un numero infinito di esponenti, tranne che nel primo sottocaso, peraltro estremamente restrittivo. Al di là dei limiti noti, è possibile che esistano uno o più esponenti p, maggiori di I 2 5 ooo , per i quali esso è falso; sappiamo però che per un tale p può esserci solo un numero finito di soluzioni primitive. Se p è minore di 6 miliardi, allora, poiché il primo sottocaso vale per un tale p, almeno uno dei numeri di una qualsiasi soluzione sarà divisibile per p, cosa che comporta numeri maggiori di I 2 5 ooo 1 2 5 000; d ' al tro canto, se p è maggiore di 6 miliardi allora emergeranno numeri ancora più astronomici . Per tutti gli scopi pratici l'ultimo teorema è dunque « vero ». Naturalmente per il matematico questo non signi fica che la questione sia chiusa: il problema dell'ultimo teorema non sarà risolto finché non si otterrà una prova rigorosa o una con futazione altrettanto rigorosa. Al momento non sembra che le cono scenze di cui disponiamo possano portare al raggiungimento di que sta meta. Può darsi che il problema debba essere affrontato in un modo completamente nuovo, nel qual caso l'ultimo teorema potrebbe ancora una volta portare a sviluppi significativi in altri campi della matematica.

220

CAPITOLO OTTAVO

Sembra molto probabile, anche se nulla è certo, che se mai si troverà una soluzione essa richiederà ben altro che considerazioni elementari. Questo significa che i molti matematici dilettanti (come Fermat?) , che regolarmente sostengono di aver dimostrato l'ultimo teorema, sbagliano immancabilmente. In effetti, se si esaminano attentamente tali prove, di solito risulta che le argomentazioni addotte non bastano neppure per risolvere il caso n = 3 , che Eulero provò nel I 75 3 · Eppure ogni anno compaiono nuove « dimostra zioni »: l'ultimo teorema detiene senz' altro il primato per la quan tità di dimostrazioni false. Molte di queste arrivano all'Istituto di Matematica dell'Uni versità di Gottinga, in Germania. Oltre a una medaglia d'oro e al premio di 3000 franchi offerti dall'Accademia francese nel I 8 I 6, la prima persona che riuscirà a dimostrare l'ultimo teorema di Fer mat vincerà il premio Wolfskell. Quando fu offerto per la prima volta nel I 9o8 dall'Accademia reale delle scienze di Gottinga, con formemente alla volontà di un certo Paul Wolfskell, ammontava a I oo ooo marchi; in seguito ai vari mutamenti della moneta tede sca, il premio oggi è di I O ooo marchi . Malgrado le numerose e rigide clausole che regolano la parteci pazione al premio, l'Istituto di matematica di Gottinga continua a ricevere in media una soluzione alla settimana, che è costretto a valutare . La situazione è comunque migliorata rispetto all'anno in cui fu istituito il premio, quando i concorrenti furono 62 I ! Le probabilità di successo per un dilettante inesperto sono quasi nulle. Tuttavia pochi matematici oserebbero scoraggiare chiunque dal tentare: cimentarsi con la matematica è soprattutto un diver timento, e chi vorrebbe negare ad altri la soddisfazione che lui stesso prova? Se uno tenta e fallisce, può almeno consolarsi sapendo che anche molti matematici famosi non sono riusciti a risolvere questo allettante problema. Se invece uno tenta e ci riesce . . .

C apitolo 9 Problemi difficili sui numeri complessi

Un argomento complesso Per molti lettori questo sarà il capitolo più difficile del libro, non perché la matematica sia intrinsecamente più difficile che altrove, ma per il grado di astrazione che comporta. Parleremo di numeri, sia naturali che complessi. Il compito essenziale dell' ana lisi complessa (si usa anche parlare di teoria delle funzioni complesse) e del campo strettamente affine della teoria analitica dei numeri (che è l' applicazione dei risultati e delle tecniche dell'analisi com plessa allo studio dei numeri naturali) è di studiare la struttura pro fonda e le interconnessioni nascoste sotto una nozione apparente mente semplice, come può sembrare quella di numero complesso data nel capitolo 3 . Portare avanti queste ricerche richiede alcune tecniche matematiche molto astratte, poco familiari ai non addetti ai lavori. Sfortunatamente non ci si può neppure aiutare con i dise gni: l' analisi complessa è poco visualizzabile, diversamente dalla topologia (argomento del cap. 1 0 ) , in cui è possibile trasmettere idee altrettanto difficili e astruse (almeno nei casi semplici) con l' ausilio di disegni e diagrammi . Si tratta nondimeno di un campo importante, in cui in questi ultimi anni si sono fatti alcuni passi avanti significativi, sicché non lo si può più ignorare. Inoltre, pro cedendo in questo capitolo vedremo emergere dall'astrazione nuove prospettive su concetti familiari, quali le frazioni e i numeri primi. Si dà per scontato che si sia letto il cenno introduttivo sui numeri complessi dato nel capitolo 3 . Benché i tre problemi che costituiscono il nucleo di questo capi-

222

CAPITOLO NONO

tolo siano tutti altamente astratti, non si deve pensare che l' ana lisi complessa non abbia applicazioni al di fuori della matematica, anzi: dopo il primo lavoro di Augustin Cauchy del 1 8 2 5 sull' argo mento, le connessioni con il mondo « reale » non sono mai man cate. Il lavoro di Riemann, immediatamente successivo a quello di Cauchy, mostrò quanto la teoria delle funzioni complesse potesse essere di aiuto nella soluzione di problemi di fisica, e un ulteriore lavoro sulle cosiddette « trasformate integrali » (come la onnipre sente trasformata di Fourier) rese la connessione ancora più evidente . La natura bidimensionale dei numeri complessi (si veda il cap. 3 per una trattazione del piano complesso) fa sì che essi possano essere usati per risolvere problemi a due dimensioni, proprio come i pro blemi a una dimensione possono essere trattati con i numeri reali. Poiché molti problemi della vita reale a tre dimensioni di natura simmetrica (come il flusso di liquido in un condotto) si riducono a problemi matematici a due dimensioni, l' analisi complessa è importante sia per i fisici sia per gli ingegneri . Il matematico russo N . Y . Jukovskij ( 1 847- 1 9 2 I ) usò l' analisi complessa per specificare la forma di un profilo alare (la sezione trasversale di un'ala d'aereo) e studiare la dinamica del flusso d'aria circostante, rivoluzionando così il design dell' aereo . Da allora, la teoria delle funzioni complesse ha assunto un'importanza fonda mentale nella descrizione di tutti i tipi di flusso di fluidi e nella progettazione di automobili e di navi . Nel 1 9 2 0 alcuni scienziati dei laboratori Beli negli Stati Uniti fecero un uso sistematico della teoria delle funzioni complesse nella progettazione di filtri e di amplificatori ad alto rendimento, che resero possibili i collegamenti telefonici su grandi distanze . Un ingegnere elettronico ben cono sce l'importanza del criterio di Nyquist per la stabilità degli ampli ficatori di risposta, e anche tale criterio è un' applicazione diretta dell' analisi complessa . In bre v e, oggi non si può rinunciare all ' a nalisi complessa, perché ben poco della scienza e della tecnologia moderne può in qualche modo fare a meno dei numeri complessi. Ma allora, cos 'è poi l' analisi complessa? Come primo tentativo di risposta la si potrebbe definire un'estensione dei metodi dell' a nalisi (differenziazione, integrazione, somme infinite e così via) dal più familiare insieme dei numeri reali al dominio dei numeri

223

PROBLEMI SUI NUMERI COMPLESSI

complessi. Come ogni approssimazione, questa risposta è allo stesso tempo stimolante e ingannevole, poiché l'intero apparato dell ' a nalisi prende una forma completamente diversa quando è appli cato ai numeri complessi . Concetti che con i numeri reali sembrano completamente distinti possono risultare fortemente èorrelati quando si introducono i numeri complessi; un esempio, già ripor tato nel capitolo 3 , è l'identità di Eulero

e"; = - I . Un altro esempio molto pertinente è fornito dall'equazione

e" ; = cosx + i sinx che collega e, i e le funzioni trigonometriche usuali seno e coseno . In efetti, nulla ci impedisce di applicare le funzioni seno e coseno ai numeri complessi, anche se non si può calcolare, ad esempio, sin (3 + 4i) in termini di triangoli rettangoli come si può fare con i numeri reali . Una volta stabilito di lavorare con i numeri com plessi, bisogna essere disposti a lasciarsi guidare dalla teoria, e per le funzioni trigonometriche questo significa entrare nel campo delle serie infinite. Così come la relazione

anche le due seguenti

cosx = I -

x2 + x4 - x6 . . .

-

2!

-

4!

-

6!

sono valide sia per gli x reali che per gli x complessi. S e x è reale, ognuna di queste somme infinite darà esattamente la stessa rispo sta che si otterrebbe dalla usuale definizione geometrica, ammesso che l' angolo x sia misurato in radianti e non in gradi (un radiante equivale a I 8o/'ll gradi, cioè circa a 5 7 , 3 gradi) ; ma niente impedi sce di usare queste equazioni quando x è complesso . Con una semplice manipolazione algebrica delle tre espressioni

224

CAPITOLO NONO

precedenti, si possono ottenere le formule sinx = � (e ix - eix) , 21

I ( e'x + e - •x) cosx = ' 2 .

.

dove, di nuovo, x può essere reale o complesso . Uno dei primi compiti dell'analisi complessa è verificare che tutti i calcoli eseguiti prima con le serie infinite siano legittimi. Come è stato chiarito nel capitolo 2 , l'infinito deve essere maneggiato con cautela, soprattutto quando abbiamo a che fare con numeri complessi. L'integrazione* risulta molto diversa dal caso reale quando è eseguita per funzioni complesse. Naturalmente, poiché i numeri complessi sono bidimensionali, non si può semplicemente integrare tra un numero a e un numero b come avviene con i numeri reali, come ad esempio l x 2 dx = _!._ 3 ' o Bisogna invece integrare lungo una curva nel piano complesso, ad esempio lungo un cerchio . Quale potrebbe essere allora la risposta se si dovesse integrare la funzione complessa (x - a) - I , dove a è una costante complessa, lungo la traiettoria circolare C? L'inte grale è scritto come c

1 dx x -a

(tali integrali sono chiamati talvolta integrali curvilinei o di linea) , e ha un risultato del tutto inaspettato, specialmente per chi sa quanto possa essere difficile l'integrazione per le funzioni reali. Se il numero a corrisponde a un punto nel piano complesso interno al cerchio C , la risposta è 2 n i ; se il numero a è esterno al cerchio, la risposta è O . La cosa sorprendente è che la dimensione e la posi zione del cerchio sono ininfluenti, e il solo modo in cui la costante a condiziona la risposta è dato dalla sua relazione con il cerchio . * Il lettore che non avesse dimestichezza con questo concetto nell'ambito dei numeri reali può tralasciare il resto di questo paragrafo e gli altri riferimenti occasionali all'integrazione presenti nel capitolo.

PROBLEMI Sill NUMERI COMPLESSI

Sebbene questo esempio particolare sia stato scelto proprio come caso limite, è indicativo di come le funzioni complesse assumano una loro vita propria, diversamente da quanto ci si aspetterebbe dopo lo studio dei numeri reali . La teoria delle funzioni complesse, quando è applicata allo stu dio dei numeri naturali, ci riserva altre sorprese, come risulterà chiaro andando avanti in questo capitolo . C ' è da notare che l'in tegrale menzionato prima assume un ruolo significativo in questo contesto, anche se non merita di essere approfondito qui.

Divertimenti con i numeri Una frazione hfk è chiamata frazione propria se è compresa tra O e I , e se h e k non hanno fattori comuni . Ad esempio I/2 , 3/4 e 7/8 sono frazioni proprie; 2/4 , 3/9 e 3/2 non lo sono . Per qual siasi numero n la successione di Farey di ordine n, F., è la succes sione di tutte le frazioni proprie con denominatore minore o uguale a n e della « frazione » I/ I , poste in ordine crescente. Così, ad esem pio, F5 è la successione I I I 2 I 3 2 3 4 I 5' 4' 3' 5 ' 2 ' 5 ' 3' 4 ' 5 ' I ' e F7 è la successione I

I

I

I

2

I

2

7' 6' 5' 4' 7' 3' 5'

3 I 4 3 7 ' --:; ' 7 ' 5

2

' 3'

5 3 4 5 6 I 7 ' 4 ' 5 ' 6 ' 7 ' �·

Non è chiaro chi abbia avuto per primo l'idea di prendere in considerazione tali successioni, ma il primo a raggiungere dei risul tati matematici veri e propri sembra sia stato Haros nel I 8o2 . Farey, in un articolo del I 8 I 6, esplicitò formalmente uno dei risultati di Haros, senza fornirne la dimostrazione, e quando in seguito Cau chy, esaminato l' articolo, trovò una dimostrazione del risultato ne attribuì l'idea a Farey dando così origine alla denominazione. Il risultato di Haros sviluppato da Farey consiste in questo: date tre qualsiasi frazioni successive comprese in una successione di Farey, a/d, b/e, c//, allora bfe = (a + c)/(d + /) . Ad esempio, il decimo,

226

CAPITOLO NONO

l'undicesimo e il dodicesimo termine di

6 IO

F7

sono 4/7 , 3/5 , z/3 e

3 5

L'altro risultato dimostrato da Haros è che se afe, b/d sono ter mini successivi di una successione di Farey, allora be - ad = r . Pren dendo di nuovo F7 come esempio, il sesto e il settimo termine sono I/3 e 2/5 e 2 X 3 - I X 5 = 6 - 5 = r.

È possibile ricavare le precedenti proposizioni l'una dall' altra, il che significa che basta provare una delle due per provarle entrambe. È un esercizio di alta abilità algebrica; se non è di vostro gusto, potete divertirvi a verificare le formule per altre sequenze. Per un qualsiasi numero n, denotiamo con A (n) il numero di termini nella successione di Farey Fn : ad esempio, A (5) = I O e A (7) = I 8 . Supponiamo ora di prendere l'intervallo da O a I sulla retta reale e dividerlo in A (n) segmenti uguali (fig . 9 . I ) . I punti che dividono l'intervallo in questo modo sono i punti I/A(n) , z/A(n) , 3/A (n) e così via fino a (A (n) - I )/A (n) . Poiché i termini nella suc cessione di Farey sono situati a intervalli disuguali tra O e I , molti numeri della successione non coincideranno con i punti situati a distanze uguali nell'intervallo . Ammettiamo che d1 sia la diffe renza tra il primo termine della successione F" di Farey e I/A (n) , d2 sia la differenza tra il secondo termine e z/A (n) , e così via fino a dA(nl - 1 ; non ha importanza quale sia il più grande in ciascuna coppia, ciò che conta è la differenza presa in valore assoluto. Indi chiamo con D(n) la somma di tutti i numeri d1, d2 , , dA(nl - 1 • • • •

Figura 9 . 1 La successione di Farey F4 I termini d i questa successione sono indicati dalle frecce che mostrano la loro posizione rispettto ai cinque punti che dividono l' intervallo da O a r in sei segmenti uguali. I numeri d t. d2, , d5 misurano la differenza tra le fra zioni di Farey e i rispettivi punti di divisione. D (4) è la somma di queste differenze. •

• • •

227

PROBLEMI Sill NUMERI COMPLESSI

Per fare un esempio semplice, F4 è costituita dai numeri I I I 2 3 I 4 ' 3 ' 2 ' 3 ' 4 ' I ' quindi A (4) = 6 . I punti che dividono l'intervallo da O a I in sei segmenti uguali sono I/6, 2/6, 3/6, 4/6, 5/6; allora d, è la diffe renza tra I/4 e I/6, cioè I/4 - I/6 = I/1 2 ; d2 è la differenza tra I/3 e 2/6 che è O; d} è la differenza tra I/2 e 3/6, che è anche O; così pure d4 = O ; d5 = 5/6 - 3/4 = I/I 2 . In definitiva:

D (4) = _I_ + I2

o

+

o

+

o

+ _I_ = __!__ . I2 6

Si può calcolare D (5) allo stesso modo . In un lavoro pubblicato nel I 9 24 , J . Frane! e E . Landau studia rono il comportamento della funzione D (n) al variare di n tra tutti i numeri naturali, usando tecniche algebriche e non calcolando arit meticamente grandi quantità di successioni di Farey. In partico lare, essi partirono dall' affermazione che se r è un qualsiasi numero reale maggiore di I/2 , allora esiste una costante C tale che D(n) è sempre minore di Cn'. Essi provarono che questa affermazione apparentemente semplice è equivalente alla congettura più impor tante, come riconoscono i matematici professionisti, tra tutte quelle irrisolte fino ad oggi: l'ipotesi di Riemann.

Il più importante tra i problemi irrisolti Per il lettore medio, il più famoso problema matematico irrisolto è certamente l'ultimo teorema di Fermat, presentato nel capitolo 8 . L a fama, tuttavia, non sempre v a di pari passo con l'importanza. Se si domanda a un ricercatore matematico qual è l'unico problema veramente importante ancora aperto in matematica, ci si può tran quillamente aspettare di sentirsi rispondere : « L'ipotesi di Rie mann ». Non c'è dubbio che il grande matematico inglese Godfrey H . Hardy (vedi cap . 4) la pensasse così. Dovendo affrontare una traversata dalla Scandinavia all'Inghilterra in condizioni atmosfe riche particolarmente difficili, mandò una cartolina a un collega (certo pensando all'origine dell'ultimo teorema di Fermat) con il

CAPITOLO NONO

messaggio: « > è possibile dimostrare che dal punto di vista della topologia tutte le superfici orientabili chiuse sono equivalenti a una sfera a cui sono attaccati un certo numero di manici. Questo dà una forma standard per le superfici chiuse orientabili.

un foro nella superficie e si cuce un nastro di Mobius facendo com baciare il bordo del foro con quello del nastro . Nello spazio tridi mensionale questo è fattibile solo se si fa in modo che il nastro di Mobius si autointersechi (fig. 1 0 . 1 3 ) . Poiché un nastro di Mobius permette di scambiare il senso orario e quello antiorario, una super ficie con una calotta sarà non orientabile. La caratteristica di Eulero di una sfera con n calotte è 2 - n; anche in questo caso lo si può dimostrare partendo da un grafo su una sfera e osservando che ogniqualvolta si aggiunge una calotta la quantità V - E + F dimi nuisce di I . * Praticando la chirurgia, è possibile deformare con relativa faci lità qualsiasi superficie non orientabile in una non orientabile stan dard di qualche genere . Per esempio, il piano proiettivo , che a * Questo è spiegato per esteso in Stewart ( 1 9 8 1 ) , citato nella nota precedente.

CAPITOLO DECIMO

{a)

{b)

Figura I O . I J L a calotta intersecantesi. Per attaccare una calotta a una superficie, s i pratica u n foro, come in (a) e si cuce un nastro di Mobius facendo combaciare il bordo del foro con quello del nastro. Nello spazio tridimensionale questo può essere visualizzato solo se si fa in modo che il nastro di Mobius si autointersechi, come in (b) . Praticando la chi rurgia topologica è possibile dimostrare che qualsiasi superficie chiusa non orientabile è topologicamente equivalente a una sfera avente un certo immero di calotte. Questo costituisce una forma standard per le superfici chiuse non orientabili.

dispetto del nome è una superficie chiusa, diventerà una superfi cie non orientabile standard di genere I , e la bottiglia di Klein si trasformerà in una di genere 2 . Poiché la caratteristica di Eulero di una superficie non orientabile standard dipende dal genere (secondo la formula 2 - n) , anche questo procedimento di stan dardizzazione determina la classificazione per mezzo della carat teristica di Eulero di tutte le superfici non orientabili. Le super fici con bordi vengono classificate considerando le superfici standard munite di fori. Con quanto abbiamo fin qui appreso sulla topologia delle super fici, possiamo ora dare un'occhiata a cosa si è scoperto negli ultimi

NODI E QUESTIONI TOPOLOGICHE

anni per le dimensioni di ordine più elevato. Partiamo esaminando uno dei tipi più semplici di varietà: la sfera n-dimensionale, per n uguale a 2 , 3 , 4 e oltre. Il più famoso problema della topologia riguarda proprio queste varietà.

La congettura di Poincaré La più semplice tra tutte le superfici bidimensionali chiuse è la sfera, quella da cui si è partiti per il processo di classificazione appena descritto. L'analogo n-dimensionale di una sfera è noto come n-sfera (sicché la comune sfera è una 2 -sfera) . Come la 2 -sfera è la superficie di una palla tridimensionale, così la n-sfera è la « super ficie » di una « palla » di dimensione ( n + I ) . Quando il matema tico francese Henri Poincaré, all'inizio del nostro secolo, comin ciò a studiare varietà di dimensioni di ordine più elevato, dando in sostanza avvio a quello che oggi si intende per topologia delle varietà, si occupò in modo particolare delle n-sfere. Queste, dopo tutto, dovrebbero essere molto particolari, proprio come la 2 -sfera è particolare tra le varietà bidimensionali. Nel 1 904, non riuscendo a dimostrare un' asserzione sulle n-sfere che egli riteneva ben fon data, la formulò come una congettura destinata a diventare il pro blema più famoso in quel campo. Come tutte le buone congetture, è allo stesso tempo di fondamentale importanza e di facile formu lazione . Supponiamo di tracciare una curva chiusa su una 2 -sfera; que sta si può contrarre fino a ridursi a un punto senza abbandonare la sfera (fig. 1 0 . 1 4a) . Anzi, la sfera è la sola superficie chiusa su cui è possibile farlo : se dovessimo, ad esempio, tracciare una curva chiusa su un toro, in uno dei due modi indicati nella figura I 0 . 1 4b, esso non potrebbe essere ridotto a un punto . Allo stesso modo (fidandoci però della matematica astratta, senza l' aiuto di figure) , se prendiamo una n-sfera per qualsiasi valore di n maggiore di 2 e vi « disegnamo » una curva chiusa, essa può essere ridotta a un punto senza lasciare la n-sfera. Tuttavia, e qui sta il grosso enigma, è vero che la n-sfera è la sola varietà chiusa n-dimensionale dotata di questa proprietà, come lo è in due dimensioni? Nella con-

CAPITOLO DECIMO

(a)

(b)

Figura 1 0 . 1 4 L a congettura d i Poincaré. S e s i disegna u n laccio chiuso s u una sfera, esso può essere contratto senza lasciare la superficie, fino a essere ridotto a un punto, come in (a) . Su un toro questo non è sempre possibile. Se il laccio è disegnato in uno dei due modi indicati in (b) , non può essere contratto e ridotto a un punto senza lasciare la superfi cie. Per le superfici chiuse, questa proprietà di poter contrare qualsiasi laccio chiuso e ridurlo a un punto è una caratteristica esclusiva della sfera: nessun'altra superficie chiusa le possiede. Secondo la congettura di Poincaré un risultato analogo vale per tutte le dimensioni più elevate. Ad esempio, la sola varietà chiusa tridimensionale avente la proprietà di cui sopra è l'ipersfera tridimensionale.

gettura di Poincaré la risposta è sl, anche se, a rigor di termini, a Poincaré interessavano solo le varietà a tre dimensioni . Nonostante i notevoli sforzi, il problema di dimostrare o di con futare la congettura di Poincaré fu (parzialmente) risolto solo nel 1 960, quando il matematico americano Stephen Smale dimostrò che la congettura è vera per tutte le dimensioni maggiori o uguali a 5 . Questo risultato fu considerato cosl importante da meritare a Smale una medaglia Fields per il suo lavoro . È anche un esem pio del fenomeno di cui abbiamo già parlato, per cui le varietà si comportano in modo diverso dalla quinta dimensione in poi : i metodi di Smale non funzionavano per tre o quattro dimensioni . Questo avveniva quasi vent' anni prima che fosse risolto il problema per le quattro dimensioni ad opera di un altro americano; nel 1 9 8 1 Michael Freedman sfruttò l e idee d i Smale e i l lavoro d i Andrew C asson per dimostrare la congettura di Poincaré per le 4-sfere . Rimane il problema delle tre dimensioni, proprio quello per cui la congettura era stata originariamente formulata. Qual è lo stato attuale delle cose? Nonostante la notevole mole di lavoro di mate matici di prim'ordine, il problema rimane tuttora insoluto . Ci si

NODI E QUESTIONI TOPOLOGICHE

279

può fare un'idea del grado delle difficoltà incontrate dal semplice fatto che alcuni esperti impiegarono parecchi mesi per individuare una falla in uno dei recenti tentativi di dimostrazione, pubblicato all' inizio del 1 986. Ottant ' anni dopo la sua formulazione, la con gettura di Poincaré rimane il maggiore problema irrisolto della topologia.

La teoria delle varietà Secondo la definizione astratta, una varietà n-dimensionale è un oggetto avente la proprietà per cui qualsiasi sua parte assomi glia molto al familiare spazio euclideo n-dimensionale, R n . Ad esempio , stando a questa definizione, la 2 -sfera è una varietà bidi mensionale : qualsiasi minima parte della sfera .si presenta esatta mente come R 2 , cosa verificabile in pratica quando ci si muove sulla superficie terrestre. Si noti che, per il solo fatto che una varietà n-dimensionale debba assomigliare localmente a R n , non è detto che ciò valga per l'intera varietà . Fu proprio per non aver capito questo fatto circa le varietà bidimensionali che si giunse alla con clusione che la Terra fosse piatta: lo è (quasi) localmente, pur non essendolo nella sua globalità. Ora, ciò che soprattutto interessa nello studio delle varietà è il modo naturale in cui queste sorgono in relazione a problemi di analisi matematica e di fisica. In questi casi non si ha più a che fare con varietà pure e semplici, bensl con tipi di varietà su cui è possibile sviluppare una delle tecniche più utili della matema tica: il calcolo differenziale . Probabilmente il lettore conoscerà il calcolo differenziale sulla varietà R, cioè il comune calcolo diffe renziale per funzioni di una variabile reale che si insegna a scuola, ed è probabile che conosca anche quello sulla varietà R 2 • Le stesse tecniche ci permetteranno di sviluppare un calcolo differen ziale per qualsiasi varietà R n a dimensioni di ordine superiore, per n = 3 , 4 , 5 ecc . Poiché qualsiasi varietà n-dimensionale assomiglia localmente a R n , possiamo usare localmente i metodi del calcolo differenziale su quella varietà. E globalmente? Almeno per la sfera, è possibile sviluppare un calcolo differenziale che copra l'intera superficie,

CAPITOLO DECIMO

perché la transizione da un' area locale alla successiva avviene in modo piano e uniforme. Per dirla in altre parole, supponiamo di dover ricoprire tutta la superficie della sfera con meridiani e paral leli: otterremo un sistema di coordinate che, localmente, non è dis simile dal solito sistema di coordinate cartesiane, che sottende allo sviluppo del calcolo differenziale su R 2 • Se usiamo queste coor dinate per sviluppare il nostro calcolo localmente sulla superficie, allora, visto che usiamo esattamente le stesse linee coordinate su tutta la superficie, non ci sarà differenza tra ciò che succede in un punto e ciò che si verifica in un altro : le transizioni saranno tutte uniformi. Il quesito di fondo che vien naturale porsi è per quante varietà sia possibile sviluppare un calcolo differenziale globale, così come si può fare per la sfera. Una tale varietà è detta varietà differenzia bile (o anche liscia) . Un sistema di coordinate che copra tutta la varietà e serva di base al processo di differenziazione, come ad esempio i meridiani e i paralleli sulla sfera, è detta struttura diffe renziabile. In realtà le cose sono un po' più complicate, ma l'idea è pressappoco questa. La domanda sulle varietà lisce, ovvero a quali varietà sia possibile dare una struttura differenziabile, porta con sé un' altra domanda non meno interessante: si possono dare strut ture differenziabili diverse ad una stessa varietà? E se sì, in quanti modi? Poiché anche i fisici passano molto tempo a lavorare con il calcolo differenziale su varietà diverse, le risposte a queste domande non interessano solo gli studiosi di topologia. Per le varietà a due o tre dimensioni le risposte a questi quesiti si conoscevano fin dalla metà degli anni cinquanta: tutte le varietà a due o tre dimensioni sono differenziabili, e a varietà di questo tipo non si possono dare due strutture differenziabili diverse. Allora sembrava che fosse solo una questione di tempo per poter esten dere il risultato alle varietà multidimensionali . Tuttavia, nel 1 956 lo statunitense John Milnor, con grande stupore di tutti, scoprì che la 7-sfera può avere 2 8 strutture differenziabili completamente distinte, e subito dopo si trovò che ad altre sfere di dimensioni più elevate si possono dare diverse strutture differenziabili. Occor reva una gran mole di lavoro per capire che cosa stesse succedendo, e i matematici capaci e disposti a farlo non mancavano. Il periodo tra il 1 95 6 e il 1 97 0 è stato definito « età dell'oro della topologia

NODI E QUESTIONI TOPOLOGICHE

delle varietà ». In realtà fu l'età dell'oro dello studio delle varietà a cinque o più dimensioni, poiché ancora una volta si rivelò impos sibile affrontare il problema per le quattro dimensioni con i metodi di cui si disponeva. In questo periodo, sfruttando il concetto mate matico di omotopia, gli studiosi di topologia riuscirono a fare una classificazione abbastanza sistematica di tutte le varietà a più di quattro dimensioni, in particolare distinguendo tra quelle diffe renziabili e non. E per le quattro dimensioni? Forse tutte le varietà sono lisce e ammettono un'unica struttura differenziabile, come per le dimen sioni di ordine più basso? O magari c'è una vasta gamma di possi bilità, per cui si rende necessaria una classificazione, come per le dimensioni di ordine più elevato? La risposta giunse finalmente nel 1 98 1 . Michael Freedman, oltre a trovare la soluzione alla con gettura di Poincaré per le quattro dimensioni, dimostrò anche che esiste una varietà a quattro dimensioni non differenziabile. (La descrizione di Freedman di questa varietà, che per motivi tecnici è nota come E8, è, come sempre nella topologia delle dimensioni superiori, di tipo algebrico) . In effetti, sia la soluzione della con gettura di Poincaré per le quattro dimensioni, sia il risultato rela tivo alla varietà quadridimensionale non differenziabile furono la conseguenza di un unico risultato di carattere molto generale, e del tutto inatteso, conseguito da Freedman. Secondo tale risul tato, per classificare qualsiasi varietà a quattro dimensioni occor rono due sole informazioni « elementari », informazioni tuttavia non cosl « elementari » da poter essere spiegate qui. Le sorprese non finivano Il. Presto ne sarebbe seguita una che interessava proprio il cuore dell'universo fisico in cui viviamo . I risultati inattesi riguardanti le varietà possono sempre essere giustificati dal fatto che si ha a che fare con nozioni astratte, che nella migliore delle ipotesi sono comprensibili solo in parte. Anche le varietà a due dimensioni possono essere a volte graziosi oggetti di fantasia, in grado di sfidare l'immaginazione. Non si può certo dire lo stesso per le varietà più concrete R , R2, R 3 ecc. Dopo tutto, R 3 non è forse lo spazio fisico in cui viviamo, e R 4 il con tinuum spazio-temporale? In verità, queste varietà concrete rive lano un comportamento quasi esemplare. Tanto per cominciare, sono tutte differenziabili; inoltre, per ciascun n esiste un unico

CAPITOLO DECIMO

Figura 1 0 . 1 5 Soluzione dell'enigma degli anelli (fig . 1 0 . 1 ) . L a sequenza d i immagini indica come la configurazione originale di anelli concatenati può essere deformata in una di anelli non concatenati.

modo per attribuire una struttura differenziabile a R n . . . tranne che per n = 4 · Per una qualche strana ragione, i matematici non erano riusciti a provare la unicità di una struttura differenziabile per R 4 • Que sto insuccesso era tanto più imbarazzante in quanto riguardava proprio il punto di maggior interesse per i fisici. Si pensava però che fosse solo questione di tempo , e che prima o poi ci si sarebbe arrivati . Non era forse inconcepibile che la differenziazione su R 4 potesse farsi in modo non-standard? Ma l'inconcepibile risultò vero . La notizia arrivò nell' estate 1 9 8 2 . Utilizzando il lavoro svolto da Freedman, che era essenzial mente di tipo algebrico, unitamente a una grande quantità di ana lisi e di geometria differenziale, Simon Donaldson, un ventiquat trenne studente di Michael Atiyah a Oxford, consegul un risultato che implicava l' esistenza di una struttura differenziabile su R 4 diversa da quella usuale . In altre parole, la struttura differenzia bile usata da fisici e matematici di tutto il mondo non è l'unica! Non solo : più tardi, Clifford Taubes dimostrò che la solita strut tura differenziabile su R4 è solo una delle infinite che si possono

NODI E QUESTIONI TOPOLOGICHE

dare a questa varietà. Questa scoperta solleva domande affasci nanti. Che cosa ha di così particolare la quarta dimensione da essere l'unica a dar vita a questo fenomeno? Poiché esiste più di un modo per eseguire la differenziazione su R\ come possiamo sapere qual è quello appropriato per quanto riguarda la fisica? Dal momento che le varietà a n dimensioni rientrano in un ordine preciso per tutti i valori di n diversi da 4, il caso n = 4 ha suscitato sempre maggior curiosità. Ma allora, i fisici stanno usando su R 4 i procedimenti matema tici giusti? Probabilmente sì. Tutte le infinite strutture differen ziabili anomale su R4 che sono state scoperte hanno un compor tamento molto singolare e artificioso, che ne esclude l'uso per quanto attiene al nostro universo fisico . Nondimeno, la loro esi stenza sta senz' altro a indicare che lo spazio a quattro dimensioni è veramente molto particolare, e la loro scoperta fa sì che il nostro tempo sia davvero l'età dell'oro della topologia.

C apitolo

II

L ' efficienza degli algoritmi

Ancora algoritmi Il concetto di algoritmo ha già giocato un ruolo importante nel capitolo 6 : d'ora innanzi si darà per scontato che il lettore lo cono sca. Il decimo problema di Hilbert chiedeva, in sostanza, se un particolare problema potesse essere risolto con un algoritmo . Era in discussione solo l'esistenza (o meno) di un tale algoritmo, e non ci si domandava affatto se esso fosse eseguibile praticamente. Que sto era perfettamente legittimo, in tale contesto; quando si passa al mondo reale, però, sapere che un algoritmo esiste non è suffi ciente, ma costituisce solo un punto di partenza. Infatti, non serve a nulla avere un metodo che, sebbene in teoria capace di risolvere un certo problema, potrebbe richiedere migliaia di anni per farlo, pur con un calcolatore molto veloce . Per i problemi che interes sano il mondo degli affari e le scienze applicate, ciò che importa è l'esistenza di un « buon » algoritmo . In campo economico, que sto potrebbe voler dire risolvere il problema nel giro di qualche ora, mentre per sistemi come quello di pilotaggio di un aereo i risul tati devono essere disponibili nel giro di una frazione di secondo . Per applicazioni di questo tipo, è chiaro che si deve dimostrare che un particolare problema può o non può essere risolto con un algoritmo efficiente. A questo scopo , il primo passo da compiere consiste nel formulare un metodo adeguato per valutare l'efficienza di un algoritmo . Ovviamente la velocità con cui un programma dato può essere eseguito su un calcolatore dipende da più fattori . La dimensione

L' EFFICIENZA DEGLI ALGORITMI

e la velocità della macchina, l'efficacia del linguaggio di program mazione usato per scrivere il programma, nonché l'abilità del pro grammatore sono tutti elementi che hanno la loro importanza. Tut tavia, essendo fattori molto specifici, non fanno al caso di uno studio generale. Ci serve piuttosto una divisione molto generica che distingua gli algoritmi in due categorie: algoritmi efficienti e algoritmi non efficienti. Questa classificazione dovrebbe essere tale che eventuali variazioni dei fattori marginali, come la velocità del calcolatore o il linguaggio di programmazione, non trasformino un algoritmo non efficiente in uno efficiente e viceversa. La classificazione introdotta da A. Cobham e }. Edwards a metà degli anni sessanta costituisce attualmente la base per la maggior parte degli studi sull'efficienza degli algoritmi. Sebbene essi adot tassero il tempo come principale metro di valutazione, per evitare la dipendenza dalla velocità di calcolo, la vera definizione è data sulla base del numero di passaggi richiesti per l'esecuzione. Natural mente neppure questo concetto ha valore assoluto, perché dipende da che cosa si intende per « passaggio » e dal modo in cui i dati sono rappresentati . Ma tutte le considerazioni di questo tipo risul tano irrilevanti per quanto riguarda il concetto fondamentale di efficienza. Per questo motivo è ormai subentrata la prassi di for mulare le varie definizioni in termini di macchine di Turing (si veda il cap. 6) , che sono sufficientemente semplici per consentire una teoria matematica uniforme. Ciò nonostante, tutto ciò che vale per una macchina di Turing è ugualmente valido nel nostro sistema di calcolo preferito, qualunque esso sia. Avendo scelto per la parte teorica la macchina di Turing come sistema di base del calcolo, misuriamo l'efficacia di un algoritmo in base al numero di passaggi, cioè dei passi che occorrono alla macchina di Turing per completare il calcolo . Non serve chiedersi in che modo l' algoritmo sia scritto come programma per una mac china di Turing e come i dati siano codificati sul nastro, perché considerazioni di questo tipo non modificano la frontiera tra algo ritmi efficienti e algoritmi non efficienti . È invece importante la dimensione dei dati introdotti: maggiore è il numero di dati, mag giore è il numero di passi richiesti per maneggiarli. Per esempio, nella moltiplicazione manuale di coppie di numeri interi, raddop piando la lunghezza dei numeri il tempo richiesto diventa più del

CAPITOLO UNDICESIMO

quadruplo, tenendo anche conto dei riporti. Tenendo presenti que ste osservazioni, diamo ora le definizioni fondamentali. Si dice che un algoritmo, che ai fini della definizione possiamo considerare come un programma per una macchina di Turing, occupa un tempo polinomiale se esistono due numeri interi A e k tali che, per dati di ingresso di lunghezza n, e per qualsiasi valore di n, il calcolo è completato al massimo in An k passi. Ad esempio, l' algoritmo standard per sommare a mano due numeri interi occupa un tempo polinomiale . Se i numeri sono espressi nella solita notazione decimale e l'operazione di base del calcolo è l' addizione di due cifre, allora l' addizione di due numeri di n/2 cifre ciascuno (dati in ingresso di lunghezza n) implica esat tamente n passi, tenendo conto dei riporti, e la definizione vista poc' anzi è soddisfatta con A e k uguali a I . Nella moltiplicazione di due numeri di n/2 cifre ci sono n 2/4 moltiplicazioni più n/2 somme, per un totale di n 2/4 + n/2 passi; poiché n 2/4 + n/2 è sempre minore di n 2 , prendendo A = r e k = 2 nella definizione vediamo che la moltiplicazione di numeri interi con la tecnica usuale è un algoritmo a tempo polinomiale. Se gli esempi di prima fossero valutati in termini di macchine di Turing piuttosto che di aritmetica decimale, si dovrebbero natu ralmente usare valori della costante A più grandi, e forse anche un k maggiore, ma si tratterebbe ancora di algoritmi a tempo poli nomiale. In effetti, questo è il motivo per cui il concetto di algo ritmo a tempo polinomiale è indipendente da qualsiasi variazione nei dettagli della macchina e della programmazione: tali fatti pro ducono variazioni solo nella dimensione delle due costanti, ma la sostanza della definizione rimane valida. Gli algoritmi che non occupano un tempo polinomiale si dicono a tempo esponenziale. Per esempio, un algoritmo che richiede 2 • (o 3 " , o n•, o n ! ) passaggi per trattare dati d'ingresso di lunghezza n è un algoritmo a tempo esponenziale . Questo spiega l'impiego della parola « esponenziale », sebbene il modo in cui è usato sia un po' ambiguo, poiché include funzioni come n 108 " , che non è di solito considerata esponenziale . Come il lettore avrà ormai capito, « efficienti » sono gli algo ritmi che occupano un tempo polinomiale, « non efficienti » sono quelli che richiedono un tempo esponenziale. La discussione sulla

L' EFFICIENZA DEGLI ALGORITMI

crescita esponenziale nel capitolo I dovrebbe essere sufficiente a convincere il lettore che gli algoritmi a tempo esponenziale sono estremamente inefficienti; d' altra parte, potrebbe essere giustifi cata una certa dose di scetticismo sul fatto che algoritmi a tempo polinomiale siano necessariamente efficienti. La facoltà di sceglie re le costanti A e k nella definizione di tempo polinomiale sem brerebbe offrire un margine di possibilità persino troppo ampio: è improbabile che un algoritmo polinomiale in cui A = I 0 10 e k = I OO sia « efficiente » in senso reale. È bene puntualizzare due cose: primo, capita che i problemi pratici siano risolubili con algo ritmi a tempo esponenziale o con algoritmi a tempo polinomiale dell'ordine, ad esempio, di 1 0n 3 passaggi, o forse anche meno; secondo, la distinzione tra polinomiale ed esponenziale è soltanto una classificazione preliminare e approssimativa, e in futuro si ren derà necessaria una differenziazione più precisa. Queste due osser vazioni sono messe bene in risalto nella tabella I I I . •

Tabella I 1 . I Tempi polinomiali e tempi esponenziali . Si assume che un dispositivo di calcolo esegua una sola operazione di base in o,ooooo i secondi. La tabella indica il tempo richiesto per eseguire il calcolo, una volta assegnate le dimensioni dei dati e la funzione di complessità (cioè il modo in cui il calcolo dipende dalla dimensione dei dati) . Si noti come i tassi di crescita siano decisamente maggiori per le due funzioni esponenziali. Il tempo di calcolo per n = 50 e per una funzione di complessità 3 è superiore alle migliori valutazioni correnti dell'età del l'Universo, e per n = 6o esso è circa I oo ooo volte più lungo •

Funzione di complessità n

Dimensione dei dati (n) 20

IO

30

40

0 ,0000 1 s 0,00002 s 0 ,00003 s 0,00004 s

50 0,00005 s

6o o,oooo6 s

n>

0,000 1 s

0,000 4 s

0 ,0009 s

o,oo i 6 s

0,0025 s

0,003 6 s

n'

0,00 1 s

o,oo8 s

0,027 s

0,06 4 s

o, I 2 5 s

0,216 s

2"

0,00 1 s

I ,O

3"

0,059 s

S

58 min

1 7 ,9 min 6,5 anni

1 2 , 7 giorni 3 5 , 7 anni 3 855 secoli 2 x I 0 8 secoli

366 secoli 1 ,3 x 1 0 13 secoli

Per illustrare come i concetti appena esposti siano utilizzati per classificare i problemi reali e gli algoritmi, ne esamineremo uno famoso e molto importante in campo economico .

CAPITOLO UNDICESIMO

Il

problema del commesso viaggiatore

Immaginiamo che un commesso viaggiatore debba visitare una cinquantina di località; non importa l'ordine in cui si reca nei vari luoghi, purché li tocchi tutti. Naturalmente è nell'interesse suo e di chi paga le spese di trasporto che il giro avvenga secondo un criterio di economia di percorso . Sulla base di quali elementi sce glierà il tragitto? Ovviamente, incomincerà disegnando uno schema che evidenzi le distanze tra una località e l'altra. Dopo di che, come procederà? Ad esempio, qual è il percorso più economico per visi tare tutti i luoghi indicati nella figura I I . I ? Un primo modo di affrontare il problema consiste nell'elencare tutte le possibilità di percorso, calcolare la lunghezza totale di ognuna e scegliere la più breve. Questo metodo senza dubbio funzionerà, il che dimostra che il problema può essere risolto con un algoritmo, dal momento che il procedimento può essere fa cilmente eseguito da un calcolatore (perlomeno in linea di princi pio) . Ma anche per un numero abbastanza limitato di luoghi, le possibilità da esaminare sono decisamente troppe: se le località

IO

Figura 1 1 . 1 Il problema del commesso viaggiatore: trovare un itinerario attraverso tutte le località indicate che minimizzi l'intera distanza coperta. Le distanze indicate sono quelle par ziali tra un luogo e l'altro lungo i percorsi possibili. Ad esempio, l'itinerario ABEFDC corrisponde a un viaggio di lunghezza 8 + 9 + 2 + 1 o + 3 = 3 2. Talvolta si richiede che l'itinerario incominci e finisca nella stessa località, nel qual caso questo percorso speci fico sarebbe incompleto.

L' EFFICIENZA DEGLI ALGORITMI

da visitare sono n, allora ci sono n ! itinerari possibili. Si ricordi che n! (« n fattoriale ») è il prodotto di tutti i numeri n, n - I , n - 2 , . . . , 3 , 2 , r . Poiché la funzione n ! è senza dubbio esponenziale (aumenta più velocemente di 2 n o 3 n , sebbene non velocemente come la funzione « Superesponenziale » n n) , l'elencazione di tutti gli itine rari possibili porterà inevitabilmente a un algoritmo di comples sità esponenziale. Per farsi un'idea della scarsa praticabilità di tale metodo, si tenga presente che per I o località i percorsi possibili sono Io!

=

3 6 2 8 8oo.

Siamo su ordini di grandezza affrontabili dai calcolatori moderni, ma quando si arriva a 2 5 località il numero di percorsi da pren dere in considerazione diventa I 6 seguito da ben 25 zeri . Un giro che tocchi venticinque città è del tutto realistico per un commesso viaggiatore, per non parlare di altre situazioni che corrispondono allo stesso problema matematico, dove il numero di luoghi può essere dell'ordine di centinaia. Quindi il metodo di elencare tutte le possibilità risulta inattua bile se non per un numero limitato di località. Quale altra via si può tentare? Forse una soluzione dettata dal « buon senso »? Ad esempio, guardando una mappa o una tabella delle distanze, si potrebbe identificare un percorso che dapprima tocchi tutte le loca lità prossime al punto di partenza, per poi allontanarsi progressi vamente. Sebbene questa strategia, come qualsiasi altra che si voglia sperimentare, possa essere efficace in certe situazioni particolari, è stato dimostrato che non sempre funziona. Prendiamo ora in con siderazione il comportamento complessivo dell' algoritmo . È pos sibile che istanze particolari del problema del commesso viaggia tore risultino avere soluzioni facili (se ad esempio le località si trovano tutte su una linea retta il percorso sarà ovvio) , ma ciò che noi vogliamo è un algoritmo applicabile in tutti i casi . Da quando il matematico viennese Karl Menger sollevò il problema nel I 93 0 , sono stati intrapresi molti studi i n questa direzione ( e sono stati pubblicati oltre trecento articoli) , ma una soluzione generale non è ancora stata trovata. In effetti, come vedremo, è assai probabile che non esista un algoritmo efficiente in grado di risolvere questo problema . Nel frattempo, è opportuno accennare ai notevoli progressi fatti

CAPITOLO UNDICESIMO

per alcuni casi particolari. Nel 1 962 Michael Held e Richard Karp dell'IBM usarono una tecnica detta programmazione dinamica per risolvere il problema per tutti i percorsi con un massimo di r 3 loca lità ( r 3 ! = 6 2 2 702 oSo) . Nel 1 963 Little, Murty, Sweeney e Karp inventarono una tecnica potente, detta branch and bound, che rese possibile la soluzione del problema per percorsi fino a 40 località, occupando un tempo di alcuni minuti su un mainframe IBM 7090 . Nel 1 970 Held e Karp svilupparono un algoritmo branch and bound in grado di risolvere una istanza del problema con n = 42 ; con que sto algoritmo bastava esaminare 6 r dei numerosissimi percorsi pos sibili (4 2 ! è pari a 33 seguito da 49 zeri) . (Questo problema, che riguardava 42 città negli usA, era già stato risolto nel 1 954 da Dan trig, Fulkeston e Johnson della RAND Corporation) . Nel 1 979 Crow der e Padberg risolsero un problema specifico con n = 3 1 8 , senza dubbio il massimo numero mai raggiunto fino ad allora. L'opinione comune è che le tecniche di cui disponiamo dovrebbero essere in grado di fornire la soluzione di qualsiasi caso con n corrispondente a 500 circa in un tempo di calcolo ragionevole, che potrebbe essere di alcuni giorni al massimo . Ma la struttura particolare di ciascun caso è un fattore determinante. In linea di massima, i problemi che nascono dalla vita reale risultano essere perlopiù trattabili, men tre è possibile inventare esempi « artificiali » che resistono a tutti i tentativi di soluzione conosciuti. Il paragrafo seguente spiega per ché una soluzione generale che funzioni bene in tutti i casi è, molto probabilmente, impossibile da ottenersi .

P e NP Se si vuole discutere in astratto su come problemi trattabili pos sano essere risolti con un algoritmo efficiente, risulta opportuno riformulare tutti i problemi in modo che prevedano risposte del tipo sì o no, il che permette di confrontare problemi differenti. Ad esempio, il problema della moltiplicazione (dati due interi a e b, qual è il loro prodotto?) potrebbe essere così espresso: dati gli interi a, b e c, è vero che ab = c ? Al problema del commesso viaggiatore potrebbe essere data questa forma: dato un insieme di luoghi, nonché una tabella delle distanze, e dato un numero B ,

L' EFFICIENZA DEGLI ALGORITMI

esiste un percorso che tocchi tutti i luoghi e la cui lunghezza totale sia al massimo B ? A prima vista non si direbbe che una tale for mulazione possa cogliere l'essenza del problema, ma così è: se esi ste un algoritmo che risolve il problema nella versione originale, allora ne esiste uno che lo risolve nella versione « SÌ-no », e viceversa. I problemi con risposte del tipo sì o no son detti problemi deci sionali. Un problema decisionale è detto di tipo P se può essere risolto con un algoritmo polinomiale. Ad esempio, il problema della moltiplicazione visto poc' anzi è di tipo P: per verificare se ab = c, si moltiplichino semplicemente a e b e si veda se il risultato è uguale a c; questa operazione richiede un tempo polinomiale (anzi, qua dratico) . Finora non si sa con certezza se il problema del commesso viag giatore sia di tipo P o no . Si sa solo che è di tipo NP, cioè a tempo polinomiale non deterministico . Per capire questo concetto, si pensi a una macchina di Turing, o a qualsiasi altro apparato di calcolo, in grado di avanzare ipotesi casuali in vari stadi del suo funziona mento . Non essendo possibile costruire una macchina con questi requisiti, bisogna riuscire a immaginarla. Usando questo ipotetico apparato, detto macchina di Turing non deterministica, il problema del commesso viaggiatore può essere risolto con un algoritmo poli nomiale. È un algoritmo semplice: scegliamo a caso il primo luogo da visitare, poi il secondo, il terzo e così via, fino a completare tutto il tragitto, calcoliamo il percorso totale e confrontiamolo con il numero dato B . Ammesso che la macchina « indovini » a ogni stadio (cosa improbabile nella realtà, essendoci r/n ! probabilità di successo, dove n indica il numero dei luoghi da visitare) , il risul tato ottenuto sarà corretto . L'essenza dei problemi di tipo NP è proprio questa: l'essere risolubile in tempo polinomiale da una mac china di Turing non deterministica che avanzi sempre ipotesi corrette. Un altro problema di tipo NP è dato dallo stabilire quali numeri interi siano composti. Dato un intero n, supponiamo che gli interi a e b siano minori di n e verifichiamo se ab = n. Avremo una risposta con un algoritmo polinomiale, e un'ipotesi ottimale darà la risposta corretta. Si noti che lo stesso tipo di algoritmo non è sufficiente per stabilire se il problema complementare, che consiste nel determinare se un numero intero dato n è primo, sia di tipo NP.

CAPITOLO UNDICESIMO

Per dimostrare che n è composto è richiesta un'unica ipotesi esatta da parte della macchina, mentre per dimostrare che n è primo tutte le ipotesi devono rivelarsi errate . In realtà, il test di primalità è di tipo NP, ma per dimostrarlo dobbiamo usare un altro ragio namento. L'importanza del concetto (molto astratto) di problemi di tipo NP deriva da due fattori . Per prima cosa, molti dei problemi per i quali non si è ancora scoperto un algoritmo efficiente risultano essere di tipo NP. Intuitivamente, si capisce che le cose stanno così perché la difficoltà in tali problemi non sorge dal procedi mento di calcolo richiesto, ma dal fatto che contengano un grande numero di possibilità. Quando queste diverse possibilità sono abba stanza simili tra loro da poter essere affrontate allo stesso modo, è possibile adottare la strategia di ipotesi e prove descritta prima per i problemi NP. Quindi il concetto di NP fornisce il quadro teo rico per risolvere un grandissimo numero di problemi pratici reali. Il secondo fattore nasce dal lavoro svolto nel 1 9 7 1 da Stephen Cook sull'efficienza degli algoritmi. Utilizzando tecniche che risal gono a Turing e ad altri, Cook riuscì a trovare un modo per dimo strare che è molto improbabile, o meglio è impossibile, che certi problemi di tipo NP si possano risolvere con un algoritmo polino miale efficiente . Più specificamente, Cook dimostrò che un pro blema particolare di tipo NP è, come egli lo definì, NP-completo : se tale problema può essere risolto con un algoritmo polinomiale, allora la stessa cosa è possibile per tutti gli altri problemi di tipo NP. In altre parole, il problema considerato da Cook non è meno difficile di tutti gli altri problemi di tipo NP. Facendo tesoro del risultato di Cook, altri matematici dopo di lui dimostrarono che molti altri problemi NP sono anche NP-completi, compreso il pro blema del commesso viaggiatore (vedi inserto C) . Così, il lavoro di Cook e di altri fornì un modo per dimostrare che molti problemi NP che sorgono nel mondo reale sono altret tanto difficili da risolvere quanto qualsiasi altro problema di tipo NP. Ora, la maggior parte dei matematici concluderebbe dicendo che è uno spreco di tempo cercare un algoritmo efficiente, cioè polinomiale, per risolvere un problema non meno difficile di tutti i problemi NP. Di conseguenza la prova che un dato problema è NP-completo implica necessariamente che non può essere risolto con un algoritmo polinomiale.

293

L' EFFICIENZA DEGLI ALGORITMI

Inserto C - Alcuni problemi NP-completi Commesso viaggiatore (si veda il testo per i dettagli) . Circuito hamiltoniano Data una rete di città e di strade che le collegano, c'è un percorso che inizi e che termini nella stessa città e tocchi tutte le altre una sola volta? Allocazione di multiprocessori Dato un insieme T di pro grammi da eseguire, unitamente a un elenco dei tempi richiesti per eseguire ciascun programma su un determinato tipo di elaboratore, e dato anche un numero specifico di elaboratori di quel tipo, è possibile dividere i programmi dell'insieme T e assegnare ciascun gruppo a un elaboratore, cosicché il tempo totale occorrente per l'esecuzione di tutti i programmi sia inferiore a un tempo dato? Ciascun processare funziona sequenzialmente, sebbene nel loro insieme funzionino in parallelo . Colorazione di mappe (cap . 7) Data una mappa, è possi bile colorarla usando solo tre colori e facendo sì che nessuna coppia di paesi confinanti risulti dello stesso colore? Residui quadratici Dati i numeri interi a, b, c, con a minore di b, esiste un numero intero positivo x minore di c tale che x 2 mod b = a ? Equazioni diofantee quadratiche (cap . 6) Dati i numeri interi positivi a, b, c, esistono due numeri interi positivi x e y tali che ax 2 + by = c ?

2 94

CAPITOLO UNDICESIMO

C 'è comunque una difficoltà. Il risultato di Cook e i successivi non precludono la possibilità che le classi P e NP siano in sostanza le stesse, cioè che qualsiasi problema di tipo NP si possa di fatto risolvere usando un algoritmo polinomiale, sebbene trovare tale algoritmo non sia impresa facile. Se le cose stessero effettivamente così, sapere che un problema è difficile quanto qualsiasi altro della classe NP non sarebbe molto significativo (tutti i problemi NP sarebbero « facili » nel senso che se ne dà ora) . Pochi esperti pren dono in considerazione tale eventualità, perché la natura stessa dei problemi NP, che implica un procedimento per tentativi assai poco algoritmico, ne rende improbabile l'equivalenza a quelli di tipo P. Di conseguenza, la possibilità teorica che le classi P e NP coincidano è di solito negata in via di principio, e un problema di cui si sia dimostrata l'NP-completezza è considerato definiti vamente « insolubile ». Naturalmente, per risolvere in modo definitivo la questione sarebbe sufficiente trovare un unico problema di tipo NP che si possa dimostrare essere anche di tipo P. Nonostante la differenza tra P e NP sembri evidente, non si è finora giunti a nessun risul tato in questo senso, e tutte le prove di cui disponiamo mostrano quanto il problema sia difficile. Noto come congettura P = NP, esso è considerato uno dei problemi aperti più significativi della moderna matematica computazionale. Parte della sua importanza deriva naturalmente dal fatto che esso ha attinenza con molti problemi pratici (ma bisogna essere cauti, poiché tali questioni non sono mai semplici) . È dunque tempo di tornare alla realtà.

Ritorno alla realtà: la programmazione lineare La teoria appena descritta, sebbene fornisca informazioni pre ziose, non offre sempre un quadro accurato dei campi a cui è appli cata. In teoria, un algoritmo può essere esponenziale, cioè « inef ficiente », ma nella pratica, con dati semplici, può funzionare molto bene . L' andamento esponenziale può manifestarsi solo per deter minati tipi di dati che non si incontrano comunemente; in un certo senso il problema del commesso viaggiatore rientra in questa cate goria. I metodi di cui disponiamo, che sono senza dubbio espo-

L ' EFFICIENZA DEGLI ALGORITMI

295

nenziali per quanto riguarda il tempo di funzionamento, possono dare buoni risultati quando siano applicati a configurazioni reali di città e strade . Un esempio ancora più sorprendente del poten ziale abisso tra la teoria e la pratica è offerto dal problema della programmazione lineare, problema che ha dato vita alla cosiddetta ricerca operativa, e che ne costituisce ancora oggi uno dei temi cen trali. Questa disciplina, che ebbe origine con la seconda guerra mondiale, usa metodi matematici per affrontare problemi complessi che implicano la direzione e la conduzione di grandi sistemi di uomini, macchine, materiali e denaro nel campo dell'industria, del commercio, del governo e della difesa. La programmazione lineare è una tecnica usata per fornire una descrizione matematica, ovvero un modello, di un problema della vita reale in cui qualcosa deve essere massimizzato (ad esempio i profitti o la sicurezza) o minimizzato (ad esempio i costi o i rischi) . L' ottimizzazione richiesta si raggiunge con una opportuna scelta di valori di un certo numero di parametri, ovvero di variabili. Entrambi i fattori da ottimizzare e alcuni o tutti i parametri saranno passibili di uno o più vincoli. La parola « lineare » indica che tutte le espressioni matematiche del modello sono lineari, cioè non com portano la moltiplicazione di due o più variabili tra di loro o il loro elevamento a potenza. Nella pratica, questa limitazione non è rilevante, dal momento che la maggior parte dei problemi incon trati nella vita reale sono intrinsecamente lineari, o possono essere supposti tali senza generare errori di qualche entità. Un primo esame del problema rivela che i vincoli lineari hanno una rappresentazione geometrica naturale. I valori delle variabili che soddisfano tutti i vincoli corrispondono ai punti che giacciono entro una determinata figura geometrica: se le variabili sono due, quella figura sarà un poligono il cui numero di lati corrisponde al numero dei vincoli; se le variabili sono tre, sarà un poliedro; se sono n, sarà un politopo in uno spazio n-dimensionale (vedi cap. r o) . Naturalmente è impossibile disegnare u n politopo a quattro o più dimensioni, ma i procedimenti matematici restano semplici qua lunque sia la dimensione. Basterà un esempio elementare per chiarire quanto si è detto . Immaginiamo una ditta che produca due tipi di tessuti, A e B , usando lana di tre colori diversi. L a quantità di lana occorrente

CAPITOLO UNDICESIMO

Tabella 1 1 . 2 Quantità di lana rossa, verde e gialla occorrente per la fabbricazione di pezze unitarie di tessuto A e B, e quantità totale di cui si dispone per ciascun colore Quantità occorrente per unità di lunghezza Colore della lana

Tessuto A

Tessuto B

Quantità disponibile

Rosso

4 kg

4 kg

1 400 kg

Verde

6 kg

3 kg

1 8oo kg

Giallo

2 kg

6 kg

1 8oo kg

per una pezza di lunghezza unitaria per ciascun tipo di tessuto e la quantità totale di lana di cui si dispone per ciascun colore sono indicate nella tabella I I . 2 . Il profitto del fabbricante è di I 2 ster line su ciascuna pezza unitaria di tessuto A e di 8 sterline per il tessuto B . La domanda che ci poniamo è come debba essere usata la lana disponibile per realizzare il maggior profitto globale pos sibile. Siano x e y rispettivamente il numero delle unità di tessuto A e B che vengono prodotte. Il profitto P, espresso in lire sterline, sarà dato da P = I 2X + By. (I ] Quali sono i vincoli sui valori di x e y ? Poiché s i hanno solo I 400 kg di lana rossa e tutti e due i tipi di tessuto richiedono 4 kg di lana rossa per ciascuna unità di lunghezza, dovrà essere 4X + 4Y � 1 400.

[2]

Allo stesso modo, considerando la lana verde e gialla di cui si dispone, si avrà 6x + 3 Y � I 8oo,

2x

+

6 y � I 8oo .

Infine, poiché né x né y dovrebbero essere negativi (vincolo che è ovvio quando si considera il problema reale, ma che deve essere reso esplicito nella rappresentazione matematica) , valgono le con dizioni x ;;a: o, y ;;a: o . L a figura I I . 2 offre una rappresentazione grafica dei vincoli imposti dalle disuguaglianze [2], [3] e [4] . Qualsiasi coppia di valori

L ' EFFICIENZA DEGLI ALGORITMI

297

Figura 1 1 . 2 Programmazione lineare. La soluzione del problema della fabbricazione di tessuto.

di x e y che soddisfi tutti questi vincoli costituirà le coordinate di un punto all'interno dell' area tratteggiata, e viceversa qualsiasi punto in quest'area avrà coordinate che soddisfano le disuguaglianze [2], [3] e [4] (lo verifichi il lettore, leggendo le coordinate di vari punti interni ed esterni a quest'area) . Quindi ora dobbiamo tro vare un punto dentro l' area tratteggiata che renda la quantità P dell'equazione [ I ] più grande possibile. Tutte le rette con equazioni della stessa forma della [ I ] , per un valore fissato di P, sono parallele tra loro (due di queste, per P = I 200 e P = 2400, sono indicate nella fig. I 1 . 2 ) . È dunque abba stanza chiaro che cosa si deve fare per massimizzare P: spostare la retta del profitto (data dalla [ I ]) il più lontano possibile dal l' origine senza uscire del tutto dalla zona tratteggiata. Questo ci porta al punto indicato con B . Le coordinate di B si ottengono

CAPITOLO UNDICESIMO

facilmente con l' algebra elementare, come soluzione di un sistema di due equazioni: (250, I oo) . Quindi il fabbricante deve produrre 250 unità di tessuto A e I oo di tessuto B per ottenere il massimo profitto possibile, che è di 3 8oo lire sterline. Verrà così usata tutta la lana rossa e tutta la verde, mentre ne avanzeranno 700 kg di quella gialla (e risulterà quindi che il fabbricante non ha fatto bene i suoi calcoli prima) . Ora che il problema è stato risolto, vediamo di analizzarlo. I vincoli erano rappresentati nella figura I I . 2 tramite la regione poli gonale ABCDO del piano . Il punto di massimo era uno dei vertici del poligono, e rimaneva da stabilire quale dei cinque . In questo semplice esempio non era difficile da trovare, eppure è proprio questo il punto che rende difficoltosi i problemi di programma zione lineare più complessi, e di conseguenza più realistici . In un problema con tre variabili, i vincoli daranno origine a un poliedro tridimensionale; con n variabili si otterrà un politopo n-dimen sionale, che non si può disegnare ma che può ancora essere trat tato algebricamente . In ogni caso il problema si riduce a trovare il vertice della regione vincolare (poligono, poliedro o politopo) in cui si verifica l'ottimizzazione. Come si può fare? Potrebbero esserci milioni di vertici, per cui una ricerca sistematica è di solito fuori discussione, proprio come per il problema del commesso viag giatore. Occorre quindi un metodo diverso . Nel I 947 il matematico americano George Dantzig ne ideò uno: l'algoritmo del simplesso. In pratica, con questo metodo si parte da un vertice (qui non diremo come si trova questo vertice ini ziale) e poi ci si sposta sulla superficie del politopo, lungo i lati, da vertice a vertice. Ogni volta che si arriva a un vertice, ci saranno varie direzioni in cui procedere e vari criteri per decidere quale di queste scegliere. Il più ovvio consiste nel portarsi a un vertice che aumenta la quantità da massimizzare, o la diminuisce se è da minimizzare. A causa dell'enorme numero di percorsi possibili intorno ai ver tici di un politopo, si sa che l' algoritmo del simplesso, in teoria, è un algoritmo esponenziale, ma quando viene usato praticamente, su problemi che implicano centinaia o addirittura migliaia di varia bili, funziona molto bene, puntando direttamente verso il vertice ottimale con relativamente pochi passaggi. In verità, pare che tenda

L ' EFFICIENZA DEGLI ALGORITMI

299

ad occupare un tempo lineare: il numero di passaggi sembra essere direttamente proporzionale al numero di variabili implicate. I tipi di vincoli e i politopi ad essi associati che rendono l'algoritmo inef ficiente non si presentano molto spesso in pratica; devono essere « inventati » di proposito con lo scopo di sconfiggere il metodo del simplesso . A dire il vero, sono cosl innaturali che l'esistenza di questi problemi « artificiali » non esclude minimamente che alcune versioni dell'algoritmo del simplesso siano immediatamente uti lizzabili ogniqualvolta venga immmesso sul mercato un nuovo sistema applicativo a uso industriale o commerciale. Detto in ter mini semplici, il metodo funziona. E siste un metodo più veloce non solo nella maggior parte dei casi, ma in tutti i casi, cioè un algoritmo polinomiale? Lasciandosi guidare dall'intuito, si potrebbe pensare che, invece di trovare il vertice ottimale del politopo seguendo i lati sulla superficie del politopo stesso, dovrebbe essere più veloce « prendere una scor ciatoia » attraverso l'interno . Qui il problema è che, poiché non si sa in anticipo quale sia il vertice ottimale, non si sa in quale direzione procedere. Stando sulla superficie del politopo, se non altro, abbiamo un metodo per decidere da che parte andare a ogni passo . C ' è un modo per orientarsi una volta che si è abbandonata la superficie e ci si è inoltrati all'interno? In effetti c'è. Nel 1 970, il matematico sovietico Shor intul che una vecchia tecnica, nota come metodo di Newton, poteva essere applicata al problema della programmazione lineare, e ulteriori modifiche apportate a questa idea da Levin, Judin e Nemirovski (sempre in Unione Sovietica) condussero nel 1 976 alla formulazione del cosiddetto metodo ellissoidale. In questo metodo, la direzione del percorso da seguire attraverso l'interno del politopo viene stabi lita con l' aiuto di una sequenza di elissoidi che lo approssimano . Nel 1 979, il sovietico Khachian dimostrò che il metodo ellissoi dale funziona in tempo polinomiale. Sfortunatamente, sebbene in teoria fosse migliore del metodo del simplesso, il nuovo metodo applicato a problemi del mondo reale non presentava vantaggi rispetto al vecchio . Il lettore potrebbe dire: « Questo concetto di efficienza inte ressa solo i teorici, perché in realtà il metodo teoricamente ineffi ciente ha spesso prestazioni migliori di quello teoricamente effi-

300

CAPITOLO UNDICESIMO

dente ». Questo è proprio quanto hanno detto molti non mate matici. Dopo tutto, il problema della programmazione lineare forse era (e tuttora è) l'unico problema veramente importante della vita reale. Se vogliamo un esempio che incrini la validità della classifi cazione polinomiale/esponenziale, questo è proprio il peggiore che si possa immaginare dal punto di vista matematico. Ma all'inizio del 1 984 un altro teorico venne in soccorso della matematica. Narendra Karmarkar, un ventottenne che lavorava presso i laboratori Beli negli Stati Uniti, scoprì un algoritmo per la programmazione lineare in tempo polinomiale, che funzionava veramente bene anche nella pratica e che in molte occasioni risul tava decisamente più efficiente del metodo del simplesso (in una prova con un problema a 5000 variabili, l' algoritmo di Karmarkar risultava 50 volte più veloce) . Fu un avanzamento notevole e del tutto inaspettato . Per ottenere il suo nuovo algoritmo, Karmar kar aveva dovuto usare tecniche matematiche altamente sofisti cate, che implicano una sequenza di manipolazioni del politopo volte a dargli una nuova forma, allo scopo di trovare le direzioni preferite da seguire una volta che ci si trovi all'interno . Tuttavia, proprio come avviene nei programmi per calcolatore basati sull' algo ritmo del simplesso, dove la macchina si serve di operazioni arit metiche e non utilizza direttamente le proprietà geometriche soggia centi, nell' algoritmo di Karmarkar si tralasciano i concetti geo metrici più sofisticati a favore di una serie di operazioni su matrici. L'idea teorica di efficienza, dopo tutto, si è rivelata fondata. Inoltre, il nuovo algoritmo offre un esempio lampante di come certi concetti matematici astratti assai sofisticati, che implicano analo ghi multidimensionali di poliedri e strane deformazioni geometri che, possano portare a un prodotto concreto di importanza deter minante nel mondo reale degli affari, dell'industria e della difesa. È una fusione esemplare del puro e dell' astratto da un lato, e del mondo in cui viviamo dall' altro, nonché un buon modo per con cludere un saggio sulla >, I 40 delle simmetrie, I 2 2- 2 7 , I 3 0 immagine omomorfaftelescopica d i un, I 36 immagine puntuale di un, I 36 « mostro », 1 40 sporadico, I 3 8 teoria dei, I 3 o Heawood, formula di, I 88-9o Heegner, punti di, 87 Herman, anello di, I I 1 Hilbert: albergo di, 57 decimo problema di, I 47-49 , I 6o-63 programma di, 49 i, unità immaginaria, 7 I Ideali, teoria degli, 2 I 4 India antica, matematica nell ' , 7 3 sg. Insieme(i), 5 I calcolabile, I 5 5 di Julia, I 05-o8 di Mandelbrot , I 08- I 4 elemento d i un, 5 I sg. inevitabile, I 87 infiniti, 54 sg. numerabile, 57 potenza/delle parti, 62 ricorsivamente enumerabile, 1 5 7 sg. , I 65 teoria degli, 50-64 vuoto/nullo, 62 Integrali di linea/curvilinei, 2 2 4 Integrazione nel piano complesso, 2 2 4 Interi, 45-47 ciclotomici, 2 1 2 di Gauss, 8 2 sg. irriducibili , 83 Introductio Arithmeticae (di Nicomaco) , 32 In variante topologico, 1 89 , 2 5 7 sg. Inverso in un gruppo, I 2 7 sg. Involuzioni , 1 44 Ipercubo, 2 70 sg . Ipersfera, 2 7 I sg. Isomorfismo, 2 65

311

INDICE ANALITICO

Koch: curva di, 94 isola di, 9 1 -94 Lato di un grafo/poliedro, 1 77 sg. Legge: di cancellazione, 45 di reciprocità quadratica, 8 2 , 2 1 4 dinamica, 1 0 2 Liber Abaci (di Fibonacci) , 1 6 3 Logaritmo integrale, 2 2 9 Logica dei predicati, 5 1 Macchina d i Turing, 1 5 3- 5 7 , 285 sg. universale, 1 59 Manico, 266, 2 74 sg. Mappa, 1 7 2-74 riduzione di una, 1 83 Mappa normale, r 86 minimale, I 8 7 Matrice(i) , I 3 I - 3 3 identica, 1 3 3 invertibile/non singolare, 1 3 4 non invertibile/singolare, 1 3 4 ordine della, I 3 1 quadrate, 1 3 1 Modulo, 2 1 Monte Carlo, metodi, 2 9 Nastro d i Mobius , 2 54 sg. , 2 7 5 sg. Nodo(i), 2 5 9-69 a otto, 2 5 9 diagramma di , 2 6 o equivalenti, 2 6 1 gruppo del, 263 sg . invarianti di, 2 6 1 piano, 268 polinomi del, 267-69 primario, 2 6 1 quadruplo, 2 6o sg . , 2 67 semplice, 259 sg. semplice chiuso , 2 60 sg . , 267 sg. teoria dei, 2 50, 2 59-69 vaccaio, 268 Non-decidibilità di proposizioni matematiche, 4 1 sg. n-sfera, 2 7 7 Numeri primi, 1 5 , 67 di Mersenne, 2 3 , 3 2 Sg . , 2 1 8 distribuzione dei, 2 2 9-3 3 formula generatrice di, 1 65 sg. infinità dei, r6 sg. irregolari, 2 1 4- I 6

regolari, 2 1 4 - 1 6 teorema dei, 2 3 1 Numero(i) : complessi, 48, 7 1 , 76-8 I composti, I 5 d i Bernoulli, 2 I 5 di Feigenbaum, 1 06 di Fermat, 2 7-30 di Fibonacci, vedi Fibonacci di incroci, 2 6 1 sg. di Mersenne, 2 5 , 3 3 d i Skewes , 2 3 0 , 2 3 2 divisibili d a quadrati, 2 3 6 ideali, 2 1 3 sg. immaginario, 7 1 , 76 sg. irrazionale, 68, 76 liberi da quadrati, 2 3 6 naturali, 1 4 , 7 1 negativi, 7 3 sg . perfetti, 3 1 razionali, 48, 7 2 reali , 48, 74-76 teoria analitica dei, 67, 2 2 1 sg. teoria dei, 30 transfiniti, 5 5 triangolare, 3 3 Numero d i classi, 85 problema del, 83-87 Omotopia, 2 8 1 Ottonioni , 8 2 n:, 6 8 n:(n), r 6 , 2 2 9-33 Parte: immaginaria, 77 reale, 7 7 Permutazione, 1 4 1 dispari , 1 4 1 pari , 1 4 1 Piano: complesso, So sg. proiettivo , 2 7 5 Pitagorici, 3 1 Poliedri regolari, 2 7 3 Poligono, 3 1 , 2 9 7 sg. regolare, 3 1 Politopo, 2 7 3 , 298 Pollard, metodo di fattorizzazione di, 2 9 Postulato, vedi Assioma Problema: dei quattro colori, 1 67-7 1 del commesso viaggiatore, 2 88-90

3I2 del continuo di Cantor, 4 I , 5 S-6 I NP, 2 9 I sg. NP-completo, 2 9 2 -94 P, 2 9 I Problemi decisionali, 2 9 I Programmazione lineare, 2 9 3 , 295 Prolungamento analitico , 2 3 I Proprietà: commutativa, 44 sg. distributiva, 45 Proprietà associativa: dei gruppi, 1 26, 1 2 8 dei numeri, 44 sg. Pseudoprimi , 20 Quaternioni , S I -S3 Radianti, 2 2 3 Radicali, u 6 , I J I soluzione per, u 6 , I 4 3 Radice numerica, 3 3 Regresso all'infinito, 2 04-06 Retta reale, 59, So Riducibilità, I SS Riemann: ipotesi di, I 47 , 2 2 7 sg. , 2 3 2-36, 2 4 I ipotesi generalizzata di, S6 Riflessione, I 2 0 sg . Russell, paradosso di, 5 2 sg. Scaricamento, procedura di, I 9 2 -94 Scuola: ionica, 7 I pitagorica, 7 I Seno, 2 2 3 Serie infinite, 2 2 3 Setacciatura, 2 7 Siegel, disco di, I I I Sierpinski : spugna d i , 97 sg. tappeto di, 97 Simmetria(e) , I 2 o- 2 2 asse di, I 2 I assiale, I 2 I di rotazione, I 2 2 Sistema: crittografico, 35 dinamico, I 0 2 RSA, 3 S Sottogruppo, I 3 0 Sottoinsieme, 62 Spigolo, I 77 sg.

INDICE ANALITICO

Struttura differenziabile, 2 So Superficie/Faccia, 2 5 2-54 chiusa, 253 non orientabile, 2 55 orientabile, 2 5 5 standard, 274 sg. Tempo: esponenziale, 2S6 sg. polinomiale, 2 S6 Teorema: dei cinque colori, I SI -S6 della fattorizzazione unica, S3 di C antor, 6I sg. di classificazione dei gruppi finiti semplici, I I5 di Feit-Thompson, I 4 3 sg. di incompletezza di Godei, 49 sg. di Pitagora, 73 di Proth, 2 S fondamentale dell' algebra, 7 9 fondamentale dell' aritmetica, I 5 , S 3 Teorema ultimo d i Fermat, I 9 7 primo sottocaso del, 2 0 7 secondo sottocaso del, 2 0 7 Terna pitagorica, 2 0 I primitiva, 2 0 2 Test: ARCL, I9 di Fermat, I 9 sg. di Lucas-Lehmer, 2 4 , 33 di primalità, 1 S- 2 2 Topologia, 249-S3 Trasformazione: continua/topologica, 250 identica, I 2 3 rigida, 256 Triangolo: isoscele, I 2 o pitagorico, 204 Varietà, 270, 279 differenziabile/liscia, 2So teoria delle, 2 5 0 , 2 79-S3 Verhulst, processo di, I03 sg. Verità in matematica, 47 sg. Vertice, I 77 Wolfskell, premio, 2 2 0 Zermelo-Fraenkel, teoria degli insiemi di, 5 3 sg.

È difficile, per il profano, pensare alla matematica come a una disciplina in continua evoluzione: la scienza esatta per eccellenza, immutabile dai tempi di Newton (o forse di Euclide), non sembra ammettere al suo interno né ricerca, né progresso. Scopo dichia rato di Keith Devlin è sfatare questo luogo comune, mostrando al pubblico dei non specialisti in quali direzioni si sia mossa la ricerca matematica negli ultimi decenni. Il panorama è ampio e differenziato: ad argomenti ormai classici, come il teorema di Fermat o la teoria dei frattali, Devlin non esita ad affiancare settori meno conosciuti della disciplina. Ecco quindi fare la loro comparsa i «gruppi finiti semplici», la «funzione zeta di Riemann» e altri affascinanti oggetti matematici, che si pre stano a essere «scoperti» anche dal lettore munito di un bagaglio essenziale di conoscenze. Scritta da un matematico professionista con grandi doti di divul gazione, quest'opera tenta di colmare la distanza tra il linguaggio della ricerca e il bisogno di informazione del pubblico, in un'epo ca in cui la matematica sembra permeare di sé, con i suoi metodi e modelli, l'intero discorso della scienza. Keith Devlin, matematico assai attivo nel campo della ricerca, ha insegnato in varie università inglesi e nordamericane. Al suo lavoro scientifico ha sempre affiancato un'intensa attività di divulgazione, apparendo alla

BBC e

scrivendo

per vari quotidiani (tra cui il «Guardian», dove ha una rubrica fissa). Questo è

il suo nono libro.

ISBN 88-339-0840-2

9

Il 1111111

788833 908403