L’infinito nella scienza. Infinity in science

Atti del convegno "L'infinito nella scienza", Roma, 7-11 gennaio 1986, Istituto della Enciclopedia Italia

774 109 7MB

Italian, English, French Pages 300 [304] Year 1987

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

L’infinito nella scienza. Infinity in science

Table of contents :
L’infinito nella scienza......Page 3
Colophon......Page 6
Indice......Page 7
Giuliano Toraldo di Francia, L’infinito in una scienza finita......Page 9
Ilya Prigogine, The Open Universe......Page 19
Carlo Rubbia, L’infinito: riflessioni di un fisico......Page 31
Bernard d’Espagnat, Le problème des infinis en physique, obstacle ou indice?......Page 49
Paolo Budinich, L’horror infiniti nella fisica......Page 57
Tullio Regge, L’infinito e le simmetrie......Page 75
Max Jammer, Zeno’s Paradoxes Today......Page 83
Gabriele Lolli, Il formalismo e l’infinito......Page 99
Jens Erik Fenstad, The Discrete and the Continuous in Mathematics and the Natural Sciences......Page 113
Elliot Mendelson, Infinity in Set Theory......Page 129
Jean-Yves Girard, L’infini en logique: autour du concept d’entier......Page 143
Solomon Feferman, Infinity in Mathematics: Is Cantor Necessary?......Page 153
Vincenzo Cappelletti, L’infinito e il problema della forma......Page 213
Alistair C. Crombie, Infinite Power and the Laws of Nature: A Medieval Speculation......Page 225
John North, Eternity and Infinity in Late Medieval Thought......Page 247
Nicola Badaloni, L’infinito nel Rinascimento: Giordano Bruno fra gli’antichi’ e i’moderni’......Page 259
Valerio Verra, L’infinito della ragione......Page 275
Giulio Giorello, Il’disgusto dell’infinito’ e il rigore del Calcolo......Page 285

Citation preview

ACTA ENCYCLOP!EDICA

7

Questa collana si pubblica con il coordinamento editoriale e redaziona/e di Gianni Eugenio Viola. Redattrice responsabile Rosa/ba Lanza.

L'INFINITO NELLA SCIENZA INFINITY IN SCIENCE

A cura di Giuliano Toraldo di Francia

ISTITUTO DELLA

ENCICLOPEDIA ITALIANA FONDATA DA G. TRECCANI

© PROPRIETÀ ARTISTICA E LETTERARIA RISERVATA Copyright by Istituto della Enciclopedia Italiana, fondata da Giovanni Treccani, Roma

1987

Edito dall'Ufficio Attività Culturali dell'Istituto della Enciclopedia Italiana In redazione, Rosa/ba Lanza e Franca Rovigatti

14796-1 - Stabilimenti Tipolitografici «E. Ariani>> e «L'Arte della Stampa>> della S.p.A. Armando Paoletti - Firenze

Indice

Giuliano Toraldo di Francia, L 'infinito in una scienza finita . . . . . .

Pag.

7

Ilya Prigogine, The Open Universe

»

17

Carlo Rubbia, L 'infinito: riflessioni di un fisico . . . . . . . . . . . . . . . . .

»

29

»

47

Paolo Budinich, L'horror infiniti nella fisica . . . . . . . . . . . . . . . . . . .

»

55

Tullio Regge, L 'infinito e le simmetrie

»

73

Max Jammer, Zeno 's Paradoxes Today

»

81

Gabriele Lolli, Il formalismo e l'infinito . . . . . . . . . . . . . . . . . . . . . .

»

97

Jens Erik Fenstad, The Discrete and the Continuous in Mathematics and the Natura! Sciences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

»

111

Elliot Mendelson, Infinity in Set Theory . . . . . . . . . . . . . . . . . . .. . .

»

127

Jean-Yves Girard, L 'infini en logique: autour du concept d'entier

»

141

Solomon Feferman, Infinity in Mathematics: Is Cantar Necessary?

»

15 1

Vincenzo C appelletti, L 'infinito e il problema della forma . . . . . . . .

»

211

. . . . . . . . . . . . . . . . . . . . . . . . ... . . . . . . . . . . . ... .

»

223

John North, Eternity and Infinity in Late Medieval Thought . . . . . . .

»

245

chi ' e i 'moderni' . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

»

257

V alerio Verra, L 'infinito della ragione . . . . . . . . . . . . . . . . . . . . . . . .

»

273

Giulio Giorello, Il 'disgusto dell'infinito ' e il rigore del Cakolo . . . .

»

283

Bernard d'Espagnat, Le problème des infinis en physique, obstacle ou indi-

ce?

Alistair C . Crombie, Infinite Power and the Laws o/ Nature: A Medieval

Speculation

Nicola Badaloni, L 'infinito nel Rinascimento: Giordano Bruno fra gli 'anti-

5

Questo volume raccoglie, in forma parzialmente ampliata e con alcune variazioni nel­ l'ordine di presentazione, i testi illustrati in occasione del Convegno su «L'infinito nella scienza» tenuto si in Roma tra il 7 e l' 1 1 gennaio 1986 e organizzato dall'Istituto della Enciclopedia Italiana e dall' Istituto Gramsci. L'Ufficio Attività Culturali della Enciclopedia Italiana e la Sezione di Teorie e Metodi della scienza dell' Istituto Gram­ sci (diretta da Antonio Di Meo) hanno assicurato il coordinamento dei lavori che si sono avvalsi della direzione scientifica di Giuliano Toraldo di Francia .

Giuliano T oraldo di Francia •

L'infinito tn una scienza finita

Scrisse Blaise Pasca! nei Pensieri (1 ) : «L'uomo non è che una canna, l'essere pm debole della natura; ma è una canna che pensa». Nello stesso spirito e con lo stesso ammirato stupore si potrebbe dire: «L'uomo è un essere finito; ma un essere finito che può pensare l'infinito». Nel passo citato Pasca! così prosegue: Non occorre che l'universo intero si armi per schiacciarlo; un vapore, una goccia d' acqua bastano per ucciderlo. Ma quand' anche l'universo intero lo schiacciasse, l'uo­ mo sarebbe sempre più nobile di ciò che lo uccide, perché sa di morire; mentre, del vantaggio che ha su di lui, l'universo non sa niente.

Ebbene oggi noi siamo arrivati a capire che questo universo potrebbe essere infinito, ma può essere finito. Sappiamo che è in espansione e che l'espansione po­ trebbe proseguire all'infinito o arrestarsi e tornare indietro. E abbiamo fondata fidu­ cia che fra qualche anno o decennio saremo in grado di risolvere il dilemma. Sappia­ mo che se l'universo fosse infinito e statico avremmo da fare i conti con il cosiddetto paradosso di Olbers, per cui il cielo notturno dovrebbe avere splendore infinito (o, più realisticamente, lo splendore del sole). Tutte queste cose sappiamo. L'universo invece non le sa. Abbiamo detto che l'uomo può pensare l'infinito. Ma siamo sicuri che sia così? Si tratta di un vero e proprio 'concetto' , di qualche cosa che possiamo afferrare e intuire nelle sue qualità distintive, oppure della mera 'negazione' di un concetto, come è suggerito dalla stessa denominazione (d-peiron in greco, injinitum in latino e nelle lingue derivate, un-endlich in tedesco, e così via)? Non c'è dubbio che per molto tempo questa negatività sia apparsa proprio come la connotazione saliente dell'infinito. Ma, paradossalmente, essa può anche risultare motivata, o almeno suggerita, da una contraddittorietà del 'finito' e dalla conseguente impossibilità di pensare chiaramente quest'ultimo. È infatti il finito che con la sua 'delimitazione' sembra necessariamente rimandare all"altro-da-sé' e quindi alla pro­ pria negazione. Esemplarmente dice Lucrezio nel De rerum natura (2) : Ammettiamo che Io spazio tutto sia finito. Se qualcuno corre all'ultimo confine di esso e scaglia una freccia veloce, ti sembra che essa, lanciata con grande forza, vole(l) B. Pascal , Les Pensées, qui cit . d all a trad . it.: I Pensieri, Torino 1 962, p. 3 7 7 . (2) Lucrezio, D e rerum natura, qui cit . d alla ed . Mil ano 1978, vol . l , p . 970.

7

rebbe lontana al bersaglio, oppure pensi che qualche ostacolo la fermerebbe? O l'uno o l' altro devi accettare. Ma l'uno e l'altro ti tolgono ogni scampo e ti costringono ad ammettere che l'universo si estenda senza fine. Infatti, sia che qualcosa impedisca al dardo di giungere al bersaglio e di conficcarvisi, sia che esso esca fuori, vuoi dire che non è partito dal confine.

E di qui, come è noto, si arriva dritti dritti alla prima antinomia della ragion pura di Kant. Ad ogni modo, a parte gli atomisti - ai quali appunto appartiene Lucrezio - sia i filosofi, sia gli scienziati antichi sembrano aver avuto una sorta di terrore religioso dinanzi all'infinito. La natura puramente negativa del concetto è da essi messa in luce mediante la fondamentale distinzione fra 'infinito potenziale' e 'infinito attuale' . Del primo infatti - sia che si tratti di enumerazione, o di movimento, o di costruzione - si parla come di qualcosa che si può continuare quanto si vuole senza essere interrotti, mentre del secondo si parla come di un concetto completo in se stesso e determinato. Ma, come afferma Aristotele nella Metafisica (3 ) , non è in gioco qui l'ordinaria distinzione fra ciò che è in 'potenza' e ciò che è in 'atto ' . Infatti «quello che s i vede» viene così chiamato «O perché s i vede o perché s i può vedere; ma l'infinito esiste in potenza non perché possa mai esistere in atto; è separa­ bile solo nella conoscenza». Naturalmente all'infinitamente esteso fanno riscontro - all' altro estremo della scala delle grandezze - l'infinitamente piccolo e l'infinitamente divisibile. E qui è ben noto quale enorme impatto abbiano avuto sulla filosofia e sulla scienza i para­ dossi di Zenone. Oggi, per chi conosca la meccanica quantistica, tali paradossi hanno perduto molta della loro forza, in quanto si appoggiano a ipotesi fisicamente impropo­ nibili. Per esempio, la localizzazione di un corpo (particella) in punti sempre più vicini fra loro è impossibile; fra l'altro perché esigerebbe che si avesse a disposizione un'energia infinita, ciò che è assurdo. Ma già nella fisica classica si doveva essere fortemente perplessi sulla validità di alcune argomentazioni. Per esempio, nella «dico­ tomia», come pure nell' «Achille e la tartaruga», appariva singolare che chi ammetteva tranquillamente che una lunghezza finita fosse infinitamente divisibile, dovesse poi credere che un intervallo di tempo infinitamente diviso fosse necessariamente infinito. Comunque la matematica moderna, dopo secoli di timida perplessità dinanzi all'infinito, finì per trovare modi - almeno apparentemente - ragionevoli per trat­ tarlo e per riconoscerne quindi la legittimità. Le vie per giungere a questo traguardo sono state molte. Ma vale la pena di metterne in risalto una molto importante, che spesso viene ignorata. Si tratta della scoperta della prospettiva da parte degli artisti del Rinascimento. Fino a che si dice che due rette convergenti che 'convergono sempre meno' s'incontrano in un punto sempre più lontano e si aggiunge che quando diventano parallele non s'incontrano più, si fa una netta distinzione qualitativa fra un infinito potenziale e un infinito in atto. Infatti nel primo caso il punto d'incontro, anche se lontano quanto si vuole, esiste, mentre nel secondo caso non esiste più. Ma, una volta scoperto il 'punto di fuga' , in cui sulla tela del pittore s'incontrano rette che nella scena reale sono parallele, ci si convince che la differenza fra un (3) Aristotele, Metafisica, 1048 b .

8

punto al finito e il punto all'infinito di una retta è puramente contingente, in quanto dipende solo dalla scelta del piano sul quale s'intende proiettare. Come si fa a dire che il punto all'infinito non esiste, quando se ne può addirittura dipingere l'immagi­ ne? Nasce così la geometria proiettiva, nella quale appunto i punti e le rette all'infini­ to hanno identica cittadinanza di tutti gli altri punti e rette. E, del resto, quando nasce l'ottica geometrica, si riconosce con lo stesso procedimento che le immagini all'infinito e le immagini al finito hanno identico statuto e sono convertibili le une nelle altre mediante una semplice lente. Insomma l'infinitamente grande e l'infinita­ mente lontano cessano di far paura e se ne affronta la trattazione. Galileo ha già idee chiare sull'infinito numerabile, come quando nei Dialoghi delle nuove scienze (4) afferma: Ma se io domanderò quante siano le radici [quadrate], non si può negare che elle non siano quanti tutti i numeri, poiché non vi è numero alcuno che non sia radice di qualche quadrato; e stante questo, converrà dire che i numeri quadrati siano quanti tutti i numeri, poiché tanti sono quante le lor radici, e radici son tutti i numeri.

È chiaro qui il concetto della 'corrispondenza biunivoca' , che tanta importanza avrà nella matematica moderna. Ora soprattutto a Galileo si può far risalire quell'intima fusione fra matematica e scienze della natura, che, se da un lato ha potuto celebrare innumerevoli trionfi, dall' altro ha portato anche a qualche pericoloso equivoco, proprio dove entra il con­ cetto d'infinito. Tutti sanno che nel Saggiatore ( 5 ) Galileo aveva scritto: La filosofia è scritta in questo grandissimo libro che continuamente ci sta aperto innanzi agli occhi (io dico l'universo) , ma non si può intendere se prima non s'impara a intendere la lingua e conoscere i caratteri ne' quali è scritto. Egli è scritto in lingua matematica, e i caratteri son triangoli, cerchi e altre figure geometriche, senza i quali mezi è impossibile a intenderne umanamente parola.

Non c'è da meravigliarsi che Newton e Leibniz seguissero le orme di Galileo e che quindi, nel creare il calcolo differenziale, credessero di andare scoprendo pro­ prio quella 'lingua matematica' che è insità nella natura. Tanto più che le immediate applicazioni del calcolo alla fisica ottennero folgoranti successi. Semmai le perplessità nascevano proprio dal lato della matematica. I procedimen­ ti dei grandi iniziatori apparivano poco o punto rigorosi e la nozione di 'infinitesimo' destava forte sospetto. Ma il paziente e acutissimo lavoro di Cauchy, Weierstrass e tanti altri matematici del secolo passato valse a chiarire quasi tutti i punti controver­ si e a pervenire - attraverso il fondamentale concetto di 'limite' - a un tutto accettabile. Oggi poi, con la cosiddetta 'analisi non standard', si arriva perfino a parlare legittimamente di infinitesimi attuali. Anche l'infinito vero e proprio sembrò diventare attuale con la teoria degl'insie­ mi di Georg Cantor. Un insieme è infinito quando i suoi elementi possono mettersi in corrispondenza biunivoca con quelli di una sua parte, proprio come abbiamo visto (4) G. Galilei, Dialoghi delle nuove scienze, giornata I. (5) Idem, Il saggiatore, 6 .

9

chiaramente riconosciuto da Galileo per l'insieme dei numeri naturali. Ma Cantor mostrò che si può andare al di là dei numeri naturali, costruendo i cosiddetti numeri ordinali e cardinali 'transfiniti' . Inoltre fece vedere che esistono insiemi che vanno al di là del 'numerabile' , cioè insiemi i cui elementi non possono essere messi in corrispondenza biunivoca con i numeri naturali. Tale per esempio è l'insieme 'conti­ nuo' dei numeri reali o quello dei punti di una retta. La teoria degl'insiemi si annunciava ricchissima di promesse, tanto che si pensò possibile fondare su di essa tutta la matematica. Per questa via si mise decisamente Gottlob Frege. Ma nel 1 900 successe un guaio. Un principio fondamentale di Cantor era quello di 'comprensione' , per cui, data una proprietà qualsiasi, esiste sempre un insieme di enti che hanno quella proprietà. Tuttavia Bertrand Russell scoperse un famoso controesempio; infatti «essere un insieme che non contiene se stesso come elemento» è una proprietà per la quale non esiste affatto un insieme di elementi che ne godono. Ancora una volta l'infinito creava antinomia, e tutta la teoria veniva messa in crisi. Non è possibile qui illustrare adeguatamente le grandi 'scuole' - come formali­ smo, predicativismo, costruttivismo, intuizionismo - e le loro ramificazioni che in vario modo si dettero ad affrontare la crisi. Ma vale la pena di sottolineare che tutti questi studi fondazionali, lungi dal fornire alla matematica un necessario 'sup­ porto' senza il quale non avrebbe potuto proseguire, vennero ben presto a costituirsi in un' affascinante disciplina autonoma, quella appunto dei 'fondamenti' della mate­ matica e della logica. Quanto alla matematica stessa non si può proprio dire che essa fermasse il suo imponente sviluppo a causa di tali studi e della crisi che li aveva originati. In particolare l'infinito seguitò ad essere usato con cautela sì, ma anche con confiden­ za, portando a risultati del massimo interesse. Ci basti ricordare che Hermann Weyl (6) scriveva: «Vedo la grandezza della matematica proprio nella sua capacità di arrivare a decidere nella quasi totalità dei suoi teoremi ciò che per sua essenza è infinito con criteri finiti». E quest'affermazione rimane valida a tutt'oggi, anche se quando fu scritta ( 1 9 18) non erano ancora compar­ si i grandi teoremi limitativi di Godei, Tarski e Church e non si sapeva ancora per certo che esistono enunciati indecidibili. Ma torniamo alla fisica. Era inevitabile che la dottrina galileiana della lingua della natura e gli strepitosi successi del calcolo differenziale applicato alla meccanica celeste portassero a creare un 'mito ' , che forse non è ancora interamente sfatato. Si tratta dell'idea che all'infinita divisibilità matematica e al continuo dei numeri reali corrisponda necessariamente qualcosa nella realtà fisica. Nasceva così la teoria dei 'mezzi materiali continui' , che obbediscono a precise equazioni differenziali a derivate parziali; concezione che si trasformò poi - solo con inessenziali modifiche - nella più moderna teoria dei 'campi ' . E nelle mani di alcuni grandi teorici il modello del 'continuo fisico' arriverà a molti e brillanti successi. Ora tutta questa costruzione porta, fra l'altro, una conseguenza di capitale im­ portanza. Si tratta della convinzione che - almeno in teoria - il risultato di una misura possa essere infinitamente preciso, sì da concretarsi in un numero reale. Sup(6) H . Wey l , Das Kontinuum, qui cit. dalla trad . it . : Il continuo, Napoli 1977, p. 83 .

lO

poniamo per un momento che ciò sia vero. Se tutto è perfettamente 'determinabile' , vuoi dire che nella natura tutto è perfettamente 'determinato' . E di qui al più rigoro­ so determinismo - in base alle leggi classiche della meccanica - il passo è breve. Non fa meraviglia che Laplace Cl arrivasse ad affermare: Un' intelligenza che , a un istante dato, conoscesse tutte le forze da cui la natura è animata e la situazione rispettiva degli esseri che la compongono, se fosse abbastan­ za vasta da sottomettere questi dati al calcolo, abbraccerebbe nella stessa formula i movimenti dei più grandi corpi dell' universo e quelli del più leggero atomo : niente sarebbe incerto per essa e l ' avvenire, come il passato, sarebbe presente ai suoi occhi.

È chiaro che qui Laplace dava per inteso che quell' «intelligenza» potesse conosce­ re tutti i dati dell'universo con 'infinita precisione' . Ma, una volta messi su questa strada, si può arrivare a concezioni anche più meravigliose. La matematica dell'Ottocento annovera fra le sue più eleganti creazioni la teoria delle 'funzioni analitiche' . Una funzione analitica è infinitamente derivabile ed ha la proprietà che basta conoscerne l' andamento in una ragione finita, comunque picco­ la del piano complesso per conoscerla ovunque. Ora, poiché le soluzioni delle equazio­ ni differenziali a cui obbediscono i mezzi continui sono analitiche, può nascere addi­ rittura il sospetto che basti conoscere una regione finita del mondo fisico per conosce­ re tutto l'universo! Si avvererebbe così il sogno razionalistico di Leibniz, che affermava (8): Ogni corpo viene influenzato da tutto quello che avviene nell' universo, in tal modo che colui che vede tutto potrebbe leggere in ciascuno quel che avviene dovunque ed anche quel che è avvenuto o che avverrà, notando nel presente quel ch'è lontano, sia per tempo , sia per luogo .

Forse - chissà - sarebbe bello che il mondo fosse fatto così; ma si dà il caso che 'non è' fatto così . In realtà sarebbe stato possibile accorgersi che le cose andavano diversamente, anche prima di giungere all'atomismo moderno e alla conseguente meccanica quanti­ stica. Bastava non lasciarsi trasportare da eccessivi entusiasmi galileiani per la 'lingua della natura' e comprendere la fondamentale differenza che c'è fra la matematica e la fisica. Quest'ultima - come del resto aveva insegnato lo stesso Galileo è una scienza sperimentale, che, se anch& fa uso delle «certe dimostrazioni» non può non partire dalle «sensate esperienze», per poi tornare ad esse. E per uno sperimentatore che cosa può essere 'attuale', se non ciò che è 'attuabi­ le' , ovvero raggiungibile con una sensata esperienza? Eppure il concetto che non sia possibile 'estrapolare' a cuor leggero dal dominio dello sperimentabile a quello del non sperimentabile tardò molto a farsi strada. È vero che quando tale concetto fu ben compreso venne forse un po' esagerato nella portata, come quando Moritz Schlick si lasciò andare ad affermare (9): «Il significato di una proposizione è il me­ todo della sua verifica». Se fosse da accettare questa concezione, è evidente che (') P. Laplace, Théorie analytique des probabilités, Paris 1812, p. l. (8) G. \V!. von Leibniz, Monadologie, qui cit. dalla trad. it.: La monadologia, Bari 1975, p. 61. (9) M. Schlick, Allgemeine Erkenntnislehre, Berlin 1925, p. l.

11

l'infinito (attuale, ma anche potenziale) in fisica 'non avrebbe significato' , perché non è mai verificabile. Ma, anche volendo attenuare il drastico giudizio riguardo al 'significato' , sta di fatto che l'infinito non è sperimentabile. Non si pensi che la posizione qui sostenuta sia uno stretto 'fenomenismo' , come quello che arrivava a negare l'esistenza degli atomi perché non sono visibili o palpabi­ li. No, non si tratta di questo. Diamo per scontato che la sperimentabilità possa aver luogo - anzi, che oggi di regola abbia luogo - attraverso un lunga e complicata catena operativa. Ma sta il fatto che l'infinito non è sperimentabile nemmeno in questo modo. Per cominciare dai procedimenti elementari della sperimentazione, ricordiamo che 'il risultato di una misura non è mai un numero reale' , ma un intervallo di numeri reali. L'estensione di tale intervallo dipende dagli strumenti adoperati; può essere piccola, ma mai zero. La conseguenza è che una misura ci fornisce sempre un'informazione 'finita' (un numero finito di bit) riguardo al mondo fisico. Ma gli estrapolatori si finsero con disinvoltura un mondo in cui 'esiste' veramente un nume­ ro reale, risultato della misura, anche se - per una circostanza che reputavano quasi trascurabile - i nostri strumenti introducono sempre un 'errore' che c'impedisce di conoscerlo. Si venne cosl a creare l'immagine fuorviante di una fisica che in realtà non esisteva e non poteva esistere ( 1°) : una scienza nella quale era possibile - almeno in linea di principio - desumere una quantità infinita d'informazione riguardo a un sistema finito. Nessuno sembrava domandarsi se quel sistema 'contenesse effetti­ vamente' infinite informazioni. Si dava per scontato. La fisica dei numeri reali ha imperversato nelle speculazioni di molti filosofi della scienza, conducendo non di rado ad aporie (sembrava di essere tornati ai tempi di Zenone) o a risultati sconcertanti. A volte si arrivava ad affermare, più o meno apertamente, che la fisica non era possibile e che qualunque teoria è falsa in partenza! Questa fisica immaginaria sembrava a molti cosl bella, che dispiaceva abbando­ narla. Ha scritto Otto Frisch ( 11 ) a proposito dell' applicazione del calcolo diffe­ renziale: I fisici si rallegravano della loro crescente abilità di risolvere problemi piuttosto artifi­ ciali quali le vibrazioni di una piastra di metallo elastica di forma, diciamo, rettangola­ re o ellittica. Se questa piastra fosse stata un insieme di innumerevoli atomi si sareb­ bero potuti sviluppare nuovi metodi matematici, più complessi e meno eleganti. Per­ ché andare in cerca di guai?

Ed Erwin Schrodinger diceva nel 1950 ( 1 2 ) : Se si considera lo sviluppo della fisica durante gli ultimi cinquant' anni, si riceve l'impressione che l' aspetto discontinuo della natura ci sia stato imposto contro la nostra volontà. Pare che ci trovassimo assai bene col continuo.

( 10) (1 1) 1 98 1 , p. ( 1 2)

C fr. G. Toraldo di Francia, L'indagine del mondo fisico, Torino 1 976, p. l. O. R. Frisch , What Little I Remember, qui cit. d alla trad . it. : La mia vita con l'atomo, Roma 17. E. Schri:idinger, Science and Humanism: Physics in our Time, qui cit . d all a trad . it . : Scienza e umanesimo, Firenze 1970, p. 5 7 .

12

In realtà quest'ultima affermazione va intesa solo in senso ironico. Col continuo finiamo quasi sempre per trovarci male. Cominciarono nel secolo scorso Rayleigh e Jeans, che basandosi sul continuo classico per calcolare la radiazione di un corpo nero, si scontrarono con l'assurdo risultato di una radiazione che diventava infinita nell'ultravioletto. Quella difficoltà, come è noto, fu superata soltanto quando Max Planck introdusse una speciale - e a quei tempi incredibile - 'granularità' dell'ener­ gia. Ma anche dopo che la meccanica quantistica fu ben stabilita, ci si trovò a combattere una quasi perenne battaglia contro gl' 'infiniti' , che sembravano scaturire inesorabilmente dalla natura stessa dei campi, sia pure quantizzati. Con frase scherzo­ sa, si potrebbe dire che l'infinito colpiva ancora. Molte di quelle difficoltà furono superate con accorgimenti ingegnosi, ma forse è azzardato dire che la battaglia è terminata. Piuttosto vale la pena di fare una considerazione sulla portata del metodo quanti­ tativo nella fisica e sulla sua reale attualità al giorno d'oggi. Più di un secolo fa la matematica fece una scoperta di capitale importanza. Precisamente ci si accorse che l'algebra poteva avere un significato molto più esteso di quello fin ll usuale di una trattazione schematica delle operazioni fra i numeri e fra le quantità. Quest'ul­ tima è solo una possibile 'interpretazione' . L' algebra astratta può invece concernere relazioni molto più generali, suscettibili di interpretazioni molto diverse. Seguendo questa strada, George Boole arrivò a mostrare che le stesse leggi della logica - che di per sé ben poco ha a che fare col quantitativo - si possono tradurre in un insieme di operazioni algebriche. Ed è inutile ricordare quali importantissime conseguenze ebbe tale intuizione. Un fenomeno in qualche modo analogo si è verificato nella fisica a metà del secolo presente. Ci si rese conto che lo studio della fisica tutta, ma in particolare quello delle particelle subatomiche, si può basare in gran parte sui risultati generalissi­ mi della teoria dei gruppi e sulle leggi della simmetria. E per questa strada furono ottenuti alcuni dei più brillanti risultati. Tuttavia non è da pensare che l'introduzione delle simmetrie potesse valere a scacciare totalmente dalla fisica le considerazioni quantitative e i pericoli dell'infini­ to. Fra l' altro, è chiaro che anche l'accertamento delle simmetrie non può non passare attraverso la sperimentazione e l'esecuzione delle misure quantitative. Ad ogni modo la scoperta degli atomi - se questi ultimi avessero realmente corrisposto all'etimologia del termine - avrebbe potuto risolvere (negativamente) il problema dell'infinita divisibilità della materia. Ma tutti sanno che ciò non avven­ ne. L'atomo si rivelò costituito di nucleo ed elettroni; il nucleo è costituito di nucleo­ ni, i nucleoni di quark. . . e nessuno può garantire che siamo alla fine. Anzi oggi si sospetta che si debba procedere ulteriormente. Eppure non si tratta di quello che molti credono, cioè di quello che Jonathan Swift esprimeva in questi termini ( 13 ) : «Così i naturalisti .osservano che una pulce ha delle pulci più piccole che la tormentano e queste delle pulci ancora più piccole che le pungono, e così procedendo all'infinito». Nel nostro caso non avrebbe molto senso dire che si tratta sempre di «pulci», cioè di oggetti qualitativamente sempre eguali, che divengono sempre più «piccoli». Fra l'altro sorge un curioso problema, (ll) J. Swi ft, On Poetry, Ox ford 1920, p. 337.

13

che Poincaré avrebbe forse detto d"impredicatività' . Per definire una nuova particel­ la, proprio perché la si chiama 'particella' , si fa uso dell'insieme di cui essa è parte, cadendo in un circolo vizioso. Comunque il mondo delle particelle non si lascia descrivere negli stessi termini di quello macroscopico. Per esempio, si pensi che da qualunque particella può, in opportune condizioni, scaturire qualsiasi altra particella con la quale essa è capace d'interagire. Non possiamo ora entrare in dettaglio in questa affascinante problematica. Ci basti invece osservare che dalla meccanica quantistica e dal suo principio d'indetermi­ nazione risulta che qualunque sistema fisico composto da un numero finito di particel­ le contiene solo una quantità 'finita' d'informazione. Nel linguaggio tecnico si dice che lo spazio delle fasi di un sistema di energia finita è diviso in un numero finito di celle. Le conseguenze di questa scoperta sono di portata eccezionale. Basta pensare che, essendo la molecola di DNA costituita di atomi, il codice genetico può immagaz­ zinare nei cromosomi di qualsiasi animale, compreso l'uomo, solo una quantità finita d'informazione. Forse è questa la forma più moderna del riconoscimento che l'uomo è un essere finito. A questo punto è inevitabile che sorga la domanda: ma non può la limitazione riguardare soltanto la costituzione 'fisica' dell'uomo e lasciare invece impregiudicata la sua 'creatività' , che è libera di espandersi in uno spazio infinito? Così, per esempio, assumendo una concezione 'generativista' (alla Chomski) dell' attività linguistica, non si arriva a concludere che l'uomo può formare e pronunciare un'infinità di frasi diverse? È lecito dubitarne. Bisogna infatti distinguere fra la capacità di formare una frase mai udita in precedenza e la capacità di formare un numero infinito di frasi diverse. Ora, che partendo da un vocabolario finito si possa (in un tempo finito, s'inten­ de) pronunciare solo un numero finito di frasi è cosa ovvia, naturalmente. Ma non tutti si rendono conto che le cose non cambiano anche se si ammettono le 'innovazio­ ni linguistiche' , le 'inflessioni' , i 'timbri' diversi. Un teorema limitativo della scienza delle informazioni ci assicura che in un tempo finito si può trasmettere soltanto un numero finito di messaggi diversi. Così i pezzi di musica diversi che possono stare su un disco sono in numero finito. Passando poi dall' acustico all'ottico, si conclude che i dipinti diversi che potrebbero stare su una tela sono in numero finito; e così via. L'intera specie umana, dalla sua nascita all'estinzione, ha a disposizione soltanto un numero finito di cose da dire. Ma dopo queste osservazioni, che potrebbero indurre al più pessimistico scora­ mento, vale la pena di far notare una circostanza veramente paradossale. È proprio la finitezza dell'essere umano che rende possibile, anzi indispensabile, la sua 'creatività' . In matematica pura non esistono il 'molto grande' e il 'molto piccolo' : non hanno senso. Invece rispetto a un essere finito qual è l'uomo - un essere che, come voleva Protagora, è misura di tutte le cose - tali termini acquistano un signifi­ cato perfettamente legittimo. Così, anche se è vero, come abbiamo visto, che in fisica si può avere a che fare solo con un numero finito di cose, di stati, di circostan­ ze, sta il fatto che a volte quei numeri sono troppo grandi perché l'uomo si possa sognare di dominarli col suo contare e col suo operare. Ebbene, quando abbiamo 14

a che fare con siffatti numeri 'irraggiungibili' , è indifferente per noi che siano finiti o infiniti in senso matematico. È 'come se' fossero infiniti. Ma in tal caso il nostro raziocinio, !ungi dal confessarsi impotente e rinunciare, passa ad assumere altre forme interessantissime, basate sul concetto - ancora per molti versi misterioso - di 'probabilità' . Prendiamo per esempio gli scacchi. In base alle regole del giuoco si può dimostra­ re che il numero delle partite possibili è finito. Se i giocatori potessero averle presenti tutte nella mente, uno dei due sarebbe certamente in grado di scegliere sempre la mossa che porta alla vittoria o, almeno, alla patta. Ma il numero è talmente grande che nessun uomo (e nessun calcolatore) può dominarlo. Allora che fa il giocatore? In parte - come ci aspettiamo - analizza e calcola alcune mosse, ma in parte, basandosi sulla sua esperienza, compie una valutazione di probabilità. Immagina un certo numero - molto grande, ma necessariamente finito - di 'mondi possibili' (come avrebbe detto Leibniz) e ricorda quante volte in circostanze analoghe ha avuto successo con l'uno o con l' altro. Il processo si svolge in gran parte inconsciamente. È questo che variamente chiamiamo 'intuizione' , 'fantasia' , 'creatività' . Ed è proprio questo che facciamo nella grande partita a scacchi che è la vita di tutti i giorni. Perché poi questo metodo abbia successo è forse uno dei problemi più profondi e sconcertanti della scienza della natura. Ma per non lasciare adito a troppo semplicistiche o ingenue supposizioni riguar­ do alle reali capacità umane, sarà bene osservare che la 'sperimentabilità' dell'enorme­ mente grande e dell'enormemente piccolo può essere mediata da un gran numero di passaggi estremamente ingegnosi, che ne alterano nettamente la natura rispetto a quella che il non iniziato potrebbe immaginare. Così, per esempio, il fisico moderno può permettersi di speculare su quale sarebbe stata la struttura dell'universo, ponia­ mo, lQ-32 secondi dopo il big bang o di ipotizzare che il protone possa decadere con una vita media di 1032 anni. Poiché quest'ultimo lasso di tempo è almeno mille miliardi di miliardi di volte più lungo dell'intera vita dell'universo, si potrebbe dire che si ragiona di un evento che non avverrà mai! E infatti qui c'è un artificio che consiste nel convertire - con l' aiuto della teoria - una durata assolutamente non sperimentabile in un numero enorme di protoni, sperimentabile. Grandi, grandissimi, strabilianti i numeri di cui arriviamo sensatamente a parla­ re. Eppure anch'essi sono nulla rispetto all'infinito matematico. Come abbiamo fatto a concepire quest'ultimo? E, dal punto di vista dell'evoluzione biologica, qual è per l'uomo il valore adatta­ tivo della capacità di concepire l'infinito, quando nell'ambiente in cui deve sopravvi­ vere tutto è finito? Domanda tanto più pressante quanto più riconosciamo che proprio dalla contraddizione fra la finitezza dell'uomo e la sua capacità di pensare l'infinito può nascere, come voleva Hegel, la sua «coscienza infelice». Forse presto saremo in grado di riconoscere con certezza che l'universo è finito. Eppure quegli «intermina­ ti spazi» di Giacomo Leopardi «ove per poco il cor non si spaura» continueranno a incuterei terrore. Arriviamo così alla fine proprio lì dove avevamo cominciato: allo stupore e all' ammirazione per questa «canna che pensa» l'infinito.

15

Ilya Prigogine

The Open Universe

Abstract This paper describes the road from instability to irreversibility as it appears in the frame of classica! dynamics . Por highly unstable dynamical systems such as K flows (K far Kolmogoroff), classica! dynamics involves the manipulation of an infinite information. It is the elimination of this infinite information which leads from the traditional description of dynamics in terms of groups to a description in terms of semigroups, including irreversibility. In this sense, the appearance of an arrow of time on the dynamic level corresponds to the construction of a ' finite' science aut of the amount of information present in the infinite universe.

1.

Introduction

The title of this lecture evokes Karl Popper' s remarkable essay ( l ) in which he pleads passionately far indeterminism as «a kind of prolegomenon far creativity». It is a good sign far the new convergence between science and philosphy that Pop­ per' s arguments can now be complemented by a detailed analysis based on classica! dynamics (far lack of space, we limit ourselves here to classica! dynamics) . Curiously, the road from the deterministic time-reversible view of classica! mechanics, formulated in terms of dynamical groups, to a description of classica! mechanics involving a probabilistic and time-irreversible description in terms of semigroups, goes through the recognition that classica! dynamics of unstable dynamical systems assumes infinite information (see section 2) . It is the elimination of this infinite information which leads to the semigroup description. As a result, the classica! description appears now as the singular limit of a semigroup description. This is in marked contrast with the traditional view, in which the probabilistic description was considered to be an approximation of the deterministic, time-reversible one! W e want to describe in this lecture some of the features which lead from in­ stability to irreversibility (2) . As has been shown by the previous work together with prof. B . Misra, they are: (1) K. Popper, The Postscripts to the Logic of Scientific Discovery, vol . II: The Open Universe: An Argument /or Undeterminism, London 1982. (2) C f . B. Misra, in LXXV ( 1 978), pp. 1627- 163 1 ; I . Prigogine, From Being to Becoming, San Francisco 1980; Y. E lskens and I . Prigogine, to appear in «Proc. Nat. Acad . Sci.>> ( 1 986).

17

l) For sufficiently unstable systems, there exist manifolds in phase space which have a broken time symmetry. For example, we may distinguish, as we shall see, between contracting and dilating fibers which are time-inverses one of the other (see section 4) . 2) Systems which are situated on the same contracting fiber converge towards the same phase point for t- + oo (while systems situated on the same dilating fiber converge for t--oo) .

Taking these two fundamental properties into account, we show that, for unstable systems, the idea of Gibbs ensembles corresponding to an arbitrary finite precision has to be replaced by a new type of ensemble we shall call Boltzmann ensembles. The Boltzmann ensembles satisfy semigroup Markov type of equations . I t was, o f course, always understood that exact initial conditions correspond to an idealization, but we find rather unexpected that giving up this idealization leads to so momentous consequences. In other words, the classica! deterministic scheme appears as unstable with respect to the passage from an infinite information to a finite information involving an arbitrary amount of digits (see section 6) . It is not the first time that such a situation has appeared. After all, the small parameters h, Planck' s constant, and 1/c (where c is the velocity of light) change drastically the basic structure of theoretical physics. In short, we witness here the instability of the ideai of complete knowledge, which has haunted Western science for three centuries. We see that such an ideai is only meaningful for stable dynamical systems. The message of the second law is precisely that we are living in a world of highly unstable motions, to which the classica! ideai does no t apply.

2. Classica! and Modern Dynamics Classica! dynamics rests on the notion of trajectories in phase space. H we let (w 1 w,J describe the state of a physical system, the system' s evolution is represented by a one-to-one mapping in the phase space r

w

=

• . •

St w(O)

=

w(t).

(2 . 1)

For Hamiltonian systems, and more generally for flows, the mapping St is inverti­ ble: S;-1 L1; the configuration w(O) uniquely defines all the past and future con­ figurations w(t). Modern analysis developed an alternative approach to classica! dynamics with the description of the system's state by a set of symbols s, taking values in an 'alphabet' � according to the following rule. Let us first choose a partition P of r, i.e., a set of subsets P, sE�, covering r, such that P,n P, 0 i/ s*r. Then we say that a state w is described by a symbol s if w e P, (s is a 'coarse-grained' description of w) . H we make sequential observations, say at every time t e Z, the system' s evolution defines the sequence s (sJ t e Z, of the successive symbols =

=

=

18

·

for the successive states w(t). Then the dynamics S, induces on the sequence

s

a

symbolic dynamics in the form of a 'shift' mapping

(2 .2)

This description expresses clearly the reversibility of classica! mechanics: the sequence (s,J exists once for all, and the flow of time leads to a mere relabeling of the symbols s In the study of complex systems, involving many degrees of freedom, a descrip­ tion of the system' s state by a single point w in phase space is unrealistic. W e thus resort with Gibbs to a statistica! description, by a probability measure dp. = p(w)dw over r. The physical interpretation of this ensemble is an assembly of identica! systems with the same macroscopic properties; the evolution of the ensemble is induced by the microscopic motion as •.

p,(w) = U, po(w) = po(S_, w).

(2 . 3 )

I f the mapping S, i s invertible, the evolution operators U,, -oo< t < oo , form a unitary group

U,* U, = l

U,U, = U,+,.

(2 .4)

This Koopman description of the dynamics, in terms of distribution functions or ensembles evolving by the action of the operator U,, is conjugate to the point transformation S, on r. Moreover, for Hamiltonian systems in canonica! coordinates, Liouville's theorem states that l ) The evol ution operator Ut* preserves the measure dw:

[A dw

=

.fs_,Adw

U,l

=

l.

(2 . 5 )

2) For any measure p(w)dw and function /(x):

.fr f(U, p(w))dw In

=

.fr f(p(w))dw.

(2 . 6)

particular, the Boltzmann H-functional H[p] = I p lnp dw

(2 . 7)

is constant in time. However, while the volume (the 'measure') of sets in phase

space is preserved, their shape may be highly deformed or even fragmented. This deformation or fragmentation gives then the appearance of approach to equilibrium - where all points would be uniformly distributed in the phase space. In the classica! view, the world is thus similar to a museum, in which infor­ mation is stored once for all. Time could then be compared to a patient demolition of artefacts into pieces, which are preserved and could be used to reconstruct the artefacts in full detail. For nearly three centuries after Newton, classica! dynamics appeared as a closed science enabling one to compute whatever physical quantity from first principles and well-defined initial data. This holds true, but only for a limited class of dynamical systems, for the recent developments in dynamics show that 'many' dynamical systems are unstable: in such systems, each region of phase space (whatever its size) contains 19

many diverging trajectories, so that the assimilation of a finite region of phase space (however small) to a single point becomes meaningless (3 ) . In this context, it is interesting to recall the classification of dynamical systems recently proposed by Ford, Eckhardt and Vivaldi (4) : - For > A80, 1984, p. 177.

( " ) P. Bu dinich, L. Dab rows ki, testo in el aborazione.

( 1 2 ) R. Penrose, Spinors and Space-time, Camb ridge 1984. ( 1 3 ) Storicamente, le tras formazioni di coordinate che portano sul cono dell a luce all 'in finito sono

state studiate d a P.A.M. Dirac e prima ancora da L E. Veblen. ( 1 4) C f r. nota 10.

63

Le trasformazioni conformi-speciali infinite Possiamo quindi concludere che:

i) se la simmetria conforme globale è una simmetria fondamentale della natura; ii) se vogliamo ammettere che lo spazio-tempo in assenza di massa sia piatto (senza curvatura) e che in esso valga rigorosamente sia la geometria euclidea che il principio di causalità; allora dobbiamo aggiungere allo spazio-tempo una regione (detta «cono della luce all'infinito») dove l'ordine temporale non è definibile, e che non è raggiungibile con traslazioni temporali (e spaziali) finite, e che perciò si può dire «fuori del tempo» (e dello spazio); ed esistono trasformazioni del gruppo conforme che portano i punti dello spazio-tempo ordinario in questa regione fuori del tempo, e viceversa da questa regione fuori del tempo in punti dello spazio-tempo ordinario. Naturalmente, la causalità vale nello spazio-tempo ordinario, e non vale sul cono della luce all'infinito dove trasformazioni conformi speciali possono portare. E questa non è una contraddizione, perché lo spazio-tempo ordinario ove vale la causalità è infinito o più precisamente illi mitato (!X1tttpov) , e ogni traslazione di Poincaré, co­ munque grande, non porta fuori dello spazio-tempo ordinario e per un qualsiasi siste­ ma fisico nello spazio-tempo ordinario ci vuole un tempo infinito (e velocità c della luce) per arrivare sul cono della luce all'infinito, che pertanto deve considerarsi come

fuori dello spazio-tempo ordinario a distanza di spazio e di tempo infiniti.

Cercherò ora di spiegare con semplici analogie come la teoria della covarianza conforme arrivi a queste affermazioni e come si possa renderle intuitivamente plausibili. Abbiamo detto come le trasformazioni conformi si possano anche pensare come trasformazioni di coordinate (ortogonali) in uno spazio a sei dimensioni e come lo spazio-tempo si possa immaginare come un cerchio e una sfera in quello spazio. Per passare da questo spazio curvo a quello piano, dove si svolgono i fenomeni della fisica e dove noi viviamo e pensiamo, si può usare il metodo della proiezione stereografica, che rispetta la covarianza conforme e che per semplicità illustrerò in una sola dimensione. Immaginiamo un cerchio C ed una retta T orientata passante per il suo centro O. Possiamo pensare che T rappresenti il nostro spazio-tempo (o anche il solo tempo) .

64

Tracciamo una retta ortogonale a T per O e chiamiamo N uno dei due punti dove interseca il cerchio. Proiettiamo da N i punti P della circonferenza C sui punti t della retta; basta tracciare una semiretta che parta da N e intersechi sia la circonfe­ renza in P che la retta T in t. Via via che P si avvicina ad N, t tende all'infinito positivo o negativo a seconda che P si trovi sul semicerchio destro (P, P ' ) o sinistro (P " ) . In tal modo possiamo rappresentare tutta la circonferenza C sulla retta infinita T. Più precisamente: tutta meno il punto N a cui corrisponde, sulla retta, il punto dove la retta T incontra la sua parallela per N e cioè o nessuno oppure sia + co che -co , qualora si pensi che il 'punto all'infinito' sia un punto della retta. Quindi per rappresentare tutta la circonferenza C dobbiamo prendere tutta la retta T infinita e aggiungere ad essa il limite t-+ + co che è equivalente a t--+ -co ovvero il punto ( + co, -co] (detto anche 'punto improprio') della retta che corrisponde all'unico punto N della circonferenza. Dunque abbiamo: la retta orientata e infinita T corrisponde alla circonferenza C meno il punto N. Il punto N corrisponde al punto improprio della retta dove l'orientazione (temporale) non è possibile. Supponiamo ora di eseguire delle rotazioni sulla circonferenza C. Per esempio: alla rotazione che porta P in P ' corrisponde la traslazione sulla retta che porta + t in + t ' . Dunque, a rotazioni sulla circonferenza corrispondono traslazioni sulla retta T e viceversa. Se però mi limito alla retta T, dove posso eseguire tutte le possibili traslazioni, le corrispondenti rotazioni sulla cir­ conferenza non sono tutte le possibili, perché ho escluso il punto N. Se voglio tutte le rotazioni debbo aggiungere anche N, e corrispondentemente alla retta T anche il punto improprio ( + co, -co] che si può pensare come fuori di T (fuori del tempo), perché non si può raggiungere con un numero, comunque grande, di traslazioni tem­ porali finite. Inoltre, in esso l'orientazione (temporale) non è più possibile. Abbiamo visto dunque che il punto ( + co, -co] è necessario per rappresentare le trasformazioni (rotazioni) globali; è necessario per la fisica se le traslazioni globali sono all'origine di fenomeni che si osservano in natura. Questo punto ( + co, -co] è corrispondente a N e quindi: a rotazioni che portano da P a N su C corrispondono, sulla retta T, traslazioni che portano da t a ( + co, -co] e queste devono essere divergenti ovve­ ro infinite ( 15 ) . Ebbene, se fossimo partiti dal cerchio e dalla sfera dello spazio a 6 dimensioni avremmo così trovato che per rappresentarli completamente è necessario l'usuale spazio­ tempo piatto infinito, dove il tempo è orientabile, più il cono della luce all'infinito non orientabile nel tempo e nello spazio o 'fùori dello spazio-tempo' , dove appunto le trasformazioni conformi speciali divergenti portano i punti dello spazio-tempo. Il gruppo conforme possiede quindi, accanto alle trasformazioni del gruppo di Poincaré che fanno passare da un sistema di riferimento in quiete ad uno in moto rettilineo uniforme, anche trasformazioni che portano a distanza infinita e, per così dire, 'fuori dello spazio-tempo' . Queste trasformazioni come le possiamo immaginare? Le trasformazioni tra sistemi di riferimento in quiete e in moto (inerziali) della relatività galileiana e di quella di Einstein sono facilmente immaginabili e anche (15)

retta T, d a una

È interessante notare che a una rotazione su C d a P a P" passando per N corrisponde, sull a l a successione di due tras lazioni: una da t a [ + l ovvero a ' fuori del tempo' seguita d a ' fuori del tempo' a - t ' . �.

- �

,

65

realizzabili (è facile mettersi sul treno) ma quelle del gruppo conforme che portano 'fuori del tempo' come si possono realizzare? Per tentare di capirlo, torniamo alla relatività ristretta, e ricordiamo che se un uomo su una nave spaziale, che si muove con velocità v, misura un intervallo di tempo 't', noi dalla Terra misureremmo l'intervallo di tempo t dato da:

dove c è la velocità della luce (16} . Immaginiamo ora di poter portare la nave spaziale alla velocità prossima a quella 2 della luce; in tal caso 1tende a 1-1 O e quindi t tende all'infinito anche



=

se 't' è infinitamente piccolo. Se poi l'intervallo di tempo -r comprende l'istante presen­ te (per il quale -r O) corrisponde cioè all'intervallo di tempo (sulla nave) =

,

il corrispondente intervallo visto da noi sulla Terra tenderà a:

e si può dimostrare che t tenderà proprio al cono della luce all'infinito, di cui abbiamo detto prima. Se poi opero una traslazione di Poincaré, ho che ogni intervallino dello spazio-tempo può essere cosl portato, al limite, sul cono della luce all'infinito, cioè 'fuori del tempo' . Ecco quindi che il cono della luce all'infinito si può immaginare come il luogo dove tende un qualsiasi intervallo di tempo infinitesimo (ma non nullo) su un sistema di riferimento che si muova con la velocità che tende a quella della luce. Ma sappiamo che la nostra ipotesi di portare la nave spaziale alla velocità della luce è fallace, perché solo i sistemi con massa zero possono farlo. Quindi la nostra trasformazione sul cono della luce all'infinito o 'fuori del tempo' sarebbe possibile solo se potessimo far perdere alla nostra nave spaziale, e ai viaggiatori, tutta la loro massa. Possiamo quindi dire che le nostre trasformazioni conformi speciali che porta­ no 'fuori dello spazio-tempo' potrebbero anche pensarsi come usuali trasformazioni di Poincaré tra sistemi di riferimento inerziali, purché ammettessimo di poter far perdere tutta la massa ai sistemi fisici che si muovono entro detti sistemi di riferimento. È naturale invece che per i sistemi fisici che presentano simmetria conforme, che possono essere solo sistemi senza massa, queste trasformazioni fino al cono della luce all'infinito, cioè 'fuori del tempo' , sono legittime e ammissibili. (16) Questa relazione, detta anche dilatazione relativistica del tempo, è ben nota e sperimentalmen­ te verificata nei raggi cosmici e in laboratorio. 66

Naturalmente, anche l'inverso è possibile. Ci sono trasformazioni del gruppo conforme che portano dal cono della luce all'infinito (da 'fuori dello spazio-tempo') ad un punto qualsiasi dello spazio-tempo, ed esse si possono legittimamente pensare come limite di trasformazioni di Poincaré di un sistema senza massa a simmetria conforme che si trovi sul cono della luce all'infinito, e quindi 'fuori dello spazio­ tempo' (sistema che acquistando massa, è necessariamente proiettato in una regione dello spazio-tempo ordinario dove vige la causalità e quindi l'ordine temporale) . Queste affermazioni sono una letterale traduzione in parole di quanto espresso dalle equazioni matematiche-geometriche delle teorie e simmetria conforme globale; indubbiamente, però, richiamano alla mente antiche intuizioni del mito e della filoso­ fia; in particolare richiamano alla memoria il concetto parmenideo d'eterno che «non era né sarà ma sempre è». La fisica arriva fino a qui, anzi, a dire il vero, non vi è ancora del tutto arrivata. Non sappiamo ancora con assoluta certezza se, a parte le equazioni di Maxwell, la covarianza conforme globale sia una simmetria fondamentale della natura; lo so­ spettiamo fortemente, ma c'è ancora molta strada da fare non solo per provarlo rigorosamente ma anche per scoprire quali siano tutte le conseguenze fisiche di questa simmetria più grande di quella relativistica.

Conclusione Abbiamo visto che l'horror infiniti ha avuto nella fisica il ruolo di determinare la nascita della meccanica quantistica e poi, attraverso le eliminazioni degli infiniti, ha permesso la verifica sperimentale delle teorie quantistiche relativistiche, ma ha anche stabilito il criterio per determinare quali possono essere le teorie valide (teorie rinormalizzabili) e quali quelle impossibili (non rinormalizzabili) . L' apparire degli infiniti nel gruppo conforme ha invece reso necessaria l'introdu­ zione del cono della luce all'infinito, dove lo spazio-tempo non è più orientabile, aprendo la possibilità a nuovi campi per la speculazione filosofica. Non sappiamo ancora se questi infiniti si potranno definitivamente eliminare, per arrivare così a una fisica finita ma anche profondamente modificata. Per ora, ci limitiamo ad osservare che ambedue questi infiniti potrebbero volerei suggerire che le leggi dei fenomeni più elementari della natura non sembrano seguire i dettami della intuitiva geometria euclidea, ma piuttosto quelli della più elementare, ma meno intuitiva, e quindi apparentemente (ma solo apparentemente) meno semplice, geome­ tria dei vettori a lunghezza nulla.

67

Appendice

Per il lettore che voglia avere un'idea, sia pur vaga, della parte formale, diamo qui qualche cenno sui gruppi di trasformazioni citati nel testo. Ricordiamo che un insieme di elementi forma gruppo quando:

t) è definita una legge di composizione o prodotto e il prodotto di due elementi dell'in­ sieme è un elemento dell' insieme, ii) esiste l'elemento unità: e, iii) ogni elemento ha nell'insieme !"inverso' che moltiplicato per l'elemento dà l'unità. L'insieme delle trasformazioni di coordinate forma gruppo, il prodotto di due trasforma­ zioni è dato dalla loro successione .

Gruppo

di Euclide: 10(3)

Trasformazione, rotazione e traslazione nello spazio ordinario tridimensionale

Sistema di riferimento Cartesiano ortogonale O

Sistema traslato rispetto

di riferimento O ' (b;) e ruotato (aik ) a O.

Tra l e coordinate (x1 x2 x� e (x{ x] x)) del medesimo punto mento O e O ' intercorrono le relazioni:

P

rispetto a i sistemi d i riferi­

l, 2, 3, rotazione

traslazione la matrice ia;kl rappresenta una ro­ tazione ortogonale del gruppo 0(3).

68

RJ.

Se il determinante lla;k ll l , i sistemi di riferimento sono ambedue destrorsi (o sini­ strorsi) . Se il determinante lla;kll -1 i due sistemi di riferimento sono uno destrorso e l'altro sinistrorso: è avvenuta una 'riflessione' . Le trasformazioni del ruppo di Euclide lasciano invariata la distanza l di due punti che è uguale a fi + � + /}. =

=

Gruppo di Galileo Trasformazioni da un sistema di riferimento in quiete O ad uno O ' ruotato e in movimen­ to di traslazione con velocità costante v rispetto a 0:

Sistemi d i riferimento inerziali: i l sistema d i riferimento O ' si muove d i moto traslatorio rettilineo uniforme con velocità costante v rispetto al sistema di riferimento O

Il gruppo di Euclide si ottiene come sottogruppo del gruppo di Galileo per v O oppure, equivalentemente, per qualsiasi v al tempo t O. Naturalmente il tempo t è il medesimo sia in O che in O ' =

=

.

Gruppo di Poincaré: 10(3, 1). Trasformazioni nello spazio-tempo quadridimensionale dove ogni punto-evento è definito da tre coordinate di spazio : x 1 xr3 ed una di tempo x4 ict considerata immaginaria dove i2 -1 e c rappresenta la velocità della luce. Tale spazio-�empo si d�ce anche ' �pazi� di _ Minkowski' . Le trasformazioni di Poincaré portano da un sistema di_ riferimento m quiete O ad uno O ' ruotato e in moto di traslazione con velocità costante v nello spazio di Minkowski. =

=

69

Sistema di riferimento inerzia/e con mo­ to rettilineo uniforme v .

Spazio di Minkowski con sistema di ri­ ferimento cartesiano ortogonale in quiete.

Equazione del cono della luce: x / + x/ + x/ -

t! f

O

ovvero x / + x/ + x/

=

t! f

è una sfera il cui raggio et è ctoe zero all' istante t O e cresce con la velocità della luce . Lo si può pensare come il fronte sferico di un'onda luminosa generata da una scintill a luminosa scoccata all'istante t O nell'origine O delle coordinate. Le trasformazioni di Poincaré =

=

=

Il

trasformazioni di Lorentz

=

l, 2, 3, 4

traslazioni di Poincaré

si possono pensare come rotazioni-traslazioni nello spazio quadridimensionale di Minkowski. Le traslazioni spazio-temporali sono rappresentate da hp. e le rotazioni dalla matrice l ap., l che deve soddisfare alle relazioni di ortogonalità: La matrice l aP.. I rappresenta una rotazione ortogonale del gruppo 0(3, l) (di Lorentz) . Le trasformazioni del gruppo di Poincaré lasciano invariata la distanza il cui quadrato è dato da: 12

=

l/

+

l/

+

l/

+

l

fra due punti

l/

in particolare lasciano invariato il cono della luce nei due sistemi di riferimento inerziali:

70

il che significa che la 'velocità' della luce c nei due sistemi di riferimento inerziali O e O ' è la medesima (come confermato dall'esperienza di Michelson) . Ponendo bll O e supponendo gli assi spaziali x1 x2 x3 paralleli a x1 ' x/ x; ' si ottengo­ no le trasformazioni di Lorentz particolari: =

che si riducono a particolari trasformazioni di Galileo per mente si verifica.

c

tendente all' infinito, come facil­

Gruppo conforme 0(4,2) Trasformazione nello spazio-tempo quadridimensionale di Minkowski tra sistemi di riferi­ mento inerziali di Poincaré (vedi sopra) più dilatazioni e trasformazioni conformi speciali: Poincaré dilatazioni conformi speciali dove

d2

=

d/

+

d/

+

d/

+

d/

Per di' O si ottiene il gruppo di Poincaré più le trasformazioni di dilatazione che costitui­ scono il gruppo di Weyl, sottogruppo del gruppo conforme. Il sottogruppo di Poincaré del O e p l. gruppo conforme si ottiene per d !l Le trasformazioni conformi speciali s i possono ottenere come la successione d i una inver­ sione conforme : =

=

=

una traslazione dll seguita da un'altra inversione conforme. Così come la inversione conforme diverge, ovvero fa tendere xl' all'infinito, quando x ' 2 tende a zero, anche una trasformazione conforme speciale diverge quando, data la traslazione dll, x� è tale che

71

per

d2

� O. Se invece

d2

O, se x: soddisfano alle

2 dx ' = 0 . Data la traslazione di' le trasformazioni conformi speciali divergenti portano x ' sopra definite sul cono della luce all'infinito che giace fuori dello spazio-tempo R · 1 di Minkowski. Il gruppo conforme può essere anche pensato come un gruppo di trasformazioni ortogonali in uno spazio a sei dimensioni avente quattro coordinate spaziali reali Y Y YJ Y , e due 5 1 2 temporali Y Y immaginarie. Il gruppo consiste nelle trasformazioni ortogonali 0(4,2) :

4 6

A

=

l, 2, 3, 4, 5, 6,

dove la matrice 0 AB rappresenta il gruppo 0(4,2) e soddisfa alle relazioni

Lo spazio di Minkowski si trova sul cosiddetto cono della luce dello spazio sentabile con le equazioni:

Y/

+

Y/

circonferenza del tempo in R4• 2

Y/

+

Y/

+

Y/

+

Y/

sfera dello spazio in

Su tale cono si ottengono le coordinate xl' dello spazio-tempo

R3• 1

=

R4• 2

R4• 2

rappre­

l

con le equazioni:

Affinché il gruppo conforme possa agire globalmente è necessario aggiungere allo spazio-tempo R3• 1 così definito anche il cono della luce all'infinito definito da cono della luce all'infinito in

R4· 2,

dove le coordinate xl' sono tutte infinite . Tale cono della luce all'infinito si trova sulla inter­ sezione del cono della luce con la superficie tridimensionale impropria (all'infinito) dello spazio­ tempo di Minkowski. Sul cono della luce all'infinito lo spazio e il tempo non sono orientabili e pertanto si devono considerare fuori dello spazio-tempo infinito, o più precisamente illi mita­ to, dove invece lo spazio-tempo è orientabile e la causalità è rigorosamente valida.

72

Tullio Regge •



L'infinito e le stmmetrte

L'organismo dell'uomo è limitato, può elaborare solamente un ammontare finito di bytes al secondo, anche se aiutato da possenti calcolatori. Non possiamo dunque trattare direttamente con una infinità attuale di dati o con strutture infinite. Possia­ mo illuderci tuttavia di essere in grado di accedere ad una infinità potenziale nel senso di avere una crescita continuata ed indefinita della nostra conoscenza e della nostra attività di ricerca. Non esiste dunque il vero infinito nella fisica, e quando si parla di infinitamente piccolo e di infinitamente grande si intende sempre qualcosa di molto grande o molto piccolo in rapporto alla scala umana. Se ci apprestiamo a misurare l'universo in centimetri (cm) , vediamo che lo spazio misurabile dai fisici abbraccia circa 45 ordini di grandezza, da 10E- 1 7 cm fino a 10E28 cm (uso la notazione esponenziale dei calcolatori, ormai universalmente nota) . Il limite inferiore si riferisce alle misure relative alla fisica della luce pesante, quella delle particelle W e Z viste da Rubbia al Cern. Queste misure coinvolgono tipicamente energie dell'ordine di 10E 12 eV 1TeV. Non sembra verosimile poter andare molto oltre un altro ordine di grandezza. Un limite teorico ancora più piccolo riguarda la lunghezza di Planck, circa 10E-33 cm corrispondente all'energia di 10E 16 TeV, circa un centesimo di milligrammo come massa equivalente. Osservazioni con­ dotte su questa scala metterebbero in evidenza i fenomeni quantistici del campo gravitazionale e l'unificazione finale di tutte le interazioni. Purtroppo occorrerebbe, seguendo la tecnologia attuale, un acceleratore del diametro di alcune migliaia di anni luce. Scenderemo fino alla lunghezza di Planck solo sfruttando nuove e brillanti idee costruttive per gli acceleratori. Se andiamo nella direzione opposta, arriviamo fino al limite superiore di 10E28 cm che corrisponde a circa 10 miliardi di anni luce, il raggio della zona di universo osservabile al momento dalla Terra. Né la lunghezza di Planck né questo raggio sono lunghezze infinitamente piccole o grandi; esse segnano semplicemente il limite ultimo della nostra conoscenza. V a tenuto conto inoltre che in questa panoramica ho fatto uso di idee controver­ se e di ipotesi su cui non esiste un accordo totale. Commenti del genere valgono anche quando si consideri l'evoluzione temporale del cosmo . In questo ambito è prassi consueta considerare diverse epoche caratterizzate da diversi stati della materia. Lascerò per ultima la questione della nascita dell'universo. Ha ottenuto molto favore tra i cosmologi l'ipotesi di un'era inflazionaria iniziata al tempo t 10E-45 sec dopo il big bang e terminata a circa 10E-30 sec. Durante quest'epoca la densità =

=

73

della materia era così alta da causare una transizione verso uno stato di vuoto diffe­ rente da quello ordinario, un fatto, questo, previsto dalle cosiddette teorie della grande unificazione (GUT) . Le particelle elementari note, e quindi tutta la materia, possono essere considerate come vibrazioni del campo unificato attorno allo stato di vuoto. La scelta di questo stato determina dunque le proprietà della materia come la conosciamo. Ci attendiamo dunque che durante l'era inflazionaria non esistessero le particelle note, e che la materia avesse proprietà radicalmente diverse da quelle attuali. In particolare, questa materia densissima che riempiva l'universo doveva avere una rilevante pressione negativa, che ha portato due conseguenze molto importanti. Essa ha agito (come ci si attende dalle equazioni del campo di Einstein) come una massa negativa, producendo una repulsione cosmologica e quindi un'espansione rapi­ dissima dell'universo. In secondo luogo, il fluido superdenso che riempiva l'universo è entrato in una fase di super-raffreddamento (supercooling) molto simile a quello sfruttato per la costruzione di camere a bolla per la rivelazione delle particelle prodot­ te dagli acceleratori. In queste condizioni il fluido occupa effettivamente un volume superiore a quello di equilibrio e tende a sviluppare nel suo interno delle bolle vuote che riducono il volume totale. In modo simile si pensa che il cosmo abbia sviluppato, in regime di espansione rapida, delle bolle di vuoto normale, e che da una di queste bolle, enormemente espansa, sia nata la porzione visibile dell'universo attuale. La omogeneità dell'universo visibile sarebbe dunque una conseguenza locale di un mesco­ lamento attuatosi nei primissimi istanti di vita del cosmo e non avrebbe necessaria­ mente un carattere universale. Finita l'epoca inflazionaria, ebbe inìzio l'epoca relativistica in cui il cosmo era riempito da un fluido densissimo e caldissimo (rispetto agli standard umani) di parti­ celle e di antiparticelle relativistiche, con un lieve eccesso delle prime, e la cui velocità era dunque una frazione apprezzabile di quella della luce. Questa epoca termina al tempo t l secondo, con la annichilazione mutua e quasi totale delle particelle e delle rispettive antiparticelle che lascia intaccato il lieve eccesso della materia nor­ male costituita in essenza dalle particelle stabili ben note, tra cui il protone ed il neutrone (nucleoni) . Nei tre minuti che sono seguiti (era nucleare) i nucleoni hanno reagito tra di loro sintetizzando nuclei di elio (particelle alfa) e una percentuale minima di nuclei più pesanti. Inizia infine l'epoca della radiazione, che dura circa un milione di anni. Alla fine di questa era l'universo diventa cosl freddo da permettere la ricombinazione di elettroni e nuclei con formazione degli atomi. Inoltre la densità di energia di radiazione è cosl bassa da far sl che tale energia diventi meno importante della materia usuale come sorgente del campo gravitazionale. L'era della materia dura fino ai giorni nostri, ed ha visto la condensazione delle galassie visibili e la formazione delle stelle. Essa è durata circa 18 miliardi di anni, se teniamo fede alle misure di Sandage. Che cosa ci riserva il futuro, almeno quello estremo e remoto? Dalla mia breve cronistoria cosmica ci si rende conto che dal punto di vista della durata vi è stata un'enorme differenza fra le varie epoche, ma che in fondo l'era inflattiva e quella della materia sono state altrettanto ricche di eventi. Lo scorre­ re del tempo si può misurare non solo nella coordinata t ma anche prestando attenzio­ ne a quanto accade in una determinata epoca. Sotto questo aspetto l'era inflattiva =

74

può essere considerata lunga quanto altre epoche e forse di più, tutto dipende dagli eventi essenziali verificatisi nel corso di essa. Conviene dunque rappresentare il tem­ po su una scala logaritmica in cui t O arretra fino a -infinito. Hartle e Hawking hanno lanciato l'idea di una nascita dell'universo quale flut­ tuazione quantistica dal nulla. Nella meccanica dei quanti un sistema fisico può pren­ dere a prestito energia per un periodo di tempo che è inversamente proporzionale (secondo il principio di incertezza di Heisenberg) all'ammontare del prestito. In altre parole l' azione energia per durata del prestito, non deve superare la costante h di Planck. Un universo potrebbe avere avuto una generazione spontanea tramite questo prestito, attraverso quel fenomeno che i fisici chiamano tunneling quantistico. Non esiste una conferma osservativa per la genesi secondo Hartle e Hawking: si tratta tuttavia di un meccanismo estremamente ragionevole e semplice per far nascere l'universo dal nulla. Questa nascita potrebbe essere descritta in modo equivalente usando la cosiddetta teoria euclidea dei campi. Si pensi a come la teoria della relativi­ tà unifica spazio e tempo considerandoli come coordinate in un continuo unico. Esiste tuttavia una differenza fondamentale tra i ruoli dello spazio e del tempo. Tutti ricordano il teorema di Pitagora secondo cui l'area del quadrato costruito sull'i­ potenusa è la somma delle aree dei quadrati costruiti sui cateti. Questo teorema è alla base della geometria spaziale. Ove si includa il tempo; occorre invece sempre sottrarre l'area dei quadrati costruiti sui cateti disposti lungo il tempo. Sin dal 1909, anno in cui Minkowsky scoprl le basi geometriche della teoria della relatività ristretta, i fisici hanno tentato di ridurre il tempo ad una pura coordi­ nata spaziale, usando l'unità immaginaria i, la radice quadrata di - 1 . Questa ridu­ zione ha ricevuto una giustificazione meno formale ma più rigorosa solo in tempi più recenti. Essa consiste nel costruire matematicamente una evoluzione temporale lungo tempi immaginari. Se così facciamo tutte le dimensioni diventano spaziali e scompare l'evoluzione temporale come la conosciamo. Lo spazio-tempo diventa un continuo a 4 dimensioni ma statico, l'essere parmenideo. La nascita quantistica di Hartle e Hawking diventa molto semplice se vista sull'essere parmenideo. Immaginia­ mo l'universo ad un dato istante rappresentato come un circolo ad una dimensione invece delle 3 solite (questo è necessario per poter fare un disegno) e pensiamo a questo circolo come ad un parallelo sul globo terrestre. Vicino al Polo Nord i paralleli si restringono fino a scomparire. Se tuttavia andiamo fino al Polo, scopriamo che si tratta di un punto geografico che non gode di nessuna proprietà particolare che lo distingua da quelli circostanti. Anzi, il Polo si sposta continuamente seguendo, tra l'altro, l'influsso delle maree e dei movimenti della crosta. In modo simile si pensa che la nascita parmenidea possa essere descritta come il progressivo raccordarsi di universi spaziali a 3 dimensioni fino a contrarsi in un polo la cui natura è però solamente convenzionale e legata alla nostra maniera di definire il tempo. La genesi quantistica chiude ipoteticamente l'infinito passato ma nulla dice sul futuro remoto a cui ho accennato. Per quanto io ne so, Freeman J. Dyson è stato il primo futurologo remoto nella storia della scienza. Egli ha deciso di occuparsi del problema di quello che sarà l'universo man mano che si procede verso il futuro infinito. La futurologia remota è ovviamente molto più facile di quella immediata intesa ad anticipare i fatti storici: ma non intendo con questo sminuire i meriti scientifici di Dyson. Una =

=

75

prima scelta che si impone al futurologo riguarda la presente incertezza tra modello chiuso e modello aperto dell'universo. Ambedue i modelli seguono dalla teoria della relatività generale e dal principio cosmologico, ossia dalla omogeneità su grande scala dell'universo. La decisione finale dovrebbe essere osservativa, e dipendere dalla densi­ tà media della materia nell'universo. Questa potrebbe essere valutata direttamente dalla distribuzione delle galassie oppure in modo indiretto dal rallentamento del loro moto recessivo. Aumentando infatti la densità di materia veniamo ad aumentare l' attrazione gravitazionale tra le galassie e quindi la loro decelerazione. Oltre un certo limite (dato dalla cosiddetta densità critica che al momento è dell'ordine di un protone per metro cubo) , il rallentamento condurrà all'arresto completo della espansione cosmica, all'inversione della marcia e a un collasso finale (big-crunch) che ripeterà al contrario il big bang. Secondo i dati attuali questa inversione non avverrà prima di 50 miliardi di anni circa. Si ottiene in questo modo il modello chiuso di durata finita ma anche di estensione finita. La sua struttura spaziale è infatti quella di una ipersfera a tre dimensioni, che sta alla sfera normale come questa sta al circolo. Se invece la densità è più bassa del valore critico si ottiene il modello aperto, di durata ed estensione spaziale infinita. Solo in questo caso si pone il proble­ ma dell'infinito spazio-temporale, e hanno senso le speculazioni di Dyson. Che capiterà dunque su una scala di tempi che non conosce limiti? Anzitutto si esaurirà il combustibile stellare; il Sole si spegnerà fra circa 6 miliardi di anni, altre stelle impiegheranno 100 miliardi di anni, altre moriranno molto prima, illumi­ nando quali supernove le nostre notti e deliziando gli astronomi del futuro immedia­ to. Ove si attenda almeno 10E 16 anni, i frequenti incontri stellari distruggeranno i sistemi planetari, incluso il nostro. Le stelle si raduneranno verso il centro galattico formando un gigantesco buco nero, altre si spargeranno nello spazio intergalattico. Tutti gli oggetti finiranno per assumere la forma sferica, dopo 10E66 anni anche i buchi neri di massa solare saranno evaporati secondo il processo Hawking. Dopo 10E 1500 anni gli elementi chimici si saranno tutti catalizzati in ferro, cenere ultima nucleare, attraverso una lentissima serie di fusioni e fissioni nucleari mediate dal tunneling quantistico. Ma soprattutto è chiaro che l'universo diventerà progressiva­ mente sempre più freddo. Abbiamo dunque la scelta tra il morire arrostiti (ove giunga il big-crunch) e il morire assiderati, con uno scenario alla Dyson. Ma potrebbe anche accadere che la materia sia instabile, e che il protone possa disintegrarsi con una vita media di circa 10E32 anni, al limite dell'osservabile. Un'automobile avrebbe la probabilità di perdere in questo modo un atomo in cento anni. In questo caso, dopo 10E32 anni l'universo sarebbe praticamente pieno di elettroni, positroni neutri­ ni e fotoni vaganti in uno spazio vuoto. Secondo Dyson la sopravvivenza di organismi intelligenti dovrebbe essere possibile anche in condizioni tanto estreme, anzi queste condizioni apparirebbero loro normali. Degli organismi immensi, capaci di trarre par­ tito dai pochi fotoni emessi da una stella morente e capaci di ibernare per lunghissimi periodi, potrebbero considerare i nostri pochi centigradi come una calura infernale. I loro tempi di reazione potrebbero essere così lenti da rendere il trascorrere di un millennio pari al nostro battito di ciglia. Al limite, questa lentezza farebbe loro navigare l'eternità in periodo finito di tempo psicologico. Anche qui l'infinito trove­ rebbe un limite. E viceversa forse l'epoca inflattiva ha ospitato delle fiorenti civiltà che, una volta giunte alla soluzione dei fondamentali problemi della fisica, saranno 76

state capaci di predire la nostra venuta, considerandoci come mostri dysoniani del futuro. Ma lasciamo queste estrapolazioni per tornare al dilemma universo chiuso/univer­ so aperto. Ho già inquadrato il problema osservativo, mi sia concesso discutere altri aspetti meno rigorosi, anzi scopertamente ideologici. In una sua celebre finzione, J. L. Borges parla della Biblioteca di Babele, di quella che «alcuni chiamano univer­ so». In sostanza, la biblioteca conterrebbe tutti i libri, con un formato ben stabilito, scritti in un dato alfabeto - che è poi quello spagnolo - e contenenti tutte le permutazioni possibili di lettere e simboli consistenti con il formato. Il volume di questa biblioteca si aggirerebbe sui 10E3000 chilometri cubi. Molto prima di essere completa essa crollerebbe sotto il proprio peso. Ma naturalmente il vero messaggio di Borges, oltre che una presa in giro di se stesso e del lettore, è metaforico e cosmologico. Se per formato intendiamo le equazioni del campo e per libro una soluzione di queste, allora vediamo che il nostro universo diventerebbe una biblioteca se contenesse in tutta la sua estensione e lungo tutto il corso della sua storia una qualsiasi configurazione di campo compatibile con le equazioni del moto. Qualche decennio fa un noto fisico delle particelle, Murray Gell-Mann disse che in fisica tutto quello che non è esplicitamente vietato è obbligatorio. Egli applicava questo principio essenzialmente alle disintegrazioni delle particelle che dovrebbero procedere e dovrebbero vedersi in natura a meno che non esistano delle specifiche regole di selezione (quali la conservazione della carica o dell'energia) che lo vietino. Se accettia­ mo alla lettera il detto di Gell-Mann allora dovremmo richiedere l'esistenza di una qualsiasi configurazione di materia che non sia esplicitamente vietata dalle equazioni. Una statua di Woody Allen in samario, alta 200 metri, dovrebbe quindi esistere in qualche luogo, su qualche pianeta ed in qualche epoca pur di viaggiare e di saper attendere abbastanza a lungo. E la stessa Biblioteca di Babele potrebbe essere sparsa per il nostro universo in una configurazione strutturalmente accettabile. Un universo che contenga tutto deve essere infinito in estensione, dunque aperto. Sostengo quindi l'universo aperto, magari accettando il caso transizionale sugge­ rito dal meccanismo inflattivo. Un universo chiuso sarebbe claustrofobico, 10 miliardi di anni luce sono pochi, voglio l'infinito ! Va ricordato infine che subito dopo la creazione della relatività generale, e sotto la spinta unificatrice di Einstein, uscì un lavoro di Kaluza-Klein che si proponeva di unificare gravitazione ed elettromagnetismo introducendo una quinta dimensione (e cioè una quarta dimensione spaziale accanto alle solite tre) . Alcuni argomenti basati sulla causalità tendono ad escludere una nuova dimensione temporale: ogni nuova dimensione, in accordo con Kaluza-Klein, deve essere spaziale. Una nuova dimensione solleva tuttavia dubbi fondamentali. Ci si può chiedere infatti come mai non è mai stata avvertita come tale e come mai il movimento lungo questa dimensione non sembra realizzabile. La risposta di Kaluza e Klein è in sostanza che questa dimensione extra è compatta mentre le altre non lo sono, o, se lo sono, la compattez­ za attiene alla scala cosmologica. Se consideriamo un cilindro indefinito vediamo che le rette che corrono lungo la direzione assiale hanno lunghezza infinita, mentre il circolo di base è finito. Si dice dunque che queste rette non sono compatte mentre il circolo lo è. Nella teoria di Kaluza-Klein la nuova dimensione corre lungo il circolo mentre le vecchie sono incluse nella dimensione non compatta. La lunghezza del 77

circolo è dell'ordine di quella di Planck, lOE-33 cm, ed è totalmente inaccessibile all'osservazione diretta. Se tuttavia consideriamo l'epoca quantistica immediatamente precedente a quella inflattiva allora vediamo che anche le dimensioni non compatte si curvavano su una scala di lunghezze pari a quella di Planck, e che non si può più distinguere tra dimensioni vecchie e nuove. Lo spazio avrebbe effettivamente quattro dimensioni. La teoria di Kaluza-Klein è servita più recentemente da modello per una serie di generalizzazioni, alcune basate sul nuovissimo concetto di stringa relativistica, in cui si impiega un numero di dimensioni spaziali che arriva fino a 25. Nulla vieta che altri modelli giungano oltre: tanto vale postulare subito l'esistenza di infinite dimensioni di cui solamente alcune saranno osservabili, direttamente o indirettamen­ te, dall'uomo. Ed infine, e questo ci avvicina al tema delle simmetrie che hanno giustificato questa conversazione, bisogna rendersi conto che una infinità di dimensioni è legata ad una infinità di simmetrie. Uno dei risultati più importanti della fisica teorica del dopoguerra è stata la scoperta di meccanismi di rottura spontanea della simmetria. In sostanza, si riconosce che la dinamica di un sistema fisico può avere normalmente una simmetria molto più alta di quella degli stati in cui si può trovare. Se poniamo su una colonna verticale un peso tale da incurvarla, allora la colonna può flettersi lungo una direzione qualsiasi che viene a rompere la simmetria circolare iniziale del problema. Una biglia posata sul fondo di un catino si fermerà in un punto qualsia­ si lungo un cammino circolare e questo punto romperà la simmetria iniziale del problema. Per molto tempo è stato accettato quasi come un assioma, suffragato da numerosi esempi, il fatto che il vuoto, cioè lo stato di minima energia di una teoria di campo, possedesse tutte le simmetrie della teoria. Negli ultimi decenni i fisici hanno comin­ ciato a studiare delle teorie in cui questo non avviene, e che sono di grande interesse. Le particelle note sono in essenza delle oscillazioni del campo attorno allo stato del vuoto, e corrispondono alle eccitazioni di energia più bassa. Esse risentono dun­ que della struttura del vuoto, ed ogni imperfezione nella simmetria di questo induce una corrispondente rottura nello schema di classificazione delle particelle. Se guardia­ mo dunque alle particelle prodotte dai nostri acceleratori vediamo che esse riflettono in modo deformante la simmetria che regna in natura; noi stessi e le nostre macchine, in quanto fatte di queste particelle, siamo condotti ad una visione antropomorfa del cosmo, storicamente non simmetrica. La ricostruzione delle simmetrie è dunque impresa ardua e non completa, e forse neppure completabile. Se davvero esistono infinite dimensioni, allora si può ben anticipare che l'umanità potrà osservare gli effetti solamente di un numero finito di esse, e anticiparne altri su basi logiche, mediante teorie alla Kaluza-Klein. Nulla esclude che la natura sia organizzata su basi di indecidibilità godeliana, in cui i successi ottenuti non serviranno a nulla per anticipare situazioni interamente nuove che si presenteranno ad ogni svolta e dopo ogni successo. In fondo la storia delle particelle elementari dimostra che l'elementarità ha sempre avuto un ruolo storico effimero. Dagli atomi come costituenti ultimi siamo passati al nucleo e agli elettroni, il nucleo è stato scomposto in nucleoni e questi in quarks . Infine già si parla di scomporre i quarks in altri costituenti, quali i preoni oppure i rishoni. L'elementarità 78

va vista sempre in relazione ad una data scala di energie e queste sono cresciute di un fattore 100.000 nell'ultimo trentennio. Molti vorrebbero aver di fronte un panorama finitistico e completabile, almeno in linea teorica. Penso invece che la ricerca scientifica derivi vitalità ed interesse dalla tensione e dalla dialettica continue che ad essa vengono imposte dalla struttura inerentemente infinita, ed incomprensibile nella sua interezza, delle leggi naturali.

79

Max Jammer

Zeno's Paradoxes Today

The present essay is an attempt to examine whether r(!Cent advances in the exact sciences bave something new to say about the difficulties concerning the con­ cepts of motion, change and plurality with which Zeno of Elea is reported to bave confounded bis contemporaries some 2500 years ago. Ever since Aristotle and bis ancient commentators Themistius, Simplicius and Philoponus discussed Zeno's paradoxes, they bave been at the center of research on the foundations of the exact sciences and «have afforded grounds for almost ali the theories of space and time and infinity which bave been constructed from bis day to our own» ('). The originai wording of Zeno's paradoxes seems to bave been lost already in Aristotle' s time. Simplicius' claim of having had access to an originai work of Zeno, which he quoted in bis discussion of the argument against plurality (2 ) , has been seriously questioned by modern scholarship. Nor is there any consensus among scholars precisely against whom Zeno's attacks bave been directed. These issues, important as they may be for the history of philosophy and of science, will not be discussed in this essay. When we refer to Zeno's paradoxes we mean not their authentic formulation, of which in any case we know next to nothing, nor even the precise logical contents of their argumentations, but rather the fundamental conceptual pro­ blems which they bave raised and which, in spite of the voluminous literature about them, seem not yet to bave received a fully satisfactory, or even only agreed, solution. Reviewing this literature we cannot help noticing that there bave been recurrent periods of particularly intense interest in the subject. Surveying only the last one hundred years we find that about a century ago, prompted perhaps by the writings by Eduard Zeller and by Paul Tannery, the paradoxes were a much discussed subject among philosophers, physicists and mathematicians alike. Thus, the very first volume of the «Revue de Métaphysique et de Morale» ( 1 893) carried no less than eight articles on this topic, some of them written by Poincaré, Milhaud and Lechalas . About fifteen years later, Zeno's paradoxes were a centrai theme in the writings of Peirce, Russell and Bergson. The next wave of intense interest carne in the early fifties : thus, no fewer than seven articles on Zeno's arguments were published bet(1) B. Russell , Our Knowledge o/ the External World, London 1926, p. 1 8 3 .

(2) Simplicius, In Aristotelis Physicorum libros quattuor priores Commentaria, ed . by

1 882, p. 140.

H . Diel s, Berlin

81

ween 195 1 and 1953 solely in the philosophical journal «Analysis». The latest period of intensified interest in this topic were the years 1 964 till 1970, highlighted by the appearance of three monographs, by ]. A. Benardete's In/inity, A. Griinbaum's Modern Science and Zeno 's Paradoxes and W. C . Salmon' s Zeno 's Paradoxes. An historiographic study of this recurrent clustering of interest, details of which would lead us too far astray from our own topic, would undoubtedly reveal that in each case it was the advent of a new idea or of a new complex of ideas in mathematics or in the physical sciences which prompted the revival of interest in these age-old problems . The last-mentioned resurgence of Zeno's paradoxes, for example, seems to have been the result of the emergence of interest in the so-called infinity machines, themselves a subject associated with the technology of automation and computariza­ tion which developed in those years. I do not believe that any major breakthrough in the exact sciences during the last few years calls for a new reviewing of Zeno's paradoxes . If nevertheless I intend to find out whether modero science has any bearing on them, I do so because it seems to me that certain scientific developments that took piace even more than twenty years ago have not sufficiently been taken into consideration and that, in addition, certain proposals of solving those difficulties, made under the impact of modero science, are untenable if closely examined. Let me briefly summarize the arguments underlying Zeno's paradoxes as far as they are relevant for the sequel. Por details the reader is referred to the standard literature on this topic. Zeno's paradoxes are divided into four classes, (I) those dealing with motion, (II) those dealing with plurality, (III) the millet-seed paradox, and (IV) the paradox conceroing the concept of piace (or space) . (I, l) The Dichotomy (or Bisection) Paradox: (I, la) (Progressive division) He who wants to walk a distance d has always to traverse first one half of what has stili to be traversed; hence an infinite progres­ sion d/2, d/4, d/8, . . . of finite distances has to be traversed; but such a progression has no last member and therefore can never be exhausted; consequently the walk cannot be finished. (I, l b) (Regressive division) He who claims to have walked a distance d had always to traverse first one half of what he claims to have traversed; hence an infinite regression . . , d/8, d/4, d/2 of finite distances had to be traversed; but such a regression has no first member and therefore can never have been begun; conse­ quently the walk cannot have started. Remark: It is clear that the ratio 1{2 in both arguments (I, la) and (I, l b) can be replaced by any ration a/b where a and b are positive real numbers satisfying a < b. (I, 2) The Achilles Paradox Swift Achilles will never overtake, or even only catch up with, the slow tortoise, for he must always reach first the point where the tortoise started, leaving Achilles always behind. (I, 3) The Arrow Paradox The arrow cannot move in the place which it occupies, nor can it move at a place which it does not occupy; hence it cannot move at all. .

82

(I, 4) The Stadium Paradox Of three parallel rows, each containing, say, three objects, two rows move in apposite directions relative to a third row which is stationary; the last object of the first moving row passes two objects of the other moving row, but only o ne object of the stationary row; hence «double the time is equal to half». (II, l) The Paradox of Plurality (modero version) An infinitely divisible extensive magnitude, if exhaustively divided, is an ag­ gregate of no further divisible, hence unextended, elements; but a composition of unextended elements cannot be an extended magnitude. Remark: (II, l) is often called «the metrica! paradox of extension» and can be reformulated geometrically as follows : A straight-line segment o f positive length cannot b e conceived o f a s a collection of (unextended) points. (III) The Millet-Seed Paradox If a grain of millet, when it falls to the ground, makes no sound, a bushel of millet, when it falls, cannot make any sound either. (IV) The Paradox of Space Everything that exists has a piace, hence piace has a piace, and so on ad infinitum. The Stadium, as ancient commentators already realized, presents greater inter­ pretative difficulties than the other paradoxes . We do not intend to dwell upon this issue and only point out, following Gaye, Russell and Owen, that an atomistic (or stroboscopic) theory according to which time and space are discontinuously com­ posed of indivisible elements and motion is a sequence of elementary displacements by one element of space in one element of time, makes the argument intelligible. Moreover, since the Dichotomy Paradox and the Achille s Paradox seem to de­ pend on the assumption that both space and time are infinitely divisible, and the Arrow Paradox, as Aristotle already had noticed, on the assumption that time, but not necessarily space, is composed of indivisible elements, the assumption underlying the Stadium Paradox, namely that both time and space are composed ( 3 ) of indivisi­ ble elements, is «making the quartet symmetricah>, as Lee has put it. This «sym­ metry», as Lee conceived of it, establishes, at most, some kind of logica! coherence among the four paradoxes of motion. A logica! pattern in which also the Paradox of Plurality (in its various presentations) and possibly also the Millet-Seed Paradox can be fitted has been proposed by Owen (4 ) . Recalling that Zeno as a staunch Parmenidean monist ,

N . S . LVIII ( 1957- 1958), pp . 199-222; reprinted in W. C. Sal mon (ed . ) , Zeno's Paradoxes, Indianapolis 1970, p. 1 4 0.

83

assumption about the structure of space and time leads to absurdities, and his paradoxes of plurality do thus constitute a coherent system of alternatives for carrying out this program. The paradox about piace will henceforth be excluded from our discussion. It differs fundamentally from ali the other paradoxes, the Millet-Seed Paradox included, and may be due not to Zeno but probably to Gorgias to whom it was, in fact, attributed by Empiricus and other authors. We may go even further. Just like the different versions of the Paradox of Plurality so also the three paradoxes of motion are ultimately only different formulations of one and the same logico-ontological difficulty. First of ali, it is clear that either of the two versions of the Dichotomy, (I, la) and (I, lb), follows from the other one by the time reversal of motion. It is also obvious that the Achilles Paradox (I, 2) reduces to the Dichotomy Paradox (I, la) by a translation of the reference system, namely if the motion of Achilles is relativized to a reference system whose origin lies at the location of the tortoise. Finally, the Arrow Paradox (I, 3) follows from paradox (I, lb) if the regression mentioned in the latter is considered to converge at the front-point of the arrow. Furthermore, the Millet-Seed Paradox (III) may be taken - though only cum grano salis from the viewpoint of the modern physiological theory of perception - as an acoustical analogue of the Paradox of Plurality (II, 1), the sound of a grain cor­ responding to a point, and the sound of the bushel corresponding to the line-segment. We are thus faced in principle with only two fundamental problems which we choose to be presented by the Dichotomy Paradox (I, la) and the metrica! paradox of extension, as formulated in the Remark above. Let us consider the metrica! paradox of extension which has been summarized already by Aristotle (5) in the statement: «If something extended consists of points [. . . ] i t will not possess any magnitude». Porphyry attributed this argument to Parmenides, but according to Alexander and Simplicius (6) its author was Zeno. As Aristotle also pointed out, it was one of the most effective arguments which the atomists advanced in support of their denial of infinite divisibility. As shown by Vlastos C), Zeno's metrica! argument, if presented in extenso, consists of three parts:

(1) if an existent were infinitely divisible, it may be assumed to bave been divided «exhaustively» or «through and through»; (2) but an exhaustive division would resolve the existent into elements of zero extension; (3) this is impossible since no extensive magnitude consists of unextended elements. The argument, as stated, can be - and has been - easily refuted. Already Aristotle, insisting on a strict distinction between potential and actual infinity, challeng­ ed the logica! validity of part (1). In fact, as has been repeatedly pointed out, the statement that the existent has been exhaustively divided is incompatible with the premiss concerning its infinite divisibility; for the latter implies that the process (5) Aristot le, On Generation and Corruption, 3 16 b 29-30.

(6) Simplicius, op. cit. , p . 139, 24 et seq.

( 7) G. Vlastos, Zeno, in: P. E dwards (ed .) , The Encyclopedia of Philosophy, New York 1966, vol . 8 .

84

of dividing the existent is unending or never leading to a final stage where no further division is possible, while the former just assumes that such a stage has been reached. Another objection may be raised against the expression «elements of zero extension» as used in part (2). If such an element is meant to be a point - Euclides, it will be recalled, defined the point as «that which has no part» it may be rightfuliy contended that modern mathematics does not apply the notion of «extension», «length» or «measure» to points but only to sets of points. Ali these and similar criticisms, however, do not strike at the real root of the chalienge raised by Zeno. For a reformulation of it in terms of the modern C antorian set theory of the continuum will render it immune against such censures. We shall therefore confine ourselves in the sequel to the modernized version of the argument: A straight-line segment of positive length cannot be conceived of as a coliection of (unextended) points . Since the argument, thus reformulated, constitutes a severe challenge t o any consistent mathematical, physical or philosophical theory of continuous extension in space or time, a criticai examination of its latest and, as it seems, generally accepted resolution certainly deserves our attention. Adolf Griinbaum' s «resolution of Zeno's metrica! paradox of extension for the mathematical continua of space and time» (8 ) is undoubtedly a most important contribution toward a clarification of the difficulty but, in my view, not a fully satisfactory solution of it. In order to present the paradox and its suggested solution in as lucid and unam­ biguous a manner as possible we shall proceed in a rather pedestrian fashion and start with certain elementary measure-theoretic definitions and theorems . In accordance with the Cantorian conception of the continuum there exists a one-to-one correspondence between the set of ali points {P l on a straight line and the set of ali real numbers {x l of the real number system. The real number x which corresponds to a given point P in this manner will be called the coordinate of P and will also serve as its (continuous) index: Px. Far any pair of real numbers X 1 � X2 the closed (linear) interval fPx , , Px,l, or briefly [x1, x:J, is defined as the set of ali points Px whose coordinates (or indices) satisfy the relation x1 �x � x2 . If in particular x1 = x2 , the interval [x1, x:J is called degenerate and denoted simply by [PJ or [x] where x is either x1 or x2 . A degenerate interval contains exactly one point . The length ).[x1, x:J of the interval fx1, x:J is defined by the non-negative number XrXJ . It is shown in set theory that the set of ali points contained in a non-degenerate interval has the cardinality of the continuum, irrespective of the length of the interval. The foliowing two theorems are logica! consequences of the preceding definitions : Theorem l: The length of a degenerate interval is zero

).[x] = O

for every x.

(8) A. Griinb aum, A Consistent Conception of the Extended Linear Continuum as an Aggregate of Unextended Elements, in XIX ( 1 952), pp. 290-295 ; Idem, The Resolution of Zeno's Metrica! Paradox of Extension for the Mathematical Continua of Space and Time, in: Philosophical Problems of Space and Time, New York 1963, Dordrech t 1 9732; Idem, Zeno's Metrica! Paradox of Extension, in: Modern Science and Zeno's Paradoxes, Mi ddl etown, Conn. 1 967, pp. 1 15 - 1 3 5 , reprinted in W. C. Salmon (ed . ) , op. cit. , pp. 176- 199.

85

Theorem 2 : An interval [x�, x.J is the set-theoretic umon of ali disjoint degenerate intervals [x] for which x1 �x � X2

[x1, x.J

=

Ux .

XJ � X � X2

The measure p.(I) which, as defined in (Lebesgue) measure theory, associates with certain linear point sets I a non-negative number,is a natura! generalization of the length ). as defined above. In particular, if I [x 1 , x.J then p.(I) ).(I). We thus obtain =

Theorem 3: p.([x])

=

=

O for every x.

'"'

The (Lebesgue) measure p. is O

( l)

On the other hand, by Theorem 2,

p.(I)

=

p.(U[x]) XJ �X�X2

(2)

We now assume (Assumption I) that p. is supernumerably-additive, i.e. (in analogy to Theorem 4) that

p. ( U [x]) c

Zp.([x])

=

c

(3)

where the set-theoretic union and the arithmetic summation are to be performed over the index-set C of ali indices x satisfying the relation X1 �x � x2 . Combining (2) and (3) we obtain

p.(I)

=

Z p.([x])

(4)

zo

(5)

c

and hence, by Theorem 3 ,

p.(I)

=

c

where the symbol on the right-hand side of the equation denotes the arithmetic sum of super-denumerably many zeros. If, finally, we assume (Assumption II) that the arithmetic sum of super-denumerably many zeros is zero itself, that is that zo c

86

=

o

(6)

we are forced to conclude, in virtue of (5) and (6), that p.(I)

=

O

(7)

contradiction to ( 1 ) . The preceding analysis shows that we have to reject either Assumption I or Assumption II, or both, in order to avoid this contradiction. Griinbaum bases his proposed solution of the contradiction on m

the fact that our theory does not assign any meaning to 'forming the arithmetic sum ' , when we are attempting to 'sum' a super-denumerable infinity of individuai numbers (lengths) . This fact is independent of whether the individuai numbers in such a non-denumerable set of numbers are zeros or finite cardinal numbers differing from zero el .

Griinbaum also declares that «we are here confronted with an instance in which set-theoretic addition is possible while arithmetic addition is not» (10) . Griinbaum, as we see, rejects Assumption II on the ground that mathematics does not assign any meaning to a ' sum' of super-denumerably many zeros . This reasoning, I believe, is open to the following criticism. In mathematics the «meaning» of a sum of infinitely many terms, even if this infinity is numerable, is a matter of definition. In fact, there are severa! summability criteria (or defini­ tions) . The question is, therefore, whether mathematics. can consistently define an arithmetic sum of super-denumerably many zeros. In the following we shall show that a well defined meaning can be assigned to 'forming the arithmetic sum' of a super-denumerable infinity of real numbers, even in the case where not ali of them are zero. To this end let us consider a set SA [aç} ( O an integer n, such that for n> n, and m> n, / i: aç,/ < e . Take F, ff1 , 6, . . . f .} . k=n Then /s ' - E aç,/ < e for every finite subset G containing F. =

=

=



f�«G

Theorems 5, 6, and 7 show that -r-summability is a consistent extension of ordinary summability as defined by the convergence of partial sums and that the symbol E introduced in the definition of -r-summability resumes its ordinary meaning in ali cases of ordinary summability. For the metrica! paradox of extension the following theorem is important. Theorem 8: If A is a set of arbitrary cardinality and aç then SA is -r-summable with sum s O.

=

O for ali feA,

=

Proof: Take for every e> O F, 0 (the empty set) . For any finite index set G obviously /0 - E ad O < e. =

f•G

=

Theorem 8 shows that, contrary to Griinbaum' s thesis, Assumption II need not be rejected and that equation (6) is meaningful. It foliows that Assumption I is suspect of being responsable for the contradiction. In fact, the metrica! paradox of extension can be regarded as providing a proof, by a reductio ad absurdum, of the logica! impossibility of generalizing the notion of measure to one which is super­ denumerably additive. Does this result exhaust the significance which this paradox has for present-day science? To gain further insight into this problem let us now turn to the Dichotomy Paradox which deals not only with the structure of the continuum but also with its relation to kinematics by involving the notion of motion. As stated above, it argues that a distance d, which for the sake of simplicity may be taken to be the unit distance d l , can never be completely traversed since, according to the ver­ sion of progressive division, the infinite sequence 1/2, 1/4, 1/8, . . . of finite distances to be successively traversed, has no last member, or as Russeli has put it: «There is the moment when the runner stili has half his distance to run, then the moment when he has stili a quarter, then when he stili has an eighth, and so on in a strictly =

88

unending series» (1 1) . Since the moment when he reaches the goal is beyond the whoie of this unending series, and «nothing can be beyond the whoie of an unending series», the runner will never reach the goal. According to Russell this difficuity has its root in the «more or Iess unconscious operation of the idea of counting» (1 2 ) . Indeed, he adds, if half, three-quarters , seven-quarters, seven-eighths, and so on of the course were marked, and the runner was not allowed to pass any of the marks until the umpire said «Now», Zeno' s conclusion would be true in practice, and he would never reach the goal.

To resoive the difficulty, Russell resorts to the C antorian theory of sets which defines the relation of membership not by passing the elements in review one by one, but rather by an impredicative definition, that is, by a collective characterization. The individuai enumeration, marked by the umpire' s enunciation each time by «Now», becomes therefore unessential and «an unending series may nevertheless form a whoie, and there may be new terms beyond the whoie of it» (13). What Russell has in mind is of course, in modern terms, the ordinai w + l . But does this set-theoretical approach realiy resoive the Dichotomy Paradox? I think that it fails to do so for precisely the same reason as do those who claim that the mathematicai theory of converging infinite series resoives the paradox. Probabiy the first among these was René Descartes. Just as he tried, with his discovery of anaiytical geometry, to reduce geometry to algebra, so he tried to reduce Zeno's kinematicai paradoxes to the theory of infinite series, embryonic as it was at his time. In a Ietter to Cierselier, dated 1646, Descartes wrote: L'Achille de Zenon ne sera pas difficile à soudre, si on prend garde que, si à la dixiéme partie de quelque quantité on adioute la dixiéme de cette dixiéme, qui est une centiéme, et encore la dixiéme de cette dernie re [ . . . ] toutes ces dixiémes [ . . . ] ne composent toutesfois qu'une quantité finie, sçavoir une neufiéme de la primiere quantité, ce qui peut facilement estre demonstré (14) .

The Iast words o f this quotation probabiy refer t o the fact that the contention

l

+

10

l

1 00

l

...

+ -- +

1 000

=

l

9

(8)

> XXXI ( 1 980); and also P. Cartier, Perturbations singu/ières des équations différentiel/es ordinaires et analyse non-standard, in «Seminar Bourb ak i» DLXXX ( 1 9 8 1 - 1 982) .

1 19

The relationship between a and e also has a numerica! content and tells us how to arrange an approximative calculation of canards . It is, of course, a well-known fact in numerica! analysis that various approximations, step-lengths, often must be chosen to depend on each other in quite specific ways in arder to exhibit a particular phenomenon. It could be that the nonstandard theory is the 'right' way to discuss this.

Singular perturbations. - Let Ho = -Ll be the free Schrodinger operator, where Ll is the Laplacian in RJ. It corresponds to a quadratic form Bo (/,g) = f (-Ll/) gdx.

We want to perturb the operator on a 'small' set, i. e. a set of measure O in RJ. This means that we want the 'free' particle to feel a force concentrated on a small set, e.g. a point lattice in RJ as in solid state physics, or a 'thin' submanifold of RJ, or a Brownian path Cw [b(w, r) l t E [O, l]j as in polymer science or quantum field theory. Formally, this means to add to Ho a singular perturbation of the form =

H = Ho + V, where V in the Brownian path case would be

V(x)

=

- J .t, (x) ò (x-b (w, t) ) dt,

ò being the ò-function in RJ. In terms of quadratic forms this can be written as

E (j,g) = Bo (/,g) + fcw ).jgdp, where p(A) = m{t E [0, l] l b(w, t) E A], m the Lebesgue measure on the real line. But does E exist as a non-trivial perturbation of E0? This question can be answered by using the theory of hyperfinite quadratic forms which we developed in Nonstandard Methods in Stochastic Analysis and Mathematical Physics (1°) . The ap­ proach is to lift the problem to a hyperfinite setting. Given is the space X = Rd, the measure m, the 'thin' set C = Cw (i. e. m(C) = 0), and the measure p on C. Choose Y as a hyperfinite subset of *X such that st(Y) = X, e.g. let Y be a hyperfinite lattice in *X with infinitesimal spacing. Let f.J. be the normalized coun­ ting measure on Y, in a precise sense m is the standard part of f.J. · Since C is a closed subset of X, there is an internai set B 5;;; Y such that st(B) C. Finally, let p be an internai probability measure on B having p as its standard part. Ho can be lifted to an operator Ho on U (Y, f.J.), e.g. let Ho be some 'natural' discretization of -Ll . In this hyperfinite setting the lifting of H must be =

Hf (x) = Ho / (x) - iw (x) · f (x) · p (x) f.J. (x) ( 10) S . stic Analysis E. Fenstad , by Null Sets,

120

A lbeverio, ]. E . Fenstad , R. H�egh Krohn, T. Lindstr�m, Nonstandard Methods in Stocha­ and Mathematical Physics, New York 1986; t he t heory was announced in S. Albeverio, J. R. H�egh Krohn, W. Karwows ki, T. Lindstr�m, Perturbations of the Laplacian Supported with Applications to Polymer Measures and Quantum Fields, in O be infinitesimal and let A8 be a hyperfi­ nite lattice in * R with spacing o. By transfer we have a hyperfinite lattice field which we can easily show to be a mode! of the free Euclidean field of quantum field theory. What is noteworthy here is that the hyperfinite field is pointwise defi­ ned. We stili have infinities, but they can be controlled through a consistent algebra, hence lead to unambiguous and meaningful results (15) . The free field is of rather limited physical interest, the goal is to construct fields which mode! various forms of particle interaction. One way of doing this is to construct suitable 'local additive functionals' of the free field. Let o> O be a standard real and consider the lattice A8 obtained from a bounded domain A � Rd.

(13) L. Arkeryd , Loeb Solutions of the Boltzmann Equation, in «Archive Rat. Mech . and Analysis» LXXXIV ( 1 984) . ( 1 4) For an exposition see B. Simon, The P (rph Euclidean (Quantum) Field Theory, Princeton 1974. (1 5 ) See S . Albeverio, J. E . Fenstad , R. H fi egh Krohn, T. Lind stri'J m, op. cit.

122

Let g be a positive function with support in A and let u8 be any continuous real function. We will study interactions of the form

U�

=

À o � odg

(no) U0 (s (n) ),

where ).8 is a reai constant, the 'coupling constant' . We may introduce the pertur­ bed measure ...1 . .

_

Uf-'g, Ao -

exp (- UV df.Lo, A,

--'--'------"'--:......C..:. --"--

J exp (-UV df.Lo . A,

on the space �., but keep the field s (n) (q) q.s. We would hope that under suitable conditions df.Lg, A . leads to a non-gaussian measure (either in the limit or in the hyperfinite picture), hence to a model of an interacting field. The function g in U� represents a kind of 'space cut-off' , it could e. g. be the characteristic function of some domain As in A . In order to obtain a nontrivial field we now let o tend to zero while at the same time letting As f Rd. To remove the 'space cut-off' we let g converge to the constant function 1 on Rd. This is the standard program. In the hyperfinite version it means that we want to choose o> O infinitesimai, A8 a hyperfinite lattice and g an internai function such that g (no) 1 for all nearstandard no € As. We would then like to extract from the internai construct f.Lg, A, a non-gaussian measure satisfying the field-theoretic axioms (16) . We cannot carry through this in detail in this exposition, however we indicate a few steps to exhibit some of the parts that come into play . Let us for simplicity choose an exponential interaction f.Ls (y) exp (ocy). Let us make the following cai­ culation to see what we have to do in order to control the possible infinities. We assume that o> O is standard, that As is a finite lattice and that g� O has support in A : =

=

=

f (U�2 dp. O, As

(+) where

A� where T8

=

.ì.i (A!F

� L.J

o2d g (no) g (n ' o) e

no, n' 8 f A1

oc2 exp ( - (27r)-d

[-1r/o, 1r/oJ and

=

=

2

f.Ls (kY

=



2

A c•• . ,

f f.to (k)-2 dk , Ts d o-d [2d- 2 � cos (k; o) l + m2.

)

i=l

Let d 2, choose o> O infinitesimai and A8 hyperfinite, but keep a cut-off g of compact support . If oc2 < 47r we easily see that the sum on the right hand side of ( + ) is finite, but the integrai in A� diverges . However, one infinity can be ba­ lanced against another. The coupling constant is so far left unspecified, so let us choose =

Às

=

À

·

(A�- 1 ,

where À > O is a finite real number independent of o and oc. With this choice the

( 16) C f . ibidem. 123

right hand side of ( + ) is nearstandard, and it is not difficult to see that the standard part is

.F j g (x) g (y) e/c lx-yJ dxdy, Rd

where G (x,y) is the kernel of the operator (-L1

+

m2)- 1 •

Remark. - For the informed reader we note that the interaction U� is more com­ monly written u�

=

).

.E odg (no): ez ��>s!n! : '

where :ez��>s!n! : (A!)- 1 ez��>s!nJ is the so-called Wick renormalization of ez��>s!nJ . Thus one important stage in the program is completed. It remains to remove the space cut-off g. Let once more o> O be a standard rea!, As a finite lattice, and let g have support in A. The Schwinger functions associated with the measure fl.g, As are given by =

5� (nl O, . . . , nk O)

=

f s (nJ . . . s (n,J dp.g, As .

Let g, g 1 both have support in A , assume that the support of g is contained in the support of g 1 , and that g g 1 on the support of g. Then one may show that =

o

� 5f. � 5� � 5�,

where 5� is the Schwinger function of the free field. In the fina! stage of the program we pass to the hyperfinite picture and remove the finite space cut-off by choosing an internai function g., such that g., (no) l for ali finite no. Then we may prove that L (EJ.g.,,AJ, the Loeb-measure associated with fl.g.,.As is a non-gaussian probability measure. And using the inequalities esta­ blished above, we may verify that this measure for d 2 gives us a mode! for a quantum field with non-trivial interaction. =

=

Remark l. - Recently this example has attracted much attention due to the connec­ tion of its zero mass version with the theory of relativistic strings. The massless expo-. nential interaction model is called the Liouville model, since it was studied originally by Liouville as a classica! field theory. The connection between the quantum version of this field theory and relativistic strings was observed by Polyakov in 1 98 1 . In fact, it turns out that the theory of relativistic strings in space-time dimension D � 13 (corresponding to oc < �) can be expressed in terms of expectations with respect to the pathspace measure of the Liouville model (17) . The reduction of the string model to the exponential Euclidean model also reduces the 'singularities' of the string approach to a discussion of singularities of the Euclidean model, and can thus be discussed by the methods developed in this section.

Remark 2. - In the book Nonstandard Methods in 5tochastic Analysis and Mathematical Physics, further examples are given, e.g. a nonstandard version of the �1 model due (") This is discussed in a fort hcoming work by S. Albeverio, R. H�egh Krohn, S . Paycha and S. Scarlatti.

124

to Brydges, Frèilich, Sokal (18); a construction of gauge fields a discussion of polymer measure and quantum fields .

m

dimension 2; and

Some Concluding Speculations Mathematics provides the basic conceptual framework for the natura! sciences. This framework is not an invention of the 'pure' mathematician, but has evolved out of the interaction between mathematics and the sciences . This basic framework is not the substantive part of the sciences . It does, howe­ ver, give the conceptual tools for 'slicing up' and modelling the reality of our imme­ diate experience. Standard mathematics gave us the arithmetical continuum as the fundamental conceptualization of the space-time manifold. But recent developments have shown that this framework is too restrictive. Science must cope with infinities, singularities, and phenomena occuring on many scales. We have seen that what happens on the micro or infinitesimal scale has effects measurable on the macro leve!, the leve! of our experience. I have, in this paper, tried to present, both through a conceptual analysis, and through a series of examples, nonstandard analysis as a framework better adapted for this analysis. It has been claimed that infinities must be eliminateci from science. But this is wrong - infinities exist and must be tamed. Nonstandard analysis is a conceptuali­ zation for the taming of infinities . Infinities and singularities occur within the do­ main of finite measurement, and they are labeled 'infinities' and 'singularities' becau­ se the standard framework has no direct way of dealing with them. Our examples are not exhaustive. I suggest that some calculations in connection with the renormalization group technique should be analysed from a nonstandard perspective. And, we may speculate, the extra space-time dimensions, going beyond the four observable on the macro leve!, and which currently are under discussion in fundamental physics, may be manifest only on a micro, i. e. infinitesimal, scale (thus only occurring within a suitable compactification) . The world is richer than we can immediately see.

(18) D . C . Bry dges, J. Fro lich, A. D . Sok al , A New Proo/ o/ the Existence and Nontriviality of the Continuum rp j and rp j Quantum Fie/d Theories , in XCI ( 1983).

125

Elliott Mendelson

Infinity



tn

Set Theory

Tbe proper bistory of infinity in set tbeory is scarcely more tban one bundred years old. Before tbat, matbematicians eitber naturally tbougbt in ways tbat did not cali for reference to infinite sets (ratber tban reference to arbitrary members of sucb sets) or carefully avoided sucb reference. One of tbe earliest test cases, Euclid' s tbeorem on tbe infinitude of tbe primes, is inconclusive. Sir Tbomas Heatb's translation of Proposition 20 of Book IX reads: «Prime numbers are more tban any assigned multitude of prime numbers». Tbis could bave been formulated in a set-free way as «Given any prime number, tbere is a larger prime number» or in a frankly set-tbeoretic way as «Tbe set of prime numbers is infinite». But Euclid seems to bave cbosen a bybrid form, apparently using tbe word 'multitude' in tbe sense of 'finite set ' . Aristotle' s notion o f 'potentially infinite' probably derived from tbe problems associated witb Zeno's paradoxes and tbe supposed infinite divisibility of a line segment. Here, one tbinks of a segment being cut in balf, tbe resulting segments being cut in half, and so on witbout end. Tbe geometers' points, tbe end-result of tbis process, are idealizations for wbicb tbere is no empirica! evidence. It was difficult to conceive of bow tbe points 'fit togetber' to form tbe line and of bow motion was possible along a line. However, tbe adjective 'potentially' seems inap­ propriate. A young cbild wbo sbows signs of matbematical talent may be potentially a great matbematician because it is possible for tbe child to become a great matbemati­ cian. But a potentially infinite line segment, at least in Aristotle' s view, cannot become actually infinite (in tbe sense tbat tbere would be infinitely many points, or even subintervals, in it) . Altbougb Aristotle cbaracterized tbe set of natura! numbers as potentially infinite, it is reasonable to assume tbat be would deny tbat tbe set is actually infinite, since, in bis terms, it does not exist as one finisbed tbing. It seems to me tbat tbis is a poor way of talking about tbis matter. Instead of saying tbat tbe set of natura! numbers is potentially infinite, one sbould refrain from refer­ ring to sometbing (namely, tbe set of natura! numbers) wbicb does not exist. Instead, presumably everytbing one wants to say can be said by talking about natura! numbers and by using tbe fact tbat, beyond any natura! number, tbere are greater natura! numbers. Quantification over natura! numbers would be permissible, but tbe forma­ tion of a matbematical object containing tbe natura! numbers as members would be forbidden (') . Witb regard to quantifiers, tbere is no problem about «For ali (l) According to Hermann Weyl ( 1949), the formation o f such an object is the f all and originai sin o f set theory.

127

natural numbers n, A(n)», but the rules governing the use of «There exists a natural number n such that A(n)» would engender disputes between classica! and construc­ tivist mathematicians. The latter would allow an assertion of the latter form only when it is justified by a specific method for finding such a number n and showing that A(n). Here, there is a further division between the moderate constructivists, who would simply refuse to acknowledge the truth of such an assertion without an accompanying justification, and the extreme constructivists who deny any meaning to the assertion until the justification is at hand. The constructivists say that they are opposed to the imagined thought experiment in which one pictures a process of examining the natura! numbers, one at a time, to see whether they satisfy the property A(n). The founder of the intuitionistic school of constructivists, L. E . J. Brouwer, seems to think of mathematics as of a story being invented. Can we ask ourselves whether there are four consecutive 7 's in the decimai expansion of tr? In Brouwer' s view, that decimai expansion is in the process of being made up. Analogously, if we ask a novelist whether his main character likes pizza, that question may be inadmissible if the author hasn't thought of the question yet or never will think of it. Most mathematicians, however, believe that the mathematical story already has been made up and that there was no other way to tell it . The philosopher Ludwig Wittgenstein took a position similar to Brouwer's: However queer i t sounds, the further expansion o f a n irrational number i s a further expansion of mathematics. [ . . ] And if you say that the infinite expansion must contain the pattern 7777 or not contain it, you are so to speak showing us the picture of an unsurveyable series reaching into the distance. But what if the picture began to flicker in the far distance? (2) . .

I suppose that most mathematicians would answer that, if the picture began to flicker, then Wittgenstein had the wrong picture. I cannot understand how one can honestly go as far as the extreme construc­ tivists . After ali, if you do not understand the meaning of the assertion «There exists a natura! number n such that A(n)», how do you know how to look for a natura! number n such that A(n) holds? An important example of this type of asser­ tion is the following restricted Goldbach Theorem: there exists a natura! number no such that every odd natura! number greater than or equa! to no is the sum of three primes . This was proved non-constructively by Vinogradov in 1937; he showed that the non-existence of such a number n0 leads to a contradiction, but he gave no way of finding such a number. From a constructivist point of view, Vinogradov' s theorem has not yet been proved; for a radica! constructivist, i t i s not even mean­ ingful. In my opinion, he is only pretending not to understand it. It is an undeniable fact that, until the late nineteenth century, mathematicians rarely used the notion of a set, and even less frequently the notion of an infinite set. This was not necessarily the result of a conscious avoidance of these notions . Rather, i n the course o f the development o f mathematics , there was no need to explicitly mention sets or the notion of infinity. Whatever mention there was of infinite sets was mainly negative, because it (2) Wittgenstein ( 1 956), vol . IV, pp. 9-10.

128

was generally believed that infinite coliections were not susceptible to mathematical treatment . In 1638, in his Dialogue on Two New Sciences, Galileo presented the apparent paradox that, although the perfect squares l , 4, 9, 1 6, . . . form a proper part of the coliection of ali natura! numbers, yet the correspondence between each natura! number and its square shows that there are as many perfect squares as there are numbers . He first points out that the density of the perfect squares is O (that is, if P(n) is the number of squares not exceeding n, then the ratio P(n)/n approaches O as n gets larger and larger) . And then he says : «On the other hand, in an infinite number, if o ne could conceive of such a thing, o ne would be forced to admit that there are as many squares as there are numbers, ali taken together». The conclusion derived by Galileo is this : This is one of the difficulties which arise when we attempt, with our finite minds, to discuss the infinite, assigning to it those properties which we give to the finite and limited; but this I think is wrong, for we cannot speak of infinite quantities as being the one greater or less than or equa! to another.

According to D. A. Steele (3) , Galileo's Paradox might have been known to Plutarch and Proclus in ancient times. It was definitely known to some fourteenth century scholastics, such as Thomas Bradwardine (4 ) . A similar paradox was used in the thirteenth century to establish the impossibility of an eternai world. Indeed, during an infinite past, the argument went, there would be twelve times as many revolutions of the moon as there would be revolutions of the sun. But there would be as many revolutions of the moon as of the sun; the scholastics claimed this on the basis of their belief that ali infinites are egual, which, in the case of the denumerable sets in question, is true. Galileo' s conclusion was echoed by Newton (in a letter written in 1692) : «ln­ finites, when considered absolutely without any restrictions or limitation, are neither egual nor unequal nor have any certain proportion one to another». Leibniz, aware of Galileo' s and similar examples, said: «Nothing is more palpable than the absurdity of an actual idea of an infinite number». But Leibniz seems to contradict himself: «l am so much in favor of the actualiy infinite that, instead of admitting that nature abhors it, as is vulgarly said, I hold that it is affected by it everywhere, so as to better exhibit the perfections of its author» ( 5 ) . Bernard Bolzano, an Austrian w ho, in the early nineteenth century, was o ne of the first mathematicians to put some of the truths of the calculus on a rigorous basis, wrote a book, Paradoxes of the Infinite, in which, in addition to paradoxes of Galileo's type, he pointed out that the interval of real numbers (0, 5) could be placed into one-to-one cor­ respondence with the bigger interval (0, 12) by means of the function y = (1 2/5)x. There are two assumptions on which Galileo' s Paradox is based. First, there is the belief that two collections are of the same size i/ and only if their elements can be paired off with each other by means of a one-to-one correspondence. In Galileo's case, this correspondence matched n with n2 • The second assumption is the Eucli(l) lntro duction to Bol zano ( 1 85 1 ) . (4) See Murdoch ( 1962 ) .

( ' ) G. W . Leib niz Opera omnia studio, Ludov. Dutens, vo l . I I , part l , p . 243 .

129

dean axiom that the whole is greater than any of its parts. This implies that every set is greater in size than any of its proper subsets, and, in particular, that the set of natura! numbers is greater in size than the set of perfect squares. Both of these assumptions hold in the domain of finite sets . The first assumption seems to enjoy almost universal acceptance. Two sets that can be put into one-to-one correspondence are said to be equinumerous. It is natura! to think of equinumerous sets as being egual in size. The only notable argument in the past against this assumption was made by Bolzano. He acknowledged that equality of size is established in the case of finite sets by virtue of a one-to-one correspondence. The illusion i s therefore created that this ought t o hold when the sets are n o longer finite, but infinite instead. The illusion, I say, for a closer study reveals that no such necessity exists, because the grounds upon which this holds for finite sets are bound up precisely with the finitude and become inoperative for infinite sets .

Thereupon, Bolzano launches into a hazy discussion about the relations between objects that are destroyed under a one-to-one correspondence; in addition to lack of clarity, Bolzano's arguments seem to apply just as well to finite sets as to infinite sets. However, we shall return later to a much more substantial challenge to this assumption. Of course, we all know now that there is an easy way to overcome Galileo' s Paradox. Simply drop the second assumption that the whole must b e greater than its parts. More precisely, accept the fact that certain infinite sets can have the same size as some of their proper subsets. This was done by Dedekind and Cantor about one hundred years ago, and the result, Cantor' s set theory, is one of the most beautiful creations in the history of mathematics . Numbers, so-called transfinite numbers, can be assigned to infinite sets in the same way that finite cardinal numbers are assigned to finite sets. These new numbers can be compared in size and can be subjected to operations of addition, multiplication, and exponentiation, and a very rich and useful theory can be constructed. A certain amount of caution is necessary, however. If one is not careful, contradictions can arise. We shall return to this problem later. When Dedekind and Cantor set about the task of developing a theory of infinite sets and numbers, certain fundamental issues arose. Once a mathematical treatment of infinity is undertaken, we must define the basic notions of finite and infinite set, we must confront the question of the existence of infinite sets, and we must see whether there are different levels of infinity.

Definitions of Finite and Infinite For a long time, the notion of finite set was taken to be intuitively clear: such was a set that could be counted. I am not certain that even Cantor and Dedekind ever gave precise definitions . But clearly, if the natura! numbers O, l, 2, . . are assum­ ed known, then a set A is finite if and only if there is a one-to-one correspondence between the members of A and the set of all natura! numbers less than some natura! .

130

number n. It is easy to prove that, if there is any such number n, then it is unique, and that unique n is called the number of elements in the set A. A set is defined to be infinite if and only if it is not finite. We shall call these the standard definitions of finite and infinite. Some people use the term inductively finite instead of standard finite. Dedekind (6) gave a definition of infinite set which makes no reference to natural numbers at all. He defined a set B to be infinite if there was a one-to-one correspondence between B and a proper subset of B . Thus, he made the disturbing property of Galileo' s Paradox into the characteristic property of infinite sets . We shall call a set satisfying Dedekind' s definition Dedekind-infinite; a set which is not Dedekind-infinite is said to be Dedekind-finite (1) . One can prove that a set is Dedekind-infinite if and only if the set contains a denumerable (8) subset (9) . I t is not difficult t o show that every standard finite set A i s Dedekind-finite. The proof is carried out by induction on the number n of elements in the set A. The proof of the converse that every Dedekind-finite set is standard finite, although it seems very obvious, makes use of the axiom of choice (1°) , a much-debated prin­ ciple in set theory. It has been shown that the use of the axiom of choice in this proof is essential (11) . It is sometimes said that Dedekind's definition of infinite set was discovered independently by the American logician C . S . Peirce ( 12 ) . In fact, Peirce claimed that he had sent Dedekind a reprint of Peirce' s 1 8 8 1 paper On the Logic of Number, in which there is essentially the same definition that later appeared in Dedekind' s 1888 monograph. Thus, Peirce accused Dedekind o f plagiarism, since Dedekind had made no mention of Peirce's work. A thorough study of this dispute has just been published by Francesco Gana ( 13 ) , who brings out two important facts . Dedekind already had invented his definition of infinite set several years before 1 88 1 . He had communicated it to Weber in 1878, and a draft of his 1 888 monograph had been prepared between 1 872 and 1878. Moreover, Peirce' s 1 8 8 1 paper does not contain a definition of Dedekind-finiteness . In that paper, Peirce defines a set to be finite if it admits a one-to-one correspondence with an initial segment of the natural numbers. The connection with Dedekind's definition occurs in Peirce's discus­ sion of De Morgan' s syllogism of transposed quantity ( 14 ) , which Peirce formulates as follows: (6) Dedekind ( 1 888). (') De fining finite in terms of infinite is not necessarily counterintuitive. In a letter to C lerselier, Descartes wrote: (Correspondence, ed . by Ch. Ad am and P. Tannery, 5 vo li . , Paris 1974-1976, vol . V, p. 356). ( 8 ) A set is said to be denumerable if and only i f it can be put into one-to-one correspondence with the set o f natura! numbers . (9 ) See Mendelson ( 1 964), chap. 4 . ( 10) The axiom of choice ( A C) claims that, far every set A , there i s a so-called choice function which assigns to each non-empty sub set of A some element of that sub set . This principle gained great notoriety when it was used by Zermelo ( 1 904) to prove that every set can b e well -ordered (by a well­ ordering o f a set we mean an ordering under which every non-empty sub set has a least element) . An extensive deb ate followed about the vali dity o f (AC) and about the treatment of infinite sets. (AC) is provable far finite sets; it is only problematic far infinite sets . See Moore ( 1 982) . ( 1 1 ) For a study o f sets which are infinite but not Dedekind -infinite, see Wrinch ( 1 92 3 ) . ( 12 ) See Dauben ( 1 977) . ( 13 ) Gana ( 1985). ( 1 4) De Morgan ( 1 860) .

13 1

Every Texan kills a Texan. No Texan is killed by more than one Texan. Therefore, every Texan is killed by a Texan. Abstracting from the gory particulars, we obtain the following inference:

(i) For every x in T, there exists y in T such that Kxy. (ii) For any x, y, z, in T, if Kxz and Kyz, then x y. Therefore, (iii) For any y in T, there exists x in T such that Kxy. =

Peirce, however, interpreted (i) to mean that K determines a function: (i ') For every x in T, there exists o ne and only one y in T such that Kxy. Let us cali a set T Peirce-finite if and only if any relation K o n T satisfying (i ') and (ii) also must satisfy (iii) . It is obvious that a set T is Peirce-finite if and only if T is Dedekind­ finite. However, in his 1 8 8 1 paper, Peirce proved only that every standard finite set is Peirce-finite and gave no hint that he thought the converse true. In a later artide On the Algebra of Logic in 1885, Peirce gives a definition, equivalent to Dedekind's, suggested by another syllogism of De Morgan. In Gana's opinion, Peirce realized for the first time in 1890 that the notion he studied in his 1 8 8 1 paper could be used as a definition of finite set, but, in looking back, his memory betrayed him into taking for granted that he must have been aware of the definition in 188 1 ( 15 ) . Gana points out that Peirce needn't have assumed in (i ') that K determines a function. This yields another definition: T is Ganajinite if and only if every relation K on T satisfying (i) and (ii) also must satisfy (iii) (another way of expressing this is to say that any function from a subset of T onto T must have ali of T as its domain) . It is easy to prove that every standard finite set is Gana-finite and that every Gana-finite set is Dedekind-finite. The reverse implications seem to require the axiom of choice (we can be sure that at least one of them does) . By refining the definition of Gana-finiteness, it is possible to interpolate in­ finitely many different definitions of finitiness between standard finiteness and Dedekind­ finiteness. For each positive integer n, replace (i) by the statement: m

(i). For every x in T, there exists at least one and at most n elements y T such that Kxy.

Then T is said to be n-Gana-finite (abbreviated G.-Fin(T) ) if every relation K on T satisfying (i). and (ii) also must satisfy (iii) . Clearly, T is Dedekind-finite if and only if T is l -Gana-finite. It is easy to prove that every standard finite set is n-Gana-finite and that every n-Gana-finite set is Dedekind-finite. Moreover, any n + l -Gana-finite set must be n-Gana-finite. Thus,

Fin(T) => . . . => G. + 1-Fin(T) => G.-Fin(T) => . . . => G2-Fin(T) => Ded-Fin(T). Here, Fin(T) means that T is standard finite, and Ded-Fin(T) means that T (1 5 ) Gana also notes that the German mathematician Liiroth in 1 8 7 3 had proposed a de finition equivalent to Dedekind ' s ; see Schroder ( 1 898) .

132

is Dedekind-finite. The reverse implications Gn -Fin(T) � G n 1-Fin(T) hold under the assumption of (AC) but can be proved under much weaker assumptions. There has been extensive research on definitions of finiteness. Of special in­ terest are definitions that are equivalent to standard finiteness but do not involve the notion of natural number. Here is a short list. (a) There is a well-ordering of T whose inverse is also a well-ordering of T ( 16) . (b) If :J' (T) denotes the set ali subsets of T, every non-empty subset of :J' (T) has a member which is minimal (respectively, maximal) with respect to the inclusion relation ( 17 ) . (c) :J' ( :J' (T)) is Dedekind-finite ( 1 8 ) . (d) T belongs to every class B of sets such that 0fB and, for every set u in B and any v, u U[v]fB ( 19 ) ; (here, 0 is the empty set, U is the union operator, and [v] is the unit set of v) . (e) There is a function from T into T which does not map any proper subset of T into itself (2 °) . Definition (e) was a second definition given by Dedekind, who conjectured that it was equivalent to Dedekind-finiteness . A definition that, in the absence of (AC), is weaker than Ded-Fin(T) is : T cannot be partitioned into two sets, each of which is equinumerous with T. A definition of finiteness that is intermediate between Fin(T) and Ded-Fin(T) is that :J' (T) is Dedekind-finite (which, in addition, implies Gn -Fin(T) for ali n) (2 1 ) . +

The Existence o/ Infinite Sets Dedekind had the naive boldness to try to show the existence of infinite sets. In Proposition 66 of his 1888 monograph, he gives a proof that the world S of his ideas, the totality S of ali things which can be objects of his thought, is Dedekind­ infinite. Por, the function which assigns to each element t in S the idea t' that t can be an object of Dedekind' s thought is a one-to-one function from S into a proper subset of S. Bolzano (22 ) gave a similar demonstration that the set of true propositions is infinite. Start with any true proposition A, form the true proposition B asserting the truth of A, then the true proposition C asserting the truth of B, and «so forth without end». An even earlier example was given by the writer Jonathan Swift ( 1667- 1 745) in On Poetry: «So naturalists observe, a flea i Hath smaller fleas that on him prey; l And these have smaller stili to bi te 'em; l And so proceed ad infinitum. l Thus, every poet, in his kind, l Is bit by him that comes behind». Cantor made no attempt to prove the existence of infinite sets, but was firmly

b) .

( 16 ) Stac kel ( 1 90 7 ) . (") Tars ki ( 1 924) . (18) Whitehead and Russell ( 1 9 1 0 · 1 9 1 3 ) , vol . I I . (19) Ibidem. (20) Dedekind ( 1888). (2 1) More information on definitions of finiteness can be found in Tarski ( 1 924) and Lévy ( 1 958a,

(22 ) Bolzano ( 1 85 1) . 133

convinced of their existenceo He wrote: «The fear of infinity is a form of myopia that destroys the possibility of seeing the actual infinite, even though it in its highest form has created and sustains us, and in its secondary transfinite forms occurs ali around us and even inhabits our minds» (2J) o Others are equally convinced of the reverseo Hilbert, in his essay On the Infinite, said: Just a s i n the limit processes o f the infinitesimal calculus the infinite i n the sense of the infinitely large and the infinitely small proved to be merely a figure of speech, so too we must realize that the infinite in the sense of an infinite totality, where we stili find i t used in deductive methods, is an illu sio n [o o o] the infinite is nowhere to be found in reality, no matter what experiences, observations , and knowledge are appealed to ( 24 ) 0

This i s affirmed more recently and even more emphatically by Abraham Robinson: Infinite totalities do not exist in any sense of the word (i. e o , either really or ideally) o More precisely, any mention or purported mention of infinite totalities is, literally, meaninglesso Nevertheless, we should continue the business of Mathematics ' as usual', that is, we should act as if infinite totalities really existed (25 ) 0

Further on, h e says : It appears to me that the notion of a particular class of five elements, for example, of five particular chairs, presents itself to my mind as clearly as the notion of a single individuai (a particular chair, a particular table) [ o o o ] . By contrast, I feel quite unable to grasp the idea of an actual infinite totalityo To me there appears to exist an unbridgeable gulf between sets or structures of one, or two, or five elements, on the one hand, and infinite structures on the other hand, or, more precisely, between terms denoting sets or structures of one, or two, or five elements, and terms purporting to denote sets or structures the number of whose elements is in­ finite ( 26) o

But would Robinson have understood the term that denotes the set of Fermat primes, which contains at least five members and, according to present knowledge, may contain either five, or a finite number greater than five, or infinitely many members? In the Zermelo-Fraenkel system ZF of axiomatic set theory and in ali variants of that system, there is an axiom of infinity which explicitly assumes the existence of an infinite set, in fact, of a Dedekind-infinite seto Such an axiom was assumed in the first axiomatic set theory of Zermelo and in the theory of types of Whitehead and RusseU (27) 0 In all these systems, the axiom of infinity is unprovable from the rest of the axioms o Any mode! of the rest of the axioms will contain infinitely many elements, but there are such models which do not contain a member which is i tself infinite o (23) (24) (25) (26) (27)

134

Cantor ( 1 932), p. 204. Hilbert ( 1925 ) . Robinson ( 1965 ) . Ibidem. Zermelo ( 1 908); Whitehead and Russell ( 1 9 1 0- 1 9 1 3 ) .

We should not have any preconceived notion that an axiom of infinity cannot be proved from more basic set-theoretic principles . Quine's system NF (New Founda­ tions) is a kind of hybrid theory between the theory of types and ZF (28) . Its ax­ ioms are an axiom of extensionality (providing a basic property of equality) and a set existence schema assuring the existence of sets corresponding to stratified for­ mulas (that is, formulas satisfying the type restrictions of the theory of types) . Ernst Specker (29 ) made the shocking discovery that an axiom of infinity is provable in NF. He did this by disproving (AC); since (AC) would hold if ali sets were finite, it foliows that an infinite set must exist. The last word may not have been said here; some logicians suspect that NF is inconsistent. In a set theory without an axiom of infinity, most of elementary number theory and combinatorics could stili be derived. But the rest of mathematics (that is, almost ali of modern mathematics) would seem to be unsalvageable. That is the reason why Hilbert, Robinson, and other so-called formalists wish to behave as if there were infinite sets. Their position is analogous to certain philosophies of physics, according to which electrons and other subatomic particles are just convenient fic­ tions that are part of a theory enabling us to obtain verifiable empirica! results .

Different Kinds of Infinities C antor characterized two sets as having the same size in terms of their being equinumerous, that is, in terms of the existence of a one-to-one correspondence between them. Sets that are equinumerous are said to have the same cardinal number. If a set A is equinumerous with a subset of B but not equinumerous with B itself, then the cardinal number A of A is said to be less than the cardinal number B of B (this is written A < B ) . The cardinal number of the set N of natura! numbers is denoted X 0 while the cardinal number of the set of real numbers (or, equiva­ lently, the set of points on a line) is denoted c. It is not hard to prove that the set of even integers, the set of ali integers, and the set of ali rational numbers have cardinal number X 0 . In addition, every interval (open, closed, or half-open) has the cardinal number c. Ali of this supported the naive view that ali infinities are the same. But in 1873 Cantor discovered that X 0 < c, and in 1 8 9 1 he found his famous diagonalization proof of what is now called Cantor's Theorem: A < :l (A). The result X 0 < c is a special case, since c is also the cardinal number of the set :J' (N) of ali sets of natura! numbers. On the basis of Cantor' s Theorem, it is possible to build up a transfinite hierarchy of cardinal numbers by starting with X 0 N and iterating the operation :J (A). Can­ tor had already constructed a theory of ordina! numbers, which are numbers associa­ ted with weli-ordered sets (3°) . One can associate with each ordinai number oc a =

( 2 8 ) See Rosser ( 1 9 5 3 ) . ( 2 9 ) Spec ker ( 1 9 5 3 ) . (lO) Ordinai numb ers and cardinal numbers o f finite sets c a n be identi fied , since there is essen­

d tially only one well -ordering o f a finite set . But an infinite set, to which exact ly one cardinal correspon s,

135

set H(cc) by letting H(O) = 0, H(cc +

l) = :J' (H(cc)),

and, then at so-called limit ordinals

À (' 1 ) , letting H().) be the union of ali H(cc) with cc < À . The sets which belong to

these H(cc) 's form a model of the axiom system ZF, and the cardinal numbers H(cc) eventually exceed any given cardinal number. Cantor's Theorem apparently yields a contradiction when applied to the univer­ sal set V of all sets. By the theorem, V < if (V). On the other hand, :J' (V) is a subset of V, and therefore, :J' (V) 5 V. This contradiction, called Cantor's Paradox, forces us to conclude that it is impermissible to form the universal set V. Cantor was already aware of this paradox in 1 895 . In a letter to Dedekind in 1899, he wrote: A coliection can be so constituted that the assumption of a ' unification' of ali its elements into a whole leads to a contradiction, so that it is impossible to conceive of the coliection as a unity, as a 'completed object' . Such coliections I cali absolutely infinite or inconsistent collections.

The collection V, the collection of all cardinal numbers, and the collection of ali ordinai numbers are inconsistent collections. Severa! years later, Russell and Zer­ melo independently discovered a simple proof that the collection of all sets that are not members of themselves is also an inconsistent collection. One of the basic motives for Russell's theory of types and Zermelo's axiomatization of set theory was to provide a precise codification of set theory in which the avenues leading to the known paradoxes were closed off. Their efforts have been singularly succes­ sful; eighty odd years have passed without any contradiction having been found in their systems. Nevertheless, the fact that contradictions do result from a naive notion of set gives some credibility to the constructivist criticism of unbridled accep­ tance of infinite sets (3 2 ) . Within axiomatic set theory, i t i s possible t o imagine the existence o f cardinal numbers which are so enormously large that they are greater than any cardinal num­ bers which can be shown to exist on the basis of the presently accepted axioms. The simplest kind of such large cardinals are the so-called inaccessible cardinals (33) . In recent years, a vast number of interesting types of large cardinals have been invented ( '4 ) . Let us return now to the first assumption underlying Galileo's Paradox: (ONE-ONE) Two sets bave the same size i/ and only i/ there is a one-to-one correspondence between them.

To reject this nowadays would be akin to believing that the earth is flat. Yet, in a recent Ph. D. thesis written at MIT in 198 1 , Frederic Katz has offered what

can be well -ordered in many essentially different ways. For exampl e, the natura! numb ers, in addition to their usual ordering, can al so be well-or dered in infinitely many other ways, such as: l, 2, 3, 4, . , O; or 2, 3, 4, . , 0, 1 ; or O, 2, 4, 6, , l, 3, 5, , etc. ( 3 1 ) Limit ordinal s correspond t o non-empty well -or dered sets with n o l ast element . (32) See Beeson ( 1 984) for an up-to- d ate survey of constructivism. (33) See, for examp le, Keis ler and Tars ki ( 1 964) and Lévy ( 1 978). ( 3 4 ) See Kanamori and Magi dor ( 1978) . . .

. .

136

.. .

. . .

he considers an alternative to Cantor's theory. He accepts as nothing more than common sense the second assumption: (SUBSET) If A is a proper subset of B, then A has smaller size than B .

But i t i s not enough just t o assert this. I t must form part o f a generai theory of set size which is both consistent and useful. Dr. Katz proceeds in the following way. The object is to obtain all sentences which are true for all finite sets and are consistent with (SUBSEn . Since (ONE-ONE) holds for all finite sets, it is neces­ sary to restrict the language of the sentences that we shall consider. In addition to the symbols of first-order logic with equality, the language of Boolean algebra will be included (that is, 0, I, U, n , C ) . Moreover, in order to talk about size of sets, we introduce predicates x < y, x> y, x = y, and sum (x, y, z), where x < y means that x has smaller size than y , x > y i s equivalent t o y . DEF= .

x > y # y et 1f'" varient parmi des fonctionnelles de type supérieur, représentant l'itération de l' action de restreindre les quantificateurs numériques à des univers finis. Cette fois-ci, les opérations logiques infinies seront représentées par des transfor­ mations 'effectives' opérées sur la partie existentielle (le l!>) des interprétations. Cette interprétation a en gros les memes qualités et les memes limites que les travaux de Gentzen: i) au niveau des opérations, les quantificateurs sont éliminés au profit de cons­ tructions effectives, du ressort de l'infini potentiel; ii) au niveau des méthodes de démonstration, la réduction est beaucoup plus discutable. Détaillons ces deux points. I. 4.a. La sémantique des types supérieurs. - Les fonctionnelles de type supérieur sont des fonctions qui prennent comme arguments des fonctions etc. Pour montrer que de telles fonctions sont du ressort de l'infini potentiel, il faut etre à meme de les approximer au moyen de données finies, autrement dit de trouver des principes de continuité adaptés. L'idée la plus évidente, qui consiste à interpréter la 'continuité' topologiquement, est pratiquable, mais peu intéressante, à cause de sa lourdeur. En analogie avec un autre domaine où ce type de finitarisation s'est révelé intéressant 1 46

(les fonctions ordinales, finitarisées par les dilatateurs), il est tentant de regarder ces notions du point de vue de la théorie des catégories : i) les approximations finies d'une structure infinie s' expriment par des limites inductives filtrantes (limites directes, notation: lim); ii) il y a une notion d'intersection de deux approximations finies (sans analo­ gue topologique) qui s'exprime par le concept de produ'it fibré.

Les domaines qualitatifs sont une forme très générale de structure sur laquelle on a une notion de fonction effective: un domaine qualitatif est un ensemble de parties, qui est non vide, clos par unions filtrantes et par sous-ensembles. Une fonc­ tion 'finitaire' de X vers Y sera une fonction croissante pour l'inclusion, et se com­ portant bien par rapport aux approximations finies (i. e. unions filtrantes, limites directes) et aux intersections de parties compatibles (i.e. produits fibrés) . Le concept de domaine qualitatif est suffisamment général pour que l'ensemble des fonctions 'finitaires' de X vers Y forme lui-mème un domaine qualitatif X � Y. Mais aussi le concept est suffisamment simple pour qu'il soit possible de faire de vrais calculs sur les interprétations . I. 4. b. Preuves dans !es types supérieurs. - En fait nous avons à décrire sous quelles conditions on peut conclure qu'une expression tl$ V lf" A a) et d' objets de types variables, comme ida, l'identité de a, de type a => a. Ce système :J, introduit par l' auteur, possède essentiellement, outre la classique flèche a => -r (fonctions 'effectives' de a vers -r) , le schéma 1\ aa[a] , dénotant des fonc­ tions 'uniformes' associant à tout type -r, un objet de type a[-r] . Par exemple, il y a un objet de type 1\a·a => a, l'identité uniforme, qui evalué sur n'importe quel type -r, donne l'identité de -r: ID(-r) = Id•. _

II.3. L 'interprétation de :F :F possède au départ une caractéristique étrange, qui est l'équivalent exact de la non-prédicativité, à savoir que les types variables n'ont pas d'interprétation 'nai:ve' en théorie des ensembles. En effet, un objet de type 1\ aa[a] prend pour arguments 148

cles types " quelconques, y compris " = 1\ao'[a] . En particulier il n'est pas possible d'interpréter de tels objets par cles graphes fonctionnels (alors que les types supérieurs de Godei sont justiciables d'une telle interprétation, mème si elle est de gout dou­ teux) . En d'autres termes, :F ne peut pas ètre interprété de façon naturelle par l'infini actuel, alors qu'il existe une interprétation satisfaisante de :F en termes d'infini potentiel. II.3.a. Interprétation des types variables. La difficulté pour comprende 1\aa[a] , c'est que a varie sur une totalité qui n'est pas bien définie. Ceci di t, si on restreignait a à ne varier que sur une liste préétablie L de types, nous n' aurions aucun problème à interpréter /\ aa[a] par /\ aeL a[a] . Par con tre, un objet ainsi interprété n' aurait plus de valeur sur un type en dehors de L. L'idée est de trouver un moyen de prolonger une fonction définie sur L en une fonction définie sur tous les types. Ceci se fait en utilisant les limites directes et les produits fibrés . U n type est interprété par u n domaine qualitatif quelconque, autrement dit, 'TYPE = DOMAINE QUALITATIF' . La liste L sera formée de tous les domaines qualitatifs finis (pris à isomorphisme près) et qui constituent un bon exemple d'infini de type potentiel. Maintenant, si on connait la valeur d'un objet A de type variable sur XeL : A(X), ainsi qu'un lien entre A(X) et A (Y) quand X s'identifie à un ' sous-type' de Y, i.e. si A est défini comme un foncteur sur L, alors A peut ètre défini sur un type X quelconque par limites directes, et nous sommes ainsi débarrassés de la circularité. L'interprétation est simple et économique; par exemple, l'identité uni­ forme ID, interprétée ainsi, ne consiste que d'un point ID = [( 1 , ([O] , O)] , avec l = le domaine qualitatif [ 0 , [ OJJ . C et unique point permet de retrouver tous les JJX par une formule simple. -

II.3.b. Enoncés universels dans :F. Les constructions non-prédicatives ont pu ètre réduites à l' opération d'infini potentiel (clone prédicative) de limite directe. Bien entendu, on doit quelque part utiliser un principe non-élémentaire, pour établir cles identités de la forme V 'l"A'Y, et nous savons que ce principe ne sera qu'une réduc­ tion douteuse du schéma de compréhension. Ce principe, qui peut ètre formulé de bien cles façons, n'est rien d'autre qu'un principe d'induction II� dans :F, analogue à celui que nous avions utilisé pour les fonctionnelles de Godei. -

Résumons en quelques mots ce que nous avons déjà répété ad nauseam: i) les opérations infinies actuelles se laissent 'potentialiser' sans problèmes majeurs; ii) les principes de démonstration correspondants offrent une résistance irré­ ductible à la potentialisation. Tout ce qu'on obtient à ce niveau n'est au mieux qu'une 'réécriture' très différente cles principes de départ, comme par exemple TI(e.r) ou les principes d'induction cles systèmes de fonctionnelles.

149

Solomon Feferman

Infinity in Mathematics : Is Cantor N ecessary? (*) lnfinity is up on trial [ ] (Bob Dylan, Visions of Johanna) . . .

Dedicateci t o the memory o f my friend and colleague Jean van Heijenoort

Introduction

Since tbe rise of abstract matbematics in Greek times, matbematicians bave bad to grapple with tbe problems of infinity in many guises. Wben mathematics became an integrai part of pbysical science it could be used to formulate precise answers to tbe age old questions: Is space infinite? Did time have a beginning? Will it bave an end? Modern cosmologica! tbeories now marshal considerable pbysical evidence to support tbe finitude of space and time. But wbetber or not (or bow) infinity is manifested in tbe pbysical universe, matbematics requires at its base tbe use of various infinite aritbmetical and geometrica! structures. Without tbese no coberent system of matbematics is possible; and since matbematics is essential for tbe formulation of pbysical tbeories, tbere is also no science witbout tbese uses of tbe infinite at tbe base. Beginning in tbe 1870's, Georg Cantor carne to realize tbat one must distinguisb different orders or sizes of infinity of tbe underlying sets of objects in tbese basic matbematical structures . As be continued to work out tbe implications of bis ideas, he was led to tbe introduction of a series of transfinite cardinal numbers for measuring tbese sizes. Many matbematicians of Cantor's time were disturbed by bis work, partly due to tbe novelty of bis concepts and partly due to tbe uncertain grounds on wbicb bis computations and arguments witb tbe scale of cardinals rested. But some reacted in direct opposition to Cantor's work, for bis reintroduction of tbe 'actual infinite' into matbematics (ironically, after that seemed to bave been finally eliminated from analysis by tbe previous foundational work of tbe 1 9'h century) . (*) This is an expanded version of my contribution to the conference held in Rome, January 7- 1 1 , 1986, organized by the Istituto della Enciclopedia Italiana and the Istituto Gram­ sci. While t he bulk of t he exposition is intended for a generai audience, I address fundamental questions which are o f interest to specialists as well . The l atter can pass quickly from the statement of my two main theses in the Introduction to the cases I make far them in the sections which comprise the last third of the p aper.

15 1

One of Cantor's most vigorous and severe critics was his former teacher, Leopold Kronecker, who would admit only 'potentially infinite' sets to mathematics and, indeed, only those reducible to the natural number sequence O, l , 2, 3, . . . . Worries about the Cantorian approach were compounded when, around the turo of the century, paradoxes appeared in the theory of sets by taking its ideas to what appeared to be their logical conclusion. The most famous and simplest of these contradictions was due to Bertrand Russell, but earlier ones had already been discovered for Cantor's transfinite numbers by Cesare Burali-Forti ( 1 ) and even by Cantor himself. While these paradoxes did not worry Cantor, the vague distinctions between the transfinite and the 'absolute' infinite that he made in order to avoid them could not at first be made precise. But the contradictions plagued Russell and he attempted many solutions to escape them, i.e. he sought precise systematic grounds for accepting substantial portions of Cantor's theory while excluding the paradoxes. The means at which Russell finally arrived is called the theory of types, and though it proved to be very cumbersome as a framework for set theory, it did restore a measure of confidence in Cantor' s work. Independently, Ernst Zermelo introduced an axiomatic theory of sets which featured a simple device for limiting the size of sets so as to avoid the paradoxes while providing a very flexible and ready means for the precise development of a considerable portion of Cantor's theory of higher infinities. Extensions of Zermelo' s axiom system, which will be described below, allow one to develop Cantorian theory in full while avoiding ali known paradox­ ical constructions. Parallel to the work by logicians providing an axiomatic foundation for higher set theory, Cantor's ideas were put to use more and more in mathematics, so that nowadays they are largely taken for granted and permeate the whole of its fabric. But there are stili a number of thinkers on the subject who, in continuation of Kronecker' s attack, object to the panoply of transfinite set theory in mathematics. The reasons for doing so are no longer the paradoxes, which have apparently been blocked in an effective way by means of the axiomatic theories devised by Zermelo and his successors. Rather, the objections to the Cantorian ideas reside in fundamen­ tally differing views as to the nature of mathematics and the objects (numbers, points, sets, functions, . . . ) with which it deals. In particular, these opposing points of view reject the assumption of the actual infinite (at least in its non-del)umerable forms) . Following this up, alternative schemes for the foundations of mathematics have been pursued with the aim to demonstrate that everyday mathematics can be accounted for in a direct and straightforward way on philosophically acceptable non-Cantorian grounds . While genuine progress has been made along these lines, the successes obtained are not widely known and the alternative approaches have attracted relatively few adherents among working mathematicians. The generai im­ pression is that non-Cantorian mathematics is too restrictive for the needs of mathematical practice, regardless of the merits of the guiding non-Cantorian philosophies. (') Actually, Burali-Forti' s paradox was only implicit ly contained in his work . Incidentally, Rus­ sell ' s paradox was found independent ly by Zermelo in 1902 . Whil e t he work was not published , Zermelo cl aimed t hi s earlier discovery in his 1 908 paper; t hat h as subsequently been con firmed by a variety o f evidence in Rang and Thomas ( 1 9 8 1 ) .

152

Some logicians would now go further to bolster this impression by giVmg it a theoretical underpinning; their aim is to demonstrate that Cantor's higher infinities are in fact necessary for mathematics, even for its most finitary parts. The results that have been obtained in this direction do, at first sight, appear to justify such a reading. Nevertheless, it will be argued below that the necessary use of higher set theory in the mathematics of the finite has yet to be established. Furthermore, a case can be made that higher set theory is dispensable in scientifically applicable mathematics, i. e. in that part of everyday mathematics which finds its applications in the other sciences. Put in other terms: the actual infinite is not required /or the mathematics of the physical world. The reasons for this depend on other recent developments in mathematical logic, the description of which is the fina! aim of this paper. In order to explain the objections to Cantor's ideas in mathematics that lead one to search for viable alternatives, one must first provide some understanding of their nature and use. This will be clone here more or less historicaliy though necessarily in outline; we start with a rather innocent looking problem about the existence of certain special kinds of numbers (2) . From Transcendental Numbers to Transfinite Numbers

There are two basic number systems (having ancient origins), the set N of natura! numbers O, l, 2, 3, . . . used for counting, and the set R of rea! numbers used for measuring. The latter represent positions of points on a two-way infinite strai�t line, relative to any initial point O (the 'origin') and any unit of measurement 0 1 . R i s pictured a s foliows :

N can thus be identified with a subset o f R . Other subsets o f use are Z = [. . . , -3, -2, - l , O, l, 2, 3, . . .} (the set of ali integers) and Q = [n/m / n, m E Z and m .r O}, the set of rational numbers, consisting of ali quotients or ratios of integers with non-zero denominators. We here write 'x E S' for the relation of membership of an object x to a set S, and '{x:P(x)j ' for the set of ali objects x satisfying a determinate property P(x) . If x does not belong to S we write 'x t S'. Finite sets S can be denoted directly by a listing of their elements as S = {ao, a1, a2 , . . . , an}. This notation is extended to certain infinite sets such as N = {0, l, 2, . , n, .. .} and Z (as above), when we have a complete survey of their elements. If 5 1 and 52 are sets then S1 is a subset of S2 , in symbols S 1 C S2 , if for every x E S 1 we have x E S2; S2-S 1 = {x:x E S2 and x t Sd then denotes the difference of these two sets. S2 -S1 might be empty, when S1 = S2 ; the empty set is denoted by � . .

(2) This is not where Cantor himsel f started , t hough he carne to it soon enough . For a goo d de· tailed introduction to t he history of the development o f Cantor's ideas see Grattan-Guinness ( 1 980), chapters 5 , 6 (b y ]. W . Dauben and R . Bunn resp.). For a deeper pursuit I would recommend most highly the book s Moore ( 1982) and H all e tt ( 1984) .

153

The set Q is densely dispersed throughout R and cannot be distinguished from R by a simple picture as above. A basic realization from Greek geometry was the existence of irrational magnitudes, i.e. elements of R-Q. For, Pythagoras' law giving the hypotenuse c of a right triangle in terms of its legs a, b by c! = a2 + b2, or equiv ently c = va2 + b2 , Ieads directly to quantities such as v2 = v1 2 + 1 2 and /5 = 1 2 + 22 which are easily proved to be irrational. Other kinds of irrational numbers also arise naturaliy in geometry, e.g. 3 /i in the classical problem of the duplication of the cube (i. e. construction of a cube with double the volume of a given one), and 11:( = 3. 1 4 159 . . ), the ratio of the circumference of a circle to its diameter. However, the proofs of the irrationality of numbers like 11: only carne much later. Other irrational numbers arise from the solution of algebraic equations; e.g. one solution of x4- 7 = O is x = 4 /i and of x6-x3 - l = O is x = 3 V(l + /5)/2. Some equations, such as x2 + l = O, have no solutions in real numbers, although we can treat their solutions in the extension of the real number system by the imaginary numbers such as H; however, those will not concern us here. A real number is calied algebraic if it is the solution x of a non-trivial polynomial equation p(x) = O with integer coefficients, i.e. p(x) = k,x" + kn_ 1X'- 1 + . . . + k1x + ko with n> O and kn � O, and each k;€Z. We use 'A ' to denote the set of ali (real) algebraic numbers . Thus Q C A and A contains ali the irrational numbers shown above, except possibly 11:. However, i t is natura! to suspect that rrf A, since there is no known polynomial equation of which it is a root. This was in fact first conjectured by Legendre in the 1 8'h century, but a proof did not come until a century later. A number is called transcendental if it is in the set T = R-A. Another specific number which, like 11:, is ubiquitous in mathematics and was conjectured to be transcendental is the base e( = 2. 7 1 828 . . . ) of 'natura!' logarithms. The first proof that there exist any transcendental numbers at alt, i. e. that T� �' was given by Liouville in 1844. His method was to find a property P(x) which applies to ali algebraic numbers x and which says something (technical) about how weli x can be approximated by rational numbers. Liouville then cooked up a real number l which does not satisfy the property P, so l must be transcendental. Infinitefy many other transcendental numbers can also be produced in this way, but Liouville's method did not help answer the specific questions as to whether e and 11: are transcendental. Those results were not obtained until somewhat later, by Hermite ( 1873) and Lindemann ( 1882), respectively, using rather special methods . In the meantime, Can­ tor published in 1874 a new and extremely simple but striking argument to prove the existence of transcendental numbers . Cantor's result in this respect was no better than Liouville's, but the methodology of his proof turned out to be one of the main starting points for his novel conception of infinity in mathematics . First o f ali, Cantor defined two sets S I and s 2 t o b e equinumerous i f their elements can be placed in one-to-one correspondence with each other; symbolically this is indicated by 51 - 52. A set 5 is finite if it is equivalent to some initial seg­ ment of N, possibly empty, i. e. 5 - {0, . , n- l}, where n 2: O. A set 5 is called denumerable if 5 is finite or 5 - N. Every non-empty denumerable set 5 can be listed as 5 = [ao, a1, . . . , a"' . . } possibly with repetitions, and conversely. From this foliows directly severa! basic facts :

,

.

.

154

,

..

( l ) a denumerable union of denumerable sets 1s denumerable; (2) tbe set Q is denumerable;

(3) tbe set A is denumerable. In ( l ) we are considering sets Sa, S1, , Sm · · · each of wbicb 1s denumerable, and may be assumed non-empty; tbese are listed as . . .

The arrows have been added to show that the union S can be listed foliowing tbe indicated arrows as

Now, for (2) , take S. to be tbe set of ali multiples m/n for n � O and m in Z; eacb S. is denumerable and tbeir union is Q, so (2) foliows. To prove (3), one sbows first tbat ali equations of tbe form k,x"' + + k1x + ko = O witb integer coef­ ficients and km � O can be enumerated. If plx) = O is tbe n'h such equation, take S. to be tbe set of its solutions. This set is finite (possibly empty), bence certainly denumerable. But tbe set A of algebraic numbers is tbe union of tbese S. 's, so it also is denumerable, i. e. (3) bolds. Now, in contrast, Cantar sbowed that: . . .

(4) R is non-denumerable.

In other words tbere is no way to list R as a simple sequence of real numbers, [xo, X 1 , x2, .}. Cantor's first proof of (4) made use of special properties of R. Later be gave a simpler proof wbicb could be generalized to otber sets; tbis used bis famous diagonal argument. It is sufficient to show tbat tbe set of reals x between O and 1 c annot be enumerated. Indeed, given any enumeration [x0, X1, x21 .} of a subset of R, we sbali construct a number x wbicb is not in tbe enumeration. First write each member of [x0, X 1 , x2, .} as an infinite decimai: . .

• •

..

Now form x = O. k1k2k3 k not in [xa, X 1 , x21 } by cboosing k1 � a1, k2 � b2, k3 � c3 , etc. For example, take k1 = O if a1 � 0 and k 1 = 1 if a 1 = O, etc. Tbis proves (4) ; it tben foliows immediately from (3) tbat A � R . Hence T = R-A must be non­ empty, and tbus tbe existence of transcendentals is newly establisbed. In fact, T must also be non-denumerable, for otberwise by ( l ) and (3) we would bave R denumerable. Tbis is a stronger conclusion tban Liouville's, wbicb was merely tbat T is infinite. Clearly tbere are two senses of tbe size of a set involved bere. If S1 is a pro• • •



. . .

• • •

155

per subset of S2 then it is smaller than S2 in the sense of containing fewer elements. But it may well be possible for S 1 to be a proper subset of 52 and stili have 51 and S2 being of the same size in the sense that S1 - S2 . Por example, N = {0, l, 2, . . . , n, . . .} is equinumerous with the set E = {0, 2, 4, . . . , 2n, .. .} of even integers, though E is a proper subset of N. Similarly Q- A by the above, though Q is a proper subset of A . Intuitively, any infinite set 5 is of the same size as a proper subset, while finite sets are just those which are not equinumerous with any proper subset. So if S1 is a subset of S2 and we do not know whether S1 is a proper subset of S2 , one way to establish that is to show that S 1 and S2 are not equinumerous, in symbols, Sr>'- S2 ; however, to do so would require a special argument, since by the preceding S1 - S2 is weli possible for proper subsets. In the case of S 1 = A and S2 = R that is accomplished by the results (3) and (4) above. Cantor's argument is novel not only in the concepts (set, equinumerosity, denumerability, non­ denumerability) and results ((1)-(4)) involved but also in a basic point of methodology: Cantor finds a property P* of sets and shows two sets S1, S2 to be distinct by showing that one of them has the property P* while the other does not. Moreover, the existence of elements of a special kind follows by a purely logica! argument: if S1 is a subset of S2 and P*(SJ holds while P*(S:J does not hold, then S1 must be a proper subset of S2 , i. e. there exists an element x of S2-S1 . Since two finite sets [a 1, a2, . . . , an} and [b1, b2, . . . , bm} (of distinct elements) are equinumerous just in case they have the same number of elements (n = m), Cantor was led to say in generai that two sets S 1 and 52 have the same number of elements if S1 - S2 . One may regard the number of elements in 5 as an abstraction from its specific nature which isolates just what it has in common with ali equinumerous sets. Thus, for example [1, 2, 3} - [1, 3, 2} - [/i, 3 /5, 1r}, ali have the same number 3. Por Cantor this was a process of double abstraction: the first leve! S abstracts away all that is distinctive about the ele!Ili!nts of 5 except how they are placeg in a certain order, and the second level S abstracts away the order as weli; S is called the cardinal number of S. Here instead we shall write card(S) for S. Por example, card([/i, 3 ,;5, 1r}) = 3, card([5}) = l and card(�) = O. To identify the cardinal number of infinite sets we need new names. Cantor used the Hebrew letter X (aleph) with subscripts to name various infinite cardinal numbers, beginning with card(N) = X Thus also card(E) = card(Q) = card(A) = X but card(R) � X To name the cardinal number of the continuum R, a new symbol c is introduced by definition as c = card(R). There is another way of naming card(R) that comes from the extension of the arithmetic operations of addition, multiplication and exponentiation to infinite car­ dinals, as follows. Suppose n = card(SJ and m = card(S:J; we can assume, without loss of generality, that S1 and 52 are disjoint. Then define n + m = card(S1 + S:J, where S1 + S2 is the union of S 1 and S2 . Next, define n x m = card(S1 x S:J, where S1 x S2 is the set of all possible ways (x, y) of combining an element x of 5 1 with an ele­ ment y of S2 . Finally, define nm = card(S/2) where 51 52 = . . . 51 x . . . x S1 x . . . conSz sists of ali possible combinations of elements of 5 1 , one for each position in S2 . o·

156

0,



For 51, 52 finite tbese definitions of + , x and exponentiation agree witb tbe usual ones, but for 5 1 or 52 infinite we obtain new results . As examples of calculations witb tbe latter, one bas for any finite n. For tbis reflects tbe relations

[0, l , . . . , n- l} + [n, n + l, . . .] - [O,

2,

4, . . .] + [1 , 3, 5, 7, . . .] - [O, l,

2,

. . .

]

.

Tbus unlike tbe case for finite m wbere n + m is greater tban m, we bave m + m = m for m = X Similarly, for tbe same m we bave m x m = m; tbis corresponds to the fact tbat a denumerable union of denumerable sets is denumerable. In order to represent tbe cardinal number c of R in terms of tbese operations, we return to tbe relationsbip of R witb Q. Eacb element x of R is approximated by sequences or sets of rationals in various ways. One way is to associate witb x tbe subset Q. of Q consisting of ali rationals r witb r>. This is apposite to the position taken here, that one may be led to accept such results without assuming higher-type notions in the platonist sense. However, as regard s the finite combinatoria! independence resul ts to be discussed in the next sub-section, Isaacson and I agree that they are ob tained by a transmuta­ tion o f essentially metamathematical statements coded in the language o f arithmetic.

1 94

Undecidable Diophantine Problems. - Tbe results bere, and tbe question of tbeir relevance to everyday matbematics just raised, are comparatively easy to discuss. Diopbantine equations are tbose of tbe form p(xh . . . , x,J = q(x1, . . . , x,J wbere p, q are polynomials in one or more variables witb coefficients in Z (the integers) . A diopbantine problem is one wbether there exist integer solutions of sucb an equa­ tion, i.e. wbether ('ilx1, . . . , x. E ZJ p(x1, . . . , x,J = q(x1, . . . , x,J. Hilbert's l O'h pro­ blem in bis 1 900 list asked wbether there is an effective metbod to determine wbe­ tber or not a diophantine equation is solvable, i. e. bas any integer solutions . Tbere is a closely related group of problems for solutions in N, and for solutions in Q. Specific sucb questions were first considered by the Greek matbematician Diophan­ tos (3dc. A . D . ) ; after a long lapse, tbe subject was revived by Pierre de Fermat in tbe 1 7'h century and has been a staple of number tbeory ever since . Many spe­ cific diophantine problems bave so far resisted attack. Among the most famous is Fermat's ' Last Tbeorem' (FLT) which stands as an unproved conjecture, namely tbat the equation x" + y" z" has no non-trivial solutions (xyz ;;é O) for eacb n > 2 . Tbe first step toward a negative solution o f Hilbert ' s l O'h problem was made by Gi:idel in bis 19 3 1 incompleteness p aper. H e sbowed there that every primitive recursive function F(x) is aritbmetically definable, bence can be put in tbe form =

(l)

F(x) = y+-. Q1Z1 . . . Q.z. R(x, y , Z1, . . . , z,J

wbere eacb Q is tbe universai ( V ) or existential quantifier ('il) , tbe variables Z; ran­ ge over N, and R is built up by /\ , V and ..., from polynomial equations . It follows that every m statement V xF(x) = O is likewise definable in tbat form. Godei con­ cluded from ( l ) that for eacb (w-) consistent formai system 5 containing a sufficient amount of number tbeory, tbere are aritbmetical propositions A wbicb cannot be decided by 5, i. e. such that neitber 5 f- A nor S f- • A . In tbe later development of the tbeory of effective computability at tbe bands of Churcb, Kleene, Turing, Post and others, attention sbifted from individuai pro­ blems A undecidable relative to given formai systems 5, to effectively undecidable problems for subsets C of N, i.e. for wbicb there is no effective metbod to determine, given an arbitrary x in N, wbether or not xEC. By Cburcb' s tbesis, tbe effectively decidable sets C are exactly tbose whicb bave a generai recursive cbaracteristic func­ tion, and then tbese are exactly the same as tbe .11 sets. Church gave examples of recursively enumerable sets wbich are not recursive, in otber words wbicb are in the class 2::1 but not in m . Beginning i n tbe 1 950's, considerable progress was made o n Hilbert's l O'h prob­ lem througb tbe work of M. Davis , H . Putnam and J. Robinson. Tbey succeeded in sbowing that if variable exponents are permitted, every 2::1 set C is definable in tbe form (2)

xE C-'ilz1, . . . , Zn [p(x, Z1, . . . , z,J = q(x, Z1, . . . , z,J]

wbere p, q are exponential integer succeeded in establishing a result of this finally sbowed tbe answer to quently, Matijasevic and Robinson n � 13 to represent as in (2) every

polynomiais. Finally, in 1 970, Ju . Matijasevic the same form for ordinary integer polynomiais; Hilbert ' s l O'h problem to be negative . Subse­ succeeded in showing tbat it suffices to take recursively enumerable set witb ordinary p, q. 1 95

This and a number of other results concerning Hilbert' s l O'h problem are reviewed in Davis, Matijasevic, Robinson ( 1 976). A few years later, Matijasevic managed to reduce the number of variables in the representation (2) of recursively enumerable sets from 13 to 9 for ordinary polynomiais, and even further to 3 variables for exponentiai polynomials (69) . Now, returning to undecidable propositions, it follows by Godel' s results that for suitable consistent systems S of arithmetic, there are true TI'l statements A of the form (3)

A = V x, Z1 , . . . , Zn [p(x, Z1, . . . , z,J � q(x, Z1, . . . , z,J]

which are not provable in S; by formalizing the work described above, this can be reduced to n :5 9 for ordinary integer polynomiais p, q. Impressive as these results are, the problems they concern are stili very distant from the bread-and-butter problems of everyday number theory ('everyday' over the last 300 years), because the number of variables is so much larger than is conside­ red in such problems, and the complexities of the polynomiais involved is so great (according to various measures of complexity) . There is no evidence that these unde­ cidability and incompleteness results have any relevance to the classic unsettled prob­ lems that have challenged generations of number-theorists . Though the chain from the originai undecidable propositions to the undecidable propositions of the form (3) is a long and technically complicated one (so that the point of departure recedes into the background), it remains the case that the problems thus shown to be undecid­ able were not of any prior mathematical interest - they have simply been derived in a step-by-step process from problems 'cooked-up' to demonstrate the incomplete­ ness of formai systems . As a further reinforcement to the view here that the results on undecidable diophantine problems are irrelevant to everyday mathematicai con­ cerns is that the character of these problems is insensitive to the formai system considered. If one takes A in (3) to be equivaient to ConpA, there is no way to tell it apart from an A taken equivaient to ConzFc or from one which is equivaient to the consistency (with ZFC) of the existence of measurable cardinais. This suggests that the mathematical content of the resulting individuai diophantine problems sim­ ply has nothing to do with the internai mathematicai content of the formai systems from which their independence is established. How much different it would be if one showed that Fermat's 'Last Theorem' FLT is not provable in PA, or even more strikingly, in ZFC - and thus demonstrated why i t' s so difficult to prove FLT (if true) ! There is nothing in the work o n undecid­ able diophantine problems to suggest that one is anywhere near obtaining such a result - or anything comparable - nor that further efforts in chopping n down in (2) or (3) is going to get one any closer to achieving such a result . The situation at present is thus anaiogous to that concerning transcendental numbers with which we began this story: Liouville and Cantor showed how to construct (explicitly or implicitly) transcendental numbers, but mathematicians wanted to know whether the numbers 1t and e are transcendental. For those results the work of Liouville (69) For re ferences to t his furt her work see Mathematical Reviews, 8 l f : 0305 5 .

1 96

and C antor was useless. Ali tbey did was demonstrate tbat tbe effort to sbow specific numbers to be transcendental numbers was not a waste of time, since sucb numbers do after ali exist . Working number-tbeorists want to know about tbe truth of specific diopbantine problems like FL T. It is bighly unlikely tbat o ne will simultaneously demonstrate tbe unprovability of FLT from certain S and tbe trutb of FLT, as was tbe case witb tbe non-provable propositions produced by Godei. But mathematicians would no doubt sit up and take notice if merely unprovability were establisbed. Ali tbat tbe cbain of work from Godei to Matijasevic permits one to say currently is tbat efforts to obtain such independence results for propositions of prior matbema­ tical interest are not necessarily a waste of time .

Independence Results far Statements o/ Finite Combinatoria! Character.

In the last ten years a number of interesting independence results bave been obtained witb respect to a wide range of formai systems for statements wbich are prima facie relevant to finite combinatoria! matbematics in its everyday sense. The expository artide Simpson ( 1 986) provides an excelient introduction to tbis area of work, and bas been quite useful to me in tbe following . Many of the results are ' finitizations' Pfin of strong infinitary propositions P, wbere P implies Pfin· In some cases we even bave P equivalent to Pfin· Tbe classic example of tbis sort is Konig's Infinity Lem­ ma, according to wbicb if T is a finitely brancbing infinite tree tben T bas an infinite brancb and (as is obvious) conversely . For T represented as a collection of finite sequences in N, tbe statement P tbat T bas an infinite brancb is :El, while for T finitely branching tbe equivalent statement Pfin tbat i t contains infinitely many nodes is TI3, and even TI'J for branching witb fixed bounds. As Simpson points out , Konig in bis 1 92 7 paper Uber eine Schlussweise aus dem Endlichen ins Unendliche tbougbt of bis lemma as a metbod of obtaining infinit­ ary results from finitary ones . Indeed, one of tbe most striking early applications of KL (Konig' s Lemma) was Godel ' s use of it in bis proof of tbe completeness tbeorem for l" order predicate logic : if a sentence A is consistent in tbat logic 0 tben it bas a model (' ) . Tbe bypothesis of consistency is TIJ, but tbis is used to build a binary brancbing infinite tree wbose nodes correspond to sequences of state­ ments or tbeir negations consistent witb S. In tbis case we obtain a :El conclusion from a TI'J bypotbesis . The argument requires classica! logic and can be carried out formally within PA , since tbe model constructed is aritbmetically definable . (Tbis situation is in a way a vindication of Hilbert ' s view discussed earlier tbat tbe infinite is already implicit in the use of tbe Law of Excluded Middle wben combined witb quantifier logic .) Now, to continue witb Simpson's point, tbe newer results discussed bere pro­ ceed in tbe apposite direction . Starting witb P wbicb is independent of a formai system S tbe effort is to obtain a finitary consequence Pfin of P wbicb is stili inde­ pendent of S. Tbe first striking example of sucb was provided by tbe tbeorem of Paris-Harrington ( 1 97 7 ) , wbicb is a modified form of tbe famous combinatoria! tbeo-

('O) Godei d.id not exp licit ly ac know ledge the use of Konig' s Lemma; c f . the d.iscussion in Go dei ( 1 986), pp. 5 3 - 5 4 , of his 1929- 1930 work on completeness.

1 97

rem due to F.P. Ramsey in 1930. Ramsey's theorem concerns partitions of the set of ali k-element subsets of a set X, i.e. (l) where [X] = [Y: Y� X and card(Y) = k ] and C, , Ct are pairwise disjoint. We deal here only with denumerable X and may assume X� N. The Infinite Ramsey Theorem P is the statement that if X is infinite then for any k and partition of [X] as in ( 1 ) , there exists an i $, l and an infinite subset Y of X such that ...

(2) In the case k = l = 2 this is interpreted as saying that any infinite graph whose edges (i.e. members of [XJ) are colored by one of two colors (C1 or C2), there exists an infinite subgraph ali of whose edges have the same color. Ramsey proved a finitary form Pfin of P which is as follows :

l and m there exists n such that for any X with card(X) = n and partition [X] = Cz U . . . U C1, there exists i $, l and Y � X such that card(Y) � m and [Y] � C;.

( 3 ) for any k ,

This statement can be seen to be a consequence of P by use of KL; if (3) is assumed false, then a finitely branching infinite tree T can be constructed such that an infinite branch X through it violates the conclusion of the Infinite Ramsey Theorem. It turns out that this Finite Ramsey Theorem (3) can be proved in Peano Arithmetic PA. The surprising result found by Paris and Harrington is that a slightly modified form P/!n of (3) is independent of PA . This Modified Finite Ramsey Theorem differs from (3) only by addition, to the conclusion, of the requirement that card(Y) � min (Y), where min (Y) is the least element of Y. The argument that P implies P/!n can again be carried out by contradiction and use of KL (though, as pointed out by Simpson, this use of KL is inessential) . Since the work of Paris and Harrington, a number of other results of finite combinatory character have been shown to be independent of PA. One of the simp­ lest is a theorem due to Goodstein concerning the effect of shifting bases in the representations of natural numbers to various bases b, which has been shown by Kirby and Paris to be independent of PA (7 1). It should be emphasized at this point that the statements Pfin thus shown in­ dependent of PA are recognized to be true by infinitary methods which go beyond PA . They can in fact be proved in the 2nd order system (I1�-CA) based on the arithmetical comprehension axiom with full induction. Moreover, Pfin is equivalent to the 1 -consistency of PA (a notion intermediate between w-consistency and consi­ stency) . Incidentally, (as will be discussed in the next and final section) , the system (IT�-CA) � with restricted induction proves the same arithmetical statements as PA . The system (II".,-CA) is predicatively justified, since the 2 nd order variables can be interpreted as ranging over the arithmetically definable subsets of N. Schiitte and I both analyzed in formai terms the transfinite iteration of the formai process (71) See Simpson ( 1 986) for detail s .

1 98

of introducing sets by definitions referring only to previously determined collections of sets, where the iteration extends only to those ordinals corresponding to previously recognized well-orderings. The limit of these is a certain countable ordinai ro (72) . This characterization of predicativity yields a sequence of ramified systems of analysis Ra each of which is predicatively justified for oc < ro, but no t for oc ro. In my 1 964 paper and in severa! subsequent papers I produced a variety of single unrami­ fied systems S which are proof-theoretically of the same strength as U R.[oc < Fol and hence are locally predicative ( 73 ) . Another such system of strength ro has been introduced and utilized by Harvey Friedman, and denoted ATRo by him; in our notation this is denoted A TR t, since it uses restricted induction on N. The locally predicative system (ATR t) is itself a relatively weak subsystem of the frankly impredi­ cative system (Jil-CA) t. The point of ali this here is that Friedman found a finite combinatoria! version P1;. of an existing infinite combinatoria! theorem P known as Kruskal's Theorem, such that Pfin is independent of ATR t and hence cannot be proved by predicative methods. In this case Kruskal's proposition P concerns a certain (relatively simple) embeddability relation � between finite trees; it says that the collection of such trees is «well-quasi-ordered» under � , i.e. =

(4) for any infinite sequence T1, T2, . . . , T., . . . of finite trees there exist i, i with i LXXXVI ( 1 976) , pp. 36-5 7 . ( 36) R. Descartes, letter o f 2 7 , V, 1 6 3 0 , i n Oeuvres, cit . , p p . 1 5 1-2. ( 37) Idem, Meditationes prima philosophia, Responsio ad sextes ob;ectiones (1641); Oeuvres, vol. VII, ( 1 904), p. 436; cf. Pliny, Nat. hist. , II, 5, 27 and 27, 9 7 (note 4 above) . (38 ) R. Boyle, Some Considerations about the Reconcilableness of Reason and Religion, sects . 2, 3 ( 1 675) , ed. T. Birch, Works, vol. III, London 1 744, pp. 5 15 , 5 16 ; cf. J. A. H. Murray et Al. , A New English Dictionary, VI, l, ed. H. Bradley, Oxford 1903: Law; E. M. Klaaren, Religious Origins of Modern Science: Belief in Creation in Seventeenth-Century Thought, Grand Rapids, MI 1 9 7 7 ; F. Oakley, Omnipotence, Covenant . . . , cit.

240

procure a recession from the settled course of the universe, and especially from the most catholic laws of motion

yet where men were concerned I think it becomes a Christian philosopher to admit, in generai, that God doth sometimes, in a peculiar though hidden way, interpose in the ordinary phenomena and events of crisis' s ; but yet that this is done so seldom, at least in a way that we can certainly discern, that we are not hastily to have recourse to an extraordinary providence, and much less to the strange care and skill of that questioned being called nature, in this or that particular case, though perhaps unexpected, if it may be probably accounted for by mechanical laws, and the ordinary course of things.

For the ommsc1ent and almight author of things having once framed the world, and established in it the laws of motion, which he constantly maintains, there can no irregularity, or anomaly, happen, [ . . . ] that he did not from the beginning foresee and think fit to permit, since they are but genuine consequences of that order of things, that, at the beginning, he most wisely instituted .

OnJy «On some special occasions, this instituted order, either seemingly or realiy, has been violated» (39) . Against the deist use of the argument against God's special providence, that «after the first formation of the universe, ali things are brought to pass by the settled laws of nature», Boyle insisted that God's special providence was evident above ali in «the first formation of things». For «the laws of motion, without which the present state and course of things could not be maintained, did no t necesarily spring from the nature of matter, but depended upon the will of the divine author of things». Besides, he repeated, I

look upon a law as a mora!, not a physical cause, as being indeed but a notional thing, according to which, an intelligent and free agent is bound to regulate its actions. But inanimate bodies are utterly incapable of understanding what a law is, or what it enjoins , or when they act conformably or unconformalby to it; and therefore the actions of inanimate bodies, which cannot incite or moderate their own actions, are produced by rea! power, not by laws ; though the a§ents, if intelli­ gent , may regulate the exertions of their power by settled rules ( 0 ) .

Boyle' s attempt to restrict the term law to its proper human and moral context did not succeed, but the long tradition behind his insistence on the utter dependence of human science upon God's omnipotent will received an interesting extension by Isaac Newton. For God who created the world, who «governs ali things [ . ] as Lord over ali», and who «knows ali things that are and can be done» (4 1 ) , could as easily if he so chose «vary the laws of nature, and make worlds of severa! sorts in severa! parts of the universe» (42 ) . . .

(39) R. Boyle, A Free Inquiry into the Vulgarly Received Notion of Nature, sects . l, 2, 5, 6, 7 ( 1 666-82 ) ; in Works, cit . , vol. IV, ( 1 744), pp. 362, 3 67 , 3 8 5 , 398, 403 . 4 0 Idem, The Christian Virtuoso ( 1 690) ; in Works, cit . , vol. V, ( 1 744) , p. 46. (41) I. Newton, Philosophiae naturalis Principia mathematica, vol . III, Scholium generale, Londini 1687. 4 2 Idem, Opticks, 4 t h e d . query 3 1 , London 1 7 30, pp. 3 79-80.

( )

( )

24 1

Within this intellectual context the essentially theological concept of laws im­ planted by God in the creation of nature carne to offer an invitation to man to discover and draw out these laws of nature by scientific observation and analysis . The theological concept of ordained law became transformed into the scientific con­ cept of natura! laws, not as moral imperatives sanctioned by right reason but as physical principles, albeit of a nature stili with moral attributes . By the time of Newton the term laws of nature had come to designate the object of all scientific inquiry: the principles or axioms to be discovered by experimental and theoretical exploration, or postulated for experimental control. By itself the concept of laws of nature could scarcely have been a guide to how to conduct such an inquiry. What made it scientifically effective was its amalgamation with two matching con­ cepts. First the analogy of natural with human art offered an invitation to simulate natural effects with artifacts made by and therefore understood by man: by discove­ ring how to contro! hypothetical models of his own contrivance man could thus gain insight into the laws controlling nature itself. Secondly the concept of laws of nature became quantified by association with that of mathematical functions ex­ pressing the quantitative dependence of effect on cause in concomitant degrees (43 ) . Thus changes in an effect (as the dependent variable) expressed as an algebraic function of the conditions necessary and sufficient to produce it (as the independent variables) could be precisely calculated from those conditions . It may be argued that the concept of functions can be found implicitly but effectively in antiquity: in tabulated correspondences of celestial motions in Babylonian and Greek astrono­ my, in the linkage made by musical theorists, from Archytas of T arentum and Plato to Boethius, of different sensations of pitch with variations in the speeds of the motions producing sound, in Ptolemy's systematic correlation of the degrees of re­ fraction of light with increasing angles of incidence, and so on. The concept may seem to be implied also by the Aristotelian principle that a cause must be adeguate to produce an effect, and therefore that there must be a quantitative proportion between a cause and its effect. Yet it was evidently not until the 13th or 14th centuries that the implied notion of functional dependence between variable quanti­ ties was explicitly recognized in the West. Then it was developed first only in princi­ ple, without the systematic practice of measurement that was necessary to incorporate it effectively into experimental science. That practice was to develop first in the technical arts . It was not until the 1 7th century that systematic measurement was (43 ) Cf. my Styles of Scientific Thinking . . . , cit . , eh. 4: Hypothetical Modelling, and far the concept of functions chs . 2, l, III; 3, l, III, with E. Cassirer, Das Erkenntnisproblem in der Philosophie und Wissenschaft der neueren Zeit, vol. III, Berlin 1 923 ; ]. L. Coolidge, The Origins of Analytical Geometry, in I ( 1 936), p. 2 3 1 -50; Idem, History of Geometrica! Methods, Oxford 1 940; C. B. Boyer, The Concepts of the Calculus, New York 1939; Idem, History of Analytical Geometry, New York 1956; A . Maier, Der Funktionsbegriff in der Physik des 1 4 . ]ahrhunderts, i n