I fondamenti storico-filosofici delle discipline statistico-probabilistiche 883391528X, 9788833915289

L'autore studia il complesso delle discipline statistico-probabilistiche forte della convinzione che non è possibil

386 49 8MB

Italian Pages 269 [270] Year 2004

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

I fondamenti storico-filosofici delle discipline statistico-probabilistiche
 883391528X, 9788833915289

Table of contents :
Copertina
Indice
Prefazione
I fondamenti storico-filosofici delle discipline
statistico-probabilistiche
1 . Le origini
1. Introduzione
2. l fondamenti della probabilità
3. I principi della probabilità
4 . De Méré, Pasca l e i casi possibili
5, Arbuthnot e la divina provvidenza
6. Conclusione
7. Appendici
A. Un 'applicazione
B . Lo schema bernoulliano
2. Il periodo classico
1. Introduzione
2. La definizione classica di probabilità
3. Il principio di indifferenza
4. La stima probabilistica
5. La stima non probabilistica
6. Conclusione
7. Appendici
A. Il metodo bayesiano
B. Il teorema di de Moivre - Laplace
C. La regola di successione di Laplace
D. Il metodo della massima verosimiglianza
3. Il frequentismo
1. Introduzione
2. I probabilisti d'inizio Novecento
3. Collettivo e probabilità
4. I saggi di significatività
5. Conclusione
4. Il logicismo
1. Introduzione
2. Probabilità ed evidenza
3. La probabilità iniziale
4. Descrizioni individuali
5. Descrizioni statistiche e probabilità
6. Conclusione
7. Appendici
A. Il metodo dei risultati e la distribuzione beta
B. La probabilità di una previsione
5. Il soggettivismo
1. Introduzione
2. Il soggettivismo tollerante
3. Il soggettivismo radicale
4. La scambiabilità
5. Conclusione
6. Appendici
A. Coerenza e regola della somma
B. Il teorema di de Finetti
C. Una stima bayesiana
6. L'assiomatizzazione
1. Introduzione
2. Gli assiomi della probabilità
3. Teorie astratte
4. Probabilità assolute e relative
5. Conclusione
6. Appendici
A. Modelli della probabilità
B. L'indipendenza
7. Molecole e indipendenza
1. Introduzione
2. Maxwell e la teoria cinetica dei gas
3. Boltzmann, il caos molecolare e l'entropia
4. Gibbs e l'ensemble
5. La statistica di Maxwell-Boltzmann
6. L'indipendenza stocastica
7. Determinismo e indeterminismo
8. Conclusione
8. Particelle e dipendenza
1. Introduzione
2. Livelli di descrizione
3. La statistica di Bose-Einstein
4. La statistica di Fermi-Dirac
5. La dipendenza stocastica
6. Dipendenza stocastica e informazione
6. Conclusione
9. Processi stocastici
1. Introduzione
2. Pulci, cani e demonietti
3. Equilibrio
4. Un po' di fantascienza
5. Loci e agenti economici
6. Processi di osservazione e scambiabilità
7. Probabilità ontiche ed epistemiche: un primo sguardo
8. Conclusione
10. Considerazioni conclusive
1. Introduzione
2. Ancora sulla storia
3. Indipendenza e dipendenza stocastiche
4. Soggettivismo e oggettivismo
5. Probabilità epistemiche e ontiche
6. La visione probabilistica del mondo
Riferimenti bibliografici

Citation preview

Domenico Costantini

I fondamenti storico-filosofici delle discipline statistico-probabilistiche

Bollati Boringhieri

Prima edizione maggio 2004

© 2004 Bollati Boringhieri editore s.r.l., Torino, corso Vittorio Emanuele II, 86 I diritti di memorizzazione elettronica, di riproduzione e di adattamento totale o parziale con qualsiasi mezzo (compresi i microfilm e le copie fotostatiche) sono riservati Stampato in Italia dalla Litopres di Druento (To) ISBN 88-339-1528-x Schema grafico della copertina di Pietro Palladino e Giulio Palmieri Stampato su carta Palatina delle Cartiere Miliani Fabriano

Indice

7

Prefazione

I fondamenti storico-filosofici delle discipline statistico-probabilistiche

13

1 . Le origini

38

2 . Il periodo classico

63

3 . I l frequentismo

91

4. Il logicismo

1 . Introduzione, 13 2. I fondamenti della probabilità, 16 3 . I principi della probabilità, 18 4. De Méré, Pasca1 e i casi possibili, 20 5. Arbuthnot e la divina provvidenza, 22 6 . Conclusione , 27 7. Appendici : A . Un' applicazione, 27 B . Lo schema bernoullia­ no, 2 9

1 . Introduzione, 38 2. La definizione classica di probabilità, 4 1 3 . Il principio di indifferenza, 4 4 4 . La stima probabi1istica, 47 5. La stima non probabilistica, 50 6 . Conclusione, 55 7. Appendi­ ci: A. Il metodo bayesiano, 56 B . Il teorema di de Moivre - Lap1a­ ce, 58 C . La regola di successione di Lap1ace, 60 D. Il metodo della massima verosimiglianza, 6 1

1 . I ntroduzione , 63 2 . I probabilisti d ' inizio Novecento, 70 3 . Collettivo e probabilità, 72 4. I saggi di significatività, 80 5. Conclusione, 90

1 . Introduzione, 9 1 babilità iniziale, 96

2 . Probabilità ed evidenza, 93 4. Descrizioni individuali, 98

3 . La pro5. Descri-

6

INDICE

zioni statistiche e probabilità, 1 02 6. Conclusione, 1 05 7. Ap­ pendici: A. Il metodo dei risultati e la distribuzione beta , 1 06 B . La probabilità di una previsione, 1 08 113

5 . Il soggettivismo

139

6 . L'assiomatizzazione

160

7 . Molecole e indipendenza

189

8. Particelle e dipendenza

219

9 . Processi stocastici

245

26 7

1 . Introduzione, 1 1 3 2. Il soggettivismo tollerante, 1 1 6 3. Il soggettivismo radicale, 1 2 1 4. La scambiabilità, 125 5. Conclu­ sione, 1 3 0 6. Appendici : A. Coerenza e regola della somma, 1 3 1 B . I l teorema di de Finetti, 1 3 2 C . Una stima bayesiana , 1 3 4

1 . Introduzione, 1 3 9 2. Gli assiomi della probabilità, 143 3. Teo­ rie astratte, 1 4 5 4 . Probabilità assolute e relative, 1 4 9 5. Con­ clusione , 1 54 6. Appendici: A. Modelli della probabilità, 1 55 B . L'indipendenza, 1 57

1 . Introduzione, 1 60 2. Maxwell e la teoria cinetica dei gas, 1 62 3 . B oltzmann, il caos molecolare e l ' entropia, 1 67 4 . Gibbs e l'ensemble, 1 72 5. La statistica di Maxwell-Boltzmann, 1 76 6. L 'indipendenza stocastica, 1 79 7. Determinismo e indetermi­ nismo, 1 82 8. Conclusione, 1 88

1 . Introduzione, 1 89 2. Livelli di descrizione, 1 9 3 3 . La stati­ stica di Bose-Einstein, 1 9 6 4. La statistica di Fermi-Dirac, 2 0 1 5. L a dipendenza stocastica, 204 6 . Dipendenza stocastica e informazione, 209 7. C onclusione , 2 1 8

1 . Introduzione, 2 1 9 2 . Pulci, cani e demonietti, 224 3 . Equi­ librio, 2 3 0 4. Un po' di fantascienza, 2 3 2 5. Loci e agenti economici, 2 3 6 6. Processi di osservazione e scambiabilità, 238 7 . Probabilità ontiche ed epistemiche : un primo sguardo, 242 8. Conclusione, 244

lO. Considerazioni conclusive

1 . Introduzione, 245 2. Ancora sulla storia, 245 3 . Indipen­ denza e dipendenza stocastiche, 248 4 . Soggettivismo e ogget­ tivismo, 252 5. Probabilità epistemiche e ontiche, 258 6 . La visione probabilistica del mondo, 262

Riferimenti bibliografici

Prefazione

Nella primavera del 200 1 Franco Rositi, direttore dell' Istituto Universitario di Studi Superiori dell'Università di Pavia, mi invitò a tenere nell'inverno successivo un corso di lezioni, per la Scuola Universitaria Superiore della suddetta Università, sulla storia e le basi filosofiche delle teorie statistico-probabilistiche. Gli studenti ai quali avrei dovuto indirizzare le lezioni frequentavano il quarto anno delle facoltà umanistiche dell'Università di Pavia e, pertanto, il corso che avrei dovuto tenere doveva evitare un'impostazione strettamente tecnica: la preparazione universitaria di quegli studen­ ti non era sufficiente a metterli in condizione di seguire lezioni ben caratterizzate dal punto di vista formale. Questo vincolo mi impo­ neva di tenere lezioni che, pur non trascurando alcuno dei punti es­ senziali della problematica connessa ai fondamenti di quelle disci­ pline, evitassero un eccessivo tecnicismo . Tuttavia, una trattazione seria delle questioni legate ai fondamenti delle discipline statisti­ co-probabilistiche non può ignorare del tutto gli aspetti formali. Decisi quindi che questi aspetti non dovevano essere completa­ mente sottaciuti, ma che alcune delle questioni tecniche un poco più impegnative fossero poste in appendice alle lezioni. Non potevo infatti escludere l'eventualità che qualche uditore, per sue ragioni in possesso di una prepazione matematica superiore a quella solitamente richiesta per gli studi umanistici, fosse interessato a un maggiore approfondimento . Il risultato fu che, sostanzialmente, le lezioni si presentano come un corso di alta divulgazione dei fonda­ menti delle discipline statistico-probabilistiche.

8

PREFAZIONE

Già nel corso dei nostri primi scambi di idee, Rositi mi mise al corrente della necessità di preparare per gli studenti delle dispense che molto fedelmente rispecchiassero le lezioni: l'Istituto Universi­ tario di Studi Superiori dell'Università di Pavia pretende - a ra­ gione - un notevole impegno dai docenti cui affida lo svolgimento dei suoi corsi. Devo riconoscere che immediatamente intesi que­ sta parte dell'impegno che mi veniva richiesto come la tessera ini­ ziale di un mosaico che da qualche tempo andavo immaginando, vale a dire tornare a occuparmi dei fondamenti delle discipline sta­ tistico-probabilistiche in vista di elaborare una visione del mondo basata sulle nozioni tipiche di queste discipline. Le lezioni che avrei dovuto tenere a Pavia avrebbero potuto rappresentare una sorta di introduzione al tentativo che avevo in animo - nell'ultima lezione ho tracciato le linee generali del progetto che mi propongo di rea­ lizzare - e come tale essere pubblicate. Sono ormai più di trent 'anni che, per i tipi di Feltrinelli, diedi alle stampe un volume sui fondamenti del calcolo delle probabilità. Senza falsa modestia, quel volume rappresentò un momento di un qualche rilievo nel panorama degli studi italiani dedicati alla pro­ babilità e alla statistica; il suo merito fu innanzi tutto di segnalare agli studiosi italiani ambiti di ricerca allora in Italia trascurati quan­ do non completamente ignorati. Ad esempio, in quel volume si par­ lava a lungo della concezione soggettivista della probabilità, in particolare di Bruno de Finetti e della nozione di coerenza che egli aveva posto a fondamento del calcolo delle probabilità. Pur essen­ do allora come ora la mia filosofia della probabilità molto lontana dal soggettivismo, mi era sembrato non si potessero ignorare i con­ tributi tecnici e filosofici di de Finetti, soprattutto perché allora ben pochi erano al corrente del loro grande valore culturale. Le cose poi cambiarono . Oggi l'opera di de Finetti è largamente conosciuta e, almeno a mio giudizio, forse sopravvalutata è la sua filosofia, la parte meno valida dei suoi contributi alla probabilità e alla statistica. Ma anche le mie idee sono mutate nel corso di que­ sti trent'anni. Già dal titolo, quel volume metteva chiaramente in risalto che la mia attenzione era rivolta al calcolo delle probabilità, cioè alla parte deduttiva delle discipline statistico-probabilistiche, mentre trascuravo la parte induttiva, cioè la statistica inferenziale .

PREFAZIONE

9

Questa è la ragione per cui allora non avevo affrontato questioni più propriamente statistiche, quali ad esempio la nozione di scam­ biabilità e il suo uso in statistica inferenziale come, nel corso di un dibattito, molto cortesemente ebbe a rimproverar mi lo stesso de Finetti. Il trascorrere degli anni mi ha convinto che non si può disgiun­ gere la probabilità dalla statistica e, soprattutto, che occupandosi di queste discipline non si può passare sotto silenzio, come se nep­ pure esistessero, i capitoli basati sulle nozioni statistico-probabili­ stiche in fisica, in biologia, in economia e in molti altri ambiti di studio. Questa è la ragione del titolo del presente volume; il riferi­ mento ai fondamenti delle discipline statistico-probabilistiche ha lo scopo di attirare 1'attenzione del lettore su questa convinzione. Purtroppo, il tempo che mi era stato concesso - dieci lezioni di due ore ciascuna che i dieci capitoli del presente volume fedelmente ri­ specchiano - non permetteva di affrontare tutte le discipline di cui ho detto: dovetti scegliere . Optai per la fisica giacché, indubbia­ mente, questa è la disciplina scientifica che maggiormente ha cam­ biato tanto il nostro modo di vivere quanto il nostro modo di pen­ sare, in una parola la nostra visione del mondo . Ogni scelta è in qualche misura arbitraria e pertanto criticabile . Lo è anche la mia. Mi riprometto di affrontare con maggiore ampiezza le discipline che, a malincuore, ho dovuto trascurare nel corso della realizzazio­ ne del progetto che ho delineato e di cui il presente volume costi­ tuisce una sorta di introduzione. Non posso terminare senza ringraziare i ricercatori del Diparti­ mento di Epidemiologia dell'Istituto nazionale per la ricerca sul cancro di Genova e del Laboratorio di Fisica e Statistica medica del Dipartimento di Fisica dell'Università di Genova con i quali, in occasione di seminari e conferenze, ho avuto modo di discutere alcuni degli argomenti che ho affrontato . Sento infine il dovere di ricordare e ringraziare due carissimi amici e colleghi: Corrado Mangione dell'Università di Milano, per essersi assunto l'impegno di leggere, correggere e commentare le pagine che seguono; Ubaldo Garibaldi della sezione di Genova dell'IMEM-CNR, per il debito in­ tellettuale che ho nei suoi confronti e per il suo essenziale contri­ buto, senza il quale non sarei mai stato in grado di formulare la

IO

PREFAZIONE

seconda parte delle mie lezioni - delle due la più importante dedicata alla fisica statistica. È superfluo aggiungere che mi prendo tutta la responsabilità delle idee che sto per esprimere e delle man­ chevolezze che dovessero inficiarle. Domenico Costantini Pavia, novembre-dicembre 200 1 Germignaga, gennaio 2 003

I fondamenti

storico-filosofici delle discipline statistico-probabilistiche

Alla mia famiglia: mi ha dato l'amore e la serenità che trasformano la ricerca in gioia piena.

1.

Le origini

1 . Introduzione La svolta che generò i movimenti di pensiero che caratterizzano l'epoca moderna si concentra, come disse Ernst Cassirer [8], attor­ no al compito di elaborare un nuovo concetto della conoscenza che non doveva essere cercata nella mente umana ma nell' osservazione della natura. Per di più, come rilevò Ludovico Geymonat [22], tanto per Bacone quanto per Galilei la natura non va soltanto ascoltata bensì interrogata, ma mentre l'interrogazione baconiana mira a in­ dividuare la forma dei fenomeni, quella galileana si ripropone di scoprirne le leggi, cioè le relazioni matematiche che legano i feno­ meni stessi. Ecco quindi gli esperimenti di Galilei, le sue misura­ zioni e l'individuazione dei principi della dinamica che fornirono il paradigma a tutta la scienza moderna. Ma mentre nella dinamica le leggi via via individuate o dedotte sono rigorosamente univoche - un fenomeno è seguito da un certo altro fenomeno, sempre lo stesso nei giochi d'azzardo e nei comportamenti umani o sociali, questo accade raramente. La probabilità fu la nozione con cui, proprio in concomitanza con la svolta che portò all'epoca moderna, si cercò di scoprire le leggi dei fenomeni caratterizzati da comportamenti variabili. Ciò significa che analizzando questi fenomeni, ad esempio il distribuirsi dei risultati dei giochi d'azzardo o quello delle morti alle varie età, si scoprì che queste distribuzioni presentano andamenti che rive­ lano certe « regolarità » che, in alcuni casi, potevano essere suscetti­ bili di rappresentazione matematica. La nozione di probabilità che

14

CAPITOLO PRIMO

consentiva questa rappresentazione era per tanti versi nuova al punto da indurre qualche studioso, ad esempio Ian Hacking [25], a sostenere che il significato di questa nozione venne elaborato pro­ prio a cavallo tra Cinque e Seicento, mentre non ne esisteva traccia prima dell'epoca moderna. Quindi, certamente assieme ad altre, la nozione di probabilità è una di quelle che caratterizzano l'epoca moderna. Ciò è tanto più vero se si tien conto che a partire dal periodo testé ricordato, le nozioni statistico-probabilistiche ebbero un ruolo crescente nella conoscenza scientifica, fino a divenire og­ gi il concetto senza il quale non è possibile alcuna conoscenza del mondo che ci circonda. Per molti versi, tuttavia, quella di probabilità è una nozione am­ bigua. Ciò fu evidente fin dal suo apparire, nel senso che questa nozione fu e può essere intesa in modo anche profondamente di­ verso in accordo con l'uso che se ne fa; d'altronde, la convinzione che dietro il termine « probabilità » si celino e si scontrino almeno due nozioni diverse non è certo nuova. La migliore illustrazione di questa fondamentale diversità di interpretazioni è dovuta a Hacking il quale, un quarto di secolo fa e con validissimi argomenti, sosten­ ne che la dualità della nozione di probabilità appare già chiaramen­ te delineata fin dal suo emergere attorno alla metà del XVII secolo . Molti autori, a partire da Jacob Bernoulli, hanno implicitamente o esplicitamente sostenuto questa posizione. Tra coloro che implici­ tamente presero partito per la dualità si possono annoverare Antoine Augustine Cournot, che intese la probabilità sia classicamente sia frequentisìÌcamente (vedremo nel seguito i significati di questi av­ verbi) , e Karl Pearson, che fece uso tanto di probabilità iniziali e finali per stimare valori sconosciuti di grandezze quanto della vero­ simiglianza per controllare ipotesi statistiche (di nuovo, rimando al seguito per i significati) . Tra coloro che invece esplicitamente sostennero avere la probabilità due significati ben distinti, da un lato una relazione fra un'evidenza - vale a dire un insieme di cono­ scenze relative a dati di fatto di solito, ma non necessariamente, ottenute per via sperimentale - e un'ipotesi il cui valore di verità non è noto, dall'altro una frequenza relativa di accadimenti deter­ minata su un numero sufficientemente elevato di osservazioni, tro­ viamo Frank Plumpton Ramsey e Rudolf ç..�!"n�p. Le posizioni di questi due autori si differenziarlO per il fatto che, mentre il primo

LE ORIGINI

15

sostiene essere soggettiva la relazione di cui dianzi ho detto, il secon­ do al contrario ne affermò la logica oggettività. Con questi cenni ho indicato le tre interpretazioni - quattro se si tiene conto anche della classica ormai abbandonata - che hanno caratterizzato per circa tre secoli gli studi e le ricerche connessi alle discipline stati­ stico-probabilis tiche . L'uso dell' aggettivo composto statistico-probabilistiche deve esse­ re chiarito al fine di evitare fraintendimenti. Di solito la teoria o calcolo delle probabilità e la statistkainferenziale o matematica sono considerate discipline distinte . Questa presunta distinzione consegue, da un lato, dall'esasperata tendenza alla specializzazione che ha caratterizzato il secolo scorso e, dall'altro, da ragioni banal­ mente sindacali e/o didattiche. Per un verso, una sorta di miopi a intellettuale, rendendo indistinta la visione dei nessi profondi, con­ duce a sopravvalutare le differenze; per l'altro, la ricerca di siste­ mazioni personali induce a trascurare i legami sostanziali per porre l'accento sulle differenze formali. È invece mia profonda convin­ zione che la probabilità e la statistica - come per semplicità d'or'a innanzi chiamerò i due momenti strettamente complementari del­ le ricerche statistico-probabilistiche - siano appunto due aspetti di un medesimo corpo di studi e di ricerche dedicati a chiarire, da un punto di vista sia sostanziale che formale, le nozioni statistico-pro­ babilistiche. Quanto appena detto deve essere immediatamente integrato con l'aggiunta di due postille. In primo luogo, l'uso dell'aggettivo com­ posto proprio non mi piace. :rr:eferirei usare probabilità e basta, come fecero Pierre-Simon de �aplace nel Ì812 e Ì-Iaròìd Jeffrey� nel 1939 intitolando rispettivamente Théorie analytique des proba­ bilités [32] e Theory 0/ Probability [29] i loro grandi contributi a questo ambito di studi, o come fece nel 1996 Edwin T. Jaynes che scelse Probability Theory. The Logic 0/ Science [28] quale titolo per la sua ultima, purtroppo incompiuta, opera. Ma se così facessi, a ragione della miopi a di cui ho detto, al mio lavoro potrebbe venir attribuita una portata diversa da quella che ho in mente. Questo è il motivo per cui ho deciso di usare l'espressione discipline stati­ stico-probabilistiche al posto di probabilità o statistica. Ma questo è anche il motivo per il quale nel prosieguo il lettore a volte troverà solo probabilità o statistica. Quando ciò dovesse verificarsi, stia

CAPITOLO PRIMO

bene attento a non attribuire a questi due termini i significati angu­ sti con cui troppe volte vengono usati. Sia un termine sia l'altro do­ vranno sempre essere intesi come riferentesi a quell'insieme di ricerche che ho indicato come statistico-probabilistiche. La seconda postilla serve a precisare che il significato testé indi­ viduato di statistico-probabilistico è valido, in senso stretto, solo per la prima parte delle presenti lezioni, nel corso delle quali esem­ plificherò le varie concezioni della probabilità . Nella seconda parte invece, a partire cioè dal settimo capitolo, utilizzerò l'aggettivo com­ posto con un'accezione più ampia già usata da Richard von Mises all'inizio del secolo scorso. Vale a dire, intenderò come discipline statistico-probabilistiche tutte quelle che, per un verso o per l'altro, sono essenzialmente fondate sulla nozione di probabilità e fanno ri­ ferimento ad argomentazioni statistiche; fra queste segnalo la fisica statistica - che von Mises, in un importante lavoro di quasi un secolo fa [35], a differenza di quello che si fa oggi, qualificò come statistica fisica, essendo fisica l'aggettivo e statistica il sostantivo e la genetica di popolazioni.

2. lfondamenti della probabilità Un'altra avvertenza è necessaria e non deve essere dimenticata: la storia dei vari modi di intendere il termine probabilità, succedu­ tisi nel corso del tempo (questo s 'intende quando ci si riferisce alla storia dei fondamenti della probabilità) , viene di solito esposta nei termini seguenti. Almeno sino alla fine del Settecento sono pre­ senti più d'una interpretazione di probabilità, senza dubbio quelle che in seguito saranno chiamate classica e soggettivista e per certi aspetti, ad esempio nel campo assicurativo, anche la frequentista. Con Laplace, tuttavia, il quadro cambia radicalmente, nel senso che le definizioni diverse dalla classica vengono abbandonate: la proba­ bilità di un evento viene intesa come il rapporto fra il numero dei casi favorevoli al verificarsi dell'evento e quello di tutti i casi pos­ sibili, cioè favorevoli e sfavorevoli, mentre tutte le altre interpre­ tazioni vengono espunte. La definizione classica di probabilità non ebbe rivali fino all'i­ nizio del Novecento, per declinare poi col procedere del secolo a fa-

LE ORIGINI

vore della definizione frequentista, che si presenta in modo scien­ tificamente soddisfacente negli anni dieci del Novecento anche se, come vedremo, già nella seconda metà dell'Ottocento fu larga­ mente usata. In accordo con questa definizione la probabilità di un evento è (il limite del) la frequenza relativa con cui l'evento si veri­ fica in una popolazione molto numerosa (infinita) o in una succes­ sione di osservazioni, quando il numero di queste diviene molto ele­ vato (tende all'infinito) . Nella terza decade del secolo scorso vengono elaborate, in sor­ dina per lì verità, due altre definizioni: la logicista e la soggettivi­ sta . Per i sostenito�i della prima la probabilità di una proposizione, data un' evidenza, è una relazione logica che sussiste fra qualcosa di conosciuto e qualcosa che non lo è. L'aggettivo logici sta che quali­ fica questa nozione di probabilità intende porne in risalto due aspetti fondamentali: da un lato, che la relazione è oggettiva, nel senso che non dipende da colui che la sta considerando; dall' altro, che questa relazione può essere quantificata mediante l'analisi lo­ gica del linguaggio . Per i sostenitori del soggettivismo, invece, la relazione è di natura personale, dal momento che dipende in modo essenziale dall'attendibilità che il soggetto che sta valutando la pro­ babilità assegna alle conoscenze a sua disposizione. Ho detto che la definizione classica verrà sempre meno usata col procedere del secolo; in effetti oggigiorno ha un ruolo meramente didattico mentre a livello scientifico si fa quasi esclusivamente rife­ rimento alle accezioni frequentista e soggettivista . Nelle scienze naturali la prima è l'unica interpretazione considerata; nelle scien­ ze sociali, segnatamente in economia, !'interpretazione soggettivi­ sta ha un numero crescente di sostenitori e si appresta, se già non lo è, a divenire maggioritaria. La definizione logicista, che per con­ tro ha sempre convinto una minoranza di studiosi, va via via iden­ tificandosi con la definizione soggettivista; rappresenta ormai una sorta di qualificazione moderata del soggettivismo, adottata da coloro che non intendono tagliare tutti i ponti con il momento sperimen­ tale della ricerca. Ma prima di passare a esaminare nei dettagli le varie definizio­ ni del termine probabilità, cosa che faremo nei prossimi capitoli, mi occuperò brevemente delle origini delle discipline statistico-proba­ bilistiche. A questo punto tuttavia è opportuna una digressione che

18

CAPITOLO PRIMO

ci consenta di soffermarci brevemente sulle assunzioni fondamen­ tali di queste discipline. La ragione della digressione è che senza un minimo di formalismo matematico non è possibile cogliere la porta­ ta innovativa di dette discipline nello studio dei fenomeni naturali e sociali. La probabilità fu introdotta al fine di rappresentare in ter­ mini matematici i fenomeni caratterizzati da comportamenti varia­ bili e, come si sa, ciò non è possibile senza un adeguato formalismo. Tuttavia, come ho già avvertito nella prefazione per non appesan­ tire l'esposizione, rimanderò alle appendici la trattazione di alcuni argomenti che non mi sono sembrati strettamente necessari alla comprensione del testo . Chi desidera approfondire quanto andrò esponendo, potrà integrare la lettura del testo con quella delle ap­ pendici.

3. I principi della probabilità Tenendo conto dello scopo che intendo perseguire, formulerò i principi di base (o assiomi, come anche si può dire) per una proba­ bilità relativa o subordinata o condizionata. Siano date le descrizioni di alcuni eventi, che per brevità chiarrieremo I, l', D e C; n sia il simbolo della congiunzione. n primo dei principi che stiamo considerando afferma che: P1

La probabilità di I (ipotesi) dati C (conoscenze di contornQ.Q di sfondò ) e D (evidenza o da ti) - scriveremo tale probabilità P(I I cn n D) - è un numero reale compreso fra O e 1 estremi inclusi. n

secondo principio afferma che:

P2 Se I segue logicamente da C n D - lo scriveremo C n D ç I allora P(I I C n D) = 1

da cui segue che la probabilità di un evento certo è pari a 1. n terzo principio afferma che: P3

P(I I cn D) + P( - I l cn D) = 1.

-

LE ORIGINI

Da questi principi segue che: qualora la negazione di I, che abbiamo indicata con I, cioè l'evento che si verifica se e solo se I non si veri­ fica, è una conseguenza logica di C n D, allora P(I I C n D) = O; quindi O è la probabilità di un evento impossibile date le cono­ scenze di contorno e l'evidenza; inoltre, qualora I e 1', siano esclu­ sivi sulla base della conoscenza di C n D, nel senso che si escludono a vicenda o anche che non possono accadere entrambi, nel qual caso dirò che la loro congiunzione è vuota e scriverò I n l' = 0, allora la probabilità che se ne verifichi almeno uno è la somma delle rispet­ tive probabilità, cioè: P(I U l' I C n D) = P(I I C n D) + P(I' I C n D), questa è l a regola della .somma che vale per u n numero qualsivoglia ma finito di eventi. L'ultimo principio è la regola del prodott o: -

P4

p(In I' I cn D) = P(I I cn D)P(I' I cn D n n

vale a dire la probabilità dell' evento composto dai due eventi I e 1', subordinata mente a C n D, è pari al prodotto della probabilità del primo evento, subordinatamente a C n D, per quella del secondo determinata subordinata mente all'essersi verificato di I, cioè del primo evento e, ovviamente, a C n D. U n caso particolare della regola del prodotto si ha quando

p(In 1' 1 cn D) = P(I I cn D)P(I' I cn D)

[1.1]

che, tenendo conto della regola del prodotto, equivale a

P(I' I C n D n n P(I' I C n D) .

[1.2] Ogniqualvolta valga l'una o l'altra di queste uguaglianze, si dice che gli eventi I e l' sono stocasticamente o prob ab ilisti camente o sta­ tisticamente indipendenti. Due eventi sono quindi stocasticamente indipendenti se la probabilità di un evento congiunto fattorizza nel prodotto delle probabilità dei due eventi componenti o, anche, se il verificarsi di uno dei due eventi non modifica la probabilità del verificarsi dell'altro . Ne consegue, e non lo si dimentichi mai, che l'indipendenza stocastica è una condizione squisitamente probabi­ Ilstica che, in certe occasioni, può essere conseguenza del fatto che {iri"evento non influenza il verificarsi di un altro evento ma che, in generale, non ha nulla a che vedere con l'influenza, fisica di solito, di cui abbiamo testé detto. =

20

CAPITOLO PRIMO

Prima di chiudere la digressione, desidero attirare l'attenzione su due questioni che potrebbero ingenerare confusione. In primo luogo, avverto che nel seguito userò i termini evento e ipotesi come si­ nonimi in considerazione del fatto che si tratta di due modi di descrivere gli accadimenti: il primo all'interno della teoria degli insiemi come evidenzia l'uso che ho fatto dei simboli di questa teo­ ria, il secondo entro un opportuno linguaggio. In secondo luogo, e a motivo del fatto che nell'esporre la teoria delle probabilità, segna­ tamente quella dei processi stocastici, di solito la virgola è usata al posto di n , nei contesti formali userò la virgola al posto di questo simbolo, vale a dire A, B dovrà intendersi come A n B. Ciò non­ dimeno nei contesti linguistici, per la congiunzione userò ancora il simbolo n . 4 . De Méré, Pasca l e i casi possibili I primi tentativi volti a risolvere problemi di natura probabili­ stica sono legati ai giochi d'azzardo . Molte volte questi problemi presentavano una caratteristica comune: si trattava di spiegare per­ ché risultati che a un superficiale calcolo risultavano essere deter­ minati da un ugual numero di possibilità, di fatto si verificavano con frequenze diverse. Fra questi uno dei più famosi fu posto nel 1 654 dal cavalier Antoine Gombaud de Méré, un accanito giocato­ re d'azzardo, a Blaise Pascal, il famoso filosofo e matematico gian­ senista. Il giocatore aveva chiesto al matematico di spiegargli il motivo per cui, puntando sull'uscita del « 6 » - correttamente: dell'ar­ restarsi il dado sulla faccia opposta a quella con impresso il « 6 » in quattro lanci, fosse più facile vincere che perdere mentre, pun­ tando sull'uscita del « doppio 6 » su 24 lanci di due dadi, fosse vice­ versa più facile perdere che vincere . De Méré si era convinto che le due probabilità di vittoria dovessero essere uguali al momento che

: è uguale a �:. La ragione di questa uguaglianza avrebbe

dovuto risiedere in una vecchia regola, già usata da Gerolamo Car­ dano, che può essere descritta nel modo seguente: in qualunque gioco, che può essere ripetuto con probabilità di vincere pari a



21

LE ORIGINI

i n ogni ripetizione, sia n il numero di queste che è necessario ese­ guire per avere una probabilità globale di vincere maggiore di quella di perdere : in questa eventualità il rapportq

� è costante .

Quindi dovrebbe essere costante il rapporto fra i casi favorevoli al verificarsi della vittoria, pensato come il numero delle volte in cui il gioco può essere ripetuto, diviso per il reciproco della probabilità di vittoria in ogni occasione considerato come il numero dei casi possibili. L'affermazione di de Méré è una conseguenza di questa regola. Infatti, considerando il ripetuto lancio di un dado, N = 6 e n = 4, è il medesimo rapporto che caratterizza il ripetut � i�� cio di d��



dadi, N = 36 e n = 2 4 . Secondo il nostro cavaliere questo costi­ tuiva un grande scandalo per la matematica poiché, da attento gio­ catore e ottimo osservatore quale doveva essere, si era accorto che le cose non andavano in questo modo dal momento che, mentre chi puntava sul « 6 » in quattro lanci riportava un numero di vittorie superiore a quello degli insuccessi, per chi puntava sul « doppio 6 » le cose andavano in modo contrario, cioè perdeva un numero mag­ giore di volte . Da qui il quesito che, a ben vedere, non nascondeva certo il sospetto che la matematica non fosse in grado di spiegare ciò che accade . La risposta di Pascal fu molto semplice: calcola bene le probabilità e vedrai che non vi è alcun scandalo. Ed è proprio quello che immediatamente farò, supponendo che in ogni lancio tutti i possibili risultati abbiano la stessa probabilità di verificarsi, un'ipotesi ragionevole se i dadi non sono truccati. Con­ sideriamo dapprima il lancio di un singolo dado. Ognuno dei sei « nu­ meri » che si possono presentare· ha la stessa probabilità; contiamo quindi i casi possibili e quelli sfavorevoli alla vittoria in ogni lancio, per differenza arriveremo a quelli favorevoli; facendo poi il rap­ porto, avremo le probabilità che ci interessano . Nel primo lancio, 6 sono i casi possibili e 5 quelli sfavorevoli, quindi vi è un solo caso

� �

favorevole e la probabilità di vincere è pari a 1 - = 0, 16, cioè, in accordo con P3, uno meno la probabilità di perdere; per­ tanto al primo lancio la probabilità di perdere è maggiore di quella di vincere . Affinché si vinca al secondo lancio bisogna aver perso al =

22

CAPITOLO PRIMO

primo, Di nuovo,calcoliamo il numero dei casi possibili e di quelli sfavorevoli; sono rispettivamente 36 e 25 , quelli favorevoli saranno pertan

� 36 - 25 = Il e la probabilità di vincere, 1

-

(� y = �! =

= 0,305 , ancora minore di quella di perdere, Per tre lanci abbiamo 2 16 casi possibili e 125 sfavorevoli, quelli favorevoli saranno 1 = quindi 2 1 6 - 125 = 9 1 e la probabilità di vincere, 1 16 0,42 12, è ancora,come le due già viste,minore di quella di per­ dere, Infine in quattro lanci, 1296 possibili e 625 sfavorevoli, i risultati favorevoli saranno 1296 - 625 = 67 1 , che finalmente con6 7 1 0,5 1 7, ducono a una probabilità di vincere, 1 = 1 296

(� y ;

=

-

(�)4

=

=

maggiore di quella di perdere, Ripetendo lo stesso ragionamento

per il «doppio 6», abbiamo per il primo lancio " In lanclO

(��Y

-

0,056 e così di seguito fino al " d"I vincere e' 1 CUl' la probabI'llta 36

il secondo

1-

1

=

-

(35)24

3� =

O,Oi?, per

:entiquattresimo =

' dI' 0 49 1 ,qUIn ,

ancora minore di quella di perdere, Le cose cambiano invece ese­ guendo un altro lancio, infatti in questa eventualità la probabilità

(�� y5

= 0,505, quindi maggiore di quella di di vincere diventa 1 perdere, La regola di de Méré era quindi sbagliata e Pascal, contando bene i casi possibili e quelli favorevoli,individuò le probabilità cor­ rette, Il cavaliere de Méré non era di sicuro un gran matematico, ma era senza dubbio un attentissimo osservatore, giacché non è facile valutare, servendosi delle frequenze dei risultati osservati, una differenza fra probabilità inferiore al per cento, -

3

5, Arbuthnot e la divina provvidenza Lasciamo il Seicento e veniamo ai primi anni del Settecento per occuparci di un tipo di argomentazione statistica che, col nome di saggio di significatività (test oj signij icance) , è divenuto di enorme

LE ORIGINI

importanza e rappresenta una delle grandi branche della statistica inferenziale. Si tratta di un modo di ragionare presente anche pri­ ma di John Arbuthnot,ma è con questo autore che l'inferenza sta­ tistica ci appare in modo del tutto esplicito. Vale quindi la pena di soffermarsi sul ragionamento di Arbuthnot,giacché la sostanza delle sue argomentazioni è ancora valida. Arbuthnot [1] notò che per 82 anni consecutivi nella città di Londra il numero delle nascite maschili aveva superato quello delle nascite femminili; si tratta, come ben sappiamo, di un fenomeno caratteristico non solo della Londra del XVII secolo bensì di tutte le nascite umane. Al nostro autore questo dato di fatto non appar­ ve come un frutto del caso e la sua argomentazione è volta a soste­ nere che non è il caso benslla divina provvidenza che determina la prevalenza delle nascite maschili; vediamo come. L'argomento di Arbuthnot prende le mosse dall'ipotesi che inten­ de confutare,egli suppone cioè che,essendo affidato al caso il sesso del nascituro,in occasione di ogni parto sia equiprobabile la nascita di un maschio e quella di una femmina, quindi sia

� la probabilità

di una nascita maschile. Se le cose stanno così, ne consegue una probabilità molto prossima a

� di ottenere un numero di nascite

maschili maggiore di quello delle nascite femminili. Infatti questa probabilità sarà leggermente minore di

�, dal momento che dob­

biamo sottrarre la probabilità che il numero delle nascite maschili in un anno uguagli quello delle nascite femminili. Per semplicità supponiamo tuttavia che sia pari a

� la probabilità di un anno

maschile,cioè di un anno in cui le nascite maschili superano quelle femminili. Ora indichiamo con Mi l'evento che si verifica quando l'i-esimo,i = 1 , 2 , . . . , 82 , anno è maschile,e chiediamoci quale sia la probabilità di ciò che Arbuthnot aveva notato supponendo valida l'ipotesi che la probabilità di un anno maschile sia sempre

� unita­

mente a quella che il presentarsi di un anno maschile non modifi­ chi la probabilità che anche il prossimo anno lo sia, vale a dire che

24

CAPITOLO PRIMO

gli anni maschili o femminili siano stocasticamente indipendenti. Per la regola del prodotto abbiamo

P(Ml nM2 n ... nMSl nMd = = P(Ml)P( M2IMl) n ... n P( MS2IMl n M2 n ... nMSl) = S2 = P( Ml)P( M2) n ... n P(Md = = 2 X 10-25.

(�)

La probabilità di 82 anni maschili è quindi minima, essendo al­ l'incirca uguale a quella di estrarre una biglia nera da un'urna che ne 2 contiene 1 nera e 5 X 10 4 bianche. Arbuthnot concluse il suo ragionamento affermando che un evento con una simile probabilità non può verificarsi e che, pertanto, la successione di 82 anni ma­ schili non è opera del caso bensì della divina provvidenza. Come ho detto,questo è il modo di argomentare tipico di un sag­ gio di significatività che,perlomeno a mio parere,è del tutto lecito. Vale quindi la pena di soffermarsi un poco su questa argomentazio­ ne che costituisce (ed è perciò mia intenzione ritornarvi) una que­ stione di grande interesse non ancora completamente chiarita. Notiamo, innanzitutto, come l'evento di cui ci siamo chiesti la probabilità, la sequenza degli 82 anni maschili, sia un evento già accaduto. Arbuthnot lo ha tratto dai registri delle nascite che, a meno di errori di cui ora non ci occupiamo, riporta dati reali e non immaginari. Ne consegue che la prima osservazione da fare è che la probabilità degli 82 anni maschili è pari a 1 , dal momento che questo è il valore che assegniamo agli eventi certi,e un evento accaduto è senza dubbio certo. Più chiaramente, se D è il dato dei registri delle nascite, cioè D è l'asserzione «nel registro delle nascite vi sono 82 anni maschili consecutivi», allora la sua probabilità subor­ dinatamente a ciò che conosciamo,cioè P( D I D), è pari a 1 . Ma non è questa la probabilità che Arbuthnot e noi con lui abbiamo calcolato. Per chiarire il significato della probabilità di Arbuthnot, indichiamo con

In l'ipotesi

dell'indipendenza e con

� l'ipotesi della

costanza della probabilità di ogni anno maschile. Con questi sim­ boli la probabilità di cui ci siamo occupati può essere indicata come

p(DI In, �) che mostra la ragione per cui la probabilità,pur essen-

LE ORIGINI

do relativa a un dato di fatto,non è tuttavia uguale a 1. Detto altri­ menti, non abbiamo calcolato la probabilità degli 82 anni maschili del registro delle nascite di Londra, bensì quale sarebbe stata hi probabilità di ottenere 82 anni maschili se le nascite annuali fossero state regolate congiuntamente dalle ipotesi In e

�.

Quella calcolata da Arbuthnot fu dll!2Qlle una probabilità ipote­ tica e viene perciò naturale chiedersi per quale ragione egli ricorse a una siffatta probabilità. La risposta è molto semplice: il nostro autore intendeva confutare !'ipotesi secondo cui il susseguirsi degli 82 anni maschili fosse da attribuirsi al caso, perché questo è pro­ prio il significato della congiunzione dell'ipotesi dell'indipendenza e della costanza della probabilità. Per rendersi conto della ragione per cui in vista di confutarla si suppone la validità di un'ipotesi, con­ viene fare riferimento al metodo ipotetico-deduttivo che dobbiamo a Galileo Galilei. In forma del tutto semplificata, questo metodo asserisce che, se da un'ipotesi si deduce un fatto in contrasto con le osservazioni, allora queste confuteranno l'ipotesi. Adattato alle nostre esigenze,possiamo esemplificare l'uso del metodo nel modo seguente. Supponiamo di avere un'urna contenente delle biglie di cui non conosciamo il colore; avanziamo !'ipotesi che tutte le biglie dell'urna siano nere; dopo aver estratto un certo numero di biglie nere ne estraiamo una bianca; concludiamo che l'ipotesi è falsa. Fin qui tutto è pacifico; ma è questo il caso di Arbuthnot? La risposta è ne­ gativa; analogie certamente sussistono ma non completa identità. Per renderci conto della differenza,sostanziale dal nostro punto di vista, trasformiamo gli anni maschili in estrazioni di biglie da un'urna, occupandoci solo della parte accettabile delle argomenta­ zioni di Arbuthnot e non delle sue conclusioni metafisiche. Ab­ biamo dunque estratto dall'urna una sequenza di 82 biglie nere e, con l'intento di assicurare tanto !'indipendenza quanto la costanza delle probabilità,abbiamo operato le estrazioni rimettendo di volta in volta la biglia estratta nell'urna; inoltre abbiamo eseguito le estra­ zioni in modo tale che tutte le biglie contenute nell'urna, indipen­ dentemente dal loro colore, avessero la stessa probabilità di essere estratte. Ora, coll'intento di confutarla, avanziamo l'ipotesi che nell'urna vi sia un ugual numero di biglie nere e bianche. Arbuthnot ritiene che la sequenza osservata di biglie nere sia sufficiente per

CAPITOLO PRIMO

confutare l'ipotesi dell'uguale proporzione delle biglie nell'urna. A questo punto basta davvero poco per convincersi che la situazione è profondamente diversa da quella in cui, a seguito dell'estrazio­ ne di una biglia bianca, abbiamo confutato l'ipotesi che nell'urna vi fossero solo biglie nere. Infatti allora il fatto accaduto era logi­ camente escluso dall'ipotesi avanzata: se tutte le biglie nell'urna sono nere, allora è impossibile estrarre una biglia bianca e, lo si noti, quest'impossibilità è logica prima ancora che pratica. Non stanno certo così le cose con l'ipotesi di Arbuthnot: nono­ stante la stessa proporzione delle biglie nell'urna,nulla esclude l'e­ strazione successiva di 82 biglie nere. Questa possibilità è tanto lontana dall'impossibilità logica che siamo stati in grado di calcolar­ ne la probabilità; se si fosse trattato di un risultato impossibile,lo­ gicamente beninteso, la sua probabilità sarebbe stata nulla. La di­ stanza che corre fra impossibilità e possibilità,è la stessa che corre fra le due argomentazioni che abbiamo visto. Quindi il ragionamento di Arbuthnot non è basato sul metodo ipotetico-deduttivo, dal nlo.;­ met1.to che l'ipotesi da confutare non esclude il verificarsi di ciò che sr� verificato. Ma,si potrà obiettarmi, non vorrai negare che, sul­ la scorta dell'indipendenza e dell'equiprobabilità, la probabilità di ciò che di fatto si è verificato sia davvero minima? Non lo nego, infatti; aggiungo solo che,��jntendiamo servirci dello schema indi­ _�ato dal metodo ipotetico-deduttivo,dobbiamo modificarlo intro­ QI:ls:endo illqualche modo,_fP:�gari per semplice convellzione,un'as� sunzio.Q R3, R4 ) =

(� y

vale a dire la probabilità di uno qualsivoglia dei risultati possibili è il reciproco del numero dei risultati possibili,che è un altro modo di dire che tutti i risultati possibili sono equiprobabili. D'altro canto,si vede immediatamente che,se tutti i risultati possibili han­ no la stessa probabilità, allora abbiamo

P(R1, R2, R3, R4 )

=

(� y

=

P(R1)P(R2)P(R3)P(R ) 4

LE ORIGINI

e quindi

!

=

i = P(Rr), � = P(R2)

P(R4 )

=

=

P(R21 Rr),



=

P(R3) = P(R31 Rr nR2),

P(R4 1 Rr nR2 n R3), che mostra essere i risultati di

ciascun lancio equiprobabili e indipendenti. L'equivalenza di cui ci siamo appena occupati è di grande importanza e avremo modo di occuparcene ancora nei capitoli seguenti. B . Lo schema bernoulliano

Le determinazioni delle probabilità che abbiamo visto sono casi particolari di uno schema (di estrazioni) probabilistico - a questo proposito si parla anche di campionamento - che prende il nome da colui che per primo se ne occupò verso la fine del XvII secolo, vale a dire J acob Bernoulli. Vediamo ora un poco da vicino, insieme allo schema, anche il primo grande risultato della teoria delle proba­ bilità, il teorema di Bernoulli, che apparve nella celeberrima Ars conjectandi pubblicata a Basilea nel 1713 dopo la morte di Ber­ noulli. Consideriamo un'estrazione da un'urna nella quale sono contenu­ te N biglie di cui Np, O