Filosofia della fisica [1 ed.] 8842494003, 9788842494003 [PDF]

È un libro quasi d'altri tempi, per la sua consistenza - "adesso" un libro non deve mai superare le 200-2

146 39 13MB

Italian Pages 672 [667] Year 1997

Report DMCA / Copyright

DOWNLOAD PDF FILE

Filosofia della fisica [1 ed.]
 8842494003, 9788842494003 [PDF]

  • 0 0 0
  • Gefällt Ihnen dieses papier und der download? Sie können Ihre eigene PDF-Datei in wenigen Minuten kostenlos online veröffentlichen! Anmelden
Datei wird geladen, bitte warten...
Zitiervorschau

Gli autori

Silvio Bergia.Laureato in Fisica. Docente di Metodi Matematici della Fisica presso il Dipartimento di Fisica dell'Università di Bologna. Si occupa di storia della fisica e di fisica teorica, segnatamente dei fondamenti della meccanica quantistica e della relatività. I risultati sono stati pubblicati in riviste internazionali e volumi collettivi. Fra i suoi lavori: Einstein e la relatività (Laterza, Bari 1978) ;Dal cosmo immutabile all'universo in evoluzione(Bollati-Boringhieri, Torino 1995). Maria Luisa Dalla Chiara.Laureata in Filosofia. Docente ordinaria di Logica presso il Dipartimento di Filosofia dell'Università di Firenze. È stata Presidente della Società Italiana di Logica e Filosofia della Scienza. Attualmente è Vicepresidente della Division of Logic, Methodology and Philosophy of Science e della Associazione Italiana di Logica e sue Applicazioni. Le sue ricerche si sono svolte prevalentemente nei seguenti campi: teorie del significato, filosofia e fondamenti della fisica, logica quantistica. I risultati sono stati pubblicati in numerosi saggi e volumi. Mauro Dorato. Laureato in Filosofia e in Matematica. Dottore di ricerca in Filosofia alla Johns Hopkins University di Baltimora. Si occupa di filosofia della scienza e di filosofia della fisica, specialmente di tematiche temporali. Oltre a numerosi saggi ha pubblicato Time and reality (Clueb, Bologna 1995) ;Futuro aperto e libertà (Laterza, RomaBari 1997). Giancarlo Ghirardi. Laureato in Fisica. Docente ordinario di Istituzioni di Fisica Teorica presso il Dipartimento di Fisica Teorica dell'Università di Trieste, di cui attualmente è il Direttore. Ha pubblicato oltre un centinaio di saggi su temi di fisica teorica e di fondamenti della meccanica quantistica. È coautore di uno dei più noti modelli alternativi alla versione standard della meccanica quantistica. È membro dell'Editorial Board di "Studies in History and Philosophy of Modem Physics" e di "Foundations of Physics". È Presidente della Società Italiana per i Fondamenti della Fisica. Ha curato Simmetry principlesin quantum physics(M. Dekker, New York 1970). Roberto Giuntini.Laureato in Filosofia. Dottore di ricerca in Filosofia presso il Dipartimento di Filosofia dell'Università di Firenze. Si occupa dei fondamenti logici e fùosofici della meccanica quantistica e di logiche non dassiche. Ha pubblicato vari saggi in riviste internazionali e il volume Quantum logic and hidden variables(Bibliographisches Institut, Mannheim 1991). Massimo Pauri. Laureato in Fisica. Docente ordinario di Relatività al Dipartimento di Fisica dell'Università di Parma. È Vicepresidente dell'Accadémie Internationale de Philosophie des Sciences e Senior Fellow del Center for Philosophy of Science di Pittsburg. Ha pubblicato oltre un centinaio di saggi su vari argomenti di fisica teorica e di filosofia della fisica. Fra questi, la voce quadro "Spazio e tempo" per il Dizionario delle Scienze fisiche(Istituto dell'Enciclopedia Italiana, Roma).

Filosofia della fisica A cura di Giovanni Boniolo Con testi di S. Bergia, G. Boniolo, M.L. Dalla Chiara, M. Dorato, G. Ghirardi, R. Giuntini, M. Pauri

Bruno Mondadori

© Edizioni Scolastiche Bruno Mondadori Milano, 1997 L'editore potrà concedere a pagamento l'autorizzazione a riprodurre una porzione non superiore a un decimo del presente volume. Le richieste vanno inoltrate a: Associazione Italiana per i Diritti di Riproduzione

delle Opere dell'ingegno (AIDRO), via delle Erbe 2, 20121 Milano, tel./fax 02/809506. Progetto grafico: Massa R Marti, Milano La scheda bibliografica è riportata nell'ultima pagina del libro. In copertina: Albert Einstein e Pieter Zeoman in una fotografia del 1921.

Indice

Introduzione Parte Prima: LO SPAZIO E IL TEvPO

1. Dalla relatività galileiana alla relatività generale di Giovanni Boniolo e Mauro Dorato

710

1.

T r a sformazioni galileiane e fisica dassica

1.1

L a c ovarianza della meccanica classica Prodotto scalare e prodotto vettoriale N umeri se calari Funzioni scalari e vettoriali Cam p i di forze conservativi Derivata e differenziale di una funzione a piu variabili Operatori differenziali Il teorema di Stokes N on c ovarianza delle leggi dell'elettromagnetismo classico Equazioni di Maxwell

10

10 10 12

12

14 16

16 17

13

19

2.

19 21

2.1 2.1.1 2.2 2.2.1 2.3 2.3.1 2.3.2

24 28 34 34 39 47 54 57 59 63

La r elatività speciale

L e t r asformazioni di Lorentz Conseguenze ddle trasformazioni di Lorentz L'i n t ervallo spaziotemporale L i n terpretazione geometrica della rdatività speciale Te m p o e simultaneità Tempo oggettivo e tempo relativo nella relatività speciale La teoria causale del tempo e la non-esistenza dell'universo m un Istante 23,3 L a convenzionalità ddla simultaneità 2.4 L a r e altà della contrazione delle lunghezze e deHa dilatazione dei tempi 2.4.1 L esperimento di Michdson e Morley e le sue prime interpretazioni Calcolo della velocità della terra rispetto all'etere 2.4.2 Spiegazione causale e spiegazione strutturale degli effetti relativistici

'72g 2.4.3 Il paradosso dei gemelli 78 79 88

2.5

2.6

Un p o ' di matematica: vettori e tensori Vettori e matrici I quadrivettori

VIII Filosofiadellafisica 91

93 94

Il p r o blema interpretativo ddla massa relativistica Calcolo dell'energia cinetica 2.8 L'equivalenzafra massa ed energia

102

3,

La r elatività generale

102

3.1

L e f o rze inerziali

103 107

32

I l p r incipio di equivalenza

3.3 3.4 3.5 3.6 3.7

Il p r i ncipio di covarianza generalizzato Ve r so la geometria ddla relatività generale L a c u rvatura L a c o nnessione af6ne I l t e nsore energia-impulso

111 115 118

124 128 129 138 140 140

2.7

3.8 Le equazionidicampo 3.9 I l p rincipio di Mach 3.10 H principio di equivalenza debole 3.11 F i sica e geometria 3.11.1 La "irragionevole" ef6cacia della geometria nella descrizione

del mondo 6sico 143 3.11.2 Il platonismo e il realismo geometrico 147 3.11.3 Il kantismo 154 3 . 1 1.4 Il formalismo 157 -3 .113 Il convenzionalismo della metrica e la disputa fra sostanzialisti e relazionisti

Bibliogra6a

163

169

2. Problemi fondazionali e metodologici in cosmologia

di Silvio Bergia 171

1.

La cosmologia come disciplina scientifica

171 172

1.1 1.2

179 181

1.3

Osservazioni di natura cosmologica Osservazioni con valenza cosmologica La cosmologia teorica: è lecito parlare dd tutto?

182

1.5

1.4

Leggi e condizioni iniziali Ruolo peculiare delle condizioni iniziali in cosmologia: una teoria rigida?

185 1.6 187

1.7

189 1.8

Forme possibili del rapporto fra cosmologia e fisica: la subordinazione della cosmologia alla fisica e il Principio Cosmologico Moti naturali, principio di Weyl, tempo cosmico come tempo degli osservatori dd substrato e modelli di universo Dal principio cosmologico alla soluzione di Friedman-Lemaitre-

Robertson-Walker (FLRW) 191

1.9

193

1.10

Intermezzo. La biblioteca di Babele: i problemi dell'in6nito spaziale Dinamica dell'universo nella cosmologia standard: necessità

di un inizio e possibili modalità deHa 6ne

Indice IX

Forme possibili del rapporto fra cosmologia e fisica: leggi locali e leggi cosmiche

196

201 203 206 206

1.12 Forme possibili del rapporto fra cosmologia e fisica: la subordinazione della fisica alla cosmologia 1.13 La teoria dello stato stazionario: il Principio Cosmologico Perfetto e le ragioni della permanenza delle leggi fisiche 1.14 La radiazione cosmica di fondo 1.15 Un esempio di predittività della cosmologia 1.16 L'isotropia della radiazione di fondo e il Principio Cosmologico 1.17 Elusione delle condizioni iniziali o ricerca della causa della causa:

209

1.18 Un metodo per la cosmologia?

211

2.

211 211

2.1

197 198

tentativi di risposta al problema chiave della cosmologia teorica

Problemi e moddli di spiegazione nella cosmologia evolutiva

2i2' 214

215 216 217

La storia termica dell'universo 2,1.1 L'universo e il secondo principio 2.1.2 I paradossi della "morte termica" 2.1.3 Il secondo principio dal punto di vista meccanico-statistico e l'evoluzione spontanea come evoluzione verso l'ordine 2.1.4 L'apparente contraddizione: la tendenza in atto allo squilibrio.

Il caso della biosfera 2..1.5 L'apparente contraddizione: la tendenza in atto allo squilibrio. Il caso generale 2.1.6 L'espansione come spiegazione: il modello dell'espansione incontrollata nel vuoto

220 221

223 225 226

227 228 228

229 234 235 236 239 240

2.1.7 Meccanismi specifici per la generazione d'ordine con aumento dell'entropia globale 2.1.8 L'universo è nato in uno stato di bassa entropia? 2.1.9 La bassa entropia iniziale come origine dell'irreversibilità e della freccia dd tempo 2.1.10 Diramazione successiva di sistemi fuori equilibrio 2.1.11 Bassa entropia "iniziale" e iperespansione 2.1.12 L'archetipo dd processo d'espansione come processo reversibile e le sue risposte 2.2 II P r i ncipio Antropico 22.1 L e espansioni inspiegate fra costanti adimensionali

2.2,2 Il Principio Antropico (debole e forte) come proposizione 22,3 I l valore esplicativo delle proposizioni antropiche 2.2.4 La scoperta della criticità dell'universo

2.2,5 Finalismo o daremmo? Postfazione Bibliogra6a

X Filosofia della fisica

245

3, La descrizione fisica dd mondo e la questione del divenire temporaledi Massimo Pauri

247

1.

254

2.

258 267 282 287

4. 5. 6.

Introduzione Antefatti storici: il principio di ri-presentazione Il presente

Il divenire Il tempo fisico ela suafreccia "Se c'è divenire il fisico deve saperlo", ovvero:

il divenireimpossibile 296 303 316 330

7. 8. 9.

H tempo cosmico Una ricapitolazione: la descrizionefisicadel mondo 11 divenire ritrovato Bibliografia

335

Parte seconda: LA MECCANICA QUANTISTICA

337

4. I fondamenti concettuali e le implicazioni epistemologiche della meccanica quantisticadi Gian Carlo Ghirardi

339 340 342 343 345 346 348 351 352 352

1.

La nascita della meccanica quantistica

1.1 1.2

La crisi della fisica dassica

355 356 361 362

13 1.4

1.5 1.6 1.7 1.8

Il dualismo onde-corpuscoli

1.9

Cenni alle problematiche sollevate dal nuovo schema

2.

La struttura formale della teoria

2.1

Le regole del gioco: un'esposizione semplificata Un'illuminante descrizione geometrica Probabilità degli esiti ed effetto della misura nel caso di autovalori degeneri e/o di spettro continuo Ancora sulla preparazione dei sistemi: stati puri e miscele statistiche Lo schema generale Osservabili fisiche e operatori autoaggiunti

2.2 2.3 2.4

369 371

La dipendenza della temperatura del "colore" degli oggetti Gli atomi e le loro proprietà L'ipotesi di Planck e la successiva elaborazione di Einstein L'atomo di Bohr e,la quantizzazione L'ipotesi di de Broglie Il superamento della crisi

2.5 2.6

I~dice XI

374 380 383 386 388 389 391 393

2.7

2.11 2.12 2.13 2.14

Scarti quadratici medi La trattazione degli insiemi statistici e l'operatore statistico

396 396 400 400 402 407 410 413 415 417 423

3.

Prime implicazioni concettuali della teoria

3.1

Il principio di sovrapposizione

429 429 430 433 437 439

4.

Sistemi composti ed entanglement

4.1

Aspetti formali ddla descrizione dei sistemi composti Stati fattorizzati e non fattorizzati

4.3 4.4 4.5

Un utile esempio: gli stati di spin di due particelle di spin 1/2

443

5.

L'argomento di incompletezza di EPR

450 452 454 459

5.1 52 5.3 5.4 5.5

Il cosiddetto "paradosso" di EPR Una prima valutazione delle implicazioni del lavoro di EPR La reazione di Bohr

2.8

2.9 2.10

Rappresentazione esplicita delle variabili posizione e impulso L'algebra ddle componenti dd momento ddle quantità di moto Lo spin dell'dettrone Valori medi Il processo di evoluzione temporale L'operatore statistico e la riduzione del pacchetto

Operatori statisticiassociatiainsiemi omogenei e disomogenei Valori medi deglioperatori diproiezionenelcaso diuninsieme statistico

32 3.3 3.4 3.5 3.6 3.7 3.8

4.2

Sovrapposizioni e variabili spaziali L'indeterminismo Le relazioni di indeterminazione L'argomento di Heisenberg

Misure di osservabili compatibili Primi cenni al dibattito circa l'interpretazione della teoria Il dibattito Bohr-Einstein: prima fase

Stati entangled e riduzione del pacchetto d'onde La descrizione formale dei singoli costituenti di un sistema composto: miscele statistiche di prima e di seconda specie

Alcuni fraintendimenti dell'argomento di incompletezza La violazione della località einsteiniana comporta la possibilità

di segnali o effetti superluminalib

6.

464 464 466 469 472

6.1 6.2 63

473 477 482 485

6.4 6.5 6.6 6.7

Le variabili nascoste

L'idea deHe variabili nascoste Il teorema di impossibilità di von Neumann La teoria dell'onda pilota Come la teoria di Bohm riproduce le distribuzioni quantistiche in posizione

Alcuni esempi di descrizione "alla Bohm" di processi Bsici La contestualità delle teorie deterministiche a variabili nascoste

La contestualità ddle variabili di spin Le caratteristiche delle teorie e variabili nascoste in sintesi

XII Fi losofia della fisica

487 489 491 491 493 495 496 500 505

7.

La nonlocalità e la disuguaglianza di BeH

7.1 7.2

La richiesta di località secondo Bdl

73 7.4 7.5 7.6

507 509 510 511 514 516 518 y~, zz) è data dal teorema di Pitagora: d 12 ( x l x2 ) ' + (y1 — y2) + (zl z 2 ) Per analogia, chiamiamo intervallo spaztotemporale fra due eventi E1 (xt, y1, z1, ct1) e Ez — (x> yz, zz, ct>) la radice quadrata della relazione ~ ( 1 t 2 ) + (x l x 2 ) + ( y l y 2 ) + ( z l z 2 ) 12 Rispetto al caso eudideo, si noti che, oltre alla presenza del tempo e di c, vi è anche un segno meno. Il che indica che si sta lavorando in una geometria non più euclidea, ma, come viene chiamata, pseudo-euclidea o -

minkowskiana (da Hermann Minkowski).

La relatività speciale 25

Ponendo a zero il secondo membro deil'equazione appena scritta, si ottiene l'equazione descrivente il fronte d'onda sferico di un segnale di luce propagantesi, dall'origine di un sistema di coordinate euclideo (x, y, z), nel tempo t con velocità c. Questa osservazione ci porta a dire che l'intervallo spaziotemporale percorso da un raggio di luce è nullo. Naturalmente questo intervallo, data l'invarianza di c, è invariante rispetto a sistemi di riferimento in moto inerziale. Viene allora spontaneo chiedersi se vi siano casi in cui l'intervallo spaziotemporale sia maggiore e altri in cui sia minore di zero. Inoltre ci si può chiedere se in questi casi l'intervallo spaziotemporale sia ancora invariante, Cominciamo dal secondo problema. Per uniformarci alla notazione standard, invece di lavorare con l'espressione di cui sopra, da ora utilizz1amo s 12 = ~(hl h 2 ) (xl x2)' — (yl — y2) ( Zl Z 2 ) Inoltre, sempre per lo stesso motivo, invece di lavorare con grandezze finite usiamo grandezze infinitesime, ossia consideriamo intervalli spaziotemporali fra due eventi infinitamente vicini. Dopo queste due modifiche puramente formali, l'intervallo infinitesimo è dato da ds = cdh — dx — dy — dz

Adesso non ci resta che applicare le trasformazioni di Lorentz e riconoscere che il ds trovato in K è proprio il ds' che si trova in K', ovvero che d s'= d s hz

dove ds' = cdt' —dx' — dy' — dz' . Sapendo che dhh'

=g(dhh — VCh)

=

f = J, dh'= y

dh -— dx c

2

si ottiene ds' = c y

=...= y'

d h -— dx 2 c

h' — V'

(

— y (dx — Vdh) — dy — dz 2

dh'+ y' —

)

c

—1 dhh' — dy' — dh' = 2

= C dh — dx — dy — dz = ds c.v.d. Mentre in meccanica classica è invariante sia la lunghezza spaziale fra due

26 1.D allarelatività gal ileiana alla relatività generale

punti che la durata temporale fra due fenomeni, in relatività ristretta l'unica quantità invariante è l'intervallo spaziotemporale fra due eventi. Le lunghezze spaziali e le durate temporali coordinate dipendono invece dal particolare osservatore che le descrive. Per motivi di comodità, invece di lavorare in quattro dimensioni, sopprimiamo due coordinate spaziali, rappresentando l'intervallo con la coordinata temporale e con una generica coordinata x, che sintetizzerà tutte e tre le dimensioni spaziali. Inoltre ritorniamo a intervalli spaziotempora-

li finiti, ossia r'= c' M - h x ' dove At = (tz — t,) e hx = (xz — xt). Abbiamo già visto che l'intervallo spaziotemporale è nullo quando rappresenta la distanza fra due eventi collegati da un raggio di luce; in questo caso si chiamerà intervallo di tipo luce. Vediamo che cosa accade nd caso in cui s < 0 e nel caso in cui s' > 0. È importante sottolineare che per l'invarianza dell'intervallo, se s è uguale, maggiore o minore di zero in un sistema inerziale, lo è in tutti i sistemi inerziali. Analizziamo i due casi 1. s = c ht — hx > 0. In questo caso siamo in presenza di un intervallo di tipo tetnpo, dove i segnali che connettono i due eventi sono

più lenti di quelli luminosi (c d,t > hx'). È anche possibile trovare un sistema di riferimento K' in cui i due eventi, che in K erano distanti hx, coincidono spazialmente, cioè du' = 0. Per tale sistema K', avremo cos i s' = c'd,t' — hx' = d,t" > 0 .

2. s' = rht — Lbc' < 0. Siamo in presenza di un intervallo di tipo spazio, dove un ipotetico segnale che connettesse i due eventi dovrebbe viaggiare a velocità superluminali, dato che lo spazio da esso percorso è superiore a quello percorso dalla luce (c At < hx' ). È possibile trovare un sistema di riferimento K' in cui i due eventi sono simultanei, dove cioè ht' = 0 . Per tale sistema K'avremo s = ch,t — hx' = — M" < 0 . I futuro assoluto

passato assoluto

La rektivit à speciale 27

In base a tutto ciò, rispetto all'origine il nostro spaziotempo può essere diviso in tre zone (fig. 1): una dove ci possono essere solo intervalli di tipo tempo (I), una dove ci possono essere solo intervalli di tipo luce (II) e una dove ci possono essere solo intervalli di tipo spazio (HI). Prendiamo ora un evento qualsiasi coincidente con l'origine degli assi ct e x. Supponiamo che tale evento costituisca un accadimento relativo a una particella. Ogni successiva posizione della particella sarà individuata da un

punto evento ndlo spazio bidimensionale(ct, x) (che in effetti sarebbe 4dimensionale (ct, x, y, z)). L'insieme di tali punti costituisce la sualinea di universo, cioè la sua storia spaziotemporale. Consideriamo ora un intervallo di tipo luce. In tal caso s = 0, cioè c'd t = hx . Questo significa che la tangente a tale traiettoria è proprio la bisettrice degli assi ct e x. Ma, visto che la tangente alla traiettoria è la velocità, in questo caso la particella si muoverà con velocità c = Ml ht , ossia si muoverà con velocità della luce. Risultato che ci si aspettava perché avevamo visto che un intervallo

di tipo luce è proprio qudl'intervallo percorso da un raggio di luce. Se una particella si evolvesse lungo una linea di universo la cui tangente forma con l'asse delle x un angolo maggiore di 45' (e specularmente mi-

nore di 135'), cioè maggiore di quello formato dalla bisettrice, allora la particella avrebbe una velocità minore di queHa ddla luce. In questo caso c dt' > due' e saremmo in un intervallo di tipo tempo. Se la particella si evolvesse lungo una linea di universo la cui tangente formasse un angolo minore di 45' (e specularmente maggiore di 135') la particella si muoverebbe con velocità maggiore di quella della luce. In questo caso c b,t ( M e s a remmo nel caso di un intervallo di tipo spazio. Dato che il limite per la velocità dei segnali imposto dalla relatività ristretta è quello della luce, non ci possono essere particelle che si muovono a velocità superluminali, e quindi non ci possono essere processi fisici che evolvono lungo linee di universo di tipo spazio. Abbiamo cosi costruito lo spaziotempodi Minkowski. Consideriamo la I zona dello spaziotempo. Nel caso di ct positivi ogni evento diverso dall'origine è un evento successivo, mentre nel caso di ct negativi ogni evento è precedente. Questa relazione di successione, o precedenza, temporale deve essere invariante per tutti i sistemi di riferimento. Infatti, nella regione I gli intervalli fra due eventi, di cui uno è situato neil'origine, possono essere solo di tipo tempo, il che comporta che se due eventi sono successivi in un sistema di riferimento lo saranno in tutti i sistemi e, come visto, in questo caso non è possibile trovare un sistema in cui gli eventi siano simultanei. Questo comporta che il rapporto causale fra due eventi nella zona I non può essere mutato in alcun sistema di riferimento. Per cui, rispetto a un evento p considerato "qui e ora", è naturale parlare di

28 1. Dalla relatività galileiana alla relatività generale

cono (4-dimensionale) del futuro assoluto di p per ct positivi, e di cono del passato assoluto di p per ct negativi. Invece le connessioni fra l'evento nell'origine e gli altri eventi della zona III sono di tipo spazio, il che comporta che ci possano essere sistemi in cui i due eventi (di cui uno è situato neH'origine) sono simultanei. Ma non solo. Possiamo infatti trovare anche sistemi in cui i due eventi sono uno posteriore aH'altro e altri in cui questo ordine temporale è invertito. Come conseguenza, due eventi possono essere connessi da una relazione causale se e solo se l'intervaHo che li separa è di tipo tempo. Infatti, solo in questo caso, l'evento causante precede temporalmente l'evento causato in modo invariante per ogni sistema di riferimento. 2.2.1 Linterpretazione geometrica della relatività speciale Quanto detto finora può essere reso intuitivamente perspicuo ricorrendo a semplici ragionamenti geometrici dai quali si evince la simmetria deHa relatività della simultaneità (di cui non abbiamo ancora parlato estesamente), delle contrazioni spaziali e delle dilatazioni temporali. Consideriamo un sistema inerziale K. Dato un evento E, ogni evento che, in K, accade neHo stesso istantet in cui accade E è a questo simultaneo. Questo significa che in K saranno simultanei tutti quegli infiniti eventi appartenenti a queH'iperpiano (o ipersuper6cie) 3-dimensionale intersecante perpendicolarmente l'asse temporale al tempo t. Tale iperpiano è di tipo spazio in quanto ogni due suoi punti distrnti sono divisi da un intervallo di tipo spazio. Per facilitare le cose, consideriamo solo due coordinate: una temporale, ct, e una spaziale, x. In tal caso dato un punto t = t" deH'asse temporale, l'ipersuperficie di simultaneità è rappresentata dalla retta parallela aH'asse x passante per t = t'. Consideriamo ora due rivelatori di segnali luminosi in quiete a t = 0 in K e siano u e P le due linee di universo che li identificano. In tal caso gli eventi A e B, rispettivamente appartenenti alle due linee di universo, giacciono sullo stesso iperpiano di simultaneità t = 0. Si abbia inoltre una sorgente luminosa S equidistante dai due rivelatori e tale da emettere un segnale di luce a t = 0. Sappiamo che il segnale percorre intervalli di tipo luce rappresentati da linee di universo formanti un angolo di 45' con l'asse x. Il punto di intersezione fra le linee di universo del segnale luminoso e le linee di universo dei due rivelatori permette di identificare il tempo t = t ' in cui il segnale viene rivdato; siano E e F questi due eventi. Per K, data l'isotropia della velocità ddla luce, E e F sono simultanei, ovvero appartengono alla stessa ipersuperficie di simultaneità t = ta (fig. 2a).

La relatività speciale 29

Supponiamo ora che i due rivelatori e la sorgente siano solidali a un sistema di riferimento K', di coordinate ct' e x', in moto inerziale rispetto a K lungo le x positive e tale da avere l'origine coincidente con quella di K. I segnali luminosi emessi da S continueranno ad avere linee di universo formanti un angolo di 45' con l'asse x. Per quanto discusso nei paragra6 precedenti, l'osservatore in K vede che il rivelatore di sinistra si avvicina alla sorgente, mentre qudlo di destra si allontana. Ne segue che, per l'osservatore in K, il segnale luminoso arriverà prima a quello di sinistra e poi a quello di destra, come si coglie intuitivamente dalla 6g. 2b. Se sonoE' e F', rispettivamente, i due eventi collegati con la rivelazione del segnale,E' e F' non sono simultanei per K. Però sono simultanei per l'osservatore in K'. Questo signi6ca che, per K', apparterranno a uno stesso iperpiano di simultaneità che perciò dovrà essere paralldo all'asse x' di K'. In effetti E' e F' sono dati dall'intersezione ddle linee di universo dd segnale luminoso con le linee di universo u eP dei due rivelatori che ora, pur essendo sempre parallele fra di loro e all'asse ct', saranno inclinate rispetto alle linee di universo dei due rivelatori in quiete (6g. 2b). ct

ct

ct~

c t' y' P ' ~x'

/ / /

/ / /

/ /

A

S

B

A S B

b fig. 2 a e ot' linee di universo del rivelatore di sinistra nel sistema di riferimento, rispettivamente, KeK' P e P' linee di universo dd rivelatore di destra nel sistema di riferimento, rispettivamente, KeK' p e y' linee di universo della sorgente luminosa nd sistema di riferimento, rispettivamente, KeK' 5< e 5'> linee di universo del segnale di luce nel sistema di riferimento, rispettivamente, K e K'

Quindi la rappresentazione del sistema K', una volta dato il sistema K, sarà individuata da due assi aventi la stessa origine di quelli di K, ma indinati rispetto a questi di un angolo proporzionale alla vdocità relativa fra K' e K. Se si fa attenzione ci si accorge che l'inclinazione dell'asse x'

30 1. Dalla relatività galileiana alk relatività generale

rispetto a x deve essere compresa fra 0' e 45'. Ossia K' avrà una vdocità rdativa compresa fra vdocità nulla (in tal caso, K' -= K, E' = E, F' -= F) e

velocità pari a quella della luce. Abbiamo cosi visto che due eventi simultanei per K' (E' e F') non lo sono più per K; viceversa, ciò che è simultaneo per K (E e F) non lo è più per K'. Parliamo allora di relatività della simultaneità. Consideriamo ora un sistema K e ndla sua origine poniamo una sorgente luminosa che a t = 0 emette un segnale. Questo si propagherà lungo

linee di universo formanti angoli di 45' con l'asse x di K. Sappiamo che l'intervallo spaziotemporale è dato da s' = x' — c't' e che, essendo questo un invariante - anzi l'invariante fondamentale della relatività ristretta —, se K' è un sistema in moto relativo uniforme rispetto a K si ha s ' = x — c't' = x "

— c t" = s "

Ricordandoci un po' di geometria, ci sovviene che l'equazione x' —ct' = s' è esattamente l'equazione di una conica particolare, segnatamente di un'iperbole equilatera, che chiameremo iperbole invariante, la quale ha la proprietà di avere come rette asintoti le bisettrici dei quadranti individuati dagli assi x e ct. Nella fattispecie, le rette bisettrici sono proprio le linee di universo del segnale luminoso. Infatti, l'intervallo di tipo luce, identi6cato da x' — c't' = 0, può essere sviluppato in x = ct e x = —ct che sono le due equazioni delle due rette bisettrici, rispettivamente, dd I e III quadrante e

del II e IV. Un ultimo aspetto da notare è che in realtà abbiamo due iperboli. Sappiamo infatti che s' può essere maggior di zero (intervallo di tipo spazio) o minore di zero (intevallo di tipo tempo).s Quindi non avremo solo un'iperbole equilatera, ma due: l'iperbole equilatera 1 identificata da x' — c't' = s', con s' ) 0 e quindi avente come asse di simmetria passante per i fuochi l'asse x; l'iperbole equilatera 2 identificata da x' —r't' = s', con s' ( 0 e quindi avente come asse di simmetria passante per i fuochi l'asse

ct (cfr. fig. 3a). Dalla fig. 3b, si può notare che l'asse x interseca l'iperbole in un punto a mentre l'altro asse, ct, è parallelo alla retta tangente l'iperbole nel punto a ed è uscente dall'intersezione delle due rette asintoto. Possiamo generalizzare questo fatto e dire che, una volta 6ssato il sistema K nella cui origine vi è la sorgente luminosa, ogni altro sistema di riferimento K' in moto rela' Si noti che nd paragrafo 2.2. avevamo detto che l'intervallo di tipo spazio era caratterizzato da r' < 0 e quello di tipo tempo da s' ) 0. Non vi è però contraddizione con quanto stiamo dicendo ora perché mentre in 2.2 per comodità avevamo considerato Vintetvallo spaziotemporale come s' = ct' — x', ora, sempre per comodità, lo abbiamo considerato come s' = x' —c't'. In definitiva, per nostra comodità espositiva e per rendere più perspicua l'equazione dell'iperbole, abbiamo cambiato il segno. Ma, a parte questo, non cambia null'altro. Dal prossimo paragrafo torneremo alla notazione usuale.

La relat ività speciale 31

tivo uniforme rispetto a K ha (1) come asse x' quella retta uscente dall'origine di K e intersecante in a' l'iperbole invariante; (2) come assect' quella retta, sempre uscente dall'origine di K, che è parallela alla retta tangente in

a' l'iperbole. a ct'

ct

ct

2

/

/

1

b' ,."" t /

X

I

a

/ /

/

b fig. 3 tt retta tangente al punto di intersezione fra l'asse x' e l'iperbole invariante 1 zz retta tangente al punto di intersezione fra l'asse ct' e l'iperbole invariante 2

Poichè l'iperbole è il luogo dei punti che hanno la stessa distanza (pseudo-euclidea e non eucltdea!) dall'origine, allora la distanza di a dall'origine è per K la stessa distanza dall'orgine di a' per K'. Ovvero se, ad esempio, x '- c 't' = 5' ,

1.inK a. il punto a, di coordinate (x = 5, ct = 0 ), sarà distante dall'origine s=

x ' —c ' t ' =

x' =

5 = 5

b. il punto a', di coordinate (x, ct c 0), sarà distante dall'origine s=

x —c t

=

5 = 5

2.in K' a. il punto a', di coordinate (x' =5, ct'=0), sarà distante dall'origine s'=

x' — c 't' =

x' =

5 = 5

b. il punto a, di coordinate (x', ct' o 0), sarà distante dall'origine s'=

x' -c t ' =

5 = 5

Si noti che nella geometria euciidea l'iperbole è de6nita come il luogo geometrico dei punti di un piano per i quali è costante il modulo della differenza delle distanze da due punti particolari deni fuochi. Questo comporta che la distanza eudidea dei punti dell'iperbole dall'origine sia diversa da punto a punto. Tuttavia nella geometria pseudo-euciida minkovtskiana, dove la distanza è deEinita in modo diverso dalla distara:a eudidea (compare un segno meno), l'iperbole può essere proprio pensata come il luogo geometrico dei punti del piano equidistanti daU'origine.

32 1. Dalla relatività galileiana alla relatività generale

Se a è, per K, l'evento simultaneo a t = 0; per K' l'evento simultaneo a t' = O è a' (t = t' = 0 ).

Analogo discorso potrebbe essere fatto partendo da due punti b e b' appartenenti aHo stesso ramo dell'iperbole 2. Anche la loro distanza (pseu-

do-euclidea e non euclidea! )dall'origine è la stessa. Inoltre b è per K nello stesso luogo dell'origine e accade dopo un certo tempo; invece, per K', a essere nello stesso luogo dell'origine è b' ed esso per K' avrà la stessa

separazione temporale, rispetto all'origine O, che hab per K (6g. 3b). Una volta stabilito questo, si afferra facilmente la relatività delle lunghezze spaziali e delle misure temporali.

1.Relatività delle lunghezze spaziali ct

O

ct

A' -/;.-,~,."c..P A

Supponiamo di avere un regolo, lungo OA, in quiete in K. La linea di universo del regolo è data dalla striscia di piano (iperpiano) compresa fra le linee di universo dei suoi estremi O e A. Sia ora K' un sistema in moto inerziale rispetto a K. Gli assi x' e ct' saranno individuati come detto sopra; sia A' l'intersezione fra l'iperbole invariante e l'asse x'. Per via dell'invarianza ddl'intervallo spaziotemporale, o geometricamente per via del fatto che A e A' appartengono allo stesso ramo dell'iperbole invariante 1, allora la distanza OA per K è la stessa distanza OA' per K' Tuttavia la

lunghezza dd regolo in K' è data daOP', in quanto è P' che in K' rappresenta l'estremo di destra del regolo. Ma OP' ( OA' e quindi in K' la lun-

ghezza del regolo è più corta che in K (Gg. 4a). Vale anche il viceversa. Supponiamo che il regolo sia in quiete in K',

allora la sua linea di universo è data dalla striscia di piano (iperpiano)

La relatività speciale 33

compresa fra le linee di universo dei suoi estremiO e A'. Ma in K la lunghezza del regolo è data daOP, in quanto in K è P che rappresenta l'estremo di destra dd regolo. Poiché OP ( OA, dove OA è la stessa distanza in

K di OA' in K' (A e A' appartengono al medesimo ramo dell'iperbeleinvariante 1), allora in K il regolo è più corto che in K' (fig. 4b). 2. Rektività delle misure temporali

ct

ct

B'

~X

/B' /

/

/

O

/

/

/ /

/ /

/

/

/

/

/

/

/

I

ág. 5

Supponiamo che un orologio sia solidale all'origine di K e che esso misuri un intervallo di tempo il cui evento finale è B, per cui l'intervallo è OB. Sappiamo cheB è un punto dell'iperbole invariante 2. Sia K' un sistema in moto rdativo inerziale rispetto a K. Per esso, lo stesso l'intervallo di tempo OB misurato dall'orologio in quiete in K sarà OB', visto cheB e B' appartengono aHo stesso ramo ddl'iperbole invariante 2 (B' è il punto di intersezione fra l'iperbole invariante 2 e l'asse ct'). Ma per K' l'evento simultaneo alla fine dell'intervallo misurato da K è, in realtà, Q' dato dall'intersezione con l'asse ct' di una parallela all'asse ddle x' passante per B (questa parallela individua l'insieme dei punti simultanei

aB, cioè l'iperpiano di simultaneità). Ma OQ' ) OB', quindi l'osservatore in moto K' misura un interallo temporale dilatato rispetto a quello misurato dall'osservatore in quiete K (fig. Sa). Viceversa, se l'orologio è solidale all'origine di K' e qui misura un intervallo temporale il cui evento finale èB', allora questo intervallo sarà lungo, per K, quanto quello il cui evento finale è B, visto che B giace sullo stesso

34 1. Dalla relatività galileiana alla relatività generale

ramo dell'iperbole 2. Tuttavia, per K l'evento simultaneo aB' non è B, quanto Q; dove Q è dato dall'intersezione con l'assect della parallela all'asse x passante per B' (questa parallela individua l'insieme dei punti"simultanei a B', ossia l'iperpiano di simultaneità). Ma O Q ) OB' E quihdi anche K misura un intervallo dilatato rispetto a quello misurato da

-K' (fig.'gb). 2.3 Tempo e simultaneità 2.3.1 Tempo oggettivo e tempo relativo nella relatività speciale L'invarianza dell'intervallo spaziotemporale sopra illustrata è la caratteristica essenziale della teoria della relatività speciale. Come tale, essa è importante anche per comprendere le differenze profonde che sussistono tra la nozione di tempo relativistico e la concezione del tempo valida neHa meccanica newtoniana. In una parola, tali differenze si riassumono dicendo che mentre in quest'ultima la simultaneità è assoluta, nella teoria di Einstein essa è relativa a un sistema di riferimento inerziale. Con il senno del poi, è anzitutto necessario sottolineare che la scelta del nome "teoria della relatività" si è forse rivelata forse inopportuna, essendosi prestata a frequenti fraintendimenti interpretativi dd significato della teoria. In effetti, oltre ai due postulati della covarianza delle leggi naturali nei sistemi inerziali e della costanza della velocità della luce in tali sistemi, potremmo dire che l'equazione qualitativa tra oggettività e invarianza è il terzo postulato implicito della teoria della relatività speciale. Tale equazione risulta immediatamente evidente se a'oggettività', che è termine filosoficamente non neutrale, diamo il significato di 'intersoggettività', al modo di Immanuel Kant, e se esaminiamo più da vicino le differenze tra la regione I e la regione III dal punto di vista delle relazioni temporali in esse vigenti. Come si è visto, la differenza tra la regione I (di tipo tempo) e quella III (di tipo spazio) è la differenza che passa tra un ordinamento temporale degli eventi valido per ogni sistema di riferimento inerziale, e perciò valido intersoggettivamente per ogni possibile osservatore, e un ordina-

Si tenga però presente che l'espressione 'equazione qualitativa' va presa cumgrano salis. Linvarianza, infatti, non può essere considerata in ogni circostanza come una condizione necessaria per la

realtà dei fenomeni descrivibili rispetto a un sistema di riferimento inerziale (cfr. 2.4.2).

La relat ività speciale 35

mento temporale che è invece relativo a un particolare sistema di riferimento, e dunque valido solo per osservatori che siano in quiete rispetto a qudl'unico riferimento. Per l'invarianza dell'intervallo spaziotemporale, che esprime la distanza tra due eventi dello spaziotempo, due eventi A e B separati da un intervallo di tipo spazio rimarranno separati da un intervallo di tipo spazio per ogni osservatore inerziale. Però si è visto che per tali eventi esistono dei sistemi di riferimento per cui A è prima di B, altri per cui A è simultaneo con B, e altri ancora per cui B è prima di A. Questa dipendenza da sistemi di riferimento dei rapporti temporali sussistenti tra eventi separati da un intervallo di tipo spazio fa si che solo le relazioni temporali tra eventi di tipo tempo siano oggettive nel senso detto. Infatti, se l'intervallo fra due eventi C e D è di tipo tempo, ed è tale che C è prima di D in un sistema di riferimento, non solo esso rimane di tipo tempo per ogni sistema di riferimento, ma in più si ha anche che C è prima di D per ogni osservatore in ogni sistema di riferimento inerziale. Allo scopo di distinguere tra futuro (passato) assoluto e futuro (passato) relativo di un evento p, ricordiamo che le traiettorie dei raggi luminosi che connettono eventi separati da un intervallo di tipo luce si ottengono ponendo uguale a zero l'intervallo metrico infinitesimo dsz = czdtz — dxz d P d zz Tali traiettorie corrispondono allora all'equazione di un cono infinitesimo 4-dimensionale

c'dt' = dx'+ dy'+ dz' detto cono di luce, in cui cdt è la coordinata temporale, mentre le altre coordinate sono quelle spaziali. Sopprimendo una coordinata spaziale, per esempio la z, e considerando di nuovo intervalli finiti e non più infinitesimi, si ottiene infatti l'equazione di un cono circolare retto il cui vertice è il punto p e il cui l'asse verticale è dato dalla coordinata temporale ct (cfr. fig. 6a). Cosi come la sezione di un tale cono con un piano parallelo alla base in 3 dimensioni è un cerchio, in 4 dimensioni una su-

perficie spaziale perpendicolare all'asse del tempo — cioèuna ipersuperf tcie di simultaneità t = costante — determina una sfera, il cui raggio è dato da ct. In quattro dimensioni possiamo perciò pensare al cono di luce come álla storia completa di un raggio di luce, il cui fronte d'onda sferico converge dail'infinito verso p generando la falda inferiore, e poi diverge di nuovo all'infinito generando la falda superiore del cono. Considerando il punto p come il presente o l'origine delle coordinate ("il qui-ora"), il futuro assoluto è linsierne di eventi all interno del cono di luce futuro dell'evento, il futuro che potremo chiamare "relativo" è invece l'insieme di eventi al di sopra di una qualunque ipersuperficie di si-

36 1.D allarelatività galileiana alla relatività generale

multaneità t = costante che interseca l'evento p. Tale ipersuperácie è l'insieme di eventi 'contemporanei' a p. Come vedremo, essa è determinabile solo relativamente a un sistema di riferimento arbitrario. Si noti che il futuro relativo è spaziotemporalmente assai più esteso di quello assoluto, dato che contiene i punti di quest'ultimo come suo sottoinsieme proprio (fig. 6b). Analoghe osservazioni valgono per il passato assoluto e relativo, mentre l'unica nozione di presente assoluto è data dal "qui-ora" Il presente relativo è infatti l'insieme di punti appartenenti a una ipersuperficie di simultaneità che interseca p. ct

futuro assoluto

ct

passato assoluto

futuro relativo

passato relativo

fig. 6

Per meglio comprendere il peculiare ruolo che giocano le ipersuperfici di simultaneità nella teoria, è istruttivo pensare allo spaziotempo di Minkowski a 3 dimensioni (2 spaziali e 1 temporale) come a un mazzo di carte, in cui ogni carta rappresenta un piano di simultaneità, cioè l'insieme di eventi simultanei con l'evento dato, mentre-la perpendicolare rispetto al piano delle carte è l'asse dei tempo (cfr. fig. 7). In due dimensioni, la geometria di una tale carta è esattamente quella eudidea della cinematica newtoniana. Ogni osservatore inerziale collocato in un punto particolare dello spazio a un certo tempo (corrispondente al suo "qui-ora") divide l'insieme di eventi che costituiscono lo spaziotempo di Minkowski in modo diverso tra eventi passati (relativi) ed eventi futuri (relativi), a seconda della velocità del suo sistema fisico di riferimento.

Tale espressione intende sottolineare la dipendenza di ciò cheè futuro dalla scdta di un arbitrario sistema di riferimento.

La relat ività speciale 37 tempo

tempo

fig. 7

I diversi modi di dividere lo spaziotempo da parte di tutti i possibili osservatori inerziali sono dati dai diversi angoli di inclinazione del mazzo di carte, corrispondenti a diverse velocità relative dei sistemi di riferimento. Dato che la velocità massima con cui si può muovere un sistema è quella della luce, tutti gli angoli di inclinazione possibili del mazzo di carte con l'asse orizzontale delle x sono esterni alle due generatrici del cono di luce, ossia, in 2 dimensioni, vanno da 180' a 135' e da 45' a 0'. Il fatto cruciale che va sottolineato è che il regime dello spaziotempo di Minkowski è a carattere "democratico": a causa dell'equivalenza di ogni sistema inerziale, non esiste una inclinazione privilegiata del mazzo di carte in base alla quale descrivere temporalmente i processi fisici.che avvengono a distanza. Il regime dello spazio-tempo di Newton privilegia invece in modo autocratico un sistema di riferimento inerziale nel quale si possa definire la quiete assoluta. Per riassumere, è utile ricordare una ulteriore distinzione tra due modi distinti in cui il tempo compare neUa teoria della relatività. Il futuro o il passato relativo di un evento viene specificato da quello che tecnicamente si chiama tempo coordinato, cioè il tempo relativo a un sistema di riferimento, o a una traiettoria inerziale. Come visto, tale tempo ovviamente non è invariante, pure essendo globale nel senso che consente un ordinamento temporale di tutti gli eventi dello spaziotempo. Il tempo proprio invece, che è sostanzialmente il tempo segnato da un orologio associato a un sistema di riferimento fisico rispetto al quale l'orologio è in quiete, è assoluto e invariante, in quanto misurato lungo una particolare linea di universo cr, ma è proprio per questo strettamente legato a tale linea di universo. Le uniche comparazioni temporali permesse dal tempo proprio sono infatti quelle che riguardano eventi sulla linea di universo o. Se tale linea di universo è inerziale, il tempo proprio può essere esteso a un tempo coordinato globale, che vale però solo relativamente al sistema inerziale determinato da o; e non vale per osservatori in moto relativo rispetto a o: Si chiarisce con ciò anche il motivo per cui la regione superiore dd co-

38 1.D allarelatività galileiana alla relatività generale

no di luce è stata denominata "futuro assoluto" rispetto a un evento arbitrariamente scdto come "qui-ora". Si deve far attenzione al fatto che nella teoria della relatività il termine 'assoluto' ha diversi significati che vanno tenuti distinti a seconda dei contesti. In questo caso, 'assoluto' significa non rektivo o indipendente dal sistema di riferimento o da sistemi di coordinate. Questo è il senso a cui ci si riferisce quando si afferma che la più grande innovazione concettuale introdotta dalla teoria della relatività speciale è quella di avere relativizzato la relazione di simultaneità tra due eventi a un sistema inerziale. Prima di Albert Einstein, la simultaneità era invece considerata una relazione tra eventi valida appunto in modo assoluto (vedi paragrafo 2.2.1). È chiaro che se gli stessi eventi A e B separati da un intervallo di tipo spazio possono essere simultanei per un osservatore in un sistema di riferimento, e uno prima ddl'altro per un altro osservatore che si muova rispetto al primo di moto rettilineo uniforme, la rdazione temporale 'essere simultaneo con' non è invariante o oggettiva nel senso detto, ma relativa o dipendente dal moto ddl'osservatore. Questo fatto può essere illustrato con un esempio dovuto allo stesso Einstein. Si immaginino due eventi luminosi separati da un intervallo di tipo spazio, per esempio, due fulmini lungo una banchina ferroviaria. Immaginiamo altresi due specchi posti al centro dell'intervallo che separa i due eventi, e assumiamo che un osservatore in quiete sulla banchina e situato di fronte agli specchi veda i due segnali luminosi arrivare contemporaneamente sui due specchi. Nell'ipotesi che la luce abbia la stessa vdocità nelle due opposte direzioni, l'osservatore in quiete giudicherà gli eventi distanti come simultanei. Immaginiamo ora un treno molto lungo che viaggi a una velocità V assai elevata, e prossima a quella della luce. H treno rappresenta un altro sistema inerziale K', in moto rettilineo uniforme rispetto a quello K dato dalla banchina, ed è anch' esso dotato di un apparato di specchi posto all'esterno. Supponiamo in più che nel momento in cui, per l'osservatore a terra, accadono gli eventi corrispondenti ai due fulmini, gli specchi del treno siano spaziotemporalmente quasicoincidenti (allineati) con gli specchi sulla banchina. Si noti che poiché la velocità di propagazione della luce è molto alta ma non infinita, il momento in cui avviene il fulmine precede di un tempo N la rivelazione simultanea delk sue tracce luminose sugli specchi solidali alla banchina.Per lo stesso motivo, l'osservatore in moto sul treno giudicherà l'evento luminoso verso cui sta correndo come precedente a quello che lo sta inseguendo, dato che nel tempo D' ( d t impiegato dalla luce per arrivare allo specchio dell'osservatore in moto che per primo riceve il segnale, il treno nel frattempo si sarà spostato di uno spazio Vht' Quindi ciò che è simultaneo per il primo osservatore non lo è per il secondo.

La relat ività speciale 39

2.3.2 La teoria causale del tempo e la non-esistenza dell'universo in un istante Il motivo essenziale per cui la simultaneità neHo spaziotempo 4-dimensionale di Einstein-Minkowski viene considerata come relativa ha strettamente a che fare con due principi logicamente indipendenti concernenti la velocità deHa luce, uno riguardante la sua invarianza in tutti i sistemi di riferimento, l'altro il suo carattere di segnale limite. Cominciando con il primo principio, ci ricordiamo che esso è strettamente correlato con la covarianza deHe equazioni di Maxwell. È istruttivo osservare che ndlo spazio-tempo di Newton il fatto che la luce possa avere velocità diverse in sistemi inerziali diversi è una diretta conseguenza del carattere assoluto della simultaneità. Per la legge logica di contrapposizione, imporre il principio dell'invarianza della velocità della luce ha come conseguenza il negare che la simultaneità sia assoluta. Un semplice calcolo ci convincerà di questa tesi. Nello spazio-tempo di Newton, un raggio di luce emesso in a e riflesso in b percorre due distanze diverse dt e dq nei due sistemi inerziali diversi Kt e Kz in moto relativo con velocità V d ,~ d , = d , - V t Il tempo di percorrenza dei raggi luminosi però è lo stesso, visto che la relazione "avvenire simultaneamente" per una qualsiasi coppia di eventi è assoluta e, come tale, valida per tutti gli osservatori qualunque sia il loro moto inerziale. Poiché due osservatori ndlo spazio-tempo di Newton saranno in accordo su quanto tempo è passato da a a b, essi dovranno essere in disaccordo sulla velocità della luce nei due sistemi di riferimento, Infatti, dividendo per t = tg — t„che nello spazio-tempo di Newton è uguale per ogni sistema inerziale, la formula di cui sopra diventa C) 0 cg = ci — V

con c> e cq velocità della luce in K> e Kz rispettivamente. Come si vede, nello spazio-tempo di Newton la luce non ha la stessa vdocità in ogni sistema di riferimento. Per giustificare il passaggio allo spaziotempo di Einstein-Minkowski, si

può dire che imporre il principio della invarianza della velocità della luce equivale a richiedere che c< e cz siano uguali nei due sistemi inerziali K> e Kq. Non potendoci essere accordo tra i due osservatori sulle distan-

ze percorse dalla luce, si dovrà fare in modo di modificare opportunamente i tempi di percorrenza cosi come sono calcolati dai due osservato-

Il condizionale A m B (che si legge 'se A alloraB') è logicamente equivalente a ~B —> ~A (che si legge 'se nonB allora non A') e ~B —> ~A è il contrapposto di A w B.

40 1.Dallarelatività galileiana alla relatività generale

ri inerziali. Cioè, ricordando che la velocità è data dallo spazio percorso nell'unità di tempo, per salvare il principio dell'invarianza della velocità della luce si deve fare in modo di rendere la simultaneità rdativa al si-

stema di riferimento (cfr. Friedman, 1983, pp. 126-127). Il secondoprincipio, che è quello della luce come segnale limite, interviene in alcune interpretazioni causali del tempo relativistico, e può costituire una ulteriore prospettiva da cui guardare alla relatività della simultaneità. In tali teorie causali, dovute essenzialmente a filosofi quali Hans Reichenbach e Adolf Griinbaum, le relazioni temporali sono viste

come riducibili (definibili in base) a relazioni causali ritenute più fondamentali. In questo approccio, il carattere limitativo della vdocità ddla luce, cheequivale ad afermare l'assenza di segnalifisici o di processi causali che si propaghino istantaneamente o a velocttà superluminale, è dato come un postulato fondamentale in base a cui si può ricostruire l'intera teoria. In effetti, si può dimostrare che la struttura dello spaziotempo di Minkowski è deducibile a partire dalla semplice relazione di 'essere prima di',' che i teorici causali del tempo riconducono a 'essere causa possibile di'. Si vede cosi che mentre nello spazio-tempo di Newton la possibilità di una propagazione istantanea di segnali fisici permette l'esistenza di un unico piano di simultaneità assoluto nel senso detto, il cono di luce nello

spaziotempo di Minkowski delimita la regione al di là della quale nessun segnale fisico si può propagare,

fig. 8 - L'apertura delle falde del cono áno alla linea orizzontale significa trasmissione istantanea del segnale luminoso: la simultaneità diverrebbe assoluta come nello spazio-tempo di Newton

Nell'interpretazione causale della teoria, il cono di luce passato di p rappresenta infatti l'insieme degli eventi che sono una possibile causa di p, mentre quelli del cono di luce futuro sono tutti e soli gli eventi che sono un possibile effetto di p, dato che la regione del cono delimita le traiet' Per una teoria assiomatica dello spaziotempo di Minkowski ricostruita solo a partire da 'essere prima di', si veda per esempio Robb, 1914.

La relatività speciale 41

torie di particdle che viaggiano a velocità inferiore a quelle della luce. Nella teoria causale del tempo, il motivo per cui non valgono relazioni temporali oggettive tra eventi separati da intervalli di tipo spazio è perciò dovuto al fatto che tali relazioni devono potere essere riducibili a processi fisici di natura causale, e questi ultimi non possono propagarsi in modo superluminale. L'evento a potrebbe esser simultaneo in modo assoluto con l'evento b se e solo se ci fosse un processo fisico che si propagasse daa a b o vice versa. Infatti se ci fosse un processo fisico che connettesse istantaneamente a con b, allora a sarebbe simultaneo a b e, d'altra parte, se qualunque rapporto temporale tra eventi supponesse l'esistenza di una relazione o di un processo fisico che li legasse, varrebbe anche l'implicazione inversa. Assumendo che 1. tale processo non può esistere per il principio della velocità limite

della luce, 2. la teoria causale o riduzionista del tempo è vera, ne segue che l'attribuzione di una relazione temporale a due eventi separati da un intervallo di tipo spazio non corrisponde a nulla di fattuale o di fisico, e può essere solo conseguenza di una convenzione, ovvero di una scelta arbitraria di un sistema di riferimento rispetto al quale si attribuiscono coordinate agli eventi fisici. In altre parole, secondo tale posizione riduzionista e relazionista del tempo, quest'ultimo non sussiste in modo assoluto (cioè indipendentemente dagli oggetti e dagli eventi fisici), come Newton aveva scritto nello Scolio ai suoi Principia Matematica, ma dipende dall'esistenza di rdazioni fisiche tra eventi. Nell'ambito delle formulazioni assiomatiche delle teorie causali del tempo, si deve però precisare che la relazione di causalità considerata non è quella temporalmente asimmetrica sancita dal principio secondo cui una causa precede sempre il suo effetto. In effetti, dato che le leggi fondamentali di natura sono covarianti per inversioni temporali" — ovvero permettono la descrizione dello svolgersi di un processo sia in una direzione temporale che nella sua opposta —, nelle formulazioni assiomatiche si preferisce in generale adottare una rdazione causale temporalmente simmetrica, detta di connettibilità causak. Si dice cioè che un fotone, o una particella più lenta, può andare dal punto a al punto b dello spaziotempo e viceversase e solo se a e b sono congiungibili con un segnale fisico. " Fa eccezione la violazione del prodotto di parità e coniugazione di carica(CP) nei fenomeni di decadimento dei cosiddetti kaoni, che implica una violazione della simmetria temporale. Per il cosiddetto teoremaCPT infatti, la probabilità di un qualunque processo fisico il cui orientamento spaziale sia cambiato o "rappresentato allo specchio" (trasformazione di paritàP), in cui le cariche delle particelle siano cambiate da positive a negative o viceversa (coniugazione di carica C), e in cui l'ordine temporale sia invertito (trasformazione temporale T), deve essere identica a queÙa di un processo non trasformato.

42 1.Dallarelatività galileiana alla relatività generale

La relazione di connettibilità causale va quindi tenuta distinta dalla relazione di causalità di cui sopra, la cui asimmetria è spesso ritenuta fondamentale per tutti gli altri fenomeni di irreversibilità temporale, e dunque anche in grado di conferire al tempo una direzione o una "freccia". In realtà, il principio di causalità inteso nel senso asimmetrico afferma che ogni evento p può essere influenzato causalmente solo da eventi nel passato causale di p. Interpretato da un punto di vista di teoria della conoscenza, tale principio ci dice che l'unica informazione disponibile dal punto di vista di un evento p viene dal passato assoluto o causale di p e non dal suo presente, o da eventi a esso simultanei. Considerando ancora la figura 8, notiamo come il presente rdativistico di un evento (il punto in cui le due falde del cono si intersecano) non si estende al di là di se stesso. Questa mancanza di identità degli istanti temporali a distanza è estremamente importante, ed è in genere sottovalutata nelle presentazioni filosofiche della teoria della relatività speciale. Considerando gli eventi spazialmente vicini a noi come presenti o direttamente simultanei con la nostra percezione di essi, per 'mancanza di identità di istanti a distanza' si intende l'impossibilità di attribuire la proprietà di 'essere presenti' a eventi distanti dal nostro campo percettivo in modo invariante per diversi osservatori inerziali. Adottando il motto dei filosofo americano Willard van Orman Quine "no entity without iderttity" (non ammettere enti senza identità), la mancanza di identità di istanti a distanza dovuta alla relatività della simultaneità implica che il presente a distanza è un "non-ente", cioè non esiste. Questo risultato relativistico ha delle implicazioni molto profonde anche per il modo in cui percepiamo la realtà che ci circonda. Data la finitezza della velocità della luce, quando osserviamo eventi che non coincidono con il "qui" del campo visivo, a rigore noi osserviamo eventi passati, fatto che risulta ancora più evidente nel caso di eventi astronomici: la luce che percepiamo nel telescopio puntato sulla galassia Andromeda è stata emessa due milioni di anni fa. In realtà dunque, noi percepiamo solo il presente che è "qui", cioè i vari successori causali di eventi che sono accaduti in tempi diversi e a distanze diverse, e che hanno in comune solo il fatto di inviare messaggi postumi che colpiscono simultaneamente la nostra retina. Cosi come non esiste un "qui" senza un "ora", non esiste un "là" senza un "allora" Dato che il senso comune tende però a considerare l'esistenza simulta;. nea di eventi a distanza (il presente cosmico) come del tutto incontro-

vertibile, è importante cercare di fornire una spiegazione del sorgere di questa intuizione. In tal modo, possiamo assicurare una coesistenza pacifica tra la versione fisica della simultaneità e qudla psicologico-intuitiva

La relatività speciale 43

del senso comune, un po' come i

copernicna i

avevano il compito di spiegare, dopo avere introdotto la loro rivoluzionaria concezione, perché la Terra si muova senza che noi ce ne accorgiamo. La spiegazione che andiamo cercando fa riferimento sia al fatto che la

velocità della luce (300.000 km/sec) è molto più grande della velocità dei segnali fisici non elettromagnetici, sia ai limiti naturali dati dalla capacità di discriminazione del sistema nervoso tra due eventi temporalmente molto vicini. A causa di questi due fattori, l'essere umano si è evoluto considerando la realtà spaziale attorno a sé come qualcosa che esiste simultaneamente alla sua esperienza cosciente. Considerando il l imite approssimativo di 1/100 di secondo come indicante la soglia al di sotto ddla quale il sistema visivo umano non può discriminare visivamente due eventi come temporalmente successivi, si calcola facilmente che la luce nel tempo corrispondente percorre circa 3.000 km. Come conseguenza del principio limite della velocità della luce, un essere umano non può

che considerare ogni evento all'interno di una sfera di tal raggio come praticamente simultaneo, dato che la luce emessa da uno qualsiasi di tali eventi raggiunge la retina in un intervallo che è al di sotto della soglia di distinguibilità. Supponendo che non esista una "coscienza istantanea", ma che ogni esperienza cosciente abbia invece una durata non infinitesima o un certo spessore temporale,' il pregiudizio evolutivo per cui tendiamo a identificare ciò che è "reale ora" con ciò che è "visto ora" troverebbe una sua spiegazione naturale. In effetti, il presunto conflitto tra la credenza spontanea nell'esistenza di un presente cosmico e la sua non-esistenza fisica verrebbe eliminato se si tenesse presente che nel tempo corrispondente alla durata media di una esperienza percettiva cosciente, i segnali luminosi attraversano una distanza che è praticamente immensa rispetto all'estensione del nostro corpo e degli oggetti con cui abbiamo in genere a che fare. È interessante speculare con Howard Stein sul motivo per cui noi siamo temporalmente cosi "estesi" dal punto di vista dd presente psicologico mentre i nostri corpi sono spazialmente cosi "piccoli", ossia perché il rapporto tra la durata del presente psicologico moltiplicato per la velocità deùa luce e l'estensione spaziale dd corpo è cosi grande (cfr. Stein, 1991). In sintesi, la teoria proposta da Stein è che la natura granulare o discreta dd presente psicologico permette alle varie interazioni fisiche (dettromagnetiche) che si propagano alla velocità della luce di viaggiare avanti e indietro molte volte tra i corpi dell'ambiente circostante. Questo fatto assicura regolarità, Tra gli altri, tale supposizione è stata difesa da WiHiamJames ed Edmund Husserl. In letteratura, essa è nota con il nome curioso di "presente specioso" (specious present).

44 1. Dalla relatività galiletana alla relatività generale

ordine e stab1Tttà sia alle particelle che costituiscono le cose percepite, sia ai meccanismi fisiologici che rendono possibili le nostre percezioni. Riassumendo, se la teoria della relatività speciale è vera, l'universo non esiste in un istante in modo oggettivo come avveniva nella teoria newtoniana. In quest'ultima teoria, ogni determinazione di una distanza spazia-

le andava riferita a delle superfici spaziali 3-dimensionali (lo spazio propriamente detto) che esistono istantaneamente a causa della propagazione dei segnali a velocità infinita. In relatività speciale, la mera possibilità di assegnare una coordinata temporale a distanza effettuata da un osservatore inerziale —in base a delle procedure di misura su cui ci soffermeremo nel paragrafo seguente — non può essere considerata sufficiente per attribuire realtà al concetto di presente cosmico. In definitiva, questa affermazione non solo non risulta in contrasto con il senso comune, ma è addirittura in accordo con esso, considerando per esempio che l'etimologia stessa della parola "presente" nelle varie lingue europee rimanda a praesens, participio di praesse,ovvero "essere davanti", "essere a portata di mano", o semplicemente, "esserci" o "essere qui", come è dimostrato dal rispondere "presente" a un appdlo, che implica un semplice "essere sul posto".'~ La non-esistenza di un presente cosmico ha tre importanti conseguenze alle quali è indispensabile accennare, seppure in modo necessariamente breve. La prima è di carattere metodologico. La coincidenza tra il presente di un evento e l'evento stesso è rispecchiata dall'assunzione tipica delle teorie rdativistiche, che impone una formulazione delle leggi di natura che sia strettarrtente locale, sia nel senso che le equazioni differenziali che descrivono il sistema fisico in oggetto valgono in regioni infinitesime dello spaziotempo — in cui difficoltà con il presente a distanza non si pongono — sia nel senso che il comportamento del sistema in quel punto dipende solo dai sistemi spazialmente vicini o contigui. La prima osservazione sulla località può essere spiegata riandando alla formulazione delle leggi fisiche naturali in termini di equazioni differenziali a derivate ordinarie o parziali. Queste equazioni collegano la variazione infinitesima di certe quantità in certe direzioni dello spazio con altre variazioni a loro volta infinitesime. La seconda e la quarta equazione di Maxwell, per esempio, collegano la variazione temporale infinitesima del campo magnetico ed elettrico rispettivamente con la somma di differenze di variazioni infinitesime del campo elettrico e di quello magnetico nelle tre direzioni dello spazio. La seconda osservazione sulla località ha a che fare con un'assunzione di tipo fisico-metafisico sull'assenza dell'a'zione a distanza, una nozione controversa che aveva agitato le acque della fisica già in epoca post-newtoniana, allorquando i seguaci di Cartesio Su questo aspetto etimologico dell'"essere presente", cft.

tek, 1961, e Stein, 1991.

La relatività speciale 45

obiettavano ai loro oppositori newtoniani che l'azione a distanza implicita nella interazione gravitazionale descritta daUa legge dell'inverso del quadrato delle distanze ripristinava nel mondo effetti magici e inspiegabili, che solo l'azione causale a contatto tra corpi poteva dissipare. Recentemente, tale disputa sulla assenza di azione a distanza in fisica è ritornata in auge con la meccanica quantistica e gli esperimenti di tipo Beli sulla non-località, che secondo alcuni necessitano di una qualche spiegazione di tipo causale diretto che viola il postulato della assenza di processi fisi-

ci superluminali (cfr. Maudlin, 1994). La seconda e la terza conseguenza sono di natura più 61osofica, nella misura in cui riguardano il tentativo di mostrare il grado di accordo esistente tra la concezione fisica del tempo utilizzata nel modello matematico dello spaziotempo di Minkowski e quella presupposta daUa nostra esperienza fenomenologica. In particolare, la seconda conseguenza ha a

che fare con alcuni fraintendimenti del signi6cato dell'inseparabilità dello spazio dal tempo formulata da Minkowski nel 1908, che ha portato numerosi filoso6 della scienza ad affermare che il divenire temporale è incompatibile con la rdatività speciale, dato che in questa teoria il tempo sarebbe considerato alla stregua ddlo spazio, o come un quarta dimensione dello spaziotempo. In realtà, l'inseparabilità del tempo dallo spazio non significa che ndla teoria i due concetti siano identici o indistinguibili. Per esempio, il concetto di tempo proprio misurato da un orologio in quiete in un sistema inerziale ha nella teoria un'importanza che non è bilanciata da quello di lunghezza propria. Mentre ù primo ha per esempio un importante ruolo nella definizione del tempo cosmico in alcuni modelli della relatività generale, il secondo non ha alcun ruolo comparabile, neppure nella teoria speciale. Pur se il problema dd divenire verrà affrontato nd capitolo di Massimo Pauri in modo assai più esaustivo, occorre qui dire che l'eliminazione della simultaneità assoluta ha significato l'eliminazione dell'idea secondo cui il mondo divenga nel tempo, ma non dell'idea che una qualche forma di divenire locale, che non coinvolga però la nozione di presente come momento ontologicamente privilegiato tra tutti gli altri, non possa darsi anche in relatività speciale. Tale divenire relativistico, se di divenire reale si può parlare, è al più strettamente locale, nel senso di essere relativo a singoli eventi o a linee di universo e di non essere globalmente estendibile

(dr. Stein, 1991; Clifton e Hogarth, 1995). L'estendibilità globale, che è necessaria aU'idea che il mondo divenga nel tempo, è infatti pagata al prezzo della non-oggettività del presente nel senso detto: una partizione globale ddlo spaziotempo in ipersuperfici di simultaneità non è invariante per diversi osservatori inerziali. NeUa misura in cui il concetto di divenire presuppone un tempo globale, il divenire relativistico non può essere

46 1. Dalla relatività galileiana alla relatività generale

oggettivo, ed è dunque persino improprio parlare, come si fa talvolta, di una prospettiva cronologica fornita da singoli eventi grazie alla relazione transitiva e asimmetrica 'prima di', Come conseguenza del fatto che il mondo non diviene nd tempo, una descrizione temporalmente neutrale assoluta ddlo spaziotempo, di cui una prospettiva cronologica sia appunto una prospettiva, semplicemente non esiste (cfr. Dorato, 1997). Infine, la terza conseguenza della non esistenza di un presente cosmico ha a che fare con tradizionali concezioni metafisiche del rapporto tra tempo e realtà, ed è interessante perché illustra (meta-filosoficamente) un

modo peculiare in cui si può fare della filosofia della 6sica, che è quello di cercare di esplorare le conseguenze di teorie scienti6che fondamentali nei confronti di tradizionali concezioni filosofiche (cfr. Dorato, 1994,

1995, 1996). L'ipotesi di fondo di un tale approccio alla filosofia della fisica è che nessuna concezione metafisica può essere in conflitto con una teoria scienti6ca largamente accettata e corroborata. Ad esempio, la venerabile teoria secondo cui solo ciò che esiste nel presenteè reale, sostenuta già da Aurelio Agostino nel quinto secolo dopo Cristo, e fondata sull'uso diffuso dei tempi verbali ndle lingue indoeuropee, si riduce nello spaziotempo di Minkowski alla tesi secondo cui solo ciò che esiste "qui e ora" è reale, Dato che in tale spaziotempo tutti gli eventi possono essere "qui-ora" (nessun evento è privilegiato), la versione relativistica del principio metafisico secondo cui solo il presente è reale 6nisce in una peculiare forma che Stein ha chiamato di pluralismo solipststtco (cf. Stein, 1968). Tale de6nizione è suggestiva, a patto di ricordare che il solipsismo non può essere pluralistico per definizsone. Secondo questa concezione "hic et nunc" della realtà, gli stessi motivi che ci conducono a negare realtà a eventi distanti spazialmente — nessuna informazione su di essi è possibile "qui e ora" — sono sufficienti a negarla al futuro e al passato: solo il "qui-ora" esiste, perché esso racchiude ogni evidenza sul passato e futu-

ro. Un problema della teoria "hic et nunc" è, però, che è difficile spiegare la differenza con la teoria apparentemente opposta secondo cui tutti i punti dello spaziotempo sono reali e determinati, dato che in relatività tutti i punti, dalla loro prospettiva, hanno ugual diritto a essere "qui-ora" Questo è il tipico dilemma delle teorie filosofiche dd tempo che introducono una posizione temporale privilegiata. Analogamente, la teoria altrettanto diffusa per cui solo il passato e il presente sono reali mentre il futuro non lo è, una condizione che spesso è ritenuta necessaria per l'oggettività dd divenire, trova la sua formulazione relativistica corretta nel principio secondo cui la regione di determinatezza di ogni evento dello spaziotempo di Minkowski non coincide con quello che si è definito come 'il suo passato relativo' (cioè la zona di spazio-

La relatività speciale 47

tempo al di sotto di un piano di simultaneità), ma con il suo passato assoluto (cioè il suo passato causale). In altre parole, per ogni evento p, la regione di determinatezza deve coincidere con il cono di luce passato centrato in p, e la regione di eventi separati da un intervallo di tipo spazio rispetto a p ha lo stesso status di indeterminatezza ontologica dd cono di luce futuro. Questa concezione, secondo cui il futuro è "aperto", è stata spesso difesa, talvolta in modo concettualmente confuso, allo scopo di lasciare spazio alla nostra capacità di intervenire nel corso futuro degli eventi. Essa è particolarmente in sintonia con il principio asimmetrico della causalità che abbiamo visto sopra, secondo cui per ogni evento p, informazioni o segnali possono solo arrivare dal passato causale di p. L'unica teoria metafisica per la quale nessuna modifica è necessaria rispetto all'originaria formulazione pre-relativistica è quella secondo cui ogni evento è determinato rispetto a ogni altro evento, e non esiste alcuna differenza ontologica tra passato, presente e futuro. Questa concezione, che vede il futuro come reale o "pieno", fu sostenuta dallo stesso Einstein, ed è in genere considerata quella "più naturale" all'interno della struttura dello spaziotempo di Minkowski. È interessante notare che un recente teorema di Clifton e Hogarth prova che se vogliamo attribuire realtà determinata a eventi separati da un intervallo di tipo spazio (pure senza assegnare loro un ordine temporale), allora dobbiamo estendere la realtà anche al futuro assoluto, che riesce altrettanto determinato e reale del passato assoluto (cfr. Clifton e Hogarth, 1995). Possiamo perciò concludere che lo spaziotempo di Minkowski non permette di risolvere la controversia filosofica tra queste tre tradizionali concezioni dei rapporti tra realtà e tempo, anche se costringe le prime due a una drastica revisione sullo status ontologico del presente a distanza. Lunica posizione che viene mostrata come incompatibile con tale spaziotempo è quella che fa distinzione tra un regione di tipo spazio reale e un futuro assoluto irreale: ciò che in fondo mostra che nella concezione relativistica ciò che è spazialmente distante e ciò che è temporalmente remoto hanno lo stesso status ontologico. 2.3.3 La convenzionalità della simultaneità Malgrado la critica alla concezione dd "presente cosmico" sia una diretta conseguenza della relatività della simultaneità, la sua portata concettuale e scientifica è stata spesso sottovalutata. Onde evitare l'impressione che essa sia solo frutto di una particolare interpretazione ddla teoria, conviene approfondire il problema dei fondamenti filosofici della nozione di simultaneità relativistica. In effetti, la critica di Einstein alla simultaneità

48 1. Dalla relatività galileiana alla relatività generale

assoluta era partita proprio dall'impossibilità in linea di principio di veri6care la contemporaneità di eventi a distanza, e quindi da un posizione filosofica sostanzialmente veri jicazionista. Il verificazionismo sostiene che una proposizione qualsiasi è dotata di senso se e solo se è possibile indicare in linea di principio un metodo per verificarla. Esso adotta quindi un criterio di verità che è essenzialmente epistemico: la verità di una proposizione non trascende i mezzi cognitivi di cui disponiamo per asserirla. Per esempio, secondo un verificazionista non possiamo attribuire un valore di verità né a una proposizione matematica di cui non abbiamo una dimostrazione, né a una proposizione empirica per cui non c'è suffilciente evidenza. La posizione opposta, quella cioè per cui una proposizione è vera o falsa indipendentemente dalle nostre capacità di stabilire quale dei due valori di verità le appartenga, è in genere denominata realismo. Una strategia verificazionista è all'origme sia della critica allo spazio assoluto newtoniano inteso come portatore di proprietà meccaniche, che all'origine della critica al "presente assoluto cosmico". Postulare uno spazio assoluto e un presente cosmico assoluto non contraddice direttamente la teoria della relatività speciale. Non avendo alcuna conseguenza empirica osservabile, le due entità postulate non hanno però alcun signi6cato 6sico e sono dunque del tutto superflue. La critica concettuale di Einstein, che all'epoca della formulazione della relatività ristretta era sotto l'influenza ddle 6loso6e di David Hume e Ernst Mach, presupponeva dunque un punto di vista veriflcazionista: la verifica diretta della simultaneità tra due eventi può darsi solo quando gli eventi sono spazialmente quasi coincidenti. Di conseguenza, da parte di coloro che, come i neopositivisti, dividono la conoscenza scienti6ca in una componente empirica o dipendente dal mondo e in una definitoria o dipendente dal nostro modo di guardare a esso,' si è spesso affermato che la determinazione temporale di eventi a distanza è frutto di una convenzione, ovvero di una de6nizione svuotata di ogni contenuto fattuale. La natura convenzionale della coordinatizzazione temporale di eventi a distanza sembrerebbe portare un ulteriore argomento a favore della concezione secondo cui la simultaneità di eventi a distanza non ha alcun carattere oggettivo. Il termine 'ulteriore' va sottolineato; la controversa tesi filosofica ddla convenzionalità della simultaneità, sostenuta da Reichenbach, Griinbaum e vari altri autori, va in ogni caso tenuta distinta da quella, universalmente condivisa, della relatività della simultaneità. Mentre la tesi della convent4 Tale distinzione riecheggia qudla invocata da Kant tra elementi a priori ed elementi a posteriori della conoscenza umana. LinQusso di Kant sul primo neopositivismo è stato documentato da vari storici, tra cui Julius Weinberg e Michael Friedman.

La relatività speciale 49

zionalità della simultaneità riguarda, come ora vedremo, la scelta di una particolare relazione di simultaneità all'interno di un unico sistema di riferimento inerziale assunto come già dato, il problema della relatività della simultaneità riguarda invece la tesi sopra riferita secondo cui l'asserzione 'l'evento a è simultaneo con b' è a rigore priva di senso se gli eventi non sono quasi coincidenti spazialmente e perciò passibili di una unica percezione diretta che li comprenda entrambi. Se gli eventi sono separati da un intervallo di tipo spazio,ndlo spaziotempo di Minkowski l'asserzione di cui sopra acquista un valore di verità definito solo se essa è riferita a un particolare sistema inerziale, motivo per cui la tesi della relatività della simultaneità assume significato solo tra diversi sistemi inerziali. Naturalmente, data l'equivalenza di tutti i sistemi di riferimento, si può anche definire in modo non controverso come convenzionale (o sottodeterminata dai fatti) la scelta di un particolare sistema di riferimento con il quale descrivere i processi fisici. Ciò che bisogna comunque tenere concettualmente distinto è il problema di scegliere un particolare sistema inerziale rispetto al quale relativizzare la simultaneità dal supposto problema dk' scegliere una particolare relazione di simultaneità allinterno di un singolo sistema inerziale già dato.In che senso in rdatività siamo di fronte a tale secondo problema?

Considerando che in fisica ogni asserzione concernente la durata temporale di un fenomeno è in realtà corrispondente a una lettura di orologi, il problema da cui parù Einstein nel 1905 era quello di trovare un metodo per sincronizzare due orologi ideali supposti identici e posti in due punti spazialmente distanti di uno stessosistema inerziale. Il problema è simile a quello che possiamo incontrare quando vogliamo festeggiare il Capodanno insieme con amici lontani, e per sincronizzare il momento in cui stappare lo spumante facciamo una chiamata telefonica o utilizziamo il segnale orario televisivo. Il metodo originalmente suggerito da Einstein consisteva ndl'inviare un segnale luminoso da una linea di universo inertempo

ta

tb

te

O

O'

fig, 9 - t, = t, + e (t, — t,) con 0 < c < 1

50 1. Dalla relatività galileiana alla relatività generale

ziale O, rappresentante il primo orologio, a un'altra linea di universo inerziale O' corrispondente al secondo orologio, e poi far riflettere il segnale da quest'ultimo indietro verso il primo (cfr. Bg. 9). Data la finitezza della velocità della luce, un osservatore solidale all'orologio sulla linea di universo O potrà solo calcolare il tempo totale di andata e ritorno impiegato dalla luce dall'istante di emissione t, a queHo di assorbimento t„. Naturalmente, tale tempo su O sarà uguale alla differenza t„— t,. Il problema della sincronizzazione a distanza è dato dal fatto che, non essendoci trasmissione istantanea di segnali, l'osservatore O in linea di principio non può sapere quale istante t, successivo a t, corrisponde sulla sua linea di universo alla riflessione b avvenuta lungo O'. In linea di principio, tutti gli eventi lungo O che sono compresi nell'intervallo aperto tra t, e t„'~ e che sono separati da un intervallo di tipo spazio rispetto a b, potrebbero essere simultanei con b, dato che nessun segnale causale può viaggiare più rapidamente della luce. Poiché l'osservatore lungo O può solo calcolare i tempi di andata e ritorno della velocità della luce, nulla vieta che essa abbia una velocità diversa nei due tratti, in quanto, secondo vari studiosi, nessun esperimento potrebbe smentire tale ipotesi di anisotropia nella propagazione. Per esempio, la luce potrebbe avere una velocità quasi istantanea nd tratto da O a O', e rallentare rispetto alla velocità media nd percorso inverso da O' a O, in modo tale da dare, alla fine, un tempo totale di andata e ritorno uguale a t,— t,. In tal caso, l'evento t, simultaneo con la riflessione b sarebbe "subito dopo" l'emissione t„mentre neH'ipotesi inversa, esso risulterebbe assai vicino temporalmente all'istante di assorbimento t,. Naturalmente, l'evento b si sposterebbe lungo O' in modo corrispondente. Risulta quindi opportuno esprimere questa possibile anisotropia scegliendo una variabile t, che possa assumere come valore ogni numero reale tra zero e uno, esdusi gli estremi. Allora la risposta più generale al problema di determinare l'istante t, su O che è simultaneo alla riflessioneb su O' è di assumere chet, = t, + E(t,— t,). (Si noti che se e fosse uguale a 0, avremmo che t, = t„m e n t re per e = 1 avremmo te = t„e questi due casi sono da escludere perché sarebbero compatibili solo con l'ipotesi di una trasmissione istantanea della luce nell'una o ndl'altra direzione. È per questo che si sceglie l'intervallo aperto 0 < e < 1). L'argomento principale in favore della convenzionalità della simultaneità consiste essenzialmente nell'affermare che la scelta di una particolare relazione di simultaneità (ovvero di uno tra l'inftnità più che numerabile di

Nel caso dei numeri reali, un intervaHo si dice 'aperto' quando non comprende gli estremi.

La relatività speciale 51

valori che e può assumere) non è vincolata da alcun dato empirico. Tale difficoltà fu risolta da Einstein con una stipulazione che corrisponde a porre c = l/2 (ossia, tale che t, = t~), la cosiddetta relazione standard di simultaneità, il che a sua volta corrisponde all'ipotesi 6sica, cheseconào i convenzionalisti è in linea di principio non-vertftcabile, che nel viaggio di andata e in quello di ritorno la luce impieghi lo stesso tempo a percorrere la distanza data (isotropia della velocità del luce, ovvero sua uguaglianza in tutte le direzioni). Malgrado la questione sia ancora aperta, ci sembra che a tutt' oggi non esistano argomenti decisivi che ci permettano di attaccare la tesi della convenzionalità della simultaneità sulla base della possibilità di misurare la velocità della luce "solo andata" (one-way veloctty

of light) (sull'isotropia ddla velocità della luce, cfr. Clifton, 1989). A questo proposito, ricordiamo che un teorico causale del tempo quale Reichenbach ha giustificato la convenzionalità della sceltastandard non solo per la sua maggiore semplicità, ma anche con un argomento di tipo "circolo vizioso" Per stabilire che tt, è davvero fattuaimente e oggettivamente simultaneo con b, dovremmo poter veri6care l'isotropia della velocità ddla luce, dovremmo cioè poter misurare la velocità della luce in una sola direzione (solo andata), supponendo nota la distanza tra O e O'. Dato che però il calcolo di una vdocità presuppone la determinazione del tempo e dunque l'avere sincronizzato gli orologi a distanza, ci ritroviamo ndla situazione di partenza, dato che per sincronizzare dovremmo sapere quali eventi sono simultanei. In una parola, per determinare la simultaneità dobbiamo presupporre-l'isotropia ddla vdocità della luce, ma per determinare quest'ultima dobbiamo assumere la simultaneità, e il circolo vizioso si chiude. Sottolineiamo il carattere epistemico di questo argomento, ossia il suo fondarsi su una tesi di significanza ddle proposizioni di tipo neopositivista. Basandosi sul principio di verificabilità, tale argomento si applica anche a tentativi di definire la simultaneità con il metodo alternativo del cosiddettot ra@orto len to di orologi, inizialmente coincidenti e dunque sincronizzabili. Per spiegare tale metodo, ricordiamo che il tempo proprio misurato da un orologio lungo una linea di universo inerziale, pure essendo intrinseco ' allo spaziotempo, dipende strettamente dal percorso e dunque dalla velocità. Abbiamo infatti già visto, e ne discuteremo ancora nel prossimo paragrafo, che come effetto delle trasformazioni di Lorentz, il tempo dei sistemi in moto risulta "dilatato" se misurato dall'osservatore in quiete e quindi scorre più lentamente. Per ovviare a questa limitazione, si è tentato di argomentare che un trasporto con velocità molto piccole (al limite in6nitesime) di un orologio dal punto di emissione al punto di ri"Intrinseco" significa ciui "indipendente da sistemi di coordinate"

52 1.D allarelatività galileiana alla relatività generale

flessioneb su O' ridurrebbe a zero l'effetto di rallentamento dell'orologio in viaggio verso O' rispetto a quello in quiete che scandisce il tempo lungo O. Reichenbach argomenta però che se anche fosse possibile la sincronizzazione attraverso tale metodo, essa fornirebbe solo una definizione alternativa di simultaneità: persino supponendo che nd momento in cui il secondo orologio viene riportato su O si potesse verificare che esso è in accordo col primo, non potremmo mai essere sicuri che durante il trasporto il comportamento del secondo orologio non sia mutato. Più che su un argomento epistemico, per difendere la tesi della convenzionalità della simultaneità Griinbaum insiste invece su una teoria relazionista del tempo, ripresa anch' essa da Reichenbach. Come abbiamo già anticipato, secondo questa tesi 'il tempo non è assoluto' in un senso diverso da quello visto prima. Prima, assoluto si contrapponeva a 'dipendente da un sistema di riferimento'. Qui 'tempo non assoluto' significa che (a differenza di come pensava Newton) esso non sussisteindipendentemente dagli oggetti ed eventi fisici. Per Newton, se tutti gli oggetti dell'universo fisico si annichilissero, il tempo continuerebbe a esistere e a scorrere. Per un relazionista invece, una relazione temporale non può esistere tra istanti di tempo ma solo tra eventi fisici, e va considerata come non convenzionale se e solo se essa è definibile in base a relazioni fisiche tra gli eventi. Poiché ogni evento tra t, e t„è, come dice Griinbaum, "topologicamente simultaneo" con b, ossia causalmente non-connettibile con esso, e la rdazione di simultaneità standard c=1/2 non è definibile in base ad alcuna relazione fisica, compresa la non-connettibilità causale, Griinbaum conclude a favore della convenzionalità della simultaneità. Sebbene molta letteratura sul convenzionalismo ddla simultaneità abbia tentato di criticare questo argomento ricorrendo al linguaggio estrinseco dei sistemi di riferimento e dei raggi di luce, l'attacco più veemente a questa tesi è venuto nel 1977 da David Malament, in base a un argomento che fa riferimento solo a elementi intrinseci della struttura dello spaziotempo di Minkowski, cioè indipendenti da sistemi di riferimento. Malament parte dall'assunto fondamentale della teoria causale del tempo, secondo cui una rdazione temporale è oggettiva (non convenzionale) se e solo se è definibile in base a relazioni causali, e poi dimostra che la relazione standard di simultaneità è l'unica relazione di equivalenza non banale che è definibile in base alla relazione di connettibilità causale e a una linea di universo inerziale O (cfr. Malament, 1977).' Come si può ' Ricordiamo che una relazione si dice di equivalenza se è riQessiva, simmetrica e transitiva. Una relazione è non banale se vale almeno per due punti distinti senza essere la relazione universale, cioè la relazione che vale per ogni coppia di punti dello spaziotempo.

La relat ività speciale 53

vedere dalla figura 9, in cui per e=1/2 la linea che congiungeb a tà è ortogonale a O, la relazionestandard è essenzialmente data daH'ortogonalità ris etto a O, dato che per c c 1/2, l'ortogonalità non è preservata. interessante solo accennare a come Malament arrivi alla sua dimostrazione, dato che la tecnica da lui impiegata mostra che le proprietà oggettive dello spaziotempo di Minkowski — in questo caso la relazione di simultaneità standard, che in base al teorema risulta ovviamente relativa a O ma non convenzionale data la sua unicità — sono proprio qudle che rimangono invarianti per trasformazioni ddlo spaziotempo in se stesso che preservino la struttura causale. Da un punto di vista geometrico, tali trasformazioni, dette anche automorfismi causali, sono rotazioni spaziali attorno alla linea inerziale O (isotropia dello spazio), traslazioni lungo O (omogeneità del tempo), riflessioni rispetto a superfici di simultaneità (simmetria temporale), cambiamenti di scala (dilatazioni) e trasformazioni di Lorentz. Più semplicemente, gli automorfismi causali sono funzioni da R4 a R che lasciano invariata la struttura del cono di luce, ovvero che trasformano un vettore di tipo luce in uno di tipo luce, uno di tipo tempo in uno di tipo tempo, e uno di tipo spazio in uno di tipo spazio. Il nocciolo della prova di Malament è che tali automorfismi causali sono anche simmetrie della relazione di simultaneità che essi definiscono, tanto da individuarla in modo unico come la relazione che prescrive come simultanei tutti gli eventi appartenenti al piano ortogonale che passa per O, escludendo invece ogni relazione data da e c 1/2. Questo risultato mostra che, da un punto di vista intrinseco, la relazione di simultaneità standard è davvero parte integrante ddla struttura ddlo spaziotempo di Minkowski, assai più di quanto le considerazioni estrinseche facenti riferimento alla velocità della luce potevano far supporre.' È stato però obiettato che tale risultato di Malament non è solo "sensibile" alle condizioni definitorie, ma presuppone anche un impegno filosofico realista nei confronti dell'esistenza dello spaziotempo e delle sue proprietà metriche.' Per quanto riguarda la prima difficoltà, aggiungendo una linea di universo inerziale O' a quella data O, oppure un'orientazione temporale alla struttura dello spaziotempo, il risultato di definibilità unica di e =1/2 viene compromesso (si veda Norton, 1992). Per ' Infatti, fare a meno della relazione di simultaneitàstandard significa fare a meno di tutta la struttura che preserva gli angoli di due qualsiasi vettori, detta anche struttura conforme dello spaziotem-

po. ' In conversazione privata con uno degli autori (M.D.), A. Griinbaum ha anche obiettato che una debolezza del teorema di Malament consistenell'assumere, piuttosto che nel dimostrare, che la relazione di simultaneità sia una relazione di equivalenza. Di contro a tale assunzione, si noti che la relazione di non-connettibilità causale, i cui candidati sono eventi separati da intervalli di tipo spazio proprio come i candidati della relazione di simultaneità, è non-transitiva e dunque non è di equivalenza.

54 1. Dalla relatività galileiana alla relatività generale

quanto riguarda la seconda obiezione, più filosofica, il risultato di Malament potrebbe lasciare sostanzialmente tiepidi dei filosofi relazionisti come Reichenbach, dato che costoro ritengono che lo spaziotempo sia solo un utile modello matematico e non una entità sostanziale parte dell'universo fisico. I punti ddlo spaziotempo per un relazionista non esistono, dato che, come abbiamo visto, le relazioni spaziotemporali sono da lui costruite a partire da eventi o oggetti fisici attualmente esistenti, e non sussistono indipendentemente da essi. Seguendo Quine, si può di nuovo invocare il principio per cui non c'è esistenza di enti senza loro identità, e ne seguirebbe allora che i punti spaziotemporali non esistono, perché nessuna delle loro postulate proprietà geometriche è essenziale, o ne permette l'identificazione. Senza addentrarci ndla discussione di questa obiezione "anti-sostanzialista" dello spaziotempo, l'abbiamo però accennata per mostrare (1) che il problema della convenzionalità della simultaneità è un'area di ricerca fiisico-filosofica ancora oggi attiva; (2) che un risultato fisico tecnico-formale ha precisi presupposti filosofici; (3) che un nuovo risultato tecnico difficilmente risolve una volta per tutte una problematica filosofica, ma certamente la rende più complessa e sofisticata. L'interpretazione del risultato tecnico di Malament, e dunque anche la disputa sulla convenzionalità della simultaneità, dipende in parte da complicati argomenti sulla natura sostanziale dello spaziotempo, su cui ritorneremo nel paragrafo 3.11 su "Fisica e Geometria"

2.4 La realtà della contrazione delle lunghezze e della dilatazione dei tempi Nei novant' anni che ci separano dalla prima formulazione della teoria della relatività speciale, l'interpretazione delle contrazioni ddle lunghezze nella direzione del moto e ddle dilatazioni dei tempi dei sistemi in movimento — che, come visto, sono conseguenza diretta delle trasformazioni di Lorentz — ha spesso creato perplessità e controversie filosofiche accese. In particolare, l'aspetto del problema che crea una sensazione di paradosso sembra essere dato dal carattere perfettamente simmetrico di tali effetti per ogni coppia di sistemi di riferimento inerziale. Come vedremo, è invece essenzialmente proprio il carattere reciproco sia delle con' Proprio recentemente, Mark Zangari ha sostenuto che introducendo una rappresentazione alternativa dei punti dello spaziotempo di Minkowski che utilizza "spinori" e che serve a descrivere particelle a spin semi-intero, l'unica scdta ragionevole è quella standard di e = l/2. In tal modo, si aggirerebbe il problema della natura sostanziale dello spaziotempo, e si rigetterebbe la tesi convenzionalista della simultaneità (cit Zangari, 1994). Tale argomento è stato però criticato da Gunn evetharaniam, 1995.

La rela tivi' speciale 55

trazioni spaziali che delle dilatazioni temporali che può fornire una chiave per risolvere, o dissolvere, numerose difficoltà concettuah. Considerando il primo insieme di questioni, che riguardano lo spazio, possiamo immaginare un'auto che entri ad alta velocità in un garage aperto da entrambi i lati (si noti che l'auto e il garage hanno per ipotesi lunghezza uguale nello stesso sistema di riferimento). Nel sistema di riferimento del garage (considerato in quiete) l'auto si contrarrà di un fattore y nella direzione del moto secondo la formula esaminata in 2.1. Possiamo perciò supporre che un osservatore solidale al garage (il garagista) giudicherà che a un certo istante l'auto è completamente dentro al garage. Per il garagista, l'auto è più corta del garage, equindi entra completamente in esso. Notiamo però che non c'è nessun motivo per cui si debba considerare un sistema in quiete piuttosto che l'altro, perché nessun sistema è privilegiato, e l'unica realtà è il moto reciproco. Per l'autista perciò, che considera il sistema del garage in moto rispetto a lui, è il garage a contrarsi nella direzione del moto, motivo per cui per l'autista l'auto non è mai (in nessun istante) completamente dentro al garage. Per l'autista, il garage è più corto dell'auto. Il paradosso si origina con il chiedersi come sia possibile che le misurazioni siano, dal punto di vista dei due sistemi, entrambe corrette, come richiede la teoria. Il secondo insieme di problemi, più noto, ha a che fare con la dilatazione dei tempi, e coinvolge due paradossi distinti, quello cosiddetto degli orologi e quello dei gemelli, che noi presenteremo in successione qui di seguito. Onde evitare fraintendimenti, diciamo fin dall'inizio che men-

tre il paradosso degli orologi (cfr. fig. 10) ' è analogo al caso appena visto delle contrazioni delle lunghezze, dato che ha un carattere perfettamente reciproco in due o più sistemi inerziali, il paradosso dei gemelli va tenuto del tutto distinto perché in esso l'effetto non è simmetrico. S

S'

t=2$ t =2$ t=1$ t' =1$ t =t' = 0

fig. 10 ' Per tale figura, cfr. Maudlin, 1994.

56 1.Dallarelatività galileiana alla relatività generale

Le linee di universo S e S' rappresentate in 6gura sono le traiettorie spaziotemporali di due orologi in moto inerziale reciproco. A istanti diversi, gli orologi misurano il tempo nel sistema inerziale a cui appartengono. L'angolo formato dalle due linee di universo rappresenta la velocità rdativa tra i due orologi, e la linea verticale, che rappresenta l'evoluzio-

ne nel tempo del primo orologio (quello tondo), è qudla dd sistema considerato in quiete. Le due linee di simultaneità t = 1, 2 e t' = 1, 2 rappresentano le ipersuperEici 3-dimensionali di simultaneità relative ai due sistemi inerziali. La sincronizzazione tra i due orologi avviene all'istante t = t ' = 0, punto di intersezione deHe due linee di universo. Si noti che

rispetto al primo orologio (quello tondo), il secondo rimane indietro di un fattore y sia per t =1 che per t = 2, dato che lungo la linea di simultaneità del primo sistema, il secondo orologio non ha ancora segnato le ore corrispondenti. Tenendo presente però il punto di vista del secondo orologio, che, cambiando sistema di riferimento, può ritenersi in quiete rispetto al primo, l'effetto è reciproco, dato che a t' = 2 per esempio, il primo orologio segna un tempo che è precedente a t = 2. In definitiva, per ognuno dei due orologi, l'altro segna un tempo minore, ciò che ci fa concludere che l'effetto della dilatazione dei tempi è compktamente simmetrico. Anche qui il paradosso consisterebbe ndl'avere due misure temporali che sembrano tra loro in contraddizione, perché devono essere entrambe corrette. Possiamo ora accennare al motivo per cui il paradosso dei gemelli ha una natura essenzialmente distinta da qudlo degli orologi: che cosa succederebbe se i due orologi, magari trasportati da due gemelli separatisi al tempo t = 0, venissero riportati in uno stesso luogo spaziale dopo molti anni, facendo intersecare di nuovo le rispettive linee di universo? Come vedremo meglio in seguito, mentre non c'è nulla di paradossale nd dire che un gemello risulta più giovane dell'altro dal punto di vista di entrambi, se l'effetto di dilatazione dei tempi fossesimmetrico per entrambi i gemelli, avremmo l'assurdo che quando si rincontrano, ciascun gemello

sarebbe più giovane dell'altro! Prima di inoltrarci nella discussione di tali paradossi, poniamoci alcune domande che sembrano sorgere spontanee.. Considerando la perfetta reciprocità degli effetti di dilatazioni dei tempi e di contrazione delle lunghezze, non siamo costretti a ciassificarli come un qualcosa di apparente o di "prospettico", che non coinvolge cioè nessun mutamento reale nella costituzione fisica degli orologi o dei regoli? Inoltre, se, come avviene talvolta nella letteratura, si propendesse per questa interpretazione, come si potrebbe conciliarla con il fatto che le dilatazioni dei tempi sono state effettivamente misurate negli acceleratori di particelle elementari e do-

La relatività speciale 57

vrebbero perciò essere ritenute reali? E ináne, qual è la differenza essen-

ziale tra il paradosso dei gemdli e quello degli orologi? Anticipando il risultato della nostra discussione, che abbraccerà un punto di vista molto preciso, si argomenterà che gli effetti di contrazione e dilatazione sono una semplice conseguenza della relatività della simultaneità e che, oltre a non essere affatto paradossali, essi sono da considerarsireali. Il paradosso dovuto alla simmetria è solo apparente e va spiegato con il fatto che, in relatività, si tende a dimenticare che sia le determinazioni spaziali della lunghezza che quelle temporali della durata vanno relativizzate a un sistema di riferimento, e non sono assegnabili a un regolo o a un orologio a distanza in modo assoluto. Questo può risultare forse meno chiaro nd caso della contrazione ddle lunghezze, dato che nelle determinazioni spaziali apparentemente non dovrebbero entrare affatto relazioni temporali quali la simultaneità. In realtà, la simultaneità interviene anche nelle determinazioni spaziali come la lunghezza o il volume, se si tiene conto del fatto che la forma di un corpoin movimento può essere definita a ogni istante come linsieme delle posizioni simultanee dei differenti punti del corpo. Lo stesso Einstein, nel suo lavoro originale del 1905, aveva sottolineato che la misura di una lunghezza dipende da un-determinazione temporale quale la simultaneità, mostrando cosi implicitamente la preminenza del tempo sullo spazio, o almeno delle misure temporali su qudle spaziali. In effetti, storicamente si può affermare che non appena Einstein ipotizzò la relatività della simultaneità, tutti i problemi e le difficoltà da lui incontrati nella formulazione della relatività speciale si risolsero. Allo scopo di argomentare in favore di tali conclusioni, e per mostrare le differenza essenziale che intercorre tra il paradosso degli orologi e quello dei gemeHi, conviene ripercorrere brevemente la storia delle interpretazioni a cui gli effetti relativistici in questione sono stati soggetti. In particolare, dobbiamo ricordare che tali effetti erano stati inizialmente introdotti da G. Fitzgerald e H. Lorentz per spiegare la mancata rivelazione sperimentale della vdocità relativa della Terra rispetto all'etere, che prima della teoria einsteiniana si supponeva essere il mezzo di propagazione stazionario ddle onde dettromagnetiche (e dunque anche di quelle luminose). 2.4.1 L'esperimento di Michelson e Morley e le sue prime interpretazioni L'esperimento negativo in questione è forse ù più famoso della storia della scienza, e fu realizzato per la prima volta nel 1881 da Albert Michelson. Ripetuto nel 1887 con maggiore precisione insieme con Edward Morley, venne eseguito più volte anche dopo tale data allo scopo di de-

58 1.Dallarelatività galileiana alla relatività generale

terminare l'esistenza dell'etere, in base alla velocità che la Terra dovrebbe avere rispetto a esso in momenti diversi deU'anno. Lidea dell'esperimento è che la luce dovrebbe impiegare più tempo a viaggiare avanti e indietro lungo la direzione dell'ipotetico moto della Terra rispetto all'etere che in direzione perpendicolare a esso. Per comprendere le ragioni del fenomeno in base a qualcosa di più familiare, possiamo immaginare che una barca debba attraversare un fiume largo 50 metri e poi tornare esattamente al punto di partenza mantenendo una velocità costante rispetto a quella della corrente. Si dimostra facilmente che il tempo che la barca impiega ad attraversare il fiume per poi tornare al punto di partenza è minore del tempo che impiega a fare 50 metri a favore di corrente e poi a tornare indietro, mantenendo la stessa velocità rispetto alla corrente (ovviamente tale velocità è maggiore di

quella della corrente). Questo fenomeno venne sfruttato da Michelson e Morley in un interferometro ad alta precisione, costituito da due bracci di lunghezza OA e OB (fig. 11), da una sorgente S che emette un fascio di luce e da uno specchio semitrasparente O, inclinato a 45', che scinde il fascio di luce proveniente da S in due raggi tra loro perpendicolari. I due specchi A e B rimettono i raggi verso O in modo tale che quando si ricongiungono in M si ha l'interferenza. ~~@ B ",„' L2

O','

L -+

V

A S = sorgente A, B = specchi totalmente riflettenti O = specchio parzialmente riflettente M = apparato per rilevare l'interferenza L,, Lz = bracci dell'interferomentro v = velocità della Terra rispetto all'etere

fig. 11

Ruotando di 90' l'apparato sperimentale, i ruoli di Lq e Lz si invertono, per cui in presenza di moto terrestre rispetto all'etere, ci si aspetterebbe uno spostamento delle frange. di interferenza per il motivo visto sopra. Dalla misura di questo spostamento si è in grado di risalire alla velocità della Terra rispetto all'etere. Ebbene, questo spostamento non fu trovato.

La relat ività speciale 59

Calcolo della velocità della Terra rispetto all'etere I sostenitori della teoria del vento d'etere, ossia della teoria secondo la quale la Terra si muoveva di moto assoluto rispetto all'etere non trasportando nulla di questo mezzo con sé, supponevano che la vdocità assoluta della

Terra fosse circa pari alla velocità di rotazione della Terra attorno al Sole, ossia v = 3 X 10' m/sec. Ne seguiva che il rapporto fra tale velocità e la v 3 x 10 ' velocità della luce era - = , = 10 T u t t avia si riteneva che la realizc 3x10 zazione di apparati sperimentali in grado di rilevare tale rapporto fosse inutile per le ambiguità che potevano sorgere dall'interpretazione dei risultati. Ambiguità che invece sarebbe stata eliminata se si fosse riusciti a mettere in V

evidenza e8etti del secondo ordine rispetto a —, ossia se si fosse riusciti a C

2

rivelare effetti dell'ordine di -

2

= 10

= 10 ' . Solo un esperimento in-

C

terferometrico ad alta precisione come quello ideato da Michelson poteva garantire la rivelabilità di tali elfetti. Cerchiamo di capime il motivo. Prerdativisticamente, assumiamo che la luce abbia la velocità c solo rispetto al riferimento in quiete assoluta, dato appunto dall'etere. Nel tratto OA (fig. 11), la luce emessa da una sorgente solidale alla Terra avrà allora velocità c —v, visto che la Terra si muove con velocità v nel verso indicato daHa frec-

cia. D'altro canto, al ritorno la velocità relativa saràc + v Il tempo totale ht> impiegato dalla luce per percorrere L> nella direzione del moto e poi ndla direzione opposta sarà allora dato dalla somma del tempo di andata e di quello di ritorno (si assume per comodità cheL, = L, = L):

At>— —tempo di andata + tempo di ritorno L L 2Lc 2L r'

+

c — v c+ v dove, come al solito, y = 1 -

V —

c2 — y2

c

2 ,

C

B

B'

,'L

O 5 P 5 O' Fig. 12 - 5 è lo spostamento dovuto al moto ddla Terra

60 1.Dallarelatività galileiana alla relatività generale

Calcolare il tempo impiegato daUa luce nel compiere il percorso da O a B e ritorno è un po' più difficile, perché quando il raggio di luce arriva in B, questo si è spostato di un tratto B parallelamente alla velocità della

Terra. Conviene dunque rifarei al triangolo isoscele di fig. 12, la cui base 00 ' misura 28. Tale base corrisponde allo spazio percorso daH'interferometro durante il tempo impiegato dal raggio di luce per andare da O a B

— che nel frattempo si è spostato in B' —sommato al tempo di ritorno da B' a O, che nel frattempo si è spostato di una identica quantità b nella

posizione O'. Possiamo dunque porre il tempo impiegato dalla luce per percorrereOB', dato da OB'/c, come uguale a queHo dato da B/v OB'/c = á/v

Date le semplici proprietà delle proporzioni, si ha anche B=

(OB')v/c

Il teorema di Pitagora ci dà poi che Lz+ bz — (OBi )z cosicché, sostituendo in questa il b trovato sopra, si ha

(OB')'(1 — v'/c ) = L' OB' = Ly Ovvero, poiché il tempo di andata è uguale a quello di ritorno, il tempo totale d tzimpiegato dalla luce per giungere a B e tornare a O sarà dato dal

doppio della distanzaOB' diviso per la velocità della lucec 20B' 2L C

C

y

Abbiamo con ciò verificato che se la Terra è in moto relativo rispetto aH'etere, il tempo impiegato dalla luce per percorrere il tratto in direzione OA e ritorno è più lungo di quello impiegato per percorrere il tratto lungo il braccio perpendicolare. Ossia, At> ) ht> di un fattore y. La differenza totale tra i due tempi è data dunque da 2L y' g — 2— L y=— 2 L y(y -1) = — N = At, — ht>

C

c

C

Ruotiamo ora l'interferometro di 90', scambiando cosi i ruoli dei due bracci. Otterremo in tal caso che lo sfasamento temporale (ht') fra il tempo impiegato a percorrere il braccio paraHelo al moto della terra (At'>) e quello

perpendicolare (ht'~) è 2Ly ht'= A t', — N', = — C

(1 — y)

La relatività speciale 61

Possiamo allora calcolare 2Lr(1- r) - — 2L y(r- 1) = — 4L X(1- r) »'-» = — C

C

( 1- P )* ,

c(1 — P)' = -2L P

-

C

l

c(1 — P)

((1-P')' —)l= - ((l+iP ) — 1)

C

dove si è tenuto conto che v . . 1. P= — e quindi y =

1

(-p')'

2. poiché v « c, alloraP « 1, quindi (1 — P-)1= l 3. ndla condizione di cui sopra, possiamo sviluppare in serie (1 -P )', arrestandoci al II ordine in P = —. Ossia, (1 -P')' = 1+ ~P'+... C

C

Sapendo che il raggio di luce ha frequenza u = —, dove A, è la sua lunghezza d'onda, e sapendo che il numero di frange spostate è n = V (N'-At)

si ha che n= -

c

2L z 2 L q 2L v' — P =- P = — C

Si noti come n, ossia l'effetto da rivelare, sia effettivamente del II ordine in ". Mentre n può essere trovato sperimentalmente grazie all'apparato inC

terferometrico, sappiamo fin dall'inizio i valori di L, c e X,per cui siamo in grado di calcolare la velocità della Terra rispetto all'etere, cioè I

V=

nc il,

2L Però, come detto, Michelson e Morley sperimentalmente non trovarono alcuno spostamento di frange, ossia n = 0, per cui v = 0.

Come interpretare questo risultato negativo, che sembrava evidenziare uno stato di quiete dell'etere rispetto alla Terra? Uno dei principi metodologici più importanti che abbiamo ereditato dal 6sico e 61osofo francese Pierre Duhem, un principio che è stato poi ripreso dal 61osofo ame-

62 1. Dalla relatività galileianaalla relatività generale

ricano Quine, afferma che un esperimento non decide mai le sorti di una teoria in maniera semplice e univoca (ossia, in fisica non vale l'experirttentum crucis). Piuttosto, esistono sempre numerose ipotesi che possono spiegare un risultato sperimentale che contraddice le previsioni emergenti dallo sfondo teorico presupposto, e la teoria apparentemente falsificata può sempre essere salvata modificando qualche altra ipotesi in modo da dedurre il risultato sperimentale altrimenti falsificante. Nel nostro caso, si provò in vari modi a spiegare i risultati sperimentali negativi, ma tali ipotesi vennero successivamente eliminate. Non potendo affrontare qui l'interessante storia delle risposte teoriche al risulta-

to "negativo" dell'esperimento di Michelson e Morley (cfr. Miller, 1981), ci soffermeremo brevemente solo su qudla di Lorentz, proposta nel 1892 per salvare l'ipotesi di un etere stazionario che valesse come riferimento assoluto. Secondo l'ipotesi di Lorentz, vi è una reale contrazione del braccio dell'interferometro parallelo al moto della Terra, e questa contrazione è tale da compensare lo spostamento delle frange di interferenza. Ai nostri scopi è sufficiente ricordare che Lorentz ipotizzò un meccanismo

fisico che spiegasse perché la lunghezza del braccio fosseL solo a riposo. La contrazione macroscopica dd braccio dell'interferometro lungo la direzione dell'ipotizzato moto terrestre era secondo Lorentz il risultato della reale variazione dell'intensità ddle forze intermolecolari agenti a livello microscopico su ogni corpo in moto nell'etere, indipendentemente cioè dalla costituzione del corpo stesso. In particolare, tali forze variavano di intensità in modo proporzionale alla velocità del corpo rispetto all'etere. In definitiva, questa deformazione reale dei corpi era un'ipotesi fisica in grado di riprodurre lo stesso risultato che si sarebbe avuto se si fosse considerata, come fece poi Einstein, la velocità della luce costante e uguale a c in ogni sistema di riferimento. In tal modo, l'ipotesi di Lorentz era in accordo con gli esperimenti. Naturalmente gli osservatori sulla Terra non si accorgono di questa contrazione perché essa riguarda anche i regoli rigidi con cui la si potrebbe misurare. Secondo la teoria di Lorentz, un osservatore in quiete ndl'etere però la rileverebbe, cosi come rileverebbe che il tempo dell'osservatore terrestre in moto assoluto rispetto all'etere scorre più lentamente del suo, dato che sulla Terra il tempo impiegato dalla luce per compiere il viaggio di andata e ritorno da O a B della figura precedente è sempre uguale a 2L/c. Per l'osservatore in quiete assoluta invece, il percorso della luce nell'etere è stato visto essere uguale a (2L)g = Atq c e il tempo da essa impiegato per andare da O a B e ritorno sarà cosi uguale a (2L/c)y,

che è maggiore di 2L/c (si ricordi che g > 1). Poiché l'orologio solidale alla Terra segna 2L/c, dal punto di vista dell'osservatore in quiete assoluta

La relatività speciale 63

jl tempo ddl'osservatore terrestre, che ipoteticamente è in moto rispetto all'etere, deve scorrere più lentamente. Ovviamente, questo significa che il tempo terrestre è "dilatato", perché un secondo nel sistema in moto (queHo terrestre) dura un fattore g in più. Dato che per Lorentz entrambi gli effetti di contrazione e dilatazione erano da considerarsi fisicamente reali, dobbiamo ora chiederei qual è lo status di tali effetti nella teoria di Einstein, esaminando le interpretazioni più importanti che sono state proposte a tale scopo. Ciò richiederà

un'analisi del significato di spiegazione scientifica, in particolare della differenza tra spiegazione strutturale (in termini di un modello matematico) e spiegazione causale di un fenomeno, e un'attenta distinzione tra vari significati di "reale" e "prospettico" cost come sono usati in modo spesso fuorviante nella letteratura. 2.4.2 Spiegazione causale e spiegazione strutturale degli effetti relativisttci Chiariamo subito che l'interpretazione che offriremo qui degli effetti relativistici è un tentativo di dare risposta ad alcuni interrogativi sui quali ancora oggi non c'è un accordo unanime, malgrado la voluminosità della letteratura dedicata a questo argomento. Molti errori interpretativi sono da imputarsi a una mancata comprensione della portata rivoluzionaria deH'inesistenza di un tempo universale che scorra uniformemente per ogni sistema di riferimento. Tuttavia, vedremo che dopo un necessario chiarimento terminologico, il disaccordo tra le posizioni in campo in alcuni casi si rivelerà, per usare ancora la distinzione che la filoso6a occidentale ha ereditato da Parmenide, più apparente che reale. Viene talvolta detto che la differenza più importante tra l'interpretazione lorentziana della contrazione delle lunghezze e della dilatazione dei tempi e queHa einsteniana è che mentre la prima presuppone un atteggiamento ontologico rispetto al mutamento di lunghezza e di durata, considerato la causa reale deH'apparente uguale velocità della luce in ogni sistema inerziale, Einstein considera quegli e&etti come conseguenze apparenti deH'unica causa reale di essi, data daH'invarianza della velocità della luce (dr. Capek, 1961). La ragione di questa supposta apparenza delle dilatazioni temporali o ddle contrazioni deHe lunghezze sarebbe nel loro carattere perfettamente simmetrico per ogni coppia di sistemi inerziali. Ora, è sicuramente corretto dire che ndla teoria di Lorentz non c'è alcuna simmetria tra le contrazioni delle lunghezze e le dilatazioni dei tempi nei sistemi in movimento e le misure spaziotemporali relative aH'etere stazionario — dato che tali dfetti sono proprio ciò che distingue uno stato di moto assoluto dalla quiete assoluta. Ed è altrettanto corretto dire

64 1. Dalla relatività galileiana alla relatività generale

che nella teoria ddla rdatività speciale tali effetti devono essere simmetrici, perché ogni sistema di riferimento inerziale è equivalente a ogni altro, e se un orologio in moto e solidale al sistema K' appare segnare un tempo "dilatato" rispetto a un altro sistema K considerato in quiete, lo stesso fenomeno di dilatazione temporale dovrà essere rilevato nel sistema K' rispetto a K. Il punto centrale che qui si vuole sottolineare è che la simmetria di per sé non è un argomento contro la realtà dei fenomeni in discussione, dato che se gli effetti in questione dipendono da un sistema di riferimento, le domande del tipo "quanto è vecchio il gemello in realtà?" o "quanto è lungo il regolo in realtà?", o "quanto tempo è passato in realtà?" sono domande che nella teoria della relatività non hanno alcun senso. Visto che la locuzione "in realtà" nelle domande di cui sopra presuppone una risposta assoluta, cioè indipendente da un sistema di riferimento, noi dobbiamo invece ricordare che tale risposta è semplicemente bandita dalla teoria. Si noti che esiste una stretta analogia, e forse persino una dipendenza, tra il problema già discusso ddl'oggettività della relazione di simultaneità — inteso come la questione di stabilire se tale relazione sussista in modo fattuale o solo convenzionale tra due eventi di tipo spazio rispetto a un sistema di riferimento — e la questione della realtà della dilatazione temporale. Abbiamo visto che la relazione di simultaneità tra due eventi non è oggettiva, nel senso che essa non vale intersoggettivamente tra differenti osservatori inerziali. Ma, dopo la discussione sulla convenzionalità della simultaneità (5 2.3.3), dovrebbe essere chiaro che ciò non equivale a dire che, dato un sistema di riferimento ben preciso, la relatività della simultaneità rispetto a qud sistema sia sufficiente a stabilire la sua non-oggettività, nel distinto senso di "oggettivo" che è dato da "fattuale", e che si contrappone a "convenzionale" Cosi come la relatività della simultaneità non è di per sé un argomento contro la sua oggettività in tal senso, allo stesso modo, il fatto che la dilatazione dei tempi sia una conseguenza della relatività della simultaneità, e sia perciò un effetto dipendente da un sistema di riferimento, non implica che sia apparente, irreale, o puramente convenzionale e soggettiva. Troviamo cosi una ragione per conciliare l'atteggiamento, forse solo apparentemente contrapposto, di alcuni fisici relativisti di rango, quali Richard Tolman e Wolfgang Rindler da una parte, e Robert Wald, e J. Synge dall'altra, i quali considerano, rispettivamente, come reali e apparenti gli dfetti relativistici in questione. Qui di seguito discuteremo prevalentemente gli effetti temporali, per due motivi. Il primo è che su di essi abbiamo effettivi risultati sperimentali. Il secondo è che se stabiliremo la loro realtà o apparenza nel senso che ora vedremo, uguali motivi varranno

La relatività speciale 65

anche per gli effetti di contrazione spaziale, in quanto, come già detto, gli effetti spaziali e temporali sono tra loro completamente analoghi, e risultano entrambi una conseguenza della relatività della simultaneità. Gli argomenti più forti in favore della realtà delle dilatazioni dei tempi sono quelli sperimentali ben noti concernent, per esempio, la vita media del mesone p, (il mttone) o l'effetto Doppler relativistico. Più recentemente (1971), J. Hafele e R. Keating hanno eseguito altri esperimenti con degli orologi al cesio, trasportati su due aerei che viaggiavano in direzione opposta intorno alla Terra. Una volta tenuto conto dell'effetto della rotazione terrestre, anche tali esperimenti sono risultati in accordo con le predizioni teoriche. È istruttivo presentare in breve l'evidenza sperimentale in favore ddla realtà della dilatazione dei tempi nella forma della dilatazione del tempo di vita del muone, che è una particella radioattiva presente nei raggi cosmici e avente la stessa carica dell'elettrone (in valore assoluto), ma massa 200 volte maggiore. Come tutte le particelle radioattive, essa è instabile e perciò decade in altre particelle (due neutrini e un elettrone, o un positrone a seconda ddla carica) tn ttn tempo di decadimento carattenstico t(t che è detto vita media. Per tale grandezza, le misure effettuate in laboratorio avevano dato un valore x = 2,15 x 10 sec. Osservando muoni ad altitudini diverse (sulla cima e ai piedi di una montagna), si era trovato che il loro numero a bassa quota era maggiore di quello che ci si aspettava. Il problema essenziale era che tali muoni dovevano essersi originati vari chilometri più in alto, e il valore della vita media dei muoni misurato in laboratorio era troppo basso per permettere loro di compiere tragitti cosi lunghi. Una tale incompatibilità con i dati sperimentali fece supporre l'esistenza di un effetto relativistico di dilatazione dei tempi, che allungasse il camtnino medio l dei muoni. Infatti, persino a velocità uguali a quella della luce, ma senza dilatazione temporale relativistica, tale cammino medio sarebbe stato uguale solo a 645 m (l = rc), ancora in contraddizione con i dati sperimentali sui muoni rilevati a bassa quota. Interpretando invece la vita media To di cui sopra come vita media a riposo, cioè come durata media della vita della particella in un sistema inerziale solidale all'osservatore, se la velocità V del muone fosse stata di 99/100 di

Se supponiamo che un orologio si allontani da noi, esso apparirà battere il tempo più lentamente, dato che segnali acustici o luminosi emessi in corrispondenza dell'unità di tempo dovranno percorrere più spazio dei precedenti per arrivare a noi. Tale effetto, che era noto in epoca pre-relativistica, è detto Doppler dal nome del fisico viennese che lo studiò, ed è riscontrabile sperimentalmente in modo ancora più marcato a causa degli effetti relativistici di dilatazione dei tempi (cfn Rindler, 1977, p. 55). L'effetto Doppler è responsabile anche dello spostamento verso il rosso (redshift) nello spettro corrispondente alle galassie in recessione (cfr. il capitolo di Silvio Bergia sulla cosmologia).

66 1.Dallarelatività galileiana alla relatività generale

quella della luce c rispetto al sistema in quiete, si sarebbe avuto un cammino medio di circa 10 volte superiore (con un fattore y' = 10 il cammino diventa l = 6.450 m), in buon accordo con i dati sperimentali. B. Rossi e D. Hall trovarono cosi, nel 1941, una importante conferma alla tesi cinematica einsteiniana, formulando il rapporto tra vita media i dei muoni nei raggi cosmici e vita media a riposo tp misurata in laboratorio, ossia fZp

Analoghi fatti concernenti i muoni sono stati più recentemente evidenziati in laboratorio al CERN di Ginevra (cfr. Cattaneo, 1987, pp. 94-95).

Tutto ciò ci fa propendere per concludere definitivamente a favore della realtà delle dilatazioni temporali, sia nel senso che tale fenomeno non riguarda solo i particolari sistemi dinamici dati dagli orologi, ma ogni tipo di mutamento temporale e, dunque, anche i fenomeni biologici responsabili dellinvecchiamento, sia nd senso che l'effetto misurato non è un'apparenza, dato che è stato indipendentemente confermato da varie misurazioni sperimentali. Nessun fisico dubita oggi dell'accuratezza dei risultati sperimentali sui muoni o sugli orologi atomici. Per quanto abbiamo detto sopra, un argomento analogo dovrebbe perciò valere anche per le contrazioni di lunghezze nei sistemi in moto. Si noti che questa conclusione è anche in perfetto accordo con il senso comune: se ci si chiede infatti per quale motivo gli effetti relativistici di cui stiamo discutendo non sono riscontrabili nei processi fisici che avvengono quotidianamente sotto i nostri occhi, la risposta dovrebbe essere ovvia: le velocità in gioco in tali processi sono talmente basse che gli effetti relativistici sono trascurabili. Essi divengono rivelabili solo a velocità elevate, come nel caso degli aerei prima menzionato. A questo punto sorge però un interessante problema interpretativo, che nella letteratura critica non è stato messo in rilievo: come dobbiamo intendere le autorevoli asserzioni secondo cui la teoria di Einstein ha abbandonato le speculazioni sui meccanismi causali o forzeresponsabili degli effetti relativistici, per cui questi ultimi non sono mutamenti fisicireali negli oggetti in movimento? Se le dilatazioni temporali (e dunque le contrazioni di lunghezza) sono reali e sono state effettivamente misurate, come spiegare allora le tesi secondo cui un barra rigida non si contrae davvero nella direzione dd moto (cfr. Wald, 1977, p. 24), o secondo cui "la contrazione è solo una conseguenza del nostro modo di considerare le cose e non un mutamento della realtà fisica" (cfr. Born, 1921,

p. 189)? H punto essenziale è che le due posizioni apparentemente contrapposte sulla realtà degli effetti relativistici contengono entrambe un principio

La relatività speciale 67

di verità, perché il fenomeno delle contrazioni e delle dilatazioni non ha alcuna causa evidente dovuta a interazioni fisiche del tipo di quelle ipotizzate da Lorentz, ed è, con le qualificazioni che seguono, perfettamente simmetrico nei due sistemi di riferimento. Il vero problema è perciò, come spesso accade in filosofia, nella natura stessa della domanda: la distinzione "realtà" e "apparenza" con cui abbiamo provocatoriamente aperto questa sezione è assolutamente infondata e fuorviante nella teoria della rdatività, perchè presuppone di nuovo un punto di vista neutrale o newtoniano, e dunque "indipendente da prospettive" ("la realtà" ), che in relatività semplicemente non si dà. Se però per "prospettiva" si intende la coordinatizzazione costituita da

sistemi inerziali, all'interno dei quali soltanto si può suddividere un vettore 4-dimensionale in tre componenti spaziali e in una temporale, allora è corretto dire che gli effetti relativistici sono "prospettici", purché non si presupponga erroneamente che tali effetti siano una deformazione dell'unica realtà, data dalla lunghezza propria di un regolo e dal tempo proprio di un processo. Sarebbe infatti profondamente errato pre-

supporre, come sembra fare Milic Capek (cfr. Capek, 1961), che ndla teoria della relatività le descrizioni date all'interno del sistema inerziale in cui ci troviamo, e riguardanti la lunghezza propria di un regolo o il tempo proprio di un orologio, abbiano uno status privilegiato. Se "reale" si identifica con "invariante", allora certamente gli effetti relativistici in questione non sono reali, visto che sono una diretta conseguenza della relatività della simultaneità, e non sono invarianti. Ovviamente però, non c'è nessuna ragione per cui dovremmo considerare l'invarianza come un criterio necessario oltre che sufficiente per la realtà di un fenomeno relativistico (vedi nota 7). Anzi, la realtà dei fenomeni di dilatazione temporale, rivelati sperimentalmente come detto sopra, costituisce un ottimo argomento per sostenere che l'invarianza è un criterio di realtà troppo forte. Per questo motivo, in rdatività sarebbe fuorviante definire come "apparente" ciò che dipende da un sistema di riferimento, dato che gli effetti in questione risulterebbero allora apparenti per definizione, con il solo risultato di battezzare come illusori o irreali fenomeni riscontrabili sperimentalmente. ' Un problema più serio sollevato dagli effetti relativistici sembra essere Ci sono dei programmi di ricerca di teoria quantistica dei campi che, come quello di Gordon Fleming (cfr. Fleming, 1996), presuppongono che le grandezze assunte da un sistema quantistico (la posizione o lo spin di una particella) siano radicalmente dipendenti da un'ipersuperficie di simultaneità. Una posizione che negasse la realtà a fenomeni fisici dipendenti da un sistema di riferimento taglierebbe alleradici con un ingiustificatofiat ogni possibilità si sviluppo di tali programmi, che alla lunga potrebbero invece rivelarsi vincenti.

68 1. Dalla relatività galileiana alla relatività generale

costituito dal fatto che spesso noi identifichiamo ciò che è reale con ciò che entra in molti nessi causali, o, più, semplicemente, con ciò che è causalmente attivo. In tal caso, se per "reale" si intendesse "prodotto o effetto di un mutamento fisico causale" dd regolo o deH'orologio, allora gli effetti relativistici non sarebbero da considerarsi reali, visto che le speculazioni di Lorentz sulla variazione di intensità delle forze molecolari come causa concreta della modifica deHa lunghezza dei regoH rigidi sono state abbandonate. Tuttavia, il fatto che la spiegazione lorentziana sia stata abbandonata, non significa che ogni tentativo di spiegazione causale dei fenomeni in questione sia stato abbandonato. L'esempio che segue ci aiuterà a capire in modo ancor più approfondito la natura della contrazione di Lorentz nei suoi rapporti con le spiegazioni causali. Si consideri uno sciatore che, in modo fantascientifico, si muova con velocità V molto prossima a quella deUa luce, tale che il fattore y'sia uguale a 10. La lunghezza degli sci a riposo sia 2 metri. Se sul suo tragitto, che si immagina compiuto con moto inerziale, egli si imbattesse in una buca circolare a riposo, e di diametro uguale 1$ metri, la contrazione di Lorentz lo farebbe cadere dentro, perché gli sci si accorcerebbero di 180 cm, risultando lunghi solo 0$ metri! (y = 10). Per eliminare considerazioni fisiche più realistiche che coinvolgono la forza di gravità, e che ci farebbero fuoriuscire dalla relatività speciale, possiamo immaginare che una valanga si abbatta su di lui proprio mentre cade nella buca, e che la sua inerzia sia cosi insufficiente a fargli "saltare" la buca indenne. È interessante chiedersi quale descrizione si debba fornire dal punto di vista del sistema inerziale associato allo sciatore, che vedendo la buca venirgli incontro, deve misurare una contrazione del diametro della buca nella direzione del moto. In particolare, la buca diventa oblunga, e, riducendosi neHa direzione del moto di un fattore 10, viene a misurare solo 15 centimetri! Dato che si è sinora insistito sul fatto che le descrizioni fornite dai due sistemi inerziali devono essere simmetriche, è corretto ipotizzare che lo sciatore cada neHa buca anche dal punto di vista del suo proprio sistema di riferimento? Fisicamente questa soluzione appare ragionevole, ma come può uno sci la cui lunghezza propria è 2 metri cadere in una buca il cui diametro contratto misura 15 cm? È chiaro che per rispondere a questa domanda abbiamo solo due ipotesi. O supponiamo che la situazione fisica corrispondente "al punto di vista" della buca (la buca in quiete) sia diversa da quella data dal punto di vista dello sciatore (lo sciatore in quiete), perché-diversi sono i sistemi di riferimento, oppure le due descrizioni devono coincidere nel concludere che lo sciatore cade nella buca. Se scegliamo la prima soluzione, le due descrizioni divergono perché lo sciatore cadrebbe nella buca dal pun-

La relat ività speciale 69

to di vista del sistema in cui quest'ultima è in quiete (contrazione degli sci), mentre non cadrebbe dal punto di vista del suo sistema inerziale (contrazione della buca). In base allo spirito "invariante" della teoria fin qui sottolineato, optiamo per la seconda soluzione, che da un punto di vista metodologico è suggerita dal fatto che le leggi fisichenon possono prescrivere processi macroscopicamenteincompatibili rektivamente a due sistemi di riferimento diversi. Il fatto fisico a cui si riferisce la descrizione definita 'lo sciatore caduto ndla buca' deve essere "ritrovato" anche nell'altra descrizione: o lo sciatore cade, o non cade, senza possibili relativizzazioni a sistemi di riferimento diversi, malgrado la spiegazione fisica del fenomeno possa essere diversa per due sistemi inerziali diversi (cfr. Rindler, 1977). Come spiegare allora che lo sci lungo 2 metri cade ndla buca il cui diametro parallelo alla direzione dd moto si è ridotto a 15 cm? E non è questo in contraddizione con ciò che si diceva prima a proposito ddl'auto e dd garage? Malgrado tale problema non abbia ricevuto sufiiciente attenzione nella letteratura e sia ancora soggetto a controversie s a noi sembra che l'unica via da percorrere sia ipotizzare che la parte anteriore dello sci si curvi quando è sopra la buca, mentre quella posteriore non ha subito ancora alcuna deformazione. La spiegazione di questo effetto fa riferimento al fatto che, a causa delle contrazioni ndla direzione del moto, la forma di un oggetto rigido non puo rimanereinvariata passando da una descrizione inerziale all'altra. Inoltre, la velocità di trasmissione ddle onde elastiche che trasportano la deformazione in un corpo rigido è finita, e non istantanea, dato che la luce è un segnale limite. Quello cheva dunque tenuto presente per comprendere, seppure in maniera come lo sci cada nella buca anche nella descrizione in cui lo sciatore è in quie'te, è che la nozione di 'corpo rigido' in relatività ristretta deve essere abbandonata, perché presuppone per definizione la trasmissione istantanea di interazioni fisiche. Possiamo chiarire ulteriormente il problema con un altro esempio. Si immagini un'auto lunga 5 metri che entri in un garage lungo 3 metri grazie a una contrazione di Lorentz con fattore y = 2, Supponiamo altresi che la parete posteriore del garage sia un muro di cemento, mentre la parete anteriore abbia una saracinesca cha cala quando l'auto è completa-

appr ossimativa,

Si è visto nella nota precedente che la situazione potrebbe essere radicalmente diversa per la meccanica quantistica relativistica, che però ha a che fare con sistemi microscopici. Si vedano però, Rindler, 1961 e 1977, e M, 1987, cap. 9. Taylor e Wheeler (1963) rimandano a Rindler e ndla trattazione degli esempi qui riportati, anche noi seguiamo, con qualche modifica, la sua trattazione.

70 1. Dalla relatività galileiana alla relatività generale

mente dentro. La soluzione corretta del paradosso presuppone che la descrizione dal punto di vista del sistema in cui l'auto è in quiete deve far posto allo stesso meccanismo fisico che fa si che la saracinesca cali quando l'auto è completamente dentro il garage. La soluzione che prevede due descrizioni distinte deve invece argomentare che la saracinesca non può mai chiudere l'auto nel garage nel sistema K in cui l'auto è in quiete, dato che il garage aperto che "si fa incontro" all'auto in K misura solo lg metri, mentre la lunghezza dell'auto a riposo è 5 metri. Come già accennato, il motivo per cui questa "soluzione" va abbandonata è dovuto al fatto che l'effetto fisico della saracinesca (dovuto, poniamo, a una cellula fotodettrica), che si abbassa realmente nella descrizione riferita al sistema K' in cui il garage è in quiete, nel sistema K non si verifica: le leggi fisiche in questo caso prescriverebbero effetti fisici diversi a seconda dd sistema inerziale considerato, contro lo spirito della teoria, che fu, ricordiamolo, "escogitata" da Einstein per salvare la covarianza delle equazioni di Maxwell in riferimenti inerziali diversi. Dato che questo effetto deve invece riscontrarsi anche nell'altra descrizione, si dovrà supporre che la parete posteriore di cemento del garage che urta contro il parafango anteriore ddl'auto "trascini" con sé la macchina deformandola. All'inizio dell'urto, l'onda elastica non è ancora arrivata al parafango posteriore dell'auto, che quindi non ha subito ancora alcuna deformazione. Vista la velocità finita della propagazione delle onde elastiche nell'auto, la parte posteriore del garage aperto percorrerà 3P metri (lo spazio uguale alla differenza tra la lunghezza dell'auto a riposo e la lunghezza contratta del garage) "trascinando" la parte anteriore dell'auto, prima che le onde suddette possano giungere alla parte posteriore di quest'ultima percorrendo 5 metri. La parte posteriore dell'auto è dunque "ignara" dell'urto che ha subito qudla anteriore, anche immediatamente dopo la chiusura della saracinesca. Il punto che a nostro parere può contribuire a chiarificare il problema che abbiamo discusso, e forse l'intera discussione sulla "realtà" o "apparenza" degli effetti relativistici in questione ha a che fare, come annunciato, con i diversi approcci alla natura della spiegazione scientifica. Coloro che rifiutano di attribuire realtà alla contrazione ddle lunghezze o alla dilatazione dei tempi nel senso di escludere qualunque meccanismo fisico causale che ne renda conto, spesso ipotizzano che la spiegazione di un fenomeno debba necessariamente identificarsi con un preciso meccaInfatti, un semplice calcolo mostra che quando y = 2, la vdocità relativa del garage rispetto all'autoè 0,886 c, e dunque anche se le onde elastiche viaggiassero con velocità uguale a quella della luce, non riuscirebbero a percárrere i 5 metri dell'auto prima che la parete del garagene percorra 3P.

La relatività speciale 71

nismo causale o dinamico che lo renda intellegibile. Ma non c'è ragione di ritenere che ogni spiegazione debba necessariamente essere causale per poter essere considerata come scientifica. Essendo l'effetto relativistico di contrazione (o dilatazione) puramente cinematico, una sua spiegazione sembrerebbe richiedere un approccio diverso alla spiegazione scienti6ca. Nel caso della contrazione della lunghezza, possiamo per esempio far riferimento a una spiegazione del fe-

nomeno che sia puramente geometrica e quindi strutturak, cioè interna al modello matematico utilizzato dalla teoria con il quale la teoria stessa si può identi6care. Una volta che si sia compreso perchè la relatività delle simultaneità entri nella determinazione di una lunghezza, una spiegazione strutturale potrebbe contribuire a dissipare perplessità non ancora del tutto dissolte dall'approccio precedente, che è comunque quello adottato da molti 6sici. Per spiegare ciò che abbiamo in mente, basta richiamare la spiegazione geometrica di cui si è già parlato in 2.2.1 e in particolare le fig. 4 e 5. Da quelle figure, emerge chiaramente perché entrambi gli osservatori misurano lunghezze minori lungo la direzione del moto.

La fig. 13 è un'altra illustrazione della reciprocità dd fenomeno della contrazione delle lunghezze nel caso di un auto e di un garage aperto da entrambi i lati. L'evoluzione temporale ddle cui estremità nel sistema in quiete rispetto al garage è rappresentata dalle due linee verticali. Mentre nel sistema del garage si vede che l'auto, a causa dell'effetto di contrazione della sua lunghezza nella direzione del moto, è completamente dentro il garage, almeno nell'istante corrispondente alla linea di simultaneità orizzontale x = 0, nel sistema dell'auto ciò non avviene mai, perché per quest'ultimo, è il garagea contrarsi. In particolare, all'istante corrispondente alla linea di simultaneità inclinata rispetto all'orizzontale, si vede per esempio che l'auto "spunta" sia nella parte sinistra che in quella destra del garage, e che prima e dopo tale istante l'auto non è mai compresa nella zona grigia che segna i confini dell'evoluzione temporale delle estremità del garage. Perciò, mentre secondo la spiegazione strutturale l'auto non è mai dentro il garage, perchè non esiste un istante di tempo in cui le sue estremità lo siano in base alla determinazione della simultaneità effettuata nel sistema di riferimento dato dall'auto, secondo la spiegazione data precedentemente, l'auto è completamente nel garage anche per il conducente, grazie alla deformazione ddl'auto dovuta al trascinamento della parte posteriore del garage. La contraddizione tra le due spiegaziot Salmon (1984) è un sostenitore di tale punto di vista. Per la nozione di spiegazione strutturale, si veda Hughes, 1989, cap. 8.

Per questa figura, si veda Maudlin, 1994, p. 54.

72 1.D allarelatività galileiana alla relatività generale

ni è evitata se si considera che nella spiegazione strutturale di fig. 13 il garage è aperto da entrambi i lati.

A

B fig. 13

In definitiva, dal punto di vista di una spiegazione strutturale e non causale del fenomeno, non c'è alcun meccanismo causale responsabile deil'dfetto, né, come lo spirito ddla spiegazione strutturale illustra, esso va ricercato. La teoria della relatività non deve essere considerata incompleta se non lo propone. In definitiva perciò, se ci chiediamo se l'effetto sia reale nel senso della sua ripetibile riscontrabilità e misurabilità nd siste-,. ma di riferimento in quiete, allora la risposta deve essere positiva. Dato che analogo discorso vale anche per l'effetto della dilatazione dei tempi, rimane ora da esaminare il caso più complesso dato dal paradosso dei gemelli, per scoprire se esso si possa ricondurre a quest'ultimo.

2.4.3 Il paradosso dei gemelli Immaginiamo due gemelli che alla nascita si allontanino l'uno daU'altro fino a occupare due sistemi inerziali in moto relativo, e che poi ritornino a incontrarsi dopo un certo numero di anni. Per quantificare l'effetto, possiamo supporre che alla nascita uno dei due si allontani dall'altro su una astronave K' che dopo un'intensa accelerazione acquisisca una vdocità costante v che, rispetto al sistema K, sia (fantascientificamente) uguale a 4/5 di quella della luce. Consideriamo la situazione dal punto di vista del gemello G rimasto in quiete nel sistema K. Se il gemello in viaggio G' tornerà a incontrare G nel giorno in cui quest'ultimo compie il suo cinquantesimo compleanno, per G' saranno passati solo 30 anni. Infatti, visto che il tempo "scorre" più lentamente nel sistema in movimento K', l'orologio del gemello in viaggio sarà più lento di un fattore 1/y = 3/5. Con i dati visti, y = l/(1 — (v/c) )' = l/(l — 16/25)' = 5/3.

La relatività speciale 73

Il vero problema di questo "paradosso" è che non risulta ben chiaro in che cosa esso consista veramente, a parte l'ovvio conflitto con il senso comune dovuto alla discrepanza tra il tempo misurato da G e quello misurato da G' Tale conflitto è espresso matematicamente dalla dipendenza del tempo proprio dal percorso o linea di universo su cui lo si calcola, e filosoficamente va inteso come una diretta conseguenza dell'abbandono di un tempo universale valido per ogni osservatore. Ricordiamo anzitutto che il tempo proprio è, a differenza dd tempo coordinato, un invariante per ogni osservatore, perché la coincidenza tra l'evento dato dalla lettura dell'orologio sul quadrante in un istante e l'evento a cui si assegna la coordinata temporale è direttamente percepibile, dato che essi coincidono spaziotemporalmente. In più, poiché il tempo proprio è tecnicamente un integrale di linea e la sua misura tra due punti A e B separati da un intervallo di tipo tempo dipende dal percorso, esso risulta massimo se calcolato lungo una linea di universo inerziale o geodetica dello spaziotempo, mentre su ogni altro percorso risulta minore. Questo fatto può essere illustrato con l'esempio delle geodetiche di una sfera, che sono il cammino "più breve" tra due punti della superácie. Per calcolare la distanza più breve tra i due punti della sfera, si suddivide un cammino che li congiunga in tanti pezzetti quasi-rettilinei, si usa la metrica della superácie sferica per calcolare la loro lunghezza, e poi si sommano tutti i pezzetti integrando. Il cammino più breve o geodetica sarà quello che dà la somma minore. Nel caso della sfera la geodetica, è un arco di cerchio massimo ottenuto dall'intersezione della sfera stessa con il piano passante per il suo centro e per i punti iniziale e flnale, appartenenti alla superácie, del cammino. Per le traiettorie che connettono due eventi di tipo tempo dello spaziotempo di Minkowski, si procede analogamente. Decomponendoi percorsi in tanti pezzetti quasi-rettilinei, 'misurandoli' usando la metrica, e poi sommando tutti i percorsi possibili di tipo tempo che connettono i due punti, risulta che la traiettoria in cui il tempo trascorso è ptù lungo è appunto quella inerziale data da una retta. Tale traiettoria è chiamata geodetica di tipo tempo ed è descritta da osservatori inerziali. Per eliminare le conseguenze apparentemente controintuitive di questo fatto matematico, talvolta si fa l'esempio di un'auto che deve andare da un punto all'altro di una città. Attraversando il centro passiamo per la linea più breve, che è quella retta, ma il tempo di percorrenza è più lungo perché dobbiamo guidare per strade strette e trafficate. Se invece aggiriamo il centro viaggiando lungo un raccordo anulare, allunghiamo il tragitto ma accorciamo i tempi di percorrenza. Il lettore dovrebbe a questo punto avere compreso che in questo esempio, malgrado la sua sug-. gestività, c'è qualcosa di fuorviante. Nel caso delle auto, i percorsi sono

74 1. Dalla relatività galileiana alla relatività generale

compiuti con velocità diverse, ma si presuppone che il tempo scorra uniformemente nei due tragitti. Nel caso della dilatazione dei tempi relativistica che è alla base dd paradosso dei gemelli invece, è proprio il tempo che "scorre" in modo difforme lungo i due percorsi. Ciò può essere facilmente compreso utilizzando due orologi luminosi, tali cioè che l'unità temporale sia data dalla semi-somma del tempo impiegato dalla luce per andare da un punto di emissione a un punto di riflessione e poi di nuovo indietro verso il punto di emissione (fig. 14). I due orologi, come nel caso dei gemelli, sono in moto inerziale reciproco. Dato che assumiamo la costanza della velocità di andata e ritorno della luce nei due sistemi, la maggiore lunghezza che per l'osservatore in quiete deve percorrere il raggio luminoso che costituisce l'orologio in moto (la lunghezza della somma dei due lati del triangolo isoscele è maggiore dell'altezza) deve essere compensata da un rallentamento appropriato dd tempo.

orologio in quiete

orologio in moto

fig. 14

Il fatto che il gemello in moto registri un tempo dilatato è perciò una conseguenza del postulato dell'invarianza della velocità della luce, e proprio per questo oggi nessun fisico o filosofo ritiene che il paradosso dei gemelli metta in discussione lo status scientifico o la coerenza della teoria della relatività speciale. Tuttavia, sussistono a tutt' oggi notevoli differenze sull'interpretazione del paradosso, in particolare su come viene spiegato. In generale, c'è accordo sul fatto che il paradosso viene evitato solo se l'effetto di ringiovanimento non è simmetrico per t due gemelli, a differenza di quello che accade per la contrazione delle lunghezze e la dilatazione dei tempi (paradosso dell'orologio). Anche in questo caso però, vedremo che non sono effetti fisici quali l'accelerazione che spiegano correttamente il ritardo temporale dell'orologio del gemello in movimento come spesso si assume, ma argomenti di tipo geometrico che fanno riferimento ancora una volta alle proprietà strutturali dello spaziotempo di Minkowski.

La relatività speciale 75

Il punto essenziale è che le accelerazioni necessarie a far allontanare G' da G e poi a farlo tornare indietro in un qualsiasi modeHo realistico dell'esperimento mentale in questione distruggono l'equivalenza inerziale dei due gemeRi, e dunque il carattere simmetrico delle due esperienze. Conseguentemente, solo uno dei due gemelli sentirà deHe accelerazioni, mentre l'altro rimarrà per ipotesi in quiete nel sistema K per tutto il tempo

ddla separazione, ciò che spiega come mai sia impossibile che l'effetto di dilatazione temporale sia simmetrico anche per il gemello G nel sistema non accelerato K. 11 paradosso viene eliminato daH'asimmetria necessariamente presente tra un sistema inerziale e un sistema accelerato. Altrimenti, poiché le descrizioni fatte secondo i due orologi dovrebbero essere entrambe corrette, la simmetria implicherebbe che ognuno dei due gemeHi abbia cinquant' anni secondo il tempo calcolato con il proprio orologio, e trenta secondo il tempo calcolato daH'altro gemello. Anche se ciascuno dei due gemelli conviene sulle misurazioni deH'altro, l'apparenza fisica dei gemelli è però un segno inequivocabile deH'età che deve essere riconosciuto da entrambi i punti di vista. La simmetria implicherebbe invece la mancanza di accordo su chi sia invecchiato di più al momento deH'incontro, e ciò è assurdo. Come dovrebbe ormai essere chiaro, la relatività speciale non implica tale assurdo, nemmeno nelle formulazioni in cui le accelerazioni di uno dei due gemelli sono inessenziali alla spiegazione del paradosso. In tali formulazioni, quest'ultimo viene correttamente eliminato non grazie a osservazioni fisiche implicanti l'accelerazione di uno dei due gemelli, ma attraverso considerazioni geometriche strutturali del tipo che abbiamo fatto sopra, e che coinvolgono tre orologi e non due. Per comprendere tale argomento alternativo, si faccia riferimento alle Figure 15a e 15b.

O

O E— punti in cui vi è accelerazione

76 1.Dallarelatività galileiana alla relatività generale

La figura 15a rappresenta il modello "realistico" con accelerazioni prima menzionato. Si noti che le variazioni di vdocità in gioco nel paradosso d ei gemelli avvengono in tre punti: alla partenza (punto 0) , al r i -

congiungimento (punto E), e, fondamentale perché ineliminabile, quando l'astronave inverte la rotta per tornare verso G (punto A). Le prime due sono meno importanti, perché possono essere sostituite da sincronizzazioni effettuate "al volo" quando le linee di universo si intersecano. Immaginiamo perciò che, invece di avere a che fare con due gemelli, si abbia a che fare con tre orologi. Non essendoci differenza se non di uniformità tra orologi biologici e orologi fisici, siamo liberi di sostituire il ritmo di accrescimento biologico di un essere umano con un orologio. Iniziamo con il sincronizzare due orologi (o, alternativamente, l'età di due neonati) G e G', supponendo che al momento ddl'incontro dell'astronave in O essi riportino entrambi il tempo t = 0 (il momento della loro nascita è in comune). Al punto di intersezione A, quando cioè l'orologio G' ha segnato quindici anni e qudlo in quiete relativa G venticinque, un'altra astronave K" passa per A trasportando a bordo un altro orologio (altemativamente, un ragazzo) G", che per ipotesi sincronizza la sua dura-

ta (età) con quella di G' Si supponga che in A anche G" segni 15 anni. A questo punto, mentre G" continua la sua rotta inerziale verso G e lo incontra in E quando G" segna trenta anni, G' continua il suo viaggio indefinitamente lontano da G, che in E riporta una durata (età) uguale a cinquanta anni. La situazione è schematizzata in figura 15b con tre orologi: I che rimane in quiete ed è sincronizzato con II in O, mentre II e III sono sincronizzati tra loro in A. Si faccia attenzione al fatto che per G, che è in quiete, l'età di G' coincide con qudla di G" al momento dell'incontro tra G e G", dato che il tempo impiegato da G" per arrivare da A in E è ugua-

le a quello impiegato da G' per andare da O a A (G' e G" hanno vèlocità uguale e opposta rispetto a G). In altre parole, il momento E in cui G si incontra con G" è simultaneo con un istante che nel computo di G corrisponde a un'età di G' che è uguale a trenta anni, la stessa di G" Per G' però, è G a essere più giovane di lui dello stesso fattore 3/5, mentre lui è invecchiato più rapidamente. L'effetto simmetrico è perciò conservato in due qualsiasi sistemi inerziali (in questo caso G e G'), ma il paradosso dei gemelli è evitato perché G e G' non si possono rincontrare mai, a meno di un cambiamento ulteriore di sistema di riferimento. Ammettendo come possibile lo schema idealizzato di figura 15b, è interessante chiedersi se il paradosso dei gemelli possa essere riformulato senztt accekrazioni. Ebbene, dato che si dimostra che è la somma della dilatazione temporale di G' e G" che dà l'effetto finale in E, l'accelera-

La relat ività speciale 77

zione non può essere la causa fisica della discrepanza nell'età dei gemelli, visto che tale discrepanza è funzione sia dd tempo totale trascorso durante la separazione che della velocità relativa. Infatti, considerando l'inversione nel punto A' della figura 15b, noi avremmo la stessa accelerazione che è necessaria per tornare in E, ma in E' la differenza di età tra i due gemelli o i tre ragazzi è assai minore che in E, malgrado la velocità relativa in questo caso sia identica (per tale argomento, si veda Kroes,

1985). Quindi se ne conclude che, da un lato, l'accelerazione non può essere la causa fisica ddla dilatazione temporale, e, dall'altro, che i frequenti appdli alla relatività generale per un trattamento del paradosso dei gemelli sono inutili, anche perché la relatività speciale può trattare al suo interno l'accelerazione tanto quanto la meccanica classica newtoniana. In realtà,

come abbiamo detto sopra a proposito della contrazione delle lunghezze, non c'è alcuna causa fisica per il rallentamento degli orologi, perché tale effetto, pur misurabile, è una conseguenza della relatività della simultaneità, e del fatto che la misura del tempo proprio dipende dal cammino. Non c'è rallentamento degli orologi come processo fisico che abbia bisogno di cause meccaniche o elettromagnetiche: anche qui la spiegazione strutturale è sufficiente. Si noti però che in ogni caso l'effetto non è simmetrico nemmeno nella formulazione di figura 15b, perché la linea retta OE non può mai trasformarsi nella spezzata OAE con una sola trasformazione di Lorentz. In una rappresentazione bidimensionale dello spaziotempo di Minkowski, una trasformazione di Lorentz può solo trasformare una linea retta in un'altra linea retta. In altre parole, l'effetto di dilàtazione temporale è simmetrico solo tra dtte qualsiasi sistemi inerziali, mentre la spezzata in questione è ottenuta da due trasformazioni di Lorentz in dtte pttnti diversi dello spaziotempo, la cui composizione non è a sua volta una trasformazione di Lorentz. Come abbiamo visto, la simmetria della dilatazione dei tempi si ripristina solo tra trasformazioni di Lorentz in due sistemi iner-

ziali (I e II, II e III, o I e III). Ciò è evidente se si considera la descrizione delle due sincronizzazioni dal punto di vista ddl'orologio III, che conserva ovviamente la reciprocità della dilatazione rispetto a quella di I, perché I e III sono due sistemi inerziali in moto relativo. L'osservatore che trasporta HI vedrà prima l'orologio II intersecare la sua linea di universo con una certa velocità, e poi vedrà arrivare l'orologio I, a velocità minore di II. Anche se per III, che si considera in quiete, gli altri due orologi sono rallentati, ciò non implica alcuna contraddizione dd tipo che abbiamo illustrato sopra sul disaccordo dell'età tra i gemelli. Infatti, la comparazione dell'età di G e G"

78 1. Dalla relatività galileiarta alla relativi tà generale

prima di E è fatta a distanza, e fornisce dunque risultati diversi per i due rispettivi sistemi inerziali a causa ddla relatività della simultaneità. Il punto centrale è che una comparazione di età tra due gemelli in due punti successivi di una stessa linea di universo richiede o ddle accelerazioni o tre sistemi inerziali, e dunque in entrambi i casi una situazione non simmetrica, perché non ottenibile tramite un'unica trasformazione di Lorentz. In definitiva, mentre la simmetria della dilatazione temporale e della contrazione della lunghezza per due sistemi inerziali in moto reciproco non inficia la realtà del fenomeno nel senso della sua misurabilità — ma potrebbe, secondo alcune interpretazioni, inficiarla nel senso della reperibilità di un meccanismo causale che spieghi tali effetti — nel paradosso dei gemelli non c'è alcuna simmetria, ma l'effetto è ugualmente reale data la sua misurabilità, senza che con ciò sia disponibile una spiegazione

dinamica o causale del meccanismo del rallentamento degli orologi o dei processi biologici che regolano lo sviluppo dell'organismo umano. Una lezione filosofica importante da trarre dalla teoria della relatività speciale è che non tutte le spiegazioni scientifiche, per essere accettabili, devono essere in grado di esibire un meccanismo causale. Infatti, esse possono invocare ddle proprietà strutturali o g eometriche. Per il .sostanzialista, tale struttura matematica non è solo nel modello: il concetto di realtà di un fenomeno relativistico presuppone proprietà spaziotem-

porali intrinseche degli eventi che non sono riducibili al linguaggio delle interazioni causali tra eventi fisici. Un nemico del sostanzialismo replicherebbe naturalmente che la spiegazione strutturale ha a che fare solo con le proprietà postulate dal modello, isomorfe alle proprietà possedute dai dati cosi come sono modellizzati dalla sottostruttura empirica. La domanda che poniamo come spunto di riflessione finale al lettore è se un effetto fisico possa essere considerato reale anche quando l'unica spiegazione che disponiamo di esso è in termini di un modello matematico.

2.5 Un po' di matematica: vettori e tensori

Adontiamo ora la questione della massa e dell'energia in relatività speciale. Tuttavia, prima di fare questo dobbiamo necessariamente impadronirei di un po' di matematica che servirà sia per discutere questo punto della relatività speciale, sia per acquisire quegli strumenti matematici che saranno poi necessari per affrontare la relatività generale. Nella fattispecie bisogna capire bene che cosa sia un vettore e che cosa sia un tensore.

La relat ività speciale 79

Vettori e matrici Ricordiamo che un vettore P di componenti V„e Vr può essere espresso in forma matriciale sia come matrice riga, ossia come matrice 1 x 2 (1 riga e 2 colonne), [V„Vz]i sia come matrice colonna, ossia come matrice 2 x 1,

(

V„ . A questo punto giova anche ricordare che il prodotto di due matrici "

A e B, cioè C = AB, può essere fatto solo quando il numero di colonne di

A è uguale al numero di righe di B. Se a„" è il generico elemento della matrice A che sta neH'intersezione fra la i-esima riga e la j-esima colonna, e

se b,~ è il generico elemento della matriceB, allora il generico elemento deila matrice C cioè ca è dato da cs

=garbtt ossiase ,le matrici sono 2 x2,

a» a» b » b l z a»b» + a , zbzl a»blz+alzb» a„ azz b» bz z a» b» + az z b» aziblz+azzbzz Data una matrice A, la sua trasposta — indicata con A — è la matrice che si ottiene da A scambiando le righe con le colonne. Ad esempio, da

abc A= d e f g hi

adg s i o t t i eneA = b e b

cfi

La matnce idennta e la matnce che ha tutti gli e emenn nulh a eccezione

di quelli lungo la diagonale principale che sono uguali a 1. Nel caso 3-dimensionale la matrice identità è

100 010

001

Consideriamo un sistema di riferimento 3-dimensionale cartesiano ove ogni punto dello spazio è caratterizzato da tre coordinate (x, y, z) che da ora, per lavorare più compattamente, indicheremo con (x', x', x'), o, sintetizzando, con x, dove u = 1, 2, 3. Consideriamo un nuovo sistema di riferimento 3-dimensionale cartesiano di coordinate x' . Possiamo passare da un sistema all'altro grazie a delle leggi che ci dicono come le nuove coordinate si trasformano in funzione delle vecchie. Cominciamo dalle leggi di trasformazione più semplici, ovvero da quelle lineari, ossia dalle trasformazioni che portano una generica coordinata x" in una nuova coordinata x' che è data da una combinazione lineare delle coordinate

80 1. Dalla relatività galileiana alla relatività generale

di partenza. Segnatamente, se le coordinate di partenza sono (x', x, x'), le nuove coordinate, ottenute tramite una trasformazione lineare, sono x' ~ x ' = a x ' + bx '+ cx' x' ~ x' = d x ' + e x ' + fx'

e -.' =

gx'+ be+td

dove a, b, c d, e,f, g, h, i sono dei coefficienti costanti che caratterizzano il modo in cui le nuove coordinate sono funzioni lineari delle vecchie. Le tre equazioni di trasformazione viste possono essere scritte in forma matriciale come x II X

i2

x r3

abc = de f ghi

X X

1

2

x3

d a cui si vede che il vettore (x', x', x') è trasformato nel vettore (x', x' , x' ) grazie a una trasformazione che si sintetizza nella moltiplicazione del-

ab c la matrice T=

de f , dettamatricedi trasformazione, per la matrice g hi

colonna rappresentante il vettore originario. Questo significa che possiámo caratterizzare una trasformazione mediante la sua matrice. Ne segue che la generica trasformazione diventa

x. ~ x" = g i '

P

P

dove s"~ è l'elemento (eP)-esimo della matrice di trasformazioneT, Fra tutte le possibili trasformazioni lineari, per i nostri scopi sono particolarmente importanti quelle, dette ortogonali, che si ottengono ruo-

P

e fig. 16

X1

La relatività speciale 81

tando il sistema originario x in modo da ottenere un nuovo sistema di riferimento x' . Consideriamo, ad esempio, un punto p che in un sistema di riferimento 2-dimensionale abbia coordinate cartesiane (x', x ). ' In un sistema ruotato rispetto al precedente di un angolo 0, lo stesso punto ha coordinate cartesiane (x", x' ). Da una semplice analisi geometrica ddla figura 16, si vede che le nuove coordinate sono correlate con le vecchie nel seguente modo x' ~ x" = x co sB +x se n0 x' ~ x" = — x' senB+ x' cos0 che in forma matriciale diventano: x' c os 0 sen 0 x ' — sen 0 cos 0 cos 0 sen 0 dove T = — sen00 cos 00 è l a m a trice della trasformazione. Se indichiamo con T

r = cos 0 — sen 0 la matrice trasposta della matrice T, trosen 00 cos 00

viamo che T T = I, cioè che il prodotto della matrice trasposta per la matrice originaria è uguale alla matrice identità. Possiamo generalizzare e dire che le trasformazioni ortogonali sono caratterizzate dal fatto che il prodotto ddla matrice di trasformazione per la sua trasposta è la matrice identità. A questo punto, possiamo dare una definizione rigorosa di vettore come quell'ente geometrico le etti componenti si trasformano nel modo visto per una rotazione. Ossia, se in un sistema di riferimento 3-dimensionale K un ente geometrico è caratterizzato da tre componenti (indicate dalle sue coordinate cartesiane x ), esso sarà un vettore se nd passaggio a un nuovo sistema di riferimento 3-dimensionale K' sarà caratterizzato da tre nuovi componenti (indicate dalle sue nuove coordinate cartesiane) x' , tali che x 'M

x

'c x

=

P

dove t ~ è il generico elemento della matrice di trasformazione ortogonale. Possiamo generalizzare quanto detto a un numero di dimensioni maggiore di 3, ma soprattutto possiamo generalizzare il concetto di vettore. " È equivalente considerare il punto di coordinate (x, y) o il vettore che parte dall'origine e arriva in qud punto e che quindi ha componenti (x, y).

82 1.Dalla rektivitàgalileiana alla relatività generale

Supponiamo di avere un vettore di componenti x e uno di componenti yP. Essendo vettori, per una trasformazione di coordinate, essi diventeranno X

M X

-

7

X

y

P

P

P~ ~

dove z y e v s ono i generici elementi delle rispettive matrici di trasformazione. Possiamo adesso considerare il prodotto x" y'

i"v

=

x'y'

y,6

come il trasformato del prodotto x x . Questo significa che possiamo de6nire un nuovo ente matematico, che chiameremo tensore di rango due, come quell'ente che trasforma le proprie componenti come il prodotto delle componenti di due vettori. Generalizzando, possiamo interpretare il vettore x come un tensore di rango uno, mentre uno scalare come un tensore di rango zero. Un tensore di rango n, T""'", sarà quell'ente geometrico che per trasformazioni di coordinate trasforma come segue ~ z ' " ' " = g i'"'

r"

Jv Jn

Se nello spazio 3-dimensionale un vettore, ossia un tensore di rango 1, ha 3' componenti, uno scalare, ossia un tensore di rango 0, avrà 3 componenti, mentre un generico tensore di rango n avrà 3" componenti. Questo comporta che uno scalare sarà rappresentato come una matrice 1 x 1, un vettore come una matrice riga 1 x 3, o come una matrice colonna 3 x 1, mente un tensore di rango due da una matrice 3 x 3. E cosi via. Finora abbiamo considerato sistemi di riferimento, segnatamente 3-dimensionali, ove ogni punto ddlo spazio individuato era caratterizzato da 3 coordinate cartesiane, Possiamo però, nello stesso sistema di riferimento 3-dimensionale ortogonale, caratterizzare la posizione di un punto anche grazie a coordinate diverse da qudle cartesiane. In particolare, possiamo usare coordinate curvilinee come quelle cilindriche (r, 0 z), o quel-

le sferiche (r, 0 p). Esisteranno allora delle trasformazioni che permetteranno di passare da un sistema di coordinate all'altro, pur rimanendo neUo stesso sistema di riferimento. Si faccia però attenzione al fatto che un sistema di riferimento è diverso da un sistema di coordinate. Il primo è qualcosa che ha significato peculiare in relazione alle leggi di trasformazione, il secondo è una struttura matematica convenzionale che permette di individuare con nu-

La relatività speciale 83

meri reali la posizione spaziale di una particella in un dato sistema di riferimento.

p

coordinate cartesiane (x, y, z)

coordinate cilindriche

(; e, z)

(pr' P

coordinatesferiche (r, 8, rp)

fig. 17

Per cui quando parliamo di trasformazioni fra sistemi di riferimento, intendiamo qualcosa di diverso dalle trasformazioni fra sistemi di coordinate. Passare da un sistema di coordinate a un altro può semplicemente significare passare da un modo di caratterizzare un punto in un sistema di riferimento a un altro modo di caratterizzarlo sempre in quel sistema di riferimento. Ne segue che è qualcosa di puramente formale-geometrico, che può agevolare i conti. Si noti quindi che quando si parla di covarianza delle leggi della fisica non bisogna confondere la covarianza rdativamente ai sistemi di coordinate, con la covarianza rispetto ai sistemi di riferimento. La prima è qualcosa di puramente formale, la seconda ha significato fisico. Potrebbe quindi sembrare che soffermarsi sulle trasformazioni di coordinate non sia necessario. In realtà, familiarizzarci con tali trasformazioni permette di comprendere certe strutture geometriche che poi ritrovere-

mo dotate di reale significato fisico. Ritornando alle trasformazioni fra coordinate cartesiane e coordinate curvilinee, avevamo detto che ci sono delle leggi che permettono di passare dalle une alle altre, e viceversa. In particolare per passare dal sistema cilindrico a quello cartesiano le equa-

zioni di trasformazione sono (cfr. fig. 17) x= r c o s 8 y = rs en8 z = z

84 1. Dalla relatività galileiana alla relatività generale

mentre per passare da queHo sferico a quello cartesiano le equazioni di trasformazione sono x = r sen0cosy y = r sen0 seny z = r cos0

Introduciamo adesso un nuovo ente geometrico particolarmente utile per quanto stiamo dicendo, ossia la distanza fra due punti. Sappiamo che la distanza euchdea fra due punti individuati daHe coordinate cartesiane 3-dimensionali (xt, yt, zt) e (X> yz, zz) è data dal teorema di Pitagora, ossia sappiamo che è la radice quadrata di

s — (xg xt) + (yq — yt) + (zq — z>)' Se i due punti sono infinitamente vicini, allora la distanza tnfinitesima è la radice quadrata di

ps~ = gg p gy' p gP Se volessimo esprimere la distanza euclidea in coordinate cilindriche dovremmo applicare le trasformazioni viste, che differenziate danno dx = cos0 dr — r sen0 d0 dy = sen0 dr + r cos0 d0 dz =

dz

Queste, una volta sostituite nella distanza euclidea in coordinate cartesiane, permettono di trovare la distanza euclidea in coordinate cilindriche, ovvero ds = dr'+ r'á'0'+ dz' Analogamente, possiamo trovare la distanza euclidea in coordinate sferiche. In tal caso i dBerenziali delle coordinate sono dx = sen0 cosy dr + r cos0 cosrp d0 —rsen0 senqdtit dy = sen0 seny dr + r cos0 sentlt d0 + rsen0 cosydtlt dz = cos0 dr — r sen0 d0

e si ha ds' = dr'+ r ' d 0 '+ r ' s en 0drp' Se riscriviamo in modo astratto le tre distanze eudidee trovate (usando la notazione dx, con tz = 1,2,3), troviamo una formulazione che va bene per i tre casi, ossia

ds' = (h')'(dx')'+ (h')'(dx')'+ (h') (dÃ')' dove h, con n = 1, 2, 3, è un fattore moltiplicativo che assume valori diversi a seconda del tipo di coordinate con cui si sta lavorando. Infatti, nel caso cartesiano h' = h' = h~ = 1 (e x' = x, x' = y, x' = z); nel caso cilindrico h' = h = 1, h = r (e x' = r, x' = 0 x' = z); nel caso sferico h' = 1, h = r, h = rsen0(ex' = r, x '= 0 , x ' = q ). Come si vede, sia nel.caso cartesiano che in quello curvilineo (cilindrico o sferico) non ci sono termini misti del tipo dx dx~, con ot c P, ma

La relatività speciale 85

solo termini del tipo (dx ) . Vi possono però essere trasformazioni arbitrarie che portano a coordinate tali che nella distanza infinitesima compaiano termini misti, e quindi anche i relativi fattori moltiplicativi. Ossia, per un generico sistema di coordinate si ha

ás' = g" (dx')'+ "dx'dx'+ g"dx'dx' + g áx'áx'+ g '(dx')'+ g"dx'dx' y g31dx3dx1 y g32dx3dx2 y g33(dx3)2

Che possiamo scrivere come Il

12

13

d'

g g 21 22 23 s2 = dx1 dx2dx3 dx g g g 31 3 2 33 dx' g g Nel caso dei tre sistemi di coordinate considerati prima (cartesiano, ci-

lindrico e sferico)

gap

JO quando tz ~P

) $ quando ot P

dove h si particolarizza come visto in funzione del particolare tipo di coordinate preso in esame. Scopriremo che il g"~ ci permetterà di capire molto di più, nella fattispecie quale sia la geometria che si sta adottando. Continuiamo però a studiare il caso di coordinate curvilinee, visto che tornerà utile più tardi per capire certi aspetti del formalismo deHa relatività generale. Abbiamo detto che per passare dalle coordinate cilindriche a quelle cartesiane esiste un insieme di tre equazioni di trasformazioni che, opportunamente differenziate, permettono di trovare la distanza infinitesima euciidea in coordinate cartesiane, a partire dalla distanza infinitesima euclidea espressa in coordinate curvilinee. Nel caso cilindrico, abbiamo cioè visto che dx = cos8 dr —r sen8 d8 dy = sen8 dr + r cos8 d8 dz =

dz

In forma matriciale possiamo scrivere quanto sopra come

dx dy

dz dove T

=

cos8 —rsen8 0 dr sen 8 r cos8 0 d8 0 0 1 dz

cos8 —rsen8 0 sen 8 rc os 8 0 è la matrice della trasformazione. Se si fa 0 0 1

86 1.Dallarelatività galileiana alla relatività generale

attenzione, si nota che ogni elemento H di questa matrice è ottenuto differenziando la a-esima nuova coordinata rispetto alla P-esima vecchia coordinata, cioè t a

=

ox

. Allora, il passaggio a coordinate generiche

axp può essere scritto come

dx' dx' dx'

B x Bx

Bx

Ox O x

Bx

8X B x

Bx

B x' Bx' d x ' B x' Bx' d x ' Ox

8X

dove la matrice deUa trasformazione J-

dx' dx' dx'

Ox

Bx B x

ox

Bx B x Bx o x

ox Bx

Bx

Ox

Ox

Bx

Ox

Ox

Bx

oX

Ox

è una parti-

colare matrice il cui determinante si chiama loj ambtano della trasformazione ed è tale da caratterizzare localmente la trasformazione. Ne segue che il generico vettore si trasforma come segue + m„ = 3,3471 x 10 gr, mentre la massa dd nucleo del deuterio e mà = 3,3433 x 10" gr. Questo significa che vi è una dilferenza di massa pari a d,m = 0,0038 x 10 g r che si è trasformata in energia, detta energia di legame. Questa è l'energia che si libera dalla loro fusione, oppure l'energia che bisognerebbe spendere per decomporli nuovamente. Prima di concludere la riflessione su questa nuova idea di massa, vediamo alcune conseguenze notevoli. I conseguenza. Tenendo conto che E = myc', possiamo scrivere p = myv" come (equazione2)

ornop

P

Ev C

Supponiamo ora di considerare una particella che si muove con velocità c. Da quest'ultima equazione segue allora che E = pc. Se sostituiamo questa nell'equazione 1, troviamo che 0 = m c, da cui m = 0. Ne segue che ogni corpo che si muove a velocità della luce deve avere mas-

sa nulla. D'altro canto, se invece abbiamo un corpo di massa non nulla, dalle equazioni 1 e 2 si ricava che è impossibile che si possa muovere a velo-

Non stiamo considerando le interazioni materia-antimateria.

98 1. Dalla relatività galileiana alla relatività generale

cità pari a quella della luce. Infatti, sostituendo l'equazione 2 nella 1; trovlalT10

2

2 Ev

E2

=mc

2

c

2

V 1 -—

c

E

2

mc

2

2 4

= m c

2 2

2

1- v c2 -

da cui si vede che se avessimo v = c, allora l'energia diventerebbe in6nita (il denominatore nel secondo membro dell'ultima espressione tende-

rebbe a zero e la frazione tenderebbe a infinito). Ma è impossibile che l'energia (e quindi la quantità di moto) tenda a infiruto e quindi è impossibile che una particella massiva si muova a velocità della luce. II conseguenza. Abbiamo due energie: E = myc2

Ep — - mc2 dove la seconda è l'energia a riposo, mentre la prima è l'energia totale. Definiamo l'energia cinetica di una particdla come la differenza fra le due, ovvero 2 2 2 K = E — Ep = m@c — mc

= mc (y — 1)

Il motivo dell'attribuzione di questo nome è presto intuito non appena ci riduciamo al caso dassico. Infatti, se la sviluppiamo in serie, tenendo conto che V0

fig. 23

Il piano, la superficie a sella e la superficie sferica sono esempi paradigmatici di figure appartenenti, rispettivamente, alla geometria euclidea

(o piana), alla geometria non-eudidea di Lobachevski-Bolyai (o geometria iperbolica) e alla geometria non-eudidea di Riemann (o geometria ellittica). Si faccia attenzione a non confondere quest'ultimo tipo di geometria non-eudidea con la geometria riemanniana, sempre non-euclidea, dello spaziotempo della relatività generale. Nel caso della sfera, come d'altronde nel caso della superficie a sella e del piano, abbiamo a che fare con geometrie in cui la curvatura è costante. Invece nel caso ddlo spaziotempo della relatività generale, la curvatura varia da punto a punto, ossia abbiamo a che fare con una geometria non-euclidea a curvatura va-

riabile.

118 1.Dallarelatività galileiana alla relatività generale

Ritorniamo alla definizione intrinseca di curvatura. Abbiamo visto che cosa accade nel caso 2-dimensionale, Il caso 4-dimensionale può essere facilmente ottenuto per estensione. Abbiamo però bisogno di un ente matematico più complesso che ci dia tutte le informazioni che ci servono. Questo ente è un tensore di rango 4, R„pt, detto tensore di curvatura, o tensore di Riemann. Notiamo un fatto estremamente importante. Mentre negli esempi che abbiamo fatto la curvatura è puramente spaziale, la curvatura nel casodella rektività generale è una curvatura dello spaziotempo e non, come erroneamente molti intendono, del' spazio solo. È l'intero continuo spaziotemporale che si incurva in un dato modo a causa di una data distribuzione di materia-energia e non solo lo spazio. Ed è proprio conoscendo la forma esplicita del tensore g„- che conosciamo quale sia questo incurvamento.

3.6 La connessione affine Per formalizzare quanto detto finora, abbiamo bisogno di un altro concetto, ossia di quello di connessione fafine e quindi abbiamo bisogno di arricchire ulteriormente la nostra geometria trasformandola in una geometria affine. Si noti che, in realtà, avremmo già potuto introdurre la connessione affine, nella fattispecie prima di aver introdotto la metrica perché, come si vedrà meglio nel seguito, uno spazio affine è meno ricco di uno spazio metrico, cioè una geometria affine non è una geometria metrica, mentre una geometria metrica è una geometria affine. Per cominciare a inoltrarci in questa geometria, cominciamo a vedere che cosa vuoi dire differenziare e derivare nello spaziotempo della relatività generale. Data una funzione scalare delle coordinate p = p(x'), sappiamo che l'usuale 4-derivata totale rispetto alle coordinate — che possiamo sinteticamente indicare con p; — è Bx Bx Bx ox Bx Ovviamente, questo modo sintetico di indicare l'usuale derivata può essere esteso alla derivata di un vettore covariante (u;, I

tore contravariante (u',, =

dx'

=

~ui

'. ), di un vet-

Bx ), e di un tensore di qualunque rango e di

qualunque tipo. Il problema che ci si pone ora è: questo modo di deri-

La relativitd generale 119

vare, che vale all'interno della fisica classica e della relatività speciale, vale anche per la relatività generale? O, meglio: sappiamo che l'usuale derivata di un vettore, o di un tensore, è covariante per trasformazioni di Lorentz; ma è anche covariante per trasformazioni arbitrarie? Consideriamo l'usuale derivata di un vettore covariante, ossia u,,; Dal momento che ci sono 2 indici in pedice, la possiamo considerare come un tensore covariante di rango 2. Sappiamo come in relatività generale trasforma un tensore covariante di rango 2 per una generica trasformazione di coordinate (x'j ~ (x"j. Infatti, il tensore A„-, per una generica trasformazione di coordinate, diventa BX Bx ,k

Ne segue che se l'usuale 4-derivata dd 4-vettore covariante, ossia u,~, fosse un tensore, allora dovrebbe trasformarsi nel modo appena visto. In realtà, per una generica trasformazione di coordinate, si ha

Bx Bx

8 X

Bx Bx t9X Bx Questo accade perché in relatività generale la generica trasformazione di coordinate non è più una trasformazione lineare, ossia le nuove coordinate non sono più una funzione lineare delle vecchie. Se lo fossero, si avrebbe che

8X

= () e quindi dfettivamente l usuale derivata di un

o)x o)x

vettore trasformerebbe come un tensore di rango 2. Perciò nel caso di trasformazioni lineari, come quelle di Lorentz della relatività speciale, effettivamente l'usuale operazione di derivazione è un'operazione covariante, ossia un'operazione che mantiene la sua forma rispetto ai vari sistemi di riferimento. Ma, a causa della non linearità delle generiche trasformazioni che si hanno in rdatività generale, qui si perde la covarianza dell'usuale operazione di derivazione. E questo è un problema serio, in quanto anche qui necessitiamo di un'operazione di derivazione. L'unica cosa da fare è definire una nuova operazione tale da essere covariante per una generica trasformazione di coordinate. Questo è ottenuto definendo una nuova operazione di derivazione covariante,che sinteticamente indichiamo con u;~; data da: u ;.j = u

j

k I ji uk

La virgola (uar) è il segno per la 4-derivata usuale. Il punto e virgola (u@) è il segno per la 4-derivata covariante.

120 1.Dallarelatività galileiana alla relatività generale

dove u,~ è la usuale derivata del vettore u,; mentre I ~ è un nuovo ente che ha 4~= 64componenti eche sichiama connession~eaffine. Dunque, grazie all'introduzione deva connessione affine possiamo trovare una nuova derivata che è effettivamente covariante come desideravamo. Questo significa che la connessione affine, per una generica trasformazione di coordinate, si trasforma in modo da far si che la nuova operazione di derivazione sia covariante per la stessa generica trasformazione, ossia essa deve essere tale che effettivamente la nuova operazione di derivazione porti a un tensore di rango 2. Già quest'osservazione induce a pensare che la connessione affine non possa essere un tensore di rango 3. Infatti, la connessione affine si trasforma come segue 8X B X

BX

Bx Bx Bx dove il termine

Bx

BX

, Bx Bx Bx

t

8X

8 X

Bx Bx Bx

impedisce che essa si trasformi come un

tensore di rango 3. Vi è da dire che se un tensore è nullo in un sistema di coordinate allora, per via della sua covarianza, è nullo in ogni altro sistema di coordinate. Visto che la connessione affine non è un tensore, essa può essere nuUa in un sistema e non nulla in altri sistemi. Questo è molto importante perché, data la connessione affine in un certo sistema di coordinate, è sempre possibile trovare una trasformazione che porta a un particolare sistema di coordinate in cui la connessione affine è nulla in un punto. Ne segue che in questo particolare sistema, la derivata covariante è uguale all'usuale derivata, cioè, in questo sistema, u,~= u~. ovvero, in questo sistema, in ttn punto, vale la relatività speciale, D'altronde questo non dovrebbe sorprenderci perché sappiamo che, in base al principio d'equivalenza, la relatività generale deve ridursi localmente alla rdatività speciale e la proprietà appena vista della connessione affine non fa altro che ribadire questa basilare condizione fisica, che diventa cosi anche una condizione strutturale. D'altronde, il fatto che l'usuale derivata non possa essere covariante in relatività generale è intimamente connesso con la definizione stessa di derivazione. Sappiamo infatti che la derivata, ad esempio la derivata di un vettore contravariante tt', è definita come u'. = lim

u'(xi+ Wi) — u'(X')

Ér'-+0

dove u'(X' + Ax') e ut(x') sono due vettori definiti in due punti diversi distanti hx'. Mentre classicamente e in relatività speciale è possibile con-

La relatività generale 121

frontare due vettori definiti in punti diversi, in relatività generale non lo è più per via del fatto che qui vettori definiti in punti diversi si trasformano in modo diverso. Infatti, da un lato, i coefficienti delle trasformazioni, ossia

Bx

, sono funzioni non lineari deHe coordinate, dall'altro la-

&x to, in punti diversi il campo gravitazionale comporta una diversa struttura dello spaziotempo. Però, qualunque sia il tipo di derivata con cui abbiamo a che fare, vogliamo poter confrontare due vettori definiti in punti diversi, dal momento che la derivata è il limite di un rapporto incrementale al cui numeratore sono confrontati due vettori vicini. Ora, sia p un punto della nostra varietà, sia p' un punto vicino e sia g la curva su cui giacciono i due punti. In p sia definito il vettore tt'(p), la cui determinazione in p' è tt'(p'). Per quanto abbiamo detto, non possiamo confrontare direttamente tt'(p) e u'(p'). Però in p' possiamo costruire un nuovo vettore u "(p) avente le stesse caratteristiche di tt'(p). Per farlo necessitiamo della nozione di trasporto parallelo; infatti, intuitivamente, possiamo ottenere il nuovo vettore trasportando parallelamente fino a p', e lungo la curva y; il vettore definito in p, ossia avendo cura che la sua direzione non cambi. Ed è proprio per rendere rigoroso questo concetto che introduciamo quel nuovo ente che è la connessione affine. Consideriamo ora un vettore tt' definito in un punto p di una curva differenziabile. Sia inoltre u' tangente a tale curva in p. Cominciamo a trasportarlo parallelamente a se stesso fino a p', infinitamente vicino a p. Poi da p' lo trasportiamo paralldamente a se stesso in p", infinitamente vicino a p'. E cosi via. Essendo il vettore tt', per costruzione, sempre tangente alla curva, esso può essere pensato come la 4-velocità di un corpo in caduta libera, ossia di un corpo che è in moto nello spaziotempo della relatività generale senza essere soggetto a nessuna forza esterna, In tal caso la curva è proprio la geodetica. Inoltre, se s è il parametro della curva appena costruita, allora la 4-vdocità è tt' = dx'/ds.

fig. 24

Classicamente sappiamo che il moto inerziale è caratterizzato da velocità costante, il che comporta che la derivata della vdocità, cioè l'accderazione, sia nulla (dv/dt = 0 ). Visto che, in relatività generale, l'analogo del moto inerziale classico è dato dal moto di caduta libera, allora que-

122 1.D allarelatività galileiana alla relatività generale

sto sarà caratterizzato dall'avere 4-velocità nulla (per cui anche il differenziale totale dd vettore 4-velocità sarà nullo). Tuttavia, abbiamo visto che non possiamo continuare a usare l'usuale derivata, ma dobbiamo usare la nuova derivata covariante in cui compare la connessione affine. Per gli stessi motivi, non possiamo nemmeno continuare a lavorare con l'usuale differenziale, ma dobbiamo definire una nuova operazione di differenziazione in modo tale che sia covariante. Anche in questo caso ricaviamo la differenziazione covariante grazie alla connessione affine, ossia definiamo il differenziale covariante di un vettore contravariante u' come dut = d e + r;,ed/ dove du' è l'usuale differenziazione di un vettore contravariante u'. Nel nostro caso, u' è la 4-velocità ddla particella in caduta libera, allora — per quanto detto sopra — il suo differenziale covaòante sarà nullo, ossia, du' = 0, cioè du' + I ',t,u'dx = 0. Dividendo entrambi gli addendi per ds, e tenendo conto che u' =

. du'

ds —

(quindi,

=

ds +I

d'x'

), si ha

'~ ds ds

che è l'equazione della geodetica che cercavamo. Poiché è sempre possibile trovare un sistema di coordinate in cui la connessione affine si annulla, in questo sistema l'equazione della geodetica diventa d'xa

ds' che è la classica equazione della retta, ossia ddla traiettoria percorsa da un corpo in moto inerziale in relatività speciale. Nuovamente, dunque, compare il principio d'equivalenza. Abbiamo detto che per poter arrivare al concetto di geodetica dobbiamo prima avere quello di connessione affine. Introdurre questa nozione nella nostra varietà r-volte differenziabile comporta dotarla di nuove proprietà e quindi trasformarla in una struttura geometrica più ricca, ossia in una geometria affine. Però sappiamo anche che la nostra varietà differenziabile è uno spazio metrico. Bisogna quindi cercare una relazione fra la connessione affine e la metrica, ossia fra la connessione affine e l'ente responsabile della forma della metrica, cioè il g„; Oltre tutto, questo è pure necessario dal momento che non ci basta che un vettore sia trasportato parallelamente, ma vogliamo che durante il trasporto sia anche con-

La relatività generale 123

servata la sua lunghezza, ossia che sia conservato il prodotto scalare del vettore per se stesso. Ne segue che sebbene sia possibile introdurre la connessione affine, e quindi la geodetica, senza introdurre la metricaossia possiamo avere una geometria affine senza avere una geometria metrica — non appena cominciamo a parlare di invarianza della lunghezza di un vettore durante il suo trasporto parallelo e di linea più breve fra due punti del continuo spaziotemporale — come deve essere la geodetica per generalizzare la retta della relatività speciale — dobbiamo farlo. Ebbene, imponendo le condizioni appena menzionate, si trova che i

g il

a, +a , —a~,

La connessione affine scritta in questo modo si chiama simbok di Chri-

stoffel di II ordine e si indica con I j'.k = j > $ . Per cui ora la geodetica, tenendo conto che la connessione affine si può scrivere in funzione del tensore metrico, diventa

d'x'

ds'

+

j > ds d s

Prendiamo ora una traiettoria chiusa nel continuo spaziotemporale e, a partire da un suo punto p percorriamola tutta trasportando parallellamente a se stesso il vettore u'. Questo è un passo importante perché se lo spaziotempo è curvo il vettore trasportato parallelamente a se stesso non tornerà in p con la stessa orientazione di partenza ma risulterà ruotato di un angolo 0.

fig. 25

Sia u" è il vettore arrivato in p dopo aver percorso l'intera traiettoria chiusa, allora l'eventuale variazione fra il vettore iniziale e quello finale è data da Au' = u" -u '. Se d,u' = 0, allora l'orientazione non è cambiata e lo spaziotempo è piat-

124 1. Dalla relatività galileiana alla relatività generale

to, altrimenti lo spaziotempo è curvo. Si dimostra che questa variazione è uguale a a ' = — 'R'. '

kd'

jkl P

dove R',kt è un tensore di rango 4 che abbiamo già incontrato e che abbiamo chiamato tensore di curvatura, o tensore di Riemann. Esso è definito da R'„ = r'.„- r' .„ + l' , 1 1 — r',r-., Ricordando che la connessione affine è funzione delle derivate prime di g„", si ha che il tensore di curvatura appena esplicitato è una funzione delle derivate prime e seconde di g„; fatto che diventerà molto importante quando dovremo cercare le equazioni di campo. Dal momento che R',~t è il tensore che contiene informazioni sulla cur— 0, cioè se Aut = 0, il vettore è trasportato parallelamenvatura, se R',kt te lungo la traiettoria chiusa senza cambiare orientazione e quindi lo spaziotempo è piatto. Dal tensore di curvatura R„kt, è possibile ottenere due tensori molto importanti:

1. il tensore di Ricci (Rjt), che si ottiene attraverso una contrazione di

due indici:

ik k Rjt = g Rj ikt = R j k i

2. la curvatura scalare (R), che si ottiene contraendo i rimanenti due in-

dici: R = g"Ri = R't Quindi dotare la varietà r-volte differenziabile di una connessione aáine ha permesso di 1. definire una nuova operazione di derivazione covariante; 2. trovare l'equazione del moto di un corpo in caduta libera; 3. definire rigorosamente il concetto di curvatura intrinseca.

3.7 Il tensore energia-impulso Supponiamo di avere un fluido composto di particelle non interagenti di massa trt e velocità v. Possiamo essere interessati a sapere quante particelle si stanno muovendo in una certa direzione in un dato tempo, ossia quante sono le particdle che stanno attraversando una certa superficie Z ndl'unità di tempo. L'ente fisico che ci dà questa informazione è il flusso 4. Consideriamo un'area infinitesima dZ. Nel tempo t, per questa su-

La relat ivit à generale 125

perficie passeranno tutte quelle particelle che sono contenute in un cilindro di base dg di lunghezza vt e di volume tv. nd', dove n è il versore

normale alla superficie. f I f I I I

fig. 26

Se la densità di particelle, cioè il numero di particelle per unità di volume, è N, allora il numero di particelle che passa nell'unità di tempo per

la superficie dZ è dato dalla densità di particelle (N) moltiplicata per il volume (tv nd') e divisa per il tempo (t), ossia Nv ndZ Per cui ù flusso totale che passa per l'intera superficie che stiamo considerando è Nv ndZ E

Consideriamo ora una superficie Z racchiudente il volume x e immersa nel fluido di particelle. In questo caso abbiamo un flusso entrante e un flusso uscente. Nel caso più generale, può accadere che il numero di particelle entranti sia maggiore di quelle uscenti, o viceversa. Ovviamente, la differenza fra il flusso entrante e quello uscente è eguale alla variazione del numero di particelle dentro il volume h (ossia

dN

, doveN è il

dt numero di particdle). Per cui la diminuzione di particelle dentro il volume h è

N

"dZ

dt Dal teorema deHa divergenza, che abbiamo già incontrato, sappiamo che Nv.ndZ =

divNvdh

E

Inoltre ricordandoci che il numero di particelle è N =

N dh, si ha

126 1. Dalla relatività galileiana alla relatività generale

dN

d

dt

dt

N dh =

d i vN v dh

da cui dN

= divN v dt Visto che N v = j può essere interpretato come una corrente di particd-

le, allora abbiamo

dN

div j+

=0

dt che è la cosiddetta equazione di continuità, che non solo ci informa sul fatto che la divergenza è correlata con un Qusso, ma statuisce un principio di conservazione, in questo caso il principio di conservazione del numero di particelle. Si faccia bene attenzione a questa equazione in quanto sancisce qualcosa di assolutamente generale perché nello stesso modo possiamo trattare flussi di cariche, di masse, di calore, di energie, ecc.; e ogniqualvolta la corrente di un ente fisicoè cosicorrelata con k sua densità, allora in gioco vi è anche un principio di conservazione. L'equazione di continuità cosi scritta non può essere pedissequamente trasformata in forma relativisticamente covariante perché N non è la componente temporale di un 4-vettore. Se lo fosse potremmo introdurre un 4-vettore A' = (A, A") = (cN,g ). Allora

dN

d' N

BA'

ax'

8 A

= BA' B

ax'

A'

BA '

BA '

ax' ax' ax'

BA ' = A'

m axi

da cui avremmo che A '. = 0 ii

ossia avremmo ottenuto l'equazione di continuità in relatività speciale e che formalmente rappresenterebbe l'annullarsi della 4-divergenza di un 4-vettore. Ma, come detto, questo non è possibile perchè N non è la componente temporale di un 4-vettore quanto la componente Teti diun tensore di rango 2. Dobbiamo allora introdurre un tensore estremamente importante in relatività generale, ossia il tensore della materia-energia, o tensore energia-impulso. Supponiamo di avere un continuo in moto nello spaziotempo e per

Si noti che con 8„A" si indica la divergenza delle componenti spaziali del 4-vettore A'.

La relat ività generale 127

semplicità pensiamolo come a un fluido costituito di particelle aventi una certa massa e una certa quantità di moto. Però, in questo caso, massa e quantità di moto sono insufficienti a descrivere il fluido in quanto serve anche qualcosa che renda conto delle pressioni interne, che sono collegate alle masse delle varie particdle e alle loro quantità di moto. Lente che contiene tutte le informazioni di cui abbiamo bisogno è proprio il tensore della materia-energia, o tensore energia-impulso. Sia T„"questo tensore di rango 2. Allora esso ha 4 componenti e la sua rappresentaTpp Tpi Tpg Tp3

zione matriciale è T„

=

Tip Tii T i z T j 3

. Le varie componenti dd ten-

Tzp Tzy Tzz Tg3 T3p T3i T3z T33

sore hanno ovviamente significato fisico diverso. Ad esempio, nd caso di un fluido composto di particelle, si ha che 1. la componente tempo-tempo T„ è la densità di massa-energia; 2. la componente tempo spazio T,~ è il flusso di energia attraverso la superficie x ; 3. la componente spazio-tempo T~, è la densità di quantità di moto; 4. la componente spazio-spazio T~j3è il flusso dell'n-esima componente della quantità di moto attraverso la superficie x~. Si può dimostrare che il tensore della materia-energia, ha due proprietà: 1. 0 simmetrico, cioè Tj T j ' Questo lo si Può vedere molto facilmente per le componenti tempo-spazio ricordando l'equivalenza fra massa ed energia. Infatti: T, = flusso di energia = densità di energia per velocità con cui fluisce = densità di massa per velocità con cui fluisce = densità di quantità di moto = T ,.

2. Ha la 4-divergenza è nulla, ossiaTj' '

0 Il che altro non è che un'estensione ddl'equazione di continuità e quindi ne segue che delle quantità sono conservate, come sappiamo accade per il 4-impulso. In pratica il tensore ddla materia-energia è una fonte importante di informazioni in quanto descrive tutto ciò che interessa conoscere su un determinato ente fisico che può generare campo gravitazionale. Infatti, il tensore della materia-energia altro non è che l'ente che descrive la sorgente del campo. Però sappiamo che il campo gravitazionale può essere generato non solo da una particolare distribuzione di materia, e ogni particolare distribuzione di materia avrà il suo particolare T„" che la descrive, ma anche da distribuzioni di energia, come lo possono essere i campi elettromagnetici. Questo significa che anche le distribuzioni di energia

128 1. Dalla relatività galileianaalla relatività generale

sono descritte da un tensore energia-impulso avente le due proprietà menzionate.

3.8 Leequazioni dicampo A questo punto abbiamo veramente tutto ciò che ci serve per poter scrivere le equazioni einsteiniane per il campo gravitazionale. Innanzi tutto,

sappiamo che le equazioni di campo dassiche soddisfano l'equazione di Poisson di cui abbiamo già parlato e che nel caso gravitazionale è data

da V '4 = 4 z G p dove p è la densità di materia e 4 = - G — r

2

è i l p otenziale del campo

gravitazionale. Per cui dobbiamo cercare un'espressione che al grimo membro contenga deHe derivate seconde del potenziale di campo e al secondo la sorgente del campo. Ora il potenziale del campo è proprio dato dal tensore metrico g„", per cui dobbiamo trovare un'espressione che contenga le derivate seconde di g„; Sappiamo che il tensore di curvatura soddisfa questo requisito. Per cui l'espressione al primo membro è una funzione di questo tensore, cioè f(R„~t). Al secondo membro ci deve essere un ente che descrive la sorgente del campo, che ovviamente non può più essere uno scalare come nel caso newtoniano. Abbiamo già quello che ci serve, ossia il tensore della materia-energia, o tensore energia-impulso, T„". Per cui le equazioni dd campo gravitazionale saranno del tipo

f(R„g)l= kT„ dove k è una costante da determinarsi in modo che le equazioni relativistiche diano le equazioni newtoniane in situazione di campo debole, ossia che esse riescano a rendere conto del comportamento dei pianeti del sistema solare, ovvero del moto dei corpi in un campo gravitazionale debole, qual è quello dovuto al Sole. In base a questa considerazione si trova che k

=

8tr G 4 C

Però come deve essere la funzione del tensore di curvatura, oltre da

Si ricordi che l'esplicitazione del laplaciano è V' =

à' àx

+

à'

Q

+

à' àl

La relatività generale 129

permettere che le equazioni si riducano a quelle classiche in situazione di campo debole e oltre a essere lineare nelle derivate seconde del potenziale, cioè di g„? Ebbene, deve soddisfare altre tre proprietà: 1.deve essere un tensore di rango 2 perché al secondo membro abbiamo un tensore di rango 2, ossia deve essere del tipo G j f(Rj>pt) > 2.deve essere simmetrica per uno scambio di indici perché è simmetrico il tensore al secondo membro, ossia G j = G,,; 3.deve avere la 4-divergenza covariante nulla perché la generalizzazione alla relatività generale dell'annullarsi della 4-divergenza del tensore energia-impulso è che T',.;= 0; ossia deve essereGj ' 0 . In base a tutto ciò si trova che le equazioni einsteiniane per il campo gravitazionale sono Rj < ~gj >R kTj< dove G„" = R„" — ~g„"R, dove R„- è il tensore di Ricci e R è la curvatura scalare. Abbiamo cosi ottenuto 10 equazioni che ci danno la forma esplicità del tensore metrico g„-, cioè la struttura dello spaziotempo, una volta nota la distribuzione di massa-energia descritta da T„". Per concludere, vi è da notare che sebbene le equazioni siano 16 (g„" ha 4 = 16 componenti e quindi ci sono 16 equazioni in 16 incognite), in realtà, per via delle proprietà di simmetria dei tensori coinvolti, di equazioni indipendenti ve ne sono solo 10. Inoltre, sebbene le equazioni siano lineari rispetto aUe derivate seconde del tensore metrico, non sono per nulla lineari rispetto al campo.

3.9.II principio di Mach Nel 1918, in un articolo apparso negli "Annalen der Physik" e intitolato I principi della relatività generale, A. Einstein elenca i tre assunti della sua teoria della gravitazione. I primi due, ossia il principio di generale covarianza e il principio di equivalenza, li abbiamo già incontrati, ci resta da affrontare il terzo, ovvero quello che Einstein chiama principio di Mach in onore del fisico-filosofo austriaco che per primo aveva sostenuto — usando il linguaggio einsteiniano — che l'origine dellinerzia è la gravitazione. Mentre i primi due principi non sono nel complesso controversi, molto si discute, o, meglio, si è discusso, relativamente al corretto significato del terzo. A nostro avviso, per cercare di trovarne un'interpretazione soddisfacente bisogna tornare non solo alle critiche di Mach ai concetti assoluti newtoniani, ma anche alla sua concezione della ricerca scientifica. Come è ben noto, nei Principi matematici della filosofia della natura, Newton introduce due concetti di spazio e tempo: da una parte, lo spa-

130 1.D alk relatività galileiana alla relatività generale

zio assoluto e il tempo assoluto che, rispettivamente, paragona con il sensorio di Dio e con la sua durata sempiterna, dall'altra, lo spazio relativo e il tempo rdativo. Mentre i primi sono enti veri e matematici, i secondi sono enti che sebbene siano usati quotidianamente dal filosofo della natura nel suo lavoro, non indicano altro che il semplice risultato di una misura. Sono due enti introdotti nella filosofia della natura solo per scopi pratici, e che quindi non hanno reale valore, a differenza dei primi due che invece hanno un reale fondamento ontologico, oltre che una valenza teologica. Se i veri concetti di tempo e spazio sono quelli assoluti, significa che i processi fisici newtoniani avvengono in una sorta di enorme stanza le cui pareti sono identificate dai tre assi del sistema di riferimento assoluto e il cui evolversi è inesorabilmente segnato dal tempo di un orologio universale e assoluto. Per dare anche significato empirico a questa sostanzializzazione di spazio e tempo, Newton, all'interno dei Pnncipt', propone degli argomenti volti a evidenziare come sia possibile rivelare sperimentalmente l'effettiva esistenza dei due enti assoluti. Limitatamente allo spazio assoluto — che ha a che fare con l'argomento che stiamo trattando —, Newton sottolinea che potrebbe essere evidenziato empiricamente rivelando o le sue proprietà, o le sue cause, o i suoi effetti, In realtà, evidenziarne le proprietà è impresa impossibile in quanto bisognerebbe evidenziare l'assolutezza del moto, o della quiete, del corpo che si sta osservando. Ma per fare questo bisognerebbe sapere già qual è il sistema di riferimento assoluto. E qui il problema si riproporrebbe. D'altro canto non è nemmeno possibile rivdare le cause assolute di un moto assoluto. Per fare questo bisognerebbe capire quando una forza è effettivamente impressa a un corpo in moto assoluto o in quiete assoluta. Rimane la terza possibilità, ossia quella di rivelare effetti assoluti. Questi infatti permettono di evidenziare moti assoluti, quindi il sistema di riferimento assoluto e perciò lo spazio assoluto. A tal fine, Newton propone due esperimenti mentali: quello del secchio rotante e quello delle due sfere rotanti. In entrambi i casi si tratta di esperimenti mentali atti a mettere in evidenza effetti centrifughi, che per Newton sono rivelatori di un asse assoluto e quindi di uno spazio assoluto. Nel caso del primo esperimento mentale, vi è un secchio pieno d'acqua appeso a una corda. Si ruota il secchio fino a completa torsione ddla corda e poi lo si lascia. Il secchio ruoterà ora in senso opposto e a causa di questa rotazione l'acqua dentro di esso si abbasserà al centro e si innalzerà alle pareti. In tal modo si evidenzia un asse privilegiato che Newton identifica con l'asse assoluto. Analogamente, nel caso ddle due sfere

La relatività generale 131

legate fra di loro da una corda e ruotanti attorno al centro di gravità comune, vi sarà un allontanamento centrifugo delle sfere che sarà evidenziato dall'aumento della tensione della corda che le tiene unite. Anche in questo caso vi è un asse privilegiato che Newton identifica con l'asse assoluto. Mach, nel 1883, in La meccanica nel suo sviluppo storico-critico, sottopone a dura critica gli esperimenti e le condusioni di Newton. Secondo Mach, Newton avrebbe ragione se, ad esempio nel caso del secchio ruotante, si facesse ruotare la totalità ddle masse dei corpi celesti, se si tenesse fermo il secchio e se in questo caso non vi fossero effetti centrifughi. Ma, continua Mach, questo è impossibile, come pure è impossibile che lo stesso universo si comporti in due modi diversi. Ovvero, è impos-

sibile che 1. vi sia un universo in cui i corpi celesti ruotano, il secchio stia fermo e non siano presenti effetti centrifughi; 2. vi sia un universo in cui i corpi celesti non ruotano, il secchio ruoti e gli effetti centrifughi siano presenti. D'altronde, sottolinea Mach, è impossibile dirimere empiricamente la questione, dal momento che è impossibile fare un esperimento in cui si fa ruotare la totalità dei corpi celesti. Però l'universo è unico, e considerato che nel secondo caso vi sono effetti centrifughi, questi vi devono essere anche nel primo caso. Ne segue che l'allontanamento dall'asse non è un effetto assoluto, ma un effetto relativo ai corpi celesti, o, più precisamente, alla distribuzione delle loro masse e delle loro accelerazioni. Dunque, non esiste alcuno spazio assoluto, né alcun effetto assoluto, ma effetti inerziali che devono essere interpretati come dovuti alla gravitazione, ossia alla presenza della totalità delle masse dei corpi celesti e ai loro stati di moto. Vi è comunque da sottolineare che gli esperimenti mentali di Newton sono pensati in un mondo assolutamente vuoto a eccezione del secchio ruotante o delle due sfere ruotanti. Invece i contro-esperimenti mentali di Mach sono pensati in un universo pieno di materia. A dire il vero, Newton, almeno relativamente all'esperimento delle due sfere, si chiede se gli stessi effetti assoluti possano essere presenti anche in un universo pieno di materia. La sua conclusione è positiva. E si chiede addiritturra che cosa accadrebbe se a ruotare fossero le stelle lontane e se le due sfere rimanessero ferme. E qui conclude che nulla avverrebbe. Quindi Newton considera anche il controcaso su cui due secoli più tardi ragionerà Mach, giungendo però a condusioni opposte. Newton è perfettamente legittimato a voler considerare un modello di universo completamente vuoto in cui agisce un certo meccanismo Einzio.

132 1.Dallarelatività gali/ciana alla relatività generale

naie. Questa è una prassi consolidata fra i fisici di ogni epoca: dal piano inclinato di Galilei, all'esperimento delle due fenditure in meccanica quantistica, sempre si è lavorato con modeHi semplificati dell'universo. Al contrario, Mach è convinto che in fisica si deve sempre tener conto di tutto ciò che c'è nel mondo reale. Malgrado questo però, egli non riesce a dare un motivo valido per cui l'uso dei modelli semplificati di cui sopra debba essere considerato privo di significato fisico (su questo pro-

blema, cfr. Boniolo, 1997). D'altro canto, la posizione di Newton, secondo cui si attribuisce valore ontologico al sistema di riferimento privilegiato che si evidenzia nel caso del secchio ruotante e in quello delle sfere ruotanti, appare difficilmente giustificabile. Il sistema di cui Newton parla è un sistema di riferimento privilegiato solo per il modo in cui è stato costruito, e non per qualche altro motivo. Attribuirgli valore ontologico sembra dunque scorretto, e qui la critica di Mach coglie il bersaglio. Quindi vi è da distinguere, cosa che Newton non fece, fra sistema privilegiato in un modello finzionale dell'universo, che è assoluto solo relativamente a tale modello, e sistema ontologicamente assoluto che sia in quiete (cfr. Earman,

1970). Ma perché Mach rifiuta di attribuire significato fisico al modello di universo vuoto di Newton? Perché. vuole far dipendere gli effetti locali dalla totalità delle masse e degli stati di moto dei corpi celesti? Ebbene per capire questo dobbiamo inoltrarci brevemente nella concezione machiana della scienza, concezione che si trova discussa in due capolavori ddla filosofia della scienza quali sono Lanalisi delle sensazioni e Conoscenza ed errore. Il programma di ricerca epistemologico di Mach si basa sostanzialmente su due punti: (1) l'unificazione della scienza senza alcuna forma di riduzionismo fisicalistico o psicologistico; (2) l'espunzione da essa di qualunque ente inutile, fra cui, ad esempio, l'eliminazione di ciò che considera mostruosità metafisiche quali lo spazio e il tempo assoluti. Si noti come questo secondo punto altro non sia che una versione del rasoio di Occam in cui l'economicità dell'impresa scientifica si coniuga con una concezione antimetafisica. Al fine di realizzare questo programma, Mach introduce, come purafinzione metodologica e quindi senza alcun valore ontologico, gli elementi, ossia qualcosa che non è né fisico, altrimenti si cadrebbe nel riduzionismo fisicalistico, né psichico, altrimenti si cadrebbe nel riduzionismo psicologistico, ma un tertium che serve come base, ripetiamo, puramente metodologica, su cui erigere l'edificio delle teorie scientifiche. Questi elementi potranno dar luogo a enti fisici, a enti psichici, o a enti fisiologici,

La relatività generale 133

a seconda di come si connettono e a seconda di quali sono quelli che vengono connessi. Ne segue che, ad esempio, la fisica è quella disciplina che si occupa delle connessioni di elementi quali spazi, tempi, suoni, colori, pesi, ecc.; invece la fisiologia è quella disciplina che si occupa delle connessioni di questi elementi con il nostro corpo. Bisogna però sottolineare che per Mach gli elementi connessi sono storicamente e culturalmente determinati. Ossia epoche diverse e culture diverse avranno elementi base diversi. Inoltre, la connessione deve avere delle caratteristiche ben precise: (1) deve essere tale che ogni elemento è in mutua relazione con ogni altro elemento; (2) deve essere il più economica possibile; (3) deve essere funzionale e non causale. Se ogni demento deve essere connesso con ogni altro implica che il tutto è connesso con il tutto e se la connessione deve essere funzionale e non causale si ha che perde di significato la nozione di forza. Infatti, un dato evento fisico non potrà più essere interpretato come effetto di una causa, bensi come qualcosa mutuamente relato a tutti gli elementi in gioco. Come visto, Mach interpreta quanto detto anche come criterio di significanza fisica. Ossia attribuisce significato fisico solo a ciò che è mutua corrdazione funzionale di elementi. Per cui tutto ciò che non è in relazione funzionale con il tutto deve essere espunto dalla fisica. Consideriamo adesso elementi quali la massa di tutti i corpi celesti, le loro accelerazioni e le loro posizioni. Correlarli mutuamente e funzionalmente significa che ogni processo cosmologico diventa il risultato della mutua interazione di queste tre classi di elementi. Inoltre, ogni processo, o entità, che non possa ridursi a questa mutua correlazione deve essere espunto. Questo significa, da un lato, che gh assoluti devono essere espunti in quanto inutili e, dall'altro lato, che gli effetti inerziali sono interpretati non come dovuti a una causa assoluta, ma come risultato della mutua interazione gravitazionale di tutti i corpi dell'universo. In definitiva, in tal modo si arriva alla tesi che l'origine dell'inerzia è la gravitazione. Quindi, il principio di Mach, come sarà chiamato da Einstein, altro non è che la trasposizione a livello fisico-cosmologico della concezione machiana della scienza. Da questo punto di vista si capisce immediatamente il motivo per cui un mondo privo di materia, qual è quello dei modelli newtoniani, non è fisicamente significativo e quindi qualcosa da espungere. Per Mach, l'unico universo fisicamente significativo è qudlo pieno di materia, ossia solo qudlo in cui ogni processo fisico può essere descritto a partire dalla mutua correlazione di tutti gli altri corpi ddl'universo. Ma vi è anche un'altra importante conseguenza: non vi sono più forze gravitazionali in quanto, come detto, ogni processo fisico-cosmologico deve essere inter-

134 1.D allarelatività galileiana alla relatività generale

pretato come risultato di una correlazione funzionale del tutto con il tutto. Si noti però che l'eliminazione della forza nella concezione machiana è completamente diversa dall'eliminazione della sola forza gravitazionale che si ha in relatività generale. Questa è una conseguenza dell'identificazione di 6sica e geometria, quella una conseguenza di un modo filoso6co di vedere le teorie scientifiche. Sebbene Mach abbia criticato la fisica newtoniana degli assoluti e abbia proposto di interpretare l'inerzia come un fenomeno gravitazionale, non ha mai proposto una fisica in cui queste posizioni fossero esplicitate formalmente. Bisognerà aspettare proprio Einstein, il quale, nel tentativo di soddisfare il programma interamente relativistico di Mach, prosegue quanto già iniziato con la relatività speciale, nella quale i sistemi di riferimento inerziali sono ancora privilegiati, con la relatività generale. Tralasciamo ora le questioni storiche inerenti al fatto che mentre il giovane Einstein fu machiano, l'Einstein maturo si allontanò da tale concezione filosofica che poteva essere interpretata in modo strettamente fenomenistico. Tralasciamo anche il fatto che Mach non accettò la relatività generale. Soffermiamoci invece sul problema che ci interessa: la relatività generale è veramente una teoria machiana? Veramente il principio di Mach è da considerarsi come uno dei suoi assunti base? Nel 1921, nella prima edizione de I/ significato della relatività, Einstein esplicita chiaramente in che senso una teoria possa dirsi machiana e individua le tre caratteristiche che devono essere soddisfatte (cfr. Einstein,

1959, pp. 94-97): 1. l'inerzia di una corpo deve aumentare quando nelle sue vicinanze ci sono altri corpi massivi; 2. un corpo deve essere accelerato quando nelle sue vicinanze vi sono altri corpi accelerati; 3. un corpo cavo in rotazione deve produrre al suo interno un campo di Coriolis e un campo centrifugo. Ebbene, Einstein ritiene che la relatività generale le soddisfi tutte e tre. Per dimostrare questa tesi, prende l'equazione della geodetica e, assumendo di essere in un campo gravitazionale debole quasi statico, la modifica, con un'ulteriore approssimazione sulle velocità in gioco, fino ad arrivare a una equazione che egli ritiene mostri la machianità della relatività generale. In effetti, secondo Einstein, tale equazione metterebbe in evidenza che l' la massa inerziale aumenta all'avvicinarsi a corpi massivi; 2' le masse accelerate esercitano una sorta di induzione acceleratrice sulle masse vicine;

La relatività generale 135

3'. effettivamente dentro un corpo cavo rotante, come ha dimostrato H. Thirring, ci sono campi di Coriolis e centrifughi. Sfortunatamente: 1". il rapporto fra massa inerziale e gravitazione in tale equazione modificata, più che essere un effetto globale, è solo una conseguenza della particolare scelta di sistema di riferimento che Einstein ha fatto nella sua approssimazione; 3". in effetti, nel 1918, H. Thirring eJ. Lense avevano dimostrato che all'interno di un corpo cavo rotante vi erano effetti inerziali. Tuttavia, sebbene Lense e Thirring derivino questo risultato dalla relatività generale, lo derivano nell'ipotesi di un modello di universo perfettamente simmetrico e con condizioni al contorno minkowskiane, ossia tali per cui all'infinito non c'è materia, ossia tali che per r m~ si ha che g„-mt'„-. Ma un universo con questa condizione al contorno non è un modello machiano in quanto in un modello machiano anche all'infinito vi deve essere materia, cioè g„" non diventa mai rj„", nemmeno all'infinito. Quindi, almeno nell'approssimazione vista, la teoria della rdatività generale non è una teoria machiana, nemmeno secondo le condizioni imposte dallo stesso Einstein. D'altronde, una teoria per essere machiana non deve avere soluzioni in assenza di materia, perché per Mach, come visto, un universo privo di materia è un universo senza significato. Ma le equazioni di Einstein ammettono soluzioni in assenza di materia. Infatti nel vuoto il tensore della materia-energia si annulla, cioè Tj' 0 da c ui segue che R j 0 In o l t re vi è sempre la possibilità di ottenere soluzioni con condizioni al contorno minkowskiane, come lo è la prima soluzione alle equazioni di campo presentata nel 1916 da Schwarzchild per una distribuzione di materia composta solo da un unico corpo sferico non ruotante in un universo altrimenti vuoto. Ma in questo caso, violando nuovamente la lezione totalmente relativistica machiana, si definisce implicitamente un sistema di riferimento privilegiato. D'altronde Einstein era ben consapevole di queste difficoltà fin dal

1917, anno in cui pubblica leConsiderazioni cosrnokgiche sulla teoria della relatività generale. Qui, affrontando tale questione, ritiene che, per diminare la possibilità di avere soluzioni con condizioni al contorno minkowskiane, si debba considerare l'universo chiuso (o finito) spazialmente. In tal modo, in effetti, si elimina completamente la necessità di considerare quello che accade all'infinito. Sempre in questo saggio, propone anche che l'universo sia statico, ossia che il raggio di curvatura non dipenda dal tempo. Tuttavia, introdurre la staticità dell'universo significa anche dover affrontare il non piccolo problema della giustificazione del fatto che esso non autocollassi sotto l'a-

136 1. Dalla relatività galileianaalla relatività generale

zione delle forze gravitazionali attrattive. La soluzione einsteiniana sta nel riprendere la modificazione della gravitazione newtoniana proposta da H. Seelinger nel 1875. Esattamente come Seelinger aveva introdotto ndl'equazione di Poisson un nuovo termine repulsivo atto a bilanciare la gravitazione, cos> Einstein introduce un nuovo termine repulsivo ( — iLg;; do-

ve il è detta costante cosmologica) nelle equazioni di campo, che sventano:

R„-

—,' g1 iR

—Lg„" = kT„"

D'altronde, quest'aggiunta non comporta affatto una modifica sostanziale ddla struttura ddla relatività generale, in quanto sia le equazioni non modificate che le equazioni modificate altro non sono che una delle possibili famiglie di equazioni di campo che la teoria ammette. In tal modo Einstein pensa di aver effettivamente ottenuto una teoria machiana, ossia una teoria descrivente un universo chiuso e statico, pieno di materia e dove non vi possono essere sistemi privilegiati. Ma l'introduzione ddla costante cosmologica è sufficiente? Inoltre, l'universo reale è veramente chiuso e statico? Tra il .1916 e il 1917, W. de Sitter dimostra che è possibile avere soluzioni delle equazioni modificate anche in assenza di materia e minkowskiane all'infinito. E questo confuta immediatamente l'idea che basti inserire la costante cosmologica per avere soluzioni machiane. Nel 1922 e 1924, A.A. Friedmann pubblica dei lavori in cui dimostra che sia dalle equazioni modificate, sia da quelle non modificate è possibile trovare soluzioni descriventi universi non chiusi e non statici. In questo modo è confutata nuovamente l'idea einsteiniana che l'introduzione della costante comportasse automaticamente solo soluzioni per universi chiusi e statici. Infine, e questo è in un certo senso il colpo finale, nel 1929, Edwin Hubble pubblica i risultati delle sue osservazioni astronomiche e da essi si deve concludere che l'universo reale non è statico, ma è in espansione. Quindi, contro Einstein, da un lato, la costante cosmologica non implica affatto la possibilità di avere solo universi machiani e, dall'altro, l'universo reale è in espansione (cfr. Bergia, 1995,

capp. 2-4). Quello che qui interessa non è tanto il fatto che la cosmologia einsteiniana sia stata superata e che l'introduzione della costante cosmologica sia pressoché inutile, ' quanto che la relatività generale non è una teoria machiana, e quindi non è una teoria totalmente relativistica. Il fatto che non sia totalmente relativistica significa che vi possono essere soluzioni di campo in cui vi sono sistemi di riferimento privilegiati. Basta infatti pensare alla soluzione proposta nd 1949 da Kurt Godei descrivente un universo completamente in rotazione e quindi non machiano in quanto in-

La relat ività generale 137

dividuante un asse privilegiato: quello di rotazione. Si faccia però nuovamente attenzione a non confondere un sistema di riferimento privilegiato, e in un certo senso matematicamente assoluto, con un sistema di riferimento ontologicamente assoluto. Nessuno sostiene che nella relatività generale ci sono sistemi di riferimento ontologicamente assoluti, ma solo che certe soluzioni delle equazioni di campo descrivono universi in cui vi sono sistemi di riferimento privilegiati. Ne segue che se la relatività generale non è machiana allora il principio di Mach non appartiene aH'insieme dei suoi presupposti. Sicuramente l'intento di Mach di una fisica completamente relativistica è stato un potente stimolo per Einstein per costruire la rdatività speciale prima, e generale dopo. Ma Einstein ha, in un certo senso, fallito: non è riuscito a costruire una fisica interamente machiana, ovvero una fisica interamente relativistica, ossia una teoria fisica in cui non compaiono sistemi

privilegiati. Molti dopo Einstein, specie negli anni 60, hanno tentato di costruire una teoria della gravitazione interamente relativistica. C'è chi ha continuato a lavorare dentro la relatività generale, come H. Honl e J.A. Wheeler; altri hanno tentato di fare una teoria machiana completamemte o parzialmente diversa dalla rdatività generale, come D.W. Sciama, C.H.Brans

e R,H. Dicke, E Hoyle e J.V. Narlikar, J.B. Barbour e B. Bertotti. Ma a tutt' oggi nessuno è ruscito a proporre una teoria veramente machiana e che riesca nel contempo a superare la gravitazione einsteiniana (cfr. Bo-

niolo, 1988, e Barbour, 1989). Quello che è interessante dal punto di vista filosofico è che H. Honl, nel 1948, e Wheeler, nel 1964, ripresero, senza esserne consapevoli, una tesi già implicitamente presente in Einstein. Ossia proposero di considerare reali solo le soluzioni delle equazioni di campo che avessero condizioni al contorno machiane. Ma che cosa vuoi dire? Se si volesse veramente imporre condizioni al contorno machiane vorrebbe dire imporre la condizione che ogni massa e ogni stato dinamico dipendono da tutte le altre masse e da tutti gli altri stati dinamici, ossia che tutto dipende da tutto. Ma è possibile fare fisica con un tale presupposto?

' Einstein la considererà il "più grande errore della mia vita" (cit. in Bergia,1995, p. 53).

138 1. Dalla relatività galileiana alla relati vità generale

3.10 Il principio d'equivalenza debole Abbiamo visto che Einstein nel formulare il principio d'equivalenza ha elevato al rango di assunzione ciò che era conosciuto, ma trascurato, fin

dai tempi di Galilei, ossia l'indipendenza dell'accelerazione di gravità dalla natura dei corpi, ovvero, nel linguaggio contemporaneo, l'equivalenza numerica fra la massa gravitazionale e la massa inerziale. Dagli anni cinquanta, specie a opera di Dicke, si è cominciato ad analizzare più a fondo questa equivalenza. Come conclusione si è arrivati a distinguere fra principio d'equivalenza debole e principio d'equivalenzaforte. La formulazione debole, che in pratica riecheggia qudla galileiana, sancisce che tutti i corpi, indipendentemente dalla loro natura, forma e massa, cadono con la stessa accderazione e che quindi in un laboratorio in caduta libera e non ruotante, ossia in un laboratorio che si muove lungo una geodetica, gli effetti gravitazionali possono essere localmente trascurati. Invece la formulazione forte, implicitamente (e inconsapevolmente) sostenuta da Einstein, sancisce che in un laboratorio in caduta libera e non ruotante, oltre al fatto che corpi diversi cadono con la stessa accelerazione, tutte le leggi ddla fisica, nella formulazione rdativistica speciale, e tutte le costanti fisiche fondamentali rimangono le stesse indipendentemente dalla posizione spaziotemporale del laboratorio. Ndla formulazione forte compare il fatto che tutte le costanti di natura, fra cui le costanti delle interazioni forti, deboli e gravitazionali, sono le stesse, cosa che implicitamente è sostenuta nella rdatività generale. Ma non tutte le teorie della gravitazione che si possono costruire e che si sono costruite ammettono la costanza delle "costanti" universali. Ossia, non tutte le possibili teorie della gravitazione soddisfano il principio d'equivalenza forte. Invece tutte devono soddisfare il principio d'equivalenza debole dal momento che altrimenti sarebbero in contraddizione con la forte corroborazione empirica che questo ha avuto nel corso dei secoli. Quindi gli esperimenti di Galilei, Newton, Bessell, Eotvos, Dicke, Braginskji non sono in realtà corroborazioni al principio d'equivalenza in generale, ma solo alla sua parte debole. Questo significa che non è nemmeno vero che essi corroborino solo la teoria della relatività generale. In realtà, essi corroborano qualunque teoria della gravitazione che ammette, come principio o come proposizione dedotta, l'asserto enunciante l'equivalenza numerica fra le due masse. D'altro canto, il principio forte sarebbe corroborato, e con esso tutte le teorie della gravitazione che lo ammettono, se si corroborasse la proposizione enunciante la costanza delle costanti d'interazione; cosa empiricamente meno sicura che non l'equivalenza numerica fra le due masse.

La relat ività generale 139

Tutto ciò significa che se una teoria della gravitazione vuole essere considerata una teoria della gravitazione empiricamente valida, deve necessariamente (ovviamente, questo non è un requisito sufficiente) soddisfare il principio d'equivalenza debole. Fra tutte le teorie che lo soddisfano vi è una sottoclasse di teorie che soddisfano anche la formulazione forte. E la teoria di Einstein è fra queste. Invece fra quelle che non soddisfano la versione forte vi è, ad esempio, la teoria di Brans e Dicke che si basa su una interpretazione del principio di Mach e su una ripresa

della teoria di Paul Dirac e di Pascual Jordan dei grandi numeri. Secondo questi fisici, ogni costante di natura può essere espressa come funzione di grandezze base quali la massa dell'elettrone, il raggio dell'atomo di idrogeno e il tempo impiegato da un fotone a percorrerlo. In questo modo si arriva a una teoria adimensionale sui numeri correlati alle costanti di natura. Si arriva pure a mostrare che vi è una stretta di- 10 ) e la costante di gravitazione pendenza fra l'età ddl'univero (T = (C = 10 ), ossia G=- 1/T. Se non si è in presenza di una pura coincidenza, si ha che all'aumentare dell'età dell'universo, diminuisce il valore della costante di gravitazione, ossia la costante G non è più costante. Per Brans e Dicke questo è spiegato con il principio di Mach, nel senso che, visto che l'età dell'universo è proporzionale alla sua espansione, più l'universo invecchia e più si espande. Ma l'espansione comporta un allontanamento reciproco ddle masse e quindi una loro minore influenza gravitazionale che porta a una diminuzione di G. A dire il vero non vi è alcuna evidenza sperimentale definitivamente a favore della variabilità di G e quindi a favore della teoria della gravitazione di Brans e Dicke. Quello che però interessa è che è possibile avere, e che si hanno, più teorie ddla gravitazione e che tutte devono soddi-

sfare ù principio d'equivalenza debole. Tenendo conto di questo fatto, negli anni sessanta, K. Nordtvedt, C.M. Will e K.S. Thome proposero una teoria ddle teorie della gravitazione soddisfacenti il principio d'equivalenza debole. Tale super teoria è chiamata Parametrizzazione Posi-Newtoniana (PPN) per via del fatto che considera le teorie della gravitazione solo nel limite del campo gravitazionale debole, com'è qudlo del Sole. Il fatto sorprendente è che le tre corroborazioni dassiche della relatività generale, ossia, la precessione dd perielio di Mercurio, lo spostamento verso il rosso e la deflessione dei raggi di luce, sono corroborazioni per tutte le teorie induse nella parametrizzazione, Questo significa che nd limite del campo debole l'evidenza empirica disponibile, orna gli esperimenti relativi all'equivalenza fra le due masse e quelli appena citati, non sono assolutamente sufficienti a discriminare qual è la teoria migliore. Bisogna però sottolineare che da quando la PPN fu

140 1. Dalla relatività galileiana alla relatività generale

proposta il numero di teorie in competizione è diminuito di molto, grazie a esperimenti che via via hanno falsificato certi approcci. A tutt' oggi, comunque, non si è ancora giunti a un'unica teoria della gravitazione. Siamo allora in presenza di un tipico caso di sottodeterminazione teorica a causa dei dati, ossia i dati empirici a disposizione vanno bene per un numero elevato di teorie e non sono capaci di discriminare la migliore. Questo significa che la rdatività generale è solo una fra le teorie della gravitazione che soddisfano i dati empirici e che non è certo l'unica, come molte volte si pensa.

3.11 Fisica e geometria 3.11.1 La "irragionevole" eff icacia della geometria riella descrizione del

mondo fisico

Nel suo saggio introduttivo sulla filosofia dello spazio e del tempo, Wes-

ley Salmon ha de6nito la filosofia e la geometria due sorelle gemelle (cfr. Salmon, 1980). Tali due discipline non sono solo nate insieme, ma sono rimaste legate durante tutta la loro storia da una relazione molto profonda. Tenendo presente il ruolo fondamentale che la geometria ha avuto

anche nella nascita della 6sica modem, sembrerebbe 6n troppo ovvio considerare il rapporto tra fisica e geometria come in grado di rivaleggiare con quello menzionato sopra. Sulla scia dell'inaspettato successo della geometria non-euclidea nella descrizione sia della struttura locale del campo gravitazionale che di quella dell'universo a larga scala," neHa seconda metà del nostro secolo è stato persino proposto un programma di ricerca che considera la geometria dello spaziotempo come l'entità fondamentale in base a cui spiegare qualsiasi fenomeno fisico (il programma geometro-dinamico di Wheeler).4 Considerando il fatto che 6no al Settecento la 6sica veniva de6nita "6losofia naturale", sembra allora naturale estendere la qualifica di "sordle gemelle" anche alla fisica e alla geometria, ciò che rende un qualunque approccio critico al problema dei rapporti tra queste due ultime discipline inscindibile da una considerazione filoso6ca o epistemologica. Se filosofia, fisica e geometria sono tre sorelle gemelle, la prima è quella a cui le altre due debbono guardare per comprendere la loro relazione reci' Cfr. il capitolo di Bergia in questo volume. ' Una teoria geomeuica del campo elettromagnetico era già stata formulata da Hermann Weyl nd 1918 e venne poi ripresa da Arthur Eddington (cfr. Ryckman, 1994).

La relat ività generale 141

proca. Vorremmo anzi aggiungere che uno degli aspetti più i

mpor tanti

del complesso problema dei rapporti tra 6sica e geometria è di natura filosofico-concettuale, perché riguarda la teoria della conoscenza. In particolare, il problema essenziale che cercheremo di introdurre in questa parte è il seguente: come è possibile che la matematica, in particolare la geometria, che sembra una pura invenzione del pensiero umano e che non necessita dunque di esperienze e osservazioni per la verifica delle sue proposizioni, si riveli uno strumento indispensabile per descrivere la natura? Se, seguendo Hobbes e Vico, crediamo che l'uomo non possa comprendere nuUa che non abbia fatto lui stesso, com'è possibile che il mondo fisico, che non è stato certo fatto da noi, si lasci descrivere da complicate strutture matematiche che sembrano un puro frutto deHa nostra immaginazione, e che spesso sono state escogitate per fini totalmente eterogenei? Parafrasando Einstein, ciò che è davvero sorprendente non è solo che il mondo sia conoscibile, ma che lo sia attraverso la matematica. Alcuni esempi storici deH'e8icacia della geometria nd descrivere il mondo 6sico ci daranno la misura non solo del fascino deH'enigma, ma anche di quanto siamo ancora lontani da una sua soluzione. La straordinaria potenza ddla geometria euciidea come rappresentazione simbolica del mondo 6sico è dimostrata daH'applicazione della teoria geometrica delle coniche alle orbite dei corpi celesti. Tali curve (eHisse, iperbola, parabola, circonferenza) erano state studiate da ApoHonio di Perga alcuni secoli prima di Cristo in modo del tutto indipendente da possibili applicazioni al mondo fisico. Quasi duemila anni dopo, la conoscenza puramente astratta delle loro proprietà si rivelò utile per risolvere il problema della forma delle orbite planetarie, che Keplero scopri essere ellittica e non circolare. L'esempio ddle geometrie non-eudidee, inventate nel secolo scorso, e inizialmente guardate con sospetto, è forse ancora più eclatante, dato che, come si è visto, la teoria della relatività generale ndla sua forma finale non è altro che una reinterpretazione in termini gravitazionali di una matematica degli spazi curvi già pre-esistente. Tale matematica era stata elaborata inizialmente da Gauss per risolvere un problema relativo ai fondamenti della geometria che era privo di qualsiasi applicazione immediata al mondo reale. NeH'ottica da noi adottata, il problema dei rapporti tra fisica e geometria va visto perciò come un caso particolare del problema filoso6co più generale che cerca di chiarire se il mondo reale abbia in sé una struttura Si trattava di stabilire se il postulato eudideo delle parallele fosse indipendente dagli altri postulati della geometria eudidea. Il modo di procedere dei matematici da Girolamo Saccheri in poi fu quello di provare a negarlo per vedere se si potevano trovare delle contraddizioni con gli altri assiomi.

142 1. Dalla relatività galileianaalla relatività generale

matematica che i fisici e i matematici lentamente scoprono e mettono in luce, o se la matematica sia solo uno strumento linguistico particolarmente ricco che serve a descrivere il mondo fisico, il quale però non è letteralmente scritto, come invece sostenevano Galileo e Keplero, +in caratteri matematici».4~ Prima di chiarire meglio l'alternativa tra queste due concezioni sul ruolo della matematica neHe applicazioni alla fisica, conviene sottolineare che le applicazioni della geometria alla fisica non sono infatti le uniche applicazioni matematiche degne di nota. Basti pensare al fatto, ricordato dal premio Nobel per la fisica Steven Weinberg, che il matematico G. Hardy si vantava che il particolare ramo della teoria dei numeri sul quale lavorava sarebbe rimasto per sempre puramente teorico e privo di applicazioni. Lo stesso Weinberg, lavorando con un suo collaboratore alcuni anni dopo sul comportamento della materia a temperature molto elevate, trovò le formule di cui aveva bisogno proprio nella teoria dei numeri elaborata da G. Hardy e dal prodigio matematico indiano S. Ramanujan. Come ultimo esempio, possiamo ricordare l'uso di uno degli strumenti più potenti inventati dai matematici nel secolo scorso, i cosiddetti "gruppi" — i quali studiano l'insieme delle trasformazioni che lasciano invariato qualcosa (una legge o un oggetto matematico) — per imporre ordine e simmetria alla prolifica famiglia delle particelle elementari. Proprietà possedute da tali particelle che erano state scoperte per via sperimentale si lasciavano catalogare in base ad astratte leggi di simmetria gruppale la cui applicabilità era assolutamente insospettata. Altri esempi potrebbero essere addotti, ma crediamo che questi siano sufficienti per convincere il lettore che una qualsiasi indagine intorno al problema dei rapporti tra fisica e geometria che prescinda da un tentativo di spiegazione di quella che Eugene Wigner, in un famoso saggio, ha chiamato «l'irragionevole efficacia della matematica» sarebbe incompleta (Wigner, 1960; per una critica, cfr. Boniolo, 1995). A nostro parere, tale spiegazione va ricercata nell'esame critico delle principali teorie che sono state avanzate sulla natura ddla conoscenza matematica, e sulla conoscenza geometrica in particolare. Dato che tale programma non può essere affrontato con completezza in questa sede, qui di seguito (55 3.11.2 3.11.4) indicheremo solo molto sinteticamente le più importanti posizioni filosofiche sul problema dei rapporti tra fisica e geometria, sottolineando le conseguenze che tali posizioni hanno sulla questione di quale

Naturalmente, la cotnplessità enorme del problema dei rapporti tra fisica e geometria non può essere racchiusa in nessuna formula e in nessun approccio specifico. Il presente approccio fornisce solo una prospettiva possibile ma non molto considerata sui problemi tradizionali dell'epistemologia della geometria.

La relatività generale 143

sia la reale geometria del mondo fisico, dibattuta da Reichenbach e da grandi filosofi-scienziati degli inizi del secolo quali Poincaré e Duhem. In una parola, il problema è di stabilire se la scelta di una geometria (euclidea con forze universali che incurvino i raggi di luce e contraggono i regoli, o non-eudidea senza tali forze) sia imposta dai fatti o frutto di una convenzione. La breve carrellata sulle posizioni che presenteremo (a. il platonismo e il realismo geometrico; b. il kantismo; c. il formalismo) è necessariamente incompleta, dato che è filtrata dal nostro intento di approfondire la questione di cui sopra sulla reale geometria del mondo fisico. In particolare, non discuteremo alcune importanti posizioni sulla natura della matematica quali l'intuizionismo o il logicismo, dato che esse non ci sembrano direttamente rilevanti per la comprensione di tale questione. L'empirismo matematico verrà invece brevemente discusso in un confronto con il realismo geometrico in $3.11.2, mentre nell'ultimo paragrafo (5 3.113) presenteremo il problema della natura convenzionale della metrica nel contesto della questione dd sostanzialismo dello spaziotempo. 3.11.2 Il platonismo e il realismo geometrico Cominciando dal platonismo, possiamo comprendere l'importanza che aveva la matematica nel pensiero platonico ricordando che la scritta sulla porta dell'Accademia diceva "non entri chi non è geometra" 11 platonismo matematico, o realismo, è legato principalmente alla credenza nell'esistenza di entità matematiche quali numeri, funzioni e classi, un'esistenza che viene caratterizzata comeindipendente sia dalla mente che dal linguaggio. In altre parole, per il platonista o realista matematico credere in una teoria matematica come l'aritmetica (credere nei suoi teoremi o nel fatto che 2 + 2 = 4) vuoi dire credere ndl'esistenza degli oggetti di cui essa parla, in questo caso, numeri. Ma che vuole dire che le entità esistono indipendentemente dalla mente e dal linguaggio? Un modo semplice per rispondere a questa domanda è formulare un'asserzione condizionale controfattuale, un'asserzione cioè di tipo "se... allora..." che preveda una ipotesi (l'antecedente del condizionale) che di fatto non si dà. Il platonista o il realista matematico è convinto cioè che anche se gli uomini non fossero mai esistiti, le entità matematiche esisterebbero comunque, e che il mondo fisico, nell'ipotesi che esso davvero possieda una struttura profonda di tipo matematico, sarebbe comunque scritto in caratteri geometrici. Il mondo delle entità matematiche è dunque indipendente da qualunque attività umana. Interpretato alla luce dd pensiero contemporaneo, il platonismo affer-

144 1.Dallarelatività galileiana alla relatività generale

ma essenzialmente che i concetti e le entità matematiche non sono inventati ma "trovati", e che il matematico scoprefatti esattamente come il fisico o il biologo, fatti che vengono realisticamente interpretati come indipendenti dalla mente e dal linguaggio usato per descriverli. Cosi come per il realista scientifico è un fatto che l'acqua bolla a cento gradi, per il platonista è un fatto che le tre altezze di un triangolo si incontrino in un punto, un fatto il cui darsi è indipendente dalla mente e dal linguaggio dei matematici, e dunque dalla nostra esistenza (si veda Rota, 1993, cap. 2). Lo status di tali fatti è in genere visto al modo di Platone, cioè come qualcosa di puramente astratto, nel senso di riguardare un mondo di entità che trascende lo spaziotempo. In questo caso, tale mondo è causalmente inerte, cioè è privo di cause e di eBetti, ed è popolato da entità come il numero dodici, l'insieme dei numeri naturali, le curve del secondo ordine, ecc. L'entità astratta dodici è esemplificata dai mesi dell'anno e da tutte le dozzine di oggetti, ed è denotata da tutti i simboli che gli esseri umani hanno inventato per riferirsi a essa ('twelve', 'XII'), ma non è da confondere con uno di tali simboli, per esempio, '12'. In questo senso, la geometria è qualcosa che l'uomo scopre a priori, senza ricorso all'esperienza, svelando la struttura atemporale di tale mondo astratto. Dal punto di vista della teoria della conoscenza, secondo questa posizione il mondo fisico in tanto è comprensibile in quanto è matematico o geometrico, ovvero possiede ddle strutture che assomigliano o 'ricordano' quelle esistenti in modo puramente astratto. In qualche modo, esiste una "somiglianza" tra fatti matematici e fatti fisici, ma i primi hanno un primato esplicativo, conoscitivo e ontologico sui secondi. Questa dottrina dell'imitazione (mimesi) o partecipazione (metessi ) delle cose fisiche o naturali alle "idee matematiche" venne proposta per la prima volta nella storia del pensiero occidentale da Platone come una possibile spiegazione della razionalità e la comprensibilità dd mondo fisico. Tale spiegazione continua a esercitare il suo fascino anche su alcuni fisici matematici contemporanei (Penrose, 1989 e 1994). La duplicazione tra mondo matematico e mondo fisico può suscitare

delle prevedibili perplessità nel lettore. In effetti, il problema principale ddla posizione di filosofia della matematica che abbiamo cosi schematicamente presentato è che è difficile spiegare come sia possibileinteragire con un mondo costituito da entità puramente astratte, ossia conoscerlo, senza invocare al tempo stesso una qualche forma di intuizione o percezione più o meno mistica, o una dottrina mitica come quella della reminiscenza platonica. Ricordiamo infatti che il mondo puro di entità matematiche, su cui il platonista scommette la sua reputazione, esiste in modo non spaziotemporale, ovvero è causalmente inerte. Se ogni forma di

La relat ività generale 145

conoscenza (percezione) del mondo è una forma di interazione causale con entità nello spazio e nel tempo, come è possibile entrare in contatto con il mondo platonico di entità matematiche, che per definirione è privo di cause e di e&etti? Inoltre, come seconda difficoltà, si può far presente che la duplicazione tra mondo fisico e mondo matematico, su cui si era già espresso criticamente Aristotde, rende quest'ultimo inspiegabile in linea di principio, dato che ogni spiegazione necessariamente lo presuppone. Sorge naturale la domanda di quale sia l'origine del mondo matematico, o di quello che Spinoza chiamava l'ordine geometrico dd cosmo, che per lui faceva tutt' uno con il Dio-Natura. Allo scopo di provare a rispondere in parte a queste obiezioni, è stata elaborata un'altra filosofia della matematica di tipo realistico che, oltre a essere di diretto interesse per il nostro tema, ha in comune col platonismo una concezione realistica degli insiemi, intesi come dotati di proprietà numeriche allo stesso modo in cui gli oggetti fisici hanno una lunghezza (cfr. Maddy, 1990). Secondo questa variante del platonismo però, gli insiemi di oggetti fisici sono collocati nello spazio e nel tempo, e non sono causalmente inerti. Questa posizione realistica presenta interessanti analogie con la posizione dei sostanzialisti nei confronti ddla natura dello spaziotempo, e mostra che non tutte le posizioni platoniste sono legate all'ipotesi che le entità matematiche, e, più specificatamente, qudle geometriche, abbiano un'esistenza astratta nd senso di cui sopra. Allo scopo di approfondire ulteriormente la nostra discussione, ricordiamo infatti che esistono giustificazioni della nostra credenza in entità matematiche, che sono basate sulla cosiddetta "inferenza alla migliore spiegazione" Ad esempio, per i realisti matematici alla Quine e Hilary Putnam, vale il cosiddetto argomento ddl'indispensabilità, per cui dobbiamo credere all'esistenza delle entità matematiche che vengono postulate nella formulazione della nostra migliore teoria sul mondo. A nostro parere, con l'eccezione forse di Friedman (cfr. Friedman, 1983), nella letteratura sul problema della "vera geometria" del mondo fisico, l'argomento dell'indispensabilità delle entità matematiche che entrano nelle spiegazioni scientifiche di tipo strutturale, di cui abbiamo già parlato, è stato applicato in modo insufficiente. In particolare, tale applicazione avrebbe una conseguenza assai importante per i rapporti tra geometria e fisica: le strutture matematiche postulate per comprendere il mondo fisico, per esempio lo spaziotempo di Minkowski o quello delle geometrie non euclidee, non esisterebbero astrattamente, o in modo causalmente inerte, ma sarebbero invece reali al modo di un sistemafisico, dato che interagiscono con esso. Tale posizione, che potremmo battezzare di "realismo geometrico", af-

146 1.Dallarelatività galileiana alla relatività generale

ferma perciò che le leggi di natura hanno un carattere matematico perché il mondo è matematico, o ha proprietà numeriche e geometriche essenziali, come quelle di cui sono dotati i punti ddlo spaziotempo, la cui esistenza viene ammessa anche in un'ontologia nominalista. Le varietà 4-dimensionali di Minkowski o di Riemann esistono indipendentemente dalla mente umana che le scopre, e la novità essenziale introdotta dalla teoria della relatività generale è che lo spaziotempo, cioè la varietà stessa più la metrica, viene ad assumere per la prima volta nella storia delle idee un ruolo dinamico. Questo tipo di realismo sull'esistenza dello spaziotempo è chiamato in genere sostanzialismo, ed è una posizione che considera la postulazione dell'esistenza indipendente ddlo spaziotempo e della sua curvatura come la migliore spiegazione possibile ddla gravità, e del fatto che la materia-energia è in interazione con esso. La nostra idea di realtà fisica è concettualmente legata in modo strettissimo a quella di interazione causale: ciò che esiste ha cause e/o effetti, dato che se qualcosa indeterministicamente non ha causa, deve avere almeno degli e&etti per essere reale; d'altro canto, i cosiddetti epifenomeni, che invece non hanno effetti, hanno però delle cause. In una parola, in base a questa posizione filosofica realistica, se lo spaziotempo è in interazione fisico-causale con k materia, allora esiste.Da questo punto di vista, lo status dello spaziotempo è quello di un'entità teorica che viene considerata esistente, di un'entità cioè non osservabile direttamente ma che viene legittimamente postulata per spiegare effetti osservabili quali la deflessione dei raggi luminosi, o la permanenza della Terra nella sua orbita attorno al Sole. In definitiva, a differenza di ciò che accade nel platonismo, il problema deH'applicabilità della geometria al mondo fisico ha in questa filosofia della geometria una spiegazione immediata e semplice, perché il monismo che la sottende non implica alcuna duplicazione tra universo matematico e universo fisico. Dal punto di vista della teoria della conoscenza, tale variante dd realismo matematico si differenzia perciò dal platonismo propriamente detto per il suo anti-apriorisrno. Pe r esempio, quando Bernard Riemann cominciò a studiare le proprietà delle superBci curve, fu stimolato dalla riflessione sui fenomeni di deformazione ddle superfici metalliche dovuti al calore. Quindi, per questa concezione non esiste il

Nella tradizione filosofica medievale, i nominalisti sono coloro che negano l'esistenza di riferimenti ontologici per i termini universali quali 'cavallo', 'cane', 'uomo' o 'insieme', e ammettono invece solo l'esistenza di un particolare cavallo, di un particolare cane, di un particolare uomo. Il modemo nominalismo matematico ammette come esistenti solo i punti dello spaziotempo, da cui gli insiemi e i numeri possono presumibilmente essere costruiti. Per quest'ultima idea, cfr. Field, 1980, 1989. sr Si noti che qui per "a priori" intendiamo 'indipendente dall'esperienza'.

La relatività generale 147

problema, tipico dd platonismo, di come la mente umana possa accedere alle idee o alle entità matematiche. Come nella posizione di fùosofia della matematica più propriamente chiamata empirismo, anche per questa forma di realismo, la matematica ha origine dall'esperienza sensibile, viene elaborata dalla nostra mente attraverso quella visualizzazione intuitiva su cui molti matematici hanno insistito nel descrivere i propri processi creativi, e poi ritorna al mondo fisico in una continuo processo di prova ed errore, che aUa fine seleziona le strutture che esistono nella realtà, allo stesso modo di ciò che avviene per le entità teoriche più propriamente appartenenti aùa fisica. Come nelle versioni più liberali e tolleranti ddl'empirismo, questa concezione realistica postula entità che vanno al di là dell'esperienza, senza al contempo dover ipostatizzare nel senso delI'esistenza fisica qualunque entità che interviene in una teoria matematica. 3.113 Il kantismo Una posizione intermedia tra il razionalismo platonico-leibniziano, secondo cui conosciamo la realtà essenzialmente con la ragione, e l'empirismo, secondo cui l'osservazione è fonte unica di conoscenza, venne assunta da Kant. Come è noto, il filosofo di Konigsberg propose di considerare le proposizioni della geometria e dell'aritmetica come sintetiche a priori. Questo significa che esse sono non solo universali e necessarie (in quanto a priori), ma anche informative sul mondo fisico (sintetiche), poiché presuppongono l'intuizione dello spazio e del tempo, che sono forme che l'uomo impone a priori a una qualunque sensazione del mondo esterno e interno. L'applicabùità della geometria al mondo empirico ("Come è possibile la matematica?" era la domanda da cui Kant era partito ndla sua Estetica trascendentale) è garantita proprio dal fatto che l'uomo non può non collocare qualunque percezione di un oggetto nello spazio e nel tempo. Lo spazio non è solo la condizione di possibilità deUe sensazioni del mondo esterno, ma è anche ciò di cui si occupa la geometria. Il tempo per Kant è ancora più importante dello spazio, in quanto è la condizione di possibilità di ogni sensazione, interna ed esterna, ed essendo alla base del contare, è anche a fondamento deH'aritmetica. In questo senso, la verifica di una proposizione matematica coinvolge per Kant un processo che non è puramente formale, ma che richiede una costruzione in cui la visualizzazione e l'intuizione giocano un ruolo essenziale: in tanto l'uomo può visualizzare un processo fisico in quanto lo può intuire ndlo spazio e nel tempo. Se, come aveva già sostenuto Cartesio, la geometria è la scienza dello spazio puro o dell'estensione, e ogni corpo fisico è, astraendo dalle altre proprietà come l'impenetrabilità e il colore, esteso,

148 1. Dalla relatività galileiana alla relatività generale

allora tutte le proprietà che sono stabilite dalla geometria e deducibili dall'estensione valgono anche per i corpi in quanto questi sono estesi (cfr. Eu-

lero, 1770). Il punto controverso neH'interpretazione kantiana dei rapporti tra geometria e fisica ha a che fare proprio con la teoria della rdatività (cfr. Cassirer, 1921), e concerne il problema se ogni nostra esperienza dello spazio debba rientrare ndlo schema della geometria euclidea. Da Reichenbach fino a Karl Popper si è ripetuto, spesso in modo superficiale, che cosi come la relatività speciale confuterebbe la teoria kantiana del tempo, moddlata su queHa newtoniana, la relatività generale confuterebbe qudla dello spazio, che sarebbe basata sulla geometria euclidea. Qui di seguito, noi cercheremo di chiarire schematicamente il significato di questa seconda tesi. Partendo daH'osservazione scientificamente fondata che l'uomo si è evoluto in un ambiente in cui la geometria euclidea è approssimativamente esatta (lo spaziotempo è localmente piatto), per più di duemila anni si è naturalmente presupposto che quest'ultima fosse la geometria che descriveva lo spazio fisico. In questo senso, era naturale che Kant assumesse che qualunque nostra esperienza si dovesse conformare alla geometria eudidea, dato che nel suo tempo la conoscenza di altre geometrie non era ancora stata sviluppata e divulgata. Il problema che si pose quando si scoprirono le geometrie iperbolica ed ellittica, cosa che avvenne a partire da un paio di decenni dopo la morte di Kant (1804), era di scoprire quale di queste fosse corretta, cioè quale fosse la vera geometria del mon-

do fisico. Il grande matematico tedesco Gauss fu il primo a provare a decidere la questione in modo empirico, prima ancora che Eugenio Beltrami dimostrasse la rdativa coerenza delle varie geometrie, basandosi sul fatto che se una deHe geometrie non-euclidee fosse stata contraddittoria, allora lo sarebbe stata anche quella euclidea." Concretamente, quello che Gauss tentò di realizzare per la prima volta nella storia delle idee fu un esperimento che decidesse quale fosse la struttura geometrica del mondo

fisico. Lesperimento consisteva nel misurare gli angoli interni di "un triangolo fisico", i cui vertici erano dati da tre cime di montagna nelle Alpi, e i cui lati erano costituiti da tre raggi luminosi. Il tentativo di Gauss era di stabilire se il triangolo fisico cosi ottenuto si comportasse come un triangolo eudideo, il che equivaleva a verificare che la somma dei suoi angoIn parole povere, questo significa che la fiducia che abbiamo nella non-contraddittorietà della geometria eudidea, che pure è indimostrabile, deve essere almeno tanto grande quanto queUa daaccordare a quelle non-eudidee.

I a relatitrita generale 149

li desse esattamente 180', o fosse non-euclideo. Se la somma degli angoli fosse stata minore di 180', Gauss avrebbe misurato un triangolo iperbolico, tipico degli spazi a curvatura negativa studiati da Lobacevski, mentre se fosse risultata maggiore di 180' avrebbe ottenuto un triangolo ellittico, tipico degli spazi a curvatura positiva studiati da B. Riemann. Ciò che a noi importa per il problema della natura dello spazio fisico non è tanto il fatto che Gauss ottenne un risultato che non si discostava da 180', ma che cosa avrebbe potuto replicare un seguace di Kant se il risultato fosse stato diverso. Naturalmente, la questione essenziale per rispondere a tale domanda è di stabilire quale sia la dottrina centrale nei confronti della quale un kantiano è impegnato. Se si presenta il caso di Kant come legato indissolubilmente alla natura euclidea della geometria dd mondo fisico,allora, dopo la formulazione deHa relatività generale, la sua difesa deve passare o attraverso l'osservazione che localmente lo spazio fisico è sempre eudideo, o attraverso un argomento di tipo convenzionalista, secondo cui ogni dato possibile sottodetermina la scelta di una particolare geometria. La scelta della geometria euclidea si potrebbe allora imporre per motivi di semplicità. Se invece si sostiene che Kant è impegnato nei confronti della tesi della non visualizzabilità di una superficie spaziale 3-dimensionale curva, allora la discussione si sposta sul problema se la forma dello spazio percepito sia necessariamente euclidea, e sulla questione ddla visualizzabilità intrinseca di una superficie non-euclidea. Le due tesi sono da ritenersi diverse, cosi come sono da distinguersi lo spazio percettivo o sensoriale e quello fisico, e prima di passare a esporre la posizione formalista, noi le discuteremo brevemente. Il primo tipo di difesa, quello che fa presente la natura locale ddla geometria euclidea anche nella teoria einsteiniana sembra debole, dato che questo fatto può al massimo spiegare come mai Kant ritenesse che anche la geometria dell'universo a larga scala fosse eudidea. Ma è appunto questa tesi che si potrebbe rivelare errata, specialmente se la strategia convenzionalista che ora passeremo a discutere non funziona. È noto che la teoria ddla relatività generale di Einstein prevedeva, tra le sue conseguenze sperimentali, la deflessione di raggi luminosi in prossimità di un intenso campo gravitazionale. In questo senso, il caso della geometria non-euclidea postulato da Einstein per spiegare tale predetta deflessione ha una struttura simile a qudla dell'esperimento di Gauss, nel ca-

Per ciò che abbiamo detto sopra sulla natura eudidea dello spazio locale, la differenza tra un angolo piatto (180') e la somma degli angoli interni di un triangolo non-euclideo è una funzione della grandezza dei lati del triangolo. Ne segue che eventuali effetti non-euclidei non sarebbero stati rilevabili nel triangolo fisico scelto da Gauss, dal momento che questo era troppo piccolo.

150 1.D allarelatività galileiana alla relatività generale

so in cui quest'ultimo ci avesse fatto condudere per un valore della somma degli angoli diverso da 180'. Per un convenzionalista seguace di Poincaré, è sempre possibile reinterpretare i risultati sperimentali che ci condurrébbero a postulare uno spazio fisico curvo introducendo delle ipotesi addizionali riguardanti il comportamento degli strumenti di misura. Per esempio, si può dire che esistono delle forze o degli effetti che non variano in modo differenziale tra sostanza chimica e sostanza chimica, ma che sono universali (Reichenbach), e che incurvano i raggi di luce e fanno accorciare o espandere i regoli a seconda ddla loro posizione nello spazio. Con questa ipotesi, ogni osservazione che apparentemente si discosti dalla geometria euclidea può essere reinterpretata in modo tale che tutto appaia come se ci fosse una curvatura, mentre lo spazio è in realtà piatto. La 6g. 27, in un esempio dovuto a Reichenbach, schematizza la situazione.3'

I I

N-E

S

I

I

I

I

N-E: universo non-euciideo E: universo euc1ideo con forze che contraggono diversamente il regolo in punti diversi dello spazio fig. 27

Nella linea superiore della 6gura di cui sopra, che rappresenta un universo a curvatura variabile a due dimensioni, abbiamo che in periferia vi sono caratteristiche geometriche eudidee (linee orizzontali). Al centro invece, ipotetici abitanti di tale mondo riscontrerebbero nelle loro misurazioni che la regione a sella S ha curvatura negativa, mentre la regione R Poincaré mori nel 1912, prima cioè della formulazione completa della teoria ddla relatività generale. La posizione che qui discutiamo sotto la generica etichetta di 'convenzionalismo' non è esattamente sovrapporubile alle tesi storicamente difese dal fisico matematico francese. Per le tesi di Poincaré, cfr. Poincaré, 1989.

' Come vedremo meglio in seguito, Reichenbach si differenzia dal convenzionalismo di Poincaré, perché ritiene, come Carnap, che una volta fissato il significato di certi termini teorici chiave in modo convenzionale, la scelta tra due geometrie sia un fatto empirico (Cfr. Carnap, 1966; si veda anche Bergia, 1995, p. 63). Naturalmente, considerando che per Reichenbach la definizione stessa di congruenza tra regoli in due posizioni diverse dello spazio è frutto di convenzione, in un certo senso anche la sua posizione sulla natura della memca è convenzionalista e daquesto punto di vista essa non si differenzia da quella di Poincaré.

La relatività generale 151

ha curvatura positiva. Immaginiamo che tale mondo sia costituito da una lastra di vetro piana in corrispondenza della regione euclidea, e da una emisfera che si unisce in modo continuo alla lastra piana nella regione non-euclidea. L'ombra proiettata dal regolo usato dagli abitanti del mondo superiore sulla lastra piana del mondo inferiore rappresenta la versione euclidea con forze universali che contraggono il regolo in corrispondenza della regione superiore non-euciidea. Si noti infatti che mentre le distanze misurate nelle regioni euclidee in comune sono le stesse, quelle in corrispondenza dei punti a curvatura positiva sono diverse: distanze che verrebbero giudicate uguali nel mondo non-euclideo sono diverse in quello eudideo con forze universali. Dato che tutti gli oggetti materiali si contraggono nella regione corrispondente alla gobba, gli abitanti di quest'ultimo mondo hanno le stesse esperienze di quelli del primo, e potrebbero interpretare le contrazioni del regolo come dovute alla curvatura dello spazio. I due mondi sembrano diversi solo da un punto di vista estrinseco o 3-dimensionale: abitanti confinati al mondo 2-dimensionale (punto di vista intrinseco) non potrebbero coglieme la differenza. En passant, è interessante osservare che di fronte a tale esempio un empirtsta direbbe semplicemente che siamo di fronte a due descrizioni alternative e perfettamente equivalenti dello stesso mondo. Ricordando anche l'idea di Duhem, secondo cui gli esperimenti cruciali non esistono, il convenzionalista insisterebbe invece sul fatto che i dati empirici di Gauss o quelli della deflessione luminosa — rilevati durante la famosa spedizione guidata da Eddington nd 1919 che confermò le predizioni di Einsteinpossono essere descritti in modo alternativo da due teorie rivali diverse, entrambe compatibili con essi, tra le quali la scelta è arbitraria. Indipendentemente da queste distinzioni tra posizioni empiriste e convenzionaliste, si deve notare che persino questa lettura convenzionalista non è in armonia con la prima posizione kantiana che abbiamo presentato (quella concernente la natura necessariamente euclidea del mondo fisico). Certo, si può argomentare, come fece Poincaré, che la descrizione implicante una geometria euclidea sia sempre da preferirsi all'altra perché pià semplice, ma è importante osservare che in questo modo il carattere di apoditticità o necessità che Kant attribuisce alla geometria eudidea come descrizione del mondo fisico andrebbe perduto. Il criterio di semplicità è notoriamente vago, e, oltretutto, la tesi di Poincaré sulla maggiore semplicità della scelta della descrizione euclidea è stata abbandonata, dato che la scelta della geometria non-euclidea senza forze universali potrebbe essere qualificata come più semplice per la fisica nel suo complesso rispetto a quella eudidea con l'aggiunta di tali forze. In ogni

152 1. Dalla relatività galileianaalla relatività generale

caso, indipendentemente dal problema di definire accuratamente la semplicità, operazione forse impossibile, un problema supplementare per il kantismo è dato dall'osservazione seguente: se, come sosteneva Reichenbach,non cè nessuna risposta empirica alla domanda se uno stesso regolo collocato in due punti diversi dello spazio misuri ta stessa lunghezza,k risoluzionedi taleproblema di congruenza deve esserefrutto di una scelta arbitrariao di una convenzione. Tale arbitrarietà toglie vigore alla tesi kantiana della necessità della geometria euclidea, dato che la scelta della geometria non-euclidea per descrivere lo spazio fisico è sempre possibi/e, malgrado possa essere qualificata come convenzionale perché non dettata da alcun fatto cogente. Dopo la scoperta delle geometrie non-eudidee, il dilemma del kantismo è dunque il seguente: o la geometria non-euclidea descrive correttamente lo spaziofisico reale, e allora latesi delcarattere sintetico della geometria euclidea è falsa o al massimo è vera solo in modo approssimato e locale, oppure la scelta della geometria euclidea èfrutto di una convenzione, come sostienePoincaré e in parte anche Reichenbach, e allora la tesi della sua aprioricttà o necessità èfalsa. In ogni caso, la tesi dd carattere sintetico a priori ddla geometria euclidea o di qualunque altra geometria sembra in

seria difficoltà. Analogamente, la questione della visualizzabilità delle superfici 3-dimensionali curve sembra includere un elemento di accidentalità, che toglie il carattere di necessità alla presunta natura eudidea della nostra intuizione spaziale. Abbiamo già visto che noi possiamo visualizzare "dall'esterno" superfici curve 2-dimensionali immergendole in uno spazio euclideo 3-dimensionale (la visualizzazione che Hermann Helmholtz chiamò estrinseca). Un seguace di Kant potrebbe allora chiedersi: come possiamo immaginarci "dall'interno" (cioè in modo intrinseco) uno spazio 3dimensionale curvo allo stesso modo in cui ci immaginiamo e ci rappresentiamo in modo intrinseco lo spazio 3-dimensionale euclideo? Limpossibilità di avere una tale esperienza intuitiva non è una prova del fatto che ogni nostra rappresentazione intuitiva dello spazio deve avere carattere eudideo? La risposta in questo caso non ha a che fare tanto con la nostra incapacità di fatto a intuire uno spazio piatto a 4 dimensioni in cui immergere lo spazio 3-dimensionale curvo (in analogia con il caso a 2 e 3 dimensioni). Qui il problema riguarda piuttosto il tipo di esperienze percettive spaziali che avremmo avuto se lo spazio fisico localmente non fosse stato approssimativamente euciideo, e non è riducibile alla conCome si ricorderà, questa è la seconda interpretazione della posirione kantiana nei confronti della geometria euclidea di cui sopra.

La relat ività generale 153

cepibilità del fatto che la misura della somma degli angoli di un triangolo può risultare maggiore di 180'. Infatti, dato che la concepibilità di una nozione non implica necessariamente la sua visualizzabilità, la non visualizzabilità (intuibilità) di fatto di un mondo non euclideo 3-dimensionale non implica la sua non concepibilità, e non può bastare da sola a confermare la tesi kantiana in questione. In effetti, contro l'argomento sulla non visualizzabilità che un ipotetico seguace di Kant potrebbe avanzare per difendere il carattere necessariamente euclideo ddlo spazio percettivo, si può controbattere che le difficoltà che abbiamo a visualizzare uno spazio curvo in modo intrinseco dipendono dalle percezioni della nostra infanzia, o da quelle della specie, che si è adattata a uno spazio approssimativamente eudideo o piatto. Siccome è fisicamente concepibile una curvatura spaziale che sia (controfattualmente) più marcata anche nel raggio di dimensioni tipico dell'esperienza umana, l'argomento anti-kantiano continua dicendo che è altrettanto concepibile che una specie si possa adattare a tale geometria terrestre non-euclidea, e avere perciò esperienze corrispondenti. Ne segue che noi non possiamo visualizzare uno spazio 3-dimensionale intrinsecamente solo per un problema di costituzione fisiologica e psicologica contingente, ciò che di nuovo sembra mettere in dubbio la tesi del carattere necessario della forma euclidea dello spazio sensibile. Addirittura, esiste un argomento ancora più forte per mostrare l'inadeguatezza dell'attribuzione di un carattere necessariamente euclideo allo spazio percettivo, dato che esso potrebbe di fatto, e non solo a livello di possibilità fisica o concettuale, essere non-euclideo. Alcuni recenti studi sulla visione hanno infatti ipotizzato in modo sofisticato che lo spazio percettivo binoculare non segue la legge euclidea dell'unica parallela, ma quella ddle molte parallele a una retta data tipica della geometria iperbolica di Lobacewski. Altri studiosi hanno successivamente messo in luce che la metrica dello spazio percettivo è riemanniana in certe circostanze, mentre è euclidea in linea generale (cfr. Cesa-Bianchi, Beretta e Luccio, 1979, pp. 206-207). Tali studi mostrano che la questione non ha ancora una chiara soluzione a livello psicologico, ma in ogni caso inficiano la tesi di Kant, dato che presuppongono la possibilità o addirittura l'attualità di una struttura non-eudidea del campo percettivo.

In definitiva, una difesa possibile di un teoria kantiana ddlo spazio deve limitarsi ad assumere delle tesi assai più deboli. Le relazioni spaziali dell'"essere tra" o dell'"essere l'uno accanto all'altro" potrebbero essere fornite a priori dalla mente umana come delle forme che organizzano spazialmente il contenuto dell'esperienza, cosi come la rdazione temporale

154 1. Dalla relatività galileiana alla relatività generale

dell'"essere l'uno dopo l'altro" le organizza temporalmente. Tuttavia, come si vedrà in 3.11.4, anche questo trinceramento della dottrina kantiana dello spazio non sembra salvaguardare il carattere sintetico a priori della geometria, euclidea o non-eudidea che sia. Inoltre, dal punto di vista di una prospettiva di tipo evoluzionista, il carattere a priori di tali relazioni spaziotemporali vale in linea di principio solo per il singolo organismo, dato che dal punto di vista della specie, tali strutture concettuali potrebbero benissimo essere state acquisite a posteriori, secondo il punto di vista del filosofo inglese ottocentesco Herbert Spencer. 3.11.4 Il formalismo La dottrina del carattere necessario (a priori) eppure informativo (sintetico) ddla geometria ricevette un colpo molto duro dalla concezione formalista hilbertiana della matematica. Per riassumere questa concezione con un motto di Einstein, "in tanto la geometria è certa in quanto è vuota, cioè non ci informa sul mondo, e in tanto ci informa su esso in quanto è incerta" In altre parole, per il formalismo, la matematica, e segnatamente la geometria, si divide in una parte pura e in una applicata. La prima costituisce un sistema assiomatico, o calcolo sintattico non interpretato, in cui compaiono termini come 'punto', 'linea retta' e 'tra' (i cosiddetti termini primitivi) il cui significato è dato implicitamente dagli assiomi in cui compaiono. In base a regole deduttive specificate una volta per tutte in anticipo, la geometria pura ci dà un insieme di teoremi derivato in modo puramente logico e non intuitivo dagli assiomi. Questa parte della geometria è a priori ma vuota di significato empirico, e dunque non sintetica nel senso di Kant. È solo collegando tali termini primitivi e tali teoremi con gli oggetti fisici quali i regoli o i raggi di luce che, secondo il formalista, la geometria pura diventa applicata e assume un significato empirico. Il punto centrale è che il modo di correlare gli oggetti matematici della parte pura con gli oggetti fisici è dato, neHa tradizione filosofica neopositivista dei Rudolf Carnap, Reichenbach e Emst Nagel, che furono molto influenzati dal formalismo, da definizioni coordinative, che essendo postulati che assegnano un significato parziale ai termini teorici ddla teoria, non hanno necessariamente un contenuto fattuale. Per meglio comprendere lo status di queste definizioni coordinative, si ricorderà che è tipico della concezione neopositivista delle teorie scientifiche il considerare una teoria scientifica come un insieme di enunciati, suddivisi a loro volta in enunciati teorici, enunciati osservativi ed enunciati misti. Come è ovvio dai loro nomi, i primi sono enunciati che contengono solo termini che si riferiscono a en-

La relatività generale 155

tità teoriche, cioè a entità non osservabili direttamente quali elettrone, atomo, molecola, ecc., i secondi contengono termini che denotano grandezze o entità osservabili, mentre i terzi, che sono in genere proprio le definizioni coordinative, contengono entrambi i tipi di termini, perché connettono i termini teorici con procedure empiriche di misura o con entità osservabili. Per esempio, interpretare 'geodetica tra due punti' come corrispondente a 'cammino di un raggio luminoso nel vuoto' ci dà una definizione coordinativa.

Tali definizioni (dette anche leggi ponte, o principi, o regole di corrispondenza) hanno sostanzialmente tre compiti, tutti molto importanti. In primis, esse connettono il formalismo non interpretato con il linguaggio osservativo, e permettono di assegnare dunque un contenuto sintetico alla teoria stessa. Inoltre, a seconda che esprimano un contenuto fattuale o convenzionale, ci permettono di suddividere la scienza in una parte fattuale e indipendente dalle convenzioni umane, e in una non empirica e convenzionale, una distinzione che si richiama in parte a quella kantiana tra contenuto e forma deHa conoscenza. Infine, esse ci permettono di uscire da un circolo vizioso simile a quello già incontrato nel problema della misurazione della velocità ddla luce in una sola direzione (" solo andata"). Per esempio, come è stato evidenziato da John Norton a proposito dell'argomento di Reichenbach sulla natura della geometria, da una parte non possiamo sapere se ci sono forze universali finché non conosciamo la geometria dello spaziotempo, ma dall'altra non possiamo conoscere la geometria di quest'ultimo se non sappiamo se ci sono forze universali. Un tale circolo vizioso è infranto proprio dalla scelta di una definizione coordinativa (Norton, 1992, pp.187-188). In un'ottica empiristica di questo tipo, il problema della "vera geometria" dello spaziotempo non si pone, dato che salvare la geometria euclidea introducendo forze universali che facciano contrarre i regoli in certe direzioni, o postulare che tali forze siano uguali a zero, non significa salvare la geometria euclidea dello spazio reale, ma cambiare le definizioni dei termini corrispondenti. Per questo motivo, un Reichenbach o un Eddington non ritengono di avere due teorie tra loro incompatibili tra cui scegliere (geometria euclidea con forze universali diverse da zero, o geometria non-euclidea con forze universali nulle), ma la stessa teoria formulata in modi diversi, ovvero con significati diversi da attribuire ai termini fondamentali in base a definizioni coordinative. Il motivo per cui non abbiamo due teorie diverse che si contraddicono dipende dal fatto che per avere una contraddizione, dobbiamo supporre che quando diciamo S e non-S, il termine S abbia lo stesso significato nei due casi, cosa che non avviene, secondo Reichenbach, se le definizioni coordinative cam-

156 1. Dalla relatività galileiana alla relatività generale

biano i significati delle "due" teorie. Detto in modo forse più perspicuo, la differenza tra un empirista e un convenzionalista sul problema della geometria del mondo fisico è che per il primo due teorie che in linea di principio hanno la stessa classe di conseguenze osservative sono in realtà k stessa teoria,mentre per il secondo esistono in realtà due teone tra cui si deve scegliere in base ad argomenti non empirici. L'interpretabilità multipla dei sistemi assiomatici e dei termini geometrici fa si che ci siano vari sistemi di geometria, e che nessuno di questi porti con sé una interpretazione privilegiata. D'altra parte però, una volta stabilito il criterio di congruenza, per il formalista-neopositivista il rapporto tra geometria e fisica non si risolve in modo puramente convenzionale. Allorché (1) una definizione di congruenza è stata convenzionalmente data, e si è deciso di trattare i regoli come aventi lunghezza costante o variabile in luoghi diversi dello spazio, e (2) i termini primitivi come "linea retta" o "punto" sono stati interpretati, la questione di stabilire quale sia la geometria che descrive il mondo fisico diventa empirica e non-arbitraria. Come si è anticipato in una nota precedente, questa rappresenta la principale differenza tra la concezione di un convenzionalista tout court à la Poincaré e quella dell'empirista Reichenbach. Dato che la geometria interpretata o applicata ha contenuto empirico, a questo punto dovrebbe anche risultare chiaro come il formalista risolva il problema ddl'efficacia della matematica nella descrizione del mondo fisico: le definizioni coordinative portano il peso esclusivo di trovare una corrispondenza tra oggetto matematico e oggetto fisico. Si noti però che l'atteggiamento formalista, che seppellisce l'intuizione matematica e quindi l'origine empirica di alcuni concetti matematici e geometrici sotto un puro calcolo di segni non interpretati, si trova poi in un posizione difficile quando deve rendere conto dd problema ddle applicazioni. Infatti se lo status delle definizioni coordinative, o principi ponte, non è fattuale, ma puramente convenzionale, e non riguarda la nostra conoscenza del mondo, allora non si riesce a rendere conto del perché la matematica possa applicarsi al mondo fisico. Come nel caso di una ddinirione di congruenza o di simultaneità (in cui per esempio si assume che un regolo cambia lunghezza durante il trasporto o che la relazione di simultaneità standard è più semplice di tutte le altre) le definizioni corrispondenti non sono né vere né false, ma solo più o meno utili a connettere una struttura fisica o un oggetto reale con un concetto, cosi come il metro standard di Parigi inteso come oggetto fisico concreto è connesso al concetto 'unità di lunghezza'. Si può perciò concludere affermando che il formalista non risolve il problema dell'efficacia della geometria nella descrizione del mondo fisico, ma

La relat ività generale 157

lo sposta, o meglio, lo riformula, nei termini della misteriosa "coincidenza isomorfica" tra le convenzioni date dalle definizioni coordinative con la struttura dd mondo fisico. Persino nd caso in cui la scelta di una regola di corrispondenza sia dettata da fatti empirici e non sia meramente convenzionale, come nelle procedure operative di misurazione di certe grandezze fisiche, la corrispondenza che connette un concetto geometri-

co come quello di geodetica con qudlo empirico di raggio di luce nel vuoto è lasciata inspiegata. In quale direzione dobbiamo dunque cercare di trovare una soluzione al problema della "irragionevole efficacia" della geometria nella descrizione del mondo fisico? 3.11.5 Il convenzionalismo della metrica e la disputa tra sostanzialisti e relazionist i Prima di indicare una via possibile per rispondere a questa domanda, è opportuno presentare un altro argomento di tipo convenzionalista in favore dd carattere non fattuale ddla metrica dello spaziotempo, formulato da Griinbaum nel 1963. Piuttosto che far riferimento a questioni epistemiche del tipo analizzato sin qui, tale argomento si richiama alla natura continua dello spazio. Mentre gli argomenti epistemici di Reichenbach facevano ricorso alla non-verificabilità in linea di principio di ipotesi sulla lunghezza di un regolo in due punti diversi dello spazio, quelli di Griinbaum si richiamano a una tesi riduzionista e relazionista. Prima di riportare l'argomento di Griinbaum, ricordiamo che il rdazionista ritiene che spazio e tempo (lo spaziotempo) altro non siano che delle relazioni spaziali e temporali (spaziotemporali) esistenti tra eventi o oggetti fisici, mentre il sostanzialista ritiene che spazio e tempo (lo spaziotempo) esistano in modo indipendente da tali eventi e oggetti. In particolare, Griinbaum sostiene che se lo spazio fosse discreto o "granulare", la distanza tra due punti potrebbe essere definita in modo naturale dal numero di elementi atomici o unità discrete che lo compongono. Per determinare la distanza tra due punti, basterebbe contare tali unità. Ma, continua Grunbaum, lo spazio e il tempo hanno la struttura di un continuo, e sono perciò almeno densi: tra due punti qualsiasi, esiste un numero infinito (più che numerabile) di punti. E allora è solo la scelta di un particolare standard di congruenza, esterno allo spazio stesso, che può stabilire la congruenza tra due segmenti qualsiasi. Contro Newton e il primo Russell, Griinbaum insiste sul fatto che la relazione di congruenza tra due intervalli non è intrinseca allo spazio e quindi percepibile direttamente, ma è il frutto di una stipulazione definitoria che non è vincolata ad alcun fatto a esso relativo. In altre parole, finché non c'è una defini-

158 1.D allarelatività galileiana alla relatività generale

zione di congruenza, non c'è alcuna questione empirica riguardante la metrica dello spaziotempo. Grunbaum ha certamente ragione nel sottolineare che mentre uno spazio fisico discreto permetterebbe di definire la metrica a partire dalla proprietà topologica ddla cardinalità (il numero di punti) e da altre rdazioni di ordine, negli spazi continui tale definizione è impossibile. Ma tale argomento da solo non basta a concludere in favore della convenzionalità della metrica, dato che al massimo stabilisce che negli spazi continui la metrica è non definita in base ad altre entità, ossia è un'entità primitiva. È stato quindi notato da parte di più critici che l'argomento di Grunbaum è basato su una più o meno imphcita premessa riduzionista, che è analoga a quella già vista a proposito della teoria causale del tempo. Nel caso della metrica spaziale, tale premessa afferma che le uniche proprietà e rekzioni spaziotemporali che esistono in modo fattuale sono quelle defi-

nibili da proprietà topologiche e relazioni d'ordine(cfr. Friedman, 1983, pp. 301-309). Il fatto che gli spazi continui siano oggettivamente metricamente "amorfi" è dunque una conseguenza di questa assunzione di tipo relazionista e anti-sostanzialista, perché tali spazi in effetti non permettono una definizione della metrica in termini di proprietà topologiche quali la cardinalità. Possiamo dunque dire che mentre Reichenbach è un relazionista perché è convenzionalista (per motivi di teoria della conoscenza, egli ritiene che non ci sia modo di sapere se intervalli spaziali distinti sono congruenti), per Griinbaum è il relazionismo che motiva il convenzionalismo. Cosi come la questione che era sorta spontanea trattando la teoria causale del tempo consisteva nel chiedersi perché una rdazione temporale debba essere de6nibile a partire da una relazione causale tra eventi, ora ci si può domandare con il sostanzialista perché le proprietà e le relazioni metriche non dovrebbero essere tra quelle spaziotemporalmente primitive o basilari. Dopotutto, la teoria della relatività generale considera lo spaziotempo non più come inerte, ma come causalmente attivo, un fatto che potrebbe farei propendere per una interpretazione realista e non relazionista del suo status ontologico. La metrica dello spaziotempo della relatività generale è infatti dipendente dalla distribuzione della materiaenergia. Partendo da questo assunto, un argomento sostanzialista che respinge il riduzionismo di Griinbaum fa in genere presente che la decisione di quali proprietà e relazioni spaziotemporali vadano considerate come primitive dipende dalle postulazioni della nostra teoria migliore o meglio confermata. Se tale teoria postula le proprietà metriche come esplicative, come la relatività generale fa nel caso della gravitazione vista come un incurvamento dello spaziotempo, allora tali proprietà vanno as-

La relatività generale 159

sunte come fondamentali e dunquereali. È questa per esempio la linea di Friedman. È curioso notare che proprio tale dipendenza ddla metrica relativistica dalla materia-energia è stata utilizzata da Griinbaum per difendere una posizione rdazionista: dato che la metrica ndla relatività generale varia in base alla distribuzione ddla materia-energia in una certa regione spaziotemporale, lo spazio vuoto di per sé sarebbe per Grunbaum metricamente amorfo, in quanto una sua diversa metrizzazione dipenderebbe dalla materia-energia presente in quella regione. Ma si noti che questo non è né un argomento per il relazionismo — difatti esistono soluzioni delle equazioni di campo di Einstein in cui non c'è materia-energia, ma la metrica è perfettamente definita — né un argomento per il convenzionalismo, dato che seppure la materia in una particolare regione determina la metrica di quella regione con le limitazioni ora viste, non abbiamo alcuna scelta da compiere per definire la metrica da adottare una volta che si consiregione. deri una p Friedman ha dunque ragione nell'osservare che Grunbaum confonde il carattere dinamico ddlo spaziotempo nella relatività generale con il relazionismo e il convenzionalismo. D'altra parte, però, anche il sostanzialismo di Friedman è basato su un controverso argomento del tipo "inferenza alla migliore spiegazione". Lidea di questo argomento è che ciò che è postulato dalla migliore spiegazione disponibile (quella cioè che unifica i dati empirici in un particolare settore ddla nostra conoscenza scientifica) esiste in modo indipendente dalla mente. Tale inferenza è però assai dibattuta nella filosofia della scienza (cfr. van Fraassen, 1980) e andrebbe quantomeno rafforzata dall'argomento supplementare che solo le spiegazioni di tipo causale permettono di inferire, se corrette, l'esistenza delle entità da esse postulate. Comunque si giudichi la questione del sostanzialista dal punto di vista dell'inferenza alla migliore spiegazione, un ulteriore argomento in favore di una posizione relazionista di tipo leibniziano (si ricordi l'epistolario con il newtoniano Samuel Clarke, cfr. Leibniz, 1963) è stato recentemente avanzato da John Earman e John Norton, e in letteratura è stato battezzato "l'argomento del buco" (hole argurnent) (cfr. Earman e Norton, 1987). Nella formulazione di tali due studiosi, si presuppone che il sostanzialismo sia impegnato a considerare qualunque moddlo della teoria della relatività generale di Einstein come un mondo fisicamente possibile. Si consideri il celebre argomento di Gottfried W. Leibniz basato sull'indiscemibilità. Il

articolare

Si è visto precedentemente che le soluzioni "vuote di materia" delle equazioni di Einstein rendono assai difficile stabilire quanto macbiana o "generai-relativistica" sia davvero la relatività generale.

160 1. Dalla relatività galileiana alla relatività generale

relazionista Leibniz chiede al sostanzialista newtoniano S. Clarke se un mondo in cui si scambino l'Est con l'Ovest sarebbe identico a quello attuale, ndl'ipotesi che tutte le altre relazioni spaziali rimangano le stesse. Tale "scambio" tra i due punti cardinali può essere immaginato come una rotazione dei punti dello spazio. Tale rotazione lascia tutti gli oggetti nel-

la loro posizione, scambiando i luoghi (punti) spaziali occupati dai corpi a Est con i luoghi di quelli che prima erano a Ovest. Mentre il relazionista Leibniz condudeva il suo esperimento mentale dicendo che i due mondi cosi ottenuti sono da considerarsi identici perché indistinguibili, il sostanzialista si dovrebbe impegnare a dire che essi sarebbero comunque fisicamente diversi, perché i corpi sono collocati in luoghi spaziali diversi. Per chiarire bene la differenza tra una posizione sostanzialista e una relazionista, Earman e Norton hanno suggerito un modo di tradurre tale argomento leibniziano in termitu della teoria della relatività generale. Se M indica la varietà riemanniana e g il tensore metrico, un modello M della teoria è dato dalla coppia ordinata ( M, g >. Sia dato un altro modello M' = ( M ' , g' >, e una trasformazione h da M in M' che sia non solo infinitamente derivabile insieme alla sua inversa h ', ma anche tale da preservare la struttura differenziale di M. Allora h si chiama diffeomorfismo e si ha che i due modelli diffeomorfi M e M' tali che M' = h(M) e g' = h(g) sono entrambi modelli deHa teoria. Malgrado la metrica g' sia diversa in generale da g, si può passare daUe proprietà deH'una alle proprietà deH'altra attraverso h. L'idea leibniziana deH'argomento di Earman e Norton è che mentre per un relazionista i due modelli rappresentano lo stesso mondo possibile, per il sostanzialista essi sono mondi diversi. Si immagini ora un buco in un intorno qualsiasi dello spaziotempo riemanniano della relatività generale, e si immagini altresi che i due modelli M e M' siano identici ovunque tranne che ndla regione del buco. In particolare, mentre le metriche g e g' = h(g) sono uguali ovunque, nel buco esse differiscono in modo continuo. Si definisca ora il determinismo come quella dottrina secondo cui due mondi possibili che siano identici in un certo istante del tempo, rimangono identici in ogni istante successivo e precedente. L'indeterminismo prevede invece una biforcazione di mondi nd futuro o nel passato, dato che neH'indeterminismo identici presenti sono compatibili con diversi futuri o passati possibili. L'argomento di Earman e Norton è che il peculiare indeterminismo della teoria della relatività generale che il sostanzialista è impegnato ad accettare rende la sua stessa posizione non sostenibile. Si ricordi infatti che il sostanzialista considera i due modelli che differiscono solo nd buco come rappresentanti due mondi possibili diversi. Allora supponiamo di avere tutte le informazioni disponibili sullo spaziotempo prima e dopo il bu-

La relat ività generale 161

co: ciò dovrebbe metterci in grado di stabilire quale traiettoria spaziotemporale seguirà una particdla nel buco. Invece questo compito si rivela impossibile, perché una teoria può specificare il suo modello solo a meno di un diffeomorfismo: ossia, non possiamo determinare quale traiettoria la particella seguirà nel buco, perché le due metriche hanno identiche proprietà osservabili, anche se nel buco esse collegano tra loro punti diversi. In altre parole, se si crede che i due modelli diffeomorfi siano mondi possibili diversi e non lo stesso mondo, si deve ammettere un fal-

limento dd determinismo, perché gli stessi dati iniziali prima del buco (lo stesso "presente") origina due futuri possibili diversi nella regione coincidente col buco, per quanto piccola esso sia. Il punto di tutto questo argomento è che la verità o falsità del determinismo non può dipendere da una scelta metafisica quale quella dd sostanzialismo, ma solo da argomenti fisici. Invece in questo caso il sostanzialista è impegnato ad accettare l'indeterminismo per motivi metafisici, e ciò non è plausibile. La questione dell'esistenza e dunque dell'identità dei punti spaziotemporali della varietà differenziale non può avere una conseguenza fisica cosi significativa quale quella del fallimento del determinismo. Il vantaggio del relazionista sarebbe che egli considera i due modelli diffeomorfi come identici, e la sua posizione non lo impegna nei confronti di alcuna forma di indeterminismo, lasciando alla fisica il compito di stabilire se il determinismo sia vero a falso, Varie obiezioni sono poi state proposte a questo argomento. Per esempio, si può ribattere a Earman e Norton che la particolare forma di indeterminismo verso cui è impegnato il sostanzialista non è un vero e proprio determinismo fisico, ma solo un determimsmo di tipo metafisico, e dunque irrilevante e innocuo per la fisica. Oppure si può cercare di replicare all'argomento di cui sopra ricorrendo a una strategia essenzialista, seguendo Tim Maudlin (cfr. Maudlin, 1990). Se i punti spaziotemporali sono individuati essenzialmente dalle loro proprietà metriche, un certo punto dello spaziotempo non potrebbe essere ciò che è a meno che non abbia le proprietà che gli sono assegnate dal tensore metrico. In tal modo, al massimo un modello tra tutti i modelli diffeomorft del& teoria di Einstein è fisicamente posstbik. Tutti gli altri, che assegnano a qud punto una metrica differente, risultano fisicamente impossibili, e in tal modo l'argomento che conduce il sostanzialista all'indeterminismo è bloccato. Insomma, per Maudlin, modelli diffeomorfi non rappresentano mondi fisicamente possibili, mentre per Norton è la teoria fisica, e non un intuizione filosofica a priori che deve stabilire la nozione di 'fisicamente possibile' (Norton, 1988). Il problema della teoria di Maudlin è naturalmente come conciliare una posizione secondo cui i punti spaziotemporali non

162 1. Dalla relatività galileianaalla relatività generak

potrebbero essere diversi da come sono (ciò che potremmo chiamare essenzialismo metrico) con una teoria come la rdatività generale, in cui lo spaziotempo e la metrica dipendono in modo contingente dalla materia in esso presente. Mentre per una valutazione ulteriore della forma di essenzialismo invocata da Maudlin rimandiamo il lettore all'eccellente rassegna di Andreas Bartels (cfr. Bartels, 1993), condudiamo sottolineando ancora una volta le connessioni strettissime tra teorie geometriche, teorie fisiche e teorie metafisiche con cui avevamo aperto questo paragrafo. Geometria, fisica e filosofia sono davvero da considerarsi tre sorelle gemelle, le cui dissomiglianze superficiali mettono ancora più in rilievo la loro identità genetica di fondo.

Bibliogra6a Testi di Einstein Einstein A. (1917), Rektività: esposizione divulgativa, Boringhieri, Torino 1980, EinsteinA. (1921-1959), Il significatodella relatività, Bo ringhieri,Torino 1980.

Einstein A. (1988), Opere scelte, Bollati Boringhieri, Torino. Schilpp P. (a cura di) (1949), Albert Einstein: scienziato e filosofo, Boringhieri, Torino 1958.

Testistorici e storico-filosofici Agazzi E. (1995), I diversi volti del tempo, in E.Agazzi (a cura di), Il tempo nella scienza e nella filosofia, Guida, Napoli, pp. 19-75. Bellone E. (1989), I nomi del tempo,Bollati Boringhieri, Torino. BergiaS. (1995), Dal cosmo immutabile all'universo in evoluzione, Bollati Boringhieri, Torino. Barbour J. (1989), Absolute or relative motion?, Cambridge University Press,

Cambridge. Boniolo G. (1988), Mach e Einstein. Spazio e massa gravitante, Armando Ed., Roma. Boniolo G. (1992), Theory and experiment. The case fothe Eovos' expenments,

in "Brit. J. Phil. Sci.", n. 43, pp. 459-486. Boniolo G. (1997),On a unified theory of models and thought experimentsin natural sciences, in "International Studies in the Philosophy of Science".

Brown H.R., Sypel R.(1995), On the meaning of the relativity principle and other symmetries, in "Intemational Studies in the Philosophy of Science", n. 9, pp.

235-253. Eulero L. (1770), Lettres a une princesse dAllemagne, Einaudi, Torino 1944. Godei K. (1949), A remark about the rektionship between relativity theory and

idealistic philosophy,in PA. Schilpp (a cura di), Albert Einstein: scienziato efilosofo, Boringhieri, Torino 1958, pp. 555-563. Holton G. (1973), Thematic origi n of sci entific thought, Harvard University Press, Cambridge (Mass.). Ives H.E. (1952), Derivation of the mass-energy relation, in " Journal of the optical Societyof America", n. 42, pp. 540-544. Jammer M. (1954),Storia del concetto di spazio, Feltrinelli, Milano 1981.

JammerM. (1961),Storia del concetto di massa, Feltrinelli, Milano 1974. Leibniz G. (1963), Saggi filosofici e lettere, Laterza, Roma-Bari. Mach G. (1883), La meccanica nel suo sviluppo storico-critico, Boringhieri, Torino 1977.

Miller A.I. (1981), Albert Einstein's special theory of rektivity, Addison-Wesley, Reading (Mass). Norton J. (1984), Hoiv Einstein found his field equations: 1912-1915, in "Hist. Stud. Phys. Sci.", n. 14, pp. 254.

164 1.D allarelatività galileiana alla relatività generale

Okun L.B. (1989), The concept of mass (mass, energy and rektivity), in "Soviet Physics Usp.", n. 37, pp. 629-638. Pais A. (1982),Sottile èil signore..., Boringhieri, Torino 1986. Pauri M. (1995), Spazio e Tempo, in Enciclopedia delle Scienze Fisiche, Istituto dell'Enciclopedia Italiana, Roma, voi. V, pp. 433-463. Ryckman T., Weyl, Reichenbach and the epistemology of geometry, in "Stud. Hist. Phil. Sci.", 1994, n. 25, pp. 831-870. Torretti R. (1978), Philosophy of geometry from Riemann to Poincaré, Reidel, Dordrecht. Torretti R. (1983), Relativity and geometry, Pergamon Press, Oxford.

Testi introduttivi Agazzi E., Palladino D. (1978), Le geometrie non euclidee e i fondamenti della geometria, A. Mondadori, Milano.

Adler C.G. (1987),Does mass really depend on veloci ty, dad?, in "American Journal of Physics", n. 55, pp. 739-743. Angel R.B. (1980), Relativity: the theory and its philosophy, Pergamon Press, Oxford. Carnap R. (1966), I fondamenti filosofici della fisica, il Saggiatore, Milano 1971. Cattaneo C. (1987), Appunti di meccanica relativistica, Editrice Universitaria di Roma, Roma. Cesa Bianchi M., Beretta A., Luccio R., La percezione, Franco Angeli, Milano

1979. Born M. (1921-1962), La sintesi einsteiniana, Boringhieri, Torino 1980.

Ellis G.F.R., Williams R.M. (1988), Fiat and curved space-times,Clarendon Pt'ess, Oxford. Geroch R.(1978), Relativity from A to B, University of Chicago Press, Chicago. NortonJ. (1992), Philosophy of space and time, in W. Salmon et al. (a cura di), Introduction to the philosophy of science,Englewood Cliffs, New Jersey, Prentice Hall, Penrose R.(1989), La nuova mente dellimperatore, Adelphi, Milano. Penrose R.(1994), Ombre della mente, Rizzoli, Milano 1996. Resnick R. (1972), Relativity and early quantum theory, J.Wiley, New York. Salmon W. (1980), Space time and motion, University of Minnesota Press, Minneapolis.

Sklar L. (1974),Space, time, spacetime, University of California Press, Berkeley. Taylor E.E., WheelerJ.A. (1963), Spacetime physics, Freeman, San Francisco. Wigner E. (1960), The unreasonable effect iveness of mathematicsin the natural sciences,in "Communications in pure and applied mathematics", n. 13, pp. 1-14.

Testi di fisica AlonsoM., Finn E.J. (1967), Fundamental uniyersity physics,Addison Wesley, New York.

Bibliografia 165

BoasM. (1983), Mathematical methodsin the physical sciences, J.Wiley and Sons, New York. De FeliceF., Garke C.J.S. (1992), Relativity in curved manifolds,Cambridge Universisty Press, Cambridge.

Fleming G.(1996), Just hotv radicalis hyperplane dependence,in R. Clifton (ed.), Perspectives on quantum reality, Kluwer, Dordrecht, pp. 11-29.

FochV. (1961), The Theory of Space, Time and Gravitation, Pergamon Press, Oxford. D'Inverno R. (1992), lntroducing Einstein s relativity, Oxford University Press,

Oxford. Landau L.D., Lifsits E.M. (1976), Teoria dei campi, Ed. Riuniti, Roma. Misner C.W.,Thorne K.S., Wheeler J.A. (1973), Gravitation, W.A. Freeman and C., S. Francisco.

Pauli W.(1921), Teoria delk relatività, Boringhieri, Torino 1958. RindlerW. (1961), Length contraction paradox, in "Am. J. Phy.", pp. 365-366. Rindler W. (1977), Essential relativity, Springer Verlag, New York. Schutz R.F. (1985), A first course in generai relativity, Cambridge University Press, Cambridge. Wald R. (1977), Space, ttrne and gravity, University of Chicago Press, Chicago. Wald R. (1984), Generai relativity, Chicago University Press, Chicago. Weinberg S.(1972), Gravitation and cosmology,J. Wiley and Sons, New York. Weyl H. (1918), Space, time, matter, Dover, New York 1952.

Testi filosofici BartelsA. (1993), Traditional and modem essentialism and the problem of individuation of Spacetime Points, in Semantical Aspect of Spacetime Theories,19923, pubblicazione dd Zentrum fiir Interdisziplinare Forschung, Universitàt Bie-

lefeld, preprint. Beli J.S. (1987), Speakable and unspeakable in quantum mechanics, Cambridge University Press, Cambridge. Bergia S. (1995), Formulari interpretazioni ideologie: il caso delle teorie relativi-

stiche,in G. Giuliani, Ancora sul realismo,La Goliardica Pavese, Pavia, pp. 4769. Boniolo G. (1995), La matematica nella fisica: segno o miracolo?, in "Epistemologia", n. 18, pp. 313-340. Cassirer E. (1921), Sulla teoria della relatività di Einstein, La Nuova Italia, Firenze, 1973.

Capek M. (1961), The philosophicalimpact of contemporary physics,D. Van Nostrand Co., Princeton. Gifton R. (1989), Some recent controversy over the possibility of experimentally deterrnining isotropy in the speed of light, in "Philosophy of Science", n. 56,

pp. 688-696. Gifton.R„Hogarth M. (1995), The definability of obj ective becoming in Minkotvski spacetime,in "Synthese", n. 103, pp, 355-387.

166 1.D allarelatività galileiana alla relatività generale

Dorato M. (1994),La realtà del futuro e la relatività speciale,in "Rivista di Filosofa", n. 85, pp. 457-474. Dorato M. (1995), Time and reality. Spacetime physics and the objecttvity of temporal becoming,Clueb, Bologna. Dorato M. (1996), Three views of the relationshi p bettveen time and reality, in J. Faye, U.Scheffler, M. Urchs (a cura di),Perspectives on time, Kluwer, Dordrecht. Dorato M. (1997), Futuro aperto e libertà, Laterza, Bari.

Earman J. (1970), Who's afraid of absolute space?,in "Australasian Journal of Philosophy", n. 48, pp. 287-319. Earman J. (1989), Word enough and space-time: absolute versus relational theo-

ries of space and time,The MIT Press, Cambridge (Mass.). EarmanJ., Norton J.(1987), What price spacetime substantivalism: the hole story, in "British Joumal for Philosophy of Science", n. 38, pp. 515-525. Field H. (1980), Science without numbers, Princeton University Press, Princeton.

Field H. (1989),Realism, mathematics and modality, Blackwell, Oxford. Van Fraassen B.(1980), Limmagine scientifica, Clueb, Bologna 1985. Friedman M. (1983), Foundations of space-time theories, Princeton University Press, Princeton.

God&ey-SmithW. (1979), Special relati vtty and the present, in "Philosophical Studies" n. 36, pp. 233-244. GriinbaumA. (1973), Philosophical problem of space and time, Reidel, Dordrecht. Gunn D., Vetharaniam I. (1995), Relativistic quantum mechanics and the conventionality of simultaneity, in "Philosophy of Science", n. 62, pp. 599-608.

Horwich P.(1987), Asymmetries in time, The MIT Press, Cambridge (Mass.). Hughes R.I.G. (1989), The structure and interpretation of quantum mechanics, Harvard University Press, Harvard. Kroes P. (1985), Time: its structure and role in physical theories, Reidei, Dordrecht. Malament D. (1977), Causai theories of time and the conventionality of simulta-

neity, in "Nous", n. 11, pp. 293-300. Maddy P. (1990), Realismin mathematics, Clarendon Press, Oxford. Maudlin T. (1990), Substances and space-time: tvhat Aristotle tvould bave said to

Einstein, in "Studies in History and Philosophy of Science", n. 33, pp. 341-344. Maudlin T. (1994), Quantum non-locality and relativity, Blackwell, Oxford. Mellor D., Real time, Cambridge University Press, Cambridge. Nerlich G. (1994 ), The shape of space,Cambridge University Press, Cambridge. Norton J.(1989), The hole Argurnent, in Proceedings of the 1988Biennal Meeting of the Philosophy of Science Association,voi. 2, pp. 56-65. Poincaré H. (1989), Opere epistemologi chevoi. I (La scienza e l'ipotesi II valore della scienza),voi. Il (Scienza e metodo; Ultimi pensieri),Piovan Ed., Abano Terme (Pd). Prior A. (1967), Past, present andfuture, Oxford University Press, Oxford. Putnam H. (1967), Time and physical geometry, in " Joumal of Philosophy", n. 64, pp. 240-247.

Bibliografia 167

Reichenbach H. (1956), The directton of time, University of California Press, Berkeley. Reichenbach H. (1958), La filosofia dello spazio e del tempo,Feltrinelli, Milano 1977. Rietdijk C. (1966), A rigorous proof of determinism derived from the special theory of relativity, in "Philosophy of Science", n. 33, pp. 341-344. RobbA. (1914), A theory of time and space,Cambridge University Press, Cambridge. Rota G.C. (1994), Pensieri discreti, Garzanti, Mùano. Sahnon W. (1980), Space, time and motion, University of Minnesota Press, Min-

neapolis. Sahnon W. (1984), Scientific explanation and the causai structure of the world, Princeton University Press, Princeton.

Stein H. (1968), On Einstein-Minkowski spacetime, in "Joumal of Philosophy", n. 65, pp. 5-23. Stein H. (1991), On relativity theory and the openness of the future, in "Philosophy of Science", n. 58, pp. 147-167. Sklar L. (1985), Philosophy and spacetime physics,University of California Press, Berkeley. Zangari M. (1994), A new twist in the conventionality of simultaneity debate, in

"Philosophy of Science", n. 61, pp. 267-275.

2. Problemi fondazionali e metodologici in cosmologia di Silvio Bergia

1. La cosmologia come disciplina scientifica

1.1 Osservazioni di natura cosmologica Nei primi anni sessanta, Arno Penzias e Robert Wilson, due ricercatori della Beli Telephone, stavano studiando, nei laboratori di questa impresa a Holmdel, vicino a Princeton, nel New Jersey, un'antenna usata per le telecomunicazioni via satellite. Per migliorare la qualità delle telecomunicazioni, si deve cercare di eliminare i disturbi, qudlo che si chiama il rumore radioelettrico. Nel maggio del '64, Penzias e Wilson avevano cominciato a impiegare la loro antenna per misurare il rumore radioelettrico proveniente dallo zenit. Dedotti vari effetti, rimaneva un rumore residuo che risultò ineliminabile. Nell'anno seguente, essi si resero conto che lo stesso rumore era captato da ogni direzione. Inoltre constatarono che non subiva variazioni stagionali. Gradualmente risultò che esso non era prodotto dalla superficie terrestre, né da qualunque sorgente

localizzabile. Si tratta, come il lettore informato avrà capito, della scoperta della cosiddetta radiazione cosmica di fondo, una scoperta di straordinario interesse scientifico, sulla cui rilevanza nello sviluppo della cosmologia contemporanea dovrò tornare. Essa mi interessa qui però per un aspetto che si presta a una considerazione di carattere metodologico. Come ho appena accennato, non risultò possibile individuare per la radiazione in questione alcuna sorgente specifica. In termini suggestivi, ma non per questo scorretti, si può dire che la sua sorgente è l'universo nel suo complesso. Sembra adeguato chiamare osservazioni astronomiche o astrofisiche, che presentino la caratteristica di non riguardare oggetti singoli, osservazioni di natura cosmologica (ONC). La possibilità, e l'effettiva esistenza, di osservazioni di questo tipo fornisce un primo indizio circa la possibilità di individuare una disciplina con un suo proprio statuto, in grado di distinguerla dall'astronomia e dall'astrofisica con le quali condivide strumenti e metodi di osservazione. È lungi da me l'intenzione di procedere a un'apodittica dettatura di un tale statuto: sono consapevole dell'esistenza di posizioni che giungono a contestare la stessa possibilità di una cosmologia scientifica, un tema sul

quale ritornerò diffusamente. Non nascondendo che il mio scopo finale è proprio quello di indicare l'esistenza di un metodo caratteristico della

meto dologiciincosmologia

172 2. Problemi fondazionali e

cosmologia, mi propongo piuttosto di perseguirlo seguendo un percorso spiraleggiante, dove con l'immagine intendo suggerire il graduale ap-

profondimento e la graduale de6nizione dei problemi. 12 Osservazioni con valenza cosmologica Un'osservazione di natura cosmologica è da sempre alla portata di tutti i vedenti: il cido notturno è nero, fatta eccezione per un gran numero di sorgenti puntiformi o comunque (è il caso dei pianeti) molto piccole. L'osservazione ha una natura cosmologica, nel senso che ho tentato di delineare sopra, se, con un'estrapolazione che tutti o quasi sarebbero disposti a fare, ci sentiamo di affermare che un osservatore, ovunque collocato nell'universo, purché al di fuori di una qualsiasi forma di atmosfera, farebbe la stessa osservazione. E d'altra parte l'inferenza è confortata dall'esperienza diretta di un paio di generazioni di astronauti. Questa stessa esperienza conforta anche l'altra inferenza: che, in un cielo privo di at-

mosfera, anche il Sole splenderebbe in un cielo nero. Un piccolo inciso: il cielo diurno è luminoso perché l'atmosfera diffonde la luce solare. Non sembra legittimo considerare questo asserto come dettato dalla sola osservazione: la conclusione è raggiungibile sulla base ddl'osservazione e di conoscenze fisiche. Cosi è anche allora l'inferenza che osservatori collocati al di fuori di ogni atmosfera osserverebbero un cielo nero. L'esempio ci dice che forse non esistono ONC pure. Ma a credere che in qualunque disciplina scientifica esistano dati che si possano considerare assolutamente puri, non "intrisi di teoria",' non sono forse rimasti in molti. In questo la cosmologia non può fare eccezione. Osservazioni di carattere cosmologico sono probabilmente sempre tali solo se accompagnate da clausole che siamo disposti a stipulare sulla base delle conoscenze fisiche correnti. Forse che l'osservazione pura di Penzias e Wilson non presuppone la tacita assunzione che la strumentazione usata obbedisce alle leggi note della fisica? Nei due esempi considerati, peraltro, il peso delle clausole che stipuliamo sembra lieve: non per nulla ho voluto sopra parlare di un'estrapolazione che tutti o quasi saremmo disposti a fare; e, d'altra parte, come pure ho voluto sottolineare, abbiamo in qud caso il conforto di osservazioni dirette, sia pure in ambito limitato; quanto poi alla strumentazione di Penzias e Wilson, porre in dubbio ' Provo ad esprimere cosi in italiano quello che nella filosofia della scienza di lingua inglese è reso con "theory laden". Lautore che ha probabilmente posto la maggior enfasi su questo punto è Norwood Russell Hanson.

La cosmologia come disciplina scientifica 173

il suo corretto funzionamento equivale a vietarsi la possibilità di ogni ricerca fisica. Diverso è il discorso se da una ONC vogliamo trarre conclusioni su proprietà dell'universo. Chiamerò osservazioni con valenza cosmologica (OVC) osservazioni che potenzialmente permettano di trarre delle condusioni sull'universo (sull'universo visibile o addirittura sull'intero universo — se pure il concetto ha un senso). Ci si può senz'altro aspettare che l'attribuzione di una valenza cosmologica a una ONC implichi in generale la stipulazione di clausole più forti di qudle testé discusse. Esaminerò qui due casi in quanto permetteranno di raggiungere qualche conclusione interessante. Il primo è proprio qudlo dell'oscurità del cielo notturno. Si può dimostrare che questo "dato", accompagnato da alcune clausole basate su conoscenze fisiche comunemente accettate, esclude che possano valere congiuntamente le quattro proposizioni seguenti: — l'universo è spazialmente infinito e mediamente omogeneo; — l'universo è esistito da sempre; — le proprietà medie ddl'universo sono stazionarie; — l'universo è, su larga scala, statico. La comprensione corretta delle quattro proposizioni richiede qualche precisazione. L'avverbio "mediamente" è necessario in quanto è evidente la disomogeneità spaziale ddl'universo su scale anche molto grandi. Quest'ultimo asserto richiederebbe a sua volta una definizione rigorosa di omogeneità, che intendo rimandare a una tornata successiva della spirale. Basti al momento indicare che la presenza di concentrazioni di materia, nei corpi celesti, ma anche nelle galassie, viola l'omogeneità spaziale, che sarà eventualmente raggiungibile solo su scale cosi grandi che queste disomogeneità si possano trascurare, un po' come le catene montuose sono un'irregolarità locale trascurabile per chi studia la forma geometrica della Terra.3 Analoga rilevanza hanno l'aggettivo "medie" nella terza proposizione e l'inciso "su larga scala" nella quarta. L'incompatibilità delle quattro proposizioni con l'oscurità del cielo not-

Sto qui proponendo una versione leggermente modificata ddl'insieme di proposizioni individuate come essenziali da Hermann Bondi nel 1952 e da lui riprese successivamente (Bondi, 1960; cfr. anche Harrison, 1987, p. 189). Nella lista originale di Bondi, la seconda e la terza proposizione sono conglobate nella singola affermazione: «L'univeiso non muta nel tempo»; qui preferisco distinguere fra "eternità" e "stazionarietà"; Bondi aggiunge un'ulteriore proposizione che qui si preferisce lasciare sullo sfondo in quanto sembra avere un ruolo meno specifico: «Le leggi della fisica, quali le conosciamo, si applicano ovunque ne)l'universo». ' «[...] il nostro procedimento [in generale quello dei cosmologi teorici, n.d.r.] ha qualche somiglianza con quello dei geodeti che, per mezzo di un dissoide, si approssimano alla forma della superficie terrestre, che su piccola scala è invece molto complicata» (Einstein, 1917).

174 2. Problemi fondazionali e metodologici in cosmologia

turno è nota come paradosso di Olbers, dal nome dell'astronomo che la riscopri nel 1823. Mostrare che essa sussiste effettivamente è piuttosto facile. Supponiamo infatti che l'universo sia spazialmente infinito, e popolato, in media, uniformemente di stelle (prima proposizione). In tale situazione, puntando in una qualsiasi direzione l'occhio, prima o poi si deve necessariamente incontrare una stella. La conclusione di questo primo spezzone del ragionamento è che il cielo notturno dovrebbe risplendere come 180.000 soli. Una prima via d'uscita si avrebbe se l'universo fosse vissuto un tempo 6nito (contraddizione con la seconda proposizione): in tal caso infatti, essendo la vdocità di propagazione ddla luce 6nita, qudla di stelle situate al di là di una distanza pari al prodotto della velocità della luce per l'età dell'universo non avrebbe fatto ancora in tempo a raggiungerei, e la conclusione sarebbe in linea di principio scongiurata. Una seconda via d'uscita si avrebbe se la natura dell'universo mutasse, nelle sue proprietà medie, nel tempo (contraddizione con la terza proposizione): basterebbe che, prima che l'universo avesse compiuto una certa età, non vi fossero stelle luminose. Una terza via d'uscita sembra prospettarsi nel caso in,cui l'universo sia mediamente non statico, e specificamente in espansione (contraddizione con la quarta proposizione). La fisica ci insegna infatti che in tal caso non si avrebbe soltanto uno spostamento in frequenza della radiazione emessa, ma anche una diminuzione di intensità. Il tentativo di dimostrare che il paradosso sarebbe scongiurato dall'espansione richiede un calcolo puntuale, che non voglio proporre ora. Basti qui aver tenuto presente un'ulteriore possibile via d'uscita dal paradosso, e sottolineato, conseguentemente, che, in linea di principio, è l'insieme delle quattro proposizioni che è inconsistente con il dato. Il paradosso di Olbers non è qui citato per ricordare come ne esce la cosmologia contemporanea, ma, innanzitutto, per illustrare la nozione di OVC. In questo caso la ONC ha una valenza cosmologica in quanto potenzialmente capace di permetterci conclusioni sulle proprietà dell'universo: il discorso che precede ci porta a concludere infatti che non è possibile un universo in6nito, eterno, stazionario e statico. In secondo luogo, l'esempio è quanto mai opportuno in quanto mostra a chiare lettere che la conclusione è raggiungibile solo se si .è disposti a stipulare alcune clausole basate sull'accettazione delle conoscenze 6siche

Veramente, la denominazione si deve a Bondi, che a sua volta riscopri il problema negli anni che vedevano l'affermazione della teoria cosmologica nota come "Teoria dello stato stazionario" (steadystate theory), da lui formulata con Thomas Gold e Fred Hoyle. s È un modo pittoresco di esprimere il fatto che il Sole sottende un centottantamillesimo della volta celeste.

La cosmologia come disciplina scientifica 175

comuni. Due di queste sono state esplicitate nel discorso. La prima riguarda la finitezza della velocità della luce, la seconda la diminuzione d'intensità in caso di moto recessivo delle sorgenti luminose. Peraltro, la Finitezza ddla velocità della luce è uno dei dati sperimentali più stabilmente acquisiti dalla 6sica, l'effetto di diminuzione d'intensità è una conseguenza di quella teoria elettromagnetica della luce sulla quale sono basate cose tanto comuni e collaudate quali le radiotrasmissioni. Se non si trattasse che di accettare questi elementi di informazione, non avremmo probabilmente difficoltà ad accettare la conclusione del ragionamento senza ulteriore discussione. In realtà il discorso è più complesso. Il senso comune, se non proprio il senso fisico, suggerisce infatti un'ipotesi, che, formulata in un linguaggio ancora prescienti6co, suona cosi: la luce emessa dalle stdle più lontane potrebbe non raggiungerei, insomma, perdersi per strada. La fisica corrente sollecita a porre questa ipotesi in una forma che le sia più congrua: la luce potrebbe essere assorbita durante il tragitto. Ma la stessa fisica ci indica chiaramente che, se è assorbita, sarà assorbita da qualche cosa. Questa ipotesi fu appunto esaminata da Olbers, che ritenne di avervi trovato una via d'uscita dal paradosso (che è tale 6nché non si rinuncia a una, almeno, delle proposizioni di cui sopra). Questa via d'uscita in realtà non sussiste. Il punto è che il fluido interstellare necessariamente si riscalderebbe; nel tempo in6nito che l'universo (eterno e stazionario) mette a disposizione per questo processo esso dovrebbe aver necessariamente raggiunto la temperatura media dei corpi emittenti. «È inutile mettere dei gas in una fornace nella speranza che manterrà freddi gli oggetti al suo interno, perché il gas si riscalderà rapidamente alla stessa temperatura della fornace» (Harrison, 1981, p. 253). Questo processo dà luogo a un suggestivo riscontro ottico in una pratica artigianale:

in un forno per la cottura di vasi di terracotta, quando si

ragginguel'e-

quilibrio, i vasi diventano invisibili e indistinguibili dal fondo. La stessa cosa sarebbe dovuta accadere nella fornace universo. Dobbiamo allora concludere che il paradosso è insuperabile, e che dunque l'osservazione che il cielo notturno è nero porta inesorabilmente a dover cancellare una delle proposizioni di cui sopra? Non è proprio cosi, anche se la grande maggioranza degli addetti ai lavori farebbe propria questa conclusione. Voglio solo ricordare, a questo proposito, che Harrison, il cosmologo che si è maggiormente interessato al problema, lista ben quindici vie d'uscita dal paradosso che sono via via state proposte (Harrison, 1987, p. 209). Una di queste, da Harrison attribuita a William

Devo l'esempio a Bettotti, 1994.

176 2. Problemi jondazionali e metodologici in cosmologia

MacMillan (Ivi, p. 183), che effettivamente vi contribui nel 1925, ha una lunga e mai del tutto sopita tradizione. Si tratta deU'ipotesi che la luce perda energia nel suo cammino non già cedendola a un ipotetico mezzo interstellare e intergalattico, ma al vuoto, o meglio aU'etere cosmico, come Walter Nemst volle denominarlo rivitalizzando una locuzione tipica della fisica della seconda metà dell'Ottocento, che la immaganizzerebbe come energia di punto zero; fluttuazioni ddl'etere creerebbero nuova materia, esattamente nella misura richiesta per mantenere uno stato com-

plessivo di equilibrio. Dovrò ritornare su questa come su altre questioni di carattere fisico nella sede opportuna. Qui mi preme sottolineare come in questo esempio sia evidente che la valenza cosmologica di una osservazione di carattere cosmologico sussista solo se si è disposti a sottoscrivere un certo numero di clausole suggerite dalla visione fisica della realtà, come ho già detto, e che non è affatto detto che l'intera comunità scientifica sia disposta a farlo. Ciò vale anche per l'altro esempio che intendo illustrare. Ma prima di lasciare questo caso, vorrei sottolineare un aspetto che lo caratterizza in modo specifico. La valenza cosmologica deU'osservazione riguardante l'oscurità del cielo notturno sta nd paradosso a cui porta, che obbliga, accettate le clausole fisiche, a rinunciare a una delle ipotesi fatte sopra, cioè alla finitezza spaziale o temporale, o alla staticità o stazionarietà ddl'universo. Ora, in particolare, quesiti circa la flnitezza o infinitezza ddl'universo, ma anche la sua eternità o meno, sono a lungo stati considerati come puramente speculativi. Punto di riferimento costante

della riflessione filosoflca moderna su questi aspetti è Kant. La sua impostazione è stata riesaminata da numerosi autori in riferimento al mutato rapporto tra flsica e geometria che si è instaurato con l'avvento della rdatività generale (cfr. il capitolo di Boniolo e Dorato, in questo volume). Peraltro, la relatività generale, in quanto teoria deUa gravitazione, vede il più delle volte ristretto il suo terreno di applicazione a sistemi localizzati, come il sistema solare; non si è forse altrettanto sottolineato che l'ambito proprio dd confronto delle posizioni è quello cosmologico. La sin-

tetica ed efficace presentazione di Karl Popper ha il pregio di collocare immediatamente la questione su questo terreno: «Kant ci dice che il problema centrale ddla sua Kritik [si tratta beninteso dellaCritica della Rugion Pura, n.d.r.] sorse quando considerò se il mondo avesse o meno un inizio nel tempo. Con costernazione trovò che poteva fornire prove [nelCfr. Nernst, 1937. Alla cosmologia di Nernst è dedicato un numero recente della rivista "Apeiron" (cir. Bibliografa). Oltre alla versione inglese dell'articolo di Nemst vi si può trovare un inqua-

dramento storico complessivo di questa cosmologia alternativa.

La cosmologia come disciplina scientifica 177

l'ambito della pura ragione, n.d.r.] apparentemente valide per entrambe queste possibilità [...] Siamo qui di fronte a un contrasto fra due dimostrazioni, da Kant denominato "antinomia"». Dalle antinomie [un'altra riguarda appunto la ánitezza o meno dello spazio, n.d.r.; cfr. Abbagnano, Dizionario Filosofico', Kant concluse che (Rebaglia, 1996, p. 53).

232 2. Problemi fondazionali e metodologici in cosmologia

te all'inversa. Agazzi e Rebaglia hanno portato un elemento di chiarezza nelle discussioni sul principio antropico individuando una differenza fra

PAD e Principio Antropico Forte (PAF) che, lungi dal consistere in una sfumatura, è della natura di quella che esiste fra una proposizione e la sua inversa. A maggior ragione è dunque il caso di sottolineare che le "proposizioni antropiche" delle quali si sottolinea e si analizza il carattere contro-

fattuale riguardano il PAF e non il PAD. Ma veniamo a un enunciato del PAF; per consistenza, riporto anche in questo caso quello di Barrow e Frank Tipler; «L'universo deve avere quelle proprietà che permettono che la vita vi si sviluppi a qualche stadio della sua storia». Anche se si potrebbe conferire all'enunciato maggiore nitidezza logica rie-

sprimendolo magari nella forma: «Condizione necessaria perché a qualche stadio della vita dell'universo vi si sviluppi la vita è che esso abbia un dato insieme di proprietà», (N) è sufficientemente chiaro che si tratta dell'espressione di condizioni neces-

sarie per la formazione della vita. Proposizioni del tipo della (N) sono equivalenti a proposizioni del tipo della (O). Illustrati questi aspetti, è il caso di ritornare sulla questione della significatività di proposizioni del tipo di qudle riportate. Per quanto riguarda il PAD mi sembra che si debba ribadire il giudizio di vuotezza. Il fatto è che la tesi di proposizioni del tipo delle (S) è dimostrata: la vita, dopo tutto, esiste in qualche luogo dell'universo. Diversa è la situazione per il PAF, in specifico per proposizioni del tipo della (N): esse hanno potenzialmente capacità predittiva. Possiamo chiarire questo punto rifacendoci a un esempio noto: quello che riguarda la nudeosintesi stellare del carbonio. Essa avviene essenzialmente in uno stadio particolare dell'evoluzione stellare secondo le reazioni di sintesi diretta e, rispettivamente, autocatalitica (con il berillio 8 come intermediario) di tre nuclei di elio. Queste reazioni devono necessariamente procedere in modo sufficientemente rapido da giustificare l'attuale presenza di carbonio nell'universo (necessità di una proprietà dell'urtiverso).Dunque, sulla base del dato "esistenza ndl'universo di forme di vita basate sul carbonio", ciò che a sua volta richiede la presenza di notevoli quantità di questo elemento, e sulla base delle nostre conoscenze sui processi di nucleosintesi stdlare, siamo in grado di asserire che certe reazioni nudeari, che possiamo studiare in laboratorio, devono

' Vedi, per esempio, Barrow e Tipler, 1986, p. 252.

Problemi e modelli di spiegazione nella cosmologia evolutiva 233

avvenire in modo particolarmente rapido. Siamo qui dunque in presenza di quella che, dal punto di vista logico, è una predizione tratta da due premesse. Fino a qui, il termine "predizione" è usato in senso puramente logico e atemporale. Dal punto di vista della concatenazione temporale, bisogna poi distinguere la retrodizione di quanto deve essere avvenuto

nelle stelle (il tempo qui è quello ddla storia naturale) dallapredizione, anche in senso temporale, delle caratteristiche di un processo che possiamo studiare in laboratorio (per il quale il tempo è quello della vita dei laboratori). La prima opera in senso antitemporale (il passato è dedotto dal futuro), dunque diversamente che in fisica. La seconda opera invece in modo perfettamente omogeneo a quanto avviene usualmente in fisica; ed è molto interessante ricordare che la storia, non dell'universo, naturalmente, ma della prassi scientifica, ha ricalcato questo percorso logico. Nel 1953 Fred Hoyle, sulla base di considerazioni quali quelle riportate, predisse che, perché le reazioni menzionate potessero risultare efficaci sul piano cosmologico, il nucleo del carbonio avrebbe dovuto avere uno stato

risonante intorno ai 7,7 MeV, la cui esistenza fu ben presto confermata sperimentalmente in laboratorio. In conclusione di paragrafo, vorrei ritornare brevemente sul carattere controfattuale deHe proposizioni antropiche (forti). Rebaglia ne ha sottolineato la valenza diversa da qudla dei controfattuali espressi nelle esposizioni scientifiche consuete (Rebaglia, 1996, p. 16, pp. 52 e segg.). Un esempio di questo secondo tipo è: «Se la Luna si fosse trovata a una distanza doppia di quella effettiva rispetto al nostro pianeta essa avrebbe esercitato un'attrazione gravitazionale quattro volte inferiore» (Idem). Questa affermazione sottolinea la necessità della leggeuniversale dell'inverso del quadrato della distanza. Un controfattuale che richieda, poniamo, che il rapporto fra le intensità delle interazioni forti ed elettromagnetiche stia entro un certo intervallo non sottolinea la necessità di una legge universale, ma di qualcosa che, con una non drammatica estensione del termine, possiamo chiamare condizione iniziale. Agazzi, d'altra parte, sottolinea come i condizionali controfattuali ("Se il naso di Cleopatra...") siano scartati nelle scienze storiche per due ragioni: la prima è che non possiamo fondarci su relazioni nomologiche che connetterebbero il naso di Cleopatra al corso della storia; la seconda è che non abbiamo effettivamente a disposizione un altro mondo in cui Cleopatra non sia mai esistita In termini un po' più tecnici, si sta qui asserendo qualcosa riguardo alla sezione d'urto dei processt

Riprendendo per un attimo la discussione del paragrafo 1.14, mi sembra si possa dire che in questo caso la retrodizione del processo che deve essere avvenuto nelle stelle è resa veramente tale dalla possibilità di una sua verifica indipendente.

234 2. Problemi fondazionali e metodologici in cosmologia

(Agazzi, 1995, pp. 75-76). Sembra il caso di sottolineare come le argomentazioni antropiche possono contare, almeno in linea di principio, su relazioni nomologiche, mentre, al pari delle scienze storiche, non possono contare su universi paralleli. O almeno cosi sembrerebbe. 2.2.3 ll valore esplicativo delle proposizioni antropiche La differenza più marcata fra le proposizioni antropiche (beninteso del tipo PAF, essendosi concluse che quelle del tipo PAD sono vuote) e quelle consuete della fisica si coglie quando ci si interroghi sulle loro capacità esplicative. Possiamo dire che l'esistenza della vita sulla terraspiegalo stato risonante del carbonio? La pretesa di considerare questa una spiegazione, come ha osservato Joe Rosen, incontra due difficoltà, una di carattere soggettivo e una di carattere oggettivo. La difficoltà oggettiva deriva da quello che Rosen chiama "il problema del contesto invariante" «Perche una "spiegazione" sia una spiegazione, occorre almeno che quanto viene spiegato segua logicamente da ciò che si usa per spiegare; nel nostro caso, l'esistenza di Homo sapiens deve essere sufficiente perché le costanti d'accoppiamento abbiano il valore che hanno, ovverosia i valori effettivi ddle costanti d'accoppiamento devono essere necessari per la nostra esistenza» (Rosen, 1988). Ora, possiamo noi asserire con certezza che se quelle costanti non avessero i valori constatati l'uomo non potrebbe esistere? Si, ma solo «se si assume tacitamente che nessun altro aspetto dell'universo, nessun'altra legge della fisica, nemmeno la forma dell'equazione di interazione, è variata» (Idem). Senza l'assunzione dell'invarianza del contesto, la sufficienza dell'esistenza di Homo sapiens, o, ciò che è lo stesso, la necessità dei valori sperimentali delle costanti, non sussiste. La difficoltà soggettiva «è che noi fisici non sentiamo proprio che si stia dando alcuna spiegazione [...] Noi vogliamo infatti che ciò che spiega [l'explanans] sia più fondamentale, più semplice, più generale, e più unificante di quello che viene spiegato [l'escplanandurn], eci piacerebbe anche che il primo fosse la causa del secondo. Nd caso in esame, niente di ciò sembra valere» (Idem). Mi sembra opportuno stabilire una distinzione fra due aspetti dell'explanans che Rosen ricorda: da un lato il suo carattere di maggiore generalità, o comunque lo si voglia definire, dall'altro la possibilità di individuarlo come causa dell'explanandum. La richiesta che l'explanans presenti un carattere di fondamentalità, o comunque di maggiore generalità, rispetto aU'explanandum mi sembra derivare da ragioni più oggettivabili di quanto non sembri ritenere l'autore israeliano. Agazzi, neil'affrontare un'analisi del principio antropico in rapporto ai canoni consueti della "spiegazione scientifica", ricorda che .' No n si meravigli il lettore di fronte a queste "strane" osservazioni di Lovejoy e ai miei precedenti riferimenti a proprietà temporali speciali o peculiari. L'idea di un possibile contatto temporale con entità non-simultaneerispetto alla ordinaria successione di tempo obiettivo non è del tutto estranea alle stessepossibilità teoriche ddla fisica attuale. Valga per esempio, la seguente analogia basata sulla teoria quantistica: se esistesse un vero e proprio operatore tempo quantistico, si potrebbero considerare stati definiti da una sovrapposizione coerente di autostati di un tale operatore (si veda il capitolo di Gian Carlo Ghirardi per queste nozioni tecniche). Ora, uno stato di questo tipo sarebbe caratterizzato dalla mancanza di attribuzione obiettiva di presenza temporale! Ritengo che la diversità delle proprietà temporali — sia pure con diverse gradazioni — sia un elemento distintivo essenziale degli organismi viventi rispetto alla materia inanimata e, conseguentemente, che sia necessario un atteggiamento razionale interamente nuovo per affrontare questo problema. E chiaro che, in sostanza, sto proponendo una nozione non convenzionale di organismo vivente, fondata principalmente sulle proprietà temporali. Questo punto di vista ha il doppio vantaggio di evitare la necessità della assai problematica definizione di che cosa sia la materia vivente rispetto a quella inanimata e, al tempo stesso, di non impedire una caratterizzazione graduale della vitalità". Poiché è djfficile negare l'evidenza di una storia evolutiva delle capacità cognitive umane e degli organismi viventi,' s è chiaro che la "questione genetica" costituisce un nodo cruciale per ogni visione del mondo: come è possibile che crea-

una globalità intrinseca — anche temporale — che trascende i dettagli della descrizione temporale obiettiva. La considerazione fisicalistica di questa incommensurabilità ha dato luogo alla cosiddetta "grain objection" contro la teoria dell'identità mente-corpo (cfr. Meehl, 1966). Chiaramente, la incommensurabilità fra tempo vissuto e tempo fisico obiettivo è la base primaria della "grain objection". ' ' Cfr. Lovejoy, 1925 (corsivi miei). L'argomentazione di Lovejoy offre il fianco ad alcune efficaci obiezioni mossegli da Stephen Pepper (cfr. Pepper, 1926). La tesi che io difendo, tuttavia, in quanto basata sulla utilizzazione dei limiti strutturali della descrizione fisica, è sostanzialmente immune rispetto alle obiezioni di Pepper. Si noti che questo riconoscimento non implica affatto l'accettazione della cosiddetta "teoria" dell'evoluzione.

fl divenire ritrovato 319

ture dotate di coscienza e addirittura autocoscienza abbiano potuto evolvere da una condizione che ne è priva? In accordo con una linea di pensiero che va da Aristotele passando per Leibniz fino a Husserl e Whitehead, non vedo come sia possibile superare questo nodo senza modificare la nostra concezione filosofica di ciò che chiamiamo materia inanimata, sulla base della descrizione fornita dalla fisica a partire dalla fondazione dd metodo galileiano. Dal ristretto punto di vista della fisica, non possiamo che prendere atto del fatto che le proprietà temporali speciali sono emergenti sulle proprietà relazionali del tipo-B, nello stesso modo ualunque conon giustificato in cui gli organismi viventi sono sa questo significhi) sulla materia inanimata, come è descritta dalle correnti teorie fisiche e chimiche. Questa emergenza non deve tuttavia essere intesa in senso riduzionistico: si tratta di un'emergenza che rimanda ad una potenzialità intrinseca a qudla che chiamiamo materiai nanimata e che non viene colta dalla descrizionefisica di essa. È in questo senso che il substrato indeterminato sul quale appoggiamo oggi la nozione di materia — e che è stato già sorprendentemente "smaterializzato" dalla fisica contemporanea — assume caratteristiche che richiamano il concetto della "materia prima" aristotelica e che io interpreto, in particolare, come il substrato del divenire. È assai interessante notare che tale direzione di soluzione del problema mente-corpo sembra essere come imposta da una necessità interna della questione agli stessi sostenitori di una posizione fisicalistica radicale come quella della teoria della identità mente-corpo di Herbert Feigl.' T a le teoria afferma che gli eventi mentali corrispondenti alle percezioni dei qualia sono letteralmente e numericamenteidentici' a c erti eventi fisici del cervello; tuttavia, al fine di giustificare l'emergenza (anche evolutiva) della vita e della coscienza dalla materia inorganica, la teoria dell'identità è costretta a introdurre uno sdoppiamento nella nozione di evento fisico distinguendo fra "eventifisici-1" ed "eventifisict'-2n Gli eventifisici-1 sono gli eventi descritti nell'ambito dell'attuale struttura intersoggettiva della fisica, mentre gli eventifisici-2 sono eventi che possono essere esaustivamente descritti in un linguaggio atto a rappresentare tutto ciò che esiste e avvienein un mondo privo di vita organica (per esempio il nostro

emerg enti (q

Cfr. Meehl and Sellars 1956, Feigl, 1958, Meehl, 1966. Si noti che, secondo tale teoria, l'esperienza e i pensieri coscienti sonostati fisici del cetvello; si badi bene non causati da, né associati a, e neppure causanti i, ma letteralmènte e attualmentesono. Tuttavia, Feigl sostiene che si tratta di un'identttà empirica o "sintetica" e non logica o "analitica". Per usare le sue parole, tale identità sarebbe della stessa natura dell'identità che sussiste fra "la stella del mattino" e la "stella della sera" e non già dell'identità fra, poniamo, 5 e 3 + 2.

320 3.La descrizione ftsica delm ondo e la questione deldiveniretem porale

mondo nel periodo pre-Cambriano).' l l p unto centrale sta nel fatto che,

a differenza delleleggi fisiche-1 dell'attuale descrizione fisica del mondo, le leggi fisiche-2 avrebbero la capacità di render conto di qualitàfenomeniche oggettive che oggi, cioè dopo l'apparizione della vita e della coscienza, potrebbero essereesperite solo attraverso l'introspezione. Dunque la transizione implicita nella distinzione tra fisico-1 e fisico-2 non corrisponde ad una semplice emergenza epistemica, quanto ad una vera e propria emergenza ontologica. Tuttavia, si tratta di una soluzione del problema mente-corpo che, ancorché sviluppata con dovizia di sofisticazione logica, rimane sostanzialmente verbale, dato che le caratteristiche essenziali della fisica-2 non vengono affatto esplicitate al di là della terminologia introdotta e, come è stato osservato, «nulla diviene mentale solo

«Un evento o entità o leggeèfisica-2 se è definibile in termini di elementi teorici primitivi adeguati alla descrizionecompleta degli stati effettivi — sebbene non necessariamente delle potenzialitàdell'universoprima dell'apparizione della vita», vedi Meehl and Sellars, 1956 (corsivi miei). Si noti intanto l'implicita estremizzazione delle possibilità della descrizione fisica della realtà, laddove si richiede che questa siacompleta. Lidea di Feigl è che gli eventi cerebrali posseggano sia propnetà matematiche (fisiche) siaproprietà fenomeniche. La ragione per cui il neurofisiologo non si rende conto dell'esistenza delle proprietà fenomeniche quando esamina il cervello non sarebbe che tali proprietà non esistono o che esse esistono in un regno cartesiano non-spaziale, bensi che la loro caratteristica essenziale consiste nel fatto che esse si manifestanosolamente nellintrospezione. La tesi di Feigl è esplicitamente associata alla convinzione che il progresso della neurofisiologia sia in grado di dimostrare una correlazione sempre più stretta fra sensazioni e stati del cervello, sicché non esisterebbe alcuna difficoltà logica seria ndl'idea che la correlazione appaia infine come un'identità. Ma la difficoità è invece fondamentale: mentre è semplice intendere le modalità attraverso le quali noi riconosciamo che la "stella del mattino" è identica alla "stella deffa sera", non si vede proprio come sia possibile che scoperte puramentefattuali ci autorizzino a concludere che sensazioni e stati de( cetvello sonoaccadimenti identici,operando un implicito salto fra la mera correlazione e l'identità ontologica! È evidente che la figura linguistica qui utilizzata può essere chiamata "identità" soltanto usando il termine in un modo unico,vale a dire con valore semantico limitato proprio e soltanto a questo caso, dato che sarebbe altrimenti necessariospiegarequesta speciale identità semantica e il suo controllo dello specifico uso che qui viene fatto dell'"identità". Lobiezione ddlaspeciale unicità semanticavale per ogni utilizzazione del termine spiegazione ("explanation") della coscienza in termini fisicalistici. Una variante della tesi de!l'"identità" è quellafunzionalistica proposta e poi rinnegata da Hilary Putnam (cfr. Putnam, 1987 e poi 1981). Il funzionalismo considera le sensazioni come "identiche" ad appropriati stati del cervdlo, ma differisce daHa teoria di Feigl per i fatto che non caratterizza lo stato del cervello in termini manifestamente fisici, bensi in termini di "programmi". In tal modo tenta di superare il "materialismo" rimanendo tuttavia entro una generale "fisicalizzazione" del mondo. Alla fine, tuttavia, Putnam riconosce che la conoscenza della natura non può essere descritta senza il riconoscimento dellaintenzionalità degli stati dd soggetto e che la intenzionalità non può essere spiegata entro una teoria naturalistica (fisicalistica) della mente. Si noti infine che la posizione difesa in questo saggio potrebbe assorbire (ma trasformandone il senso) alcune affermazioni diJohn Searle a proposito di macchine, computers e intenzionalità (cfr. Searle, 1980), secondo le quali l'intenzionalità richiederebbe necessariamente lanatura biologica ddla sua base materiale. Per quanto abbiamo osservato nei paragrafi 3 e 8, sussiste una profonda differenza fra il modus operandi delle macchine e degli organismi viventi, poiché questi ultimi, a dilferenza di quanto accade per le macchine o i computers, non sono da noiprogettati e costruiti sulla base di unaconoscenza completa (nei limiti delle approssimazioni consentite di volta in volta) de!le leggi e dei fattori determinanti della loro evoluzione temporale. Tale differenza è pure riflessa ne)la árcostanza che, a differenza della descrizione fisica, la biologia non è costituita come uncorpus "ipotetico-deduttivo"

Il divenire ritrovato 321

perché lo si chiama cosi». Al contrario, la tesi che io difendo si basa sulla distinzione intelligibile fra le proprietà del tempo vissuto e quelle del tempo fisico e sulla correlata asserzione che le proprietà fondamentali del tempo fenomenologico esprimono, almeno in parte, vere proprietà temporali del substrato ("materia prima") che non possono essere colte dalla descrizione fisica. Nondimeno, sul cosiddetto "vitalismo", cioè sul ricorso ad un principio sui generisatto ad innestare la vita sul mondo fisico, la mia posizione coincide con qudla di Herbert Feigl e Paul Meehl, nel senso di rifiutarlo. Certo, la considerazione del periodo pre-Cambriano può sembrare prima faci eun argomento forte in favore del fisicalista allorché asserisce che il mondofisico esistevasimpliciter nel tempo (fisico) prima deH'apparizione della vita e ddla soggettività. Maurice Merleau-Ponty osserva al riguardo che «è pur vero che la terra deriva da una nebulosa primitiva neHa quale le condizioni necessarie per la vita erano assenti> ma aggiunge «ciascuna di queste parole, come ogni equazione deHa fisica, presuppone la "nostra" esperienza pre-scientifica del mondo» e infine «NuHa riuscirà mai a farmi comprendere cosa possa mai essere una nebulosa che nessuno può vedere». Mi sembra che nonostante vi sia del vero in questa osservazione, essa non colga il punto centrale e abbia una deriva idealistica. Il punto non è semplicemente che nessuno può vedere la nebulosa (nessuno può vedere un "quark" ma la condizione di realtà di quest'ultimo è affatto diversa). La risposta al fiscalista è piuttosto che dovremmo parlare del tempo come una sorta di tempo-2 e che il tempo fisico è una sorta di tempo-1, tipico dello schema temporale intersoggettivo della descrizione fisica. È soltanto quest'ultimo che presuppone la nostra esperienza e non può essere, per cosi dire, "retrodatato" simpliciter al periodo pre-Cambriano. Dunque, non solo la descrizione fisica non può render conto esaustivamente deHa natura degli organismi biologici, ma anche delle potenzialità complessive della "materia" al livdlo di organizzazione ddle forme del mondo inorganico. Dobbiamo negare la circostanza che attraverso la percezione si raggiunga con modalità trasparenti la natura intrinseca della realtà "materiale", che viene poi conseguentemente opposta alla realtà immediata della vita mentale e del vissuto." In realtà, la percezione rivda soltanto un'apparenzadi quella realtà "materiale" che viene ricostruita mediante il metodo scientifico e che, alla fine, salvo che per delle costanti di scala empiriche (al limite, una sola), viene tradotta e quasi dissolta in una struttura simbolica di rapporti matematici. È difficile invece sottrarsi alSi ricordi la profonda intuizione di Leibniz della materia come "mens momentanea sive carens recordatione"

322 3. La descrizione fisica del mondo e la questione del divenire temporale

l'impressione che quanto ci è rivelato nell'esperienza immediata manifesti, almeno in parte, ciò che la realtà è in se stessa, incluse le componenti di potenzialità e di causalità che, neU'esperienza esterna, si rivelano senza alcuna trasparenza ndla struttura nomologica della fisica. I qualia non potrebbero essere proiettati dal soggetto sulle cose se essi non appartenessero al soggetto, ma già questo fatto conferisce ad essi una sorta di status ontologico. D'altra parte, senza di essi, nemmeno le proprietà intrinseche descritte daUa fisica sarebbero accessibili. Quanto detto non esdude ovviamente che l'attuale indagine neurofisiologica e anche fisica accresca in modo sostanziale la nostra conoscenza della realtà, né che una gran parte delle manifestazioni del funzionamento dd cervello non sia suscettibile di analisi basate sulla tradizionale metodologia fisico-chimica e neurofi1siologica. Tale analisi appare comunque intrinsecamente limitata al quadro statistico rispetto alla singolarità essenziale del corpo vivente e cosciente. Naturalmente, per non entrare in contraddizione con l'attuale conoscenza empirica, occorre anche sottolineare che l'usuale metodologia empirica di prova ddle teorie fisiche non è in grado di falsificare in modo ovvio la realtà di quelle che abbiamo provvisoriamente chiamato proprietà temporali speciali degli organismi viventi. In eEetti le attuali teorie fisiche non sono state messe alla prova sugli organismi viventi, in quanto viventi, nello stesso senso e nella stessa misura in cui sono state controllate sulla materia inanimata. Le leggi fisiche sono state sperimentate sugli organismi viventi, in quanto viventi, soltanto indirettamente e globalmente, per cosi dire "sezionalmente", cioè su funzioni ddl'organismo preventivamente isolate,in termini di leggi di conservazione basate sumedie temporali di tempo fisico. D'altra parte, nel caso dei soggetti autocoscienti, l'evidenza sperimentale della psicologia cognitiva, che si oppone alla rilevanza epistemica della introspezione, è strutturalmente limitata a ben definiti tipi di processi e condizioni mentali. In ogni caso non si deve dimenticare che l'ordine del vissuto temporale fornisce la base iniziale necessaria per la formulazione di tutte le leggi, in particolare di quelle attraverso le quali noi conosciamo quanto accade oltre la nostra percezione. L'analisi precedente può essere riassunta affermando che la descrizione fisica di un sistema che indude soggetti coscienti è impossibilein linea di principio, nonostante il fatto che, giudicato a posteriori, l'effetto fisico di ogni libera scelta di azione nel mondo debba necessariamente essere compatibile con la stretta rete causale propria della descrizione fisica. Infatti è vero, come osserva Rudolf Carnap,' che la stessa possibilità di una li-

Cfr. Camap, 1966.

Il divenire ritrovato 323

bera scdta e di una libera azione è subordinata ad un elevato grado di macro-determinismo locale. Poiché una scelta implica una preferenza determinata per un corso di azione definito rispetto ad ogni altro, il significato di qualunque scelta sarebbe compromesso dalla impossibilità di

prevedere le conseguenze di azioni alternative. Perciò la capacità di previsione è garantita solo se il risultato della scelta si inserisce in una catena causale "quasi-deterministica" Tuttavia le cose non sono cosi semplici, per quanto riguarda il ruolo della causalità stretta prima della scdta del soggetto agente. Invero, nel caso in cui il sistema sul quale si intende agire contenga un soggetto cosciente, la situazione sarebbe differente. In tal caso, infatti, il risultato dell'azione non sarebbe prevedibile e garantito sulla base di una catena causale stretta, a meno che non si supponga, dando per scontato quello che si vorrebbe dimostrare, che il soggetto cosciente sia soggetto a condizioni causali vincolanti, deterministiche e prevedibili. Se è impossibile sostenere che i pensieri, come pure le qualità esperite, siano degli oggetti indipendenti in grado di tenere una posizione in una catena causale di tipo fisico, per poter prevedere le conseguenze

di azioni alternative dovremmo dunque appdlarci adargomentazioni più o meno razionali, che implicano connessioni-mediante-significati, appartenenti a quella che abbiamo sopra chiamato la concreta causalità generale del mondo. Si manifesta qui in tutta evidenza la natura temporalmente asimmetrica del rapporto fra concreta causalità generale e causalitàfisica stretta. La causalità generale è compatibile con la chiusura causale della descrizione fisica, proprio perché la chiusura sussiste ndla misura in cui il soggetto agente non interferisce nel sistema fisico. Questa asimmetria non è che una manifestazione esemplare della dialettica potenzialitàattualità che era già perfettamente chiara ad Aristotele. Qualunque processo di attualizzazione di una potenzialità può essere descritto e ricostruito (ma non esaurientemente! ) in termini di cause feficienti (cioè entro la causalità scientifica stretta) quando sia esaminato dopo la attualizzazione. A questo proposito, è illuminante ricordare alcuni passaggi di Kant relativi al problema posto ndl'Introduzione, cioè il problema dd rapporto fra necessità naturale e libertà dell'agire. Ndla Fondazione della Metafisica dei Costumi,' ' oltre alla frase citata in epigrafe, Kant scrive: +La filosofia speculativa non può sottrarsi al compito di mostrare almeno che l'errore in cui cade, per la presunta contraddizione [fra libertà e necessità], sta nel fatto che, quando diciamo l'uomo libero, lo pensiamo in un altro senso eper un altro riguardo di quando lo pensiamo sottoposto, in quan-

' ' Cfr. Kant, 1785 (le parentesi quadre e i corsivi sono miei).

324 3. La descrizionefisica del mondo e la iiuestione del divenire temporale

to parte della natura, alle leggi di questa; i due sensi non solo sono perfettamente compatibili, ma debbono anche essere pensati come necessariamente congiunti nello stesso soggetto». Mentre, nella Critica del& Ragion Pura,' eg li scrive:«... ma una volta dimostrata (benché non intesa) la facoltà di cominciare assolutamente da se stesso una serie nel tempo, è anche dato oramai di far cominciare da se stesse, in mezzo al corso del mondo, diverse serie di causalità, e di attribuire alle sostanze di esse facoltà di agire per libertà... In questi casi noi non parliamo di un assoluto primo cominciamento rispetto al tempo, ma rispetto alla causalità. Se io ora (per esempio) mi alzo dalla mia sedia affatto liberamente e senza l'influsso necessariamente determinante delle cause naturali, in questo fatto, prese insieme con le sue conseguenze naturali all'infinito, comincia assolutamente una nuova serie, sebbene il tempo seguente a questo fatto non sia se non continuazione di una serie precedente. Giacché codesta risoluzione e codesto fatto (della sedia) non sono punto nel seguito dei semplici effetti naturali, e non ne sono una semplice continuazione; ma le cause naturali determinanti cessano in capo ad essarispetto a questo avvenimento, che segue bensi a queste cause, ma non ne consegue, e però deve esser detto assoluto principio d'una serie di fenoment,' non rispetto al tempo, benst' rispetto alla casualità». Questi passaggi di Kant individuano il cuore del problema: se si vogliono evitare contraddizioni e paradossi distruttivi, è impossibile conciliare la libertà ddle scelte, la realtà del divenire e la connessa rilevanza ontologica ddl'esperienza della transienza temporale con la necessità della causalità naturale (che ho chiamato "causalità fisica stretta"). La soluzione data da Kant a questa basilare questione consiste ndla completa denaturalizzazione della soggettività e deontologizzazione del tempo, realizzata con l'idealismo trascendentale. A Kant è necessaria una causalità intdligibile ma non empirica, per far st che il soggetto agente come causa phaenomenon non sia incatenato alla necessità della causalità naturale (leggi "stretta") in una inscindibile dipendenza di tutti i suoi atti. Kant aggiunge: «Nella natura inanimata o meramente animale non troviamo nessuna ragione di pensare una facoltà qual sia non condizionata in modo solo sensibile. Soltanto l'uomo, che non conosce, del resto, tutta la natura se non per mezzo dei sensi, conosce se stesso anche per mezzo di semplice appercezione, e si conosce negli atti e nelle determinazioni interne... Ora l'azione, in quanto va attribuita al carattere

'" Cfr. Kant, 1781, voi. Il, capitolo II: «Lantinomia della Ragione Pura, Sezione Nona; Dell'Uso empirico del principio regolativo del& ragione rispetto a tutte le idee cosmologiche: Possibilità della causalità della libertà in accordo con le leggi universali della necessità naturale, Spiegazione dellidea cosmologica di libertà in rapporto con la necessità universale della natura»(corsivi miei).

I/divenire ritrovato 325

empirico (temperamento) come a sua causa, non ne segue nondimeno punto secondo leggi empiriche, in modo cioè che precedano le condizioni della ragion pura, ma in modo che precedono soltanto i loro effetti nel

fenomeno del senso interno [temporale]. La ragione pura, comefacoltà meramente intelligibile, non è soggetta alla forma del tempo, e quindi neppure alle condizioni della serie temporale. La causalità della ragione, nel carattere intelligibile, non nasce e non comincia, in qualche modo, in un certo tempo a produrre un effetto; perché altrimenti sarebbe anch' essa soggetta alla legge naturale dei fenomeni, in quanto essa determina le serie causali secondo il tempo... Quindi pertanto ha luogo qudlo che noi desideravamo in tutte le serie empiriche: che la condizione di una serie successiva di fatti possa essere essa stessa empiricamente incondizionata,

perché qui la condizione è fuori della serie dei fenomeni (neil'intelligibile) e quindi non soggetta a nessuna condizione sensibile e nessunadeterminazione temporale da cause anteriorá >.Si noti la rigidità della posizione kantiana, determinata con ogni evidenza dalle seguenti concatenazioni: 1) viene assunta la meccanica newtoniana come paradigma indiscutibile della necessità naturale e le leggi meccaniche vengono interpretate come rivelatrici della struttura della realtà naturale in forma esaustiva e definitiva; 2) il tempo assoluto della meccanica, che per Newton è un'entità oggettiva in sé, una sostanza o una cosa, e per Leibniz è un'entità semi-ideale di natura relazionale ("l'ordine delle cose co-esistenti"), diviene per Kant una condizione necessaria eformale a-priori di tutti i fenomeni. Quindi è bensi universale, ma rimane modellato sul tempo della fisica: solo in questi termini, infatti, viene giustificata la possibilità stessa ddla fisica, rispetto alla comprensione da parte dell'intelletto; 3) la libertà delle scelte e dell'azione viene salvata daUaapertura dialettica dell'idealismo trascendentale, in forza ddla quale la ragione, in quanto distinta dall'intelletto che categorizza il contenuto dell'esperienza empirica, sta fuori dalla rigida successione temporale, ovvero dalle serie causali della fisica. E ciò può avvenire perché il tempo è solo una precondizione della esperienza sensibile e quindi della conoscenza empirica; conseguentemente: 4) non viene data alcuna analisi esplicita della relazione fra soggetto trascendentale e soggetto empirico; infine: 5) avendo posto la ragione umana in quanto tale fuori dal tempo,la mera soggettività animale è confinata completamente entro la necessità temporale della causalità fisica stretta (gli animali come

macchine). Per ovviare alla rigidità di tale posizione, occorre necessariamente recuperare, proprio tenendo conto delle limitazioni strutturali della descrizione fisica del mondo, lo spazio per una temporalità (e quindi una cau-

salità) più ampia di quella del tempo fisico. Rovesciando la gerarchia del-

326 3. La descrizionefisica del mondo e/a questione del divenire temporale

la temporahtà del mondo, l'esistenza di serie temporali (o catene causali) emergenti, rispetto alla serie ddle cause efficienti della fisica, deve essere vista come rivelatrice della temporalità pri marta del mondo, di cui quella fisica è una riduzione. È possibile illustrare la preminenza ontologica ddle proprietà temporali proprie degli organismi viventi, rispetto alla temporalità obiettiva della fisica, mediante un argomento ex contrario, che evidenzia le peculiari contraddizioni derivanti dalla considerazione deHa presenza di soggetti coscienti entro la descrizione spazio-temporale fornita dalle correnti teorie fisiche e ammettendo l'esistenza di catene causali (macroscopiche) emergenti generate dalle azioni libere di tali soggetti. Per semplicità di argomentazione, mi limiterò a schematizzzare le origini spaziotemporali delle catene causali emergenti mediantesingoli eventi di natura intrinsecamente acausale. Questa limitazione non è essenziale per l'argomento principale e possiamo supporre che sarebbe superata da qualunque eventuale futura chiarificazione delle proprietà temporali degli organismi coscienti. Che cosa accade dunque alla descrizione fisica spazio-temporale? Questo è il punto centrale: l'esistenza di catene causali emergenti è ovviamente incompatibile con la descrizione non transiente dell'evoluzione temporale, cioè con la descrizione scientifica tout court, per lo stesso motivo per cui non c'è posto per il divenire ndla struttura della serie-B. Lungi dal costituire una contraddizione logica, questa situazione asimmetrica riflette peculiarmente la natura aporetica della biforcazione democritea e galileiana. Se infatti, in via ipotetica e semplificatoria, si volesse oltrepassare questo limite strutturale e ottenere una (comunque incompleta e antinomica) descrizione fisica di un mondo che includesse soggetti coscienti, si dovrebbe por mano ad un modello atto ad aggiornare la descrizione spazio-temporale in corrispondenza adogni evento acausale che generasseuna catena causale macroscopica emergente. Ad ogni istante di tempo t, la procedura di aggiornamento dovrebbe registrare con modalità non tensionale le catene macroscopiche emergenti le cui origini fosseroprecedenti a t e dovrebbe lasciarefuori dalla descrizione fisica i possibili eventi acausali successivi a t. In effetti, questo istante t è proprio il presentedell'immaginario "aggiornatore ideale" che sta, egli stesso,fuori dalla descrizione fisica spaziotemporale.' D' a l tro canto, questo aggiornatore è essenzialmente lo stessoagente che prepara gli stati fisici, esegue le misure ed

' ' È evidente che in tal modo si renderebbe necessariaun'infinità di insiemi di riferimento degli eventi. Gli insiemi di questa coHezione, tuttavia, non sarebbero deánibili a-priori, bensi soltanto di volta in volta, in relazione alle origini delle catene causali emergenti.

Il divenire ritrovato 327

è esistenzialmente obbligato a impiegare un discorso tensionale irriducibile! Ritroviamo in forma semplificata la conclusione che, dal punto di vista del divenire reale, la descrizione fisica fornisce cosi soltanto un modello del mondo, entro il quale la convenzione temporale, sottostante alle rappresentazioni temporali, non puo essere mostrata. L'essere cosciente è invece immediatamente consapevole ddla modalità emergente della sua propria azione nel mondo che, in quanto ri-presentata, divide il presente e identifica se stessa come ivenire. Da questo punto di vista, la presenza "è" la consapevolezza ddla potenza della libera azione su quel mondo esterno cui l'essere cosciente appartiene come corpo. Cosi le origini delle catene causali macroscopiche emergenti conferiscono potenzialmente una struttura temporale aggiuntiva alla varietà degli eventi fisici. La sovraimposta rete poteriziale di catene causali emergenti introduce un peculiare ordinamento temporale che è estrinseco o esterno rispetto alla serialità causale dell'ordinamento temporale nello spazio-tempo, ma con essa coerente. In effetti, esso implica una direzionalità, generata dalla relazione intersoggettiva di inclusione di significato, che esiste in potenza tra le libere azioni dei soggetti coscienti. In questo modo l'intrinseco divenire e la direzionalità del tempo fenomenologico sono proiettati e immersi nel mondo fisico, dando cosi luogo ad una situazione che non solo non è deterministica, ma è anche toto caelo differente da quella connessa ad una struttura nomologica indeterministica. Diversamente dalla anisotropia puramente fisica, che è metaforicamente rappresentabile mediante unafreccia dotata di punta e di coda,questa freccia reale possiede, per cosi dire, solo la punta, poiché essa è assoluta ovvero non relazionale. Chiaramente, non sto affermando che questa proiezione abbia un ruolo nell'attribuzione dell'anisotropia temporale agli eventi fisici: infatti, a parte le loro origini acausali, le catene emergenti si adeguano all'anisotropia fattuale del tempo fisico macroscopico, e anzi la utilizzano, in forza degli effetti defacto irreversibili delle azioni libere e dunque presuppongono l'anisotropia fisica dd tempo e la chiusura causale delle catene dopo la loro origine. Dunque, emerge qui una dimensione trans-soggettiva del tempo che deve essere distinta sia dalla nozione fisica sia da quella soggettiva: propongo di battezzarla tempo reak.u Cosi, il tempo è inerente alla struttura emergente del reale come un segno rivelatore del divenire, ma è necessariamente rappresentato in modalità non-transiente non appena viene oggettivato fisicamente. Come il tempo fisico è correlato alla causalità fisica stretta, cosi il tempo reale è correlato alla concreta

futuro ind

' " Si noti che, come ci ricorda Hermann Weyl, il termine tedesco "wirklichkeit", ovvero "realtà", deriva da "wirken" cioè "agire"

328 3.La descrizionefisica delm ondo e la questione deldiveniretemporale

causalità generale del mondo. Divenire e direzionalità temporale risultano

congiunte al livello ddla realedimensione temporale dd mondo, a differenza di quanto avviene al livello ddla descrizione fisica.' D ' altro canto, questa realtà è in se stessa intrinsecamente aperta e non è suscettibile di una formalizzazione oggettiva ed univoca. Ritengo che la concezione del divenire che ho esposto sfugga sia alle costrizioni poste dalla illegittima estrapolazione della descrizione fisica al di fuori dei suoi limiti costitutivi, estrapolazione che proietta sul mondo caratteristiche temporali di serie-B, sia alla artificialità e incoerenza dei tentativi di scoprire il divenire entro la stessa descrizione fisica del mondo. Naturalmente, fino a quando non si abbia una articolazione razionale soddisfacente ddla specificità delle proprietà temporali degli organismi coscienti, non si potrà dire di possedere una vera "teoria dd divenire", anche ammesso che ciò abbia senso. Richiamandoci al principio Ch parsimonia ossiamo soltanto affermare che il divenire reale è rivelato dalle modificazioni indotte nel mondo descritto dalla fisica ad opera della soggettività umana e animale, in vari gradi. Da questo punto di vista, ù divenire appare come una proprietà reale ma locale del mondo. Tutta-

met afisica,p

via, neHa misura in cui la descrizione fisica dd mondo fornita dalle teorie relativistiche consente la definizione di un tempo universale cosmico e quindi, nonostante il privilegio meramente descrittivo di tale tempo, una simultaneità fisica cosmica,possiamo anche affermare che tale descrizione non escludela realtà di una transienza temporale universale ("L'unisono del divenire" di Alfred North Whitehead). Ciò che la descrizione fisica sostanzialmente esclude è la possibilità operazionale e quantitativa di controllare tale aspetto globale della realtà temporale del mondo. Ma questo, al di fuori di una posizione strettamente operazionista e verificazionista,

Naturalmente, non affermo con ciò che non possa esistere una anisotropia temporale puramente 6sica rappresentabile entro la struttura nomologica della 6sica. Come sappiamo, l'anisotropia temporale è una pre-condizione epistemica necessaria per la descrizione fisica. Sono questioni aperte quella di sapere se questa pre-condizione rimarrànomologicamente esternaalla formalizzazione scienti6ca ovvero sarà alla fine fondata entro la struttura teorica della 6sica, come pure quella delle possibili forme che tale formulazione potrà assumere. In relazione a ciò, si può ricordare che, secondo la linea di pensiero che va da Kant all'intuizionismo, dovrebbe sussistere unapsicogenesi temporale dei concetti numerici. In tal modo la "unreasonable effectiveness of mathematics in natural sciences" di cui parla Eugene Wigner apparirebbe connessa alla nozione fenomenologica del tempo. Un tentativo audace di fondazione deUa anisotropia temporale come patticolare pre-condizione della conoscenza, mediante l'introduzione di una struttura temporale tensionale alla base delle teorie 6siche,è stato intrapreso da Cari Friedrich von Weizsacker (cfr. von Weizsácker, 1971 e 1973). Il mio punto di vista al riguardo è che, se un tentativo di tal natura avesse successo, esso costituirebbe la più radicale rivoluzione del pensiero fisico dall'epoca della sua formazione durante il Rinascimento. Per inciso, può essere interessante osservare che una somigliante (formale e solipsistica) "imitazione" della situazioneepistemologica generata dalla sussistenza di catene causali emergenti è fornita dalla cosiddetta "many-worlds interpretation" della meccanica quantistica (cfr. De-Witt e Graham, 1973).

Il divenire ritrovato 329

non costituisce un ostacolo decisivo. Poiché la descrizione fisica del mondo non può essere esaustiva, è anche impossibile una descrizione 6sica dell'universo in quanto totalità e ciò apre una prospettiva cosmologica necessariamente più ampia ed inclusiva di quella scientifica. Le argomentazioni qui presentate si situano naturalmente nell'ambito di tale prospettiva:il divenire non è altro che l'apparire delle potenzialità della "materia prima" in quanto attualizzate. Questo è il senso in cui il divenire è reale. Il divenire, cosi come la potenzialità della "materia prima", non può che esserelatente nella descrizione 6sica del mondo. L'asserzione di Hans Reichenbach deve essere rovesciata: "C'è divenire, ma il fisico non può sa-

perlo".

Bibliogra6a Aristotele (1991), Fisica, in Opere, voi. 3, Laterza, Bari.

Bailey C.(1926), Epicurus: The Extant Remains, Clarendon Press, Oxford. Bradley FH. (1883), The Principles of Logic, Oxford University Press, Oxford 1922.

BroadC.D. (1938),An examination of McTaggart's Philosophy, Cambridge University Press, Cambridge.

Carnap R. (1963), Keplies and Sistematic Exposition, in PA. Schilpp (a cura di), The Philosophy of R. Carnap,La Salle, Open Court. Carnap R.(1966), Phiksophical Foundations of Physics,Basic Books, New York. Cassirer E. (1906), Storia dellafilosofia moderna,il Saggiatore, Milano 1968. Davidson D. (1980), Essays on Actions and Events, Oxford University Press, New

York. De-Witt B., GrahamN. (a cura di) (1973), The Many-Worlds Interpretation of Quantum Mechanics, Princeton University Press, Princeton.

Dorato M. (1995), Time and Reality - Spacetime Physics and the Obj ectivity of Temporal Becoming,Clueb, Bologna. Dummett M. (1969), The Reality of the Past, in Proceedings of the Aristotelian Society 1968-69, London. Dummett M. (1986), Far accadere il passato, in La Verità e altri Enigmi, il Saggiatore, Milano.

EddingtonA.S. (1928), The Nature of the Physi cal World, MacMillan, New York. FayeJ. (1989), The Reality of the Future - An Essay on Time, Causation and Backward Causation, Odense University Press, Denmark.

FayeJ. (1995), Il Futuro è veramente reale?,in E. Agazzi (a cura di), Il Tempo nella Scienza e nella Filosofia, Guida Editori, Napoli. Feigl H. (1950),The MindBody Problemin the Development of Logical Empiricism, in "Revue Intemationale de Philosophie", voi. 4, pp. 64-83, ristampato in H.Feigl and M.Brodbeck (a cura di),Readings in the Philosophy of Science, Appleton-Century-Crofts, New York, 1953.

Feigl H. (1958), The "Mental" and the "Physical", in H. Feigl, M. Scriven, G. Maxwell (a cura di), Minnesota Studies in the Philosophy of Science,voi. Il: Concepts, Theories and the Mi nd-Body Problem, University of Minnesota Press,

Minneapolis 1967. Fraassen van B.C.(1978), Time: Physical and Experienced,in "Epistemologia", n. l.

Fraassen van B.C.(1980), The Scientific Irnage,Clarendon Press, Oxford. Fraassen van B.C. (1989), Laws and Symmetry, Oxford University Press, New

York. Fraisse P. (1957), Psychologie du Temps, Presses Universitaires de France, Paris.

Gale R. (1968), The Language of Time, Routledge & Kegan Paul, London. Godei K. (1949), Teoria della relatività efilosofia idealistica,in P. Schilpp (a cura di), Albert Einstein, scienziato e filosofo, Einaudi, Torino 1958.

Bibliogra fia 331

Godei K, (1949),An Example of a New Type of Cosmological Solution of Einstein's Field Equations of Gravitation, in "Review of Modem Physics", voi. 21,

pp. 447-450. GrunbaumA. (1952), Causality and the Science of Human Behaviour, in "American Scientist", voi. 40, p. 665, 1972; Free Will and Laws of Human Behaviour, in H. Feigl, W. Sellars, K. Lehrer (a cura di), New Readings in Philosophical Analysis,Appleton-Century-Crofts, New York. GriinbaumA. (1967), The Meaning of Time, in N. Rescher (a cura di), Essays in Honor of Cari G.Hempel, D. Reidel Pubi. Co., Dordrecht 1971. Griinbaum A. (1974), Is there a 'flow' of time or temporal 'becoming'?, in RS.Cohen, M.W. Wartofsky (a cura di), Philosophical Problems ofSpace and Time, Boston Studies in the Philosophy of Science, voi. XII, D. Reidel Pubi. Co., Dordrecht.

Hawking S.W, Ellis G.FR (1973), The Large Scale Structure of Spacetime,Cambridge University Press, Cambridge.

Hawking S.W., Penrose R. (1996), La Natura dello Spazio e del Tempo, Sansoni, Milano. Hintikka J. (1969), Models of Modalities, D. Reidel Pubi. Co., Dordrecht, pp. 45-48. Husserl E. (1928), Vorlesungen zur Phanomenologie des inneren Zeitbewusstseins,

in M. Heidegger (a cura di), Jahrbuchfur Philosophie und phanomenologische Forschung,voi. IX, Niemeyer, Halle; ristampato in R Boehm (a cura di) (1966), Zur Phanomenologi e des Inneren Zei tbewusstseins: 1893-1917, Martinus

Nijhoff, Den Haag. Kant I. (1785),Fondazione della Metafisica dei Costumi, Utet, Torino 1970. Kant I. (1781), Critica della Ragion Pura, Laterza, Bari 1970.

Lewis D. (1986), On the Plurality of Worlds, Basii Blackwell, Oxford. LovejoyA. (1924), Essaysin Metaphysics,University of California Publications, voi. V, Berkeley. McInerney PK. (1991), Time and Experience,Tempie University Press, Philadelphia. McTaggartJ.E. (1908), The Unreality of Time, in "Mind", voi. 17B. McTaggartJ.E. (1927), The Nature of Existence,voi. 1-2, Cambridge University Press, Cambridge 1968. Meehl PE., Sellars W. (1956), The Concept of Emergence,in H. Feigl, M. Scriven (a cura di), Minnesota Studiesin the Philosophy of Science,voi. I: The Foundations of Scienceand the Concepts of Psychology and Psychoanalysis,University of Minnesota Press, Minneapolis. Meehl P.E. (1966), The Compleat Autocerebroscopist: A Thought-Experiment on

Professor Feigl s Mind-Body Identity Thesis,in PK. Feyerabend, G. Maxwell (a cura di), Mind, Matter and Method - Essays in Philosophy and Science in Honor of Herbert Feigl, University of Minnesota Press, Minneapolis.

Mehlberg H. (1961),Physical Laws and Time's Arrow, in H. Feigl, G. Maxwell (a cura di), Current Issues in the Philosophy of Science,Holt-Rinehart-Winston, New York.

332 3. La descrizionefisica del mondo e la questione del divenire temporale

Mellor D.H. (1981),Real Time, Cambridge University Press, Cambridge. Michon J.A. (1975), Time Experience and Memory Processes,in J.T. Fraser and FC.Haber (a cura di), The Study of Time - II, Springer Verlag, Heidelberg, Michon J.A. (1978), La percezione e la valutazione del tempo dal punto di vista psicologico,in "Epistemologia", n. 2. Michon JA. (1995), Il senso umano del tempo: funzioni e limiti, in E. Agazzi (a cura di), Il Tempo nella Scienza e nella Filosofia, Guida Editori, Napoli. Pauri M. (1991), The Universe as a Scientific Obj ect,in E. Agazzi, A. Cordero (a cura di), Philosophy and the Origin and Evolution of the Universe,Synthese Library, voi. 217, Kluwer Academic Publishers, Dordrecht. Pauri M. (a) (1995), Oggettività e Realtà, in F. Minazzi (a cura di), L'Oggettività della Conoscenza Scientifica, Franco Angeli, Milano. PauriM. (b) (1995), Leibniz, Kant and the Quantum: A Provocative Point of View about Space, Time and the Mind-Body Issue,Relazione di apertura della Sessione 1995 della Académie Internationale de Philosophie des Sciencessu "Observability, Unobservability and Their Impact on the Issue of Scientific Realism", Parma 24-28 maggio 1995, in corso di pubblicazione nel volume Observability, Unobservability and Scientific Realism,nella "Boston Series in the Phi-

losophy of Science", Kluwer Academic Publishers, Dordrecht. Pauri M. (c) (1995),Principio Quantistico, Spazio e Tempo,in S. Valusso e S. Cerrato (a cura di),Meccanica Quantistica, Cuen, Napoli. Pauri M. (d) (1995), Spazio e Tempo, in Dizionario delle Scienze Fisiche,voi. 5, Istituto della Enciclopedia Italiana Treccani, Roma.

PenroseR. (1981), Time-Asymmetry and Quantum Gravity, in C.J. Isham, R, Penrose, D.W. Sciama (a cura di), Quantum Gravi ty II: A Second Oxford Symposium,Oxford University Press, Oxford. PepperS.C. (1926), Emergence, in "Joumal of Philosophy", voi. 23, pp. 241-245. Prigogine I. (1980), From Being to Becorning: Time and Complexity in the Physical Sciences,WH. Freeman and Company, San Francisco.

Prigogine I., Stengers I. (1981), La Nuova Alleanza, Einaudi, Torino. Putnam H. (1967), Time and Physical Geometry, in "The Joumal of Philosophy", LXIV, p. 8. Putnam H. (1981), Reason, Truth, and History, Cambridge University Press,

Cambridge. Putnam H. (1987), Mente, Linguaggio e Realtà, Adelphi, Milano 1981. Quentin Smith (1985), Mindindependence of Temporal Becoming, in "Philosophical Studies", voi. 47, p. 104. Quentin Smith (1993), Language and Time, Oxford University Press, Oxford. RedheadM. (1989), Incompleteness, Non-locality and Causality, Cambridge University Press, Cambridge.

ReichenbachH. (1928), Philosophie der Raum-Zeit Lehre, Walter de Gruyter, Berlin-Leipzig. Reichenbach H. (1956), The Direction of Time, California University Press, Berkeley.

Bibliografia 333

Rovelli C. (1995), Half Way Through the Woods, in J. Earman, J. Notton (a cura di), Annual Lectures of the Center for Philosophy of Science,University of Pittsburgh Press, Pittsburgh PA. Russell B. (1915), On the Experience of Time, in "The Monist", voi. 25, p. 212. SearleJ.R. (1980), Minds, Brains and Programs,in G. Tonfoni (a cura di) Menti Cervelli e Programmi, Clup, Milano 1984. SellarsW. (1971), Time and World Order, in H, Feigl, G. Maxwell (a cura di), Minnesota Studies in the Philosophy of Science,voi. III: Scientific Explanation, Space and Time, Minnesota University Press, Minneapolis.

Severino E. (1980), Destino della Necessità, Adelphi, Milano. ShimonyA. (1993), Reality, Causality, and Closing the Circle, in Searchfor a ¹ turalistic World View - Natural Science and Metaphysics,voi. I, Cambridge Uni-

versity Press, Cambridge (Mass.). Shimony A. (1993), The Transient Now, in Searchfor a Naturalistic World Vino - Natural Science and Metaphysics, voi. H, Cambridge University Press, Cam-

bridge, (Mass.). SquiresE. (1990), Conscious Mindin the Physical World, Adam Hilger, Bristol. Stachei J. (1993), The Meaning of Generai Covariance,in J. Earman, A.I. Janis, G,J.Massey, N, Rescher (a cura di), Philosophical Probkms of the Internai and External Worlds - Essays on the Philosophy of Adolf Grunbaum, University of Pittsburgh Press, Pittsburgh PA. Torretti R. (1986), Observation, in "British Journal for the Philosophy of Science", voi. 37, pp. 1-23. WatkinsJ. (1993), Adolf Grunbaum and the Compatibilist Thesis, in J. Earman, A.I. Janis, GJ. Massey, N. Rescher (a cura di), Philosophical Problems of the Internai and External Worlds - Essays on the Philosophy of Adolf Griinbaum, University of Pittsburgh Press, Pittsburgh PA.

WeinbergS. (1995), The Quantum Theory of Fields, voli. 1-2, Cambridge University Press, Cambridge.

Weizsacker von C.F.(1971), The Unity of Physics, in T. Bastin (a cura di), Quantum Theory and Beyond, Cambridge University Press, Cambridge.

Weizsacker von C.F. (1973),Classical and Quantum Descriptions, in J. Mehra (a cura di), The Physicist's Conception of Nature,D. Reidel Pubi. Co., Dordrecht. Weyl H. (1923), Zur Allgemei nen Relativitatstheorie, in "Phys. Z.", voi. 24, p. 230.

WhiteheadA.N. (1955), An Enquiry Concerning the Principles of Natural Knowkdge, Cambridge University Press, Cambridge. Whitrow G.J.(1980 ), The Natural Philosophy of Time, Clarendon Press, Oxford. WienerN. (1948), La Cibernetica, Bompiani, Milano 1953. Wigner E.P. (1960), The Unreasonable Effectiveness of Mathematics in Natural Sciences, "Commun. Pure Appl. Math", voi. 13, pp. 1-14. Zelicovici D. (1986),A Q3is)solution of McTaggart's Paradox, in "Ratio", voi. 28, pp. 175-195. Zelicovici D. (1989), Temporal Becoming Minus the Moving-Now, in "Nous", voi.

23, pp. 505-624.

Parte seconda La meccanica quantistica

4. I fondamenti concettuali e le implicazioni epistemologiche della meccanica quantistica di Gian Carlo Ghirardi

Ai miei fratelli Max e Mariarosa

1. La nascita della meccanica quantistica

Ci accingiamo a percorrere il cammino che ha portato, nel primo quarto del nostro secolo, all'elaborazione di qudla genuina rivoluzione scientifica rappresentata dalla meccanica quantistica, lo schema concettuale che, assieme alla teoria ddla relatività, sta alla base di tutta la moderna visione del mondo. Raramente la nascita di una nuova teoria è stata altrettanto travagliata, ha richiesto cosi rilevanti sforzi da parte di alcune delle più brillanti menti di tutti i tempi e, pur avendo registrato un successo sul piano predittivo ineguagliato da ogni altro schema teorico nella storia della scienza, ha suscitato un cosi vivace e appassionante dibattito e controversie cosi accese circa il suo vero significato. Questi fatti non risulteranno sorprendenti allorché avremo acquisito una certa familiarità con i radicali cambiamenti circa la visione dei processi fisici che sono risultati necessari per inquadrare in uno schema coerente la fenomenologia che andava emergendo nel corso delle indagini sui sistemi microscopici, Conviene precisare subito la linea che seguiremo nella presentazione del nostro tema. Questo primo paragrafo avrà un carattere radicalmente diverso da qudli che seguiranno, In esso ci limiteremo a indicare in termini non tecnici i fatti salienti che hanno posto in evidenza, nel periodo di transizione tra il secolo scorso e quello presente, l'insuáicienza degli schemi concettuali classici per rendere conto di alcuni processi fisici di notevole interesse, tratteggeremo l'articolata linea di pensiero che ha portato a identificare aspetti insospettati del mondo fisico, analizzeremo le ipotesi, talora contraddittorie e/o non precisamente definite che sono state avanzate per superare le difficoltà sopra menzionate, fino a delineare l'epilogo di questo sofferto processo rappresentato dalla formulazione di due versioni del nuovo schema teorico, che solo successivamente verranno riconosciute come equivalenti. Elencheremo anche alcune caratteristiche salienti e alcuni aspetti della teoria che si sono subito rivelati problematici. Il presente paragrafo si configura quindi semplicemente come un breve flash sulla nascita e su alcuni aspetti rilevanti della nuova teoria. Per cogliere pienamente le implicazioni concettuali della rivoluzione scientifica rappresentata dalla meccanica quantistica risulta necessario padroneggiare gli elementi fondamentali del linguaggio matematico che essa utiilizza. Come risulterebbe estremamente laborioso e poco efficace cercare di presentare la meccanica newtoniana senza fornire al lettore gli dementi di

340 4. l fondamenti concettuali e le implicazioni epistemoligiche...

base del calcolo differenziale, cosi, anche se possono farsi passi notevoli nella direzione di rendere accessibih a un vasto pubblico gli aspetti salienti dei processi quantistici,' una reale comprensione delle implicazioni concettuali del nuovo schema richiede una certa padronanza della teoria dello spazio di Hilbert e degli operatori lineari di un tale spazio. Abbiamo quindi confinato nell'appendice una concisa esposizione (evitando ove possibile dimostrazioni tecniche dettagliate) di quella parte di analisi funzionale (geometria dello spazio di Hilbert e teoria delle trasformazioni lineari su di esso) che risulta necessario padroneggiare. La scelta di spostare alla fine del capitolo questa parte è stata dettata dal fatto che, poiché essa rappresenta una lettura certamente impegnativa e che può in qualche misura venire graduata, ci è sembrato opportuno non costringere il lettore a compiere l'intero sforzo di impadronirsi del formalismo matematico prima di avere modo di confrontarsi con gli aspetti fisici della teoria. Ma dobbiamo sottolineare che l'appendice, per chi non ha alcuna familiarità con i temi trattati, risulta un prerequisito essenziale per la comprensione del testo. Fatta questa necessaria precisazione, delineiamo brevemente l'approccio che seguiremo dal paragrafo 2 e che risulterà radicalmente diverso da quello del presente paragrafo. La teoria verrà presentata in modo assiomatico e si farà sistematico uso del linguaggio matematico appropriato. Con gli strumenti acquisiti sarà poi facile affrontare i sottili temi dei paragrafi successivi e valutarne la rilevanza concettuale. Torniamo ora alla nostra presentazione discorsiva dei primi passi e degli sviluppi che hanno portato, nell'arco di un quarto di secolo, alla formulazione definitiva dello schema teorico che è il soggetto di questo capitolo.

1.1 La crisi della Asica classica Come già menzionato, il prologo deHa vicenda che ci accingiamo ad analizzare si può identificare nella fondamentale incapacità degli schemi concettuali "classici" di rendere conto di alcuni basilari fenomeni fisici. L'elenco completo risulterebbe estremamente lungo ed un'analisi esauriente richiederebbe la considerazione di sofisticati effetti fisici e trattazioni tecniche estranee allo spirito di queste prime pagine. Ci limiteremo per-

' Ci sembra utile segnalare che l'autore di questo capitolo ha recentemente accettato questa sfida impegnandosi a scrivere un testo (Ghirardi, 1997) di prossima pubblicazione diretto ad un pubblico di non specialisti nel quale si discutono tutti gli aspetti più rilevanti della meccanica quantistica. Il libro ora menzionato può servire sia come una semplice introduzione agli argomenti di questo capitolo che come fonte di maggiori informazioni su alcuni processi specifici.

La nascita della meccanica quantistica 341

ciò a descrivere alcuni processi elementari che non ammettono spiegazione aH'interno della concezione "dassica" deH'universo fisico. Prima di proseguire vale la pena di precisare che in questo testo espressioni quali "la concezione classica dd mondo", o altre equivalenti, devono intendersi riferite a qud corpo di conoscenze daborate nd lungo corso deH'evoluzione dd pensiero scienti6co dalla rivoluzione galileiana al 1800

e compendiate nei due pilastri della 6sica del secolo scorso, vale a dire la meccanica e l'elettromagnetismo. La meccanica classica, nata dalle profonde intuizioni di Galileo e concretatasi grazie alla geniale opera di Newton nd XVH secolo, ha trovato la sua espressione più raffinata e generale nei lavori di Joseph Louis de Lagrange e di WiHiam Rowan Hamilton nei due secoli successivi. Questa superba teoria tratta, come ben noto, del movimento dei corpi materiali come determinato dalle forze che agiscono su di essi. Tali forze si manifestano quali attrazioni (o repulsioni) mutue tra particdle individuali e governano i loro movimenti nei più minuti dettagli. Come ben noto la meccanica dassica ha consentito l'uniTicazione di fenomeni apparentemente diversissimi; basterà ricordare che essa implica che il moto dei pianeti nei cieli è governato dalle stesse identiche leggi che regolano la caduta di un oggetto qualsiasi sulla Terra. Vale anche la pena di menzionare che mentre in un primo tempo gli scienziati pensavano che i processi fisici che coinvolgono scambi di calore non rientrassero neH'ambito della meccanica, proprio nel XIX secolo fu possibile mostrare che i processi termici trovano la loro origine nei moti disordinati dei costituenti della materia. In altre parole, la meccanica vide in questo secolo uno dei suoi più grandi trion6 quando, grazie

aH'opera geniale diJosiah WiHiard Gibbs, Ludwig Holtzmann e di James Clerk MaxweH, essa portò a un'ulteriore uni6cazione dei fenomeni naturali

fornendo una spiegazione meccanica dei processi termodinamici. Un discorso analogo vale per l'altra grande costruzione teorica classica": l'elettromagnetismo. Per molto tempo il fenomeno ddla luce, i fenomeni dettrici e quelli magnetici sembravano non avere alcuna rdazione tra loro. Le fondamentali ricerche di Michael Faraday e Maxwell, assieme a molti altri, condussero a riconoscere che questi processi cosi disparati non erano che diverse manifestazioni di un'unica entità, il campo dettromagnetico, e permisero di identificare le equazioni che governano in modo preciso tutti i fenomeni ora menzionati. In questo modo il concetto di campo, cioè di una entità 6sica distribuita con continuità nello spazio e nel tempo, entra prepotentemente ndl'ambito deHa scienza e impone di riconoscergli un'esistenza altrettanto reale di quella ddle particelle materiali. Il campo elettromagnetico è in grado di trasportare energia attraverso lo spazio vuoto sotto forma di luce, onde radio, raggi X ecc. Una carat-

342 4. I fondamenti concettuali e le implicazioni epistemoligiche...

teristica fondamentale e pecuhare di tutti quei processi che sono governati dalle leggi dell'elettromagnetismo compendiate nelle equazioni di Maxwell, sta nella loro natura ondulatoria. Questo è il quadro concettuale verso la fine del secolo scorso: va riconosciuta un'esistenza reale sia ai corpuscoli materiali discreti che ai campi continui. Questi enti fisici evolvono in modo preciso nello spazio sotto l'influenza delle loro mutue interazioni codificate dalle equazioni della meccanica e dell'elettromagnetismo le quali dovrebbero consentire, almeno in linea di principio, la comprensione di tutti i processi fisici. Sarà facile immaginare la crisi che consegui all'identificazione di alcuni semplici processi che risultavano assolutamente incomprensibili secondo le teorie ora menzionate e che resistevano a ogni tentativo di ricondurli all'interno della visione dassica del mondo. Passiamo ad analizzame brevemente alcuni.

1.2 La dipendenza della temperatura del "colore" degli oggetti E esperienza comune che molti corpi, quali ad esempio una sbarra di ferro, cambiano colore al variare della loro temperatura. A temperature basse il ferro ci appare dd suo colore "naturale", poi, scaldandolo, esso comincia a emettere calore (ricordiamo che la radiazione termica è una forma di radiazione elettromagnetica). Successivamente esso ci appare rosso, poi giallo, via via fino a diventare bianco a temperature più elevate. Il fenomeno che stiamo analizzando richiamò l'attenzione della comunità scientifica per un motivo estremamente semplice. Su basi puramente termodinamiche risulta possibile mostrare che il rapporto fra il potere emissivo e il potere assorbente di un corpo qualsiasi relativo a una certa frequenza risulta una funzione universale, vale a dire è del tutto indipendente dalle caratteristiche chimiche e fisiche del corpo che si considera, e dipende solo dalla frequenza in esame e dalla temperatura del corpo. Considerando un corpo (detto corpo nero) che assorbe tutte le radiazioni che lo investono (e per il quale quindi il potere assorbente è uguale a 1 per ogni frequenza e ogni temperatura), la funzione universale sopra menzionata è semplicemente il potere emissivo dd corpo nero. Un corpo nero è facilmente realizzabile in laboratorio costruendo una cavità con un piccolo forellino. Poiché ogni raggio che entra nella cavità attraverso il foro subisce ripetuti processi di riflessione sulle pareti interne della cavità e in ogni processo elementare esso ha una certa probabilità di essere assorbito, quanto più piccolo è il foro, tanto minore risulta la probabilità che prima di venire assorbito il raggio venga riflesso proprio in quella direzione che

La nascita della mecc anica quantistica 343

gli consentirebbe di uscire dal foro. Il foro assorbe tutte le radiazioni che lo investono: esso è quindi un corpo nero alla temperatura cui si trova la cavità in oggetto. Gli scienziati prestano sempre una particolare attenzione alle caratteristiche universali dei processi fisici: l'universalità rappresenta di per sé una chiara indicazione che ci si trova di fronte a meccanismi che permetteranno di unificare fenomeni apparentemente diversi. Ed ecco allora (allo scadere del secolo scorso) l'impegno della comunità scientifica per rendere conto dello spettro di emissione del corpo nero. Il processo in esame coinvolge effetti termodinamici di equilibrio tra la radiazione elettromagnetica all'interno della cavità e gli scambi tra essa e le pareti della cavità. Anche se i processi in gioco risultano alquanto complessi essi rientrano tutti nell'ambito tipico della "6sica classica" (equilibrio termodinamico, irraggiamento da parte di cariche in moto e cosi via) e pertanto dovrebbe risultare possibile rendeme conto all'interno di questo schema concettuale. Ahimè, questa speranza si rivela infondata. Malgrado gli sforzi assidui della comunità scientifica non risultò possibile spiegare un processo tanto comune quanto qudlo ora descritto in termini delle leggi della meccanica e dell'elettromagnetismo classici. Questo restò un mistero imsolto fino a quando Max Planck non avanzò un'ipotesi assolutamente rivoluzionaria che sconvolse tutte le idee classiche circa la luce, o, per essere più precisi, circa le radiazioni elettromagnetiche.

1.3 Gli atomi e le loro proprietà Alla fine del secolo scorso e agii inizi di quello attuale, una serie di interessanti ricerche, le più rilevanti delle quali erano state condotte da Sir Emest

Rutherford, avevano condotto a un modello dell'atomo molto simile a quello che oggi tutti utilizziamo. Un atomo veniva concepito come un sistema planetario in miniatura con un nudeo, carico positivamente, nel quale è concentrata quasi tutta la massa dell'atomo stesso. Attorno al nucleo vari elettroni carichi negativamente e il cui numero è tale da neutralizzare la carica positiva del nucleo ruotano come i pianeti attorno al Sole. L'attrazione che, secondo la legge di Coulomb, si esercita tra cariche di segno opposto fa si che ogni elettrone venga attratto dal nucleo. Risulterà perciò ancora una volta alquanto sorprendente che questa analogia abbastanza naturale tra la struttura atomica e quella di un sistema planetario risulti assolutamente insostenibile all'interno dello schema classico per vari, decisivi motivi, alcuni dei quali veniamo a elencare, — La costanza delle proprietà degli atomi. Viene naturale chiedersi: come è possibile che tutti gli atomi di uno stesso elemento, per esempio l'ossigeno,

344 4.Ifondamenti concettualie leimplicazioniepistem oligiche...

esibiscano assolutamente le stesse proprietà 6siche comunque essi siano stati prodotti, e come possono queste proprietà persistere, immutabili, anche allorché i sistemi in questione sono sottoposti a processi notevolmente invasivi quali la fusione, l'evaporazione e, successivamente, vengono riportati alle condizioni iniziali? Un fatto analogo risulta del tutto impossibile per un sistema classico quale un sistema planetario. Infatti le orbite dei pianeti dipendono in modo assolutamente critico dalle condizioni iniziali. Diversi procedimenti di "preparazione" di un sistema planetario conducono inevitabilmente a sistemi apprezzabilmente diversi. Interazioni sia pure di piccolissima entità con altri sistemi determinano cambiamenti rilevanti nell'evoluzione e alterano la struttura di un sistema siffatto. Quindi, fissato il nucleo di un atomo e il corrispondente numero degli elettroni che ruotano attorno a esso, le effettive proprietà fisiche e chimiche del sistema risultante dovrebbero mostrare un'enorme variabilità. Si avrebbero cosi tanti atomi che corrisponderebbero ai diversi modi in cui il nucleo, per cosi dire, ha catturato i suoi elettroni all'atto della sua formazione. Ma tutta la fenomenologia 6sica e chimica mostra che le proprietà di un elemento atomico risultano assolutamente identiche, indipendentemente dalle condizioni di preparazione e dalle trasformazioni che può avere subito. Queste persistenti e precise proprietà che caratterizzano un atomo ne determinano, come già detto, univocamente e fondamentalmente il suo comportamento nei processi 6sici e chimici cui prende parte. Tuttavia, come è ben noto, anche nel caso di atomi a molti elettroni, le proprietà che li caratterizzano cambiano radicalmente allorché si passi da un atomo a un altro con un elettrone in più o in meno. Basterà considerare un gas nobile, per esempio lo Xeno, che ha un nucleo che contiene (oltre a neutroni) 54 protoni attorno al quale ruotano un eguale numero di elettroni. Esso risulta chimicamente inerte, cioè manifesta una estrema diflicoltà a formare composti chimici con altri atomi. Basta tuttavia togliergli un elettrone e un protone (i costituenti rilevanti per quanto riguarda le forze che tengono assieme il sistema) e qualche neutrone, e passare quindi allo Iodio, per avere un sistema con una ben precisa e spiccata af6nità chimica e che manifesta pertanto comportamenti e proprietà radicalmente diverse. Questo di certo non potrebbe accadere per un sistema planetario con altrettanti pianeti: il passaggio da un sistema a quello che contiene un pianetino in meno (e ha un Sole di poco più leggero) non può comportare, in generale, radicali differenze di comportamento del sistema. Infine, un altro fatto fondamentale genera un insanabile conflitto tra la stabilità degli atomi e il modello planetario all'interno dell'edi6cio concettuale della fisica classica. Secondo le equazioni della dinamica classica un sistema di cariche elettriche può stare in equilibrio solo se le cariche sono

La nascita della meccanica quantistica 345

in moto. Il fatto che l'atomo abbia un'estensione limitata comporta che le cariche in esso presenti possiedono un'accderazione. Ma, secondo le ben confermate leggi deH'elettromagnetismo, una carica accelerata emette inevitabilmente onde dettromagnetiche, cioè irraggia. Irraggiando essa perde energia e quindi la sua orbita si restringe portando la particeUa a cadere, in tempi brevissimi, sul nucleo. Un calcolo esplicito porta a concludere che ogni atomo dovrebbe avere una vita estremamente effimera, il che contraddice tutta la fenomenologia di siffatti sistemi. Molti altri fatti e in particolare le modalità specifiche di interazione tra atomi e radiazione elettromagnetica non si lasciano in alcun modo inquadrare, anzi entrano una volta di più in un conflitto insanabile con gli schemi classici. Inizia cosi quella crisi che, come spesso accade nella storia della scienza, prepara una vera e propria rivoluzione scientifica, queHa che porterà, con non pochi travagli e grazie agli sforzi titanici di un gruppo assolutamente eccezionale di geni, aH'elaborazione dello schema teorico cui è dedicato questo capitolo.

1.4 L'ipotesi di Planck e la successiva elaborazione di Einstein Come abbiamo visto nel paragrafo 1.2, tutti i tentativi di spiegare l'irraggiamento di un corpo al variare della sua temperatura in termini delle teorie "classiche" erano miseramente falliti, benché questo problema avesse impegnato alcune delle più brillanti menti del tempo. Planck mostrò che una soluzione al problema poteva ottenersi ammettendo che gli scambi di energia tra radiazione e materia non avvenissero in modo continuo, ma che un campo di frequenza v potesse scambiare energia con la materia solo per "quanti" discreti, vale a dire solo in quantità che risultassero multipli interi della quantità hv. In questa relazione h è una costante universale che da allora porta il nome di Planck stesso e il cui valore è estremamente piccolo, vale a dire pari a 6p5 x 10 " erg/secondo. Dal momento del suo apparire, questa costante, detta anche "quanto d'azione", ha giocato un ruolo sempre più rilevante neH'interpretazione dei più svariati fenomeni fisici, in particolare quelli a livello microscopico. L'ipotesi di Planck, che rappresenta certamente una delle tappe decisive neUo sviluppo della moderna concezione scientifica, non ottenne immediatamente il consenso che meritava, proprio a causa della difficoltà di accettare la rottura che il quanto d'azione introduceva nella continuità dei fenomeni naturali, allora universalmente accettata. Questa ipotesi apparve allo stesso Planck come un artificio matematico, una costruzione astratta che non comportava direttamente la necessità di un mutamento

346 4. l fondamenti concettuali e leimplicazioni epistemoligiche...

profondo ndla concezione della realtà. Planck si vide, in un certo senso, costretto a introdurre il quanto d'azione allorché si rese conto che non esistevano altre vie per dare una base teorica ai fenomeni dell'irraggiamento. La situazione mutò però abbastanza rapidamente. Nel 1905 Albert Einstein basò la sua spiegazione dell'effetto fotoelettrico sull'idea di Planck, estendendone e ampliandone notevolmente il significato: «... le osservazioni... collegate con l'emissione e la trasformazione della luce, vengono facilmente comprese qualora si assuma che l'energia della luce è distribuita nello spazio con discontinuità». Da quei giorni un fascio di luce va assimilato a una cascata, una pioggia di "quanti", di granuli d'energia, i fotoni, anziché a una distribuzione continua di energia. Fu proprio questa rivoluzionaria ipotesi che, tra l'altro, attribuiva aspetti corpuscolari alla radiazione elettromagnetica, a condurre alla formulazione dello schema concettuale, la meccanica quantistica, cui questo testo è dedicato. Risulta iUuminante farsi un'idea della piccolezza del quanto d'azione cercando di valutare, per esempio, quanti fotoni attraversano, in un secondo, un foro di un centimetro quadrato posto a un metro da una lampadina da 100 watt. Un semplice calcolo mostra che esso risulta essere dell'ordine di 24 milioni di miliardi di fotoni. Non stupirà che, a questo livello, la differenza tra una distribuzione continua e una discreta, quantizzata, di energia sia difficilmente rilevabile e che quindi l'esperienza coi campi elettromagnetici a liveHo macroscopico suggerisca una distribuzione continua di energia nello spazio associata alla propagazione dell'onda elettromagnetica. Con la tecnologia moderna non risulta tuttavia difficile realizzare situazioni in cui su una superficie quale qudla considerata arrivano pochi, o addirittura un solo fotone ogni secondo. In questo caso risulta possibile "vederli" (cioè rivelarli) uno per uno e ci si deve convincere che l'ipotesi di Planck e di Einstein è corretta: le onde elettromagnetiche presentano, accanto agli aspetti che le caratterizzano come tali, vale a dire quelli ondulatori, anche aspetti che, nella concezione classica, sono caratteristici dei corpuscoli.

1.5 L'atomo di Bohr e la quantizzazione Cosi come per superare le difficoltà del problema dell'irraggiamento Planck fu spinto a formulare un'ipotesi estranea e in conflitto col quadro concettuale della fisica classica, analogamente Nids Bohr superò una gran parte delle difficoltà del modello planetario dell'atomo con una ipotesi

La nascita della meccanica quantistica 347

analoga e altrettanto "eretica": la quantizzazione dei sistemi materiali. L'idea è abbastanza semplice; si assume che, per qualche motivo non precisato, la visione dassica secondo la quale tutti i moti "planetari" degli elettroni sono possibili non risulti corretta, ma che esistano alcune orbite privilegiate e che esse e solo esse possano essere percorse da un elettrone. Si noti che anche questa ipotesi nega, come quella di Planck, la fondamentale continuità dei processi fisici, vale a dire la radicata idea chenatura non facit saltus. Mentre, secondo la visione classica e come discusso in precedenza, variazioni continue delle condizioni iniziali di "cattura" di un pianeta da parte del sole inducono variazioni continue dell'orbita risultante, secondo l'ipotesi di Bohr questo non accade: un elettrone, per legarsi a un atomo, deve essere catturato in una di quelle peculiari condizioni che sono le uniche compatibili con la formazione di un sistema legato. A queste orbite discrete corrispondono definiti valori dell'energia, che risulta pertanto anch' essa non più una variabile continua ma "quantizzata". Il fatto che solo alcune orbite siano possibih spiega innanzi tutto la regolarità degli atomi e la loro relativa (nella scala appropriata) insensibilità a disturbi esterni. Infatti, comunque un elettrone si leghi a un atomo, deve legarsi in modo da finire su una delle orbite permesse e non su un'orbita arbitraria. Inoltre, nessun piccolo disturbo dovuto a interazioni con altri sistemi può alterare l'atomo in quanto il suo stato può cambiare solo aUorché l'elettrone si riassetta su un'altra delle orbite permesse. Ma anche l'energia che caratterizza l'orbita permessa più vicina a quella originale dista da essa di una quantità finita. Se rton si è in grado di fornire almeno questa energia al sistema, esso resta immutato. Bohr assegna una prescrizione matematicamente precisa per determinare queste orbite privilegiate. Esse sono quelle per cui il modulo del momento angolare risulta un multiplo intero della quantità h/2tr che compare tanto frequentemente nella teoria che i fisici hanno introdotto un apposito simbolo per essa, indicandola come A,. Vale la pena segnalare che, utilizzando le sue regole di quantizzazione, avvalendosi dd principio di conservazione dell'energia e ricordando l'ipotesi di Planck, Bohr riesce anche a spiegare un altro dei misteri del comportamento degli atomi, vale a dire il fatto che essi emettano e assorbano solo radiazioni di frequenze ben precise. Il ragionamento è abbastanza semplice. Se un atomo può stare solo in uno di una serie di stati di energia precisa, esso potrà emettere o assorbire radiazione elettromagnetica solo passando da uno stato all'altro. Corrispondentemente esso emetterà un quanto, un fotone, la cui energia sarà tale da garantire la conservazione dell'energia totale. Supponiamo perciò che un atomo passi da un'orbita di energia Ez a una di energia minore E> emettendo un quanto di luce. L'energia che l'elettrone

348 4. I fondamenti concettuali ele implicazioni epistemoligiche...

perde viene trasferita al fotone, e poiché l'energia di quest'ultimo risulta proporzionale alla sua frequenza v(z~t) si avrà: Ez — E) = hv(z~t)

Se si tiene conto che solo alcuni specifici stati di energia sono permessi ne consegue che solo alcune precise frequenze possono essere emesse (o assorbite) da un atomo; ecco spiegata la natura "a righe" degli spettri di emissione atomica (fig. 1.1). Uirreviotetto

III/I 1000 A '

Violetto Verde

Rosso

IIII/IW 2 0 00 A ' 30 0 0 A '

40 0 0 A ' 50 0 0 A ' 60 0 0 A ' 70 0 0 A '

fig. I.l Mentre la luce bianca che proviene ad esempio dal sole contiene, per cosi dire, tutti i colori visibili e quindi, allorché viene analizzata attraverso un prisma di cristallo dà luogo al ben noto spettro (si pensi all'arcobaleno), la luce emessa da un atomo contiene solo alcune precise lunghezze d'onda e quindi, analizzata a uno spettroscopio, dà luogo a serie di "righe spettrali". Nella figura sono rappresentate le righe caratteristiche emesse da atomi di idrogeno portati a una temperatura elevata nell'intervallo di lunghezze d'onda da 500 a 7000 angstrom. Come ben noto un angstrom rappresenta l'unità di misura caratteristica degli spettroscopisti ed equivale a 10' cm.

La teoria di Bohr rende conto, sulla base di una sola e semplice ipotesi che coinvolge un'unica e precisa regola per identificare le orbite permesse, di una quantità incredibile di dati sulle righe di emissione e di assorbimento dei vari elementi che erano stati raccolti dagli spettroscopisti del tempo. Risultò quindi subito evidente a tutti che questa peculiare ipotesi doveva avere un qualche signi6cato profondo. Va sottolineato che Bohr ha avuto il coraggio di presentare un modello palesemente inconsistente. Infatti egli usa le leggi classiche per determinare le orbite degli elettroni ma introduce l'ipotesi contraddittoria che non tutte le orbite sono possibili. Non solo, egli viola anche l'elettromagnetismo classico, in quanto assume che gli elettroni, pur movendosi su orbite circolari (e dunque possedendo un'accelerazionel non irraggiano.

1.6 L'ipotesi di de Broglie Per la nostra trattazione non risulta necessario attardarci a descrivere lo sconcerto della comunità scientifica durante questi anni appassionanti. Bruceremo quindi le tappe, menzionando solo alcuni fatti salienti.

La nascita della meccanica quantistica 349

Nd 1924 Louis Victor de Broglie presenta la sua tesi di dottorato (che gli varrà il premio Nobel) nella quale avanza un'ipotesi teorica che mostra come possa farsi un passo avanti nella comprensione degli sconcertanti aspetti del reale aumentando, in un certo senso, la confusione; non solo si deve riconoscere con Planck ed Einstein che le onde possono presentare degli aspetti corpuscolari, ma risulta utile supporre che anche i corpuscoli presentino degli aspetti ondulatori. La sua idea può esprimersi molto semplicemente: a qualsiasi particella di massa m e impulso P = mv è associata

un'onda di lunghezza d'onda: jl =-

h P

ove h è la sempre presente costante universale di Planck. Due brevi commenti; — La ragione per cui si è asserito che questo aumento di confusione porta a una maggiore comprensione dei processi naturali deriva dal fatto che se si accetta l'ipotesi di de Broglie, ne consegue che le orbite permesse secondo le regole di quantizzazione della teoria di Bohr sono solamente e precisamente quelle per cui la velocità ddl'elettrone è tale che un numero intero di lunghezze d'onda stanno esattamente in un'orbita. Questa condizione, se si ammette che in un qualche senso l'dettrone sia effettivamente associato a un'onda, è infatti l'unica che consente (fig. 1.2) l'instaurarsi lungo l'orbita di una situazione stazionaria (quale quella di una corda di violino che vibra sempre allo stesso modo), cioè che non varia nd tempo. D'altra parte, la stazionarietà del processo risulta necessaria per rendere conto del fatto che le proprietà degli atomi non mutano nel tempo. — Ovviamente l'introduzione dell'ipotesi ora discussa pone immediatamente un problema: come mai gli aspetti ondulatori postulati da de Broglie non sono mai emersi in esperimenti con corpi materiali? Come mai nessuno ha mai visto diffrangere, per esempio, una particella? La risposta è del tutto ovvia se si tiene presente che la diffrazione si presenta solo quando le dimensioni degli ostacoli che l'onda incontra sono paragonabili alla sua lunghezza d'onda. E allora per rispondere al quesito di cui ci stiamo occupando non resta che valutare la lunghezza d'onda di varie particelle a varie velocità. Per esempio un atomo di idrogeno che si muova con la vdocità che caratterizza la sua agitazione termica a temperatura ambiente va associato a un'onda la cui lunghezza d'onda risulta di circa 10' cm, che corrisponde a quella dei raggi X. Poiché la lunghezza d'onda decresce al crescere della massa risulta ovvio che tutti i corpuscoli del mondo "classico" risultano, di fatto, associati a onde la cui lunghezza d'onda è cosi piccola che per dare luogo a effetti di diffrazione dovrebbe-

350 4.lfondamenti concettualie leimplicazioniepistem olig iche.. .

ro incontrare ostacoli di dimensioni assolutamente al di sotto ddla scala dei processi che li coinvolgono. Ecco perché nessuno si è imbattuto in siffatti aspetti ondulatori per i corpi materiah. Ma se si rifà il calcolo precedente per un elettrone che si muove in un atomo, si vede (come segue

dalla relazione di de Broglie e come risulta evidente dalla fig. 12) che le dimensioni dell'atomo sono paragonabili a quelle della lunghezza d'onda che caratterizza gli elettroni stessi. Ne consegue che, se l'ipotesi di de Broglie risulta vera, nella descrizione di questi sistemi si dovrà tenere conto anche ddla loro natura ondulatoria. Onda Elettrone

® Nucleo

Orbita fig. 12 Orbita di un elettrone in un atomo e lunghezza d'onda dell'onda a esso associata secondo l'ipotesi di de Broglie. La condizione di stazionarietà del processo richiede che un numero intero di lunghezze d'onda stia perfettamente nella circonferenza. Questa condizione identifica esattamente le stesse orbite ddla teoria di Bohr.

La linea di pensiero innescata dalla coraggiosa idea di de Broglie si rivelerà estremamente feconda e, dopo poco più di un anno, porterà Erwin Schrodinger all'elaborazione della meccanica ondulatoria (cioè, di una delle due formulazioni equivalenti della teoria quantistica). L'enorme portata dell'ipotesi di de Broglie si può evincere da una frase di Einstein in una lettera indirizzata a Hendrik Antoon Lorentz nel dicembre del 1924: « ... de Broglie ha fatto un tentativo molto interessante di interpretare le regole quantistiche di Bohr. Io credo che questo rappresenti il primo

debole raggio di luce sul peggiore dei nostri enigmi nel campo ddla fisica. Io stesso ho trovato qualcosa che punta nella stessa direzione». Il ruolo essenziale del pensiero di Einstein per l'opera di Schrodinger è stato ampiamente riconosciuto da quest'ultimo, il quale asseri in varie occasioni che la sua teoria non significa altro che prendere seriamente la teoria ondulatoria delle particelle in movimento di de Broglie-Einstein. E

La nascita della meccanica quantistica 351

Schrodinger farà sempre riferimento all'assunzione discussa in questo paragrafo come "l'ipotesi di de Broglie-Einstein"

1.7 Il superamentodella crisi La profonda crisi nella visione dei processi fisici che abbiamo delineato ndle pagine precedenti trova finalmente il suo sbocco dopo un quarto di secolo. Tra il 1925 e il 1926, Wiener Heisenberg e Schrodinger giungono, indipendentemente e seguendo due linee di pensiero assolutamente diverse, a formulare in modo preciso due modelli teorici che segnano la nascita della nuova meccanica, appunto quella teoria che è l'oggetto di questo capitolo. Heisenberg, allievo e profondo conoscitore dell'opera di Bohr, si convince che l'insistenza del maestro nel visualizzare l'atomo come un sistema planetario rappresenta un ostacolo al superamento deHe contraddizioni ddla teoria. Decide pertanto di concentrare la sua attenzione non su qualcosa che non può essere direttamente esperito, come appunto le orbite degli dettroni, ma sulla radiazione emessa dagli atomi, vale a dire sulle righe spettrali di cui abbiamo parlato nel paragrafo 1.5. In questo modo egli giunge, nel 1925, a formulare uno schema matematico che diviene poi noto come la meccanica deHe matrici. La sua interpretazione rimase un problema aperto per un certo tempo e la sua comprensione ha richiesto rilevanti contributi da parte di Max Bom, PascualJordane Wolfgang Pauli. Schrodinger ebbe nel 1926 il suo anno di grazia. Egli, ormai trentottenne, con alle spalle una brillante ma non superba carriera scientifica,'è conscio del suo valore e si rammarica di non avere ancora dato contributi decisivi alla scienza. Nel novembre del 1925 scrive a Einstein parlando con entusiasmo dell'idea della natura ondulatoria dei corpuscoli. Di nuovo alla fine di quel mese scrive a Hans Thirring una lettera in cui, secondo il destinatario, si trova un preciso abbozzo delle idee che costituiranno la base della meccanica quantistica. Ma non ha ancora elementi decisivi. Tuttavia, in due settimane di vacanza alla fine del 1925 egli trova la sua strada e al suo ritorno a Vienna, avvalendosi ddle raffinate conoscenze matematiche dell'amico Hermann Weyl, porta a compimento, nel giro di meno di un anno, una serie di sei lavori che contengono la formulazione definitiva della meccanica ondulatoria. È interessante segnalare che le due formulazioni della teoria, vale a dire quella di Heisenberg e quella di Schrodinger, non hanno apparentemente alcuna relazione una con l'altra e anche formalmente usano linguaggi molto diversi. La teoria di Heisenberg, come già osservato, è formulata nel

352 4. I fondamenti concetttta3i ele implicazioni epistemoligiche...

linguaggio delle matrici e per questo prende il nome di "meccanica delle matrici", mentre quella di Schrodinger viene formulata nel linguaggio tipico ddle equazioni ddle onde e per questo diventerà nota come "meccani-

ca ondulatoria" Ci vollero alcuni anni affinché, grazie alle ricerche dello stesso Schrodinger e di Paul Adrien Maurice Dirac, ci si rendesse conto e si riuscisse a dare una dimostrazione rigorosa che in realtà le due teorie non rappresentano che due modi diversi di esprimere matematicamente le stesse identiche leggi. Discuteremo questo punto in dettaglio nel para-

grafo A.10 ddl'appendice. 1.8Il dualismo onde-corpuscoli La nuova teoria presenta aspetti molto peculiari ma, come il lettore avrà intuito, comporta al tempo stesso un'importante unificazione nella concezione della natura. Fenomeni cosi diversi dal punto di vista classico quali quelli ondulatori e quelli corpuscolari vengono assimilati. Ogni processo fisico coinvolge simultaneamente queste due facce della realtà. I quanti di luce, i fotoni, si comportano in molti esperimenti come delle particelle (sia pure con particolari proprietà) e analogamente le particelle, sotto opportune condizioni, si comportano come onde. Nasce il problema di capire come possano integrarsi concetti che sembrano inconciliabili e contraddittori. Il formalismo necessita di un'interpretazione e si apre quindi una nuova fase caratterizzata da grande interesse ed entusiasmo, una fase febbrile che porterà alla visione che descriveremo nei prossimi

paragrafi. Ovviamente, a parte gli enormi successi che la teoria incontrò molto presto nella spiegazione di svariati processi fisici, essa sollevò immediatamente un problema sperimentale di grande interesse: è possibile mettere direttamente in evidenza gli aspetti ondulatori delle particelle in esperimenti di laboratorio? Vari ricercatori si cimentarono in questa impresa e la risposta risultò affermativa.

1.9 Cenni alle problematiche sollevate dal nuovo schema Prima di concludere vogliamo passare brevemente in rassegna alcuni punti cruciali che sono emersi in connessione con il nuovo quadro teorico e hanno aperto uno dei più appassionanti dibattiti della storia della scienza. Innanzi tutto il duplice aspetto ondulatorio e corpuscolare di tutti i sistemi fisici conduce, come mostrato da Heisenberg, a una caratteristica

La nascita della meccanica quantistica 353

del tutto inaspettata: l'indeterminismo quantistico. Heisenberg, tenendo presente appunto entrambi questi aspetti riesamina il problema sperimentale di determinare i valori di varie grandezze fisiche ed è condotto a riconoscere che esistono coppie di grandezze, tipicamente la posizione e la vdocità di una particella, che non possono determinarsi simultaneamente con precisione arbitraria: ogni tentativo di conoscere con maggior precisione una di esse porta inevitabilmente a perdere conoscenza circa i valori dell'altra. Si apre un dibattito vivacissimo che vede in prima linea Einstein,

per il quale, almeno in una prima fase dello sviluppo del suo pensiero, l'indeterminismo risulta una caratteristica inaccettabile del nuovo formalismo che ne richiederebbe una radicale modifica. Sull'altro versante, i sempre più agguerriti sostenitori del nuovo paradigma scientifico convinti della sua correttezza formale e confortati dai suoi successi, per uscire da alcune imbarazzanti situazioni quale quella ora accennata si trovano spinti verso posizioni più o meno marcatamente positiviste e strumentaliste: lo scopo della scienza va limitato a render conto degli esiti di processi sperimentali e qualsiasi asserzione che non ammette una verifica (o la possibilità di essere falsificata in laboratorio) risulta illegittima. Ma il dibattito varca ben presto i confini della pura e semplice questione dell'indeterminismo e si sposta sulla questione se abbia addirittura senso pensare che un sistema possegga qualche proprietà indipendentemente dai nostri procedimenti per misurarla. Questo problema dell'esistenza di dementi di realtà oggettiva posseduti dai sistemi fisici individuali, ove il termine oggettiva significa esplicitamente "indipendente dai nostri tentativi di determinarla, indipendente dall'esistenza di osservatori coscienti", diventa uno dei nodi centrali dd dibattito negli anni immediatamente successivi al 1935, anno in cui appare il fondamentale lavoro di Einstein, Boris Podolsky e Nathan Rosen che pone in termini assolutamente nuovi la questione e fa entrare in gioco anche precise richieste riprese daHa teoria della relatività, vale a dire quelle di località. Malgrado la profondità di questa analisi critica sembra che, di nuovo, i sostenitori della cosiddetta "interpretazione ortodossa ddla teoria" abbiano la meglio. Analogamente, il problema sollevato (sia pure solo indirettamente) da Einstein se risulti possibile completare la teoria quantistica in senso deterministico, viene ignorato per molti anni grazie a un teorema dovuto aJohn von Neumann che sembra dare una risposta definitiva in senso negativo al quesito. Ma nel 1952 David Bohm esibisce un modello che rappresenta proprio un esempio di completamento deterministico della teoria. Questo risultato costituirà lo stimolo principale che porterà John Stewart Beli, negli anni Sessanta, a mostrare lucidamente che la teoria risulta, in un ben preciso senso tecnico, nonlocale, un fatto che Einstein non poteva accetta-

354 4.Ifondamenti concettualie leimplicazioniepistem olig iche.. .

re ma che anche i suoi avversari non ritenevano risultasse un'ineludibile conseguenza del formalismo. Infine, conviene menzionare subito un altro problema di grande rilievo che è stato lucidamente messo a fuoco fin dagli anni 30 da Schrodinger e che anche se fino a tempi recenti è stato dassificato come "il problema della teoria quantistica della misura", viene oggi più appropriatamente caratterizzato come il problema della oggettivazione delle proprietà dei sistemi macroscopici individuali, E qui ci addentriamo in un campo nel quale, a differenza di quelli menzionati precedentemente, il problema resta aperto e costituisce il cuore del dibattito attuale sulle implicazioni concettuali del formalismo. Gi appassionanti temi brevemente menzionati verranno analizzati nei paragrafi successivi di questo capitolo: adesso conviene delineare gli strumenti formali adatti a trattarli.

2. La struttura formale ddla teoria

Come ogni altra teoria fisica da Galileo in poi, anche la meccanica quantistica utilizza un preciso linguaggio formale che, come menzionato nel precedente paragrafo, risulta essere quello dello spazio di Hilbert. Per procedere, risulta essenziale precisare quali enti matematici del formalismo vadano associati alle quantità fisicamente rilevanti, in particolare agli stati dei sistemi fisici e alle osservabili fisiche. Inoltre, si dovrà specificare come si renda conto nello schema formale dei due momenti essenziali di ogni esperimento, vale a dire la preparazione dello stato iniziale del sistema e la sua evoluzione temporale. Infine occorreranno regole precise che consentano, dalla conoscenza ddlo "stato" (in senso matematico) del sistema a un certo istante, di fare previsioni circa gli esiti di successivi "processi di misura" Abbiamo enunciato il problema cruciale per ogni teoria, cioè quello della descrizione dei processi fisici, facendo esphcito riferimento a esperimenti di laboratorio semplicemente perché questo approccio consente di

esporre in modo più preciso e semplice "le regole del gioco". Le ragioni di questo fatto sono ovvie e ben note a chiunque sia interessato allo sviluppo dd pensiero scientifico e alla nascita della scienza quantitativa e sono state espresse in modo particolarmente brillante da John Beli: «All'inizio i filosofi naturali cercarono di capire il mondo. In questo loro tentativo essi si imbatterono nella grande idea di immaginare situazioni artificialmente semplificate nelle quali il numero di fattori che entrano in gioco è ridotto al minimo: "divide et impera" — era nata la scienza sperimentale» (Beli, 1990). Ma non vorremmo trarre in inganno il lettore. Come Beli, abbiamo perfettamente chiaro che «l'esperimento è solo un banale strumento. H vero fine resta: comprendere il mondo. Limitare lo scopo della meccanica quantistica esclusivamente a rendere conto delle futili operazioni che eseguiamo nei nostri laboratori equivale a tradire la grande impresa». Riteniamo essenziale sottolineare che la maggior parte dell'analisi seguente sarà dedicata proprio a investigare criticamente le difficoltà concettuali che la teoria incontra allorché la si voglia prendere sul serio come una teoria che ci dà informazioni su "qualcosa che esiste là fuori", vale a dire una realtà che è causa e non prodotto ddle nostre percezioni, e ad analizzare i tentativi che da più di settant' anni vedono impegnati tutti coloro che sono interessati ai fondamenti concettuali di questo schema teorico, tentativi

356 4. l fondamenti concettuali e le implicazioni epistemoiigiche...

mirati appunto a superare le difficoltà cui esso dà origine allorché si accetti che almeno alcune sue caratteristiche formali (tipicamente la linearità) che appaiono confermate oltre ogni ragionevole dubbio da una enorme messe di dati sperimentali, rendano conto di aspetti fondamentali del mondo reale.

2.1 Le regole del gioco: un'esposizione semplificata Cominciamo col precisare l'associazione tra enti matematici e quantità fisicamente rilevanti che sta alla base della teoria a) A ogni sistema fisico S è associato uno spazio di Hilbert )4. b) Gli stati di un sistema fisico individuale S sono descritti dai vettori normalizzati dello spazio g4, e questa descrizione risulta essere la più esauriente che il formalismo consente (questa ipotesi corrisponde all'assunzione, come si dice tecnicamente, che la teoria sia completa). c) Le osservabili fisiche del sistema sono rappresentate dagli operatori autoaggiunti ddlo spazio p. Come già discusso in precedenza lo studio dei sistemi microscopici e il travagliato cammino verso l'elaborazione di uno schema teorico nel quale inquadrarli ha condotto la comunità scientifica ad accettare il fenomeno della quantizzazione, cioè il fatto che almeno alcune osservabili possano assumere solo certi valori discreti. Corrispondentemente la teoria identifica in modo preciso i possibili esiti della misura di un'osservabile: Postulato 1 - esiti delle misure di osservabili fisiche. I soli possibili risultati della misura di un'osservabile A sono i punti ddlo spettro dell'operatore autoaggiunto 8 associato a essa. Con riferimento a questo postulato conviene fare una precisazione: nel caso (o per quegli intervalli dell'asse reale) in cui 8 abbia spettro discreto, la regola appena enunciata ci dice che in una misura è possibile ottenere solo uno degli autovalori propri di 8 (quantizzazione delle osservabili fisiche). Se invece si considera un intervallo appartenente aHo spettro continuo dell'operatore, allora, poiché tutti i valori corrispondenti ai punti dell'intervallo rappresentano possibili esiti, non risulterà mai possibile, in pratica, eseguire un procedimento di misura infinitamente accurato (questo vale anche nell'ambito delle teorie classiche). Pertanto, in questo caso, per descrivere i possibili esiti di una misura si farà ricorso ad asserzioni del tipo: «il valore di A appartiene all'intervallo A (arbitrariamente piccolo, ma che non può ridursi a un punto)». Ovviamente, l'accuratezza della misura dipenderà dallo specifico apparato utilizzato per eseguirla e la teoria non pone alcun

La strutturaformaledella teoria 357

limite alla precisione della misura stessa, un fatto di estrema rilevanza concettuale. Veniamo ora a considerare i tre momenti che abbiamo identificato precedentemente come caratteristici di qualsiasi esperimento. Per agevolame la comprensione procederemo in due stadi successivi. Innanzi tutto esporremo le regole per il caso (semplificato) in cui, sia per quanto concerne la preparazione dd sistema che gli esiti di misure successive, si faccia esclusivamente riferimento a osservabili con spettro puramente discreto.Questa analisi ci consentirà di passare poi in modo estremamente semplice al caso

generale. Postulato 2s - preparazione. La preparazione di un sistema (vale a dire la determinazione del suo stato all'istante iniziale che, per convenienza, indicheremo come t = 0) viene effettuata sottoponendolo alla misura di un insieme completo di osservabili commutanti.' Supponiamo di indicare con (8, E, d',...) le (n) osservabili in questione e con a;,b,; cp,... i relativi auto'valori e supponiamo di avere ottenuto nella misura proprio l'ennupla a;, b,; cp,... di esiti. Si assume allora che lo stato 'P(0) del sistema immediatamente dopo la misura (vale a dire al tempo t = 0) risulta l'unico autostato normalizzato y;~~ comune alle osservabili in questione, relativo agli autovalori ottenuti. In altre parole si pone: 'P(0) = y;, ~ . Passiamo subito ad analizzare come la teoria descrive, nel suo linguaggio formale, il processo di evoluzione del sistema fisico che supporremo di avere preparato nel modo appena indicato. Postulato ) - evoluzione. Lo stato del sistema a qualsiasi istante t successivo a quello di preparazione è determinato dalla soluzione dell'equa-

zione di Schrodinger: ib

= tt"p

(t)

(2.1)

Bt che soddisfa alla condizione iniziale 'P(t = 0) = 'P (0). Nell'equazione (2.1) kè l'operatore autoaggiunto che corrisponde all'hamiltoniana del sistema, vale a dire all'osservabile energia. È utile sottolineare alcune caratteristiche

fondamentali dell'equazione (2.1) : — l'evoluzione, essendo governata da un'equazione differenziale del primo ordine nella variabile temporale, è perfettamente deterministica: lo

' Nei paragrafo 3.6 discuteremo come le misure di osservabili commutanti risultino compatibili nel senso che non si disturbano reciprocamente, e pertanto possono pensarsi eseguite simultaneamente.

358 4.lfondamenti concettualie leim plicazioni epistem oligiche...

stato 'P(t) che descrive il sistema fisico al tempo t è univocamente determinato dallo stato 'P(0) all'istante iniziale; — l'equazione (2.1), poiché d'è un operatore lineare, risulta essa stessa lineare. Quindi, un'arbitraria combinazione lineare di stati iniziali evolve nella stessa combinazione dei loro evoluti. In altre parole se 'P,(t) è la solu-

zione (unica) deil'equazione che corrisponde alla condizione iniziale P> (0) e, analogamente, 'Pz(t) è quella che corrisponde alla condizione iniziale

'Pz(0), allora ~i (t) + @Pz(t), l'a, p c (E è la soluzione (unica) relativa alla condizione iniziale Q%i(0) + P%'z(0) ; — se si indica come V(0, t) l'operatore lineare che induce l'evoluzione, 'P(t) = V(0, t)'P(0), esso risulta unitario e quindi, in particolare, non altera la norma del vettore di stato; se, come supporremo sempre, P(0) è normalizzato, allora anche 'P(t) lo è. Di fatto, come discuteremo in seguito, l'oi

— A

peratore U(0, t) coincide con la funzione e s , nel senso di Dirac, dell'osservabile energia. A questo punto, dopo avere appreso come "preparare un sistema a un certo istante" e dopo avere "risolto" l'equazione di evoluzione, conosciamo il vettore di stato che descrive completamente il sistema al tempo t. Risulta allora ovvio interrogarsi: la conoscenza dell'ente matematico 'P(t) associato alla situazione fisica al tempo t, che tipo di informazioni fornisce sugh esiti di ipotetici processi di misura che lo sperimentatore può decidere di eseguire sul sistema? E precisamente con riferimento a questa basilare domanda fisica che emerge il carattere nuovo e rivoluzionario della teoria. Le informazioni che essa ci fornisce risultano, in generale, fondamentalmente e ineludibilmente probabilistiche. Postulato 4s - previsioni future. La conoscenza più precisa che la teoria consente circa lo stato di un sistema fisico individuale a un certo istante t (cioè quella dei vettore di stato normalizzato 'P(t) da associarsi a esso), determina esclusivamente lap egli esiti che si otterranno in qualsiasi concepibile processo di misura (cioè relativi a qualsiasi osservabile) sul sistema in oggetto. Per fissare le idee si consideri un'arbitraria osservabile B e il relativo operatore autoaggiunto E, che, come anticipato, assumeremo (per ora) possedere uno spettro puramente discreto e non degenere: Eg = b~ g~.Si consideri quindi uno — diciamo b, —tra i possibili autovalori, cke, come sappiamo, rappresentano i soli possibili esiti del processo di misura. La teoria asserisce che in una misura di B al tempo t, la probabilità condizionata P[B = b, I 'P(t)] di ottenere precisamente l'esito b,

roba bilitàd

La strutturaformale della teoria 359

allorché lo stato prima della misura èV(t), è data dal quadrato del modulo del prodotto scalare tra lo stato del sistema e l'autovettore normalizzato

di d' associato all'autovalore in questione:P[B = b, I 'P(t)] = l(g„'P(t)) l'. PostulatoSs - eKetto della misura: L'ultimo problema di cui dobbiamo occuparci, e, come vedremo, quello forse di maggiore rilievo per la teoria, riguarda il fato del sistema, o meglio del vettore di stato che lo descrive, come conseguenza del fatto che il sistema stesso è stato assoggettato al preciso processo di misura che abbiamo considerato e che nel processo in esame si è ottenuto proprio, tra i vari possibili, l'esito b,. A questo fondamentale interrogativo la teoria risponde con uno specifico postulato che ha dato origine a uno dei più accesi dibattiti della storia della scienza, un dibattito che, malgrado l'impegno di alcune tra le più brillanti menti del secolo, non ha portato, dopo settant' anni, a una conclusione soddisfacente. Il postulato in oggetto è parte integrante della cosiddetta "interpretazione ortodossa o di Copenaghen" dd formalismo, e viene indicato come il postulato della riduzione del pacchetto d'onda (Rid. P.) : se il sistema fisico è sottoposto, all'istante t, alla misura dell'osservabile B e nel processo di misura si ottiene l'esito b„aUora, immediatamente dopo la misura, il vettore di stato del sistema non coincide più con quello prima della misura stessa, cioè con 'P(t), ma esso vieneistantaneamente trasformato nell'autostato di E relativo all'autovalore ottenuto. In altre parole, l'effetto ddla misura per misura di B:

il caso in esame può descriversi nel modo seguente: 'P(t)

m

esito b,

g „ ove,

come già specificato, g, è l'autovettore normalizzato (che nel caso in esame risulta unico — a meno dd solito irrilevante fattore di fase) associato all'autovalore b,. Si impongono alcuni commenti: — 11 postulato Rid. P. precisa come cambia lo stato del sistema nello spazio di Hilbert a esso associato. A questo stadio non si tenta neppure di descrivere il processo di misura nei termini che risulterebbero opportuni, vale a dire facendo riferimento al sistema composto "sistema misurato + apparecchio di misura" che rappresenta il vero sistema fisico coinvolto nel processo. — È importante sottolineare che questo postulato rappresenta la controparte naturale e necessaria del postulato 1 che precisa come possa prepararsi il sistema. Infatti se il processo di preparazione consiste nella misura di una certa osservabile 8 e porta al risultato a,; l'assunzione che subito dopo la misura si abbia 'P(0) = p,, ove dyi = aiy,; richiede che nel processo avvenga la riduzione del pacchetto. Si osservi che il postulato 4s garan-

360 4.Ifondamenti concettualie leimplicazioni epistem oligi che.. .

tisce che la ripetizione immediata (cioè senza che il sistema abbia il tempo di evolvere) dello stesso processo di misura darebbe di nuovo con certezza, vale a dire con probabilità 1, lo stesso esito. Già allo stadio parzialmente semplificato adottato per questa prima enunciazione delle "regole del gioco", conviene fare alcune osservazioni circa la struttura formale dello schema che ci consentiranno poi di visualizzare, in una certa misura, lo svolgersi dei processi fisici secondo il formalismo quantistico. Il postulato 2s, relativo alla preparazione del sistema, e l'equazione di evoluzione (2.1) ci consentono di identificare il vettore di stato 'P(t) da associare al sistema in qualunque istante successivo a quello di preparazione. Il postulato che assegna le probabihtà ai possibili esiti della misura di qualsiasi osservabile può venire riletto nel modo seguente: l'operatore E, associato all'osservabile B cui siamo interessati, essendo ipermassimale, possiede un S.O.N.C. (Sistema ortonormale completo; vedi il paragrafo A.2), (gj), di autovettori, ciascuno di essi associato a un diverso autovalore bj Per la completezza dell'insieme (gj), qualsiasi vettore ddlo spazio, e quindi in particolare il vettore di stato 'P(t) al tempo t, può scriversi come una combinazione lineare

dei g;. 'p(r) = $ c,g,

(2.2)

Ricordando che cJ = (gj, 'P(t)) il postulato relativo agli esiti della misura si può allora esprimere asserendo che il quadrato del modulo IcJ)' del j-esimo

coefficiente dello sviluppo (2.2) dà la probabilità di ottenere l'esito bj in una misura di B. Si noti che poiché, come sappiamo, la completezza del

sistema z( l implica l l sp(r)ll = g I c, l (va)es dire poiché p(r) è nonnaJ

lizzato g l c Jl

=

1), Finterpretazione probabilistica risulta consistente: la

somma delle probabilità di ottenere uno qualsiasi dei possibili esiti è uguale a uno, cioè qualsiasi processo di misura porta a uno dei risultati consentiti dal formalismo. È anche utile notare che se si indica comeP,'" l'operatore di proiezione associato alla varietà monodimensionale individuata da gj, allora risulta: PJ' "P(t) = (gj, 'P(t))gJ = cJgj.D'altronde II cJgJ II' = I cjl = ) cJ l', che mostra come la probabilità di ottenere l'esito b, in una misura di B sia data dal quadrato della norma della proiezione del vettore di stato sulla varietà associata all'esito considerato:

Il all'

P[B = bjl'P(t)] = IIP'. "P(t)ll'

(2.3)

— Infine, l'assunzione che come conseguenza della misura lo stato venga istantaneamente trasformato nell'autovettore g corrispondente all'esito della misura stessa si può esprimere dicendo ke 'P(t) esegue un "salto

La struttura formaledella teoria 361

quantico" allo stato Pi"'P(t), che andrà ovviamente normalizzato. In formule: (B)

l'(t)

misura ci s: P. V ( t ) .»»>i

(2.4)

[[p,

f' ' p pp p) Conviene fare immediatamente alcune precisazioni. La regola ora enunciata presenta delle ambiguità che derivano, come è facile comprendere, dal fatto che mentre classicamente l'ordine in cui si scrivono le osservabili "elementari" posizioni-impulsi è del tutto irrilevante, nel caso quantistico, a causa della non commutatività, esso risulta importante. Per citare un caso banale, mentre per la fisica classica le tre quantità «'p„p,»', sp,» coincidono, quantisticamente esse risultano distinte in quanto, per esempio «p,» — = s P,, ~] + s p, = «p, — ifis. A questa difBcoltà si rimedia in parte facendo ricorso alla richiesta irrinunciabile che ogni osservabile debba essere rappresentata da un operatore simmetrico. Infatti, ricordando le regole di coniugio hermitiano e la non commutatività di una coordinata col suo impulso coniugato, si vede subito che per esempio (» p,)' = p,'(~')' = p,»' w ~ p„ove si è tenuto conto che tutti gli operatori in questione sono simmetrici (»' = s e p,' = p,). Conseguentemente l'operatore s p, non può farsi corrispondere a un'osservabile fisica. L'operatore sp,» è invece simmetrico e, come tale, è un buon candidato per rappresentare la quantità dassica in esame. Ma a questo stadio non si può non notare che anche l'operatore (1/2) P,»' + s p,] risulta simmetrico e può, a buon diritto, rappresentare anch' esso la quantità che ci interessa. La prescrizione che abbiamo dato non permette quindi di precisare esattamente l'operatore autoaggiunto da associarsi a qualsiasi concepibile osservabile classica. Fortunatamente, non risulta necessario dilungarci a dibattere questo problema squisitamente tecnico in quanto, per le quantità cui saremo interessati, non si danno mai ambiguità. Cosi, per esempio, l'osservabile energia di una particella in un campo di forze conservativo descritto dal potenziale V(x, y, z) risulterà associata in modo non ambiguo all'operatore hamiltoniano: // = (1/2m) P,' + p' + p,'] + V(», p, e). Similmente, la componenteL, = xp, — yp„del momento c(ella quantità di moto menzionata sopra sarà associata aU'operatore autoaggiunto

Non possiamo concludere questo paragrafo senza menzionare che esistono anche osservabili che non ammettono analogo classico, le più tipiche delle quali sono le variabili di spin di una particella. Per esse si dovrà fare ricorso ad altri criteri (basati essenzialmente sulla specifica fenomeno-

logia di alcuni processi fisici) per identificare il modo appropriato per descriverle e incorporarle nel formalismo generale. L'esempio dello spin sarà discusso più avanti in modo particolarmente dettagliato perché le variabili associate a questo grado di libertà non dassico delle particdle elementari risulteranno particolarmente utili per illustrare alcuni dei punti cruciali del formalismo che saranno oggetto della dettagliata analisi dei capitoli successivi.

374 4.Ifondamenti concettualie leim plicazioni epittem oligiche.. .

2.7 Rappresentazione esplicita delle variabili posizione e impulso Per dare concretezza agli argomenti appena discussi veniamo a precisare come possano rappresentarsi esplicitamente gli operatori che corrispondono alle osservabili posizione e impulso di una particella senza spin, osservabili che, a loro volta, consentono poi di caratterizzare tutte le altre osservabili di interesse fisico per un sistema siffatto. Ovviamente per poter esibire le osservabili si dovrà ricorrere a una realizzazione esplicita dello

spazio di Hilbert. Come sappiamo dall'appendice A.10, un modo per fare questo consiste ndlo scegliere un insieme completo di osservabili commutanti, individuare la rdativa base di autostati (propri o impropri) e identificare gli elementi dello spazio astratto con le successioni o con le funzioni continue definite dai prodotti scalari dei vettori con gli stati della base. In questo paragrafo, e in molti di quelli che seguono, ricorreremo a una scelta che corrisponde a quella fatta originariamente da Schrodinger, cioè adotteremo come base quella degli autostati impropri delle componenti ddla posizione. Come menzionato nel paragrafo precedente i tre operatori autoaggiunti ~, p e z presentano tutti e tre uno spettro puramente continuo che si estende su tutto l'asse reale e, per il caso in esame di una particdla senza spin, rappresentano un insieme completo di osservabili commutanti. Indichiamo allora come y„y, l'unico autovettore improprio che è autostato simultaneo di queste osservabili relativo agli autovalori x, y e z, ciascuno di essi potendo assumere un valore reale qualsiasi. In altri termini sia: +Pxyz

x 9 xyz>

p 9 xyz

y( x y a > z gxy z

z 9xyz

(2.12)

Gli autostati impropri y„y „ d o vranno inoltre essere normalizzati a una delta di Dirac in ciascuna delle variabili (infatti gli argomenti sviluppati nei paragrafi A.4 e A.10 possono ripetersi per ciascuno dei gradi di libertà indipendenti del sistema — un modo equivalente per capire questo fatto deriva dal tenere conto che lo spazio di Hilbert di una particella in tre dimensioni è il prodotto diretto degli spazi di Hilbert per ciascuno dei

suoi tre gradi di libertà) : (pzyzp p zyt) =

B(x — x)b(y — y)b(z —z)

(2.13) (3) ~

Il membro a destra della (2.13) si scriverà anche, per brevità, 8

(r — ).r

Secondo quanto precisato sopra, considerato un qualunque elemento 'P dello spazio di Hilbert, esso verrà identificato con la funzione di t.'"'(~) :

'P(x,y,z) = (y„y„'P)

(2.14)

Con questi presupposti circa la caratterizzazione dello spazio in cui stia-

La strutturaformale della teoria 375

mo operando, possiamo ora definire gli operatori che corrispondono alle componenti della posizione e dell'impulso secondo le seguenti regole:

. 8

8 Bx

. 8 (2.15)

— —, te ~ -tb —, p, w — tb — s w xe, p w ye, r w z®, p,— > tb

Bz

8$

che devono leggersi nd modo seguente: ~ è l'operatore lineare che trasforma l'elemento 'P, il cui rappresentativo è la funzione 'F(x, y, z), nell'elemento il cui rappresentativo è la funzione (~'P) (xyz) = x'F(x, y, z) (e analogamente per tt e t), mentrep, è l'operatore lineare che trasforma l'elemento 'P, il cui rappresentativo è la funzione 'P(x, y, z), nell'elemento il cui rappresentativo è la funzione p,'P) (xyz) = -ib

A'(x,y,z) '' ( e analogaBx

mente perp ep,). In altre parole gli operatori di posizione agiscono come operatori dt moltiplicazione e quelli di impulso come operatori di derivazione (preceduti da un opportuno fattore) sulle funzioni a quadrato sommabile ddle variabili x, y e z. Ovviamente il dominio di questi operatori sarà costituito dall'insieme di quegli elementi di t'"'(~) tali che le loro immagini sono ancora elementi di l'"'(~). È immediato verificare che la scelta ora fatta implica che le regole di commutazione (2.11) risultano soddisfatte. Per esempio si ha:

Bx =-ib

. A A'(X,' y, . ' z)+ib'P(,y,z)+ 'b Bx

Bx ' ( X, ' ' y, z) = 'b'P(,y,z) (2.16) 8X

che, data l'arbitrarietà dell'elemento 'P(x, y, z) di t.'"'(~), dimostra appunto che i due operatori considerati soddisfano alla regola di commutazione [s,ta,] = iA. In modo del tutto analogo si dimostra la validità delle altre regole di commutazione. Dalle espressioni ora scritte si deducono immediatamente, in accordo con le prescrizioni del paragrafo precedente, gli operatori che rappresentano osservabili quali la componente z dei momento angolare o l'energia. Per esempio si avrà:

Bp

(2.17) ox

8 . 8 zo Se si osserva che (ta.) m ( — th — )( — ih — ) = — h , (e analoghe), e che poiox

Bx

che poiché le variabili di posizione vanno identificate con operatori di moltiplica-

376 4.I o fndamenti concettualie leimplicazioniepistem olig iche.. .

zione ogni loro funzione va identificata con la moltiplicazione per la funzione stessa, si condude immediatamente che l'osservabile energia:

[p'+ p'+ p']+ V(s,p,z) 2m dovrà identi6carsi con l'operatore: p2 g z

g2

(2.18)

g2

g = — — [ — + — + — , ] + V(x,y,z) 2 m gx' g y ' gz'

(2.19)

Ne consegue che, nella rappresentazione adottata, l'equazione di Schrodinger si scriverà:

o)'P(x,y, z, t)

b' 8" P(x ,y,z> t) 8" P(x, y, z, t) 2m Qx Qy

Bt

8"P(x,y,z,t) ' ' ' ] + V ( x , y ,z)'P(x,y,z,t) + Bz

(2.20)

ove si è ovviamente posto: 'P(x,y,z,t) =

(cp„„,'P(t))

L'equazione (2.20) è un'equazione del primo ordine nella derivata temporale e come tale la sua soluzione 'P(x, y, z, t) è univocamente determinata

dalla condizione iniziale 'P(x, y, z, 0). Interessiamoci alla rappresentazione, nella base che abbiamo adottato, degli autostati della posizione stessa. Lequazione (2.13) ci fornisce già la risposta desiderata: gli autostati ddla posizione saranno rappresentati (si

confronti la discussione del paragrafo A.10) dalla funzione delta di Dirac (ovviamente, in questo caso in cui abbiamo tre operatoti con spettro continuo — uno per ogni grado di libertà — dal prodotto di tre funzioni siffatte). Poiché gli operatori di posizione sono rappresentati (come abbiamo visto sopra) da operatori di moltiplicazione dovrà valere la relazione:

XB(x — x)B(y — y)B(z — z)= xB(x — x)B(y — y)b(z — z)

(2.21)

che di fatto è una conseguenza della relazione rdativa alla sola variabile x: x B(x- x ) = xs(x — x)

(2.22)

la cui validità è garantita dal fatto che, come sappiamo, la "funzione impropria" di Dirac è nulla per qualunque valore dell'argomento tranne che per il valore nullo. Moltiplicandola per un fattore che si azzera nell'unico punto in cui essa è diversa da zero si ha quindi: (x — x)6(x — x) = 0

che è appunto la (2.22). Si noti che la relazione (che rappresenta la proprietà che definisce la delta di Dirac) valida per qualsiasi funzione 'P(x) continua nel punto x:

La strutturaformaledella teoria 377

~( )

= f v(.-)d(.—.-)d.-

(2.23)

garantisce automaticamente due fatti importanti: innanzi tutto che la sovrapposizione delle autofunzioni relative a valori x che coprono un arbitrario intervallo continuo h, genera una funzione di x che vale 1 in quell'intervallo e zero al di fuori di esso. Essa pertanto risulta a quadrato sommabile e appartiene allo spazio di Hilbett, Quindi le autofunzioni p z y 2 soddisfano alla proprietà irrinunciabile che abbiamo imposto agli autostati del continuo. Inoltre l'identità (2.23), o meglio la sua ovvia generalizzazione al caso tridimensionale: + oo

'P(y) =

+ oo

+ ee

JdxJdyf dj'P(r)d(x — x)ty(y — y)tS(x — x) (2.24)

mostra che ogni funzione di C"'(~) può esprimersi come combinazione lineare degli autostati simultanei degli operatori di posizione e che pertanto essi costituiscono un sistema completo di autovettori impropri. Secondo le regole interpretative generali i quadrati dei moduli dei coefficienti dello sviluppo rappresentano le densità di probabilità di trovare gli esiti considerati in una misura delle osservabili associate a essi. Ne consegue l'interpretazione probabilistica di Born della funzione d'onda nella rappresentazione delle coordinate (la rappresentazione adottata da Schrodinger per la sua formulazione della teoria): il quadrato del modulo

l'P(r) l' della funzione d'onda fornisce la densità di probabilità di trovare la particella nel punto r, qualora si esegua una misura di posizione. Un modo equivalente di giungere alla medesima conclusione si ha osservando

(per semplicità ci riferiremo a un solo grado di libertà) che la famiglia di operatori di proiezione definiti nella rappresentazione delle coordinate dalle relazioni: P'"'( PI,)%'(x) = 'F(x) se x < iL, P'"'(PI,)'P(x) = 0 se x > g

(2. 2 5 )

costituiscono la rappresentazione dell'identità associata all'osservabile s. Ne con-

segue che P"'(c + A) — P"'(c) è il proiettore che lascia inalterata la funzione d'onda l'(x) nell'intervallo (c, c + t )à) e lapone uguale a zero fuori da esso. Secondo

lo schema generale Il[P'"'(c + h) — P"'(c)]'P(x) II' rappresenta la probabilità di un esito appartenente all'intervallo considerato per la variabile posizione. Ma la norma di una funzione identicamente nulla fuori da un intervallo non è altro che l'integrale del quadrato del suo modulo nell'intervallo considerato, per cui:

[P[x c (c, c+ A)l%) =

C+ts

f I'P(x)l* dx nn altro modo di dire che I P(x) l' è Ia densità c

di probabilità di posizione. Risulta utile, ai fini dell'analisi che seguirà e per una discussione

378 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

approfondita del principio di indeterminazione, considerare anche le equazioni agli autovalori per le componenti dell'impulso che, come già osservato e come risulta dalle (2.15) data l'interscambiabilità dell'ordine di derivazione di una funzione a più variabili, risultano commutare tra di loro. Denotiamo come Xp p p l'autovettore improprio che è l'unico auto-

stato simultaneo di queste osservabili relativo agli autovalori p„, p, e p,: f >XP> Py P>

P>>XP> Py P> >

9 >XP> Py P> P>XPr P> P>

/PYXP> Py P> PYXPr Py P> >

Se si considera la realizzazione dello spazio che abbiamo adottato, ciò significa determinare una funzione Xp p p (x, y, z) che soddisfi alle equazioni:

8

(2.27)

-ih — Xp„,p„,p (x,y,z) = P„XP„,„,P (x,y,z)

e analoghe. Il lettore potrà facilmente verificare che la funzione cercata risulta: t

e~

Xp p p (x,y,z) =

~+P>+Ypy+~P> l

(2.28)

(2trh) ove il fattore moltiplicativo è stato scelto in modo che le funzioni in esame risultino correttamente normalizzate a una delta di Dirac: (Xp p> p>>Xp .pop>) = ~ (Px Px )~(PY

P y)@Pz

Pz)

(2.2 9 )

Risulta anche facile dimostrare (è una semplice conseguenza di teoremi generali sulle trasformate di Fourier) che se si considera una sovrapposizione continua estesa a un arbitrario elemento di volume dello spazio

degli impulsi di soluzioni del tipo della (2.28) si ottiene una funzione delle variabili x, y e z appartenente a Z"'(~), per cui le funzioni stesse sono accettabili quali soluzioni improprie dell'equazione agli autovaloii. Poiché nella (2.28) i numeri reali p„, py, p, risultano del tutto arbitrari, si è anche dimostrato che lo spettro di ciascuna ddle componenti dell'impulso copre tuttol'asse reale. In questa prima parte, per passare dal formalismo astratto a una sua concreta rappresentazione (che viene usualmente indicata come rappresentazione ddle coordinate o di Schrodinger), abbiamo fatto uso degli autostati impropri delle osservabili di posizione. Ma abbiamo appena visto che anche gli operatori associati alle componenti dell'impulsotp„tp, tp„commutano tra di loro e hanno uno spettro puramente continuo che copre tutto l'asse reale. Avremmo quindi potuto legittimamente scegliere un'altra via per realizzare concretamente gli elementi del nostro spazio, facendo riferimento a queste variabili (tecnicamente si direbbe che si

La strutturaformale della teoria 379

adotta la rappresentazione degli impulsi). A questo scopo, considerato un qualunque elemento dello spazio di Hilbert, esso viene identificato con la funzione di C"'(~), che per chiarezza notazionale indicheremo come P (p„,

(2.>0)

P(P Py P2) = (ZP.,P,,P,> P)

Ovviamente, avendo caratterizzato diversamente lo spazio, anche gli operatori che corrispondono alle variabili canoniche andranno modificati, e si verifica immediatamente che le regole di commutazione (2.11) risultano soddisfatte dalla seguente scelta, che sostituisce la (2.15) : s W ih

8 , p — ih>. 8 Px

. 8

, 2 —ih > —,

Py

ty,W px• z ty — > py• z t), W pz

(2.31)

2

Risulta utile mostrare come siano legate le due realizzazioni alternative che abbiamo appena considerato dello stesso elemento 'P dello spazio astratto di Hilbert, vale a dire identificare le relazioni matematiche che intercorrono tra la funzione 'P(x, y, z) della (2.15) e la funzione 'P(p„, py, p,) della (230). A questo scopo basta ricordare la relazione di completezza per le osservabili posizione:

'r =J dxf dyJ

(2.32)

dz(y„z„'p)r„z,

che implica: +(y y, y .) (2 =„,

+..) J' d=X J dyf

d (rZ.,.„+)(2, „., z,r..,) (2»)

Ricordando che l'ultimo termine a destra non è altro che il complesso coniugato ddla funzione (2.28) e che il termine che lo precede è la rappresentazione delle coordinate dello stato 'P, si ha infine la relazione cercata:

C(p„,yz,p,) =

f dxf' dyf

1

dze"(xy,z)e'

'" '' '

(2 y 4)

Questa equazione mostra che la funzione 'P(p„, p„ p 2), il quadrato del modulo della quale fornisce, secondo le prescrizioni generali, la densità di probabilità degli esiti per l'impulso, risulta la trasformata di Fourier della

funzione 'P(x, y, z). Questo paragrafo dovrebbe avere reso chiaro come concretamente si opera per la trattazione di uno specifico problema fisico all'interno del formalismo. Tuttavia, l'analisi delle implicazioni dello schema teorico che intendiamo sviluppare non richiederà di fare sempre ricorso a una esplicita rappresentazione degli enti astratti, stati e osservabili, che entrano in gioco, in quanto sono le loro relazioni strutturali queHe che determinano

380 4.Ifondamenti concettualie leimplicazioniepistem olit >iche...

tutte le conseguenze pratiche per quanto concerne la descrizione dei processi fisici. Per questo motivo svilupperemo la nostra analisi facendo sistematico riferimento alle proprietà formali della teoria, evitando, ove possibile, di appesantire la trattazione con formule inutilmente complicate. 2.8 L'algebra delle componenti del momento delle quantità di moto Prima di riprendere l'analisi generale, riteniamo opportuno illustrare le relazioni algebriche tra le componenti del momento delle quantità di moto o momento angolare orbitale, per la loro rilevanza e anche perché esse risulteranno utili per la successiva analisi delle osservabili di spin che non hanno analogo classico, ma che presentano le stesse caratteristiche algebriche. A questo fine consideriamo le componenti classiche del momento angolare lungo tre assi ortogonali e il quadrato del vettore momento angolare stesso: L„=yp~-zpy' > Ly = z px — xpzi L z = y t Py g P x> L = L + L + L

(2,35)

In accordo con le prescrizioni riportate nd paragrafo precedente, il formalismo quantistico assocerà a queste osservabili classiche i corrispondenti operatori: 't'

z = z'

f'z

• = 'f " z P i ' .

Calcoliamo le relazioni di commutazione tra questi operatori utilizzando le regole del paragrafo A.3 che precisano come possa valutarsi il commutatore tra somme e prodotti di operatori. Cominciamo col considerare la parentesi di commutazione tra le prime due componenti. Si ha, innanzi tutto:

— z',z',

[ /,i ] = [pp.

~p f ]

— sp,] =

[ p i ~i • ] [z

(237)

f ]+[zA ~i']

Consideriamo ora il primo termine a destra. Per esso, ricordando le identità [zl, Eg = 8'[ri', g + [8, E]C' e[88', g = 8[8, dJ + [8, Q8', si procede nel seguente

modo:

~~r"~] =

=

~~ ~ ~ ~+ ~~ ~ .

~~. =

V ~Z"f~+ ~~ f'~~+~~r- ~r+~~']f'f

Analizziamo i quattro termini di questa rdazione. Ricordando che osservabili associate a diversi gradi di libertà commutano tra loro e che [ty„z] = - [z,p,] = —i fi si vede immediatamente che l'unico termine che sopravvive è il terzo che risulta uguale a —ifipp,. Procedendo nello stesso modo si vede immediatamente che i due termini successivi a destra della (2.37) risultano nulli perché contengono o solo operatori che si riferiscono a diversi gradi di libertà o operatori identici (ovviamente ogni operatore commuta con sé stesso). Resta quindi solo l'ultimo

La struttura forrrtaie della teoria 381

termine, il quale, esattamente come il primo, può esprimersi come somma di quattro termini, tre dei quali risultano nulli. L'unico termine che sopravvive è ~[r, p,]te che risulta ugualeaifup . Condudendo [/, /] = i fi,(~p -pp,) -=ili/.

In modo del tutto analogo si valutano gli altri commutatori. Oltre alla relazione appena scritta, valgono quelle che si ottengono da essa per rota-

zione ciclica degli indici: [ / , / ] = ib/, [ / , /

] = ibt„ [ / , / ] = tyj/

(2.38)

Risulta ora immediato valutare le relazioni di commutazione di /' con le varie componenti. Come esempio possiamo considerare la parentesi di commutazione di questo operatore con /:

[ /',/ ] = [/ ' + / ' + / ' , / ] = [/ ' + / ' , / ] = [/ ' , / ] + [/ ' , / ] = /[/ , / ] + [/ , / ] / + / [/ , / ] + [ / , / ] / , = -t h// - tkf/,+ tb//+ tb// = O che implica (come è anche banale verificare direttamente) che /' commuta con tutte le componenti del momento angolare in quanto non vi è nulla che privilegi una direzione rispetto alle altre. Quindi:

[/' ,/ ] = [ / ' , / , ] = [/ ' , / ] = 0

(2.39)

Si potrebbero adesso esplicitare gli operatori in questione (esprimendoli, per esempio, in termini di operatori di moltiplicazione e di derivazione dello spazio delle funzioni a quadrato sommabile deHe variabili x, y e z) e studiame le equazioni agli autovalori. Non ci addentreremo in questo problema matematicamente laborioso e ci limiteremo a identificare i punti dello spettro di queste osservabili. Poiché /' commuta con tutte le componenti, potremo cercare, per esempio, gli autovettori comuni a esso e a una delle componenti, diciamo /. Conviene scrivere le equazioni agli autovalori nel modo seguente: / pt~ = l(l+ l ) h

c pl m> /g'/tm

r r t k p t yg

(2.40)

L'analisi di queste equazioni mostra che entrambe le osservabili presentano uno spettro puramente discreto: la prima ammette soluzioni accettabili se e solo se l risulta un intero positivo o nullo: l = 0, 1, 2,..., e, corrispondentemente, per un fissato l, la seconda ammette soluzioni solo se rrt risulta un intero positivo negativo o nullo compreso tra — l ed l: m = — l, — l +

1,...,— 1,0. + 1,...,/ — 1,L Fin qui ci siamo occupati del momento angolare di una particella. Come ben noto, il momento angolare totale di un sistema di più particelle risulta, in fisica classica, la somma vettoriale dei momenti angolari dei costituenti, È interessante sottolineare che si può dimostrare facilmente (tenendo presente il fatto che osservabili relative a diverse particelle commutano), che

382 4.Ijondamenti concettuali eleimplicazioniepistem olig iche...

le regole di commutazione (2.38), (2.39), come pure le conclusioni circa i possibili valori del quadrato dd momento angolare e delle sue componenti, valgono immutate per il momento angolare orbitale totale di un sistema di molte particelle. È interessante analizzare il fenomeno della quantizzazione nel caso del momento angolare. Poiché il momento delle quantità di moto esprime, nel caso dassico, le modalità secondo cui una trottola può, per esempio, ruotare su stessa, la prima equazione ci dice che non tutte le velocità angolari sono possibili per una trottola quantistica ma solo quelle per le quali il modulo dei momento angolare assume i valori ~lil + i)g. Inoltre, se uno preciso di questi valori caratterizza la rotazione della trottola, allora essa non può orientarsi, rispetto a una qualsiasi direzione fisicamente privilegiata, in modo da formare con essa un angolo arbitrario, ma può orientarsi solo nei (2l + 1) modi che corrispondono al fatto che la sua proiezione lungo l'asse risulta uguale a mh, con m un intero relativo compreso tra — l e l. Nella figura 2.4 abbiamo schematizzato il caso in cui si abbia l= 2, vale a dire una trottola per la quale ù modulo del momento angolare risulta +6A e, in accordo con l'analisi appena svolta, essa può orientarsi solo in uno dei cinque modi indicati in figura rispetto a un asse fisicamente caratterizzato.

6g. 2.4 I soli cinque possibili modi in cuiuuna trottola quantistica" il cui momento angolare assume precisamente il valore ~ (in unità A,) può orientarsi rispetto a una direzione che è stata scelta coincidere con l'asse z. Si sono indicati, sempre in unità fi, i possibili valori quantizzati della componente del momento angolare lungo l'asse.

prefistsa a

La struttura formale della teoria 383

Vale anche la pena di menzionare che, nel caso di una particella carica, associato al momento angolare orbitale si ha un momento di dipolo magnetico. Questo non deve stupire, una particella carica in moto che, per esempio, percorre un'orbita chiusa, è assimilabile a una spira percorsa da corrente e, come ben noto, un siffatto sistema si comporta come un ago magnetico. Di fatto esiste una ben precisa relazione, sia nelle teorie classiche che in meccanica quantistica, tra il valore del momento angolare orbitale e qudlo magnetico a esso associato. Se si misura il momento angolare, come noi abbiamo fatto, in unità fi e il momento magnetico in unità

eb 2mc

, ove e è la carica e trt la massa della particella in esame, allora

queste due quantità risultano misurate dallo stesso numero. Ciò signi6ca, con riferimento al caso appena analizzato, che se per esempio la nostra particella si trova nello stato per il quale una misura della componente z del momento angolare darebbe con certezza il risultato kA„allora, per questo stesso stato, si otterrebbe con certezza il risultato k

eb

in una

2 rtzc

misura del momento magnetico lungo la stessa direzione.

2.9 Lo spin dell'elettrone Come già anticipato, una notevole serie di fatti sperimentali ha condotto i fisici a riconoscere che l'elettrone (e molte altre particelle elementari, tra le quali il protone e il neutrone) possiede un grado di libertà interno (vale a dire non legato alle variabili di posizione e di impulso che fanno riferimento al moto nello spazio ordinario), lo spin, che si configura come un momento angolare. R come se le particelle elementari, pur essendo puntiformi, si comportassero come minuscole trottole. Lo spin però, a differenza del momento angolare orbitale che può assumere qualsiasi valore tra quelli permessi dalle regole di quantizzazione discusse nel paragrafo precedente, risulta una caratteristica tipica di ogni particeUa, cosi come la sua massa e la sua carica. Inoltre esso mostra altri aspetti sorprendenti in quanto, pur risultando quantizzato, esibisce valori che non rientrano nella famiglia di quelli che abbiamo visto essere i soli possibili per il momento angolare orbitale. In realtà, sia il fatto che alcune particelle posseggano uno spin, sia i valori "anomali" che esso può assumere, risultano conseguenze dirette della richiesta che le equazioni quantistiche vadano generalizzate in modo da rispettare i principi della teoria della relatività. Tuttavia,

384 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

poiché in questo lavoro non ci occuperemo di teorie quantistiche rdativistiche, procederemo a presentare il formalismo che è stato introdotto, principalmente a opera di Pauli, per trattare questo nuovo aspetto del mondo fisico. Come già asserito lo spin si configura come un momento angolare, pertanto risulterà naturale assumere che gli operatori che devono corrispon-

dere,all'interno del formalismo, alle componenti di questo nuovo grado di libertà dei microsistemi soddisfino alle rdazioni algebriche (2.38). Se indichiamo come Z„, Zy e Zzle tre componenti dello spin lungo tre assi ortogonali essi ubbidiranno alla regola di commutazione: (2.41) [Z„, Zy] = ihZz e quelle che ne conseguono per rotazione ciclica degli indici. Come abbiamo visto, siffatte relazioni implicano di per sé che l'operatore quadrato del momento di spin: L' Z z + Zy + Zz commuti con tutte le componenti. La novità rispetto al caso analizzato nel paragrafo precedente consiste nel fatto che l'operatore L' possiede un valore ben preciso per ogni tipo di particella. Se si scrive per comodità questo valore in una forma analoga a quella dell'equazione (2.40), vale a dire si pone: L' = s (s + 1) A,', allora per le particelle sopra menzionate (elettrone, protone, neutrone), s assume (anziché un valore intero) il valore 1/2, Poiché le relazioni algebriche tra le variabili di spin implicano, di per sé, che per un fissato valore di s, ciascuna delle componenti Z„, Zy e Zz possa assumere solo uno dei valori che (in unità A,) vanno da — s a s saltando di un'unità, ne consegue che i soli possibili esiti in una misura della proiezione dello spin di un elettrone lungo un asse risultano essere — A/2 e + A,/2. Per semplicità conviene allora esprimere Z„, Zy e Z in termini di tre nuovi operatori ponendo: Z = [A/2] o;; i = x, y, z. Per sostituzione nella (2.41) si vede subito che le regole di commutazione per i nuovi operatori risultano: [á~ o~] = 2icrz e quelle che si ottengono per permutazioni

cidiche degli indici.

(2.42)

Ovviamente, poiché i soli possibili esiti in una misura di una componente dello spin sono quelli indicati sopra, i soli possibili esiti in una misura di uno degli operatori ora introdotti sono i due numeri + 1 e — 1. Vorremmo richiamare l'attenzione del lettore su due fatti di estremo rilievo. Poiché lo spin rappresenta un nuovo grado di libertà del sistema, lo spazio di Hilbert appropriato per la descrizione di un dettrone non sarà semplicemente quello che abbiamo considerato precedentemente e che poteva identificarsi con lo spazio infinito dimensionale delle funzioni a quadrato sommabile delle variabili x, y e z, ma risulterà il prodotto diretto di questo per lo spazio di spin. Poiché in questo spazio le osservabili

La struttura formale della teoria 385

fondamentali, vale a dire le componenti dello spin lungo un'arbitraria direzione, possono assumere solo due valori, lo spazio stesso risulta bidimensionale.' Per descriverlo dovremo allora fare ricorso al formalismo matriciale di Heisenberg (si veda il paragrafo A.10) : gli elementi dello spazio saranno vettori a due componenti e le osservabih saranno rappresentate da matrici 2 X 2. Ovviamente la forma esplicita ddle osservabili e dei vettori dipenderà dalla base che sceglieremo. Per analogia col caso precedente faremo ricorso alla base degli autovettori dell'operatore o',. Poiché come sappiamo, un'osservabile, nella base dei suoi autovettori, assume forma diagonale e ha come elementi della diagonale i suoi autovalori, la nostra scelta equivale ad asserire che cr, deve rappresentarsi colla matrice: o, =

10

i cui a u t ovettori normalizzati (ricordiamo che la norma di un

vettore è rappresentata dalla somma dei quadrati dei moduE delle sue componenti) relativi agli autovalori 1 e — 1 risultano

1

e

0

, rispettiva-

mente, come si verifica subito eseguendo il prodotto righe per colonne. Il generico vettore dello spazio di spin sarà un arbitrario vettore a due componenti, ed esso può scriversi come combinazione lineare dei due autostati di o,:

una relazione che mostra come o', abbia un sistema completo di autostati, vale a dire sia un operatore autoaggiunto dello spazio di spin. H lettore può verificare immediatamente che le rdazioni algebriche (2.42) risultano soddisfatte dalla seguente scelta per le tre osservabili in gioco:

01

0—i

10

(2.43)

Prima di concludere questo paragrafo risulta opportuno scrivere esplici' Owiamente il lettore sa bene che non è corretto passare direttamente dalla conoscenza del nume-

ro degli autovalori di un operatore che abbia senso fisico alla dimensionalità dello spazio di Hilbert in cui esso opera, a causa del fenomeno della degenerazione. Per esempio, tutti gli operatori di proiezione hanno solo i due autovalori l e 0 ma, nei casi considerati fin qui, essi agiscono suUo spazio di Hilbert infinito dimensionale che risulta appropriato, per esempio, per la descrizione di una particella elementare. Il fatto importante è che, per il caso dello spin, la fenomenologia mostra che è possibile rendere conto di tutti i suoi aspetti fisici assumendo proprio che quella indicata sia la dimensionalità che caratterizza lo spazio che risulta appropriato per la descrizione di questo grado di libertà senza analogo dassico dei costituenti microscopici della materia.

386 4.lfondamenti concettualie leimplicazioni epistem olii gche.. .

tamente gli autovettori normalizzati associati, rispettivamente, all'autovalore + 1 e — 1 di a'„, che, come si verifica immediatamente, risultano: 1

1

1

1

Segnaliamo fin d'ora che per evitare di scrivere vettori a due componenti, e quindi per salvare spazio, indicheremo usualmente gli autostati di o,' con

i simboli ae P: o;a = tz,

cr,P = -

P

(2.46)

Ovviamente lo spazio completo per la descrizione di un elettrone è il prodotto diretto dello spazio che si riferisce ai gradi di libertà spaziali e di quello di spin. Per la definizione di prodotto diretto, una base in questo spazio sarà rappresentata dall'insieme di vettori:

1 0 0 p 1 , ove ( y„) è un S.O.N.C. nello spazio delle configurazioni. Prendendo un'arbitraria combinazione di tutti i vettori di base si otterrà l'elemento generico dello spazio di Hilbett di un elettrone, 'P = =

Y@+u+ y P, con y, e y due elementi arbitrari ddlo spazio di Hilbert

associato ai gradi di libertà spaziali, cioè, per esempio, due arbitrarie funzioni a quadrato sommabile delle variabili x, y e z.

2.10 Valori medi Conviene tornare ora al formalismo generale. Come abbiamo ripetutamente sottolineato, la meccanica quantistica, essendo una teoria fondamentalmente probabilistica, fornisce solo le probabilità dei vari esiti in un processo di misura. Una sua verifica richiede allora la ripetizione dello stesso esperimento un numero elevatissimo di volte o, in breve, la considerazione di un insieme statistico di sistemi. Cominciamo col considerare il caso in cui tutti i sistemi siano stati egualmente preparati e preparati con la massima accuratezza consentita dalla teoria, per cui conosciamo il vettore di stato 'P (lo stesso per tutti i membri dell'insieme) che descrive i sistemi fisici individuali in esame immediatamente prima dd processo di misura che ci accingiamo a eseguire. Supponiamo, al solito, di essere interessati alla misura di un'osservabile E, che per semplicità supporremo avere spettro puramente discreto e non degenere: Ept, — - bt,y~, e suppo-

La struttura formaledella teoria 387

niamo anche che 'P non sia autostato di E Sappiamo allora che si può scrivere 'P = 7 c , y i , con c,= (y,; 'P), e che la probabilità di ottenere ~

j

nella misura l'esito b, è data da I c, l'. Si consideri ora l'espressione: ( PPY) = g ( c kpkE,c/Ip/) = g c ke/(Ipk Elpj) = g c k ci(lpk bi/ j )

g ciack(@gai),,= g ,

c c ) b 6 p,= g Ic)l'b)

(2.47)

per sviluppare la quale si è fatto uso della continuità, della linearità e antilinearità, rispetto ai suoi termini, del prodotto scalare e dell'ortonormalità degli autovettori di L L'espressione finale della (2.47) rappresenta semplicemente la media degli esiti pesati con le loro probabilità, ed è la definizione corretta, secondo la teoria della probabilità, di valore medio, che indicheremo come (8), della variabile aleatoria che rappresenta il valore di B. Il lettore non avrà difficoltà a capire che il fatto che la media dei possibili

esiti in una misura di 8' sia data dall'espressione ('P, E'P) ha validità del tutto generale, cioè si applica anche al caso di operatori con spettro degenere e/o continuo. È importante sottolineare che tutte le quantità fisicamente rilevanti della teoria possono scriversi quali valori medi. Infatti se si fosse interessati alla probabilità dell'esito b, in una misura di 8, basterebbe considerare l'operatore di proiezione P,l" sull'autovarietà associata all'autovalore in oggetto e valutarne il valore medio. Essendo P,l" simmetrico e idempotente si ha: (P Pj P) =

( P [Pj ] V) : (Pj P P' P) : I l a Pll

(2 4 8 )

la quale mostra del tutto in generale che il valore medio del proiettore associato a un'autovarietà di un'osservabile coincide con la probabilità di ottenere il relativo autovalore in un processo di misura. Risulta anche

ovvio, sulla base dell'analisi delle sezioni precedenti, che la probabilità di ottenere un esito appartenente a un certo intervallo (c, c + A) è data, dei tutto in generale, dal valore medio del proiettore che la risoluzione spettrale dell'operatore associa a queH'intervallo. Prima di concludere risultano utili alcune osservazioni formali. Se si considera l'operatore di proiezione P~ sulla varietà monodimensionale individuata dal vettore P, un operatore di classe traccia con traccia 1 (si veda il paragrafo A.9), e se si suppone che l'operatore E sia limitato, allora P~E è di classe traccia. Valutiamone appunto la traccia. Poiché essa non dipende dal S.O.N.C. che si utilizza, si potrà scegliere una base (q),) il cui primo elemento yt coincide col vettore 'P, mentre gli altri elementi sono a esso ortogonali, per cui Pq y~ — - y~ =— 'P, Pq y~ = co (e essendo "l'elemento nullo" dello spazio), per tutti i valori di k diversi da 1. Si ha allora:

388 4.Ifondamenti concettualie le implicazioni epistem olig iche.. .

tr(prE) = g

= ( P,P + hA ) della variabile stocastica A. Per esempio, nd caso citato sopra risulta ovviamente hA = 1/2 che, tenuto conto che la media vale appunto 1/2 asserisce che di fatto la frazione di pollo che ogni italiano mangia sta tra 0 e 1, da cui la scarsa significatività della media stessa. È ovvio che se valesse ancora = 1/2 ma risultasse dA = 1/100 si potrebbe legittimamente asserire che la stragrande maggioranza degli italiani mangiano una frazione di pollo molto vicina a 1/2. Anche in meccanica quantistica — una teoria eminentemente stocastica — si potrà avere una significativa informazione sulla distribuzione degli esiti di un processo di misura valutando appunto lo scarto quadratico medio. A questo proposito risulta immediato verificare che data un'osservabile B e il relativo operatore autoaggiunto E vale la relazione:

(~)' =, ('P,f8'- (D' >j"P) Infatti, procedendo come nella (2.47) si ha:

(2.51)

La struttura formaledella teoria 389

('Ps [E- < E >]'l ' ) = g cpcj (Cle [bj

(c q yq,[ E — < B >]'cj((ij) g

< E >] tpj )

Q

c~cj ( yt„[E — < E >]' yj)

=

cpcj[bg < E >] (pp ((ij)

(2.52) la quale, ove si tenga presente che Ic,l' rappresenta appunto la probabilità dell'esito b,; mostra che la definizione (2.51) di dd) rispetta la definizione standard (2.50) dello scarto quadratico medio. Si noti che, per l'hermiticità di E e la realtà di , l'operatore [E]' risulta simmetrico, cosicché si ha:

(M)' = ('P, [E- < E >]"P) = (LE — < E >]'P, LE — < E >]'P) = I I [E — ]'PII' (

2.53 )

vale a dire

(W) = Il[E- < E >]Vll

(2.5n)

Questa espressione dello scarto quadratico medio risulterà di particolare utilità per dare una forma precisa al principio di indeterminazione di Heisenberg.

2.12 La trattazione degli insiemi statistici e l'operatore statistico Abbiamo visto in precedenza come risulti utile, talvolta necessario, considerare insiemi di sistemi che non risultano quantisticamente omogenei, vale a dire che, anziché contenere sistemi tutti associati allo stesso vettore di stato P, sono costituiti dall'unione E = u E di v ari sottoinsiemi ciascuno dei quali è uno stato puro associato a un vettore 'P„. Naturalmente si supporrà di conoscere anche i pesi' statistici dei sottoinsiemi, vale a dire ieisasiooi p,

=N

N )Y ~ a

(siossessicheg p a

= 1) d i s istemiassocia-

ti ai vari stati 'P . Abbiamo già indicato il modo ovvio in cui procedere nel caso in esame al fine di descriverne l'evoluzione, fare previsioni circa gli esiti di misure future o la valutazione di medie statistiche e cosi via: innanzi tutto si suppone che il singolo sistema considerato appartenga al sottoinsieme E e si valuta la quantità di interesse usando le regole quantistiche che consentono di fare previsioni sulla base della conoscenza del vettore di stato 'P che descrive tutti i membri del sottoinsieme E . Come discusso nel paragrafo 2.11, questo procedimento può sempre ridursi a valutare i valori medi di opportuni operatori. Successivamente si dovranno moltiplicare le quantità cosi valutate per i rispettivi pesi statistici p~, che rappresentano le probabilità che un sistema scelto a caso dall'insieme

390 4.Ifondamenti concettrtali e leimplicazioniepistem olig iche.. .

appartenga proprio al sottoinsieme Eo, e si dovrà sommare' su tutte le

opzioni possibili, vale a dire sui valori dell'indice a. Si avranno quindi tipicamente delle formule del tipo:

= g p, ( 'P ,2('P,)

(2.55)

Conviene ora ricordare che il valore medio ('P~, E'Pn) nello stato 'P~ può anche scriversi, come mostrato nel paragrafo 2.11, come una traccia del prodotto dell'operatore per il proiettore P~„sulla varietà monodimensionale associata allo stato 'Po stesso. La formula (2.55) può quindi venire riscri tta come: < B >

=g

p„ rr [pr,á]

(2.56)

A questo punto risulta naturale ricordare la linearità dell'operazione di traccia per dedurn:

= rr[(g

pPr,)B)=-rr[kB]

(2.5V)

ove si è de6nito l'operatore statistico k; che, come mostrato nel paragrafo A.9 risulta un operatore di classe traccia con traccia eguale a 1, che ha la forma:

k'= $ p,pr,

(2.58)

Questo operatore ci fornisce tutte le previsioni che possiamo fare sull'insieme statistico quantisticamente nonomogeneo che stiamo analizzando. Si impongono alcune osservazioni rilevanti. — Gli stati 'P che compaiono nell'insieme statistico E = u E pos sono essere del tutto arbitrari (purché normalizzati), in particolare essi non devono essere né ortogonali a due a due, né linearmente indipendenti. — Mentre la speci6cazione della costituzione dell'insieme statistico, vale a dire la conoscenza degli stati 'P e dei relativi pesi statistici p, determina univocamente l'operatore statistico da associare all'insieme, non vale il contrario. Anzi, è facile mostrare (un fatto che ha un notevole rilievo per le analisi che seguiranno e che non è sempre tenuto nel dovuto conto nei dibattiti sul formalismo), che tranne che nel caso puro (cioè di un .insieme quantisticamente omogeneo), esistono sempre in6niti insiemi differenti per quanto concerne la loro composizione (vale a dire per i pesi statistici e per gli stati associati ai membri dell'insieme) che corrispondono allo stesso operatore statistico. Per semplicità noi ci limiteremo a illustrarlo per un caso dementare. ' Risulta inutile segnalare che nel caso di un'in6nità continua di sottoinsiemi le somme andranno sostituite con integrali.

La struttura formaledella teoria 391

Supponiamo di avere un insieme statistico composto nel seguente modo: E = El u E2 ove i due sottoinsiemi (puri) sono associati ai due stati ortogonali 'Pl e 'P2, con pesi statistici pl e p2 che soddisfano alle relazioni p, + p, = 1, P, ) p,. Il corrispondente operatore statistico risulta: PlPrl + P2PV2

(2.59)

con ovvio significato dei simboli. Riscriviamo ora la relazione precedente nel seguente modo: ~ = P,F~, + P4'21+ (Pl P2)P%'I P2P12+(P, —P2)~Pl

(2.60)

ove abbiamo indicato come P12 l'operatore di proiezione sulla varietà bidimensionale generata da 'Pl e 'P2. Ovviamente, se si introducono due arbitrari vettori ortogonali p, e p2 in questa varietà e si indicano come P» e P» i corrispondenti proiettori sulle relative varietà monodimensionali, risulta P,2 = P» + P», per cui la

(2.60) può anche scriversi: P2 41+ P2~42+ (Pl

P2)Prl

(2.61)

che può leggersi come l'operatore statistico che descrive l'insiemeE = El u E2u E~ i cui tre sottoinsiemi puri sono associati ai vettori pl, g e 'P„con pesi statistici p,, p2 e (pl — p2), rispettivamente.

Questa semplice analisi mostra che, nel caso non puro, insiemi fisicamente diversi (sia per quanto riguarda gli stati associati ai loro sottoinsiemi che per i relativi pesi) possono essere descritti dallo stesso operatore statistico e quindi avere le stesse implicazioni fisiche, in quanto, come discusso sopra, esse sono determinate dall'operatore statistico in accordo con la formula: (B) = tr [kEJ. 2.13 Il processo di evoluzione temporale Nel paragrafo 2.1 abbiamo asserito che l'evoluzione dello stato del sistema t

— A

è indotta dall'operatore unitario U(0, t) = e s . La dimostrazione di que. sto fatto risulta elementare, ove si tenga presente che con la scrittura precedente si intende indicare la funzione, secondo Dirac, dell'operatore autoaggiunto tt' che corrisponde all'osservabile energia del sistema. In completa generalità supporremo che questo operatore abbia uno spettro sia discreto che continuo: 8u„ = E„u„,

—E(t(,)u2 bu 2 -

(2.62)

Sappiamo allora che qualsiasi stato del nostro spazio (e in particolare lo stato iniziale 'P(0) del sistema) potrà esprimersi tramite gli autostati propri

e impropri di b!

392 4. I fondamenti concettuali e le implicazioni epistemoligiche...

ic

'P(0) = g c u, + (i) )utd2; c> =(us,'P(0)), c ( 2 )=(ur,sp(0)). (2 63) t

Applicando all'espressione (2.63) l'operatore lineare e s t

— //t

'P(t) = U(0t,)'P(0) = e



t

s i ottiene:

Et t

s 'P(0) = g cse s u>+

— E(L)t

fe

(2)e '

(2.e)

u>di),

. o)'P(t) Possiamo ora valutare l'espressione ih ot ten e ndo: 63)t

. BV(t)

it>

— — E(L)t

— Et t

= g kc>E>e s u>+Jc(2)E(2)e >

usd2

(2 . 65)

D'altra parte, per la linearità di l', si ha: !

t

— E(A)t

— — E6t

c> E>e s us+ c(2)E(2)e s J

/i"P(c)=g

usd2

(2 6 6 )

Il confronto della (2.65) con la (2.66) mostra che 'P(t) soddisfa all'equazione di Schrodinger:

(2.6V) o)t

Vale la pena osservare che nel caso di un insieme quantisticamente nonomogeneo all'istante iniziale, che — con ovvio significato dei simboliindicheremo come (E = u E, 'P (0), p(a)), e che sarà quindi descritto dall'operatore statistico tP(0) = g

p(c r ) pe isi,la condizione che esso e-

volva nella stessa miscela statistica degli evoluti 'Pa(t) degli stati iniziali, implica che esso vada associato all'operatore statistico k'(t) = 7 ~ a p( a ) Pq (,). Per valutare l'operatore P~a(t) applichiamolo a un arbitrario vettore 4

dello spazio e usiamo la (2.64) : —

1

'Pa(0) >4)e

~va(t)~ = ( Pa(f)s C )Pa(t) = (e t

t

+ — Ht

— /it

—1Ht

//t 1

— //t

+ — //t

e s ' Pa(0)(Pa(0),e s 4 ) = e s P~ a ( p)É' Questa formula implica ovviamente che —

t

Ht

'Pa(0) =

t

(2.68)

t

+ — //t

Pp (,) -— e ~ Pq„(p)e s e,d ic onseguenza,che t

t

+ — //t

tu'(t) = e s k' (0)e s

(2.6V)

La strutturaformale della teoria 393

A sua volta l'equazione (2.69) rappresenta la soluzione dell'equazione: "

I l', k'(t)] o)t

(2.V0)

che soddisfa alla condizione iniziale di ridursi a tt/(0) all'istante iniziale.

2.14 L'operatore statistico e la riduzione del pacchetto Come discusso nei paragrafi 2.4 e 2.5, un processo di misura induce un cambiamento istantaneo del vettore di stato di un sistema trasformandolo nella proiezione (normalizzata) sull'autovarietà relativa all'esito ottenuto (ricordiamo che nel caso continuo l'esito è: il valore trovato appartiene a un certo intervallo). Nel commentare il postulato 5, abbiamo anche precisato la differenza tra misure selettive e non selettive, vale a dire tra quelle nelle quali si considerano, dopo che la misura ha avuto luogo, solo i sistemi che hanno dato un certo esito e quelle in cui nessun sistema viene scartato. Abbiamo sottolineato come in questo secondo caso, anche se l'insieme originale fosse omogeneo, dopo la misura ci troveremmo a trattare con un insieme disomogeneo. Nel paragrafo 2.12 abbiamo mostrato che il modo formale più adatto per descrivere una situazione siffatta è quello di fare ricorso all'operatore statistico. Risulta pertanto opportuno esprimere nel linguaggio di questo ente matematico l'effetto

della misura. Iniziamo supponendo di avere, prima della misura, un sistema quantisticamente omogeneo associato allo stato 'P. Come sappiamo, il corrispondente operatore statistico d'risulta allora il proiettore P~ sulla varietà monodimensionale individuata da 'P stesso. Si supponga ora di assoggettare il sistema a una misura di un'osservabile B il cui associato operatore autoaggiuntoindicheremo, come sempre, con E Supponiamo anche che questo operatore presenti uno spettro puramente discreto e indichiamo con (P,) la famiglia degli operatori di proiezione sulle autovarietà di E Il formalismo generale ci dice che, nel caso di una misura non selettiva, avremo un insieme disomogeneo che è l'unione di casi puri con pesi statistici uguali alle probabilità p, = IIP,'Pll' di ottenere i vari esiti e che, per il generico esito b„ lo stato dopo la misura risulta la proiezione normalizzata 'P(s) del vettore 'P sull'autovarietà a esso associata: 'P(s) = " Questa equazione si ottiene semplicemente derivando la (2.69). Si deve tenere presente che nell'eseguire questa operazione si deve prestare attenzione all'ordine in cui compaiono gli operatori k'(t) e d', in quanto, in generale, essi non commutano tra loro.

394 4. I fondamenti concettuali ele implicazioni epistemoligiche...

P,'P/IIP,%'II. L'insieme statistico risulterà allora descritto dall'operatore statistico l' :

= Q IIPPII'Pq(, ,

(271)

Tenendo conto ddla forma esplicita dello stato V(s) scritta sopra si vede allora immediatamente che l'espressione IIP,'Pll' P~(,) coincide identicamente con Pg zP,. Per convincersi di questo fatto basta applicare l'espressione in questione a un arbitrario stato ]((). Si ha: I IIP,'PII2 P~(,]] (I] =

IIP+II'(q(s), y)+(s) = IIPq II'

,y I I P,'Pl I ' I I P,'Ill '

'

=

(PV,y) PW =

P,'P(P,'P,P) = P,'P(%',P,P) = [P,P~P,]P. Ma poiché P~ è l'operatore statistico prima della misura possiamo concludere che l'effetto della misura non selettiva dell'osservabile B può scriversi nel linguaggio dell'operatore statistico nd seguente modo:

(2.72) Si noti che poiché l'operatore E è autoaggiunto risulta Y ~

s

P,= L Uti-

lizzando la linearità e le proprietà cidiche della traccia si ha quindi:

tr[g P(rP,] = g t r [ P(rP,] = g t r ( PP(r']

g

tr[P& ] = tr' [g

P,](tt

= tr(tt

=

(2.73)

che esprime il fatto che la probabilità si conserva. Infatti, se nessuno dei sistemi viene eliminato, l'insieme deve ancora essere caratterizzato da un operatore statistico di traccia 1, in quanto questa proprietà è precisamente quella che consente di interpretare come valori medi le tracce dei prodotti dell'operatore statistico per un operatore limitato e come probabilità di un esito la traccia del prodotto ddlo stesso operatore per il proiettore sull'autovarietà associata all'esito. Nello svolgere la nostra analisi siamo partiti dalla considerazione di un caso puro. Ma è immediato convincersi che il risultato ottenuto vale del tutto in generale, cioè l'equazione (2.72) identifica, in ogni caso, l'operatore statistico l'" da associare all'insieme statistico dopo la misura non selettiva dell'osservabile B se l'insieme è descritto, prima ddla misura, dall'operatore statistico l'. Infatti, l'operatore statistico di una miscela non è altro che la somma con coefficienti positivi e che si sommano a uno degli operatori statistici che descrivono casi puri. Ma tutte le formule della dimostrazione precedente possono venire moltiplicate per numeri siffatti e sommate, conservando la loro validità, per la linearità dell'operazione di traccia.

La struttura formaledella teoria 395

Un'ultima osservazione. Abbiamo considerato qui il caso di un operatore con spettro puramente discreto. La generalizzazione allo spettro continuo dovrebbe comunque risultare ovvia. Infatti, poiché nel caso di spettro continuo non è possibile determinare con precisione assoluta gli esiti, la misura di un'osservabile siffatta si ridurrà sempre a una misura che risponde alla domanda: in quale degli intervalli disgiunti che coprono tutto lo spettro continuo verrà a cadere l'esito del processo di misura?" E allora, come il lettore intuirà facilmente, si dovranno semplicemente sostituire nelle formule precedenti gli operatori di proiezione sulle autovarietà di E con i proiettori associati agli intervalli deUo spettro continuo corrispondenti all'effettivo procedimento sperimentale di misura. Infine, se la misura fosse selettiva, la relazione (2.72) potrebbe ancora usarsi lasciando cadere le somme e salvando solo il termine che corrisponde all'esito ottenuto. Ovviamente, cosi facendo la traccia deH'operatore statistico diminuisce, un modo formale per esprimere che l'insieme ha perso dei membri. Se si volesse ripartire a studiare l'insieme cosi ottenuto come se esso fosse l'unico insieme di cui ci interesseremo d'ora in avanti, si dovrebbe normalizzare l'operatore statistico, vale a dire rendere la sua traccia eguale a 1. Questo si ottiene semplicemente dividendo l'espressione P+P, (che corrisponde alla frazione di sistemi che hanno dato l'esito b,) per la quantità tr [P,k'P,]. Abbiamo cosi ultimato l'analisi della struttura formale della teoria. Nel prossimo paragrafo analizzeremo le sue più immediate implicazioni epistemologiche.

" Ovviamente la specifica discretizzazione dello spettro dipenderà dal tipo di apparecchio che si usa. Per esempio nd caso della posizione si potrebbero considerare infiniti rivelatori affiancati di ampiezza di un centimetro che coprono tutto l'asse reale.

3. Prime implicazioni concettuali della teoria

L'analisi del paragrafo precedente consente già di puntualizzare alcuni aspetti di grande rilevanza concettuale ed epistemologica della meccanica quantistica.

3.1 II principio di sovrapposizione Come ampiamente discusso, la teoria descrive gli stati dei sistemi fisici individuali per mezzo degli elementi di uno spazio lineare vettoriale. Quindi, in particolare, se 'P~ e 'P> sono stati possibili per un sistema ffsico, anche ogni loro sovrapposizione lineare, come per esempio lo stato 'P = 6%'q + @PE, b'tz, p e C, è un possibile stato del sistema. Inoltre, la dina-

mica che governa l'evoluzione degli stati è essa stessa lineare, per cui una combinazione lineare di stati quale quella appena considerata evolve nella stessa combinazione degli evoluti dei termini della sovrapposizione. Infine va tenuto presente che il formalismo pretende di essere completo, un'espressione con la quale, come ripetutamente segnalato, si indica che la conoscenza del vettore di stato rappresenta la più esauriente informazione che si può avere sul sistema. In breve "ndla teoria non c'è altro che la funzione d'onda" che caratterizzi le situazioni fisiche dei sistemi individuali. Quasi tutte le peculiarità della teoria le quali, in combinazione con le regole formali, comportano la radicale divergenza ddla visione quantistica del mondo da quella classica, hanno origine dal principio di sovrapposizione. Lo stesso principio implica il singolare comportamento dei sistemi composti che analizzeremo più oltre ed è responsabile delle difficoltà concettuali, non ancora superate, connesse al problema della misura e più in generale alla descrizione quantistica dei sistemi macroscopici. Per illustrare le conseguenze più dirette e concettualmente rilevanti del carattere lineare della teoria cominciamo con l'analizzare un caso estremamente semplice, vale a dire prendiamo in conto solo le variabili di spin di una particella di spin 1/2, quale per esempio un neutrone, ignorandone i gradi di libertà spaziali. Supponiamo anche di avere a che fare con un insieme quantisticamente omogeneo, in modo che ogni membro individuale dell'insieme è descritto dallo stesso vettore di stato. Per dare concretezza al nostro argomento immaginiamo di avere prepa-

Primeimplicazioni concettualidella teoria 397

rato l'insieme (i singoli sistemi) effettuando una misura ddla componente S, dello spin (per semplicità, d'ora in poi, anziché alle componenti dello spin, faremo riferimento alle osservabili o„', o,', e -ry„che ne differiscono solo per il fattore moltiplicativo fi/2) e di avere selezionato quei sistemi che hanno dato l'esito S„ = + fi/2 (o„ = + 1) tra i soli due possibili. Come discusso nel paragrafo 2.10, il vettore di stato dd sistema risulta allora: 'P =

(3.1)

che non è altro che la combinazione lineare

=~

(' ~('

dei due autovettori di o,' relativi agli autovalori+ 1 e — 1. In accordo con il fatto che lo stato (3.1) è autostato di a'„e con lo sviluppo (32), la teoria attribuisce le seguenti probabilità agli esiti di ipotetiche misure ddle osservabili o„e o;, rispettivamente: P(a„ =+ll%') = 1, P ( o „ = —ll'P) = 0 P(a, = +tl'P) = P (o=

— ,ll%)

= 1/2

(3.3a) (3.3b)

Affrontiamo ora un quesito di notevole rilevanza concettuale, vale a dire quello della legittimità di attribuire proprietà fisiche "oggettivamente possedute" (un'espressione che nel presente contesto significa "indipendentemente dal fatto che il sistema venga o meno sottoposto a un processo di misura") ai sistemi fisici individuali dd nostro insieme. Lidentificazione di criteri formali che risultano sufficienti per una siffatta attribuzione è semplice e naturale. Come ripetutamente sottolineato, stiamo trattando con una teoria fondamentalmente e irriducibilmente probabilistica, le cui probabilità, se si assume la completezza del formalismo, hanno un carattere genuinamente nonepistemico. Tuttavia può accadere che per un dato vettore di stato la teoria attribuisca probabilità 1 a un preciso esito di una specifica misura (vale a dire garantisca che se la misura venisse eseguita darebbe con certezza quel risultato). Risulta aUora naturale assumere, seguendo Einstein," che, perlomeno in questi casi, l'asserzione: "la grandezza fisica in oggetto ha precisamente il valore in questione", risulti legit-

" L'assunzione di Einstein, formulata nel famoso lavoro che egli scrisse nel 1935 con Podolsky e Rosen, che discuteremo a fondo più avanti, suona: «Se, senza disturbare in alcun modo un sistema, noi possiamo prevedere con certezza il valore di una certa quantità fisica, allore esiste un elemento di realtà che corrisponde a questa quantità fisica».

398 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

tima e faccia riferimento a una proprietà oggettiva del sistema che non dipende in alcun modo dalla nostra scdta di eseguire effettivamente il processo di misura. Nel caso in esame "il neutrone ha oggettivamente lo spin in su (un'espressione colloquiale per indicare che S„ = + fi/2) lungo l'asse x" Interessiamoci ora di un'altra osservabile di spin, per esempio di o,', e interroghiamoci: risulta in qualche modo lecito "ritenere" o "pensare", anche se risultasse impossibile accertarlo, che la particella in esame possieda proprietà definite rdative anche a questa osservabile? Si noti che poiché lo stato (3.1) è una combinazione lineare degli autostati di o; relativi ad autovalori diversi, la questione che stiamo affrontando ha una diretta attinenza col senso fisico che si può attribuire a una "combinazione lineare di stati che corrispondono a valori precisi ma distinti di una data osservabile". La risposta al nostro quesito risulta immediata ove si tengano presenti le regole del formalismo e si faccia appello all'assunzione che la teoria risulti completa. Basta infatti osservare che questa assunzione implica che la condizione che il vettore di stato sia un autovettore dell'osservabile in oggetto relativo all'esito considerato risulta non solo sufficiente, ma anche necessaria per rendere legittima l'asserzione che la proprietà in oggetto sia posseduta oggettivamente dal sistema. Conseguentemente la nostra domanda può riformularsi nel modo seguente: è possibile pensare che l'insieme statistico con cui stiamo trattando sia di fatto quantisticamente inomogeneo e risulti l'unione di due sottoinsiemi E = E, u E ci a scuno dei quali è un caso puro associato, rispettivamente, agli autostati n, e P, di a', relativi agli autovalori + 1 e — 1? Come ben sappiamo, la teoria è perfettamente in grado di descrivere la situazione ipotizzata e consente di identiEicame le implicazioni fisiche. Indichiamo come p, e p i pesi statistici dei due sottoinsiemi. Allora, la probabilità di ottenere il risultato cr, = + 1 (cri - —1) in una misura eseguita su uno dei membri dell'insieme E coincide con la probabilità che il sistema scelto appartenga al sottoinsie-

me,E,(E ) vale a dire con p„(p ). Il confronto con le probabilità (33b) di questi esiti implica quindi p, = p = 1/ 2 . L'argomento appena sviluppato mostra che l'unico insieme statistico E che riproduce le probabilità che lo stato (3.1) assegna agli esiti delle misure di a, e per il quale si possa pensare che ogni membro individuale dell'insieme possiede oggettivamente un preciso valore per questa osservabile è quello costituito dall'unione con pesi uguali di due sottoinsiemi puri associati agli autostati u, e P, di o,'. La nostra domanda può quindi venire riformulata: è fisicamente legittimo pensare che l'insieme con cui stiamo trattando sia di fatto l'insieme E? Per mostrare che non può essere cosi basta analizzare le implicazioni 6siche di questa assunzione per

Prime implicazioni concettuali della teoria 399

quanto concerne, per esempio, gli esiti di un'ipotetica misura di o„. Poiché ogni membro dell'insieme E è o nello stato e, o nello stato p, e poiché lo sviluppo di questi stati in termini degli autostati di a„' ha la seguente forma: tzz=

1

m< +

1

r P,

Pz=

1

1

~< — ~P

(3.4)

ne consegue che in entrambi questi stati si hanno eguali probabilità di ottenere i due possibili esiti + 1 e — 1, una conclusione che contraddice il fatto che, poiché l'insieme è associato allo stato (3.1), in una misura di o„ si otterrebbe con certezza l'esito + 1. Concludendo, non è lecito pensare che i sistemi dell'insieme originale possiedano oggettivamente una pro-

prietà definita relativa all'osservabile a,. Ci siamo dilungati ad analizzare, forse con pedanteria eccessiva, questo semplice caso per sottolineare un punto di grande rilievo concettuale: il segno + che compare fra i termini di una sovrapposizione e che descrive una combinazione lineare di stati che, considerati individualmente, corrispondono a precise e diverse proprietà per un'osservabile fisica, non può mai sostituirsi con una disgiunzione, vale a dire risulta incompatibile e contraddittorio con asserzioni del tipo "l'osservabile in questione ha uno, oppure l'altro", dei valori associati ai termini della sovrapposizione. Va sottolineato che per giungere a questa conclusione abbiamo fatto ricorso alla considerazione di ipotetiche misure di osservabili non commutanti, nel nostro caso, di a„' e a,'. Infatti, se per qualche ragione che non ci dilungheremo ad analizzare, non risultasse fisicamente possibile eseguire misure di alcuna altra osservabile oltre a o,', allora, poiché le previsioni circa gli esiti delle misure di questa osservabile nel caso della miscela statisticaE = E, u E c o np , = p coincidono con quelle relative allo stato puro (3.1), se lo si volesse, si potrebbe asserire senza incorrere in alcuna contraddizione che tutti i membri dell'insieme possiedono oggettivamente, anche prima della misura, proprietà definite relative a questa osservabile. Le conclusioni cui siamo giunti possono generalizzarsi facilmente facendo ricorso a due teoremi sugli operatori statistici.

400 4.lfondamenti concettualie leim plicazioni epistem oligiche...

Operatori statistici associati a insiemi omogenei e disomogenei L'operatore statistico associato a un insieme quantisticamente omogeneo, vale a dire uno i cui membri siano tutti nello stesso stato 'P, coincide con il proiettore sulla varietà monodimensionale individuata da 'P stesso, k' = P~, e pertanto risulta idempotente: Ã = k L'operatore statistico ie associato a un qualsiasi insieme non quantisticamente omogeneo non può invece soddisfare una siffatta relazione. Per dimostrarlo basta osservare che un operatore statistico, essendo di classe traccia con traccia 1, risulta autoaggiunto e positivo, e pertanto i suoi autovalori sono tutti positivi e devono avere come somma 1. Indichiamo con tr, gli autovalori e con II; i proiettori sulle corrispondenti autovarietà. Siha allora: (tt = P

=g >J

tr;tr,II;b„-=

tr,II;P t r i I I ,= Y t r;tr,II;Ili

g tr'.Il;. La richiesta k" = l'implica quindi/

tr;II;

=

tr,'. Il;, che, per il fatto che i proiettori Iit si riferiscono a varietà ortogoX,,' nali comporta a sua volta tr, = tr e quindi tr; = 0 oppure tr; = 1. Poiché le quantità x; sono numeri positivi che si devono sommare a 1, uno solo di essi risulterà non nullo ed uguale a 1, e inoltre l'autovarietà a esso associata dovrà risultare monodimensionale per garantire che la traccia valga 1. Ma allora l'insieme statistico associato a k'risulterebbe un caso puro, contrariamente all'ipotesi. Di fatto, l'operatore k' soddisfa alla relazione l' < k', un modo formale per asserire, nel caso di operatori positivi, che i loro valori

medi su qualsiasi stato 4 soddisfano alla condizione (@, k"@) < (4, kO). I»fa>fi: (>(>,>>'>(>(= (>(>,

»,(( ]>(>]= g >>, (>(> ((;e((g > > (>(>,((>(>( [g (@, le@) ove > si è tenuto conto che i n; sono numeri positivi minori di 1, non=

ché dd fatto che (4, II; 4) > 0.

Valori medi degli operatori di proiezione nel caso di un insieme statistico Siano (t's e kq due operatori statistici e P> l'operatore di proiezione sulla

varietà lineare 'P dello spazio di Hilbert P. Allora, la condizione:tr(k',P>) =

tr(k>P>),b'P (: P implica lei —tuz. Risulta ora immediato sintetizzare e al tempo stesso generalizzare l'argomento precedente circa l'illegittimità di interpretare i segni + che caratterizzano un'arbitraria sovrapposizione di stati come riferiti a diverse possi-

bili alternative, vale a dire di tradurli in espressioni dd tipo "o ...oppure"

Primeimplicazioni concettuali della teoria 4 0 1

Si consideri infatti un insieme quantisticamente omogeneo associato a uno stato puro %', un'arbitraria osservabile 8' e gli operatori di proiezione Pk sulle sue autovarietà (per semplicità ci limitiamo al caso di spettro puramente discreto). Supponiamo che %' non sia un autovettore di D', in modo che la somma 'P = Y P k%'contenga più di un termine. Si può allora por~ k re, come prima, la domanda: è legittimo pensare che i membri dell'insieme possiedano proprietà definite relative all'osservabile E? Se cosi fosse, per la completezza della teoria, l'insieme risulterebbe una miscela statistica di autostati di E Ma allora l'operatore statistico k da associare all'insieme soddisferebbe alla relazione l' ( k', mentre, poiché di fatto stiamo trattando con un caso puro, l'operatore statistico l'che lo caratterizza soddisfa a lV' = ttt'. Ne segue che d'c A. Il secondo dei precedenti teoremi ci assicura allora che se tutti gli operatori autoaggiunti risultano osservabili (un'assunzione che implica ed è implicata dal fatto che gli operatori di proiezione associati a qualsiasi varietà lineare di P siano osservabili) esisterà sicuramente qualche osservabile fisica il cui valore medio risulta diverso per gli stati te' e ttt.' È quindi possibile distinguere sperimentalmente il caso puro da qualsiasi miscela statistica. Concludendo, per un caso puro associato a uno stato che non è autostato dell'osservabile 8',,non risulta legittimo neppure pensare che, anche in un modo a noi inaccessibile, i membri dell'insieme posseggano proprietà oggettive che si riferiscono a questa osserva-

bile. Possiamo concludere questo paragrafo chiedendoci qual è la lezione generale che possiamo trarre dall'analisi del fondamentale aspetto che caratterizza la descrizione quantistica dei processi fisici, vale a dire la natura lineare dello spazio degli stati. La risposta è ovvia: la teoria implica che non risulti legittimo attribuire "troppe" proprietà a un sistema fisico individuale: se la particella ha, per esempio, la proprietà di avere un preciso valore per la quantità fisica "componente dello spin lungo l'asse x" allora essa non possiede proprietà precise relative alla componente dello spin in altre direzioni, Il lettore avrà sicuramente colto il significato del termine "troppe" che abbiamo usato nella frase precedente. Esso intende sottolineare la fondamentale differenza col caso classico nel quale, per una specificazione massima del sistema, tutte le osservabili fisiche hanno valori perfettamente determinati. Naturalmente, come ripetutamente segnalato, anche nel caso classico può accadere che sia praticamente impossibile conoscere perfettamente lo stato del sistema, ma questo non altera minimamente le nostre conclusioni. Nel caso classico le probabilità risultano epistemiche, cioè derivano dalla nostra ignoranza circa la precisa situazione del sistema fisico individuale cui siamo interessati. Ma anche se questa

402 4. I fondamenti concettrzali e le implicazioni epistemoligiche...

ignoranza non ci consente di asserire che, per esempio, la componente del momento angolare del sistema lungo l'asse z ha precisamente un certo valore, essa non ci vieta di pensare (anzi la struttura del formalismo ci assicura) che di fatto la quantità considerata ha un ben preciso valore che non dipende in alcun modo dalle nostre decisioni di eseguire o meno un processo di misura mirato ad accertarlo. È importante sottolineare che anche se nd contesto quantistico non risulta legittimo neppure pensare che un sistema possieda tutte le proprietà che potremmo concepire, tuttavia l'assunzione che ogni operatore autoaggiunto corrisponda a un'osservabile fisica ci garantisce comunque che il sistema, considerato come un tutto," possiede sempre oggettivamente qualche proprietà. In altre parole, per un qualsiasi stato 'P, esiste sempre un'osservabile di cui esso risulta autovettore relativo a un preciso autovalore, per cui può asserirsi che esso possiede oggettivamente la corrispondente proprietà. La dimostrazione è immediata: basta osservare che 'P è l'autovettore corrispondente all'autovalore +1 dell'operatore autoaggiunto che proietta sulla varietà lineare generata da 'P stesso. Formulata in questo modo la conclusione sembra alquanto banale, ma di fatto non è tale. Per esempio nel caso dello spin è facile mostrare che per qualsiasi assegnato vettore 'P dello spazio bidimensionale a esso associato, esiste sempre una direzione n tale che lo stato 'P risulta autovettore relativo all'autovalore +1 della componente dello spin nella direzione considerata. In breve, una particella singola, in un arbitrario stato di spin, possiede sempre oggettivamente la proprietà di "avere lo spin in su" lungo un'appropriata direzione.

3.2 Sovrapposizioni e variabili spaziali Nel paragrafo precedente abbiamo considerato dapprima il caso di una particella di spin 1/2 e quindi abbiamo argomentato in generale senza precisare né il sistema fisico, né le osservabili cui eravamo interessati. È utile illustrare ulteriormente le implicazioni del principio di sovrapposizione facendo specifico riferimento alle variabili di posizione. A questo scopo si immagini di avere una particella la quale si trova in uno stato quantistico " ll lettore coglierà appieno la necessità di questa specificazione allorché considereremo sistemi composti. Per essi dovrà farsi una precisa distinzione tra le proprietà dei costituenti e quelle del sistema globale, perquel rilevante fenomeno, che anch' esso discende dal carattere lineare della teoria, ài un possibile "entanglement" dei costituenti. Come si vedrà, mentre il sistema composto possiederà sempre "qualche proprietà oggettiva" lo stesso non varrà automaticamente, in generale, per i suoi costituenQ.

Prime implicazioni concettuali della teoria 403

che corrisponde alla sovrapposizione lineare di due stati i quali, ndla rappresentazione delle coordinate, sono associati a funzioni d'onda che sono apprezzabilmente diverse da zero ciascuna in una precisa e limitata regione, le due regioni risultando disgiunte. Segnaliamo al lettore che lo stato in questione risulta estremamente facile da preparare come può mostrarsi analizzando due semplici esperimenti. Per discutere il primo di essi " si deve tenere conto che al momento di spin è associato (come al momento angolare) un momento di dipolo magnetico. Cosi, per esempio, un neutrone può assimilarsi, oltre che a una minuscola trottola (anche se il relativo grado di libertà è fondamentalmente non classico), anche a un minuscolo ago magnetico il quale è allineato con lo spin ma opposto ad esso. Supponiamo di avere un neutrone e di inviarlo in una regione in cui le espansioni opportunamente sagomate di un magnete creano un campo magnetico inomogeneo diretto

lungo l'asse z e che cresce nella direzione positiva dell'asse z stesso (fig. 3.1.a). Il neutrone sia preparato in modo che il suo spin risulti orientato in giù rispetto alla direzione z fisicamente caratterizzata. Il polo nord dell'ago verrà allora a trovarsi immerso in un campo più intenso del polo sud (per la disomogeneità del campo stesso) e poiché il campo esercita una forza diretta verso l'alto sul polo nord, mentre ne esercita una diretta verso il basso sul polo sud, la risultante di queste forze sul neutrone è diretta verso l'alto in modo che esso nell'attraversare la regione di disomogeneità del campo subirà una deviazione verso l'alto (fig. 3.1.b). Se invece il neutrone prima di entrare nella regione ove si trova il magnete avesse lo spin in

su rispetto all'asse z (fig. 3.1.c), allora il polo nord e il polo sud dell'ago risulterebbero scambiati e quindi risulterebbe invertita (rispetto alla verticale) la forza che si esercita sul neutrone: esso verrebbe quindi deviato verso il basso. Immaginiamo ora di preparare il neutrone in modo che il suo stato iniziale sia l'autovettore corrispondente aU'autovalore + 1 dell'operatore o„', cioè lo stato (3.1). Poiché questo stato è la sovrapposizione (3.2) dei due stati "spin in su lungo l'asse z" e "spin in giù lungo lo stesso asse" e poiché l'evoluzione quantistica è lineare, lo stato finale del neutrone risulterà la sovrapposizione degli evoluti dei due termini ddla sovrapposizione. Ma il primo termine dello sviluppo corrisponde al fatto che il neutrone si troverà di certo nella regione spaziale S indicata in figura, e il secondo nella regione da essa disgiunta G pure indicata in figura. La situazione finale, aHorché il neutrone è inizialmente nello stato (3.1), sarà descritta, per quanto concerne le variabili spaziali, da una funzione d'onda che è la sovrapposizione (fig. 3.1.d) di una funzione d'onda diversa da zero solo "attorno

a S" e di una diversa da zero solo "attorno a G" Al lettore non sarà certamente sfuggita la peculiarità dello stato che abbiamo prodotto: poiché esso è la sovrapposizione lineare di due stati ciascuno dei quali

" Di fatto, l'esperimentocheá apprestiamo a descrivere è quello ideato da Stern e Gerlach per mettere in evidenza la quantizzazione del momento angolare e per ottenere una prova diretta che l'elettrone (essi consideravano un atomo neutro con un elettrone spaiato, per cui sia il momento angolare che quello magnetico dell'atomo coincidono con qudli deil'elettrone spaiato) ha spin 1/2.

404 4. I fondamenti concettuali ele implicazioni epistentoligiche...

(b

(a

G z

x-su

(d flg. 3.1 a, b, c, d Comportamento di un neutrone che attraversa una regione ove esiste un campo magnetico inomogeneo che cresce nella direzione z (a). Se lo spin del neutrone è orientato in modo opposto a questo asse esso subisce una deflessione verso l'alto (b), mentre se è orientato come l'asse esso subisce una deflessione verso il basso (c). La linearità della teoria implica allora che se il neutrone, all'inizio, ha lo spin orientato lungo l'asse x, esso evolve nella sovrapposizione di due stati spazialmente separati.

corrisponde a una precisa e diversa localizzazione della patticdla, l'asserzione che il neutrone è "oggettivamente o attorno a S oppure attorno a G" risulta illegittima, a dispetto del fatto che, appunto, queste regioni siano ben separate spazialmente e che, d'altra parte, se viene eseguita una misura mirata ad accertare ove si trovi il neutrone, esso viene sempre trovato o in una oppure neil'altra delle due regioni. L'altro modo semplice per realizzare la stessa situazione, un modo che risulta significativo anche dal punto di vista storico in quanto ha dato origine a un acceso dibattito e perché corrisponde al processo fisico che Richard P. Feynman ha definito ]'Pll• Il[E — < E>]PII (

3.8)

Possiamo adesso ricordare la disuguaglianza di Schwartz (che ci assicura che il prodotto delle norme di due vettori è sempre maggiore o uguale al modulo del loro prodotto scalare), tenere conto che il modulo di un numero complesso risulta sempre maggiore o uguale al modulo della sua parte immaginaria e che questo,

a sua volta, è uguale alla metà dd modulo ddla differenza del numero e del suo complesso coniugato. Vale quindi la catena di disuguaglianze: hA o M

= I I [d — < 8 >]'P ll •Il [E —< E >]'Pll >

l([rf — < d >]'P,[E — < E >]'P)l> 1

— 1([8- < 8 >]'P, [E — < E >]'P) —([E- < E >]'P, [~- < 8 >]'P)l

2 Tenendo conto del fatto che gli operatori [8 — M>] e [E - ] sono simmetrici, essi si possono portare a destra dei prodotti scalari ndl'ultima espressione ottenendo: 1

AA e M > — I('P, [8 — ][E- < E >]P)2 1

('P, [E — < E >][8 — < 8 >]'P)l = - I ('P, ([8 — < 8 >][E — < E >]2

[E — < E >][8 — < 8 >])'P)l

(3.10)

L'espressione in parentesi graffa è il commutatore tra [8 — M>] e [E — ]. Ma i valori medi sono dei numeri e quindi commutano con qualsiasi operatore e possono venire trascurati.

Si arriva cosi alla formula desiderata e che ha validità generale: 1

bA • dd3 > — I('P,[8,E]'P)l 2

(3.11)

Questa relazione mostra immediatamente che mentre la teoria non pone

Primeimplicazioni concettuali della teoria 4 1 1

alcun limite inferiore all'indeterminazione di un'osservabile e non vieta neppure che due osservabili che commutano possano avere entrambe indeterminazione nulla (vale a dire per un opportuno stato 'P gli esiti delle loro misure possono risultare entrambi perfettamente determinati) essa implica che, nel caso di osservabili non commutanti, esiste in generale un limite inferiore al prodotto delle loro indeterminazioni. Il caso concettualmente più rilevante è quello di due variabili coniugate, quali la posizione x di una particella e il relativo impulso p„. Poiché, come ben sappiamo, il commutatore di queste osservabili è uguale a ik si ha, dalla (3.11) : hx • hp„> fi /2. Questa, e le analoghe relazioni per le altre componenti della posizione e dell'impulso:

h

b

h

i hp,' > —, A z i hp,* > (3.12) 2' 2 rappresentano le fondamentali relazioni derivate da Heisenberg nel suo rivoluzionario lavoro del 1927. Si impongono alcune osservazioni. Innanzi tutto le relazioni (3.12) sono una semplice e diretta conseguenza delle proprietà matematiche della trasformazione di Fourier. Infatti, come mostrato nel paragrafo 3.8, Lbc• A p„> —, 2' d y

le due funzioni 'P(x, y, z) e 'P(p„, p~, p,), che altro non sono che le rappresentazioni delle coordinate e degli impulsi del medesimo vettore di stato e quindi determinano, coi quadrati dei loro moduli, le densità di probabilità di posizione e di impulso, sono, in accordo con l'equazione (2.34), le trasformate di Fourier una dell'altra. È una proprietà ben nota di questa trasformazione che quanto più ridotto risulta l'intervallo in cui è apprezzabilmente diversa da zero una delle due funzioni, tanto più esteso risulta quello in cui è diversa da zero la sua trasformata, in modo appunto che le relazioni (3.12) risultino sempre soddisfatte. Confrontiamo le condusioni cui siamo giunti con qudle relative a generiche osservabili con spettro discreto. In questo caso, è possibile preparare un autostato di una delle due osservabili e quindi rendere nulla la relativa indeterminazione. Tuttavia, perché questo accada il vettore di stato deve risultare allineato a uno degli autovettori dell'osservabile stessa. Poiché in generale, come abbiamo visto, osservabili con spettro discreto, se non commutano, sono associate a sistemi ortogonali di versori che risultano in qualche misura "sghembi" (come abbiamo visto per gli assi delle osservabùi o„' e o; nel semplice caso bidimensionale) il vettore di stato avrà, in generale, proiezioni non nulle su diverse autovarietà dell'altra osservabile. Questo indica come ogni tentativo di rendere meno indeterminata una di esse rende più indeterminata l'altra. Nel caso di osservabili con spettro puramente continuo (quale quelle che appaiono nella (3.12)), sappiamo

412 4.Ifondamenti concettualie leimplicazioni epistem oligiche...

bene che non risulta mai possibile, in pratica, rendere perfettamente definita una di esse. Comunque il formalismo consente, in linea di principio, di ridurre quanto vogliamo la sua indeterminazione ricorrendo ad appropriati procedimenti di preparazione. Le relazioni (3.12) ci assicurano che questo processo implica che il vettore di stato corrisponderà a un insieme di possibili esiti per la variabile coniugata che comporteranno una indeterminazione tanto maggiore quanto meglio avremo caratterizzato la

prima variabile. Prima di concludere questo paragrafo si deve segnalare che vale anche un'altra relazione di indeterminazione che ha una forma analoga alla (3. 12) ma coinvolge le variabili tempo ed energia:

dS • d.t >- b 2

(3.13)

Questa relazione rappresenta l'analogo delle precedenti ove si tengano in conto elementari implicazioni della teoria della relatività. Infatti, allo stesso modo in cui questa teoria lega le variabili spaziali a quella temporale

essa lega le variabili di impulso all'energia. La (3.13) è quindi, in un.certo senso, l'inevitabile controparte delle (3.12). Tuttavia lo stato concettuale della (3.13) risulta alquanto diverso dalle precedenti nello schema che stiamo analizzando. Infatti, mentre in meccanica quantistica le variabili di posizione e impulso sono osservabili e quindi sono rappresentate da operatori e lo stesso vale per l'energia, il tempo gioca il ruolo di un semplice parametro, La lettura della (3.13) deve risultare quindi diversa da quella delle precedenti relazioni. Essa asserisce, per esempio, che l'intervallo di tempo che deve trascorrere affinché un sistema cambi apprezzabilmente il suo stato risulta legato aU'indeterminazione del valore della sua energia come richiesto dalla (3.13) stessa." Due casi particolari ma fisicamente molto significativi di questa lettura vanno menzionati, Come sappiamo, se lo stato del sistema coincide, a un certo istante, con un'autofunzione propria dell'energia, vale a dire se vale 'P(0) = pi ove 8p, = E, y,, allora esso t

— — E,t

evolve nel modo seguente: 'P(t) = pi e g , una relazione che implica che la probabilità di trovare l'esito E, in una misura dell'energia è uguale a 1 a ogni istante: se l'energia di un sistema è perfettamente definita, allora essa " Anche altre letture della relazione sono possibili, quale quella che asserisce che la precisione con cui può determinarsi l'istante in cui una particella attraversa una precisa regione spaziale può determinarsi tanto meglio quanto più indeterminata è la sua energia. Analogamente può dirsi che la relazione implica che l'istante esatto in cui un sistema muta la sua energia (per esempio per emissione di un quanto di radiazione) risulta tanto meglio determinato quanto più indeterminato è il valore dell'energia del sistema. Per una analisi dettagliata rimandiamo il lettore alla letteratura tecnica sull'argomento.

Primeimplicazioni concettualidella teoria 413

mantiene quel valore per l'eternità, come ovviamente richiesto dalla (3.13). Invece, un sistema che-abbia energia indeterminata può cambiare il suo stato in un tempo finito: non a caso la rdazione (3,13) è sistematicamente utilizzata per legare la vita media T di uno stato instabile aHa sua indeterminazione in energia (ricordiamo che la vita media di un sistema instabile è il tempo necessario, in media, affinché esso subisca un processo di decadimento) :T -= fi,/hE

3.5 L'argomento di Heisenberg

Heisenberg, nel suo cdebre lavoro del 1927, non derivò (né avrebbe potuto farlo in quanto la teoria non era ancora stata né sufficientemente compresa né adeguatamente formalizzata) la rdazione di indeterminazione generale (3.10) secondo le linee che abbiamo seguito nel paragrafo precedente, ma dedusse invece le relazioni (3.12) sulla base di considerazioni euristiche che tenevano in conto la già riconosciuta duplice natura ondulatoria e corpuscolare di tutti i processi 6sici. Heisenberg si rese conto che questa caratteristica dei microscopici costituenti del mondo costringeva a interrogarsi sulla possibilità stessa di determinare simultaneamente i valori di grandezze diverse con precisione arbitraria. Riportiamo brevemente uno dei vari argomenti che egli presentò. Si supponga di avere una particella in uno stato che risulta notevolmente esteso nella direzione x ortogonale a quella (z) di propagazione. Supponiamo anche di sapere che esso abbia un impulso ben definito e diretto lungo l'asse z (ricordiamo che per il fatto che la componente x dell'impulso è assunta avere praticamente il valore zero la funzione d'onda dovrà risultare molto estesa nella direzione x, in modo che la sua indeterminazione in posizione risulti molto grande). Come aveva proposto de Broglie, un sistema siffatto va associato a un'onda di lunghezza d'onda iL=

h/p (p essendo il modulo dell'impulso stesso). Cerchiamo ora di determinare la posizione della particella interponendo sul suo cammino uno schermo con una fenditura di ampiezza hx Se la particella supera lo schermo, potremo asserire di conoscere la posizione della particella, all'istante dell'attraversamento, con una precisione data, appunto, da hx. Si noti che Heisenberg non pone alcuna limitazione a questa quantità, vale a dire accetta di potere realizzare un esperimento di localizzazione tanto accurato quanto si voglia. Ma egli utilizza una caratteristica precisa e ben nota dei fenomeni ondulatori, vale a dire il fatto che allorché un'onda incontra un ostacolo delle stesse dimensioni o di dimensioni inferiori alla sua lunghezza d'onda, si dà un effetto di diffrazione. L'onda non viene semplice-

414 4.IfonJam enticoncettualie le im plicazioni epistem olig iche...

mente "tagliata" e ridotta alle dimensioni del foro, come accadrebbe se il foro avesse dimensioni molto maggiori della lunghezza d'onda, un situazione cui può applicarsi l'approssimazione di ottica geometrica che prevede la propagazione rettilinea dei raggi luminosi e la formazione di ombre

nette (si veda la fig. 3.4 a). Nel caso di dimensioni del foro paragonabili al-

Fascio incidente

Fascio incidente

)) molto minore

del foro

Immagine geometrica del foro

a)

Lunghezza d'onda dell'ordine del foro

))

Diffrazione dell'onda

Immagine allargata del foro

fig. 3.4 a, b Il processo di localizzazione di una particdla realizzato facendo passare l'onda a lei associata attraverso uno schermo con un foro di dimensioni paragonabili a queHe della sua lunghezza d'onda comporta il processo di diflrazione deil'onda stessa. Conseguentemente, all'uscita dd foro, non si conosce la direzione di propagazione della particella. La componente verticale dell'impulso, che prima risultava molto ben definita, risulta ora indeterminata di una quantità tale da garantire che le rdazioni (3. 12) vengano comunque rispettate.

alla lunghezza d'onda, l'onda diffrangerà (fig. 3.4 b), l'angolo di diffrazione risultando ben determinato dalle leggi di propagazione delle onde (ovviamente, come nel caso della formazione della figura di interferenza, ripetendo l'esperimento molte volte le particelle, che vanno sempre a colpire lo schermo in un punto preciso, si distribuiscono in modo da riprodurre la figura a campana disegnata dietro lo schermo della 3.4 b) Conseguentemente la particella dopo avere attraversato la fenditura potrebbe

propagarsi lungo una qualsiasi delle direzioni all'interno dell'angolo di diffrazione: nel processo abbiamo acquistato una conoscenza accurata della posizione (nella direzione x) della particella, ma che cosa possiamo dire circa la componente dell'impulso nella stessa direzione? Mentre prima sapevamo che p„=- 0 ora non sappiamo se la particella si sta propagando verso l'alto, lungo l'asse z oppure verso il basso." Il calcolo esplicito che " Ingenuamente potrebbe pensarsi che quando alla fine dell'esperimento riveleremo la particella in un certo punto dello schermo, potremmo ricostruire la sua direzione di propagazione congiungendo il punto di impatto con la fenditura. Ma questo tipo di retrodizione (oltre a risultare irrilevante sul piano pratico) non risulta legittimo in linea di principio. Infam, come il lettore ha ormai perfettamente compreso, se si volesse attribuire alle particeHe al momento di attraversamento della fenditura l'impulso che può inferirsi dal loro successivo impatto sullo schermo, si starebbe sostituendo allo stato puro iniziale, una miscela statistica di autostati dell'impulso, un procedimento illegittimo e che può mostrarsi falso eseguendo opportune misure sull'insieme.

Prime implicazi oni concettualidella teoria 415

tiene conto ddl'ampiezza della figura di diffrazione mostra che l'indeterminazione hp„della componente x dell'impulso che ne consegue è tale che il prodotto hx • hp„risulta inevitabilmente dell'ordine della costante

di Planck. 3.6 Misure di osservabili compatibili In connessione col problema della possibilità o meno di eseguire misure arbitrariamente accurate di osservabili distinte è opportuno riconsiderare il caso di osservabili associate a operatori che commutano tra di loro. Come discusso nel paragrafo A.7, un teorema generale garantisce che siffatte osservabili ammettono un S.O.N.C. di stati in comune. Questo teorema riveste un particolare interesse quando entrambe le osservabili presentano degenerazione. Per semplicità, faremo riferimento a una situazione particolarmente semplice, vale a dire consideriamo un'osservabile A e due autovalori a< e az dell'operatore autoaggiunto rf a essa associato e supponiamo che a> sia due volte degenere, mentre az non presenti degenerazione. Consideriamo quindi una seconda osservabile B tale che l'operatore autoaggiunto 8' a essa associato rimuova la degenerazione relativa all'autovalore an vale a dire esso possiede due autovettori relativi a due distinti autovalori bq e bz che appartengono alla varietà bidimensionale degenere per 8. Questi vettori sono gli autovettori comuni ai due operatori di cui parla il teorema. Inoltre sappiamo già che poiché l'autovarietà associata all'autovalore az non è degenere per 8, il corrispondente autovettore risulterà automaticamente autovettore di E Per la nostra analisi non risulta necessario precisare se esso è rdativo a un autovalore diverso o coincidente con uno dei due autovalori sopra menzionati. Per semplicità e in analogia con l'analisi delle Sezioni 2.2 e 2.3 identifichiamo il nostro spazio di Hilbert con lo spazio tridimensionale associato alla coppia a~ e az di autovalori di 8, e facciamo ricorso (fig. 3.5) a una rappresentazione analoga a quella della fig. 2.2. Indichiamo come P> t e P~> gli autovettori simultanei di 8 e di E relativi all'autovalore a, per d' e, rispettivamente, b> e bzper E, e come g > l'autovettore comune di questi operatori rdativo all'autovalore az per 8 eb>per E (come già osservato b>potrebbe anche coincidere con uno dei già menzionati autovalori di questo operatore). Il vettore di stato che caratterizza il sistema fisico prima che venga effettuata una qualsiasi misura sia quello indicato come V(t) in figura. Al tempo t si esegua una misura dell'osservabile A. Supponiamo che l'esito della misura sia A = a,. Come discusso nel paragrafo 2.3 il vettore di stato viene allora trasformato istantaneamente nella sua proiezione normalizzata

416 4.Ifondamenti concettualie leim plicazioniepistem olig iche.. .

az,b~

'F(tl

at,bt ~l,y

f i n ale

dopo

at,bz fig. 3.5 Illustrazione dei processi di misura che coinvolgono osservabili commutanti. L'osservabile A presenta degenerazione di ordine 2 relativa all'autovalore an Una sua misura che dia questo esito trasforma lo stato del sistema prima della misura nella sua proiezione (normalizzata) sull'autovarietà associata a an L'osservabile B compatibile con A ha due autovettori relativi ad autovalori distinti, che giacciono in questa autovarietà. Una sua misura darà uno dei due esiti (per esempio b>) e lo stato verrà trasformato nell'autostato P,, comune alle due osservabili. Il fatto di estremo rilievo è che la seconda misura non ha alterato il risultato della prima.

Vd p sull'autovarietà degenere. In generale, questa proiezione non coinciderà con uno dei due autovettori P» e ptz, che sono gli autovettori di E Conseguentemente, se si immagina di effettuare una successiva misura dell'osservabile B i due esiti bt e bz sono entrambi possibili con precise probabilità. L'osservabile B presenta quindi una specifica indeterminazione (ovviamente nel caso generale la dimensionalità della varietà degenere può essere elevatissima — anche infinita — eB notevoimente indeterminata). Si proceda ora ad eseguire effettivamente la misura di B e si supponga di ottenere, tra i due soli possibili, proprio l'esito B = b>. Il vettore 'Pd,p, viene istantaneamente mutato in 'Pf g, -— p». L'indeterminazione di B è quindi stata ridotta zero. Interroghiamoci: cosa può asserirsi circa l'osservabile A? Poiché pt t è autovettore di 8 rdativo all'autovalore tt t siamo sicuri che in una misura di A otterremmo questo risultato. Quindi l'esecuzione della seconda misura non ha alterato l'esito della prima: risulta legittimo, senza eseguire una terza misura di A, asserire che il sistema possiede

Prime implicaz ioni concettuali della teoria 417

la proprietà oggettiva A = aq. Le indeterminazioni hA e AB di queste due osservabili risultano entrambe nulle (questo è perfettamente compatibile

con l'equazione (3.11) in quanto [8, EJ = 0). L'analisi appena sviluppata avrà chiarito al lettore perché per preparare completamente uno stato si debba fare ricorso all'osservazione di un sistema completo di osservabili commutanti. Le misure successive di questi operatori non alterano gli esiti delle precedenti e, allorché appunto il sistema delle osservabili in esame è completo, lo stato finale, che è autostato relativo all'insieme di esiti ottenuti, è un ben preciso vettore dello spazio

di Hilbert. L'analisi avrà anche messo chiaramente in luce lo status completamente diverso di osservabili compatibili rispetto a quello di osservabili i cui operatori associati non commutano. Per cogliere pienamente questo fatto basterà riconsiderare la discussione delle osservabili di spin presentata nel paragrafo 3.3. In quel caso, con riferimento alla fig.3.2, se si identificassero le osservabili A e B di questo paragrafo con le osservabili non commutanti o', e a„', rispettivamente, si dovrebbe argomentare come segue. Una misura di a, che dia esito + 1 trasforma il vettore di stato 'P nell'autovettore cz,. Come sottolineato, l'indeterminazione di o; viene ridotta a zero mentre quella di a„' non è nulla. Si supponga ora di eseguire una misura di questa osservabile. Essa darà un certo esito (supponiamo ancora + 1) e l'indeterminazione relativa si annulla. Ma se a questo punto ci interroghiamo circa l'osservabile a,', non possiamo certo asserire che in una sua misura otterremo di nuovo l'esito + 1. La seconda misura ha "disturbato" la prima, introducendo un'indeterminazione nella relativa osservabile e rendendo impossibile prevedere l'esito di una sua misura. Speriamo che la discussione di questo paragrafo abbia ulteriormente chiarito sia il significato e la rilevanza della commutatitività delle osservabili, che il senso delle relazioni di indeterminazione.

3.7 Primi cenni al dibattito circa l'interpretazionedella teoria Come risulta facile immaginare le rivoluzionarie concezioni che erano imposte dai dati sperimentali e dal modo in cui si andava configurando la teoria in grado di descriverli e che abbiamo analizzato nei paragrafi precedenti hanno dato origine a un notevole sforzo interpretativo e a un acceso dibattito tra i protagonisti della rivoluzione scientifica rappresentata dalla meccanica quantistica. Passiamone in rassegna alcune fasi cruciali. La posizione di Bohr è alquanto articolata e non sempre lucida. Per i

418 4. f fondamenti concettuali e le implicazioni epistemoligiche...

nostri scopi risulta sufficiente identificarne alcuni tratti essenziali. Bohr, innanzi tutto attribuisce un valore assolutamente prominente al linguaggio: «11 nostro compito consiste nel comunicare le nostre esperienze e idee agli altri. Dobbiamo continuamente lottare per allargare il campo della nostra descrizione ma in modo tale che i nostri messaggi non perdano mai il loro carattere obiettivo e non ambiguo». Questa sua posizione giovanile si rafforza e si articola allorché egli entra da protagonista nel campo della scienza. Egli riflette sulla pratica scientifica e osserva che, di fatto, tutti i ricercatori usano nelle loro ricerche apparecchi di misura macroscopici i cui risultati vengono poi comunicati nel linguaggio appropriato per questo tipo di sistemi fisici, vale a dire quello della fisica classica. Questo vale, egli osserva, anche per qualsiasi tentativo di descrivere cosa accade, ad esempio, in un esperimento di interferenza con sistemi microscopici. Alla fine si parlerà dell'annerimento di una lastra fotografica, della registrazione da parte di un contatore e cosi via. Il linguaggio della fisica dassica si configura quindi come una sorta di prerequisito logico anche per una teoria che tratta con processi fondamentalmente non classici. Gli eventi del microcosmo devono venire amplificati per potere essere percepiti, registrati e descritti. Ma il processo di amplificazione comporta l'uso di apparecchi macroscopici e il fare ricorso al linguaggio della fisica dassica. Si ritrovano, in questa sottolineatura del ruolo assolutamente preminente del linguaggio, tracce inequivocabili dell'insistenza dei positivisti logici sull'analisi linguistica e logica. La frase di Bohr con la quale egli esprime la sua posizione circa i processi microscopici e nella quale segnala una volta di più il ruolo essenziale del linguaggio, potrebbe essere stata scritta da uno dei fondatori del positivismo logico: " «Non esiste un mondo quantistico. C'è solo una descrizione fisica astratta. È sbagliato pensare che sia compito della fisica scoprire come è fatta la natura. La fisica riguarda quello che si può dire della natura>. Analoghi elementi di una posizione neopositivista si possono ritrovare nella nozione di complementarità cui Bohr ha voluto dare uno status concettuale assolutamente generale e preminente (vale la pena di menzionare che fu proprio la sua convinzione dell'estrema rilevanza di questa idea che lo ha portato a un duro scontro con Heisenberg a proposito del suo lavoro sul principio di indeterminazione). L'idea della complementarità degli aspetti del reale deriva da una pertinente osservazione di Bohr circa l'imbarazzante dualismo onde-corpuscoli. La comunità scientifica si era vista Si potrebbe utilmente confrontare questa frase con qudla sugli obiettivi della filosofia del positivista Ayer: «Loriginalità dei positivisti logici sta nel loro far derivare l'impossibilità della metafisica non dalla natura di ciò che può venir conosciuto ma dalla natura di ciò che può venir detto».

Prime implicazioni concettuali della teoria 41 9

costretta ad ammettere che lo stesso sistema potesse presentare entrambi questi aspetti 'incompatibili. Con riferimento a questo dato di fatto Bohr osserva che i procedimenti fisici che sono necessari per mettere in evidenza una delle due apparentemente contraddittorie facce del reale risultano incompatibili con quelli necessari per metterne in evidenza l'altra. Cosi, come abbiamo segnalato, se nel secondo esperimento del paragrafo 3.2. si tenta di determinare da quale deHe due fenditure è passata la particella, vale a dire se se ne mettono in evidenza gli aspetti corpuscolari (traiettorie definite), inevitabilmente si distrugge la figura di interferenza che mostra gli aspetti ondulatori del processo. Quindi, secondo Bohr, si deve ammettere che la natura sia estremamente ricca di sfaccettature e misteriosa. A noi è concesso di cogliere vari aspetti di questa complessa realtà, e alcuni sembrano inconciliabili, contraddittori, ma essi non emergono mai simultaneamente. Questa idea entusiasmò tanto Bohr al punto da spingerlo a

fame un principio di validità assolutamente generale, applicabile a tutti gli aspetti del reale e della conoscenza. Va riconosciuto, tuttavia, che quasi tutti gli scienziati coinvolti in questo dibattito, da Einstein a Schrodinger a Beli, concordano sul fatto che Bohr non riusci mai a rendere perfettamente chiaro che cosa avesse in mente. Vedremo poi come egli sostenne questa sua posizione nell'acceso dibattito che ebbe con Einstein. Per concludere questi brevi cenni al suo pensiero, vogliamo sottolineare come Bohr tomi continuamente sulla necessità di fare sempre e comunque riferimento a esperimenti classici che vanno descritti nei termini deUa fisica classica. Molti dei seri problemi interpretativi che la teoria pone non sono tali per Bohr, in quanto, secondo lui, ogni quesito circa il significato della teoria viene posto nel linguaggio della fisica classica ma si riferisce a campi estranei ad essa. Esistono notevoli differenze tra la posizione di Bohr e quella di Heisenberg. Quest'ultimo pensatore è sempre stato molto critico nei confronti dei tentativi di Bohr di salvare, almeno in una certa misura, la visualizzabilità dei processi fisici anche a livello microscopico. Nel pensiero di Heisenberg emerge sempre più chiaramente la necessità di distinguere tra sistema osservato e processo di osservazione e la convinzione che, in definitiva, solo il processo di osservazione possiede una realtà effettiva, quella rappresentata dai suoi esiti. Il mondo atomico comincia a sfumarsi, a'sfuggire alla possibilità di essere compreso. Ciò che si può dire di esso sta tutto ed esclusivamente nell'apparato matematico formale cui dobbiamo fare ricorso per formularne le leggi. E si arriva a frasi emblematiche del tipo deHa seguente: «Negli esperimenti sui processi atomici noi abbiamo a che fare con cose e fatti, con fenomeni che sono altrettanto reali di qualsiasi fenomeno della vita quotidiana. Ma gli atomi o le particelle elementari

420 4.Ifondamenti concettualie leimplicazioniepistem olig iche...

non sono altrettanto reali... La nostra intuizione ci conduce ad attribuire agli dettroni lo stesso tipo di realtà fisica degli oggetti del mondo di ogni giorno. Ma questo è sbagliato perché l'elettrone e l'atomo non possiedono alcun grado diretto di realtà fisica del tipo di quello di questi oggetti... Cosa significhino termini quali onda o corpuscolo, non lo sappiamo più». Di nuovo emerge una posizione che richiama quella neopositivista di Emst Mach circa i microscopici costituenti di un gas: ogni asserzione che faccia riferimento a qualcosa che va oltre la specifica esperienza diretta è priva di senso. Schrodinger, il padre deHa teoria quantistica nella sua versione ondulatoria, è sempre stato fortemente motivato dalla sua radicata convinzione circa la necessità di salvare la continuità spazio-temporale della descrizione fisica. E a questo scopo si muove lungo la linea di pensiero indicata da de Broglie ed Einstein, assegnando un ruolo'assolutamente prominente agli aspetti ondulatori. Con riferimento a questa posizione è illuminante ricordare il suo primo tentativo di interpretazione della funzione d'onda: essa fornirebbe, col quadrato del suo modulo, la densità di massa o di carica dell'elettrone cui è associata. L'dettrone perderebbe quindi la sua caratteristica di particella. Schrodinger considera una specifica situazione caratteristica dell'ottica: sovrapponendo onde con lunghezze d'onda distribuite con continuità, si produce un effetto di interferenza distruttiva al di fuori di una limitata regione spaziale. Il campo (nel caso dell'elettromagnetismo il campo elettrico o qudlo magnetico), risulta apprezzabilmente diverso da zero solo nella regione considerata. In condizioni opportune la perturbazione elettromagnetica descrive una precisa traiettoria lungo la quale è concentrata l'energia del campo stesso. Con riferimento a questo processo Schrodinger sperava che le sue funzioni d'onda potessero restare ben concentrate spazialmente e muoversi lungo traiettorie precise; solo dove l'onda risulta diversa da zero si ha massa e carica e, data la limitata estensione della regione coinvolta, essa ci appare come una particella. La appropriata critica di Heisenberg segna la fine di questa speranza. Per comprendere questo punto si consideri un elettrone libero il quale si trova inizialmente (al tempo t = 0) in una stato la cui rappresentazione delle coordinate è una funzione Gaussiana di ampiezza hx(0). Risulta facile risolvere l'equazione di Schrodinger per il caso in esame, la funzione d'onda al tempo t risulta ancora una Gaussiana, ma di ampiezza maggiore. La rdazione tra l'indeterminazione iniziale d x(0) e qudla hx(t) al tempo t ha la seguente forma: W(t) =W

(0) 1+

(3.14) 4m'[hx(0)]'

Prime implicazioni concettuali della teoria 42 1

Supponiamo di considerare un'indeterminazione iniziale (che nell'interpretazione proposta rappresenterebbe l'estensione spaziale dell'dettrone) dell'ordine di 10 ' cm. Tenendo conto del valore della costante di Planck e della massa dell'elettrone si vede che già dopo un decimilionesimo di secondo la frazione sotto radice risulta dell'ordine di 100, per cui possiamo trascurare 1 rispetto ad essa. La relazione (3.14) può allora scriversi: ~(t)

=

ht

crtt =

Z mm(0)

3t

W (0)

cf/t

(3.15)

ove nell'ultima espressione t deve esprimersi in secondi e M(0) in cm. Dalla (3. 15) segue che già dopo 1/3 di secondo hx(t) = 10' cm, vale a dire il pacchetto d'onde che descrive l'elettrone libero (e quindi la distribuzione spaziale della sua massa e della sua carica) si è, per cosi dire, sparpagliato su una distanza di 1 chilometro! Ovviamente questo fatto rende l'ipotizzata interpretazione insostenibile: una particdla elementare si trasformerebbe in tempi brevissimi in una sorta di nuvoletta (di massa e di carica) che si estende su regioni spaziali molto grandi. Eppure noi sappiamo bene che in qualunque esperimento mirato a identificare ove si trova l'elettrone, esso ci appare come una massa e una carica praticamente puntiformi. Schrodinger non può non prendere atto di questo fatto incontestabile, ma insiste nell'aderire strettamente alla visione ondulatoria e alla concezione che vede i processi fisici come svolgersi in un continuo spaziotemporale: «Non si deve attaccare alcun significato speciale al cammino dell'elettrone... e ancor meno alla posizione di un elettrone sul suo cammino... l'onda... non solo riempie tutto il cammino simultaneamente, ma si estende addirittura notevolmente in tutte le direzioni. Questa contraddizione è sentita cosi fortemente che si è persino posto in dubbio che quello che accade in un atomo possa inquadrarsi in uno schema spazio-temporale. Da un punto di vista filosofico, io considererei una decisione condusiva in questo senso come una resa incondizionata. Infatti, poiché noi non possiamo assolutamente evitare di pensare in termini di spazio e tempo, quello che non possiamo ricondurre a siffatti concetti, non possiamo comprenderlo affatto». Vedremo più avanti come questa sua posizione, cui egli non rinuncerà mai, lo porterà alcuni anni dopo ad essere uno dei pochissimi scienziati a cogliere il significato più profondo del lavoro di Einstein, Podolsky e Rosen che analizzeremo più avanti. Ma proseguiamo in questa succinta esposizione. Born, stimolato dall'analisi che ha condotto Heisenberg alla derivazione delle relazioni di indeterminazione, analisi che evidenzia l'impossibilità pratica di sapere qualco. sa di preciso circa alcune variabili, intuisce che si debba accettare che la teoria risulti fondamentalmente (cioè nonepistemicamente) probabilistica.

422 4. I fondamenti concettstali e leimplicazioni epistemoligiche...

Ed avanza la sua interpretazione: il quadrato del modulo ddla funzione d'onda fornisce la densità di probabilità di trovare l'dettrone in un certo punto se si esegue una misura di posizione su di esso. È estremamente importante notare questa svolta storica nell'interpretazione del formalismo. Essa ha un duplice aspetto. Il primo, già sottolineato, consiste nel dare dignità scientifica a una teoria che, fin dall'inizio, ammette l'impossibilità di fornire previsioni certe sui processi fisici, vale a dire nell'accettare l'indeterminismo come uno degli aspetti del reale." Ma anche il secondo richiede una particolare attenzione. Il significato della probabilità nello schema quantistico risulta del tutto peculiare. Potremmo chiederei, con Beli.. «Il quadrato del modulo ddla funzione d'onda rappresenta una den-

sità di probabilità, ma, probabilità di che cosa? ProbabiIità che l'dettrone sia nel punto considerato? No di certo, probabilità di trovarel'elettrone nd punto in esame se viene eseguita una misura di posizione». Il lettore attento che ha seguito la discussione delle sezioni precedenti avrà colto benissimo le ragioni per cui questo è il solo modo non contraddittorio di intendere le probabilità quantistiche: se si leggessero queste probabilità come riferentesi a proprietà "oggettivamente possedute" (essere in una certa posizione, attraversare una certa fenditura, avere una precisa componente di spin) allora si dovrebbe passare dalla descrizione a stato puro a quella a miscela statistica. Ma le implicazioni fisiche delle due risultano inconciliabili. La struttura della teoria risulta veramente peculiare: essa fa, in generale, solo asserzioni probabilistiche circa gli esiti di ipotetiche misure sui sistemi fisici, asserzioni condizionate tuttavia al fatto che le misure in oggetto vengano effettivamente eseguite. Emerge già a questo punto un elemento di grande rilievo: la teoria attribuisce un ruolo assolutamente primario al processo di misura e, di conseguenza, se si accetta il libero arbitrio dell'osservatore, all'osservatore stesso. È stato ripetutamente asserito che la meccanica quantistica ha, in un certo senso "disfatto la rivoluzione onendo di nuovo, e in un senso ben più radicale, l'osservatore cosciente al centro dell'universo. Vedremo più avanti come questo problema abbia rappresentato il nucleo centrale del dibattito sulla teoria per ben settant' anni e costituisca ancora oggi uno dei nodi concettuali cruciali per qualsiasi tentativo di costruire una visione coerente del mondo fisico. Concludiamo questo paragrafo segnalando come gli sviluppi che abbiamo delineato abbiano di fatto portato a posizioni estreme. Jordan, disce-

copernicana" p

" Vale la pena menzionare che mentre Einstein si rifiuterà per vari anni di accettare l'indeterminismo, Schrodinger non troverà alcuna difficoltà in esso, anzi dichiarerà: «Una volta che saremo riusciti a superare la nostra radicata predilezione per la causalità assoluta, riusciremo a superare le difficoltà».

Prime implicazioni concettuali della teoria 423

polo e collaboratore di Bom, ha assorbito cosi bene le implicazioni dell'analisi di Heisenberg e la posizione che andava affermandosi circa il significato da attribuire alla teoria da arrivare ad asserire: «In un processo di misura della posizione, l'elettrone viene forzato a prendere una decisione. Noi lo costringiamo ad assumere una posizione definita; in precedenza esso non era, in generale, né qui né là; non aveva ancora preso una decisione circa una definita posizione... Se, con un altro esperimento, si misura la vdocità dell'elettrone questo significa: l'elettrone viene costretto a decidere di assumere qualche valore esattamente definito per la velocità... noi stessi produciamo il risultato ddla misura». Nel prossimo paragrafo cominceremo ad analizzare l'articolata posizione di Einstein in merito a questi temi.

3.8 II dibattito Bohr-Einstein: primafase Il naturale referente di Einstein è sempre stato Bohr, come colui che più degli altri membri ddla cosiddetta "Scuola di Copenaghen" era animato da uno specifico interesse per gli aspetti filosofici ed epistemologici della teoria e traeva spunto dai sorprendenti aspetti del microcosmo per presentare ardite ipotesi sulla realtà e sulla nostra possibilità di conoscerla. Questi due giganti del pensiero scientifico nutrivano un profondo rispetto reciproco. Ripercorrere i momenti salienti dd loro dibattito non ha solo un interesse storico ma ci consentirà di puntualizzare meglio alcuni punti di notevole rilevanza concettuale. Come menzionato sopra, la posizione di Einstein subirà rilevanti modifiche nd corso degli anni. Nella prima fase Einstein non accetta l'indeterminismo quantistico e cerca di dimostrare che il principio di indeterminazione potrebbe venire violato, suggerendo geniali gedanken experimente che dovrebbero consentire, di fatto, la determinazione simultanea e arbitrariamente accurata di variabili incompatibili quali posizione e velocità o di mettere simultaneamente in evidenza gli aspetti ondulatori e corpuscolari di un processo. Secondo tutti i resoconti ufficiali Bohr uscirà vincitore da questo titanico scontro, ma, come vedremo, affermazioni di questo tipo non tengono nel dovuto conto le concessioni che egli ha dovuto fare né le vicende successive che mostrano chiaramente come le acute osservazioni di Einstein abbiano contribuito in modo rilevante a focalizzare alcuni problemi che non erano stati pienamente compresi né da lui né dal suo antagonista. Il primo serio attacco di Einstein alla concezione "ortodossa" che andava affermandosi all'interno della comunità scientifica si ebbe durante la

424 4, I fondamenti concettuali e le implicazioni episremoligiche...

Quinta Conferenza di Fisica dell'Istituto Solvay nel 1927. Einstein segnalò come si sarebbe potuto trarre vantaggio dalle (universalmente accettate) leggi di conservazione dell'energia e dell'impulso per ottenere informazioni sullo stato di una particella in un processo di interferenza che, secondo il principio di indeterminazione o secondo quello di complementarità, non avrebbero potuto risultare accessibili. Per seguire il suo argomento e per capire e valutare la risposta di Bohr, conviene rifarei alla disposizione sperimentale iHustrata nella fig. 3.6. Un fascio incidente ben collimato (cioè tale che le particelle che lo compongono possano essere assunte avere un impulso perpendicolare all'asse X) che si propaga nella direzione z, ma con un fronte alquanto esteso, investe uno schermo Sl che presenta una stretta (rispetto alla lunghezza d'onda del fascio) fenditura, Dopo avere attraversato la fenditura, la funzione d'onda diffrange con un'apertura angolare che lo porta a investire un secondo schermo S2 che presenta due fenditure. La successiva propagazione dell'onda porta alla formazione di una figura di interferenza sullo schermo finale F. Al solito, si fa riferimento a una situazione in cui una sola particella per volta attraversa l'intero dispositivo.

g

X

Si S2

Frange di interferenza

fig. 3.6 Un fascio monocromatico (cioè per il quale tutte le particelle hanno lo stesso impulso) investe un primo schermo, diffrange, e l'onda diffratta investe un secondo schermo con due fenditure portando alla formazione di una figura di interferenza sulla lastra F. Come sempre si assume che una sola particella alla volta attraversi l'intero dispositivo sperimentale. Dalla misura del rinculo dello schermo S1 si potrebbe, secondo Einstein, dedurre da che fenditura la particella è passata senza distruggere gli aspetti ondulatori del processo.

Primeimplicazioni concettualidella teoria 425

Secondo l'analisi precedentemente sviluppata, all'attraversamento delle due fenditure deHo schermo S2, gli aspetti ondulatori del processo risultano essenziali. Infatti è proprio l'interferenza fra i due termini della sovrapposizione corrispondenti a stati in cui la particella è localizzata in una delle due fenditure che implica che la particella sia, per cosi dire, "guidata" preferibilmente nelle zone di interferenza costruttiva e non possa mai finire in un punto in cui si verifica interferenza distruttiva (vale a dire in cui la funzione d'onda si annulla). Abbiamo anche segnalato come, di fatto, qualsiasi esperimento mirato a mettere in luce gli aspetti corpuscolari del processo al passaggio dello schermo S2 (che, per il processo in esame, si riduce a determinare da quale fenditura sia passata la particella) distrugge inevitabilmente gli aspetti ondulatori e implica lo sparire della figura di interferenza e l'emergere di due macchie di diffrazione che confermano la nostra conoscenza circa la traiettoria seguita dalla particella. A questo punto Einstein fa entrare in gioco anche il primo schermo e argomenta: poiché le particelle incidenti hanno velocità (praticamente) perpendicolare allo schermo S1, e poiché è solo l'interazione con questo schermo che può determinare una loro eventuale deflessione dalla direzione originale di propagazione, per la legge di conservazione dell'impulso che implica che la somma degli impulsi di due sistemi che interagiscono si conservi, se la particella incidente devia verso l'alto, lo schermo rinculerà verso il basso e viceversa. In condizioni realistiche la massa dello schermo è talmente grande che esso resterà praticamente fermo, ma, in linea di principio, risulta possibile misurare anche un suo infinitesimo rinculo. Se si immagina di eseguire la misura dell'impulso dello schermo nella direzione x dopo che ogni singola particella è passata, si potrà conoscere, dal fatto che lo schermo venga trovato rinculare verso l'alto (verso il basso), se la particella in questione è stata deviata verso il basso (verso l'alto) e quindi sapere da quale fenditura di S2 essa è passata. Ma poiché la determinazione della direzione del rinculo dello schermo dopo che la particella lo ha attraversato non può influire sul successivo svolgimento del processo, si avrà comunque la formazione di una figura di interferenza sullo schermo E Si noti che l'interferenza ha luogo proprio perché lo stato del sistema è la sovrapposizione di due stati le cui funzioni d'onda sono diverse da zero solo attorno a una delle due fenditure. D'altra parte, se ogni particella passa o dalla fenditura superiore oppure da quella inferiore, allora l'insieme dei sistemi in esame è la miscda statistica dei due stati, un'ipotesi che implica che non possa darsi interferenza. Non ci attarderemo a discutere il fatto che, se l'idea di Einstein fosse corretta, allora le conoscenze che si potrebbero avere sulle singole particelle porterebbero a una violazione del principio di indeterminazione.

426 4.Ifondamenti concettualie leim plicazioni epittemoligiche...

Possiamo ora discutere l'appropriata risposta di Bohr. Egli, nel commentare questo dibattito nell'articolo che Paul Arthur Schilpp gli chiederà di scrivere per onorare Einstein in occasione del suo settantesimo compleanno, schematizzerà la proposta di Einstein con le figure 3.7 a, b. La seconda mostra come vada alterata la situazione del primo schermo, rigidamente ancorato alla base, per consentire la determinazione della direzione in cui esso rincula. Bohr osserva che, affinché l'argomento di Einstein sia applicabile, si deve assumere di conoscere l'eventuale moto verticale dello schermo S1 con una precisione tale che essa non possa impedire la determinazione del verso del rinculo provocato dall'interazione colla particella. Ma, argomenta Bohr, la conoscenza estremamente precisa della vdocità nella direzione x dello schermo comporta, secondo le relazioni Heisenberg, una indeterminazione nella sua posizione. Per valutare l'esito dell'esperimento risulta quindi necessario mediare su tutte le posizioni compatibili con siffatta indeterminazione, vale a dire mediare su tutte le possibili figure di interferenza che corrispondono alle diverse posizioni della fenditura. Risulta facile mostrare che questo processo di media dell'annerimento dello schermo F farà si che esso risulti uniformemente grigio: una volta di più l'ingegnoso tentativo di evidenziare gli aspetti corpuscolari del processo all'attraversamento dello schermo S2 porta alla distruzione della figura di interferenza. L'argomento è perfettamente corretto e convincente. Tuttavia, va notato che, come argomenta Bohr, per la comprensione del fenomeno «risulta decisivo che, contrariamente ai veri e propri strumenti di misura, questi corpi (vale a dire il macroscopico diaframma mobile S1), assieme alle particelle, costituirebbero, nel caso in esame, il sistema cui deve applicarsi il formalismo quantistico. Per quanto riguarda la precisazione delle condizioni sotto le quali si può correttamente applicare il formalismo, risulta essenziale che si tenga conto di tutto il dispositivo sperimentale. Di fatto, l'introduzione di una qualsiasi nuova parte di apparecchio, come ad esempio uno specchio, sul cammino di una particella potrebbe comportare nuovi effetti di interferenza che influenzano in modo essenziale le previsioni circa i risultati che verranno registrati alla fine». Più oltre, per uscire dall'ambiguità circa quali parti macroscopiche dell'apparecchio vadano trattate quantisticamente e quali no affermerà: «In particolare, si deve avere ben chiaro che — oltre che nella descrizione della disposizione nello spazio e nd tempo degli strumenti che formano l'apparato sperimentalel'uso non ambiguo di concetti spazio-temporali nella descrizione dei fenomeni atomici va interamente limitato alla registrazione di osservazioni che si riferiscono a immagini su una lastra fotografica o ad analoghi effetti pra-

Primeimplicazioni concettuali della teoria 42 7

ticamente irreversibili di ampli6cazione come la formazione di una goccia d'acquaattorno a uno ione in una camera a nebbia».

a)

b)

fig. 3.7 a, b La rappresentazione di Bohr dell'esperimento suggerito da Einstein. Esso richiede di sostituire il primo schermo, che risulta rigidamente collegato alla base dell'intero dispositivo sperimentale, con uno schermo che può muoversi nella direzione verticale. Dalla lettura dell'indice che ne indica lo spostamento si potrebbe dedurre la direzione di propagazione delle singole particelle e quindi sapere se essehanno attraversato la fenditura superiore o quella inferiore dd secondo schermo senza per questo alterare la figura di interferenza.

Si impongono alcune osservazioni. Innanzi tutto, l'argomento cui fa ricorso Bohr per mostrare l'impossibilità di utilizzare il dispositivo ideato da Einstein per violare il principio di indeterminazione utilizza in modo essenziale il fatto che un oggetto macroscopico (lo schermo Sl) ubbidisca alle leggi quantistiche. Ma forse Bohr non aveva sempre asserito che per evidenziare gli aspetti peculiari dei microsistemi era indispensabile fare intervenire macro-oggetti, la cui caratteristica essenziale è quella di richiedere una descrizione classica? Come mai ora egli è disposto ad ammettere che una parte macroscopica dell'apparato sperimentale sia governato da leggi genuinamente quantistiche? E soprattutto, a quali criteri si deve fare ricorso (visto che la pura macroscopicità non risulta sufficiente) per identi6care quei sistemi che ubbidiscono alle leggi quantistiche e quelli che possono legittimamente considerarsi come classici? Nd 1927 la carica dirompente di questo interrogativo non era ancora stata colta pienamente, ma basteranno pochi anni perché Schrodinger la espliciti con grande lucidità. Se Einstein si fosse reso più lucidamente conto che la sua idea aveva costretto Bohr a inglobare nel "vago mondo dei quanti" una porzione del mondo macroscopico, avrebbe potuto articolare ulteriormente il suo argomento costringendo Bohr stesso ad ammettere che tutti i sistemi fisici dell'universo ubbidiscono alle leggi quantistiche, portandolo a qudl'impasse che discuteremo in connessione

428 4. I fondamenti concettuali e le implicazioni epistemoligiche...

col problema dell'oggettivazione delle proprietà di un sistema fisico macroscopico. Sembra che Bohr, sia pure inconsciamente, abbia intuito che stava per imboccare un vicolo cieco e abbia cercato una scappatoia, solo apparentemente più accettabile dell'impasse da cui voleva uscire. Egli tenta di spostare l'ambiguo confine tra microscopico e macroscopico, tra quantistico e classico a quello tra processi reversibili e irreversibili. L'esito finale (?) di un processo di misura, la formazione di una macchia su una lastra fotografica o di una goccia in una camera a nebbia, costituirebbero chiari esempi dei processi di amplificazione che Bohr andava da tempo invocando, ma ora essi acquistano un ruolo determinante non a motivo della loro macroscopicità ma per un'altra loro caratteristica, l'irreversibilità. Questa scappatoia segna un sottile spostamento di accento che finirà

col mutare, in una certa misura, i termini del dibattito e che fornirà, negli anni successivi e fino a tempi recenti, un'apparente via d'uscita dalle difficoltà concettuali del formalismo. Concludiamo questo paragrafo menzionando che al Sesto Congresso Solvay, Einstein sferrerà un nuovo attacco al principio di indeterminazione presentando un esempio di gedanken experiment che consentirebbe di violare la relazione di indeterminazione tempo-energia. Bohr viene seriamente messo in crisi dall'attacco di Einstein, ma, ancora una volta, ne esce segnalando che parti macroscopiche di un apparecchio devono ritenersi governate da leggi genuinamente quantistiche. Non ci attarderemo a discutere questo caso che è analizzato in molti libri (vedi, ad esempio, Ghirardi, 1997) ma la cui considerazione non muta in alcun modo le condusioni appena raggiunte.

4. Sistemi composti ed entangkment

Fino a questo punto abbiamo considerato sistemi fisici generici senza specificare se essi sono semplici o composti. Gli elementi astratti dello spazio di Hilbert o le funzioni d'onda di cui ci siamo occupati possono descrivere una particella elementare quale per esempio un neutrone, oppure un sistema composto come un atomo, o addirittura un sistema fisico macroscopico contenente un numero di costituenti elementari dell'ordine del numero di Avogadro, vale a dire circa 1(P particelle. Tuttavia, come vedremo in questo e nei prossimi paragrafi, la considerazione dei costituenti elementari di un sistema composto dà origine a una serie di problemi di grande rilevanza che richiedono un'attenta e dettagliata analisi.

4.1 Aspetti formali della descrizione dei sistemi composti Poiché tutte le peculiarità che caratterizzano il comportamento dei sistemi composti si presentano già nel caso di un sistema costituito da due soli sottosistemi (che per semplicità chiameremo i suoi costituenti elementari), limiteremo le nostre considerazioni a un siffatto sistema: S = St + Sz. Come discusso nell'Appendice A, lo spazio di Hilbert appropriato per la sua descrizione risulta il prodotto diretto g = P, S Pz degli spazi di Hilbert associati ai due costituenti. Ricordiamo la definizione di prodotto diretto: considerato un S,O.N.C. (y,"') in PI, e un analogo S.O.N.C. (g,'"l in Pz, l'insieme numerabile di stati ortogonali e normalizzati identificati da una coppia ordinata di indici (i, j) (y;"' S gj'"), costituiscono un S.O.N.C. in P. Per semplicità notazionale, lasceremo spesso cadere il simbolo di prodotto diretto tra le coppie di stati della base. Questo non comporta alcuna ambiguità in quanto gli apici (1) e (2) associati agli stati in oggetto servono proprio a ricordarci che gli stati si riferiscono a sistemi diversi i cui stati appartengono a spazi di Hilbert diversi. L'arbitrario elemento normalizzato di P potra scriversi come 'P (),2) ' = ~~Z

(() (2)

ij

c~ji yi . g j .' ,

Ic„-I con/ Corrispondentemente, le osservabili fisiche del sistema saranno rappre=L

sentate da operatori autoaggiunti in g. Va sottolineato che tra le osserva-

430 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

bili dovranno trovare posto anche queHe che si riferiscono a uno solo dei costituenti. La loro trattazione non pone alcun problema: se A"' è un'osservabile del sistema $1 e ~("" il corrispondente operatore lineare autoaggiunto in Pn allora l'operatore da associarsi a essa nello spazio p risulta semplicemente rf "' 8 X"', ove X"' è l'operatore identità (vale a dire quello che trasforma qualsiasi vettore in se stesso) dello spazio >2. Naturalmente l'operatore ora considerato, come operatori più generali del tipo 8 "' 8 E"' che non coincidono con l'identità in nessuno dei due spazi, agiranno nello spazio )4 nel seguente modo: — essi trasformano gli dementi della base secondo l'ovvia prescrizione: [g (1)® g (2)](p (1) 8 g (2)) [ g (1)p(1)] 8 [g (2)g(2)] — per quanto riguarda la loro azione sul generico stato 'P(1,2) ' =

X ~

(1)

E,j

c „- ( ( () E

g,'" essa è definita per estensione lineare dell'azione dell'operatore sug li elementi della base: [8"'8 1 2)' ]'I J"' ' = [8"'8 E ' '] Y

~E

- [8"'8 8 " ' ]

E,J

o

c „ " y '"g' ' = j

E

J

[ 8"' "'] 8 [ E"' " ' ]

"' "' = V

J

42 Stati fattorizzati e non fattorizzati Nel caso di sistemi composti risulta estremamente importante distinguere il caso di stati fattorizzati da stati che tali non sono. Si intende per stato fattorizzato uno stato @ dello spazio p che risulta il prodotto diretto di uno stato di p1 per uno stato di >2. 4 = ())'" 8 y~', con ((()'" e y"' due stati qualsiasi degli spazi di Hilbert dei costituenti. Ovviamente, gli stati P"' e

y"' potranno svilupparsi in serie dei membri di due S.O.N.C. negli spazi stessi. Se si fa riferimento alle basi (g'") e (g,'") del paragrafo precedente si avra; ())(1) = X ~

(1)

E

a , y.E e y

(2) = ~

Z

(2)

j

b, gJ. , ch e , sostituiti nell espressio-

ne per 4, mostrano che i coeff(cienti del suo sviluppo sulla base (cp,'" 8 g,'"l di g, risultano essi stessi fattorizzati. In altre parole, se si pone, in accordo con l'espressione dd paragrafo precedente, @ = Y ~

c„"y"' 8 jg' ' 'J E'

EJ

allora risulta: c„ = a;b ; Ovviamente l'insieme di tutti gli stati di P risulta ben più ricco di quello degli stati fattorizzati in quanto contiene anche tutte le loro combinazioni lineari. Per i nostri scopi basterà considerare sovrapposizioni lineari di un numero unito (nella maggior parte dei casi solo di due) stati fattorizzati. Il primo punto da investigare è quello ddla possibilità di attribuire pro-

Sistemi composti ed entanglement 43 1

prietà oggettive ai costituenti del sistema composto. A questo scopo consi— p;n' 8 yj'" i cui fattori siano autovetderiamo uno stato fattorizzato 4q &jp g ') ' di due operatori autoaggiunti 8n' e tori (8n'q);"' = a, P;"', E"'yj E di P i e PI< che rappresentano le osservabili fisiche A"' e B"' dei costituenti. Ovviamente, per lo stato 4q potrà asserirsi che A"' = ai e, similmente, che B"' = b,, cioè che i costituenti possiedono oggettivamente (vale a dire indipendentemente da qualsiasi processo di misura) le proprietà ora indicate. Infatti lo stato @ risulta autostato delle osservabili 8n' 8 X " ' e En' 8 8' "'relativo agli autovalori indicati. Poiché, come abbiamo osservato nel paragrafo 3, dato un qualsiasi stato di uno spazio di Hilbert esiste sempre un operatore autoaggiunto di cui esso è autostato, se si assume che ogni operatore autoaggiunto rappresenti un'osservabile, allora può concludersi che nel caso di un sistema fisico individuale (o dei membri di un insieme quantisticamente omogeneo) associato a uno stato fattorizzato, i costituenti dd sistema composto possiedono, ciascuno, una precisa proprietà oggettiva. Supponiamo ora di considerare una combinazione lineare di due stati fattorizzati per i quali i fattori dei due termini della sovrapposizione risultano autovettori delle osservabili A"' e B"' relativi ad autovalori distinti:

'P"" = ay'" 8 y "' + bP "'8 y "' a, b e C, lai' + Ibl' = 1. Uno stato siffatto viene detto entangled, dall'espressione inglese entanglemettt che significa ingarbugliamento, groviglio, ma che noi preferiremo non tradurre in quanto nel nostro contesto esso ha il preciso senso tecnico e lespecifiche implicazioni fisiche che ci accingiamo a esaminare. Riteniamo opportuno segnalare che, molto appropriatamente, Schrodinger ha voluto sottolineare l'importanza di questo aspetto del formalismo dichiarando: «Io considero [l'entanglement] non uno ma il tratto più caratteristico della meccanica quantistica, quello che implica il suo completo distacco da qualsiasi concezione classica». Passiamo subito ad analizzare alcune implicazioni dell'entanglement. Ovviamente lo stato 'Pn~' associa la probabilità lai' (diversa da 0 e da 1) all'esito a; in una misura di A'" e all'esito bj in una misura di B"', e la probabilità Ibl' relativa a ciascuno degli esiti a„e b,. Ovviamente, poiché "non può prevedersi con certezza l'esito di una misura di queste osservabili", non risulta legittimo pensare che esse abbiano valori oggettivamente posseduti. Quindi, nello stato considerato, i costituenti non hanno proprietà definite relative alle osservabili in esame. Possiamo allora chiederei, esisteranno comunque delle osservabili per i costituenti per le quali possa prevedersi con certezza l'esito di una misura? Con riferimento per esempio al sistema $> potrebbe considerarsi una generica osservabile Cn e imporre che lo stato 'P "~' risulti autovettore dell'operatore autoaggiunto d' "' 8 X"'

432 4.lfondamenti concettualie leim plicazioni epistem oligiche.. .

che gli corrisponde. Ma questo può verificarsi se e solo se entrambi gli stati p " e p„") sono autovettori di d' "' relativi allo stesso autovalore, vale a dire se ( '" presenta degenerazione, e i due stati in questione appartengono alla stessa autovarietà degenere. Il lettore non avrà quindi difficoltà a cogliere un punto di estremo rilievo concettuale: per un sistema composto, in generale, i suoi costituenti non possederanno alcuna proprietà oggettiva. Per convincersi di questo fatto basta considerare una sovrappo(1 2)

sizione di stati della base 'P '

X

=~

(1) (2)

ij

c „ "cl2. r j g. per la quale tutti i coeffi-

cienti c„, per qualsiasi t' e j, risultano diversi da zero (ovviamente essi dovranno essere tali da garantire la convergenza ddla doppia somma dei quadrati dei loro moduli). Affinché tale stato sia autovettore di un'osservabile D '" O>< X"' del sistema S1 dovrebbe accadere che tutti i vettori ()();"' fossero autovettori di l' "' rdativi al medesimo autovalore, diciamo k. Ma, poiché l'insieme (p,'") è un sistema completo, D '" risulterebbe allora multiplo dell'identità: P "' = kX'". Ovviamente sappiamo bene che qualsiasi vettore di +1 è autovettore di un operatore siffatto relativo all'autovalore k, ma questa conoscenza non ha alcuna rilevanza sul piano fisico, non ci dice nulla circa qualsivoglia proprietà del sistema. La conclusione cui siamo giunti che, vorremmo ripeterlo, ha grande rilevanza concettuale, può esprimersi anche nel seguente modo: la teoria, come abbiamo segnalato nd capitolo precedente, ci ha insegnato che non possono attribuirsi "troppe" proprietà a un sistema quantistico. Ma la teoria ci ha anche garantito che un sistema individuale, considerato come un tutto, ha sempre qualche proprietà che esso possiede oggettivamente. Invece, nel caso di un sistema composto, i costituenti del sistema non possiedono in generale alcuna proprietà oggettiva. Ovviamente, il sistema come un tutto ha ancora qualche proprietà: lo stato 'P"" a lui associato è sicuramente autostato di qualche osservabile dello spazio di Hilbert P =

51 ®F2

L'analisi appena sviluppata ha delle implicazioni notevolissime. Per ora ci limiteremo a sottolineame una. Si supponga di avere un sistema composto che inizialmente è in uno stato fattorizzato; i suoi costituenti hanno allora qualche proprietà oggettiva. Lasciamo evolvere il sistema e supponiamo che i costituenti interagiscano tra di loro. È facile mostrare che, in generale, l'effetto dell'interazione sarà quello di portare a uno stato che non è più fattorizzato e quindi a una perdita di proprietà oggettive per i costituenti. Questo è vero anche se, successivamente all'interazione, i due costituenti si allontanano e finiscono per non essere più in interazione uno con l'altro. Il solo fatto di avere interagito in passato ha fatto perdere qualsiasi proprietà individuale oggettiva ai costituenti: solo il sistema compo-

Sistemi composti ed entanglement 433

sto, considerato come un tutto ne possiede qualcuna. Ma poiché alla lunga tutto interagisce con tutto, la visione che emerge inevitabilmente dall'assunzione che il formalismo quantistico governi tutti i processi naturali è quella che è stata ben sintetizzata nel titolo del recente libro di Bohm e Basii Hiley: The uttdivided universe. Nello stesso spirito Bernard d'Espagnat (d'Espagnat, 1989, 1995) ha sottolineato come la visione quantistica porti inevitabilmente a una concezione che vede l'universo come un unbroken whok una totalità che ha qualche precisa proprietà, ma le cui parti non ne hanno alcuna.

43 Un utile esempio: gli stati di spin di due particelle di spin 1/2 Sia al fine di rendere più chiare le considerazioni del paragrafo precedente che per prepararci gli strumenti formali per l'analisi che seguirà, consideriamo ora il caso di un sistema composto S = S> + Sz di due particelle di spin 1/2, e interessiamoci solo alle loro variabili di spin. Prima di studiare gli stati del sistema composto occupiamoci degli stati dei costituenti. Come sappiamo, il più generico stato di spin di una particella di spin 1/2,

ha la forma b, a, b, e C, lai' + Ibl' = 1. Nel paragrafo 3.1. abbiamo asserito che per ogni stato de]lo spazio di spin esiste sempre una direzione n tale che lo stato in esame risulta autovettore deHa componente (in unità fi/2) dello spin lungo quella direzione relativo all'autovalore + 1. In altri termini il sistema individuale associato allo stato considerato "possiede oggettivamente la proprietà di avere lo spin in su nella direzione n " Passiamo a dimostrare questo importante fatto. L'operatore a„- che rappresenta la componente (misurata nelle unità indicate) dello spin nella direzione 8, sarà dato, ovviamente, dal prodotto scalare ddl'operatore vettore di spin di compo-

nenti (o'„, cr„cr,) con il versore 8, di componenti (n„, ns,n,) che soddisfano alla condizione n'„+ n'„+ n', = 1. Ricordando le espressioni (2.43) per gli operatori in questione, si ha allora:

(4.1) Utilizzando questa espressione risulta immediato verificare che lo stato b è a utovettore dell'operatore o~, ove il versore d è dato da: d = (d„ = 2 Re(ab"], d~ = — 21m[ab'], d, = 1 — 2lbl'). In questa espressione si sono indicati con Re[z] e Im[z] le parti reali e immaginarie del numero complesso z. È immediato verificare

434 4. 1 fondamenti concettttali e le implicazioni epistemoligiche...

che d'„+ d~ + d', = 1. Inoltre, poiché sostituendo i valori indicati nella (4.1) si ottiene: D'g =

1 — 2lbl' 2ab "' 2a -" b 2lbl' — 1

(4.2)

tenendo conto dell'uguaglianza lai' + Ibl' = 1, si verifica immediatamente che a

1— 2lbl' 2 a b ' a

a —2l b l ' a+ 2lbl' a

a

(4 3)

che dimostra appunto l'asserto.

Per gli sviluppi futuri è opportuno ricavare esplicitamente gli autovettori u„- e P„- dell'operatore (4.1) rdativi agli autovalori + 1 e — 1, rispettivamente. Come il lettore può verificare facilmente eseguendo la semplice moltiplicazione righe per colonne si ha: C- =

I

1

—(n„— in,)

2(]+n,)

1+ n,

1+ n,

2(]+n,)

"

n„+in~

(4.4)

espressioni che mostrano come questi stati siano le seguenti combinazioni lineari degli autovettori ()2, e p, di cr2: l+n, n „+i n , Q„-

Q2

+

~ 2(1 + n,)

~ 2(1 + n,) (4.S) nx t n y l+n Q,+ Pz 2(1+ n,) ~ ~ 2(1 t n) Riprendiamo ora in considerazione il sistema composto S = Si + Sz e riconsideriamo, con riferimento alle variabili di spin, la questione della radicale differenza tra stati fattorizzati e non fattorizzati. Si consideri il seguente stato fattorizzato per il sistema composto: ,

())

+r.

- a

Qx „

c

(2)

(4.6)

ove i due stati a destra si riferiscono ai due costituenti e, ovviamente, sono normalizzati. Come consegue dall'analisi appena svolta, esisteranno allora due direzioni d) ed eq dell'ordinario spazio tridimensionale tali che Vp" a' è autostato sia della componente di spin nella direzione 2> per la prima particella che della componente nella direzione ez per la seconda, relativo all'autovalore +1 per entrambe. Si può quindi asserire che "la prima particella ha lo spin in su nella direzione d> e la seconda nella direzione ez", un modo per esprimere il fatto che se si eseguissero le misure indicate esse darebbero con certezza l'esito + 1.

Sistemi composti ed entanglement 435

Passiamo ora a considerare uno stato entangled di spin, e precisamente il seguente: ~(1,2)

( (t)p(2)

S

z

g

z

p (1) (2) z

z

)

(4.7)

vale a dire la sovrapposizione di uno stato nel quale la particella 1 ha lo

spin in su e la particella 2 ha lo spin in giù lungo l'asse z e di uno nel quale le orientazioni di spin delle due particelle vengono scambiate. L'indice S è un'abbreviazione che specifica che lo stato in questione è quello che usualmente viene indicato come lo stato di singoletto di spin. Analizziamo le proprietà di questo stato relative alle varie possibili osservabili di spin. Innanzi tutto esso è una sovrapposizione con uguali coefficienti di autovettori di o, per le due particelle. Se ci chiediamo quale sia la probabilità di trovare l'esito cr,n' = + 1 in una misura della componente di spin della prima particella lungo l'asse z dovremo valutare il quadrato del modulo del coefficiente dell'autostato di questa osservabile relativo a questo autovalore nella (4.7). Ma questo coefficiente è 1/~2 e perciò la probabilità in oggetto è uguale a 1/2. Lo stesso vale anche per la probabilità di ottenere gli esiti o;n' = — 1, cr,"' = + 1, ázsn = — 1. Lo stato di singoletto assegna a tutti questi esiti probabilità 1/2. A questo punto si impone un'osservazione di notevole rilievo. Lindicazione della direzione z che caratterizza le osservabili i cui autovettori appaiono ndlo stato (4.7) risulta del tutto superflua' Per verificarlo consideriamo lo stato entangled perfettamente analogo allo stato (4.7) ma in cui la direzione z venga sostituita da un'arbitraria direzionen : ( (1)p(2) p (1) (2)

tIy(1,2)

)

(4.S)

n rt nS g 2 11 n Utilizziamo quindi le equazioni (4.5) per esprimere questo stato in termini degli autostati di o;n' e o,'"':

1

1 + n,

C(1) +

n„+ tny p ( t )

F2 ~ 2(1+a, ) n„— iny

R(2) +

~ 2(1 + a,) '

Qx

(12+ n, ) 1+ n,

~ (2)

~2( 1 + e,)

" Questa è una diretta conseguenza del fatto che lo stato (4.7) è invariante per rotazioni.

436 4. I fondamenti concettuali e le implicazioni epistemoligiche ..

n„— iny

(1) Q +

~ 2(1 + s,) l+n,

1+ n,

px

2(1+ n , )

(4.9) n „+ i n ,

(2)

tz +

2(1 + n,)

~ 2(1 + m,) Esplicitando i prodotti si constata che, di fatto, l'espressione (4.8) coincide

con la (4.7) : qg(1,2)

~(1,2)

n5

S

(4.10)

Questo risultato è estremamente interessante in quanto essomostra che le conclusioni precedenti relative a ipotetiche misure delle componenti di spin lungo l'asse z possono applicarsi a misure lungo una qualsiasi direzione arbitrariamente scelta. Ne consegue che lo stato (4.7) assegna, per ogni sistema individuale, probabilità uguali e uguali a 1/2 agli esiti + 1 e — 1 di una misura di spin lungo una qualsiasi direzione arbitrariamente scelta. Questo implica che i costituenti non possiedono alcuna proprietà di spin, in quanto non esiste alcttna osservabile di gi n di cui possa prevedersi l'esito prima di eseguire la misura. I costituenti hanno perso qualsiasi proprietà oggettiva che si riferisca allo spin. Di nuovo, solo il sistema come un tutto ha proprietà di spin def(nite. Di fatto, anche se non ci attarderemo a dimostrarlo, è relativamente facile verificare che lo stato%'s"" è autovettore dell'operatore quadrato del momento angolare totale di spin relativo all'autovalore 0. Vale la pena notare che la conclusione cui siamo giunti ha validità del tutto generale. Nella nostra trattazione abbiamo ignorato le variabili spaziali, ma risulta lecito immaginare che lo stato complessivo del sistema sia rappresentato dal prodotto dello stato di singoletto per quanto riguarda le variabili di spin per una funzione d'onda relativa ai gradi di libertà spaziali. Questa funzione può benissimo corrispondere al fatto che i due costituenti siano in regioni spazialmente separate da una distanza arbitrariamente grande e non siano più in interazione tra di loro. Non solo, lo stato che abbiamo appena descritto risulta estremamente facile da preparare in laboratorio. Questo stato giocherà un ruolo essenziale per l'analisi ddl'argomento di Einstein, Podolsky e Rosen che esporremo più avanti seguendo la più elegante e semplice riformulazione che ne ha dato Bohm, e per la derivazione ddla fondamentale disuguaglianza di Beli che ha rappresentato una vera e propria svolta concettuale nella valutazione delle sottili implicazioni del formalismo.

Sistemi composti ed entanglement 4 3 7

4.4 Stati entangled e riduzione del pacchetto d'onde L'analisi dei due paragrafi precedenti ci ha portato a concludere che il formalismo, a causa dd peculiare fenomeno deH'entanglement, comporta in generale la perdita di qualsiasi proprietà dei costituenti di un sistema composto e quindi la necessità di concepire l'intero universo come un'unità indivisibile le cui parti non possono venire caratterizzate se non con riferimento al tutto di cui fanno parte. Questo pone ovviamente difficoltà insormontabili all'idea stessa di sistema isolato e quindi alla concreta possibilità di fare ricorso a queU'approssimazione e idealizzazione dei processi fisici che, come ha osservato Beli (divide et impera), ha segnato la nascita della scienza sperimentale. Come si pone l'interpretazione ortodossa nei confronti di questo imbarazzante problema? Essa lo supera facilmente facendo ricorso al più discusso e problematico dei suoi postulati, quello della riduzione del pacchetto. Per comprendere questo punto conviene riprendere in esame un ' =~ Z sistema composto $ = $1 + S2 associato allo stato ' P (1,2)

(1) (2)

ij

c j ys. g j.

che è la sovrapposizione di stati fattorizzati, ciascuno dei quali corrisponde a proprietà definite per una coppia di osservabili A'" e B"' dei costituenti S1 ed S2, rispettivamente. Nello stato in esame queste osservabili non hanno (e, nel caso più generale, nessuna osservabile ha) valori definiti. Supponiamo ora di assoggettare il sistema $2 a una misura di B"'. essa avrà come esito uno dei suoi autovalori, per esempio b,"' e, corrispondentemente, il postulato Rid. P. ci garantisce che lo stato viene trasformato ndla sua proiezione sull'autovarietà associata all'autovalore trovato. Ma questo, nel caso in esame, semplicemente che il vettore di stato subisce istantaneamente la seguente trasformazione:

sigin fica

'P"''

~

g @2)

-

c;,y. g

=())" g,

,

t)) ' =

c;,l'' e +) (4.11)

esito b,

vale a dire diventa uno stato fattorizzato. La misura sul sistema $2 ha fatto emergere, come ci aspettavamo, la proprietà relativa all'esito b,"' per l'osservabile B"', ma ha anche precipitato il sistema $1 nello stato Pn', il quale, come ben sappiamo, sarà autovettore di un opportuno operatore autoaggiunto di p nella regione A ove è localizzata la particella S> decida, a suo libero arbitrio, di eseguire la misura della componente di spin in una direzione, diciamo n, scelta arbitrariamente. Con riferimento all'espressione (4.8) dello stato dd sistema possiamo asserire che egli ha uguali probabilità (nonepistemiche) di ottenere sia l'esito + 1 che l'esito — 1 ndla misura. Per fissare il discorso supponiamo che si dia il primo dei due esiti. Allora il postulato Rid. P. ci assicura che lo stato si trasforma istantaneamente nella sua proiezione sull'autovarietà di o„'-"' relativa all'autovalore + 1. Ma dei due stati della sovrapposizione (4.8) il primo giace in questa varietà e il secondo nella varietà a essa ortogonale, Pertanto l'effetto della misura comporta il seguente "salto quantico" : II)

(4.12) esito +l

n

st

L'osservatore O> può ora prevedere con certezza che se un osservatore Oz esegue, nella regione ove si trova la seconda particella, una misura di spin lungo la medesima direzione n, egli otterrà con certezza il risultato — 1. L'azione di O> ha fatto emergere istantaneamente una proprietà oggettiva di spin per il sistema Sz con il quale non ha interagito in alcun modo e dal quale può essere arbitrariamente distante. Il lettore avrà certamente colto la singolarità ddla situazione. Prima di qualsiasi misura entrambi i sistemi hanno probabilità nonepistemiche e uguali a 1/2 di dare uno qualsiasi dei due esiti. Ciononostante, se si eseguono due misure di spin nella medesima direzione, gli esiti risultano sempre perfettamente correlati e opposti. Come può darsi un'evenienza cosi peculiare? L'analisi ora sviluppata mette in evidenza una forma di nonlocalità, una specie di "azione istantanea a distanza": un processo fisico (la misura) che ha luogo in una precisa regione spaziale, a causa dell'entanglement dei costituenti, comporta l'emergere istantaneo di una proprietà oggettiva per un sistema arbitrariamente lontano che, prima di questa azione, non poteva essere supposto possedere già la proprietà in questione. Chiunque si occupi di fondamenti della meccanica quantistica ha una estrema familiarità con la peculiare situazione ora descritta in quanto essa incorpora gli elementi essenziali dell'acutissima analisi di Einstein, Podolsky e Rosen (cui d'ora in avanti faremo riferimento utilizzando la sigla EPR), analisi che ha costretto la comunità scientifica a riconoscere

Sistemi composti edentanglement 439

che i costituenti microscopici del mondo mostrano comportamenti più peculiari di quanto chiunque avesse immaginato. Prima di venire ad articolare più in dettaglio l'argomento di incompletezza di EPR risulta opportuno affrontare alcuni aspetti squisitamente tecnici della descrizione quantistica dei sistemi composti che utilizzeremo ripetutamente nd seguito per focalizzare alcuni punti cruciali strettamente legati alla situazione appena discussa, tipicamente per mostrare che, malgrado le apparenze, la nonlocalità quantistica non entra in un conf(itto insanabile con la teoria della relatività,

4.5 La descrizione formale dei singoli costituenti di un sistema composto: miscele statistiche di prima e di seconda specie Torniamo a considerare un sistema composto S = $1 + $2 e supponiamo, in completa generalità, di avere a che fare con un insieme statistico, eventualmente nonomogeneo, di siffatti sistemi. Indichiamo come k'n~' l'operatore statistico dell'insieme e supponiamo di essere interessati esclusivamente alla fisica di uno dei due costituenti, diciamo $1. Questo signi6ca che le uniche osservabili che prenderemo in conto sono qudle del costituente in oggetto. Sia A'" la generica osservabile di S, e 8"' l'operatore autoaggiunto a essa associato, un operatore che per i nostri scopi possiamo assumere sia limitato. Poiché di fatto stiamo lavorando nello spazio di Hilbert del sistema composto, come illustrato nel paragrafo 3.1, l'osservabile in esame andrà descritta dall'operatore 8n' ® R"' di P, ove R"' è l'operatore identità in p2. Tenendo presente che tutte le implicazioni Gsiche della teoria per S, possono esprimersi in termini dei valori medi di tutti gli operatori autoaggiunti e limitati di /In calcoliamoci il valore medio di 8n' S R"'. Come sappiamo esso può valutarsi calcolando la traccia (vale a

dire la somma dei valori medi su un arbitrario S.O.N.C. in g) dd prodotto dell'operatore cui siamo interessati per l'operatore statistico del sistema:

< A' > = tr[(d"' S X"') l ' " " ]

( associata allo stato q)l". Si noti che poiché, salvo il caso in cui lo stato 'Pn~' sia fattorizzato (ancora una volta emergono le peculiari proprietà di stati di questo tipo), la somma nella (4.17) contiene più di un termine, l'operatore k '" non risulta idempotente e quindi, dal punto di vista del solo costituente Sn l'insieme (pur essendo uno stato puro per il sistema composto) si comporta come se fosse un insieme nonomogeneo, vale a dire una miscda statistica. La situazione ora delineata ha una notevole importanza concettuale, al punto che, appropriatamente, d'Espagnat (d'Espagnat, 1965) ha voluto introdurre un'espressione esplicita per caratterizzare sBatte miscele. Dato un sistema $> che rappresenta tutto il nostro universo, questo autore chiama miscele di prima specie le miscde statistiche che corrispondono a un insieme nonomogeneo di stati di questo sistema. Egli denota invece come miscde di seconda specie quelle che descrivono un insieme di sistemi $, che, di fatto, sono i costituenti di un insieme omogeneo di sistemi composti in uno stato non fattorizzato." La distinzione intende appropriatamente sottolineare che mentre per misure che coinvolgono solo i sistemi S, una miscela di seconda specie risulta di fatto fisicamente indistinguibile da un'appropriata miscela di prima specie (in realtà, come sappiamo, indistinguibile dagli infiniti insiemi statistici distinti che sono tutti descritti dallo stesso operatore statistico), qualora si eseguano misure di correlazione tra il sistema $> e l'altro sistema che con lui costituisce il sistema composto S, risulta perfettamente possibile rivdare che di miscela di seconda specie si tratta e distinguerla da ogni miscela di prima specie. Una semplice illustrazione di questa caratteristica dei sistemi composti è già stata data: nd caso del singoletto, il fatto che gli esiti ddle misure di componenti di spin per i due costituenti di S lungo la stessa direzione risultino sempre perfettamente anticorrelati (+ 1 e — 1, rispettivamente) costituisce la prova esplicita che, a dispetto del fatto che eseguendo misure solo su S, non potremmo mai distinguere il singoletto da una opportuna miscda di " Come può facilmente veáficarsi, le stesse ragioni che differenziano e consentono di distinguere sperimentalmente, nd caso di un sistema composto, uno stato pum non fattorizzato da un insieme statistico di uno dei suoi costituemi, rendono possibile anche distinguere quest'ultimo caso da una qual-

siasi miscela statistica per il sistema composto per la quale almeno uno dei sottoinsiemi che la compongono sia associato a uno stato non fattorizzato. Infani la natura entangled anche di un solo sottoinsieme puro di un insieme statistico comporta specifiche corrdazioni che non possono venire riprodotte, se tutti gli operatori autoaggiunti e limitati del sistema composto sono misurabiTi, da qualsiasi concepi-

bile miscda di srati per uno dei costituenti, o, con maggiore proprietà logica, da alcuna concepì>ile miscela di stati fattorizzati per il sistema composto.

442 4. l fondamenti concettuali e leimplicazioni epistemoligiche...

stati di spin di S„ le misure di correlazione tra questo sistema e il suo partner ci rivdano che St è entangled con Sz, e che, nell'appropriato spazio di Hilbert per il sistema composto, stiamo' di fatto trattando con un caso puro e non con una miscela statistica. L'analisi di questo paragrafo ha messo in evidenza tutti gli elementi che risultano necessari per una appropriata comprensione e valutazione ddl'argomento di EPR circa l'incompletezza della meccanica quantistica, il tema del paragrafo che segue.

5. L'argomento di incompletezza di KPR

Attorno all'anno 1935 Einstein muta il suo atteggiamento circa la meccanica quantistica. Egli riconosce, come conseguenza delle risposte di Bohr alle sue pressanti critiche, che si deve accettare che non risulti possibile misurare con precisione arbitraria coppie di variabili canonicamente coniugate. Ma Einstein non aderisce alle posizioni positivistiche che dichiarano addirittura illegittimo parlare delle proprietà di qualcosa "che esiste là fuori", se non facendo esplicito riferimento a concreti procedimenti sperimentali per determinarle. In altri termini Einstein adotta una posizione lucidamente realista verso il mondo. Pertanto, anche se ammette che, di fatto, non è possibile configurare un esperimento che conduca alla conoscenza simultanea della posizione e della velocità di una particella con una precisione maggiore di quelle consentite dalle relazioni di indeterminazione, egli si rifiuta di accettare che una particella individuale non possieda valori perfettamente definiti di queste variabili. Analogamente egli reagisce con grande determinatezza all'idea che la scienza debba limitarsi a descrivere anziché "spiegare" la realtà che ci circonda. In altri termini, egli pretende che uno schema teorico debba consentire l'elaborazione di una visione consistente e "oggettiva" (nel senso che non risulti logicamente dipendente dal nostro ruolo di esseri coscienti) dd mondo come lo percepiamo. Questo suo atteggiamento, che pure non è dettato da posizioni dogmatiche preconcette (si veda l'analisi che svilupperà nel suo arti-

colo Reply to Cri ticsin Schilpp, 1949), gli attirerà, già in quegli anni e fino ad anni recenti, pesanti critiche da parte di molti scienziati che aderiscono alla posizione "ortodossa" circa il formalismo, e che non hanno saputo cogliere pienamente gli aspetti rivoluzionari emersi nel corso delle successive indagini teoriche e sperimentali sui fondamenti della teoria. Gli si imputa una forma di chiusura mentale nei confronti degli aspetti "non dassici" ddla nuova teoria o addirittura l'adesione acritica a posizioni filosofiche che sarebbero state spazzate via precisamente dalle indagini sui microsistemi. Due esempi illuminanti basteranno per illustrare questo stato di cose che, a nostro parere, deriva più da un'insuSciente valutazione della portata deHe sue critiche da parte dei suoi avversari che da posizioni preconcette di Einstein circa la conoscenza scientifica. Una frase di Pauli (EinsteinBom, 1969-1973) risulta emblematica: «Come di recente sosteneva O.

444 4.Ifondamenti concettualie leim plicazioni epistem oligiche.. .

Stern, l'eventuale esistenza di qualcosa di cui non possiamo sapere nulla non dovrebbe preoccuparci più di quanto non ci preoccupi l'antico problema di quanti angeli possano trovare posto sopra la punta di uno spillo. Mi sembra però che in ultima analisi tutte le questioni poste da Einstein siano di questo tipo». Vedremo più avanti come questa kase,se la si considera riferita in modo particolare al lavoro di EPR, risulti del tutto inappropriata: la questione che Einstein pone alla teoria non solo non è astrattamente metafisica, ma ammette addirittura una precisa risposta sperimentale. Che poi questa risposta non risulti quella che Einstein si aspettava, non toglie certamente rilevanza alla sua analisi. Il secondo esempio mostra invece come Einstein stesso abbia lucidamente e dolorosamente vissuto la sua emarginazione dalla comunità scientifica, causata dalle sue posizioni che venivano recepite come dogmatiche e aprioristiche." In una lettera a Born, egli scriverà: «Le nostre prospettive scientifiche sono ormai agli antipodi tra loro. Tu ritieni che dio giochi ai dadi col mondo; io credo invece che tutto ubbidisca a una legge, in un mondo di realtà obiettive che cerco di cogliere per via furiosamente speculativa. Lo credo fermamente, ma spero che qualcuno scopra una strada più realistica — o meglio un fondamento più tangibile — di quanto non abbia saputo fare io. Nemmeno il grande successo iniziale della teoria dei quanti riesce a convincermi che alla base di tutto vi sia la casualità, anche se so bene che i colleghi più giovani considerano questo atteggiamento come un effetto di sclerosi. Un giorno si saprà quale di questi due atteggiamenti istintivi sarà stato quello giusto>>.

Come menzionato all'inizio, la posizione di Einstein evolverà notevolmente nel corso degli anni. Uno dei momenti cruciali di questa evoluzione è rappresentato dall'elaborazione dell'argomento di incompletezza che presenteremo e discuteremo in questo paragrafo.

5.1 II cosiddetto "paradosso" di EPR Il 1935 fu un anno davvero straordinario. Esso vide l'apparire di due fondamentali lavori, uno di Einstein, in collaborazione con i colleghi Podolsky e Rosen, l'altro di Schrodinger. Entrambi sfruttano in modo determinante le inaspettate e imbarazzanti implicazioni del fenomeno dell'entan-

" Di fatto, egli cercava semplicemente di rendere chiare quelle che lui considerava esigenze irrinunciabili per ogni serio tentativo di "conoscere i pensieri di dio", cioè di cogliere qualche frammento di verità circa il "reale" che "esiste là fuori" Questo è per lui lo scopo vero della "grande impresa della conoscenza".

Largomento diincompletezza di EPR 445

glement per sistemi composti. Il lavoro di EPR fa riferimento a sistemi microscopici e mira a dimostrare che la meccanica quantistica è una teoria fondamentalmente incompleta. Schrodinger, nel suo lavoro, segnala come l'entanglement tra un microsistema e un macrosistema (che si produce inevitabilmente in molti processi naturali e in particolare in tutti i processi di misura) porti a un conflitto insanabile della teoria con elementari e irrinunciabili richieste circa il comportamento dei sistemi macroscopici.

In questo paragrafo ci occuperemo dell'argomento di incompletezza di EPR e lo presenteremo facendo ricorso alla riformulazione che ne ha

dato Bohm (Bohm, 1951) la quale, senza differenziarsi sul pianoconcettuale dall'argomento originale, risulta estremamente più semplice ed essenziale, e ha suggerito la realizzazione di esperimenti cruciali per la teoria. Bohm considera la seguente situazione: due particelle di spin 1/2 vengono preparate in uno stato che è analogo a quello descritto nel paragrafo precedente, l'unica differenza sta nel fatto che i costituenti, che vengono prodotti in un processo di decadimento, sono associati a due pacchetti d'onda ben localizzati che si propagano in due versi opposti lungo una direzione che assumeremo coincidere con l'asse x di un sistema di coordinate (fig. 5.1 a, b). Per quanto concerne lo stato di spin i costituenti risultano entangled e sono descritti daHa funzione di singoletto (4.7) che sappiamo potersi scrivere ndla forma (4.8), n essendo un'arbitraria direzione. Indichiamo come t = 0 l'istante in cui i due frammenti vengono emessi e supponiamo che la particella che si propaga verso destra a partire dalla comune origine x = 0 sia Sz. Immaginiamo anche che lungo l'asse di propagazione, a destra, si trovi un apparecchio di misura designato a misurare la componente z dello spin di Sz. Un modo semplice per eseguire la misura consiste nel porre sul cammino della particeHa un magnete di Stern e Gerlach seguito da una coppia di rivelatori disposti sui due cammini che la particella seguirebbe se fosse, rispettivamente, associata a un autovettore dell'osservabile spin in su o spin in giù lungo l'asse z. Il fare attraversare alla particella la regione ove si trova il campo combinato con la rivelazione successiva della posizione della particella, costituisce appunto il processo di misura di cr,"'. Per semplicità supporremo (senza alcuna perdita di generalità) che sia possibile identificare la traiettoria su cui viene trovata la particella senza assorbire la particella stessa, vale a dire considereremo quella che si indica come "una misura ideale di prima specie" che porta a un esito preciso registrato da un opportuno apparecchio senza assorbire il sistema misurato, ma semplicemente proiettandone il vettore di stato sull'autovarietà corrispon-

446 4. I fondamenti concettuali eleimplicazioni epistemoligiche...

dente all'esito ottenuto." Gli autori del lavoro che stiamo analizzando argomentano nel seguente modo: 1) Prima che il sistema S2 raggiunga la regione D ove è sistemato l'apparecchio di misura, lo stato di spin del sistema complessivo risulta essere quello di singoletto: (

tIs(1,2)

S

P

(1)p(2) p ( 1) (2) z

z

r

z

)

(5.1)

che, essendo la sovrapposizione con pesi uguali dei due autostati dell'osservabile che verrà misurata, ci garantisce che la particella $2 non possiede alcuna proprietà oggettiva relativa all'osservabile in questione. Di fatto, se si risolve l'equazione di Schrodinger per la propagazione ddla parte spaziale (non esplicitamente indicata) dello stato (5.1), si vede facilmente che la funzione spaziale che descrive la posizione della particella di destra si trasforma nella sovrapposizione di una funzione; apprezzabilmente diversa da zero solo attorno a una traiettoria defiessa verso l'alto e di una defiessa verso il basso. Indichiamo come t t l'istante (che può rendersi ben de6nito) in cui il costituente S2 subisce il processo di misura. Sappiamo che la misura avrà certamente un esito, vale a dire o scatterà il contatore posto sulla traiettoria superiore oppure quello sulla traiettoria inferiore. Supponiamo che si verifichi il secondo caso. Allora" il vettore di stato viene ridotto istantaneamente al primo termine della (5.1) : (2)

misura di á''

tIs(1,2) S

esilo 1

(1) p(2) r

z

(5.2)

2) A questo punto EPR fanno ricorso all'ipotesi che abbiamo già discusso nel paragrafo 3.1, vale a dire formulano una ben precisa richiesta di realismo, o di oggettivismo, che indicheremo come R., e che si adatta bene alla natura fondamentalmente probabilistica ddla teoria: R.: «Se, senza disturbare in alcun modo un sistema è possibile prevedere con certezza (vale a dire con probabilità uguale a 1) il valore di una quantità fisica, allora esiste un elemento di realtà fisica che corrisponde a questa quantità», " Un dispositivo sperimentale che realizza una misura di questo tipo può risultare difficile da realizzare in pratica ma, come il lettore comprenderà facilmente, questa assunzione non risulta in alcun modo essenziale per l'argomento che segue. Esso può svilupparsi con riferimento a qualsiasi processo di misura che permetta di asserire, con un ragionevole grado di attendibilità: (o, corrispondentemente tutte le particelle S~ dell'insieme) ha di fatto la proprietà di avere una componente di spin definita lungo l'asse z in quanto non può essere stata la misura su Sz che l'ha prodotta. Ma lo stato che descrive il sistema prima della misura risulta isotropo, e quindi non privilegia in alcun modo la direzione z. In altre parole la descrizione formale non è in grado di rendere conto della situazione che precede il processo di misura. La conclusione è la stessa: la teoria è incompleta in quanto non è in grado di descrivere, non contiene neppure gli elementi matematici che possano rendere conto di uno stato di fatto che si è stati condotti a riconoscere come esistente. Prima di concludere questo paragrafo vorremmo menzionare che lo stato considerato da EPR nel loro lavoro non faceva riferimento alle variabili di spin ma a quelle di impulso e di posizione che erano al centro del dibattito sulle imphcazioni della teoria. Questo stato era scelto in modo tale che una misura di posizione su un costituente consentiva di inferire con certezza l'esito di una successiva misura di posizione sull'altro e quindi portava ad asserire che quest'ultimo doveva possedere oggettivamente una posizione definita anche prima della misura sul suo partner. Per di più, la specifica forma dello stato consentiva anche di prevedere in modo certo l'esito di una misura di impulso sul secondo costituente dalla conoscenza dell'esito di un'analoga misura eseguita sul primo. Di nuovo, se si assume che non possa essere la misura lontana a creare istantaneamente questa proprietà, si è condotti ad ammettere che il secondo costituente deve possedere, prima di ogni misura, un impulso preciso. Ma allora, a dispetto del fatto che non si possa realizzare un dispositivo sperimentale in grado di consentirci di determinare con precisione arbitraria posizione

450 4.Ifondamenti concettualie leimplicazioni epistem oligiche.. .

e impulso di una particella, dobbiamo ammettere che di fatto essa le possiede entrambe. La teoria non è in grado di rendere conto di questa situazione in termini deHa funzione d'onda, Ma in meccanica quantistica "non c'è altro che la funzione d'onda" per caratterizzare gli stati di un sistema fisico: conseguentemente, essa non può ritenersi completa.

5.2 Una prima valutazionedelle implicazioni del lavoro di EPR Prima di analizzare la reazione di Bohr al lavoro di Einstein e di mostrare come esso abbia innescato un processo critico di enorme portata concettuale ed epistemologica, riteniamo opportuno sottolineame alcune implicazioni immediate. Innanzi tutto esso mostra come, indipendentemente

dalla difficoltà o (addirittura) dall'impossibilità pratica di realizzare situazioni sperimentali in cui si possano determinare con precisione assoluta sia la posizione che la velocità di una particella, tuttavia, a meno di non rinunciare alla richiesta di località (un passo che nel 1935 quasi nessuno avrebbe osato fare) si deve accettare che una particella non solo possa, ma debba pensarsi possedere effettivamente ed oggettivamente valori precisi di entrambe queste variabili. Ovviamente questo implica una revisione deH'interpretazione e dd senso che veniva attribuito al principio di indeterminazione: esso avrebbe solo un significato pratico, relativo a qudlo che possiamo conoscere, ma non un significato fondamentale, relativo a

quello che è. Non solo, vale la pena di menzionare che l'argomento di EPR, anche indipendentemente dalla valutazione che se ne voglia dare ed anche se si accetta la posizione di Bohr e della scuola di Copenaghen che non lo ritiene conclusivo, segna almeno la fine di un grosso malinteso circa il principio di indeterminazione stesso, vale a dire la sua interpretazione "a disturbo" Si era infatti affermato ù punto di vista che l'indeterminazione dovesse ritenersi dovuta (a causa della finitezza del quanto di azione) aH'inevitabile e incontrollabile disturbo causato al sistema dal processo di misura. Poiché la costante di Planck non è nulla, risulta impossibile interagire con un sistema senza disturbarlo in modo incontrollabile, in quanto non può rendersi arbitrariamente piccolo, per esempio, lo scambio di energia tra apparecchio e sistema. Bene, anche i più rigidi sostenitori dell'ortodossia, non potevano, a fronte della prima parte deH'argomento di Einstein, negare che per sistemi opportunamente preparati (in particolare per sistemi associati a stati entangled) risultasse possibile dedurre con precisione arbitraria il valore di un'osservabile di un costituente daH'esito della misura di un altro costituente da esso arbitrariamente lontano e non

L'argomento di incompletezza di EPR 451

in interazione con esso. In queste condizioni è chiaro che nessuno si sarebbe sentito di sostenere l'interpretazione a disturbo del processo di misura. In secondo luogo EPR hanno per primi posto in piena luce le implicazioni ddla nonseparabilità nel caso generale, vale a dire la radicale dBerenza tra sistemi "elementari" (o, equivalentemente, tra sistemi composti in stati fattorizzati), e sistemi composti in stati entangled. I costituenti di questi ultimi vengono a perdere la loro individualità, nel senso che possono non possedere alcuna. proprietà oggettiva a dispetto del fatto che siano lontanissimi e non più in interazione. Ed ecco allora emergere chiaramente l'inevitabilità di considerare l'intero universo come un tutto indivisibile le cui parti non hanno alcuna "oggettiva esistenza": la fdicissima circostanza (Beli, 1990) di poter fare riferimento a sistemi isolati viene messa radicalmente in crisi." Infine, si impone un'ultima osservazione. L'acuta puntualizzazione del fatto che la teoria vada riconosciuta come incompleta, suggerisce in modo del tutto ovvio che risulti rilevante interrogarsi circa la possibilità di completarla. Il lavoro di EPR si conclude con la frase estremamente significativa: «Mentre abbiamo mostrato che la funzione d'onda non fornisce una descrizione completa della realtà fisica, abbiamo lasciato aperta la questione se una descrizione siffatta esista o no. Tuttavia noi crediamo che una teoria di questo genere risulti possibile». Non stupirà quindi che Einstein insista su questo punto cruciale: «Se si suppone che gli sforzi per elaborare una descrizione fisica completa abbiano successo, la teoria quantistica verrebbe ad assumere, nello schema della fisica del futuro, una posizione approssimativamente analoga a quella della meccanica statistica ndlo schema della fisica classica. Io sono fermamente convinto che lo sviluppo della fisica sarà di questo tipo; ma il cammino sarà lungo e difficile». E ancora: «Io sono di fatto fermamente convinto che il carattere essenzialmente statistico della teoria quantistica contemporanea è esclusivamente da ascriversi al fatto che questa teoria opera con una descrizione incompleta dei sistemi fisici». Al di là della questione (che secondo noi trova la sua origine nelle inappropriate osservazioni di Max Jammer circa alcune asserzioni di Beli (Beli, 1976)) se Einstein possa o meno considerarsi come colui che ha suggerito l'idea delle teorie a variabili nascoste " Non vorremmo essere fraintesi. È chiaro che anche in fisica classica la considerazione di sistemi "perfettamente isolati" rappresenta un'idealizzazione e non corrisponde ad alcuna )ituazione reale, ma, come appropriatamente segnalato da Beli, essa costituisce un'idealizzazione che risulta tanto migliore quanto più i sistemi sono lontani e che comunque può essere analizzata e, almeno in linea di principio, valutata. Nel caso quantistico l'entanglement non varia in alcun modo con la distanza e con il diminuire delle interazioni tra i costituenti,

452 4.Ifondamenti concettualie leimplicazioniepistem oligiche.. .

(cioè di cercare di elaborare un completamento deterministico della meccanica quantistica), non si può certo negare che la sua analisi ha richiamato con forza l'attenzione su un tema che si rivelerà ricco di importanti sviluppi concettuali.

$.3 La reazione di Bohr L'argomento di EPR aveva in sé una forza dirompente per la sua semplicità e per le ragionevoli ipotesi su cui si basava. Non stupirà quindi che esso abbia rappresentato per Bohr un'impegnativa sfida. La sua risposta venne pubblicata cinque mesi dopo sulla stessa rivista, "The Physical Review" e con lo stesso identico titolo, "La descrizione quantistica ddla realtà fisica può ritenersi completa? n dell'articolo di EPR. Conviene innanzi tutto rivivere quei momenti ndle parole di uno dei testimoni di quel processo, vale a dire Léon Rosenfdd: «Questo attacco feroce ci colpi come un fulmine a ciel sereno. Il suo effetto su Bohr fu enorme... Una nuova difficoltà non poteva presentarsi in un momento meno propizio. Tuttavia, non appena Bohr ascoltò la mia relazione sull'argomento di Einstein, abbandonò ogni altro problema... Eccitatissimo, Bohr iniziò immediatamente a dettarmi lo schema... di una risposta.Quasi subito, tuttavia, egli si fece esitante: "No, questo non basta, dobbiamo tentare tutto da capo... dobbiamo essere assolutamente chiari..." Continuò cosi per un certo tempo, mentre aumentava in lui la meraviglia per l'insospettata acutezza ddl'argomento... Il mattino seguente egli riprese improvvisamente a dettare, e io fui colpito dal cambiamento nel tono ddle frasi: in esse non vi era più alcuna traccia del netto dissenso del giorno precedente. Alla mia osservazione che egli sembrava aver assunto una posizione più conciliante egli sorrise: "Questo è un segno — disse — che stiamo cominciando a capire

il problema"». Malgrado questa ottimistica dichiarazione e malgrado il fatto che la maggior parte della comunità scientifica del tempo e dei fisici teorici 6no a tempi recenti abbiano dato per scontato che ancora una volta Bohr aveva vinto il suo scontro con Einstein, va ammesso apertamente che la risposta di Bohr risulta notevolmente oscura e non può certo venire considerata una conclusiva refutazione dell'argomento di EPR. Grandi scienziati, tra i quali vanno annoverati lo stesso Einstein, Beli e tanti altri, hanno dichiarato esplicitamente di non essere stati in grado di cogliere il significato della posizione di Bohr sul problema in esame. Anziché limitarci a riportare l'opinione di questi maestri possiamo renderci conto direttamente del fatto che la risposta di Bohr non risulta incisiva e non consente neppure di

L'argomento di incompleteua di EPR 453

cogliere quali fossero precisamente i punti e le ragioni per cui egli dissentiva da EPR. A questo fine consideriamo il passaggio dd suo articolo che Bohr stesso riteneva conclusivo. Infatti egli riprenderà questo passaggio alla lettera quando, parecchi anni dopo (cioè nel 1949) riassumerà, per il già citato volume Albert Einstein, scienziato-filosofo curato da Schilpp in occasione del 70' compleanno di Einstein, le vicende del suo confronto/ scontro con Einstein. Bohr reagisce aH'assunzione R. di EPR dicendo: «...L'enunciato del criterio in questione risulta ambiguo per quanto concerne l'espressione "senza disturbare in alcun modo il sistema". Naturalmente, nel caso in esame, non può in alcun modo invocarsi un disturbo meccanico del sistema neH'ultimo stadio cruciale del processo di misura. Ma anche a questo stadio emerge in modo essenziale il problema di un'in fluenza sulle precise condizioni che definiscono i possibili tipi di predizioni che riguardano il comportamento successivo del sistema... il loro argomentare non giustifica la loro conclusione che la descrizione quantistica risulti essenzialmente incompleta... Questa descrizione può caratterizzarsi come una utilizzazione razionale di tutte le possibilità di un'interpretazione non ambigua del processo di misura compatibile con l'interazione finita e incontrollabile tra l'oggetto e lo strumento di misura nel contesto della teoria quantistlccp>.

Mi sembra superfluo sottolineare l'oscurità di questo passaggio. Esso contiene una serie di punti che, come ha lucidamente puntualizzato BeH, risultano del tutto incomprensibili. Quale senso preciso può infatti attribuirsi alla specificazione "meccanico" che viene usata con riferimento a quei "disturbi" che Bohr stesso ritiene non vadano presi in conto? Come può leggersi, nel passaggio che Bohr stesso ha voluto sottolineare facendo ricorso al corsivo, l'espressione aun'influenza suHe condizioni precise..." se non nel senso che diverse misure su Sz forniscono informazioni diverse sul sistema $>? Questo fatto non solo è ammesso apertamente, ma costituisce uno dei punti di forza deH'argomento di EPR. E infine, come osserva. BeH, che cosa può significare l'espressione "interazione incontrollabile tra l'oggetto e l'apparecchio di misura", se si tiene presente che il punto centrale deH'argomento di EPR consiste neH'ipotesi che, se si accetta la località, solo il sistema Sz può venire disturbato dal processo di misura e,

ciononostante, questo processo fornisce informazioni precise sul sistema $,? Bohr sta forse contemplando la possibilità" di azioni istantanee a distanza? È ovvio che se si abbandona l'assunzione L.E. l'intero argomen-

" Inutile sottolineare che dalla sue stesse asserzioni si direbbe proprio di no.

454 4. l fondamenti concettuali e leimplicazioni epistemoligiche...

to di EPR crolla, ma se questo fosse il vero signi6cato della critica di Bohr, perché non dichiararlo esplicitamente?" Personalmente ritengo che Bohr, da un lato, non abbia saputo cogliere

appieno le sottili implicazioni dell'argomento di Einstein" che chiamavano in causa insospettati aspetti del reale quale appunto la nonlocalità, dall'altro, non sia riuscito a identificare (e di fatto non avrebbe potuto) argomenti conclusivi da contrapporre a Einstein. Sembra quasi che egli si sia lasciato guidare (e se ne ritrova una traccia nell'oscura frase analizzata sopra) unicamente dalla sua idea circa la complementarità degli aspetti del reale, che poteva venire usata per sottolineare come anche l'indiretto e ingegnoso modo ideato da Einstein per ottenere informazioni sul sistema Si, richieda, qualora si tratti di informazioni su osservabili incompatibili

(quali la posizione e l'impulso nell'argomento originale di EPR o componenti di spin lungo direzioni diverse nella nostra versione) di fare ricorso a procedimenti in D che non possono coesistere. In particolare, la specifica disposizione sperimentale in questa regione che fornisce informazioni sulla posizione del costituente St è incompatibile con quella che consentirebbe di acquisire informazioni sull'impulso di S,. Questa osservazione è certamente di grande rilievo e perfettamente corretta e, secondo noi, ha

ispirato a Bohr l'oscura espressione «un'influenza sulle condizioni precise che definiscono i possibili tipi di predizioni che riguardano il comportamento successivo del sistema». Ma, per quanto corretta, questa osservazione risulta assolutamente inappropriata per ribattere l'argomento di EPR. Questi autori avevano perfettamente chiaro che le scelte di eseguire una misura di posizione oppure una di impulso risultano incompatibili e mutuamente esclusive, ma nulla, nel loro argomento, richiede che esse possano di fatto venire eseguite assieme sullo stesso sistema.

5.4 Alcuni kaintendimenti deH'argomento di incompletezza Abbiamo già menzionato come la comunità scientifica si sia immediatamente convinta (alquanto acriticamente) che Bohr col suo articolo aveva, " Tra l'altro, come vedremo, la ragione per cui l'argomento di Einstein risulterà non condusivo deriva proptio dal fatto che le correlazioni quantistiche di per sé, vale a dire indipendentemente da qualsiasi concepibile interpretazione, implicano la nonlocalità dei processi naturali. Ma occorreranno molti anni e il geniale contributo di Beli affinché la comunità scientifica colga questo rivoluzionario punto che tratteremo dettagliatamente nel seguito. " Questa non vuoi essere una critica a questo profondo pensatore, a questo vero e proprio gigante della fisica. Di fatto vedremo tra poco come il livello di incomprensione dell'argomento di EPR da parte di grandissimi fisici ed epistemologi di quegli anni e dei successivi (da Bom a Pais a Popper), tisulta notevolmente superiore a quello di Bohr.

Largomento diincompletezza di EPR 455

ancora una volta, sconfftto Einstein. Di fatto, come già menzionato, una gran parte degli scienziati di quel periodo e degli anni successivi non hanno saputo cogliere né il senso della critica einsteniana né quello della riposta di Bohr, e ciononostante hanno proclamato Bohr vincitore. La situazione risulta ancora più articolata e richiede ulteriori commenti. Non solo l'analisi di EPR non è stata valutata correttamente ma essa è stata spesso fraintesa e utilizzata per derivarne conclusioni insensate. Per un testo come questo che si propone soprattutto di portare il lettore a comprendere le sottili e rilevanti implicazioni concettuali della teoria quantistica, l'analisi di siffatti fraintendimenti e l'identificazione dei loro punti deboli si impone per ragioni di completezza e anche perché può risultare utile per permettere una più approfondita comprensione dei punti cruciali di questa fondamentale problematica. Cominciamo con uno dei grandi protagonisti di quegli anni, Max Born. Questo profondo pensatore incontrò particolari difficoltà nel cogliere il reale significato dell'argomento di EPR. Alcuni anni dopo, allorché pubblicò la sua corrispondenza con Einstein, egli espresse il suopunto di vista nei seguenti terme: «La radice delle differenze tra Einstein e me era l'assioma che eventi che si verificano in posti diversi A e B sono indipendenti uno dall'altro, nel senso che un'osservazione circa la situazione in B non ci può dire nulla circa la situazione in A». Sarebbe difficile configurare un più radicale malinteso. Einstein non aveva alcuna difficoltà ad ammettere che eventi lontani possano presentare strette correlazioni e quindi che l'informazione ottenuta in una regione possa fornire una più precisa conoscenza dello stato delle cose altrove; quello che egli negava era che un'azione eseguita in una regione potesse influenzare istantaneamente la situazione fisica in un'altra regione. Questo punto merita un commento specifico. Vari autori, che non starò a elencare, hanno asserito che l'argomento di Einstein non dà origine ad alcuna di6coltà in quanto risulta ben noto, anche a livello classico, che l'acquisizione di informazione su una parte di un sistema può benissimo comportare un aumento di informazione circa tutto il sistema e quindi in particolare su altre sue parti, non importa quanto lontane. Per illustrare questo punto si è fatto spesso riferimento al seguente esempio. Si abbiano due scatole e si sappia che esse contengono la prima una pallina bianca e l'altra una pallina nera, ma non si sappia quale scatola contiene la pallina di un certo colore. Si prendano queste scatole e si allontanino arbitrariamente una dall'altra portandole, diciamo, agli estremi opposti della nostra galassia. Un osservatore prima di accertare il colore della pallina della scatola vicina a lui può solo asserire che essa ha probabilità 1/2 di essere bianca. A questo punto egli apre la scatola e trova, per esempio, che essa risul-

456 4.Ifondamenti concettualie leim plicazioni epirtem olig iche...

ta effettivamente bianca. A causa deHa correlazione (colori opposti delle

due palline) egli può immediatamente inferire che la pallina all'altro estremo della galassia risulta sicuramente nera. Come già menzionato, secondo alcuni autori la situazione considerata da EPR non presenterebbe alcuna differenza con quella ora analizzata e coinvolgerebbe quindi solo un aumento "locale" di informazione che tuttavia comporta un aumento di informazione relativa anche a parti lontane del sistema. Penso che tutti i lettori attenti avranno già capito quanto fuorviante ed errata risulti questa sottovalutazione dell'argomento di EPR. Il punto cruciale della loro analisi non riguarda in alcun modo il fatto che l'acquisire informazioni localmente possa fornire conoscenza circa situazioni lontane; non è questo che li disturba, come erroneamente pensava Bom. Il punto concettualmente cruciale dell'analisi di EPR sta nel fatto che mentre nel caso classico non v'è alcuna contraddizione (ma anzi risulta corretto ed appropriato) asserire che, anche se in modo non conosciuto, "la pallina lontana era nera anche prima e del tutto indipendentemente dall'osservazione del colore dell'altra", secondo la meccanica quantistica e con riferimento allo stato entangled, questa asserzione risulta assolutamente illegittima. Ancora di più: una siffatta asserzione può venire facilmente falsificata in laboratorio.'4 Questa ingenua lettura dell'argomento di EPR è stata criticata con sottile humour da Beli che a questo scopo ha immaginato (Beli, 1981) il singo-

lare caso delle calze del Dott. Bertlmann (fig. 5.2). Come dice Beli: eI1 filosofo della strada, che non ha seguito un corso di meccanica quantistica, non resta molto impressionato dalle correlazioni di EPE Egli può facilmente menzionare moln esempi simili nella vita quotidiana. Spesso si fa riferimento al caso delle calze del Dott. Bertlmann. Il Dott. Bertlmann" ama portare sempre due calze di colori differenti. Risulta del tutto imprevedibile quale colore avrà la calza di un suo piede in un dato giorno. Ma quando voi vedete (fig. 5.2) che la prima calza è rosa, voi potete essere " Infatti, come il lettore può capire facilmente usando le regole quantomeccaniche, per rendere conto all'interno dello schema quantistico delle perfette correlazioni tra gli esiti delle misure ai due estremi dell'apparato, si dovrebbe supporre che, prima della misura, si stesse trattando con un insieme quantisticamente disomogeneo che risulta l'unione con pesi uguali di due sottoinsiemi associati agli stati fattorizzau a,a'P,a' e P,'"ct,a'. Ma una siffatta miscela statistica, come ben sappiamo, attribuisce probabilità 1/2 di ottenere risposte concordi (vale a dire due esiti uguali a + 1 oppure due esiti eguali a — 1) in una misura delle componenti di spin dei costituenti lungo l'asse y, mentre lo stato di singoletto ci assicura che non si possono mai dare esiti concordi in un siffatto processo di misura. " Potrà interessare il lettore sapere che il Dott. Bertlmann non è una creazione della fantasia di Beli, ma un Bsico realmente esistente. Quello che l'immaginazione di Beli ha inventato è la sua irresistibile tendenza a indossare calze di colore differente. Di fatto egli ha dichiarato che dopo la pubblicazione dell'articolo di Beli, ogni volta che viene presentato a un fisico che lavora nel campo dei fondamenti della meccanica quantistica, questo cerca, senza dare troppo nell'occhio, di sbirciare le sue calze.

L'argomentodiincompletezza diEPR 457 immediatamente sicuri che la seconda calza non sarà rosa. L'osservazione della prima calza e la conoscenza delle abitudini del Dott. Bertlmann, forniscono una informazione immediata sulla seconda. Ma l'affare di EPR non è esattamente analogo a questo?». Dopo questo esordio Beli espone in dettaglio la situazione del gedanken experirnent di questi autori. E conclude: «Adesso risulterà più facilmente comprensibile perché il lavoro di EPR ha dato origine a tante dispute ed ha sollevato un polverone che non si è ancora dissipato. È come se noi fossimo stati condotti a negare la realtà delle calze del Dott. Bertlmann, o almeno del loro colore, quando non sono osservate, E se un bimbo chiedesse: come è possibile che esse scelgano sempre colori diversi quando vengono osservate? Come può la seconda calza sapere cosa ha fatto la prima? Paradosso davvero! Ma per gli altri, non per EPR, EPR non usarono mai la parola "paradosso". Circa questo punto essi erano dalla patte dell'uomo della strada. Per loro queste correlazioni mostravano semplicemente che i teorici quantistici erano stati precipitosi nel negare la realtà del mondo microscopico. In particolare Jordan aveva commesso un serio errore nell'assumere che nulla fosse reale o determinato in quel mondo prima del processo di osservazione».

Le calze del Signor Bertlmann e la natura

Il[p; y! t

della realtà Fondazjone Hugot

17 giugno 1980

Non Rosa fig. 5.2 Il divertente esempio ideato da Beli per configurare una situazione perfettamente analoga a quella descritta sopra con riferimento alle due palline di diverso colore, e per ironizzare su coloro che adottano una posizione cosi ingenua circa l'argomento di EPR.

Le considerazioni appena svolte ci consentono di puntualizzare un fraintendimento di questo tipo da parte di un grande filosofo deHa scienza, Sir Karl R. Popper. A pagina 137 del libro La teoria quantistica e lo scisrna nella fisica, che raccoglie vati suoi scritti, egli presenta le sue critiche

458 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

all'interpretazione ortodossa della teoria e attacca, in particolare, la posizione tradizionale circa la riduzione dd pacchetto asserendo: «Senza dubbio la riduzione del pacchetto può verificarsi molto rapidamente; persino

a velocità superluminale (cioè maggiore di quella della luce), come ho spiegato nella sezione 75 della Logica della Scoperta Scientifica; perché esso semplicemente non è un evento fisico — è il risultato della libera scelta di nuove condizioni iniziali». Si noti come questa frase, con l'esplicita asserzione che la riduzione del pacchetto non è un evento fisico, suggeri-

sca una posizione del tipo di queHa dell'esempio ddle scatole o delle calze. Come queste nuove condizioni iniziali, definite da un'azione che ha luogo a destra possano, per usare il linguaggio caro a Popper, rendere immediatamente attuali alcune e non altre delle potenzialità presenti a sinistra, non sembra interessarlo. Parecchi anni dopo nello stendere la Prefazione al libro in oggetto Popper cade in un fraintendimento opposto e altrettanto grave circa una situazione alla EPR. In questa occasione, contrariamente al caso precedente, si tratta di un'indebita sopravvalutazione della loro analisi. Difatti a pag. 27 dei libro di cui stiamo parlando, questo autore propone un esperimento che costituisce una variante di queùo di EPR e asserisce che selinterpretazione di Copenaghen risulta corretta, allora l'esperimento da lui analizzato permetterebbe di inviare segnali superluminali. Questo lavoro è uno di una lunga serie che dimostreremo errati nd prossimo paragrafo nei quali si sostiene che il formalismo quantistico consentirebbe di utilizzare il fenomeno della riduzione del pacchetto per esercitare azioni fisiche istantanee a distanza. A dispetto della peculiarità della situazione analizzata da EPR questa conclusione è fondamentalmente falsa e nasce solo da un uso non corretto del formalismo quantistico. Veniamo ora all'ultimo esempio di un serio fraintendimento del senso e

dell'importanza della proposta di EPR. Nel 1982 appare un libro che rappresenta una delle più belle, più complete e più serie biografie che siano mai state scritte: Sottile è il Signore, dd grande fisico Abraham Pais. In esso l'autore analizza l'intera vita di Einstein fornendo al lettore dettagliate e documentate informazioni di carattere biografico e presentando in modo lucido, brillante ed esauriente la sconfinata produzione scientifica di Einstein stesso. Il libro è sicuramente un'opera di estremo pregio, di notevole interesse e rappresenta una fonte inesauribile di notizie preziose. L'unica parte del libro che, a nostro parere, risulta notevolmente carente è quella in cui l'autore espone la posizione di Einstein nei confronti della meccanica quantistica. Essa contiene numerose inesattezze e rivela un pregiudizio, originato dall'incondizionata adesione ddl'autore all'ortodossia di Copenaghen, che non gli consente di cogliere le sottili sfumature e la

L'argomento di incompletezza di EPR 459

rilevanza di molte osservazioni di Einstein. Per quanto riguarda il tema di questo paragrafo non posso esimermi dal segnalare l'opinione di Pais circa la proposta di EPR. Secondo l'autore l'interesse del lavoro di EPR sta tutto ed esclusivamente nel fatto che esso contiene due frasi che permettono di comprendere (quella che Pais ritiene sia) la vera posizione di Einstein. Lasciatemi usare direttamente le parole deU'autore: «Secondo me, l'unica parte dell'articolo (di EPR) destinata a sopravvivere è questa frase, che cosi acutamente riassume il punto di vista di Einstein, nei suoi ultimi anni, sulla meccanica quantistica. Si è a volte parlato del contenuto dell'articolo come del paradosso di Einstein, Podolsky e Rosen. Andrebbe sottolineato che questa memoria non mette in evidenza né paradossi né difetti logici. Semplicemente essa conclude che il concetto di realtà oggettiva è incompatibile con l'ipotesi che la meccanica quantistica sia completa». Fino a questo punto le opinioni dell'autore risultano puntuali e corrette. Ma la conclusione, ndla frase seguente, contiene un giudizio molto pesante che, se si considera in che anno il libro fu scritto e gli sviluppi cui l'analisi di EPR ha dato origine che analizzeremo nel seguito, risulta sorprendente per qualsiasi ricercatore che abbia un minimo di competenza nel campo: «Tale conclusione non ha inciso sugli sviluppi successivi della

fisica ed è dubbio che lo farà mai». L'analisi di qudlo che accadrà negli anni cinquanta con l'opera di Bohm e negli anni sessanta con l'opera di Beli consentirà facilmente al lettore di capire come Pais non abbia saputo cogliere la ricchezza, la profondità e la fertilità ddl'acuta analisi di EPR, il germe che ha portato a un salto qualitativo nella comprensione delle implicazioni del formalismo e della realtà fisica.

5.5 La violazione della località einsteiniana comporta la possibilità di segnali o effetti superluminali? Come menzionato sopra, sono apparse ripetutamente e continuano ad apparire nella letteratura scientifica proposte di utilizzare le caratteristiche straordinarie del processo di riduzione del pacchetto per inviare segnali superluminali. Inutile dire che se tali proposte risultassero logicamente corrette e sperimentalmente verificate esse segnerebbero la fine della teoria della relatività. Affronteremo ora questo problema fornendo una dimostrazione completamente generale (Ghirardi, Rimini e Weber, 1980)

dell'impossibilità di simili effetti, A questo scopo consideriamo il solito sistema composto Sr + Sq e supponiamo, del tutto in generale, di avere un insieme statistico di sistemi siffatti descritto dall'operatore statistico k""'. Supponiamo anche di essere

460 4. I fondamenti concettuals' e le implicazioni epistemoligiche...

interessati agh esiti di processi di misura che coinvolgono esclusivamente il sistema $>. Come abbiamo visto nel paragrafo 4.5., tutte le implicazioni 6siche per il sistema in questione si possono dedurre dall'operatore statistico ridotto k'"' ottenuto prendendo la traccia parziale di tk"'a' sullo spazio di Hilbert del sistema Sz.. o )p(ng()). y ( ) t ()g ( , ) g() (5.>) Nell'equazione (53) gli apici si riferiscono, come ampiamente discusso nel paragrafo 4, ai due spazi di Hilbert )4 t e gz associati, rispettivamente ai costituenti $> e Sz di S. Prima di procedere dobbiamo ricordare che, come discusso nel paragrafo 2.15, del tutto in generale (vale a dire sia per sistemi semplici che composti), se si assoggetta un sistema a una misura non selettiva di un'osservabile e si indica come (P,) la famiglia dei proiettori sulle autovarietà dell'operatore (che per semplicità supporremo avere uno spettro puramente discreto) a essa associato, l'effetto della misura (si veda l'equazione 2.72) è queUo di trasformare l'operatore statistico k~, , associato al sistema (o all'insieme di sistemi) prima della misura nell'operatore statistico p che ha la seguente forma: l'„;,„, m k g...

(s.4)

=g Pkp„,P,

Fatte queste considerazioni possiamo tornare al nostro problema. Supponiamo quindi di sottoporre il sistema Sz a un processo di misura di un'osservabile B"' per la quale l'operatore autoaggiunto 8'"' che la rappresenta abbia uno spettro puramente discreto. Siano bk i suoi autovalori e Pk"' gli operatori di proiezione sulle corrispondenti autovarietà. Si noti che questi operatori agiscono solo nello spazio di Hilbert PI< del secondo sistema, per cui, a rigore, andrebbero più appropriatamente indicati come X"' ® Pk"'.L'effetto ddla misura comporterà, in accordo con la (5.4), il seguente cambiamento dell'operatore statistico k'"" associato al sistema: y 0,>) ~n y ¹ g)

0 , 2) ~ ~

p (2 ) g 0 ,2)p(2) k k

(5,5)

k

Analizziamo ora le implicazioni fisiche per il sistema $> del nuovo stato di cose, vale a dire del fatto che il sistema composto sia descritto dall'operatore /u'"'a' anziché da quello l'"" , che lo caratterizzerebbe se la misura non fosse stata eseguita. Come già sottolineato sopra, tutte le informazioni sul sistema $> sono esaurientemente sintetizzate dall'operatore statistico ridotto k""' ottenuto prendendo la traccia parziale sullo spazio Pz dell'operatore statistico del sistema composto:

g¹ (0

( ~)p¹ (~ ~~ ~~~ < p(~~g 0~~~PQ~l— ~ tr~~~[p~~~g 0'~~p~~~] (5.(>) k

L'argomento di incompletezza di EPR 461

Nell'ultimo passaggio dell'equazione precedente si è fatto uso del fatto che l'operazione di traccia, essendo lineare, può portarsi sotto il segno di somma. Riscriviamo i termini dell'ultima espressione a destra come tr"'[(Pk"'k'"" }Pk"'] e ricordiamo la proprietà di ciclicità della traccia enunciata nel paragrafo 2,9, vale a dire che la traccia del prodotto di un operatore di classe traccia per uno limitato è indipendente dall'ordine dei fattori, Di fatto nel paragrafo menzionato, questa proprietà si riferiva alla traccia su tutto lo spazio di Hilbert nel quale operano gli operatori che appaiono sotto il segno di traccia stessa. Tuttavia, risulta semplice dimostrare che la stessa proprietà vale allorché la traccia sia di fatto una traccia parziale, se l'operatore che si intende spostare da destra a sinistra agisce solo nello spazio su cui si prende la traccia. Si ha quindi:

g¹ (1) ~

(2)[p(2)p(2)g (1,2)] k

t (2) [(Q ~

k

~ ~

(2)[p(2)g (1,2) k

P( 2))g (1,2) ]

k

] (5.7)

k k

ove si è tenuto conto che gli operatori Pk"', essendo proiettori sono idempotenti, vale a dire coincidono col loro quadrato. Non resta ora altro da fare che ricordare la proprietà fondamentale della famiglia dei proiettori sulle autovarietà di un operatore autoaggiunto di avere per somma l'operatore identità. Nell'ultima espressione a destra della (5.7) si può quindi lasciar cadere il fattore tra parentesi tonde ottenendo: )

t ()(g(, )]

g (

(5.8)

L'equazione (5.8) esprime una proprietà di grande rilevanza fisica, e precisamente quella che ci garantisce che l'istantanea riduzione del pacchetto a distanza non consente alcun effetto superluminale. Infatti l'equazione mostra che l'operatore statistico H"" che si deve usare per valutare la probabilità di qualsiasi evento fisico che riguarda il solo sistema $1 nel caso in cui il costituente S2 dd sistema composto S = $1 + S2 sia stato assoggettato a un processo di misura coincide identicamente con l'operatore statistico tu'"' dell'equazione (5.3) che andrebbe utilizzato per la descrizione della fisica del sottosistema $1 nel caso in cui l'operatore statistico associato a S = S1 + $2 fosse quello, tu'"~', che descrive il sistema prima che qualsiasi misura abbia luogo su $2. Il teorema appena dimostrato è stato generalizzato recentemente (Ghirardi, Grassi Rimini e Weber, 1988) a coprire anche il caso di misure non ideali sul sistema $2, e all'evoluzione unitaria che Sz può subire come conseguenza di interazioni con altri sistemi che non interagiscono con $1. La conclusione generale di questa analisi è stata espressa con grande efficacia da Abner Shimony, il quale, con esplicito riferimento all'emerge-

462 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

re istantaneo di elementi di realtà per effetto di azioni eseguite su parti arbitrariamente lontane di un sistema composto senza che tuttavia essi possano venire utilizzati per trasmettere alcuna informazione o esercitare

effetti fisici rùevabili, ha coniato (Shimony, 1993) la felicissima espressione passion at-a-distctnce da contrapporre a quella action at-a-distance che andrebbe usata per caratterizzare influenze fisiche istantanee di un sistema su un altro da lui separato. La condusione che Shimony trae dalla sua analisi per quanto concerne lo status concettuale del problema è particolarmente illuminante: egli afferma che, malgrado le caratteristiche nonlocali del formalismo (che discuteremo dettagliatamente in uno dei prossimi capitoli), si ha una coesistenza pacifica della meccanica quantistica con la teoria della relatività. Sul piano fisico la conclusione che ci interessa è che, a dispetto ddle loro stupefacenti caratteristiche, né il fenomeno dell'entanglement né il postulato Rid. P. consentono di utilizzare le strette correlazioni tra gli esiti di misure sui costituenti di sistemi composti per comunicare a velocità superiore a quella della luce o per indurre istantaneamente cambiamenti fisici rilevabili su un sistema agendo su sistemi lontani da lui. Abbiamo voluto dedicare alcune pagine a un'esauriente disamina del problema delle implicazioni della natura istantanea del processo di riduzione del pacchetto d'onde per cancellare, esibendo un teorema semplice ma generale, qualsiasi dubbio circa il fatto che questo stato di cose consenta di violare i principi che stanno alla base della teoria della relatività. Per lo specifico caso in esame, vale a dire quello di due particelle nello stato di singoletto, avremmo potuto fare ricorso a un osservazione tanto semplice da risultare addirittura banale. Si supponga infatti che un osservatore O, decida di eseguire misure di componenti di spin lungo una direzione arbitraria. Cosa accadrà? La teoria ci assicura che esistono uguali probabilità che egli ottenga l'esito "spin in su" e l'esito opposto e per di più che queste probabilità sono fondamentalmente nonepistemiche. La ripetizione dell'esperimento un devato numero di volte fornirà quindi all'osservatore Ot una lunga stringa di "in su" e "in giù" con frequenze quasi coincidenti e distribuite in modo genuinamente casuale. Supponiamo ora che, prima ddl'osservatore in esame, un altro osservatore Oz abbia eseguito le stesse misure di spin sull'altro costituente del sistema composto. Cosa sarebbe accaduto? Egli avrebbe ottenuto una stringa di "in su" e "in giù" con le stesse caratteristiche, vale a dire con frequenze quasi uguali e distribuite del tutto a caso. L'aspetto sbalorditivo del processo consiste nel fatto che anche se le due misure avvengono a intervalli cosi ravvicinati che, data la separazione spaziale tra i due osservatori, non

c'è il tempo affinché un segnale alla velocità della luce (e quindi una qual-

L'argomento di incompletezza di EPR 463

che azione fisica) si propaghi da uno all'altro, se successivamente essi confrontano i loro esiti essi trovano che le loro successioni casuali sono perfettamente anticorrelate: a ogni "in su" di Oz corrisponde inevitabilmente un "in giù" di O> e viceversa. Ma poiché, per ciascuno di essi, la successione ha le stesse caratteristiche di casualità sopra menzionate sia che l'altro abbia o non abbia eseguito le misure, essi non possono accorgersi del fatto che le misure abbiano avuto luogo. Ancora una volta Shimony ha saputo caratterizzare efficacemente questo stato di cose: il processo esibisce aspetti nonlocali, ma è precisamente il fatto che il primo osservatore non possa controllare in alcun modo gli esiti delle sue misure (esse risultano genuinamente nonepistemiche) che non gli consente di utilizzare la nonlocalità per inviare segnali al compagno. Abbiamo cosi concluso questo paragrafo. In esso abbiamo segnalato come EPR siano stati condotti a concludere che il formalismo quantistico risulta fondamentalmente incompleto. Sorge allora spontanea la domanda che affronteremo nel prossimo paragrafo: risulta forse possibile completarlo?

6. Le variabili nascoste

Se si accetta la conclusione del lavoro di EPR che la descrizione quantistica dei sistemi fisici risulta fondamentalmente incompleta in quanto la funzione d'onda non contiene la controparte formale di elementi di realtà fisica che vanno riconosciuti come oggettivamente posseduti da sistemi fisici individuali, non risulta possibile eludere il problema che essi sollevano a conclusione del loro lavoro: «Mentre abbiamo mostrato che la funzione

d'onda non fornisce una descrizione completa della realtà fisica, abbiamo lasciata aperta la questione se una descrizione siffatta esista o no». Questa domanda ha stimolato un dibattito di grande rilievo sul piano concettuale, che, dopo alterne vicende, ha portato a riconoscere che un completamento deterministico della teoria è effettivamente possibile (e quindi che le probabilità quantistiche possono interpretarsi in senso epistemico) ma ha anche messo in luce che qualsiasi approccio di questo tipo implica che alcune proprietà fisiche di un sistema risultano inevitabilmente contestuali (un aspetto che analizzeremo in dettaglio più avanti). Inoltre questo processo ha condotto, alla fine, a identificare molto più lucidamente, grazie al

brillante lavoro (BeH, 1964) di Beli e agli splendidi esperimenti (Aspect et al., 1982) di Alain Aspect e collaboratori, le caratteristiche fondamentalmente nonlocali delle leggi naturali. Anche per coloro che sono specificamente interessati al problema dello sviluppo delle idee scientifiche la storia delle teorie a variabili nascoste risulta di grande interesse. Infatti essa illustra in modo esemplare come l'adesione a posizioni scientifiche "dominanti" possa seriamente ritardare lo sviluppo della scienza stessa. La vicenda del teorema di impossibilità di von Neumann (von Neumann, 1932) e della sua accettazione acritica da parte della comunità scientifica ha avuto come effetto immediato quello di scoraggiare questo tipo di ricerche e ha condotto all'emarginazione dei ricercatori che cercavano di esplorare nuove vie per la descrizione dei processi naturali,

6.1 L'idea delle variabili nascoste Prima di illustrare l'idea che sta alla base delle cosiddette teorie a variabili nascoste è opportuno precisare che per i pionieri di questa linea di ricerca

Le variabil inascoste 465

il completamento della teoria doveva risultare strettamente deterministico. Il programma consisteva quindi nel cercare di identificare opportune variabili (che possono aggiungersi o addirittura sostituire la funzione d'onda), la conoscenza delle quali determina in modo preciso il valore di tutte le osservabili di un sistema 6sico individuale." Naturalmente, questo valore non può risultare qualsiasi ma deve coincidere con uno di quelli consentiti dal formalismo per l'osservabile in questione vale a dire rispettare il fatto che le grandezze fisiche risultano, in generale, quantizzate. Passiamo a descrivere in modo formale come si configura una teoria di questo genere. Riassumiamo, per semplicità, nel simbolo iL tutte le variabili nascoste includendo tra esse, qualora richiesto dalla struttura formale della specifica teoria in esame, anche la funzione d'onda del sistema. Si consideri quindi una generica osservabile A del sistema fisico in oggetto: assegnate le variabili nascoste iL, siffatta osservabile avrà un valore preciso che indicheremo come A(i1) il quale deve appartenere allo spettro dell'operatore autoaggiunto che la teoria standard associa ad A. Che relazioni esistono tra le quantità ora menzionate, vale a dire i precisi valori A(iL), e le probabilità che la meccanica quantistica attribuisce agli esiti di una misura dell'osservabile in oggetto? La risposta risulta semplice e naturale. Come sappiamo, tutto il contenuto fisico della meccanica quantistica può riassumersi neU'assegnazione dei valori medi delle osservabili." Si assume pertanto che le variabili nascoste risultino distribuite secondo una funzione reale e positiva p(iL) (vale a dire una misura di probabilità) il cui integrale sullo spazio delle variabili nascoste stesse dovrà risultare uguale a 1:

p(r)>0, fp( i1)di1

> r

(6.1)

e si richiede che la media dei valori definiti di A(iL) valutata in accordo con la distribuzione pQ) riproduca il valore medio quantistico dell'osservabile in questione: = ( P A P )

= f A(a)pg)D.

(62)

Il significato della (6.2) dovrebbe risultare ovvio: se noi conoscessimo il preciso valore iL delle variabili nascoste che caratterizzano completamente

" Come vedremo, in una seconda fase del dibattito su questo tema sono state prese in considerazione anche teorie a variabili nascoste probabilistiche, cioè tali che l'assegnazione delle variabili determina solo le probabilità che le varie osservabili abbiano certi valori. " Va anche notato che, come mostrato da Ehrenfest, queste quantità nel caso di sistemi macroscopici ubbidiscono, nel limite in cui effetti dell'ordine della costante di Planck possono venire trascurati, precisamente alle leggi della meccanica dassica, una ragione di più per assegnare loro un ruolo specifico nel formalismo.

466 4.Ifondamenti concettualie leimplicazioniepistem olig iche.. .

lo stato del sistema, allora conosceremmo il valore (perfettamente definito) di qualsiasi osservabile fisica del sistema stesso. La natura probabilistica della teoria quantistica trova la sua origine esclusivamente nel fatto che queste variabili non risultano accessibili, per cui qualsiasi processo di preparazione di un sistema (o meglio di un insieme di sistemi) che porta al vettore di stato 'P comporta una distribuzione delle variabili stesse che non possiamo controllare. Le probabilità quantistiche diventano epistemiche, esse sono dovute alla nostra ignoranza circa variabili la cui conoscenza ci fornirebbe informazioni precise su qualsiasi quantità fisica.

62 II teorema di impossibilità di von Neumann Come menzionato sopra il programma delle variabili nascoste ha subito una sorta di ritardo a motivo della derivazione, da parte di von Neumann, di un teorema che ne avrebbe dimostrato l'impraticabilità. John von Neumann, indubbiamente uno dei più grandi matematici del nostro secolo, mostra fin dai primi anni un notevole interesse per lo schema teorico, la meccanica quantistica, che passa da un successo all'altro nella descrizione dei fenomeni microscopici e presenta un fascino particolare sia per la raffinata matematica che ne costituisce il linguaggio che per i profondi interrogativi che solleva circa i processi fisici. Cosi, già negli anni trenta, von Neumann diventa, per cosi dire, il matematico della comunità che si riconosce nel nuovo paradigma scientifico. Nel 1932 egli scrive un testo in cui presenta una lucida e corretta formulazione della teoria e inoltre affronta alcuni temi di fondo quali appunto qudli di un possibile completamento deterministico della teoria e della formalizzazione ddla descrizione dd processo di misura. Per quanto concerne il primo di questi due temi, von Neumann esibisce la dimostrazione matematica che il programma delle teorie a variabili nascoste è condannato a fallire, vale a dire che nessuna teoria predittivamente equivalente alla meccanica quantistica può assegnare a tutte le osservabili valori precisi (anche se non conosciuti). Il teorema è ovviamente corretto sul piano matematico e, benché fosse abbastanza raffinato dal punto di vista tecnico che certamente solo un'esigua minoranza dei fisici del tempo era in grado di capirlo e di valutario, esso assunse immediatamente, grazie all'immenso prestigio del suo autore, il ruolo di un dogma che venne usato contro ogni tentativo "eretico" di rendere appunto epistemica la fondamentale aleatorietà dei processi naturali (l'indeterminismo) che la nuova teoria aveva messo in luce. Se il teorema risulta matematicamente corretto ma le sue conclusioni risultano inappropriate, come

Le variabili nascoste 467

verrà dimostrato da Bohm, il quale nel 1952 esibirà un modello perfettamente consistente di una teoria deterministica a variabili nascoste predittivamente equivalente alla meccanica quantistica, l'unica possibilità che rimane è che qualcuna delle ipotesi del teorema non risulti corretta, o, almeno, logicamente necessaria. E questo è proprio il caso, come ci accingiamo a dimostrare. In fisica dassica, come pure in meccanica quantistica, si considerano spesso osservabili che sono una combinazione lineare di altre osservabili. Un caso tipico è, per esempio, quello della componente neUa direzione n del momento di spin di una particella che (in unità k/2) risulta, come illustrato nel paragrafo 2.10, la seguente combinazione dei tre operatori (2.43) : G„-

= n„o„+ n y o'y+ nzoz

(6.3)

Del tutto in generale, si consideri un'osservabile C che è una combinazione, con opportuni coefficienti reali, di altre osservabili (per semplicità ci limiteremo a considerare il caso di due) : C = aA+bB

(6.4)

Nel caso classico le quantità A e B, una volta specificato in modo completo lo stato del sistema (per esempio assegnando le posizioni e le velocità di tutte le particelle che lo costituiscono), hanno valori definiti e il valore (anch' esso definito) dell'osservabile C risulta precisamente la stessa combinazione dei valori di A e di B. Nel caso quantistico non si possono attribuire, in generale, valori definiti a tutte le osservabili e, come discusso sopra, le quantità che in un certo senso corrispondono ai valori classici sono rappresentate dai valori medi ddle osservabili. È facile convincersi che siffatte quantità, per la linearità dd prodotto scalare, sono legate tra loro dalla stessa relazione lineare (6.4), cioè vale:

('P, d''P) = a ('P, d'P) + b('P,8''P)

(6.5)

ove abbiamo indicato, come sempre, con 8, E e 0 gli operatori autoaggiunti che rappresentano, rispettivamente, le osservabili A, B e C. Fatte queste premesse possiamo enunciare l'assunzione che von Neumann ha utilizzato per derivare il suo teorema: nel caso di una teoria a variabili nascoste e di un'osservabile C che è la combinazione lineare (6.4) di altre due osservabili (più in generale un'arbitraria combinazione di un

numero qualsiasi di osservabili), i valori certi A(iL),B(il) e C(iL) che queste assumono allorché si specifichino le variabili nascoste, devono soddisfare la stessa relazione:

C(L) = aA(iL)+ bB(iL)

(6.6)

468 4.Ifondamenti concettualie leimplicazioniepistemoligiche...

Due osservazioni si impongono immediatamente. La condizione (6.6),

di per sé, allorché si tenga conto che si richiede anche che i valori A(iL), B(iL) e C(il) debbano coincidere con gli autovalori degli operatori quantistici associati alle osservabili in questione, è sufficiente per derivare in modo quasi banale la conclusione di von Neumann. Infatti, nulla nel formalismo degli operatori negli spazi di Hilbert ci dice che gli autovalori della somma di vari operatori debbano risultare la stessa combinazione degli autovalori dei suoi termini. Un modo elementare per convincerei di questo fatto sta nel fare riferimento all'equazione (6.3) e scegliere come n il vettore unitario di componenti (n„

= 1/ ù3,

trr

= 1/F3,

n

= ,1 / ù3 ). Si

ha allora: nt

(l) = (tr„(Z)+ trrQ)+ trQ)]

/E3

(67)

Le quantità cr;(iL) (t = x, y, z), rappresentano i valori definiti assunti dai tre operatori in questione allorché le variabili nascoste assumono i valori il, e, poiché devono coincidere con gli autovalori delle osservabili in questione, risulteranno uguali a + 1 o a — 1. Il membro a destra della (6.7) assume allora uno dei valori k/~3 con k = — 3, — 1, + 1, + 3. D'altra parte anche cr„- è una componente di spin (nelle solite unità) e pertanto deve essere cr„-(A)= a 1. Ma allora l'equazione (6.7) risulta manifestamente assurda in quanto implica che un numero intero sia uguale a un numero irrazionale. Condudendo, neppure nel semplicissimo caso delle componenti di spin di una particella di spin 1/2 può richiedersi che i valori assunti dalle osservabili siano definiti e coincidano con quelli permessi dalla teoria e al tempo stesso che questi valori soddisfino alle relazioni algebriche lineari che legano le osservabili stesse. Il fatto, come già segnalato, è quasi banale se considerato nella prospettiva ddla teoria degli operatori: una combinazione lineare di operatori non commutanti non ha, in generale, come autovalori la corrispondente combinazione lineare degli autovalori dei termini della somma. A questo punto conviene interrogarci: esiste qualche ragione di principio che rende logicamente o fisicamente necessaria la relazione (6.6) o le sue ovvie generalizzazioni? H fatto che siffatte relazioni siano soddisfatte in un contesto classico e dai valori medi quantistici non costituisce un motivo cogente per ritenere che esse vadano imposte ai valori precisi per le osservabili determinati dall'assegnazione deHe variabili nascoste. Se si riconosce che la richiesta (6.6) non è necessaria, la prova di von Neumann semplicemente non regge e quindi non esiste alcuna ragione di principio per ritenere impossibile un completamento deterministico della meccanica quantistica. Di fatto, un siffatto completamento è stato esplicitamente

Le variabili nascoste 469

presentato da Bohm nei suoi due fondamentali lavori del 1952 che ci accingiamo a descrivere.

63 La teoria dell'onda pilota

La vicenda di Bohm risulta alquanto singolare. Egli, allievo di Robert Oppenheimer, lo segue a Princeton nd 1947 dove resterà fino al 1951, anno in cui dovrà lasciare gli Stati Uniti per ragioni politiche. In questo periodo, come egli stesso confessa, avrà molti interessanti scambi di vedute con l'irriducibile critico dell'interpretazione ortodossa, Albert Einstein. Sono gli anni in cui Bohm manifesta un vivo interesse per i problemi fondazionali ddla teoria quantistica e scrive un libro (Bohm, 1951) che viene subito riconosciuto di grande valore per la vastità e la profondità dei temi trattati. È interessante sottolineare che questo libro mostra che Bohm aderisce alla posizione ortodossa: esso contiene addirittura la prova di von Neumann dell'impossibilità di una teoria a variabili nascoste equivalente alla meccanica quantistica. Ma forse proprio le riflessioni che egli sviluppò durante questo lavoro combinate con le interazioni con Einstein suscitarono in Bohm serie perplessità circa l'interpretazione di Copenaghen della teoria. Nel 1952, poco tempo dopo la pubblicazione del suo libro in cui sosteneva le concezioni ortodosse," egli esibisce esplicitamente un moddlo in cui, come ha detto Bdl «si realizza l'impossibile», vale a dire si elabora una consistente teoria a variabili nascoste. Prima di passare a descriverla, conviene richiamare alcune idee di Louis de Broglie che in una certa misura l'hanno ispirata; non a caso questa teoria verrà citata per molti anni come la teoria dell'onda pilota di de BroglieBohm. Di fatto, nel 1927 al Congresso Solvay, de Broglie aveva presentato una versione di quella che sarà poi la teoria di Bohm nella quale egli propone di considerare la posizione di una particeHa come sempre perfettamente definita. La probabilità delle varie posizioni è governata

semp lificata

dalla densità di probabilità di Born e l'evoluzione della posizione nel tempo è anch' essa determinata dalla funzione d'onda. Queste idee di de Broglie derivano direttamente daUe sue idee originali sulla natura ondulatoria dell'elettrone del periodo epico della nascita della nuova teoria. Mentre per Bohr un sistema elementare è ora un'onda eora una particella,

" Incidentalmente, risulta interessante segnalare che proprio allo scopo di presentare nel suo libro l'argomento di EPR in modo più semplice egli ne ideò la variante che abbiamo utilizzato nel paragrafo 6 (e che sta alla base dell'analisi di Beli), la quale fa riferimento alle variabili di spin anziché a quelle di posizione e impulso.

470 4. I fondamenti concettuali e le implicazioni epirtemoligi che...

per de Broglie esso è un'onda e una particella. Di fatto, la proposta di de Broglie non ebbe grande seguito e fu anzi severamente criticata da Pauli. L'idea di de Broglie rappresentò per molti anni, come sottolinea Peter Holland, un programma non sviluppato, fino a quando Bohm non lo portò alla sua conclusione logica. In particolare, mentre de Broglie fa sempre riferimento a una singola particella, Bohm tratta direttamente con un sistema a molte particelle. Veniamo ora a precisare la proposta di Bohm. La caratterizzazione completa dello stato di un sistema fisico è data dalla sua funzione d'onda cui vanno aggiunte delle variabili nascoste la cui scelta non mancherà di stupire il lettore: esse sono semplicemente le posizioni di tutte le particelle che compongono il sistema fisico in esame. Per capire le motivazioni di questa scelta riprendiamo in considerazione la funzione d'onda. Per semplicità limitiamoci al caso di una sola particdla che si muove lungo una retta, La funzione d'onda è allora semplicemente una funzione complessa 'P(x)

ddla variabile reale x, posizione della particella. Come sappiamo il quadrato del suo modulo l'P(x) l' rappresenta, secondo l'interpretazione pro-

babilistica di Bom del formalismo, la densità di probabilità di trovare la particella nel punto x, se si esegue una misura di posizione. Ora, poiché l'osservabile posizione non risulta quantizzata e quindi il suo spettro copre tutto l'asse reale sappiamo che la teoria, pur consentendo di rendere l'indeterminazione in posizione tanto piccola quanto si vuole, non permette di ridurla a zero. Pertanto, per qualsiasi procedimento di preparazione del sistema esisterà un intervallo non nullo in cui potrebbe venire trovata la particella se sottoposta a una misura. Il modello di Bohm fa precisamente riferimento a questo fatto essenziale e avanza la sua ipotesi di base: la particella in questione si trova, realmente ed oggettivamente, in una ben precisa tra le posizioni compatibili con la funzione d'onda che la descrive. Non solo, se il medesimo procedimento di preparazione viene ripetuto molte volte, la distribuzione oggettiva delle posizioni delle particdle individuali che costituiscono l'insieme statistico riproduce appunto la densità di probabilità associata alla funzione d'onda. Poiché non vi è alcun modo di preparare uno stato per il quale la posizione della particella sia determinata con precisione assoluta, si capirà perché le posizioni, che pure sono variabili con un diretto significato fisico, possano venire identificate con le variabili nascoste deHa teoria: l'osservatore non ha di fatto alcun modo per gestirle completamente. Passiamo ora a delineare lo schema teorico completo. Si consideri un sistema fisico costituito da N particelle la cui evoluzione è governata dall'equazione di Schrodinger che scriveremo esplicitamente nella rappresentazione ddle coordinate (ri, rz,...,r~), dei suoi costituenti:

Le t>ari abili nascoste 471

t>>2

d'P(rl, r2,..., l'N, l ) '='

Bt

2M,

(6.8)

V(t l, r2,...,rN )'P(rl, t 2,..., t N, t)

ove M; è la massa dell't-esima particella e ove abbiamo indicato con A; l'operatore di Laplace nelle variabili r;: B

+

8

+

o

(6.9)

8X. B y . BZ, La teoria è allora formulata nel modo seguente. Supponiamo che il sistema venga preparato al tempo t = 0 nello stato 'P(r l, rz,..., rN,0) e si determini la soluzione 'P(rl, rq,..., l'N, t) dell'equazione (6.8) che soddisfa a tali condizioni iniziali. In termini della funzione d'onda al tempo t si definiscono N campi di velocità v;(r l, rz,..., r~, t) nel modo seguente: vi (fl, r2, • • .,PN, l)

Ji(rl>r2»" .

N,l)

(6.10a)

I'Pl(rl, r2,..., rg, t )l'

ove j ;(rl,r2,...,rN,t ) =

['P(ri,...,rN,t)V 'P ">(t'l,...,rN,t

2M;

)

N,t)V P( r l,...,rN,l)] (6.10b) e 'Pi è l'operatore gradiente nelle variabili dell't'-esima particella. Si considerano quindi le posizioni r „r2,..., rN delle particelle e si assume che la loro evoluzione temporale sia determinata dall'equazione differenziale: t

= V, (Xl,X2 ... XN,t )l„,

„,„, „, „-, „-„

(6.11)

La notazione usata a destra della precedente equazione indica che la funzione prima della barra verticale va valutata per i valori delle variabili indicati sotto la barra stessa. Si noti che queste equazioni, essendo del primo ordine nelle derivate temporali, determinano univocamente la traiettoria ri(t) dell't'-esima particella una volta che sia assegnata la sua posizione iniziale r,(0). La teoria asserisce allora che la specificazione completa della situazione iniziale determina univocamente la situazione al tempo t. Infatti, assegnata la funzione d'onda 'P(r,, t 2,..., rg, 0) e le posizioni iniziali

ti(0) delle N particelle del sistema, le soluzioni della coppia di equazioni (6.8) e (6.11) determinano le posizioni r,(l) delle particelle al tempo t. Il pregio della teoria e il senso in cui essa risulta predittivamente equivalente alla meccanica quantistica deriva dalla seguente caratteristica. Se si

472 4. l fondamenti concettuali e le implicazioni epistemoligiche...

considera un insieme di sistemi per i quali la distribuzione iniziale delle posizioni de]le particelle riproduce la densità l'P(r n rz,..., rtv, 0) l' e si considera, per ciascuna di esse, la traiettoria determinata dalle prescrizioni precedenti, allora le loro posizioni al tempo t risultano distribuite in modo da riprodurre la densità l'P(r"„rz,..., rtt, t) l' associata all'evoluta secondo l'e-

quazione di Schrodinger della funzione d'onda iniziale. La prova matematica di questo fatto risulta semplice ma richiede alcuni passaggi. Per il lettore interessato la illustriamo limitandoci al caso di una sola particella. Come la teoria di Bohm riproduce le distribuzioni quantistiche in posizione Le equazioni che descrivono la dinamica di un Guido del quale siano assegnate la velocità 8(r, t) e la densità p(r, t) all'istante t in ogni punto r dello spazio, equazioni che esprimono semplicemente la conservazione della massa, risultano:

dp(r, t) t

+divj (r,t) = 0,

g ( r",t)= p(r,t)v (r,t)

D'altra parte moltiplicando l'equazione di Schrodinger c)'P(r,t)

Ek

dt 2m a sinistra per P*(r, t) e la sua complessa coniugata:

o'" (r,t)

ih

i

— — h+ — V(r) ' P * ( r ,t) 2m b

Bt a sinistra per P(r, t), e sommandole, si ottiene: c)t

= - ['P * (r, t)6'P(, t) — 'P(r, t)h'P '"(r, t)] = 2m

di v — ['P * (r, t)V'P(r, t) — 'P(i', t) V'P* (r, t)] 2m

— divj(r, t), ove j(r, t) ha precisamente la forma (6.10b). Dal confronto con la prima equazione scritta sopra si vede allora che l'P(r, t)l' soddisfa la stes-

sa equazione differenziale di p(r, t). Poiché la soluzione di questa equazione è univocamente determinata dalie condizioni iniziali, si vede che la scelta

p(r, 0) = 11'P(r, 0)l' implicap(r, t) = l'P(r, t)l', che dimostra precisamente che l'insieme statistico ottenuto facendo evolvere secondo le precise regole del modello l'insieme di particelle che sono distribuite, al tempo t = 0, secondo la funzione densità l'P(r, 0) l', si ottiene un insieme tale che la distribuzione delle particelle all'istante t coincide con l'P(r, t) l'.

Le variabil i nascoste 473

Prima di concludere questo paragrafo riteniamo doveroso sottolineare come la presentazione che abbiamo dato della teoria di Bohm è quella che risulta formalmente più semplice e che viene seguita in tutti i testi e nelle pubblicazioni scientifiche più recenti. La formulazione originale di Bohm, anziché considerare un'equazione per le traiettorie, la (6.11), che contiene le derivate prime rispetto al tempo, utilizza la soluzione deH'equazione di Schrodinger 'P(r„r>,..., rtt, t) per definire un potenziale V(r„r„ . . ., rq, t), detto potenziale quantomeccanico, che rappresenta delle forze f, da aggiungersi alle forze classicheP;" che agiscono sulle particdle (per esempio dovute alle loro mutue interazioni o alla presenza di campi di forze esterni) e che determinano, in accordo con l'equazione di Newton: M; at = P;" + P, , la loro evoluzione. In questo senso la teoria si configura, in un certo senso, come più dassica. Tutti gli aspetti quantistici del comportamento dei sistemi fisici sono riassunti dal campo di forze determinato dalla funzione d'onda, la quale viene quindi a configurarsi veramente come un'onda pilota che guida le particelle durante il loro moto nello spazio.

6.4 Alcuni esempi di descrizione "alla Bohm" di processi fisici Per comprendere a fondo il modello conviene studiare alcuni casi particolari. Cominciamo (fig. 6.1) con il processo di diffrazione da una fenditura. Si suppone che nella regione tra lo schermo che "prepara" la funzione d'onda ddla particella aH'istante iniziale e lo schermo rivelatore, la particeHa non sia soggetta ad alcuna forza di tipo classico (cioè non vi sianot campi elettrici, magnetici o gravitazionali che agiscono su di essa).

Qual è la visione di Bohm del processo? AH'inizio la funzione d'onda è quella indicata in figura subito dopo la fenditura deHo schermo, vale a dire essa ha un valore costante neH'intervaHo che corrisponde aH'estensione del foro ed è nulla al di fuori di esso. Di fatto però, asserisce Bohm, la particella si trova in una posizione ben precisa (anche se a noi ignota), diciamo nel punto a. Poiché nella regione tra i due schermi non esistono forze di alcun genere che agiscono sulla particella, secondo la fisica dassica essa si propagherebbe rettilineamente e andrebbe a colpire lo schermo esattamente nel punto che sta di fronte al punto a. Ma in questa parte dell'analisi abbiamo dimenticato la funzione d'onda che, evolvendo secondo l'equazione di Schrodinger, cambia la sua forma nella regione intermedia. Essa corrispondentemente genera una forza quantistica che agisce sulla particella stessa in quella regione. Il calcolo esplicito mostra che questa forza determina una deflessione della particella che dipende dalla sua

474 4.Ifondamenti conceuualiele implicazioni epistem olig iche...

posizione iniziale e che fa deviare leggermente verso l'alto le particdle della regione superiore e verso il basso quelle della regione inferiore. Si hanno cosi le traiettorie, indicate in figura per varie posizioni iniziali, che andranno a formare sullo schermo la figura di diffrazione che, come ben sappiamo, risulta allargata rispetto all'immagine geometrica del foro del primo schermo.

Quadrato ddla funzione d'onda iniziale

t

Quadrato della funzione d'onda finale

fig. 6.1 La visione nell'ambito ddla teoria deH'onda pilota del processo di diffrazione da una fenditura.

L'analisi di un esperimento di interferenza, anche se concettualmente analoga, risulta molto più interessante.In questo caso la funzione d'onda iniziale (cioè immediatamente dopo avere attraversato le due fenditure) risulta la sovrapposizione quantistica di due funzioni d'onda, ciascuna diversa da zero solo in corrispondenza di una delle fenditure; Ancora una volta la teoria asserisce che, di fatto, la particella si trova in un preciso punto tra quelli consentiti, vale a dire o in un punto della fenditura A o in uno della B. Ma la presenza nella funzione d'onda del termine che corrisponde alla regione della fenditura in cui la particella non si trova (oltre ovviamente al termine che corrisponde alla regione in cui essa si trova), gioca, a causa ddl'interferenza, un ruolo essenziale nel determinare la funzione d'onda globale nei vari punti tra lo schermo iniziale e quello rivelatore. Questa funzione d'onda produce a sua volta un campo di forze quantistico che determina l'evoluzione della particella che si trova-

Le variabil i nascoste 475

va all'istante iniziale in un certo punto di A, un campo che la guida nella regione intermedia portandola in uno preciso dei punti compatibili con la figura di interferenza che sappiamo formarsi sullo schermo se l'esperimento viene ripetuto molte volte. Ovviamente la ripetizione dell'esperimento con una seconda particella comporta, in generale, che all'inizio

essa abbia una diversa posizione, e quindi che segua una traiettoria diversa dalla precedente. Come sappiamo, la caratteristica cruciale e interessante della teoria sta nel fatto che essa ci garantisce che se si tiene conto di tutte le possibili posizioni iniziali (pesate con la corretta probabilità assegnata loro dalla funzione d'onda al tempo t = 0 ) allora l'insieme delle traiettorie risulta tale da garantire che la distribuzione delle posizioni sullo schermo finale riprodurrà esattamente la figura di interferenza della meccanica quantistica. Nella fig. 6.2 abbiamo riportato il grafico (Philippidis, Bohm e Kaye, 1982) che rappresenta le traiettorie per un elettrone (ogni traiettoria dipende crucialmente, come si vede, dalla condizione iniziale) la cui funzione d'onda investe un apparato con due fenditure. Le traiettorie sono state calcolate tenendo conto del potenziale quantomeccanico.

ág. 6.2 Traiettorie delle particelle in un esperimento di diffrazione da due fenditure. Si noti come ogni particella segua un percorso ben preciso determinato completamente dalla sua posizione iniziale ma come, per effetto dd potenziale quantomeccanico, le traiettorie tendano a disporsi in modo da riprodurre la figura di interferenza che si forma sullo schermo, aUorché l'esperim nte o viene ripetuto molte volte.

Si impongono alcune osservazioni. Innanzi tutto le traiettorie si raggruppano assieme in modo da riprodurre l'alternanza tra frange scure e chiare che caratterizza questo esperimento. Secondariamente va notato

476 4. I fondamenti concettuali e le implicazioni epistemoligiche...

come la figura renda evidente il ruolo essenziale del potenziale quantomeccanico e illustri come, per quanto "classica", la teoria mostri degli aspetti del tutto peculiari che, ovviamente, costituiscono la controparte "deterministica" delle peculiarità del mondo quantistico. Si pensi, che secondo la teoria, una particella all'istante iniziale è di fatto e oggettivamente in un punto della fenditura A. Si confronti questa situazione con quella in cui la stessa particella si trova nello stesso punto, ma la situazione sperimentale corrisponde al fatto che la fenditura in B è chiusa, per cui la funzione d'onda in questa regione è nulla. L'evoluzione successiva della particeHa risulta completamente diversa nei due casi. Nel secondo essa seguirebbe, come illustrato nella fig. 6.3 una particolare (quella che le compete per le condizioni iniziali) delle traiettorie del tipo di qudle della fig. 6.1. Nel caso reale invece, essa segue una traiettoria del tipo di quelle ddla fig. 6.2. Questa osservazione ha un notevole interesse concettuale e pedagogico in quanto consente di cogliere fin d'ora che la teoria presenterà alcune caratteristiche sorprendenti. La particella in A sembra potersi accorgere se il foro in B è aperto o chiuso. Ovviamente, questo accade anche neHo schema quantistico standard, che risulta assolutamente equivalente a quello ora considerato dal punto di vista degli esiti di misure di posizione. Ma non ci si può dimenticare che mentre nel formalismo quantistico si asserisce che l'idea stessa di traiettoria non può venire contemplata, ora siamo in un ambito "classico" e deterministico, che pretende di assegnare traiettorie precise a ogni particella. Ed allora il fatto che "chiudere una'fenditura" possa avere un effetto rilevante per una particella che "passa per l'altra" fa intuire l'esistenza di caratteristiche nonlocali del formalismo che, dal punto di vista classico, pongono alcuni imbarazzanti interrogativi." Ma di questo parleremo nei paragrafi successivi. Prima di concludere il presente paragrafo, conviene analizzare un'altra peculiarità che caratterizza non solo la teoria in esame ma risulta tipica di tutte le teorie a variabili nascoste deterministiche, e che riveste una notevole importanza per le sue implicazioni circa il senso preciso in cui il programma delle variabili nascoste soddisfa le richieste di fondo che lo hanno motivato. Questa peculiarità viene indicata come "contestualità" Malgrado la natura tecnica di questa espressione, risulta facile cogliere il significato di questa caratteristica " Vale la pena notare che l'analisi appena sviluppata mostra come la modificazione della situarione in B che può essere prodotta secondo la libera scelta di un osservatore in qualsiasi istante (spostando lo schermo che copre la fenditura) implica un cambiamento istantaneo del potenziale quantomeccanico in tutto lo spazio. Questo, di per sé, non porta direttamente a situazioni fisicamente inaccettabili e in contrasto con le richieste relativistiche, in quanto il potenziale quantomeccanico, a differenza di tutti i potenziali classici, non trasporta energia.

Le variabili nascoste 477

e risulta interessante illustrarla facendo, per esempio, riferimento alla teoria dell'onda pilota. X

X

L

i

A '

fig. 6.3. Le traiettorie ddle particelle che attraversano la fenditura A risultano drasticamente alterate dal fatto che si chiuda la fenditura B, come risulta evidente dal confronto con la fig. 6.2.

6.5 La contestualità delle teorie deterministiche a variabili nascoste Ricordiamo che qualsiasi tentativo di realizzare un completamento deterministico della meccanica quantistica nello spirito delle teorie a variabili nascoste richiede che precisato completamente lo stato fisico del sistema (cioè assegnate le variabili nascoste il) tutte le osservabili fisiche del sistema abbiano un valore preciso, posseduto indipendentemente da qualsiasi intervento mirato a determinarlo. Vogliamo ora mostrare come questa richiesta entra direttamente in conflitto con alcune ipotesi che sembrano assolutamente naturali. Interroghiamoci: come può la pretesa avanzata sopra, di per sé, risultare problematica? Se qualcuno ci chiedesse come la si possa implementare praticamente noi potremmo semplicemente dencare tutte le osservabili e assegnare a ognuna di esse un valore preciso tra quelli permessi dal formalismo quantomeccanico. Il problema nasce allorché si richiede che la teoria soddisfi alcune ulteriori condizioni talmente

478 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

ovvie che nessuno, prima dei lavori di Beli del 1966 e di Kochen e Specker del 1967, aveva neppure ritenuto opportuno discutere." Queste ipotesi incorporano semplicemente la pretesa che risulti possibile eseguire "misure attendibili", vale a dire che nel caso il formalismo asserisca che un certo valore è oggettivamente posseduto da un'osservabile, allora esso coincida con il valore che si ottiene eseguendo la misura e che, se una grandezza risulta essere una funzione di altre grandezze tra loro compatibili, il valore che essa assume coincida con la funzione dei valori assunti da esse. Mi sembra evidente che per chi intende elaborare un completamento della teoria nella prospettiva de)l'oggettivismo che caratterizza e motiva il programma delle variabili nascoste risulti difficile rinunciare a queste richieste. Per illustrare il problema che ci interessa consideriamo un S.O.N.C. di stati (cp1.) e la famiglia di proiettori (P~) sulle relative varietà monodimensionali. Ricordiamo che i vettori yt, sono ortogonali e rappresentano, nel linguaggio pittorico che abbiamo ripetutamente usato, un sistema di infiniti versori ortogonali del nostro spazio. Ricordiamo anche che, proprio grazie all'ortogonalità deHe varietà lineari caratterizzate da questi vettori, i proiettori commutano tra di loro, e quindi, essendo operatori limitati e autoaggiunti, rappresentano osservabili compatibili. La completezza del sistema dei (y~) garantisce inoltre che i proiettori in oggetto si sommino all'operatore identità: Pg =

t

(6.12)

Supponiamo ora di avere una teoria a variabili nascoste deterministiche e uno stato caratterizzato da un preciso valore ~(, delle variabili stesse. Poiché gli operatori Pp sono proiettori, i loro possibili autovalori sono rappresentati dalla coppia (0, 1). Ne consegue che dovrà valere o Pt,(il) = 0 oppure P~(iL)= 1. D'altra parte, l'operatore identità ha come solo autovalore 1. Se richiediamo che la relazione (6.12) valga anche per i valori precisi assunti da queste osservabili in corrispondenza alla specificazione delle variabili nascoste, dovremo avere: Pg(iL) = 1

(6.13)

La richiesta (6.13) richiede un commento, Infatti essa ricorda quella di von Neumann, vale a dire che se un'osservabile (in questo caso II) risulta

" Di fatto la dimostrazione di quello che viene usualmente riferito come il teorema di Kochen e Specker, e che porta alle conclusioni che ci accingiamo a esporre, era contenuta in un raffinato teorema generale derivato da A.M. Gleason circa dieci anni prima (Gleason, 1957). Ma la rilevanza di questo teorema per il problema in oggetto è stata appropriatamente sottolineata da Beli e da questi autori.

Le variabili nascoste 479 una combinazione lineare di altre osservabili (Pp) essa debba assumere il valore che è la stessa combinazione degli autovalori dei termini della combinazione. Ma si deve notare che la situazione che stiamo considerando è radicalmente diversa da quella del teorema di von Neumann in quanto, come abbiamo segnalato, le osservabili della combinazione risultano compatibili. Poiché è vero del tutto in generale che un operatore che è combinazione lineare di operatori commutanti ha come autovalori la stessa combinazione lineare degli autovalori dei termini della combinazione la richiesta è quindi fondamentalmente diversa da quella di von Neumann e sembra, non solo naturale, ma addirittura irrinunciabile, come vedremo nd

seguito.

Per proseguire nella nostra analisi della contestualità conviene trasformare il problema in esame in un appassionante problema topologico di colorazione di una sfera. Poiché ciascuno dei termini a sinistra della (6.13) assume il valore 0 oppure il valore 1 ed essi devono sommarsi a uno, questo implica che, considerato il sistema di assi individuato dai versori (yà) e la sfera di raggio unitario nel nostro spazio, i punti rè in cui gli assi intersecano la sfera devono essere tali che, per L fissato, possa associarsi il numero 1 a uno di essi e il numero 0 a tutti gli altri. Ma, va osservato, nulla privilegia il S.O.N.C. ora considerato rispetto a qualsiasi altro. In altre parole per tutti i sistemi di assi ortogonali che si possono concepire, una volta fissate le variabili nascoste i1, si può argomentare nello stesso modo. Ed ecco allora come può riformularsi il problema: supponiamo, per un dato sistema di assi, di colorare in rosso l'unico punto della sfera che corrisponde alla direzione per la quale il relativo proiettore assume il valore 1 e in blu tutti i punti associati agli altri vettori. Il nostro interrogativo diventa quindi: è possibile colorare tutta la sfera con due colori (rosso e blu) in modo tale che qualsiasi sistema di assi ortogonali identifichi sulla sfera un insieme di punti (quelli in cui gli assi l'attraversano) tale che uno solo di essi sia rosso e tutti gli altri blu? La risposta è negativa se lo spazio è almeno tridimensionale.4' Non presenteremo la dimostrazione rigorosa di questo fatto ma ci limiteremo a renderlo plausibile con un esempio semplice. Supponiamo che il nostro spazio, anziché infinito-dimensionale sia tridimensionale. Se si considera una terna di assi e si prende come polo nord della sfera quello che corrisponde al punto rosso in cui la terna

" Nel caso bidimensionale (reale) sarà ovvio al lettore perché la risposta al nostro quesito è positiva;

basta considerare un cerchio, dividerlo in quattro archi uguali e colorare gli archi alternativamente in rosso e in blu. Allora ogni coppia di assi ortogonali attraversa sicuramente il cerchio in un punto rosso e uno blu.

480 4.Ifondamenti concettualie leimplicazioni epistem olig iche...

attraversa la sfera, i due punti che gli altri assi individuano suH'equatore devono risultare blu. Ma se ora si cambia la terna semplicemente ruotandola di un angolo qualsiasi attorno aH'asse che congiunge il centro col polo nord si ha una nuova tema di assi ortogonali. Il fatto che per la considerata assegnazione delle variabili nascoste il proiettore che corri-

sponde alla direzione del polo nord ha il valore 1, deve corrispondere a un dato di fatto oggettivo deHa situazione fisica. Ma allora esso dovrà comunque essere colorato in rosso e i corrispondenti punti suH'equatore in blu. In breve, data l'arbitrarietà deH'angolo di rotazione se ne conclude che tutto l'equatore deve risultare blu. Ma allora, come il lettore intuirà, la nostra prescrizione associa, in un certo senso, troppi punti blu a qualsiasi assegnato punto rosso. Di fatto Kochen e Specker hanno dimostrato come, nel caso tridimensionale, risulta possibile identificare 117 punti sulla sfera che individuano varie terne ortogonali opportunamente disposte per le quali la pretesa che venga rispettata la nostra regola di colorazione non può essere soddisfatta (rimandiamo il lettore interessato alla prova esplicita al lavoro di Ghirardi e de Stefano

(1996)). Vale la pena notare che l'argomento ora analizzato, il quale, poiché fa ricorso a una famiglia di proiettori ortogonali nello spazio astratto di Hilbert infinito dimensionale potrebbe sembrare troppo formale, ha, di fatto, dirette imphcazioni fisiche. Il caso più semplice è quello deHe componenti di spin di una particdla di spin 1 (cioè una per cui il quadrato dello spin il quale è una caratteristica fondamentale del sistema vale S' = 1(1 + 1) fi,'= 2ft,'. Sappiamo già che la misura delle relative componenti di spin S„- per una qualunque direzione (diciamo n), può dare come esiti solo uno dei tre valori S„-= + A, 0, — ft,. Conseguentemente, scelta una direzione arbitraria, l'osservabile fisica "il quadrato della componente di spin lungo quella direzione" può assumere (in unità fi') solo i valori 0 e 1. Consideriamo adesso una terna di assi ortogonali e indichiamo come P, Q e Ri tre punti che essi individuano sulla sfera. Va notato che il fatto che la particella ha spin 1 implica che i quadrati delle componenti di spin lungo tre assi ortogonali commutano tra Ch loro(questo non vale in generale per spin o momenti angolari con valori arbitrari). Misuriamo i quadrati delle componenti come pure il quadrato deHo spin totale in unità ft', e ricordiamo che, per definizione: S' = S> + Sq' + S„-', con ovvio significato dei simboli. Poiché, nelle unità considerate S' = 2 e ciascuno dei quadrati delle componenti può assumere solo il valore 0 o 1, avremo che, per ogni assegnato il dovrà valere:

2 = S'(iL) = S'(i1 ) + S'(il,) + S'(il) p

q

(6.14)

Le variabil i nascoste 481

Ci troviamo allora in una situazione analoga (a parte lo scambio tra 0 e 1) a quella di prima, vale a dire ogni terna ortogonale deve intersecare la sfera in tre punti di cui due vanno associati al numero 1 e uno al numero 0. Sappiamo già che questo non risulta possibile. Cosa se ne deve concludere? Ovviamente non è possibile rinunciare né alla richiesta che, assegnate le variabili nascoste, le osservabili in esame abbiano i valori indicati, né che la somma dei quadrati corrisponda alla proprietà fondamentale e intrinseca del nostro sistema di avere spin 1, vale a dire 5' = 2. Abbiamo forse dimostrato che il programma delle variabili nascoste è impraticabile? La risposta è no, come ha appropriatamente sottolineato Beli stesso (Beli, 1966). Dobbiamo però accettare un fatto del tutto inaspettato dai proponenti di un completamento deterministico della teoria, cioè il fenomeno ddla contestualità. Esso può esprimersi dicendo che il valore di verità di un'asserzione circa una proprietà di un sistema fisico (cioè il fatto che essa risulti vera o falsa) non dipende solo daHe variabili nascoste che caratterizzano la situazione fisica, ma dall'intero contesto sperimentale. Nel nostro caso potrebbe aversi che, per esempio, se il contesto sperimentale corrisponde a misurare le osservabili compatibili Sp~ Sq e S„-', allora, per il valore considerato di i1, si abbia S>(il) = 0 (e quindi Se~(A)= S„-'(L) = 1) ma se il contesto corrispondesse a misurare la stessa componente S-' e le componenti S (i(), St-(il) lungo due direzioni s, t tra loro ortogonaL e ortogonali a p ma diverse dalle precedenti, allora può accadere che per lo stesso valo-

re di L si abbia Sz (iL)= 1. Va notato che le osservabili "le componenti dello spin lungo s, t " risultano incompatibili con quelle "lungo q ed r ", e quindi i due contesti non possono mai darsi simultaneamente. Solamente nel preciso senso sopra speciflcato, vale a dire se si accetta (in generale) il carattere inevitabilmente contestuale delle osservabili fisiche, esiste la possibilità di un completamento deterministico della meccanica quantistica e quindi di rendere epistemiche le relative probabilità. Sembra tuttavia opportuno sollevare un quesito: tenuto conto delle motivazioni che animano i proponenti delle teorie a variabili nascoste, il riconoscimento dell'inevitabile contestualità di almeno alcune osservabili non entra in conflitto con la pretesa "oggettività" delle proprietà possedute da un sistema> Se il valore di verità (cioè il fatto che essa risulti vera o falsa) dell'asserzione "A assume il valore A(i1,)" dipende dal fatto che, per esempio, un altro osservatore decida (a suo libero arbitrio) se misurare l'osservabile B o l'osservabile C (entrambi compatibili con A ma incompatibili tra loro) e per di più, come vedremo nel paragrafo 7 questa misura, nei casi di entanglement, può persino coinvolgere solo una parte lontanissima del sistema, in che senso l'asserzione in esame può ritenersi avere un valore oggettivo?

482 4. I fondamenti concettuali e le implicazioni epistemoligiche...

E di estrema importanza sottolineare che, fortunatamente, per ogni data teoria a variabili nascoste non tutte le osservabili risultano contestuali. Di fatto risulta possibile, per ogni sistema fisico, costruire una teoria a variabili nascoste per le quali un sistema completo di osservabili compatibili risulta noncontestuale. Esse vengono cosi ad acquistare uno stato di oggettività particolare." Quasi tutte le altre osservabili risultano fondamentalmente contestuali e quindi, in un certo senso, non oggettive. La scelta di quali variabili compatibili rendere noncontestuali risulta in notevole misura arbitraria. Per esempio nella teoria di Bohm, come abbiamo sottolineato ripetutamente, tutte le particelle di qualunque sistema fisico hanno sempre posizioni perfettamente e oggettivamente definite" (le posizioni in questo caso coincidono con le variabili nascoste stesse e rappresentano le osservabùi noncontestuali della teoria). Molto appropriatamente Beli stesso ha indicato il corretto atteggiamento da assumere, con riferimento alla teoria dell'onda pilota, circa le variabili contestuali e le variabili noncontestuali della teoria: «La morale di questa storia è che le sole osservazioni che vanno considerate sono le osser-

vazioni delle posizioni, addirittura solo delle posizioni degli indici degli apparecchi. È un grande merito della teoria di de Broglie-Bohm l'averci costretto a tenere conto di questo fatto. Se uno, anziché limitarsi a dare definizioni e a derivare teoremi, avanza assiomi circa le "misure" di qualsiasi altra cosa, allora egli introduce ridondanze e rischia inconsistenze».

6.6 La contestualità delle variabili di spin Per gli scopi futuri conviene analizzare brevemente il ruolo dello spin nella teoria di Bohm e segnalare come in essa le osservabili legate a questo grado di libertà non classico risultino contestuali. A questo scopo conviene riferirsi al processo di misura della componente lungo l'asse z dello spin di una particella neutra, quale un antineutrone, la quale è associata " Oltre a queste osservabili genuinamente noncontestuali, anche tutte le proprietà che, in un dato momento, hanno valori definiti (cioèhanno probabilità uguale a 1 di venire trovate) secondo lo schema quantistico standard, hanno "oggettivamente" gli stessi valori nella teoria a vatiabili nascoste. Questo è interessante (e doveva essere cosi) ma, ovviamente, il tipo stesso di proprietà possedute in questo senso dipende dal vettore di stato e varia da istante a istante come conseguenza dell'evoluzione.

Ovviamente si sarebbe potuto fare una scelta alternativa e costruire un'altra teoria equivalente alla meccanica quantistica nella quale le velocità delle particelle risultassero noncontestuali e quindi oggettive. Il prezzo da pagare sarebbe stato quello di rendere contestuali le posizioni, un prezzo troppo alto, come il lettore capirà facilmente.

Le variabil i nascoste 483

all'autostato rdativo all'autovalore + 1 dell'osservabile a,'. Per svolgere il nostro argomento senza ricorrere a una trattazione matematica complicata facciamo una precisa assunzione circa la funzione d'onda spaziale della particella, vale a dire che essa risulti simmetrica rispetto al piano che contiene la traiettoria della particella (l'asse x) prima che essa raggiunga la regione ove è situato un magnete di Stem-Gerlach e che è perpendicolare all'asse z, cioè alla direzione che caratterizza la disomogeneità del campo. Secondo la meccanica quantistica sappiamo cosa accadrà: la funzione d'onda risulterà la sovrapposizione di due stati che corrispondono a due diverse traiettorie, una diretta verso l'alto, l'altra verso il basso. Veniamo ora alla descrizione del processo nell'ottica della teoria di Bohm. La specificazione completa di un singolo sistema fisico richiede di precisare, in aggiunta alle funzioni d'onda spaziali e di spin all'istante iniziale, anche la posizione iniziale esatta della particella tra quelle compatibili con la funzione d'onda considerata. Senza entrare nei dettagli tecnici possiamo adesso rendere plausibile cosa accadrà. Come conseguenza ddla perfetta simmetria del problema rispetto al piano x-y, risulta immediato dimostrare che la componente z della velocità della particella risulta nulla quando la particella sta in questo piano. Questo implica che nessuna particella può attraversare il piano in questione e quindi, poiché sappiamo che la teoria riproduce le distribuzioni finali delle posizioni previste dalla meccanica quantistica, tutte le particelle le cui posizioni iniziali (le variabili nascoste) stanno nella metà superiore della regione (che in figura abbiamo rappresentato come una sferetta) in cui la funzione d'onda è diversa da zero seguiranno una traiettoria deflessa verso l'alto e andranno a colpire lo schermo in un punto che lo sperimentatore interpreterà come: la misura ha avuto come esito "lo spin è stato trovato in su lungo l'asse z" (fig. 6.4a). In modo assolutamente analogo tutte le particelle che all'inizio stanno nella regione che si trova sotto il piano di simmetria del processo., verranno deviate in giù e, corrispondentemente, per esse si conduderà che "lo spin è stato trovato in giù lungo l'asse z" L'esempio illustra bene come la conoscenza delle variabili nascoste comporti la possibilità di prevedere con certezza l'esito di una misura di spin che, nello spirito della teoria, significa semplicemente lungo quale delle due traiettorie finirà la particella all'uscita della regione di disomogeneità

del campo. Fin qui tutto sembra perfettamente chiaro e semplice. In particolare le frequenze relative degli esiti riproducono quelle previste dalla teoria standard: metà particelle verranno deviate in su e metà in giù, gli esiti risulteranno casuali in quanto il processo di preparazione della funzione d'onda iniziale non permette assolutamente di controllare la posizione della parti-

484 4. I fondamenti concettuali e leimpiicazioni epirtemoligiche...

cella, la quale, per la simmetria della funzione d'onda si troverà, con uguali probabilità, nella regione superiore o inferiore rispetto al piano di simmetria. Ma a questo punto possiamo considerare una situazione nella quale il contesto sperimentale è diverso. Ad esempio, possiamo semplicemente supporre, lasciando tutto il resto inalterato, di fare in modo che il

campo decresca al crescere di z (fig. 6.4b). In altri termini, se prima il campo era più debole ndla regione inferiore e cresceva spostandosi nella direzione positiva dell'asse z, ora, pur essendo il campo ancora orientato verso la direzione positiva di questo asse esso cala in intensità, anziché crescere, allorché ci si sposta lungo questo asse. Ovviamente, in accordo con l'analisi presentata nel paragrafo 4.2., poiché la deduzione ddl'esito della misura di spin dal tipo di traiettoria che la particella segue si basa sulla considerazione che ove il campo è più intenso esso esercita sul minuscolo ago magnetico associato allo spin una forza

z

Posizione finale della particellaconclusione:

Z

sPnl In glu

Spul ln SU

Posizione iniziale della particella

Posizione finale della particellaconclusione:

Posizione iniziale della particella

X

X

Posizione iniziale della particella

Posizione iniziale della particeizta

Posizione finale della particella-

Posizione finale della particella-

Regione del conclusione: sPln ln glu

a)

disomogeneo: il campo cresce verso l'alto

b)

conclusione egione spm m su campo disomogeneo:

il campo cresce

verso tt basso

ág, 6.4 a,b. Contestualità ddle vaáabili di spin ndla teoria di Bohm. Un antineutrone la cui funzione d'onda spaziale (simmetrica rispetto al pianox-y) è rappresentata dalla sferetta in grigio, e con lo spin "in su lungo l'asse y — perpendicolare al foglio" si propaga lungo l'asse x verso una regione in cui è presente un catnpo magnetico disomogeneo (la tipica situazione di un esperimento alla Stern-Gerlach), diretto nel verso positivo dell'asse z, ma che auinenta in intensità al crescere di z (caso a) oppure diminuisce di intensità lungo la stessa direzione. La specificazione della variabile nascosta della particdla determina in modo univoco la traiettoria che essa seguirà. Da questa si inferisce poi il valore "trovato" per la componente z. La simmetria del problema implica che se la particella sta nella parte superiore (inferiore) verrà comunque deviata in su (in giù), indipendentemente dal verso in cui cresce il campo. Ma poiché l'inversione del gradiente del campo comporta una diversa lettura dell'esito, si vede emergere la natura contestuale dello spin: la conoscenza della variabile nascosta determina univocamente la proprietà di spin solo relativamente a un contesto specificato.

Le variabil i nascoste 485

maggiore di quella che esercita ove esso è meno intenso, ndl'interpretare l'esito della misura nel nuovo contesto si asserirà che le particelle che vengono rivelate lungo la traiettoria superiore sono quelle per le quali la misura ha dato l'esito "lo spin è stato trovato in giù lungo l'asse z", e viceversa. Questa stessa condusione vale nel caso ddla teoria di Bohm. A questo punto la natura contestuale delle variabili di spin in questo schema emerge chiaramente. A causa del fatto che la simmetria dd problema rispetto al piano centrale non è cambiata, di nuovo, le particelle le cui posizioni iniziali (le variabili nascoste) stavano sopra il piano di simmetria verranno comunque deviate in su e quelle le cui posizioni iniziali stavano sotto il piano in questione verranno comunque deviate in giù. In sintesi: l'assegnazione delle variabili nascoste, cioè delle posizioni, determina univocamente la traiettoria della particella indipendentemente dal verso della disomogeneità del campo. Ma poiché se si inverte il gradiente del campo si deve fare l'associazione opposta fra traiettoria e componente di spin, la variabile in oggetto risulta contestuale: una particella con la propria variabile nascosta nella regione superiore ha certamente la proprietà di avere lo spin in su se si considera il primo contesto sperimentale (campo magnetico che cresce verso l'alto), la stessa particella con la stessa variabile nascosta ha certamente la proprietà di avere lo spin in giù se si considera il secondo contesto. Quindi pur restando vero che l'assegnazione delle variabili nascoste determina perfettamente il valore posseduto dalle osservabili fisiche questo valore, oltre che dalle variabili stesse, viene a dipendere da tutto il contesto (e, come già accennato, qualora si considerino stati entangled può dipendere da esso anche in modo nonlocalema di questo parleremo nel seguito).

6.7 Le caratteristiche delle teorie e variabili nascoste in sintesi Possiamo chiudere questo paragrafo riassumendo le conclusioni cui siamo giunti e sottolineandone la rilevanza concettuale: — è possibile elaborare un completamento deterministico della meccanica quantistica, vale a dire rendere epistemiche le probabilità della teoria, introducendo opportuni parametri (variabili nascoste) che, comunque, non devono poter essere gestite dallo sperimentatore; — il programma sopra ddineato richiede però di pagare un prezzo, quello di accettare la contestualità della maggior parte delle osservabili fisiche, vale a dire il fatto che i loro valori certi non siano interamente caratterizzati dall'assegnazione delle variabili nascoste ma dipendano, in un senso ben preciso e anche nonlocalmente, dall'intero contesto. Questo richiede, a

486 4. I fondamenti concettuali eleimplicazioni epistemoligiche...

nostro parere, una radicale revisione del senso in cui la teoria consente di parlare di proprietà oggettivamente possedute; — malgrado ciò si può sempre identificare un sistema completo di osservabili commutanti la cui natura risulta noncontestuale, vale a dire i valori che la teoria attribuisce loro per una precisa specificazione delle variabili nascoste possono considerarsi come oggettivamente posseduti, indipendentemente da qualsiasi atto di misura o processo fisico che abbia luogo in qualsiasi parte dell'universo. Nel caso della teoria di Bohm queste osservabili sono precisamente le posizioni di tutte le particelle dell'universo. Ci sembra quasi sottolineare che i fatti ora elencati mostrano che la teoria può rendere conto "oggettivamente" solo ddle proprietà associate a variabili noncontestuali.

superfluo

" Anche se non lo abbiamo esplicitamente sottolineato ndla teoria di Bohm variabili di diretto e semplice significato fisico, quale gli impulsi delle pamcelle risultano contestuali. Una volta di più ci sembra quindi necessario assumere la posizione indicata da Beli nella citazione precedente. Asserire che una particeUa possiede, nella teoria di Bohm, un impulso preciso significa solo che se la si assoggetta a una misura di impulso tramite un apparecchio il quale ci dà informazioni suU'impulso del sistema misurato, allora queste informazioni saranno codificate nella posizione, per esempio, deU'indice dell'apparecchio (o dei sistemi fisici con cui il sistema misurato ha interagito). Alla fine l'indice finirà in una precisa posizione che noi interpreteremo come: l'impulso della particella è stato trovato avere questo valore. Ma ciò che è vero del mondo "là fuori" è solo il fatto che le particeUe hanno posizioni deánite, sia la particeUa di cui vogliamo misurare l'impulso, che le parti dello "strumento di misura" dopo che esso ha eseguito la misura stessa. La frase "la particella ha questo impulso" indica allora semplicemente "la posizione finale ddl'indice deU'apparecchio che misura l'impulso è questa".

7. La nonlocalità e la disuguaglianza di Beli

John Beli ha sempre mostrato un interesse particolarmente vivo per le implicazioni concettuali della meccanica quantistica e, come egli stesso ha confessato in una sua brillante intervista (Bemstein, 1991), non ha mai condiviso l'interpretazione ortodossa di questa teoria. ,Dopo accanite discussioni con i suoi professori su questo tema, egli, vedendo rafforzarsi la sua convinzione che i padri fondatori del nuovo schema non erano stati capaci di elaborare una visione logicamente coerente dei processi fisici a livdlo microscopico e rendendosi lucidamente conto di quanto potesse risultare rischioso per un giovane studente lasciarsi catturare come dice Feynman "da quel gorgo cieco da cui nessuno è ancora uscito", sceglie deliberatamente di allontanarsi da questi temi e di occuparsi di fisica degli acceleratori. Ma Bdl non cessa di seguire, almeno da attento spettatore,-gli sviluppi nel campo. In seguito commenterà nel modo seguente la teoria dell'onda pilota: «I lavori di Bohm del 1952 sulla meccanica quantistica furono per me una rivelazione. L'eliminazione dell'indeterminismo era stupefacente. Ma, più importante ancora, secondo me, era l'eliminazione della necessità di una vaga divisione del mondo in "sistemi" da una parte e "apparecchi di misura" o "osservatori" dall'altra. Io, da allora, ho sempre pensato che coloro che non hanno colto il senso di quei lavori... e sfortunatamente essi rappresentano la maggioranza... siano in qualche misura handicappati nelle discussioni sul significato della meccanica quantistica». Alcuni anni dopo ribadirà il suo apprezzamento per la teoria di Bohm: «Questa teoria è sperimentalmente equivalente all'ordinaria meccanica quantistica nonrelativistica... ed è razionale, è chiara, è esatta," è in accordo con gli esperimenti e io penso che sia uno scandalo che non la si presenti agli studenti. Perché non lo si fa? Penso che vi siano soprattutto ragioni storiche per questo, ma una delle ragioni sta sicuramente nel fatto che questa teoria elimina praticamente tutti gli aspetti "romantici" della meccanica quantistica. Lo schema rappresenta un controesempio vivente di quasi tutte le cose che raccontiamo al pubblico circa le grandi lezioni della fisica del ventesimo secolo: cose come il principio di indeterminazio~ Per evitare fraintendimenti risulta opportuno precisare che, come egli stesso ha ripetutamente sottolineato, Beli usa il termine esatta, con riferimento a una teoria, per indicare che essa non richiede l'esistenza di osservatori coscienti ma non viene neppure posta in imbarazzo da essi.

488 4.I ondamenti f concettualie leimplicazioni epistemoligiche...

ne — che le particelle non hanno sia velocità che posizioni; cose come il ruolo indispensabile dell'osservatore nella fisica moderna — non ne ha alcuno; cose come l'emergere del caso nella fisica moderna: questa teoria è deterministica e rende conto completamente di tutti i fenomeni quantistici. Allora, cosa c'è che non va in essa?». Per rispondere a quest'ultimo interrogativo conviene fare un passo indietro e seguire lo svùuppo del pensiero di Beli negli anni immediatamente precedenti la derivazione della sua disuguaglianza. Egli osserva che persino Pauli, Rosenfeld ed Heisenberg non sono riusciti a trovare nella teoria di Bohm alcun difetto logico o formale e, per criticarla, si sono dovuti limitare a ciassificarla come metafisica e ideologica. Ma Bdl non teme la speculazione di tipo concettuale: è convinto che ci sia qualche profonda lezione da imparare dall'esistenza stessa di questa teoria e che pertanto risulti doveroso approfondirla. Nell'autunno del 1963 Beli trascorre, assieme alla moglie Mary, un anno sabbatico a Stanford al Centro degli Acceleratori Lineari. La moglie stabilisce immediatamente costruttive collaborazioni col Centro eJohn Beli entra a fare parte del gruppo teorico. Come egli ricorda: «Poco prima di lasciare Ginevra io mi ero di nuovo interessato ai fondamenti della meccanica quantistica, stimolato da varie discussioni con Joseph Jauch, Egli stava cercando di derivare una dimostrazione più generale del teorema di von Neumann. Per me questo era come agitare un telo rosso davanti a un toro. Perciò volevo dimostrare che lui aveva torto e pensavo di avere identificato l'ipotesi insensata nell'argomento di von Neumann. Essendo abbastanza isolato, a Stanford mi fu possibile riprendere a riflettere sulla meccanica quantistica. La mia mente era focalizzata sugli argomenti di Jauch e decisi di fare chiarezza su questo problema e di scrivere un articolo di rassegna sulle variabili nascoste. Nel corso di questo processo mi convinsi sempre più che il vero nodo del problema era quello della località». Difatti, riconsiderando la teoria di Bohm (che costituisce un chiaro controesempio del teorema di von Neumann), egli si rende conto che essa risulta fondamentalmente nonlocale. Eventi che si verificano in un certo punto dello spazio hanno conseguenze istantanee, a livello individuale, in regioni lontanissime. Per esempio, come abbiamo discusso nel precedente paragrafo, la traiettoria di una singola particella in una regione può venire alterata istantaneamente per effetto di un'azione in un'altra regione. Beli si convince che questo è il problema centrale e, rifacendosi all'affermazione con cui si concludeva il lavoro di EPR che la nonlocalità da loro evidenziata sarebbe dovuta risultare solo apparente nello schema teorico "completo" che ancora mancava, si interroga: la nonlocalità è un elemento accidentale legato allo specifico modello dell'onda pilota, oppure ha un senso più profondo? Con estrema

La nonlocalità e la disuguaglianza di Beli 48 9

lucidità egli concentra la sua attenzione sulla formulazione dell'esperimento alla EPR che Bohm stesso aveva proposto. Per questo specifico caso egli cerca di elaborare un modello "alla Bohm", cioè deterministico e in accordo con le previsioni della teoria quantistica, ma che risulti locale. Malgrado tutti i suoi sforzi fallisce. Si chiede allora se non sia possibile dimostrare, del tutto in generale, che risulta impossibile rendere conto delle corrdazioni quantistiche in uno schema locale, e ci riesce, giungendo alla derivazione della sua famosa disuguaglianza. Con sua stessa sorpresa egli ha fornito la prova che i microsistemi, per il solo fatto di ubbidire alle leggi quantistiche, esibiscono dei comportamenti più singolari di quanto chiunque avesse immaginato. La disuguaglianza di Beli è di un'estrema semplicità formale. Prima di derivarla mi sembra appropriato riportare l'osservazione che Abner Shimony fece nel 1990 nel commemorare questo grande scienziato alla conferenza della Società Americana di Filosofia della Scienza (Fine, Forbes e Wessel, 1991): «Il teorema di Beli, per il quale egli è diventato famoso, rappresenta più un trionfo del carattere che dell'intelletto. Non era un teorema difficile da dimostrare sul piano formale. La cosa difficile era rendersi lucidamente conto di cosa era stato capito e di cosa restava oscuro nelle ricerche sulle variabili nascoste. Lonestà di Bdl circa il suo

livello di comprensione gli ha fornito la spinta per concepire e per dimostrare il teorema».

7.1 La richiesta di località secondo Beli Per affrontare il problema che ci accingiamo a discutere conviene innanzi tutto precisare la situazione sperimentale cui faremo riferimento, introdurre opportune notazioni che renderanno più snella la trattazione e rendere assolutamente precisa l'ipotesi di località adottata da Beli stesso nella derivazione della sua disuguaglianza. Il contesto è quello di un esperimento alla EPR nella versione utilizzata da Bohm nel suo libro, vale a dire si considerano due particelle di spin 1/2 che si propagano in direzioni opposte e che sono descritte dallo stato di singoletto di spin. La teoria fornisce precise indicazioni probabilistiche circa gli esiti di ogni tipo di misura, e in particolare circa le misure delle componenti di spin dei due costituenti. Ci interesseremo a misure di spin che coinvolgono uno o entrambi i costituenti e a una situazione in cui le misure si immaginano venire eseguite a tempi tali che non esista il tempo sufficiente affinché un segnale emesso al momento ddl'esecuzione di una delle due misure dalla regione in cui la misura ha luogo raggiunga la regione nella quale il secondo costituente

490 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

viene sottoposto a una misura, prima che essa venga eseguita. Consideriamo un'ipotetica teoria e supponiamo che essa contempli la possibilità di specificare nel modo più esauriente possibile lo stato del sistema e che una tale specificazione completa determini univocamente le probabilità (si badi bene le probabilità — il che significa che l'argomento copre anche il caso di teorie a variabili nascoste non deterministiche e addirittura la meccanica quantistica stessa) degli esiti di qualsiasi misura sul sistema. Supponiamo che uno dei costituenti si trovi nella regione A a destra e l'altro nella regione B a sinistra della regione comune in cui essi vengono prodotti. Indichiamo per semplicità con a e b le direzioni lungo le quali eseguiremo le misure delle componenti di spin per i due sistemi e con u e P due numeri (ciascuno dei quali può assumere solo i valori + 1 o — 1) che rappresentano i soli possibili esiti della misura (nelle solite unità). Infine denotiamo, come abbiamo fatto finora, con il tutte quelle variabili, accessibili o nascoste, che specificano nel modo più esauriente consentito dall'ipotetica teoria in esame lo stato di un sistema fisico individuale. Indichia-

mo infine con il simbolo pq'(a, b; u, P) la probabilità di ottenere gli esiti u e P in un esperimento in cui ai due estremi A e B del dispositivo sperimentale si misurano le componenti di spin delle due particelle nelle direzioni indicate nel caso in cui lo stato del sistema fisico sia caratterizzato dai parametri iL Saremo anche interessati al caso in cui uno solo dei costituenti venga sottoposto al processo di misura. Le probabilità, per un dato il„di ottenere l'esito u (P) allorché si effettui una misura sul sistema in A (in B) e nessuna misura sul sistema in B (in A), verranno indicate con i simboli

pq (a, "; u) e pg('",b; P), rispettivamente. Prima di proseguire vogliamo sottolineare come, anche se non abbiamo fatto alcuna ipotesi di determinismo, non lo abbiamo neppure escluso. Infatti il determinismo richiede che una volta in modo completo lo stato del sistema tutti gli esiti di qualsiasi misura siano determinati con certezza. Esso può quindi venire semplicemente incorporato nello schema in esame assumendo che tutte le funzioni sopra introdotte possano assumere solo i valori 1 (esito certo) oppure 0 (esito impossibile). Passiamo ora a formulare in modo preciso la richiesta di località di Beli che, per tenerla ben distinta da quella di Einstein, indicheremo come L.B.:

spe cificato

L.B.:p" (ab u p) = p (a,"';u)>< p (",b;p)

(7.1)

La relazione appena scritta asserisce che la probabilità di ottenere una coppia di esiti in due processi di misura ai due estremi dell'apparecchio, eventi che sono separati da una distanza di tipo spazio (si veda il capitolo 1), è semplicemente il prodotto delle probabùità di ottenere ciascuno di essi indipendentemente dal fatto che l'altra misura venga eseguita o no.

La nonlocal ità e ladisuguaglianzadiBeli 491

Inutile sottolineare come questa richiesta incorpori (ma renda molto più precisa dal punto di vista matematico e formale) l'idea di Einstein che non possa essere il semplice fatto di eseguire una misura che determina qualche effetto istantaneo nella regione ove si trova l'altro costituente del sistema.

7.2Il teoremadi Beli La derivazione del teorema di Beli risulta alquanto semplice. Si consideri una funzione, tradizionalmente indicata come E~(a, b), definita come la somma delle probabilità di ottenere esiti concordi meno la somma delle probabilità di ottenere esiti discordi quando si eseguano entrambe le misure lungo le direzioni indicate. In termini delle probabilità introdotte nel paragrafo precedente si avrà:

Ez(a,b) = p (a,b;+1,+1)+ p (a,b; — 1,— 1)-

p (a,b;+1,-1) — p (a,b; —1,+1)

(7.2)

Risulta ora molto semplice utilizzare la richiesta L.B. per derivare una disuguaglianza che coinvolge quattro funzioni del tipo Eq(a, b) :

IESI(a,b) — Ez(a,d)l+ IESI(c,b)+ Ez(c,d)l < 2 (

7.3 )

Il calcolo, un po' laborioso ma del tutto elementare è esplicitamente illustrato nel riquadro sottostante.

Derivazione dell'equazione (73) Se si e~srimono le funzioni di probabilità che compaiono nella definizione di Ez(a, b) tenendo conto della condizione L.B. si ottiene:

Ez(a,b) = [p"z(a,";+ll — p z(a,*; — 1)]x[p z(h,"";+ll — p"z(b,'"",-1)] da cui si deriva immediatamente:

Ez(a,h) — Ez(a,d) = [p z(a,'";+ll — p z(a,*; — 1)]x

([p"z(b,";+l) — p'z(k";-1)] - [p'z(d,", +1) — p" l2,"',-11]). z Si ricordi ora che il valore assoluto del prodotto di due numeri è il prodotto dei valori assoluti e si osservi che, poiché in una misura sul costituente ndla regione A si ottiene certamente uno o l'altro dei due soli possibili esiti, si ha:

p z(a,";+ll+ p z(a,"; — 1)= 1

492 4.Ifondamenti concettualie leimplicazioniepistem oligi che.. .

usando la quale il primo fattore dell'equazione precedente diventa;

p «(à, ;+l) — p"«(à,~; — 1) =1 — 2p «(a,'"; —1) Poiché p"«(a,'"", — 1) è certamente compreso tra 0 e 1 (essendo una probabilità) l'espressione appena scritta risulta compresa tra 1 e — 1 e quindi il suo valore assoluto risulta minore o uguale a 1. Ne segue:

I E«(á, b) — E«(à, 2)l essa non fa scattare il contatore, il diaframma non si apre, il gas velenoso non si diffonde nell'ambiente e il nostro gatto continua indisturbato a scorrazzare par la stanza in cui si trova; — se la particella è nello stato ~ essa segue una traiettoria (si pensi al caso del dispositivo di Stern-Gerlach) che la porta ad attivare il contatore. Il diaframma si apre, il gas invade la stanza e il povero gatto muore. Formalmente possiamo al solito riassumere l'intero processo sintetizzando l'evoluzione con una freccia (e indicando con i puntini gli stati del contatore, del gas e cosi via) ; catena di interazioni

p,8...84 (gatto vivo)

~

evoluzione lineare

p,8 ...8 4 ( g atto vivo) (8 . 7a)

catenadiinterazioni

y>8...8 4 ( gatto vivo )

m evoluzione lineare

y z8 .. .8 4 (g a tto morto) (8,7b)

Ilproblema dell'oggettivazione delleproprietà macroscopiche 523

La natura lineare della teoria comporta, come ben sappiamo, che se lo stato iniziale dd microsistema risulta la sovrapposizione lineare con coeflicienti uguali dei due stati pi e ~, l'evoluzione risulterà la seguente: catenadiinterazioni ] l

[y, + y,]O~...®4 (gatto vivo)

m

— [g®...

euolntione tirreare

®4 (gatto vivo ) + tp~ 8... 84 (gatto morto)] (8.7c) L'imbarazzo risulta (almeno a livello psicologico) ancora maggiore di quello sollevato dall'analisi precedente. Lo stato finale è uno stato entangled e quindi rende illegittimo pensare che una delle proprietà associate agli stati dei costituenti sia oggettivamente posseduta da essi. In particolare è illegittimo asserire che il gatto è o vivo, oppure morto. Non solo, se si confronta lo stato di cose col fatto inequivocabile che qualora un osservatore guarda il gatto lo percepisce come o vivo o morto, sembra doversi concludere che è l'osservatore stesso che determina il fato del nostro povero animale. Questo almeno è quanto avrebbe concluso Jordan in accordo con la sua asserzione: «Noi stessi produciamo l'esito della misura». Incidentalmente sottolineiamo che, come discuteremo nd paragrafo 9, von Neumann e Wigner sarebbero giunti alla stessa condusione.

8.7 Dif6coltà nel mettere in evidenza le sovrapposizioni di stati macroscopicamente diversi Prima di passare a discutere i vari tentativi per aggirare le difficoltà connesse con il problema della macro-oggettivazione conviene investigare in modo matematicamente preciso il problema di distinguere uno stato puro da una miscela statistica, con particolare riferimento ai sistemi composti. Per illustrare i termini deHa questione di cui ci occuperemo, consideriamo un generico sistema composto che indicheremo come S + A, e supponiamo che esso si trovi in uno stato puro entangled, del tipo dello stato 6nale

deU'equazione (8.4) che qui riscriviamo: V '

= g c„p, Ox C„

(8.7)

La questione di immediata rilevanza per i nostri scopi è la seguente: come si deve operare, quali procedimenti fisici vanno messi in atto per distinguere lo stato puro in oggetto dalla miscela statistica costituita dall'unione di insiemi puri associati agli stati qr„07< 4„con pesi statistici p, = Ic„l'? Si impongono immediatamente alcune osservazioni: — se la distinzione non risultasse possibile, allora, qualora si pensi che lo stato (8.7) descrive la situazione fisica a misura avvenuta, il problema della

524 4.Ifondamenti concettualie leim plicazioni epistem oligi che...

macro-oggettivazione delle proprietà dell'apparecchio risulterebbe banalmente risolto: basterebbe considerare anziché lo stato in esame la miscela statistica menzionata sopra, per ciascun membro della quale può asserirsi che l'indice dell'apparecchio punta in una e una sola direzione. Ovviamente, questa via d'uscita non risulta praticabile se non si introducono limitazioni dell'insieme delle osservabili; — come discusso nel paragrafo 3.1., la distinzione è, in linea di principio, sicuramente possibile sperimentalmente, qualora si assuma che tutti gli operatori di proiezione dello spazio di Hilbert del sistema composto (o, equivalentemente, tutti g)i operatori autoaggiunti — si pensi alle relative risoluzioni dell'identità) corrispondano a quantità fisicamente misurabili in quanto l'operatore statistico associato allo stato (8.7) è un proiettore, mentre quello associato all'insieme statistico non lo è; — dire che la distinzione risulta possibile è certamente interessante, ma è anche interessante rendersi precisamente conto di cosa essa richieda. Una risposta illuminante al quesito che abbiamo sollevato è fornita dal teorema che presentiamo nel riquadro che segue. Sulla distinguibilità di stati puri da miscele statistiche Consideriamo un sistema composto S + A e limitiamo le nostre considerazioni a un insieme (R"1) di osservabili del costituente A tale che gli operatori autoaggiunti (E"1) a essi associati commutino tutti tra di loro. Sappiamo allora che essi ammetteranno un sistema completo di autovarietà in comune (se l'insieme (E"t,) fosse un sistema completo di osservabili commutanti queste autovarietà risulterebbero monodimensionali, ma, per generalità, non faremo questa assunzione che non risulta in alcun modo necessaria per la dimostrazione). Osserviamo che, sotto le ipotesi fatte, risulta possibile definire un operatore autoaggiunto 7 ", tale che le sue autovarietà P," coincidano con le autovarietà comuni degli operatori (E't,) e che esse siano associate ad autovalori diversi per 7 ": 7 'g, = t„g„9g, e P ," e r c s m t„c t ,. Ne segue immediatamente che qualsiasi osservabile dell'insieme M'"t,) risulta una funzione, nel senso di Dirac, dell'osservabile 7 ". Indichiamo come P," i proiettori sulle autovarietà P". Per la generica funzione P7") di 7 " e per ogni stato V dello spazio di Hilkert %' 8 g' del sistema A + S, vale: 1r(7 ") [W 8 P,"]'P = /ti) [D' 8 P,"1'P,ove W è l'operatore identità nello spazio di Hilbert P' associato al costituente S. Infatti, se (p') è un S.O.N.C. in g' e P,' sono i proiettori sulle relative autovarietà monodimensionali (i quali soddisfano alla relazione

g

P. I

= P ) e analogamente se (g „) è un S.O.N.C. che genera la varietà li-

neare'Pp si ha; [+ Qx P ] P

=gg

( P 8 @ 'P) P Qx @ da cui:

ll problema dell' o gge ttivazionedelleproprietà macroscopiche 525

/(r')[D' SP,"]P = g $ /(tt)g

g

( t t'8 8 " t

((t , 8 8 " , , ' P )t(t , 8 8 "

' ,P) t/'8/ ( r

) St"

= /(tt)P

Si consideri ora l'osservabile di S+ A: r] ' S [f(7") con P)" un arbitrario operatore autoaggiunto di g', e se ne valuti il valore medio sul generico stato 'P di

g'S P". Tenuto conto che V P" =P" si ha allora: k ('P,[8 8 [ r(7 )]'P) = ('P,[r)' 8(t(7 )]X

('P,[r(' 8$(7 )]

SZ 'P) =

P'. SP, 'P) =

P, SP )'P) = g / ( t )(P,[8 OP ] P ) Ig D'altra parte si consideri la miscela statistica M"" con pesip/, g /( t )('P,tt

— I[W I 8 P/,"]'Pl l'

degli stati puri normalizzati :-~ = [L' S P/,"]'PII I [L'O)( Pt.']'PII. Per una sif-

fatta miscela il valore medio ddl'osservabile [/(" 8 [t(7 ")] risulta:

,([ 'S P ,"]'P,[8'S]t'(7 )][L'SP,]'P) Il[F' S P,"]'Pll'

$ g(t/,)([E SP $ /(t/,)('P,d' [E

]P,/i [E SP,"]P)=$ (t(tp)(P,[E SP ]/l'P' S P ,"]P)=

y /(t,)('P,tf'[E'

S P" ]'P)= y /(t,)('P,[ff' S P" ]'P)

S Pq ]'P) =

Nella catena di eguaglianze appena considerata si è tenuto conto dell'autoaggiuntezza e ddl'idempotenza degli operatori di proiezione e del fatto che l'operatore identità commuta con qualsiasi operatore. Il confronto di questa equazione con la precedente mostra che lo stato puro 'P e la miscela statistica M'" attribuiscono gli stessi valori medi a tutti gli operatori del sistema S+ A del tipo I//I" S P7 )], ove /f' è un qualsiasi operatore autoaggiunto di P' e tt(7') un membro qualsiasi della famiglia di operatori autoaggiunti commutanti di "p" che abbiamo preso in considerazione. Si noti che gli stati della miscela statistica M"" sono tali che per ciascuno di essi tutte le osservabili

[t(7 ") del sistema A hanno valori de6niti. L'analisi formale appena sviluppata ci fornisce un complesso di informazioni di grande rilievo che passiamo a elencare: a) Se, per qualche ragione, si dovesse essere condotti ad ammettere che per uno dei due costituenti (che nella nostra analisi è stato identificato col sistema A in quanto esso rappresenta l'apparecchio di misura) non risulta possibile misurare osservabili i cui operatori associan non commutano, allora non risulterebbe possibile distinguere lo stato 'P dalla miscda stati-

526 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

stica M'" per la quale tutti i suoi membri individuali possiedono proprietà de6nite relative a tutta la classe delle osservabili fisicamente significative per il sistema A. b). Come caso particolare, con riferimento al problema della misura, se

si limitano le proprie considerazioni alla sola osservabile indice dell'apparecchio, allora potrebbe dirsi che l'indice punta, per tutti i membri dell'insieme a valori definiti (e rispettando le probabilità circa gli esiti implicate

dal formalismo). c) Ancora come caso particolare, se si immayna di non volersi occupare di uno dei costituenti (per cui non si eseguono misure su di esso, né misure di correlazione), allora non è possibile distinguere lo stato puro dalla miscela statistica: nella prospettiva dello studio dell'evoluzione successiva del solo sistema misurato, il postulato della riduzione del pacchetto risulta quindi appropriato. d) Le considerazioni ora svolte possono immediatamente generalizzarsi al caso dello stato finale dell'ipotetica catena di von Neumann. Conseguentemente se in uno qualsiasi degli stadi della catena si ignora uno dei costituenti o si suppone che risulti impossibile misurare su di esso osservabili incompatibili, ancora una volta si può, per le implicazioni fisiche della teoria, sostituire lo stato puro con la miscela statistica.

Concludendo, con riferimento allo stato anale della (8.6), la possibilità pratica di mettere in evidenza che, di fatto, la situazione fisica è appropriatamente descritta dall'imbarazzante sovrapposizione che compare a destra dell'equazione, richiede che si possano effettuare misure di correlazione che interessano tutti i costituenti e, per di più, che siffatte misure coinvolgano osservabili incompatibili con quelle i cui autostati sono gli stati q)„, @„, :-„..., Q„che compaiono appunto a destra della (8.6). Se si pensa quanto risulti problematico eseguire misure di correlazione per due microcostituenti di un sistema composto (si ricordino gli esperimenti del tipo di quelli di Aspect) e si tiene conto che i sistemi coinvolti in un processo di misura risultano inevitabilmente in interazione con l'ambiente circostante, ci si convince immediatamente che il problema che stiamo analizzando è un problema squisitamente concettuale che ha scarsa rilevanza pratica. Come ha sempre ammesso Beli, si deve riconoscere (Beli, 1990) che: «La meccanica quantistica ordinaria, per quanto ne so, risulta perfettamente appropriata per tutti i fini p >. Ma la teoria prevede che lo stato finale è lo stato puro e non la miscela statistica e questo comporta che a un certo livello si debba fare il salto concettuale di sostituire uno con l'altra. Il fatto che la teoria non precisi ove debba porsi questa linea di demarcazione tra il nebuloso mondo quantistico e il mondo degli eventi precisi è (Beli, 1989): «11 problema della meccanica quantistica. Esso non

rati'

Il problema dell'oggettivaziorte delle proprietà macroscopiche 527

rappresenta un problema dal punto di vista pratico — in pratica noi pòssiamo collocare la linea di demarcazione giudiziosamente in modo che non risulti molto importante spostarla leggermente. Ma ogni volta che noi poniamo questa hnea di con6ne — e noi dobbiamo definirla — allora dividiamo arbitrariamente il mondo in due parti che richiedono due descrizioni del tutto differenti. Questa è un'approssimazione, ed essa risulta sufficiente per tutti gli scopi pratici, e forse risulterà tale per sempre, ma io penso comunque che è estremamente interessante vedere se questa incertezza è imposta dagli esperimenti oppure è solo una cattiva abitudine che noi abbiamo preso». Nel prossimo paragrafo vedremo come diversi pensatori abbiano mostrato una diversa sensibilità ai quesiti cosi ben riassunti dalle frasi di Beli appena riportate e quali vie siano state suggerite per superare la fondamentale difficoltà che esse mettono in luce.

9. Il dibattito attuale sulle implicazionidella teoria

Il paragrafo 8 è stato interamente dedicato a mettere in evidenza le diScoltà di principio che la teoria incontra nella descrizione dei processi di misura e, più in generale, nel rendere conto delle nostre percezioni circa il comportamento dei sistemi macroscopici. Abbiamo anche segnalato come questo problema sia stato al centro di un vivace dibattito fin dagli anni trenta e abbia avuto vicende alterne. Malgrado vari autori, anche di grande statura scientifica, abbiano negato che questo sia di fatto un problema, negli ultimi anni è emerso un consenso sempre più diffuso tra gli esperti nel campo circa il fatto che la meccanica quantistica, nella sua versione ortodossa, non è in grado di fornire un quadro concettualmente soddisfacente dello svolgersi dei processi naturali. Il problema della macro-oggettivazione viene riconosciuto come un serio problema scientifico che va affrontato, analizzato e risolto in termini scientifici: la formulazione ortodossa va per lo meno arricchita con nuove precise ipotesi interpretative se non addirittura modificata. Recentemente si è persino giunti a contemplare modelli teorici che si qualificano come rivali della meccanica quantistica standard nel senso che, almeno in linea di principio, essi hanno implicazioni fisiche diverse e quindi potrebbero suggerire esperimenti cruciali mirati appunto a identificare il dominio oltre il quale il principio di sovrapposizione verrebbe a cadere. In questo paragrafo passeremo in rassegna le proposte (a nostro parere) più interessanti che sono tuttora al centro del dibattito sui fondamenti concettuali della teoria. Come il lettore avrà intuito, il problema è ben lontano dall'avere trovato una soluzione che risulti unanimemente accettata. Ci stiamo quindi avventurando in un campo ancora in corso di evoluzione che sicuramente rappresenta per tutti coloro che sono interessati al senso e al valore della conoscenza scientifica uno dei temi più affascinanti della ricerca attuale. Richiamiamo i termini essenziali del problema. La natura lineare della teoria ci costringe ad ammettere che sovrapposizioni lineari di stati corrispondenti a situazioni macroscopicamente distinguibili possono darsi e anzi si danno. Questo ci spinge ad affrontare il problema della macrooggettivazione delle proprietà dei sistemi fisici: a un opportuno livello una o l'altra delle proprietà macroscopiche diverse che risultano potenzialmente possedute dal sistema deve diventare attuale. Ma un processo siffatto non trova spazio nello schema ortodosso. Come già ripetutamente

Il dibattito attuale sulleimplicazioni della teoria 529

menzionato alcuni pensatori hanno proposto varie vie d'uscita a questa imbarazzante situazione. Ci sembra opportuno organizzare le proposte più rilevanti collocandole in una struttura ad albero le cui varie ramificazioni corrispondono ai punti cruciali in cui esse differiscono dalla teoria standard e tra di loro. Nella figura 9.1 si è tracciato uno schematico diagramma che può risultare utile per seguire il nostro argomentare in questo paragrafo conclusivo. Per consentire al lettore di cogliere il vero senso delle varie proposte conviene ricordare che gli ingredienti essenziali della teoria che è l'oggetto di questo capitolo sono gli stati che lo schema utilizza per la descrizione dei sistemi fisici (vale a dire gli elementi dello spazio di Hilbett appropriato per il sistema in esame), k osservabili fisiche dei sistemi stessi (vale a dire l'insieme degli operatori autoaggiunti che corrispondono a grandezze fisiche con o senza analogo classico e che si suppongono in linea di principio misurabili) e infine la dinamica dei sistemi, vale a dire la legge di evoluzione di Schrodinger per gli stati stessi.

9.1 Una prima distinzionedelle possibili vie d'uscita: l'ipotesi di completezza della teoria Gli stati. Una prima classificazion delle alternative che sono state proposte si basa sulla considerazione del ruolo che si assegna al vettore di stato, più precisamente se si suppone che esso fornisca la più accurata caratterizzazione possibile dello stato di un sistema fisico individuale (o, di un insieme quantisticamente omogeneo) oppure se, almeno in linea di principio, risulti possibile una più accurata specificazione. La prima articolazione del nostro albero (fig. 9.1) fa quindi riferimento alla scelta tra l'assunzione che la teoria risulti completa oppure, come suggerito da Einstein e da tanti altri, che essa sia fondamentalmente incompleta. Analizziamo la seconda possibilità. — La meccanica quantistica è una teoria incompleta: la specificazione dello stato di un sistema per mezzo del vettore di stato è insufficiente, esistono ulteriori parametri che caratterizzano la situazione fisica, la specificazione dei quali consentirebbe di conoscere i valori di tutte le grandezze fisiche del sistema in esame, sia esso microscopico o macroscopico. Come il lettore avrà colto chiaramente, scegliere questa linea di pensiero equivale ad aderire al programma delle variabili nascoste. Poiché approcci di questo tipo sono stati ampiamente analizzati nel paragrafo 6 non ci dilungheremo a discutere questa alternativa, ma ci limiteremo a richiamame le caratteristiche concettualmente salienti.

530 4. 1 fondamenti concettuali eleimplicazioni epistemoligiche...

Il dcltorr di statofornisce la descrizione complma dello stato del sisrcmat

No



Incompletezza

Completezza della teoria

della teoria Teories variabili nascoste, contestuslità, mlcrorealismo Insieme lormalmente omogeneo ma Ssicsmente disomo anco

Insieme formalmentc omogeneo e anche lisicamente orno anco

Assunzionicirca le osrerooblli

Limitazioni deB'osservabilità

Aonura ddla connessione

Assunzioni airesl'evoluzione

Due principi di evoluzione

Unssola dinamica

Riduzione Ridusione del da parte ddla psccheno coscienza

Teorie unlrlceul dl

Moltiplicazione degli untversl

autovcuorc. proprietà

ne le

Tuttele osservabili

Interprerasioni

sono

Sotlu

modali del formalismo

b s anr e mpalibli

praticomeale

quantistico

Interprerszione Inrerprerazione a molti universi amoltementi

riduzione dinamica

mmpatibli

Le storie uuuistiche

Controddinorm Consisterrte n si anuarc aad poslriortc rlrameetalitla nlcd id Senescenza

sncali/ios

Comporto and

drrcririonr paniaimerrte atabigad deik proprietà "postedute

Moitlphca gh enti in modo ioaccessibiie

Richil de pecr iian' ipotesi ciror i protesti prrcclllel

Comporta

Assegna

uud

d(i osscnldtorc

descri uoee duaiisrica panlaioreate

comicdlc ua lucio asroiulomcule

ambigua

prolaiadntr

Ha an carenare /caoelenoiogicm Rende porsibik aad posizione Iadcrorediista

fig, 9.L L'albero che riassume le diverse posizioni più significative che sono state assunte per superare le difficoltà concettuali del formalismo. Come indicato nel testo risulta opportuno articolare le varie scelte facendo riferimento alla posizione che essi assumono rispetto allo stato logico e concettuale degli elementi di base dd formalismo, gli stati, le osservabili n fisiche e la dinalnica. Nel diagramma l'approccio recente noto come le storie quantistiche" è stato indicato in modo tratteggiato, non per diminuirne la rilevanza ma perché, come vedremo, esso viene a collocarsi, in accordo con le diverse posizioni di coloro che lo adottano, in una posizione in qualche misura intermedia tra altre posizioni ciassificate in modo più preciso sulla base dei criteri che abbiamo adottato.

Innanzi tutto il programma può essere coerentemente sviluppato, l'esempio più chiaro ed esplicito di una sua implementazione è dato dalla teoria di de Broglie-Bohm. In uno schema siffatto tutte le osservabili fisiche hanno valori perfettamente definiti una volta specificate le variabili nascoste del sistema, quindi il problema deHa macro-oggettivazione non si presenta. Non possiamo tuttavia ignorare un fatto (a nostro parere) di

Il dibattito attuale sulleimplicazioni della teoria 53 1

estremo rilievo concettuale, vale a dire la contestualità delle osservabili. Come abbiamo sottolineato nei paragrafi 6.5-6.7 essa consiste nel fatto che il valore di verità di asserzioni circa la più parte ddle proprietà "oggettivamente possedute dal sistema" non è univocamente determinato dall'assegnazione delle variabili nascoste ma dipende, anche in modo nonlocale, da tutto il contesto. A noi sembra che questo fatto richieda un serio ridimensionamento delle pretese che hanno motivato il programma in esame. Personalmente siamo convinti che una riflessione critica circa il senso della contestualità conduca, se si vuole essere rigorosi sul piano logico e concettuale, ad attribuire uno stato realmente oggettivo solo a quelle variabili (e abbiamo sottolineato che se ne può sempre scegliere un insieme sufficientemente ricco) che risultano noncontestuali. Questo è il prezzo da pagare per seguire questa via: ciò di cui la teoria parla, ciò che è "oggettivamente vero" del mondo "la fuori", sono le grandezze noncontestuali. Cosi, per esempio, il modello di Bohm descrive il mondo in termini delle posizioni di tutte le particelle le quali percorrono ben precise traiettorie: qualunque asserzione circa proprietà oggettivamente possedute è, in de6nitiva, un'asserzione circa le posizioni dei microcostituenti di tutto l'universo. È allora semplice illustrare come approcci di questo tipo risolvano il problema ddla macro-oggettivazione: nella teoria di Bohm uno stato quale quello a destra dell'equazione (8.4) che qui riscriviamo lyp S@p

=

c„e J]SSp r

[g

irrteragione S+A

~

evoluzione lineare

g c,y„ S S ,

(9.1i

nel quale, come ampiamente discusso nel paragrafo 8.2, gli stati @„dell'apparecchio corrispondono a diverse posizioni del suo indice macroscopico, non dà luogo ad alcun problema interpretativo. Anche se la funzione d'onda del sistema è una sovrapposizione di stati per i quali l'indice dell'apparecchio punta in diverse direzioni, ciononostante esso punta, di fatto, in una ben precisa direzione univocamente determinata dalle variabili nascoste. Non si dovrà mai fare ricorso al fenomeno della riduzione del pacchetto: una successiva misura porterà dalla (9.1) ai successivi stati della catena di von Neumann, ma, di nuovo, poiché i termini della combinazione lineare corrispondono a diverse posizioni di almeno una particella, la situazione reale, quella che noi percepiamo, sarà quella associata a uno solo dei termini della sovrapposizione. Inutile dire che la teoria non incontra alcuna difficoltà neppure nel trattare l'imbarazzante situazione del povero gatto di Schrodinger: sicuramente molte particelle risulteranno in posizioni differenti nello stato di gatto vivo e in quello di gatto morto, quindi, pur essendo assolutamente corret-

532 4.I ondamenti f concettualie leimplicazioniepistem oli giche...

to associare alla situazione fisica la sovrapposizione dei due stati in questione, il gatto è, di fatto, o vivo oppure morto. Conviene concludere questa analisi con una puntualizzazione. Si faccia riferimento a un oggetto macroscopico quale l'indice di un apparecchio e si supponga che esso sia descritto da una funzione d'onda che è la sovrapposizione di due stati diversamente localizzati. Sappiamo però che, di fatto, l'indice è in una delle due posizioni compatibili con lo stato in esame. Come si configura all'interno del modello il processo di riduzione del pacchetto della teoria standard che porta alla soppressione di uno dei due termini della sovrapposizione? Ovviamente esso rappresenta un'approssimazione in quanto ignorare il contributo che il termine soppresso darebbe al potenziale quantomeccanico significa certamente trascurare effetti fisici reali. Ma, come il lettore avrà intuito, la teoria ha molti aspetti benigni. Innanzitutto, una descrizione sensata e in accordo con le nostre percezioni non richiede affatto, a differenza dd formalismo quantistico standard, di fare ricorso all'approssimazione in questione: anche se la funzione d'onda è diversa da zero in due regioni diverse, l'indice macroscopico è realmente in una posizione precisa. secondariamente all'interno dello schema teorico possono valutarsi esplicitamente le conseguenze dell'ignorare la funzione d'onda nella regione ove il sistema non si trova. E, nel caso macroscopico, questa approssimazione risulta estremamente accurata, potremmo dire altrettanto accurata di quanto risulti, nello schema classico, utilizzare le equazioni irreversibili della termodinamica per descrivere l'evoluzione di un gas a dispetto del fatto che la meccanica

classica che governa il processo è perfettamente reversibile. Infine, la teoria permette di identificare ove vada posto il confine tra micro e macro, reversibile e irreversibile, quantistico e classico e, nella regione di transizione (quindi per esempio quando si abbia un sistema con relativamente pochi costituenti che si trova in un posto preciso ma è descritto da una funzione d'onda che è diversa da zero anche altrove), di valutare le implicazioni, per l'evoluzione successiva del sistema, del fatto di ignorare il contributo al potenziale quantomeccanico di parti della funzione d'onda, tipicamente qudle lontane dal posto in cui il sistema si trova. In altre parole, purché si accetti che l'unica cosa di cui la teoria parla sono, appunto, le posizioni, la teoria è, come ha detto Beli, «sperimentalmente equivalente all'ordinaria meccanica quantistica nonrelativistica... ed è razionale, è chiara,è esatta». Veniamo ora ad analizzare l'altra alternativa tra le due indicate precedentemente, cioè quella che considera esauriente la descrizione degli stati dei sistemi fisici in termini della sola funzione d'onda. In altre parole indaghiamo le implicazioni dell'assunzione che la teoria sia completa.

Il dibattito attuale sulleimplicazioni della teoria 533

9.2 Completezza della teoria e omogeneità o disomogeneità degli insiemi quantistici Supponiamo quindi che la teoria sia completa e. consideriamo un sistema individuale o un insieme quantisticamente omogeneo (vale a dire un insieme di sistemi che sono tutti descritti dallo stesso vettore di stato). L'omogeneità cui stiamo facendo riferimento potrebbe qualificarsi più appropriatamente come un'omogeneità formale: poiché l'assunzione di completezza comporta l'impossibilità di specificare in modo più preciso la situazione fisica e poiché il vettore di stato è lo stesso per tutti i membri dell'insieme, nulla può distinguere un sistema dall'altro. Ma, come chiariremo fra poco, questa omogeneità formale non impedisce, di per sé, di supporre che l'insieme sia fisicamente disomogeneo qualora si facciano opportune assunzioni circa le osservabili dei sistemi in esame. Quindi ci troviamo ora di fronte a un nuovo bivio: insiemi formalmente omogenei potrebbero descrivere insiemi che risultano omogenei anche fisicamente oppure insiemi che tali non sono. Per comprendere questo punto cruciale

conviene riferirei subito alla seconda alternativa. Le osservabili. Per cogliere il significato di quanto appena asserito basta rifarsi alle conclusioni del paragrafo 8.7 circa la distinguibilità tra stati puri e miscele statistiche. Supponiamo che a un certo liveHo (che per ora non occorre precisare) non risulti possibile (in linea di principio e non per ragioni puramente pratiche) misurare tutte le grandezze fisiche che corrispondono a tutti gli operatori autoaggiunti di uno dei costituenti dei sistemi che entrano in gioco nel processo di cui ci stiamo occupando. Per semplicità, ci rifaremo ancora all'equazione (9.1) e supporremo che le sole quantità osservabili dell'apparecchio A risultino commutare tutte tra di loro. Allora, in accordo con l'analisi del paragrafo 8.7 sappiamo che, se si indica come &tp l'operatore statistico associato al caso puro corrispondente allo stato 'P '" = Y ~

r

c, y , O>< C„e come &~r l'operatore statistico associa-

to alla miscela statistica con pesi pr, — IIIX' S P~]'P'"II' degli stati puri Pt,"]'P""I I, ove gli operatori P~' normalizzati :-~ = i D' O>t(tslp (p) P(a) — iH t(/b~ k(a)

k(+ ) ] (p( k(a)

(p))

(9.6)

A questo punto basta ricordare la simmetria e l'idempotenza degli operatori di proiezione per ottenere:

P[t„u, k(u)] = (e '""' l'(0), P'„',e '""' 'P(0))

(9 ~)

Supponiamo ora di sommare le probabilità in oggetto su tutti i valori di

k(u). Dall'equazione Y P ' ~k (a)

Q„,,P( ti,u,k(u ))

' = $ si ha allora

k ( a)

= (e ' " 'P(0),e ' " 'P(0)) = ('P(0),'P(0)) =1 (9.())

ove si è tenuto conto che l'operatore di evoluzione è unitario. La relazione (9.8) ha un ovvio significato in meccanica quantistica standard: essa asserisce semplicemente che se si misura l'osservabile ()t, si otterrà certamente uno dei possibili esiti. Ma l'esempio banale appena considerato illustra chiaramente le difficoltà che l'interpretazione incontra. Tra le possibili famiglie di storie che possiamo considerare vi è anche quella che è perfettamente analoga a quella ora analizzata ma che si riferisce a una diversa osservabile. E allora, se anche questa famiglia di storie trovasse posto, assieme a quella precedentemente considerata, tra le possibili famiglie, la somma delle probabilità associate a tutte le storie ddla famiglia, che è l'unione delle due famiglie considerate, risulterebbe uguale a 2, un fatto inaccettabile per una funzione probabilità su un insieme di eventi aleatori. Quale via d'uscita si propone da questa imbarazzante situazione? La risposta è semplice: non risulta lecito considerare tutte le possibili storie quantistiche assieme, esse vanno raggruppate in famiglie "di storie alternative decoerenti" in modo tale che, limitando le proprie considerazioni a tutti i membri di una qualsiasi famiglia sBatta non si entri mai in conflitto con le richieste della teoria della probabilità. Risulta possibile caratterizzare in modo matematicamente preciso la condizione cui devono soddisfare le storie di una famiglia per risultare decoerenti. A questo scopo consideriamo la famiglia [(tt', g); ..., (tz, P); (t(, ul] una notazione sintetica per indicare l'insieme di tutte le storie ([ttt, g, ttt(g); ...; tz, j(p) ; t), a, k((z)] ) ottenute scegliendo in tutti i modi possibili (compatibi-

P,

li con i relativi spettri) i valori [m(g) ; ...; j(p), k(n)] e consideriamo il cosiddetto funzionale di decoerenza:

Il dibattito attuale sulle implicazioni della teoria 545 +iHt>lbp(a) +iH(sg — s~)lbp(p) r(C)

P(() -i H ( tq — sg-1)lh P(P) " ' j (p) rrs(()

+i H ( t n - trri )lh

s(p) " ' IH(sp s))lbp(a) —iHsilh

k(a)

+(())

(9 9)

Se questa espressione risulta nulla ogniqualvolta almeno uno degli indici r, s,... risulta diverso dal corrispondente indice k, j,..., allora può mostrarsi che l'insieme delle probabilità associate alla famiglia in esame risulta consistente.

Speriamo di essere riusciti a dare un quadro chiaro dello schema interpretativo. In linea di principio si possono considerare tutte le concepibili storie, vale a dire si possono fare asserzioni circa le proprietà oggettivamente possedute dal sistema fisico in un'arbitraria successione temporale. A ciascuna storia è associata in modo perfettamente definito una ben precisa probabilità. Tuttavia, se non si vuole entrare in conflitto con irrinunciabili richieste sull'insieme ddle probabilità di eventi aleatori, si devono raggruppare le storie in famiglie di storie compatibili, tecnicamente di sto-

rie alternative decoerenti. All'interno di ciascuna famiglia l'interpretazione probabilistica è possibile e risulta corretta. Ma l'inclusione in una famiglia di storie compatibili di una storia appartenente a un'altra famiglia porta a contraddizioni. Questo è il quadro generale. Per non appesantire la trattazione ci limiteremo a indicare le diverse posizioni che sono state prese da vari sostenitori di questo approccio, aiutandoci, per illustrarle, con un esempio banalissimo che mette in qualche modo in relazione la proposta che stiamo considerando con le analisi del paragrafo 9.2. Supponiamo che per qualche motivo che non intendiamo specificare, le sole osservabili che entrano nelle storie che consideriamo risultino compatibili tra di loro e compatibili con l'hamiltoniana del sistema. È allora immediato verificare che tutte le storie risultano decoerenti, infatti gli operatori nell'espressione (9.9) si possono commutare tra di loro. Facendo questo tutti gli operatori di evoluzione spariscono per l'unitarietà e, se compaiono due indici diversi, i relativi proiettori risultano ortogonali, per cui l'espressione (9.9) risulta nulla. Le ipotesi (ovviamente eccessive) che abbiamo fatto sono precisamente quelle che, se potessero assumersi consistentemente, renderebbero possibile la

soluzione che abbiamo considerato all'inizio del paragrafo (9.2). E allora si capirà anche perché i sostenitori dell'interpretazione a storie quantistiche sostengono che qualora le storie vengano riferite a sistemi macroscopici (o addirittura a tutto l'universo) l'interpretazione risulta accettabile. Questa asserzione è tanto più corretta quanto più si ritiene impossibile rivelare (confrontando gli esiti di misure di appropriate osservabili) le sovrapposizioni di stati macroscopicamente distinguibili. Infatti per poter fare ciò risulta necessario misurare osservabili macroscopiche

546 4.I ondamenti f concettualie leimplicazioni epistem oligi che...

incompatibili le cui autovarietà macroscopicamente differenti risultino connesse dall'evoluzione. Nel senso in cui la soluzione pragmatica indicata nella parte conclusiva del paragrafo 9.2 è corretta, risulta anche corretta la descrizione a storie quantistiche, anzi, essa presenta il vantaggio di organizzare, per cosi dire, la descrizione là presentata che si configura come una descrizione a vari istanti ma in cui le situazioni a istanti diversi non sono connesse, in quello che potrebbe definirsi una specie di film delle situazioni a tempi diversi. La presentazione che abbiamo dato deH'interpretazione a storie quantistiche non è quella adottata da tutti i suoi sostenitori. Geli Mann e Hartle insistono nel limitare la considerazione deUe storie quantistiche a storie di tutto l'universo e motivano la decoerenza proprio con l'impossibilità pratica di mettere in evidenza sovrapposizioni di stati diversi dell'universo. Zurek e altri pensatori leggono invece questo approccio come un'articolazione della posizione a molti universi dd paragrafo 9.5: ogni famiglia di storie decoerenti sarebbe associata a un diverso universo. Poiché universi diversi non possono interagire tra loro, non si corre mai il rischio dell'inconsistenza che nasce dalla considerazione di storie appartenenti a diversi insiemi di storie decoerenti. Infine Omnés assume rigidamente la posizione delle storie quantistiche come valida anche per i microsistemi (e quindi per situazioni nelle quali risulta sicuramente possibile considerare storie incompatibili). Le contraddizioni con le richieste irrinunciabili della teoria della probabilità non rappresentano per questo autore un problema: egli stesso dichiara che se si adotta questa prospettiva si deve rinunciare alla logica usuale. Nella letteratura sono apparsi molti lavori che hanno focalizzato le più serie limitazioni di questo punto di vista. Per una loro analisi rimandiamo al recente lavoro di Dowker e Kent. Il fatto che l'interpretazione discussa in questo paragrafo si presti a letture diverse che hanno strette rdazioni, anche se esibiscono rilevanti differenze, con quelle analizzate in altri paragrafi ci ha spinti a collocare l'interpretazione a storie quantistiche in un certo senso a margine nel nostro diagramma ad albero. Questo non deve essere in alcun modo inteso come una sottovalutazione di questo interessante approccio.

9.6. L'oggettivazione come un processo dinamico: approcci dualistico e unificato Siamo giunti cosi all'ultimo gruppo di proposte che sono state avanzate per superare il problema dell'oggettivazione delle proprietà macroscopiche. Come già anticipato questi tentativi fanno riferimento all'ultimo degli

Il dibattito attuale sulle implicazioni della teoria

54 7

aspetti formali basilari dello schema teorico, l'equazionedinamica che governa l'evoluzione degli stati. Per introdurre la linea di pensiero che seguiremo in quest'ultima parte del paragrafo conviene ricordare la posizione dei padri fondatori della teoria, in particolar modo quella di Bohr. In sostanza essa si traduce ndl'asserzione che la considerazione di sistemi classici rappresenta un prerequisitò logico indispensabile per la formulazione stessa della teoria. Corrispondentemente, il mondo viene diviso in due classi di processi o di sistemi, quelli governati dalle leggi quantistiche

e per i quali vale il principio di sovrapposizione e quelli per i quali risulta necessaria una descrizione classica e quindi, in particolare, per cui non possono darsi sovrapposizioni. L'esempio paradigmatico di siffatti sistemi è rappresentato dagli apparecchi di misura: essi sono sistemi genuinamente classici che si trovano sempre in situazioni corrispondenti a ben precise e definite proprietà macroscopiche. Ma, come ben sappiamo, sorge allora una domanda: come può accadere che per siffatti sistemi non valga il principio di sovrapposizione? A quale stadio avviene la transizione dal comportamento quantistico a quello classico? Come possono oggettivarsi le potenzialità di un sistema macroscopico? Abbiamo visto come Bohr ha dovuto destreggiarsi per sfuggire ai pressanti attacchi di Einstein circa questo punto cruciale, come egli si è visto costretto a sfumare la regione di transizione includendo nel mondo quantistico anche parti macroscopiche dell'apparecchio e come, sopratutto, abbia sempre cercato di evadere la questione che stiamo trattando richiamandosi di continuo alla non ben definita idea di complementarità. Ma a parte queste zone d'ombra che non sono facilmente eliminabili risulta chiaro, in ultima analisi, quale sia la posizione universalmente accettata dall'interpretazione ortodossa: si accetta semplicemente che l'equazione di Schrodinger non abbia validità universale. Esistono due principi di evoluzione fondamentamentalmente diversi, quello lineare e deterministico che governa le interazioni fra sistemi genuinamente quantistici e la riduzione del pacchetto che avviene allorchè un microsistema innesca un processo che porta a situazioni macroscopicamente distinguibili, Questo ultimo processo risulta, come ripetutamente segnalato, stocastico e nonlineare. Quindi si accetta una modifica della dinamica della teoria, anche se resta non ben precisato quali sistemi ubbidiscano a questa diversa legge dinamica. Nel prossimo paragrafo vedremo come von Neumann e Wigner hanno cercato di rispondere a questo fondamentale quesito pur accettando una descrizione dualistica dell'evoluzione. In quello successivo illustreremo come recentemente si è adottato un radicale cambiamento di prospettiva: l'equazione di Schrodinger viene modificata con l'introduzione di elementi stocastici e non lineari a livello basilare, quindi anche per i sistemi micro-

548 4.Ifondamenti concettualie le implicazioniepistem oligiche.. .

scopici. L'approccio cerca di introdurre le modifiche ora menzionate in modo da non contraddire alcun fatto noto ma da far si che l'unico e universale principio dinamico che si considera, comporti automaticamente la riduzione del pacchetto in situazioni del tipo di quelle che si presentano nei processi di misura e, del tutto in generale, la soppressione dinamica delle sovrapposizioni di stati macroscopicamente distinguibili.

9.7 La riduzione da parte della coscienza e l'amico di Wigner Ispirato dalle osservazioni e dai suggerimenti di von Neumann, Wigner affronta con maggior decisione il problema dell'identi6cazione della linea di demarcazione tra le due dassi di processi menzionati sopra, processi che richiedono un trattamento completamente diverso, Questo acuto pensatore ha ben chiaro che la teoria non contiene in sé alcun elemento formale che definisca in qualche modo questo limite. E allora immagina di considerare una catena di von Neumann che contenga di fatto due osservatori. Descriviamo esplicitamente la situazione che egli considera, speci6cando i vari passi del suo argomentare e facendo, per semplicità, riferimento al caso in cui lo stato iniziale del sistema misurato sia la sovrapposizione con pesi uguali di due soli autostati yI e ~ relativi, rispettivamente agli autovalori f> e fz dell'operatore autoaggiunto &che rappresenta l'osservabile F che intendiamo misurare. Supponiamo inoltre che la catena di von Neumann preveda, negli stadi finali, che un amico di Wigner osservi l'esito della misura guardando l'indice di un opportuno apparecchio e che Wigner stesso interroghi il suo amico. Seguiamo lo svolgersi dd processo nei suoi vari passi. Primo stadio — stato iniziale:

V(0) =

1

[pi+ Pz]8@o8.. . 8Ao 8Q p

72

(9.10 )

Nell'espressione a destra di questa equazione t1Io è lo stato del contatore il cui indice punta nella posizione 0, cioè qudlo in cui l'apparecchio è pronto a eseguire la misura, Ao è lo stato dell'amico di Wigner che non ha osservato l'apparecchio e Qo lo stato di Wigner prima che egli interroghi il suo amico. Secondo stadio — il sistema interagisce col rilevatore ù cui indice finisce in una posizione diversa a seconda dello stato che innesca il processo:

P(1) =

1 2

[ p> 8 4> + pz 8@g]8...8Ao 8 Qp

(9.1 1 )

Il dibattito attuale sulleimplicazioni della teoria 54 9

Terzo stadio — l'amico di Wigner osserva l'apparecchio: P(1) =

1

[y> Ox C)>Ox OxAt y y> Ox C)>S SA>] S

Q

( 9 .12)

ove, ovviamente, abbiamo indicato come A> e Az i due stati deH'amico di Wigner che corrispondono al fatto che egli percepisce che l'indice dell'apparecchio indica r< oppure rz, rispettivamente. Con riferimento a quest'ultimo stato (9.12) Wigner solleva la questione: risulta ragionevole supporre che le cose stiano come implicato dal vettore ora considerato, in particolare che il mio amico non possa ritenersi avere una percezione definita circa la posizione dell'indice? E allora Wigner passa a considerare lo stadio finale della catena, quello in cui egli "tenta di determinare" lo stato del suo amico, di sottoporlo a un processo di misura. Il modo ovvio risulta quello di chiedergli ove, secondo lui, si trovi l'indice. L'argomento prosegue in modo chiaro e lineare: — Wigner sa con certezza che egli otterrà una sola e ben precisa risposta. Il suo amico viene quindi ridotto dal tentativo che egli fa di accertame lo stato a uno dei due termini della sovrapposizione. Almeno allo stadio che stiamo considerando, Wigner non può nutrire alcun dubbio circa il fatto che il processo di riduzione abbia avuto luogo: egli sa che, salvo allucinazioni, riceverà una risposta precisa. — È in qualche modo accettabile pensare che sia stato l'atto di Wigner a produrre la riduzione? Ovviamente no, per due fondati motivi. Da un lato assumere questa prospettiva costringerebbe Wigner in una posizione solipsistica estrema: egli può parlare solo delle sue percezioni. Per di più Wigner non si sente legittimato a considerarsi fondamentalmente diverso dal suo amico per quanto concerne il suo modo di reagire ai vari stimoli. — La conclusione inevitabile è che la riduzione deve essere avvenuta prima della sua domanda: anche il suo amico, come lui, avrà certamente percezioni perfettamente definite. La questione che Wigner affronta a questo punto è: esiste qualche elemento caratteristico nella catena che permette di individuare uno stadio in cui risulti ragionevole porre la riduzione? Esiste un livello che possa identificarsi come qualitativamente diverso dai precedenti nella serie dei processi che si sono verificati? Il lettore avrà già intuito dove l'argomentare di Wigner lo condurrà inevitabilmente: nell'intera catena l'unico punto che può considerarsi peculiare è quello che coinvolge il passaggio da puri processi fisici alla loro percezione. Perciò, anziché identificare (come tentava di fare Bohr) la separazione quantistico-classico con quella tra "piccolo" e "grande", Wigner sceglie di porla tra "mondo materiale" e "mente". Ed emerge cosi l'assunzione (che ha aspetti idealistici ma che certamente ha

550 4.Ifondamenti concettualie leimplicazioniepistem oligc ihe.. .

una sua coerenza) della riduzione da parte della coscienza:tutti i sistemi dell'universo ubbidiscono alle leggi lineari dell'evoluzione quantistica eccezion fatta per gli atti di percezione da parte di un osservatore cosciente. Una volta avviato su questa strada Wigner osa spingersi ben oltre. Egli osserva che se si accetta il fatto che la realtà fisica e l'atto di percezione cosciente vanno posti su piani diversi, allora, mentre tutte le teorie scientifiche del passato attribuivano al secondo un ruolo esclusivamente passivo (un essere percepiente diventava conscio dello stato del mondo fisico attorno a lui) la meccanica quantistica, arricchita con l'interpretazione della riduzione da parte della coscienza, attribuisce all'osservatore un ruolo assolutamente peculiare e descrive, nel linguaggio semplificato della riduzione del pacchetto, un processo finora insospettato, vale a dire il verificarsi di una reazione della coscienza sul mondo fisico che ha effetti di grande rilevanza: è l'atto di prese di coscienza che fa passare il reale dal limbo delle potenzialità alla chiarezza delle attualità. Il lettore potrà cogliere facilmente come questa posizione, combinata con le asserzioni già menzionate di alcuni aderenti all'ortodossia, abbia spinto vari pensatori ad asserire che, di fatto, la meccanica quantistica ha portato a "disfare la rivoluzione copernicana" ponendo di nuovo, e in un senso molto più radicale, l'uomo al centro dell'universo. Alcuni commenti. La posizione ha una sua coerenza intern, ma implica anche alcune scelte veramente radicali. Per esempio essa rende assolutamente insensate tutte le accurate asserzioni dei cosmologi circa lo stato dell'universo milioni e milioni di anni fa. L'universo, finché in esso non è apparso un essere cosciente, era il regno delle infinite potenzialità; al primo atto di percezione cosciente esso si è istantaneamente trasformato in quello di una precisa attualità. A noi sembra che questa interpretazione attribuisca all'uomo un ruolo assolutamente sproporzionato. Ma, va sottolineato, non è questo il vero punto debole dell'interpretazione che stiamo considerando. Come ha acutamente segnalato Beli essa è affetta da un più serio vizio di origine. La soluzione proposta è dettata dal desiderio di rimuovere l'ambigua separazione tra quantistico e classico che caratterizza l'interpretazione ortodossa e di collocare in modo preciso il confine tra questi due livelli del reale. Ma, ci si deve chiedere, il criterio adottato risponde effettivamente all'esigenza che lo ha motivato? Le nostre conoscenze attuali ci consentono forse di caratterizzare in modo preciso cosa debba intendersi come essere cosciente? Sembra che, ancora una volta, la via d'uscita mirata a identificare in modo non ambiguo il confine tra i due livelli del reale risulti fondamentalmente ambigua. Il pertinente commento di Beli su questo punto è illuminante: «Forse la funzione d'onda dell'universo ha dovuto aspettare per fare il salto (quello che ha

Il dibattito attuale sulleimplicazioni della teoria 55 1

portato alla definitezza macroscopica) migliaia di milioni di anni finché è apparsa la prima creatura vivente costituita da una singola cellula? Oppure ha dovuto attendere un po' di più, finché non è emerso un sistema più qualificato... uno con un Dottorato di Ricerca?». Con questo interrogativo lasciamo questa inquietante proposta e passiamo a esaminare l'ultima alternativa che considereremo. Essa assume che i processi di riduzione avvengano e che perciò le proprietà macroscopiche si attualizzino, ma pretende di trattare tutti i sistemi (micro, macro e coscienti) sulla base di un unico, universalmente valido, principio dinamico e all'interno di un formalismo che assume la completezza della descrizione dei sistemi fisici in termini del vettore di stato. Questo approccio, a differenza degli altri, non rappresenta un nuovo tentativo di interpretare la teoria ma si configura come una teoria rivale in quanto ne altera (sia pure in misura difficilmente evidenziabile) le previsioni empiriche e quindi, in linea di principio, consente esperimenti che potrebbero discriminare tra essa e la teoria standard.

9.8. Il programma di riduzione dinamica Come già anticipato, l'ultimo tentativo che considereremo per superare le difficoltà della teoria nel trattare i macrosistemi e il processo di misura assume che la descrizione quantistica sia completa (e quindi che gli stati dei sistemi fisici individuali siano esaurientemente descritti dal vettore di stato), ma considera la possibilità che l'equazione di Schrodinger vada modificata per tutti, e non solo per una dasse specifica di sistemi fisici. Naturalmente, sorgono due tipi di problemi. Innanzi tutto si dovrà immaginare quali tipi di modifiche vadano apportati per raggiungere l'obiettivo primario che ci si propone, vale a dire qudlo di avere una descrizione unificata di tutti i processi Fisici che tuttavia non comporti il presentarsi delle imbarazzanti sovrapposizioni di stati macroscopicamente distinguibili. Il secondo problema che si presenta è quello di fare in modo che queste modifiche soddisfino due richieste a prima vista contraddittorie, vale a dire di non avere alcun effetto apprezzabile per quanto riguarda le previsioni della teoria standard per i microsistemi (previsioni che sono state confermate al di là di ogni dubbio da un enorme insieme di dati sperimentali), e al tempo stesso di comportare una modifica estremamente rilevante e quasi istantanea dell'evoluzione dei macrosistemi in modo da condurre in tempi estremamente brevi alla soppressione dinamica (come conseguenza dell'unico principio di evoluzione che governa tutti i processi fisici) delle sovrapposizioni di stati macroscopicamente distinti.

552 4. 1 fondamenti concettuali eleimplicazioni epistemoligi che...

Un modo appropriato per affrontare il problema consiste nell'interrogarsi sugli obiettivi da raggiungere e sulle loro caratteristiche e nel confrontare queste caratteristiche con quelle dell'equazione di Schrodinger, per cercare di immaginare quali modifiche debbano venire introdotte. A livdlo macroscopico la dinamica dovrà riprodurre sostanzialmente il processo di riduzione. Allora ci si deve chiedere: quali sono le più rilevanti caratteristiche che differenziano questo processo dall'evoluzione lineare della teoria standard? La risposta è chiara: mentre l'evoluzione quantistica del vettore di stato è perfettamente deterministica e lineare, la riduzione dd pacchetto è un processo fondamentalmente stocastico e nonlineare. Infatti gli esiti della misura sono genuinamente casuali e le probabilità che essi si verifichino sono governate dal quadrato del modulo della funzione d'onda per cui, come discusso nel paragrafo 8.3, la probabilità associata alla somma di due stati non coincide con la somma delle probabilità associate ai termini della sovrapposizione. Anzi, è proprio questa differenza che dà luogo ai fenomeni di interferenza. Abbiamo cosi una prima indicazione su come procedere: si tenterà di modificare l'equazione di evoluzione includendo termini che descrivano possibili processi stocastici e nonlineari che influenzano la funzione d'onda stessa. Questi processi dovranno inoltre tendere a rendere oggettive alcune proprietà (ricordiamo che poiché siamo in un contesto genuinamente quantistico non si potrà pretendere di rendere oggettive tutte le concepibili proprietà), secondo modalità che risultino inefficaci a livello microscopico ma ef6cacissime a livello macroscopico. Una semplice osservazione ci fornisce un nuovo indizio. Chiediamoci: qual è la proprietà di un macrosistema la cui mancata oggettivazione risulta più imbarazzante dal punto di vista interpretativo? Tutti concorderanno nell'identificarla con la sua posizione. Questo punto di vista era già stato espresso con grande lucidità da Einstein: «Un corpo macroscopico deve avere sempre una posizione quasi perfettamente definita in ogni descrizione oggettiva del mondo reale». Ma non basta: una caratteristica fondamentale delle nostre percezioni è che esse corrispondono a oggetti che hanno posizioni ed estensioni spaziali precisamente definite. La conclusione ovvia è che la dinamica dovrà tendere a rendere oggettive le posizioni ddle particdle e di conseguenza quelle degli oggetti che da esse sono costituiti. Vale la pena di sottolineare che, allo stesso modo in cui quando si considera uno schema a variabili nascoste il tenere conto dell'inevitabile contestualità della maggior parte delle osservabili richiede di fare una scelta circa quelle che, non risultando contestuali, acquisteranno un livello di "oggettività" del tutto particolare, cosi in una prospettiva genuinamente quantistica, poiché non tutte le osservabili possono risultare definite in

Il dibattito attuale sulle implicazioni della teoria 553

quanto se ne danno comunque di incompatibili, si deve operare una scelta circa quelle che si vuole privilegiare. Siamo ormai pronti a illustrare la linea di pensiero che ha portato nel 1985 i colleghi Alberto Rimini e Tullio Weber e l'autore di questo capitolo a proporre un modello fenomenologico, ora universalmente noto nella letteratura sull'argomento come la teoria GRW (dalle iniziali degli autori), che incorpora in modo matematicamente preciso le idee guida che abbiamo appena delineato. Descriverò questo modello nella sua versione più semplificata. Negli anni successivi alla sua formulazione esso ha dato origine a vari sviluppi formali cui hanno contribuito, oltre agli autori del lavoro originale, Philip Pearle, Fabio Benatti e Renata Grassi. Queste ulteriori ricerche hanno portato a uno schema formale che oltre a conservare tutti i pregi del modello di GRW risulta anche notevolmente elegante dal punto di vista matematico e utilizza sistematicamente la teoria delle equazioni dinamiche stocastiche. Ma gli dementi essenziali e rilevanti della teoria possono venire colti più semplicemente e direttamente facendo riferimento alla versione originale. L'idea di fondo che caratterizza questa proposta può esprimersi sinteticamente in termini semplicissimi: si assume che tutti i costituenti elementari del mondo fisico dotati di massa (per intenderei, tutti i protoni, neutroni, elettroni e cosi via) oltre a ubbidire alla dinamica lineare di Schrodinger appropriata per il problema in esame (e quindi che tiene conto delle forze che agiscono su di esse), subiscano, a tempi a caso e con una certa frequenza media, dei processi spontanei di localizzazione spaziale. Prima di precisare le modalità dei processi ora menzionati vorrei sottolineare che essi vanno intesi come fondamentali processi naturali che non sono dovuti a interazioni con altri sistemi fisici o ad azioni deliberate da parte di osservatori coscienti. Al contrario, l'idea è che lo spazio-tempo nd quale si svolgono i processi fisici esibisca alcuni aspetti fondamentalmente stocastici, casuali, che si traducono appunto in localizzazioni spontanee dei microscopici costituenti dell'universo. Cerchiamo di essere più specifici. Sorgono ovviamente alcuni interrogativi che potremmo riassumere nelle domande: Come, Quando e Dove? — Come? : quali sono le precise modalità dei processi di localizzazione? — Quando? :quanto frequentemente essi avvengono? — Dove? poiché : come già menzionato questi processi portano a localizzazioni dei microcostituenti di qualsiasi sistema i quali, secondo il formalismo standard, sono in generale associati a funzioni d'onda apprezzabilmente estese nello spazio e quindi non possono pensarsi essere né in una precisa regione né in un'altra, ci si deve chiedere: in quale regione tra quelle "potenzialmente" possibili essi verranno confinati? Cominciamo col rispondere a questi quesiti facendo riferimento al caso

554 4. I fondamenti concettuali e le implicazioni epistemoligiche...

di una singola particella, diciamo un protone. Assumiamo che la funzione d'onda che lo descrive sia apprezzabilmente diversa da zero in un intervallo notevolmente esteso. Consideriamo ora una funzione di localizzazione L;.(r ), che giocherà un ruolo determinante nello schema. Essa è semplicemente una Gaussiana di ampiezza 1/~tz centrata attorno al valore

L,.(r)

=

(9.13)

Con queste premesse possiamo ora fornire precise risposte alle domande formulate sopra. Come. Se a un certo istante il nostro protone subisce una localizzazione attorno al punto r "' la sua funzione d'onda cambia secondo la seguente prescrizione:

'P(r) m 'P„,(r) = N@„,,.(r)

(9.14)

4„,(r") = L„.(r)'P(r). Il fattore N è semplicemente un fattore di normalizzazione. Tenuto conto delle caratteristiche sopra illustrate della funzione L„-.(r ) la prescrizione (9.14) può esprimersi più semplicemente asserendo che l'effetto della localizzazione è quello, mantenendone la normalizzazione, di porre praticamente uguale a zero la funzione originale 'P(r ) per tutti i valori di r che distano da r " a pprezzabilmente più di 1/~u. Quando. Per ogni singolo microcostituente di qualsiasi sistema fisico la probabilità di subire un processo di localizzazione spontanea risulta costante nel tempo ed è caratterizzata da una frequenza media il, in modo che la probabilità che si verifichi un processo siffatto in un piccolo intervallo temporale ht è uguale aiL At. Dove. La localizzazione può avvenire attorno a qualsiasi punto r * tale che la particella abbia, secondo il formalismo standard, una probabilità non nulla di venire trovata nel volume (1/~tz) attorno a tale punto se su di essa si esegue una misura di posizione. Tuttavia la teoria che stiamo analizzando assegna una precisa probabilità al veri6carsi di una localizzazione attorno a un punto piuttosto che a un altro. Più precisamente la densità di probabilità che una localizzazione avvenga in r * è data dal quadrato della norma dello stato 4„-.(r ). Questo significa semplicemente che le localizzazioni spontanee avvengono preferibihnente ove la teoria standard asserisce esservi una maggiore probabilità di trovare la particella in una misura di posizione. Ma, dobbiamo ricordarlo, qui nessun osservatore esegue nessuna misura: la natura stessa (il Dio di Einstein?) sceglie di indurre un

Il dibattito attuale sulle implicazioni della teoria 555

siffatto processo, secondo norme casuali ma con precise probabilità. Vale la pena notare che le regole formali sono tali che se a un certo istante avviene una localizzazione, l'integrale della densità di probabilità che essa avvenga in uno qualunque dei punti dello spazio risulta eguale a 1, Si noti che i processi di localizzazione (che vanno ad aggiungersi alla usuale evoluzione della teoria standard) rappresentano una modificazione stocastica e nonlineare della teoria. La stocasticità deriva dal fatto che sia gli istanti che le posizioni precise in cui avviene un processo di localizzazione sono governati da leggi genuinamente probabilistiche. Inoltre, ù fatto che la probabilità di una localizzazione in un certo punto piuttosto che in un altro dipende dal quadrato del modulo della funzione 4„-,(r ) implica che il processo non è lineare nel vettore di stato. Per illustrare come il meccanismo ora presentato tenda a rendere oggettive le posizioni consideriamo il caso, che abbiamo già tante volte incontrato nel corso di questo testo, in cui una particella si trovi nella sovrapposizione di due stati localizzati e spazialmente separati (si pensi per esempio alla funzione d'onda di una particella all'uscita da un apparato di Stern-

Gerlach) : 'p(r) =

['p„.,(r)+'p„,(r)]

(9.15)

Nell'equazione precedente i due stati 'P„-,(r ) e 'Pr z(r ) sono ben localizzati (rispetto alla distanza 1/~ u ch e caratterizza la teoria) in due regioni attorno ai punti ri e rz la cui separazione spaziale è molto maggiore di 1/~n. Supponiamo ora che la particella in esame subisca un processo di localizzazione. Dalle regole sopra enunciate risulta ovvio che si ha una probabilità apprezzabile che la localizzazione avvenga solo attorno al punto r> oppure attorno al punto rz. Nell'esempio specifico considerato queste due probabilità risultano praticamente uguali e uguali a 1/2. Il lettore avrà certamente colto il fatto che la probabilità che una localizzazione avvenga altrove, per esempio nella regione che sta a mezzo tra r, e r zrisulta praticamente nulla perché la funzione 4„-„(r ) che consegue a un processo siffatto ha norma praticamente nulla. La conclusione è allora ovvia: se una particella in uno stato quale quello considerato subisce un processo di localizzazione allora essa viene, per cosi dire, costretta a scegliere se stare attorno a r> oppure attorno a rq. In altre parole, la dinamica stocastica e nonlineare porta alla soppressione di uno dei due termini della sovrapposizione (9.15). Possiamo ora passare a illustrare la caratteristica della teoria più rilevante per i nostri scopi, vale a dire quella che indurrà la macro-oggettivazione delle proprietà di un sistema macrosocpico. Consideriamo l'imbarazzante

556 4. I fondamenti concettaali e le implicazioni epistemoligiche...

situazione che consegue all'applicazione del formalismo standard a una situazione quale quella di un processo di misura che porta a uno stato del

tipo di quello dell'equazione (8.4), cioè alla sovrapposizione di due stati 4t e 4z che corrispondono a due diverse posizioni R> e Rz rispettivamente di un indice macroscopico. Concentriamo la nostra attenzione sullo stato dell'indice. L'indice è un oggetto che contiene un elevatissimo numero di particelle e, ovviamente, è un sistema quasi rigido. Questo comporta che negli stati che abbiamo sinteticamente indicato come 4; le particelle dell'indice si troveranno tutte attorno al punto At o tutte attorno al punto Ãz. In altre parole se, esplicitando il fatto che essa dipende dalle variabili spaziali degli N costituenti il sistema, indichiamo come 4,(r n rq,..., rk,..., r N)la funzione d'onda che corrisponde alla posizione R> dell'indice e analogamente come 4z(r>, rz,..., rk,..., rN) la funzione d'onda che corrisponde alla posizione Rz dell'indice, allora avverrà che 4,(r>, rz,..., rk,..., rN) è diversa da zero solo quando tutte le variabili di posizione r „rz,..., rk,..., rN assumono valori vicini a R> e, analogamente, 4z(r,, rz,..., rk,..., rN) è diversa da zero solo per valori di r"„r z , ..., rk,..., rN tutti vicini a Rz. Scriviamo esplicitamente la funzione all'istante che ci interessa: 4(rt,rz,...,rk,...,rN)

=

[@>(r>, rz,..., rk,..., rN)+ Cz(r>, rz,..., rk,..., rN))

(9 1 ~ )

92 Supponiamo adesso che uno dei costituenti elementari dell'indice, diciamo la particeHa k-esima, subisca una localizzazione spontanea. Sappiamo già che essa può verificarsi solo in quelle regioni della variabile rk, in cui la funzione d'onda risulta diversa da zero, vale a dire quando rk assume un valore r,k che è "attorno a R~" o, alternativamente, un valore r. La condusione è ovvia: un processo di localizzazione per la k-esima particdla dell'indice può avvenire solo attorno a una ddle due posizioni che sono per lei possibili in corrispondenza ai due stati della sovrapposizione, e se la localizzazione avviene in una delle due posizioni, essa porta alla soppressione dell'altro termine della sovrapposizione stessa. In altre parole, localizzare uno dei costituenti microscopici dell'indice equivale a localizzare tutto l'indice in una delle due posizioni in cui egli "potenzialmente" si può trovare.

Il dibattito attuale sulleimplicazioni della teoria 557

Il meccanismo ora descritto mostra come si verifichi un'amplificazione delle localizzazioni~sontanee e rende evidente come si possa disporre dei parametri il e 1/g u i n modo da realizzare gli scopi per i quali la teoria è stata concepita. Ricordiamo che sBatti parametri governano le localizzazioni dei costituenti microscopici. Si facciano ora le seguenti scelte: L =10

sec ,

1

u = 10 cm

(e.1V)

che sono quelle proposte da GRW nel lavoro originale. La scelta di iL implica che un microsistema, diciamo un protone, subisce in media una localizzazione spontanea ogni 10" secondi, vale a dire ogni cento milioni di anni. Questo ci dice che un protone può stare nell'imbarazzante stato di non essere né qui né là per un tempo incredibilmente lungo: i microsistemi godono veramente, in questo modello come nella teoria standard, della nebulosità delle onde, come ha appropriatamente detto John Beli. Ma ora siamo interessati al destino dell'indice dell'apparecchio, Esso contiene all'incirca un numero di Avogadro di costituenti elementari, cioè 10" particelle. E anche se ognuna di esse ha solo una probabilità eguale a 10 " di subire un processo in un secondo, poiché 10 " x 10" = 10', ne consegue che in ogni secondo 10' particelle verranno localizzate. In altre parole, almeno una delle particelle dell'indice subirà quasi certamente una localizzazione in un decimilionesimo di secondo. E poiché, come abbiamo visto, ogni localizzazione di un costituente comporta la localizzazione di tutto l'indice, questo implica che la teoria, sulla base dell'unico principio dinamico che governa tutti i sistemi fisici, non può toHerare che una

sovrapposizione del tipo ddla (8.4) persista per più di un decimilionesimo di secondo. In altreyarole l'indice macroscopico deve decidere immediatamente se segnare > oppure Rz. Si può ora applicare il formalismo all'imbarazzante situazione con6gurata da Schrodinger. Ove si tenga conto del fatto che le due situazioni, gatto vivo e gatto e morto, corrispondono certamente a diverse distribuzioni spaziali di un numero macroscopico di microscopici costituenti del gatto si capirà perfettamente perché Beli abbia voluto riassumere la caratteristica fondamentale della teoria analizzata in questo paragrafo asserendo: «Qualsiasi imbarazzante ambiguità macroscopica della teoria standard risulta, del tutto in generale, solo momentanea nella teoria di GRW. Il gatto non è sia vivo che morto per più di un'infinitesima frazione di secondo». Per concludere sembra opportuno richiamare brevemente le caratteristiche concettualmente rilevanti dei modelli di riduzione dinamica. Essi non aggiungono variabili al formalismo, vale a dire assumono che il vettore di stato rappresenti la descrizione più accurata possibile di un sistema

558 4.f ondamenti f concettualie leim plicazioni epistem oligiche...

fisico individuale. In questo senso essi, dal punto di vista della loro struttura formale, sono teorie genuinamente quantistiche nel senso "tradizionale" del termine. Tuttavia essi introducono modificazioni dinamiche ddl'equazione di evoluzione che governa tutti i sistemi fisici. La caratteristica fondamentale della nuova, universale, legge di evoluzione risulta essere la seguente. Allorché viene applicata alla descrizione di un microsistema essa comporta previsioni che coincidono con quelle della meccanica quantistica standard con un tale livello di precisione che la discriminazione tra le due teorie risulta di fatto impossibile con le attuali tecnologie. Se la teoria viene applicata alla descrizione di un processo di misura, allora l'unico principio dinamico che sta alla base della teoria implica precisamente gli effetti che il formalismo standard incorpora nel principio di riduzione del pacchetto d'onde. Nella teoria questo principio non solo non risulta, come nel caso standard, in contraddizione con l'equazione dinamica per i microsistemi, ma ne costituisce una rigorosa conseguenza. Infine, se la teoria viene applicata alla descrizione dei macrosistemi essa comporta previsioni che risultano in accordo con quelle della fisica dassica come accade anche per la meccanica quantistica standard, ma, e qui sta tutta la differenza, senza che si possano mai dare imbarazzanti sovrapposizioni di stati macroscopicamente diversi." Inoltre la teoria contiene dei parametri, vale a dire la frequenza delle localizzazioni e la loro accuratezza spaziale, che definiscono in modo preciso e consentono di valutare quantitativamente quando la trattazione quantomeccanica standard risulta appropriata, quando e per quali sistemi essa vada sostituita dal postulato di riduzione del pacchetto, e cosi via. Per ogni specifico problema e per ogni specifico processo fisico la teoria dà delle risposte assolutamente precise a domande del tipo: questo sistema fisico va trattato come un sistema quantistico o come uno classico? Questo processo risulta reversibile o irreversibile?, e cosi via. In breve, la teoria definisce in termini quantitativamente precisi

È importante sottolineare che, anche se le quantità macroscopiche che vengano oggettivate sono le posizioni (e come menzionato sopra è stata proprio la considerazione che un macrosistema deve avere una posizione quasi perfettamente defmita in ogni descrizione oggettiva del mondo che ha condotto a privilegiare queste variabili), tuttavia anche tutte le altre proprietà di un macro-oggetto vengono oggettivate, sia pure indirettamente. Per convincersene basta considerare il caso della sovrapposizione di due stati di un sistema macroscopico che, ad un certo istante, sono associati a due funzioni d'onda che corrispondono esattamente alla stessa densità spaziale di posizione ma corrispondono al fatto che nel primo caso il sistema è a riposo mentre nel secondo esso possiede una certa velocità. È ovvio che all'inizio eventuali localizzazioni dei costituenti dd corpo non sopprimono la sovrapposizione, ma non appena, a causa della diversa velocità che li caratterizza, le due funzioni d'onda si separano per effetto dell'evoluzione, il meccanismo di localizzazione diventa effettivo e sopprime uno dei due tetmini: quindi anche la vdocità di un macro-oggetto viene oggettivata come effetto secondario ddl'oggettivazione della sua posizione. E l'argomento può facilmente generalizzarsi a tutte le quantità macroscopiche.

Il dibattito attuale sulleimplicazioni della teoria 559

ove debba collocarsi il confine tra il nebuloso mondo delle potenzialità e la definitezza delle attualità, il problema cruciale cui il formalismo standard non sa dare una risposta. Per citare ancora una volta Beli: «Queste teorie hanno alcuni aspetti estremamente positivi nel senso che esse rappresentano onesti tentativi di sostituire le abituali fumose asserzioni con equazioni matematicamente precise, equazioni che non vanno mai messe da parte, equazioni con le quali si possono fare calcoli espliciti e i cui risultati possono venire presi sul serio» (Beli, 1989). Risulta opportuno segnalare le differenze e le somiglianze tra il moddlo di Bohm e quello considerato in quest'ultimo paragrafo. La teoria dell'onda pilota, come tutte le teorie a variabili nascoste, mira all'oggettivismo a tutti i liveHi, cioè sia a livello microscopico che a quello macroscopico, Per ottenere questo deve uscire dal quadro concettuale tipico della meccanica quantistica (la descrizione degli stati fisici in termini degli elementi dello spazio di Hilbert) e deve pagare il prezzo della contestualità della più

parte delle osservabili. Il modello di GRW, che si colloca all'interno ddlo schema formale dello spazio di Hilbert, accetta semplicemente che un microsistema possa non avere, come conseguenza dell'entanglement, alcuna proprietà oggettiva. Ma il modello comporta che questo non possa darsi per i macrosistemi: esso consente di adottare una posizione macrorealista e macro-oggettiva nei confronti della realtà fisica.

10. Conclusioni

Siamo giunti alla 6ne del capitolo e sembra appropriato aggiungere alcune considerazioni conclusive. Abbiamo ripercorso la strada che dagli inizi del secolo ha condotto la comunità dei fisici a elaborare quella vera rivoluzione scienti6ca e concettuale che è rappresentata dalla meccanica quantistica. Questo appassionante percorso si è articolato in cinque fasi che, anche se non sono state identificate chiaramente, non saranno certamente sfuggite al lettore attento. Abbiamo esordito illustrando le difficoltà che la comunità scientifica ha dovuto affrontare agli inizi del secolo e mostrando come, attraverso intuizioni geniali e fortunate ipotesi, passando da momenti di grande frustrazione a entusiastiche speranze, da profondi sconforti a uno stupore quasi estatico, un ristretto gruppo di scienziati geniali abbia saputo sollevare il velo che nascondeva aspetti sorprendenti dd mondo reale. Successivamente abbiamo analizzato il dibattito che si è acceso attorno all'interpretazione della teoria la quale andava incontrando un successo dopo l'altro e aveva ormai acquistato una sua struttura precisa di estrema eleganza formale ma che, al tempo stesso, poneva seri problemi a chi guardasse con un atteggiamento critico alla concezione circa la conoscenza scienti6ca che essa sembrava implicare, rifiutandosi in particolare di assumere una posizione puramente strumentalista. I giganti di questa titanica sfida sono due delle 6gure più significative del nostro secolo: Niels Bohr e Albert Einstein il cui dialogo-scontro è stato ampiamente analizzato. Abbiamo visto come il confronto tra queste due figure eccezionali, che ha coinvolto direttamente anche gli altri celebri protagonisti di questa incredibile vicenda intellettuale, da Heisenberg a Schrodinger, da Born, Pauli, Jordan e von Neumann a de Broglie e Bohm abbia portato a focalizzare sempre meglio i veri problemi della teoria e abbia costretto i vari pensatori a uscire allo scoperto, prendendo posizioni via via più precise e deánite. Le vicende analizzate forniscono anche un'interessante materia di riffessione per coloro che si interessano dell'evoluzione del pensiero scientifico. Si è sottolineato come l'accettazione acritica ddl'ideologia di Copenaghen abbia rappresentato un freno per lo sviluppo di nuove idee, per l'elaborazione di proposte alternative e addirittura per la comprensione dei rivoluzionari aspetti del reale che stavano emergendo. È risultato molto difficile per voci dissenzienti farsi prendere sul serio, è stato troppo facile per chi

Conclusioni 561 condivideva la posizione "vincente" far accettare come inequivocabilmente stabiliti fatti e principi che avrebbero richiesto un'indagine più seria e approfondita. Nei paragrafi 5, 6 e 7 abbiamo visto il ruolo essenziale di un genio come Einstein e di un lucido pensatore profondamente motivato come Beli per consentire un reale salto di qualità nella comprensione delle più riposte implicazioni della teoria e quindi dei peculiari aspetti del mondo reale. Un recente articolo apparso negli atti del Convegno Advancesin Quantum Phenomena organizzato a Erice nd 1994 da Enrico Beltrametti e Jean-Mare Lèvy-Leblond, nd quale Aspect e Grangier passano in rassegna gli esperimenti che hanno messo in evidenza la violazione della disuguaglianza di Beli, si conclude molto appropriatamente con la frase: «Noi speriamo che anche coloro che non hanno un interesse diretto a problemi di questo tipo si siano convinti che Einstein ha indicato chiaramente una delle più straordinarie implicazioni deHa meccanica quantistica. Noi dobbiamo ringraziareJ. Beli che ci ha fornito gli strumenti concettuali e la possibilità di mettere in evidenza in laboratorio questa straordinaria caratteristica della natura». L'accettazione acritica della posizione ortodossa, se avesse continuato a dominare incontrastata la scena scientifica, non avrebbe permesso di affrontare i temi che hanno condotto ai nuovi insospettati sviluppi di grande rilevanza concettuale. Del resto, anche sul versante delle più recenti e sbalorditive applicazioni (che purtroppo non abbiamo potuto neppure elencare in questo testo, e per una esposizione estremamente semplice delle quali rimandiamo il lettore al nostro libro di imminente pubblicazione (Ghirardi, 1997)) va notato che proprio queste discussioni che da molti erano considerate "álosofiche" e "sterili" hanno portato ad alcuni risultati pratici sbalorditivi e hanno aperto prospettive che fino a pochi anni fa nessuno poteva neppure sospettare anche in campi tecnologicamente avanzati. Basterebbe menzionare, a questo scopo, l'interferometria a neutroni, l'ottica quantistica, la crittografia quantistica e i recenti studi sui computer quantomeccanici. Siamo cosi giunti a quella parte del capitolo, i paragrafi 8 e 9, che solleva e lascia aperti molti problemi, tecnici, concettuali ed epistemologici. Gli argomenti affrontati in essa mi sembrano quelli più stimolanti innanzi tutto perché, come ampiamente illustrato, il dibattito su questi temi è tutt' altro che concluso e presenta interessanti stimoli a una riflessione critica sulla scienza. Ma al di là di questo aspetto si è visto che proprio questo dibattito, che ancora una volta sarebbe estremamente facile ritenere, come faceva Pauli (e come purtroppo fanno ancora alcuni fisici), altrettanto sterile dei più astratti dibattiti teologici del medioevo, ha portato, da una parte, all'elaborazione di teorie che si configurano come potenziali rivali della meccanica quantistica e che quindi possono suggerire ove cercarne

562 4. I fondamenti concettuali e le implicazioni epistemoligiche...

eventuali violazioni, dall'altra all'identificazione, sfruttando le moderne tecnologie, in particolare il fenomeno della superconduttività e la possibilità che sembra farsi sempre più concreta di analizzare in dettaglio il comportamento di sistemi mesoscopici (quelli che si collocano proprio al confine tra micro e macro) di possibili test sperimentali (che sfortunatamente non abbiamo potuto descrivere per mancanza di spazio) che potrebbero risultare cruciali per la teoria. Lungo questa linea non posso non menzionare proposte di grande interesse che sono state avanzate negli anni recenti da Antony Legget e che hanno stimolato indagini sperimentali che, per esempio, sono in corso pressoi laboratori dell'Istituto Nazionale di Fisica Nucleare. Sul versante più vicino allo spirito di questo testo, qudlo concettuale, vale la pena di interrogarci su cosa potrebbero riservarci gli sviluppi futuri delle ricerche più recenti. Una prima osservazione si impone. Tra le proposte analizzate per superare le difficoltà del formalismo, quelle che richiamano maggiormente l'interesse di coloro che sono seriamente impegnati in questo campo sono queHe che vengono ormai dassificate, utilizzando il felice titolo di un recente convegno tenuto a Bielefeld lo scorso anno, come "Teorie quantistiche senza osservatori", a indicare appunto che esse non vogliono attribuire alcun ruolo peculiare all'osservatore cosciente. Tra queste si collocano la teoria di de Broglie e Bohm, le Storie Quantistiche e i Modelli di Riduzione Dinamica. Con riferimento al primo e al terzo di questi approcci è doveroso dichiarare che anche se essi si configurano come perfettamente coerenti al livello della trattazione di questo capitolo, cioè qudlo nonrelativistico, essi non risultano facilmente generalizzabili in senso relativistico. Indagini in questo senso sono tuttora in corso e hanno portato ad alcune interessanti proposte che meritano considerazione in quanto hanno gettato una nuova luce sugli imbarazzanti aspetti (dal punto di vista della teoria della rdatività) del processo di riduzione. Per questi temi facciamo riferimento ai recenti lavori di Duerr, Goldstein e Zanghi e di Grassi assieme all'autore

di questo capitolo (Ghirardi e Grassi, 1995, Ghirardi 1996). Con riferimento al programma di riduzione dinamica è anche importante menzionare che Roger Penrose si muove lungo linee che sono molto vicine, ndlo spirito, a quella di questo programma ma che egli si propone un obiettivo molto più ambizioso e affascinante, cioè quello di risolvere simultaneamente i problemi della teoria quantistica che abbiamo analizzato e quelli della teoria quantistica della gravitazione. Inutile dire che ogni passo avanti lungo questa linea potrebbe portare al superamento del carattere fenomenologico del modello di GRW e all'elaborazione di una teoria con solide basi concettuali. Sfortunatamente per ora non è risultato

Conclusioni 56 3

possibile esibire esplicitamente alcun modello che rappresenti una precisa implementazione di queste stimolanti idee. Inutile dire che tutti i tentativi che ho appena elencato si muovono nella direzione di una posizione di realismo scientifico. Per concludere non ci resta che sottolineare una volta di più come la sfida concettuale che abbiamo illustrato nella parte finale del capitolo ci sembra di grande interesse. E ci sembra opportuno sottolineare, da un lato, i nuovi titanici sforzi che questa sfida richiederà a chi è impegnato in questo campo e, dall'altro, lo stimolo che queste ricerche offrono in quanto lasciano intravedere la possibilità di cogliere nuovi, insospettati aspetti ddla realtà. Penrose stesso ha espresso recentemente una posizione, un programma e delle aspettative che condividiamo pienamente: «Io propendo per cercare di salvare sia il realismo quantistico che lo spirito ddla concezione spazio-temporale della relatività. Ma questo richiederà un cambiamento radicale dd nostro modo di rappresentarci la realtà fisica,... un cambiamento profondo dei nostri punti di vista, che rende addirittura estremamente difficile immaginare ora quale potranno essere le sue caratteristiche specifiche. Per di più esso, senza alcun dubbio, sembrerà folle!».

Appendice: Il linguaggio matematico della meccanica quantistica

Per consentire al lettore di cogliere a fondo la struttura concettuale della meccanica quantistica, risulta necessario introdurre il linguaggio matematico appropriato per essa, vale a dire la teoria ddlo spazio di Hilbert. Di fatto, i vettori di stato che rappresentano gli enti matematici associati agli stati dei sistemi fisici sono elementi di uno spazio siffatto e le quantità fisicamente misurabili sono rappresentate da trasformazioni (che soddisfano a opportune condizioni) tra gli elementi di un tale spazio. La parte seguente rappresenta una sia pur concisa trattazione formale che ci consentirà di affrontare in modo snello ed efficace i temi di grande interesse concettuale ed epistemologico che la meccanica quantistica solleva. Il lettore interessato ad approfondire questi temi può consultare, oltre al classico testo di von Neumann i recenti testi di Prugoveclá, di Reed e Simon e

di Weidmann. A.1 Lo spazio di Hilbert Spazi vettoriali lineari Uno spazio lineare vettoriale 'p è un insieme che risulta chiuso rispetto a due operazioni: moltiplicazione di un elemento di 'P per gli elementi di un opportuno corpo numerico (che nel nostro caso sarà il corpo C dei numeri com-

plessi) e somma di due elementi di p (che indicheremo con l'ordinario simbolo +). In parole più semplici, per ogni coppia di elementi (vettori) g),yr e 'P e di numeri, a, b e C, (ay, + b y) c 'P. Le operazioni devono soddisfare alcune semphci richieste di commutatività, associatività e distributività: P+ W = Y+ e(P+ Y)+X = P+(V+X) ~(V+ Y) = ~P + ~ K (a + b) y = aq+ b p, a(by)= (ab) rp. Lo spazio 'p contiene un elemento (che è facile verificare risulta unico e che può identificarsi con Og, per un arbitrario g e 'p) che è l'demento neutro per l'addizione e che indicheremo come m y + ro = á) + y = p, Vp e g Varietà lineari Un sottoinsieme 'g di 'p è una varietà lineare se è esso stesso uno spazio lineare vettoriale rispetto alle due operazioni indicate.

Appendice 565

Indipendenza lineare e dimensionalità L'elemento neutro gioca un ruolo essenziale nella definizione dell'indipen-

denza lineare degli elementi di 'p e della dimensionalità dello spazio o di una sua sottovarietà lineare 'g. Gli elementi (q)n y,,..., (pM) e'p (c g) si dicono l inearmente indipendenti se la relazione: aq'< + azyz + + a s ' ~ = coimplica a>— - az - — ag — 0. Lo spazio P (g) dicesi N-dimensionale se N rappresenta il numero massimo di elementi linearmente indipendenti che possono trovarsi in esso. Se per ogni n arbitrariamente scelto possono trovarsi n elementi linearmente indipendenti lo spazio si dice infinito dimensionale. Si noti che in uno spazio N-dimensionale qualsiasi elemento g c 'p può esprimersi come combinazione lineare di un qualsiasi insieme di N suoi elementi linearmente indipendenti. Infatti, se per qualsiasi scelta dei numeri a~ (e quindi -

-

.

.

.

anche quando tutti fossero diversi da zero) risultasse g c N

~

+

N l

ar.y>,vale a di-

dire g —~ Y1 aq' w cù,aggiungendo all insieme degli N vettori (cpv,) il vettore g si otterrebbe un insieme di N + 1 vettori linearmente indipendenti, contrariamente all'ipotesi che 'P sia N-dimensionale.

Un semplice esempio L'esempio più semplice di spazio vettoriale lineare che il lettore certamente conosce è quello i cui elementi sono i vettori v = (v„vy vz) che caratterizzano i punti del familiare spazio euclideo tridimensionale E"' ddla fisica dassica. In questo caso i tre versori i, j, k d egli assi di una tema ortogonale sono linearmente indipendenti e qualsiasi vettore dello spazio può esprimersi come loro combinazione lineare: v = v„i + v, j + v,k. L'unica differenza col caso in esame deriva dal fatto che il corpo numerico appropriato è quello R

dei numeri reali anziché C.

Spazi metrici Uno spazio lineare vettoriale 'P può arricchirsi e venire promosso a spazio metrico @ mediante l'introduzione di un prodotto scalare tra i suoi dementi. Esso è semplicemente una corrispondenza che associa a ogni coppia ordinata 'y, y e @ u n n umero complesso, che indicheremo come (y, y), con le seguenti proprietà: (cp, ay/) = a(cp,y), (p,yr + g) = (cp,y) + ((p,g), (rp,y) = (y,g))", (g cp) > 0 il segno uguale vale se e solo se cp = co.Nelle terza formula l'asterisco indica la coniugazione complessa in C. Corrispondentemente il prodotto scalare è detto lineare nel secondo fattore e antilineare nel primo in quanto la terza relazione implica (acp,y) = a"'(y,y). Riprendendo l'analogia con lo spazio eudideo 3-dimensionale E"' il prodotto scalare ora introdotto coincide, con gli ovvii cambiamenti, con il prodotto scalare tra vettori di E"'.

566 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

Spazi normati Benché sia possibile introdurre il concetto di norma (che indicheremo col simbolo Il q)ll) degli elementi di uno spazio anche nel caso in cui esso non sia metrico, va sottolineato che la struttura metrica porta in modo del tutto natu-

rale alla definizione di norma di un elemento y c < come il numero reale non-negativo: Il@ll= ~ y , q) . La norma incorpora l'idea di "lunghezza" del vettore y e soddisfa a tutte le ovvie richieste che devono imporsi a essa, vale a

dire: I INVII > 0 (il segno di uguale valendo se e solo se y= m), Ila@ l = lai IINV II.

Infine il concetto di norma costituisce il punto di base per definire la "distanza" tra gli dementi di ~.

Risulta semplice dimostrare che vale la relazione (disuguaglianza di Schwarz) : l(y, y) I < Il@ll II yA I, e che il segno uguale si presenta se e solo se i due vettori sono proporzionali, y = ay, a c C. Questa relazione, a sua volta, implica la

cosiddetta disuguaglianza triangolare: II q) + lpll < II yl I + II pl I, che risulta analoga alla proprietà euclidea che un lato di un triangolo è sempre minore della somma degli altri due.

La definizione di lunghezza di un elemento porta in modo del tutto naturale

a quella di distanza tra due elementi dello spazio: d((p, y) = Ily — yII. La distanza soddisfa a tutte le richieste. naturali per essa: d(cp, y) > 0 (l'uguaglianza potendo darsi se e solo se q)= y), d(g y) = d(ly, (p) e infine d(q, ip)

0 esiste almeno un

elemento g di Pl che dista da g meno di e:Il( — gli < z. Si mostra facilmente che se g è punto di accumulazione di elementi di PJ esiste una successione di dementi di questo insieme che converge a g. Aggiungendo a P tutti i suoi punti limite si ottiene un insieme che si dice chiuso e che si indica come gl].

Insieme denso di stati

Un insieme pJ di elementi di+ si dice denso in @ se ogni elemento rp e ~ è punto di accumulazione di elementi di P, vale a dire se ogni elemento di ~ può avvicinarsi quanto si vuole con elementi di pl.

Il criterio di Cauchy Una successione arbitraria (gi), j = 1, 2, ..., ~ di elementi di gl si dice soddisfare il criterio di Cauchy se, per ogni assegnato numero positivo e > 0, esiste

un intero N(e) tale che per ogni coppia r, s > N(8) si ha llg, — g,ll < E. In altre parole, la distanza tra una qualunque coppia di elementi della successione con indici sufficientemente elevati risulta piccola quanto si vuole. È facile convincersi che qualsiasi successione convergente soddisfa al criterio di Cauchy. A questo scopo basta osservare che considerato il limite y della successione e una coppia, g„, g„di elementi della successione si ha, per la disu-

guaglianza triangolare, llg, — g,ll < llg„—rplI + II y — g,ll e tenere presente che i due termini a destra possono rendersi piccoli a piacere pur di scegliere gli indici r ed s sufficientemente grandi.

Quanto è stato discusso fin qui vale sia per spazi finito che infinito dimensionali. Esistono però alcune differenze rilevanti tra questi due casi. Per esempio, mentre nel caso finito dimensionale il criterio di Cauchy

568 4.I ondamenti f concettualie leimplicazioniepistem oligiche..

oltre che condizione necessaria risulta anche sufBciente per la convergen-

za della successione (cioè ogni successione di elementi di < che soddisfa il criterio di Cauchy converge a un demento di ~) questo non è vero, in generale, per uno spazio a dimensionalità infinita. Risulta quindi opportuno introdurre la nozione di completezza dello spazio.

Completezza Uno spazio metrico gK dicesi completo se ogni successione di suoi elementi

+.

che soddisfa il criterio di Cauchy converge a un elemento di

Un'ulteriore proprietà che risulta automaticamente vera per ogni spazio metrico a dimensione finita ma non per uno spazio infinito dimensionale è

la separabilità. Separabilità Uno spazio metrico gE dicesi separabile se in ~ esiste un insieme numerabile di vettori che risulta ovunque denso in + stessò.

Abbiamo ormai a nostra disposizione tutti gli dementi per definire la struttura matematica che costituirà il "linguaggio naturale" della meccanica quantistica: lo spazio di Hilbert. Spaziodi Hilbert Uno spazio di Hilbert è uno spazio lineare vettoriale metrico (e quindi normato) completo e separabile. Esso verrà indicato con il simbolo P.

Appendice 569

Due importanti esempi di spazidi Hilbert Senza dilungarci a dimostrare che tutte le richieste che abbiamo imposte sono effettivamente soddisfatte, ci imiteremo a segnalare che i seguenti due spazi vettoriali lineari sono spazi di Hilbert: — E"'(~), lo spazio i cui elementi sono le successioni (at.) di numeri complessi

che soddisfano alla condizione che la serie~Y 1l tzq l' è convergente, quando si definiscano nd modo seguente le operazioni di prodotto per un numero, di somma e di prodotto scalare: seA = (tr~) e B = (Pt) sono due elementi di

l'*'( ), allora: aA+ èB = taoa+ bpa), e(A, B) =g aaBa. Si oori ohe roè la successione i cui elementi sono tutti uguali a zero.

— C")(~), lo spazio delle funzioni complesse 4(xn..., x~) di una o piùvariabip+

p+

li reali per le quali esiste l'integraleJ dx,... J dx>@(x„..., x()) )l', quando si definiscano nei modo seguente le operazioni di prodotto per un numero, di somma e di prodotto scalare: se C>= 4(x),..., x(()) e 'P = P (xn..., x (h)) sono due elementi di L'"'(~), allora: a4 + b'P = [a4(xn..., x~) + b'P(x„..., xp))] e p+ co

(4,'P) = J

p+ao

dx)...J dxB)[4

( x l , . .., xB))'P(xl,..., x)è)]. In questo caso coè

la funzione chè risulta nulla ovunque a meno di un insieme numerabile di

punn.

A.2 Sistemi ortonormali Abbiamo già notato come in uno spazio N-dimensionale qualunque vettore possa esprimersi come combinazione lineare di N vettori linearmente indipendenti. Abbiamo anche notato che l'ortogonalità di un insieme di vettori ne implica l'indipendenza lineare. Ne consegue che se si introduce un insieme ortonormale (y,l, (j = 1, 2,..., N) di N vettori in uno spazio N-dimensionale questo insieme risulta, come si dice tecnicamente, completo, vale a dire ogni vettore può scriversi come combinazione lineare degli elementi ddl'insieme: y = a,q)> + az~ + ... + a~gg. Prendendo il prodotto scalare di questa relazione con il generico elemento dell'insieme ortonormale si vede subito che i coefficienti dell'equazione precedente devono assumere i valori: a, = (y„ y ) . Il caso in esame risulta del tutto analogo, a parte la maggiore dimensionalità, al caso discusso sopra dello spazio euclideo tridimensionale nel quale ogni vettore può esprimersi come combinazione lineare di tre versori ortogonali, i coefficienti deHa

570 4. I fondamenti concettuali eleimplicazioni epistemoligiche...

somma risultando proprio i prodotti scalari del vettore per i versori. Dobbiamo ora generalizzare questo concetto al caso di nostro interesse, vale a dire a uno spazio hilbertiano infinito dimensionale. Sistemi ortonormali completi Un sistema ortonormale (yk), k = 1, 2,..., ~ dicesi completo se ogni 4 E p può scriversi come 4

=

~k=>

cke, ove ck— - (yk, 4). Luguaglianza dei due

membri della relazione appena scritta esprime il fatto che la successione @=Y ~

k= l

ck e co n v erge a 4 perN tendente all'infinito. Il punto cruciale

che va sottolineato, ma che non dimostreremo, è che la separabilità dello spazio risulta condizione necessaria e sufficiente per l'esistenza in esso di almeno un sistema ortonormale completo (di fatto di infiniti sistemi siffatti). Vale una serie di interessanti teoremi sui sistemi ortonormali completi (che d'ora in poi abbrevieremo come S.O.N.C.). Se ((pk), k = 1, 2,..., ~ è un sistema siffatto, allora: — (pk,4) =O,bkimplicaedèimplicatada@ = co,

— (4,'P) = g ( 4 , cPk)(yk,'F), l'4,'F e P, Dall'ultima relazione segue ovviamente:

I(yk, e)l' che mostra come la serie dei quadrati dei moduli dei coefficienti dello sviluppo di un vettore in termini degli elementi di un insieme ortonormale completo risulti convergente. Vale anche l'inverso, vale a dire se la serie (a termini positivi) ~

2

k=l

Ick l c o nverge, allora la successione

X„", cke converge, perN tendente all'infinito, a un elemento @ dello spazio per il quale (pk, 4) = ck. Varietà lineari generate da un insieme di vettori Dato un qualunque insieme P di elementi di p, dicesi varietà lineare generata da essi e si indica come gt l'insieme delle combinazioni lineari di un numero finito di elementi di Pl. Se si aggiungono a "gt tutti i suoi punti limite si ha la varietà lineare chiusa I gt].

Esiste un semplice procedimento, detto metodo di ortonormalizzazione di Schmidt, che consente di passare da un qualunque insieme di vettori linearmente indipendenti a un insieme ortonormale che genera la stessa varietà lineare. Utihzzando questo procedimento e tenendo conto della separabilità dello spazio di Hilbett, per ogni varietà lineare chiusa

Appendice 571

gl] t: P si può costruire un insieme ortonormale che la genera. Questo fatto può a sua volta utilizzarsi per introdurre due importanti concetti che risulteranno utili in seguito, e precisamente quelli di somma diretta e di prodotto diretto di varietà lineari. Somma diretta di varietà lineari Si considerino due varietà lineari )li> ed gz. La varietà lineare somma diretta delle due varietà considerate, che si indica come g> S gq, è costituta da tutti

i vettori di gn da tutti quelli di gq, e dalle loro combinazioni lineari finite. Se [y,'") e [q),'") sono due S.O.N.C. in 'g> e gz, rispettivamente, l'elemento generico di %> S gq è rappresentato da una combinazione lineare di un numero finito di elementi del primo e del secondo insieme: @ N

=g

i=l

c ; y'.u + J

g)

X„,, d>p~,ove M edN sono due numeri minori o uguali alla dimensionalità delle due varietà in esame. Nel caso infinito dimensionale possono aggiungersi agli elementi di 'g> S gz i loro punti di accumulazione ottenendo la varietà lineare chiusa gC> S 'gz]. Equivalentemente questa varietà è costituita da tutti i vettori che hanno la stessa forma del vettore 4 menzionato sopra ove tuttavia le somme possono correre fino all'infinito, purché le serie dei quadrati dei moduli dei coefficienti risultino convergenti. Ovviamente quanto appena detto può estendersi al caso di più di due varietà.

Il concetto di prodotto diretto risulta di particolare rilievo per la descrizione dei sistemi ásici composti da vari costituenti elementari. Prodotto diretto di varietà o di spazi vettoriali lineari Consideriamo di nuovo le due varietà lineari g> ed g> (nel caso fisicamente interessante appena citato di sistemi composti queste varietà saranno gli spazi di Hilbert associati ai due costituenti) e, come prima, siano [y,'") e [y)") due S.O.N.C. in g, e gq, rispettivamente. Si consideri ora l'insieme dei vettori prodotto di un vettore di [y,'") e di uno di [y,'"), vale a dire l'insieme [4,t) =

[y,'"y~"'). Si dice allora prodotto diretto delle due varietà (spazi) 'g> ed gq e si indica come 'g> ® gq la varietà lineare generata dai [4,t). In altre parole l'elemento generico di g, O>< gz risulta essere una combinazione lineare finita deivenorii@ti: @

=g

g

c~S ~=g

gc

>y'. " p~".Dinuovo,

nei caso infinito dimensionale se la doppia serie dei quadrati dei moduli dei numeri complessi c,~ risulta convergente, le somme possono estendersi fino all'infinito e in questo modo si genera la varietà lineare chiusa [g> 8 "gq].

572 4. I fondamenti concettttali e leimplicazioni epistemoligiche...

Il fatto che per ogni spazio di Hilbert si possa trovare un S.O.N.C. che lo genera, consente di dimostrare, ricorrendo al concetto di isomorfismo, che tutti gli spazi di Hilbert infinito dimensionali sono, in un preciso senso tecnico, equivalenti.

Isomorfismo

Si considerino due spazi di Hilbert g e P'. Essi si dicono isomorfi se risulta possibile stabilire tra i loro dementi una corrispondenza y m g che risulti: — biunivoca, cioè ogni demento di pI ha una ed una sola immagine in p" e non esistono due dementi distinti di g che hanno la stessa immagine

— lineare, cioè y c>—y' e g+-> g" implica aq+

bg m ay" + bg"

— isometrica, cioè preserva i prodotti scalari: (tp, g =

(tp',g).

Come anticipato, è facile convincersi che grazie alla completezza e alla separabilità, tutti gli spazi di Hilbert infinito dimensionali sono equivalenti in quanto risultano isomorfi tra loro. Infatti, dati i due spazi g ed P', si

considerino in essi due S.O.N.C., (y~} e (gg}. Per ogni assegnato 4 c g si consideri il suo sviluppo in serie e = Y" ct,p>. Si faccia corrispondere a ~

l

questo elemento di pl l'eiemento q>" = g c sZs di / ' . Per ie proprietà dei S.O.N.C. discusse sopra è immediato verificare che questa corrispondenza risulta un isomorfismo.

A3 Operatori lineari nello spaziodi Hilbert Un altro concetto di grande rilievo per la formulazione dello schema teorico cui siamo interessati è quello di operatore lineare. Infatti, come vedremo, in meccanica quantistica siffatti operatori, quando altre opportune condizioni risultano soddisfatte, costituiscono gli enti matematici che giocano il ruolo delle quantità fisiche osservabili ddle teorie classiche.

Appendice 573

Trasformazioni nello spazio di Hilbert Un operatore o trasformazione 7 è una corrispondenza che associa a ogni ele-

mento di un opportuno sottoinsieme (proprio o improprio)D(7) c: g dello spazio di Hilbert, detto dominio di 7, uno e un solo elemento di P: 7y = rp,

p e P(7). Al variare di p su tuttoD(7) le immagini descrivono un insieme detto codominio o range di 7 che indicheremo come Z(7).

Oltre alle trasformazioni appena considerate per le quali sia il dominio che il range sono sottoinsiemi (eventualmente impropri) ddlo spazio di Hùbert P, è opportuno considerare anche corrispondenze tra gli elementi

di p e l'insieme dei numeri reali o complessi. Mappe dag in E o in C Come appena menzionato risulta appropriato considerare anche trasforma-

zioni t da un opportuno sottoinsieme (o dominio D(c)) dello spazio di Hilbert (o dello spazio delle coppie ordinate di elementi di g) all'insieme dei numeri reali E o dei numeri complessi C. Di fatto abbiamo già incontrato corrispondenze di questo tipo. Per esempio la norma I I yl I può essere considerata come una corrispondenza che associa a ogni elemento y dello spazio di Hilbert un

numero reale: y m II gli e R; il prodotto scalare con un vettore 6ssato g e P è una corrispondenza che associa a ogni elemento y dello spazio di Hilbert il numero complesso (g, y) e C e infine lo stesso prodotto può considerarsi come una corrispondenza tra una coppia ordinata di elementi di P e un numero complesso. Commenteremo più avanti sulle proprietà delle trasformazioni ora menzionate.

Risulta utile introdurre relazioni algebriche tra operatori.

574 4. I fondamenti concettuali e le implicazioni epistemoligi che...

Algebradegli operatori Dati due operatori 7 ed S definiremo la moltiplicazione di un operatore per un numero complesso e la somma di due operatori, sull'insieme degli elementi comuni dei loro domini, tramite la relazione: (a7 + bS) tp= a7y+ bSy,

y c 0(7) n 0(S). Definiremo anche il prodotto (7g dei due operatori, sugli elementi del dominio 0(S) le cui immagini stanno nel dominio D(7), tramite la relazione (7S) y= T(Sq)). Se la corrispondenza definita da 7 è biunivoca, vale a dire se per ogni p, y e 0(7), p c ty implica 7 q) c 7 Iy (cioè 7 non può trasformare elementi diversi nello stesso elemento) allora si può definire la trasformazione inversa di 7 che si indica come 7 ', la quale ha come dominio il range di 7 e trasforma l'immagine di un elemento nella sua controimmagine. In breve, se q) = 7y, allora 7 'P = cp. Ovviamente il range di 7 ' coincide

con il dominio di 7.

Potenze di operatori e alcuni operatori particolari Con ovvie precisazioni sui domini indicheremo come potenza m-esima di un operatore il prodotto, preso m volte, dell'operatore con se stesso: 7 "' = 7 7 con 7 ' = 7 e, nel caso l'operatore ammetta inverso, si definiranno allo stesso modo le sue potenze negative 7 " . Risulta utile considerare due particolari operatori definiti su tutto lo spazio; l'operatore identità, che indicheremo con il simbolo I, che trasforma ogni elemento di % in se stesso: I tp= q, Vcp e %, e la trasformazione che associa a ogni elemento dello spazio l'elemento nullo, che verrà indicata come 0: 0 y = co, Vq) e P. Ovviamente si porrà anche, per analogia coH'usuale elevamento a potenza, 7 ' = I.

Fino a questo momento non ci siamo dilungati a discutere il dominio di definizione delle trasformazioni che abbiamo considerato. Conviene precisare subito alcuni fatti importanti. — In questo testo considereremo solo operatori o definiti dappertutto, vale a dire per i quali P(T) = p, oppure densamente definiti, vale a dire operatori per i quali la chiusura del loro dominio è tutto lo spazio di Hilbert, [P(T)] = p. — Come risulterà chiaro nel seguito, limitare le proprie considerazioni a operatori definiti dappertutto semplificherebbe notevolmente la trattazione ma risulterebbe del tutto inappropriato. Infatti, molti operatori di grande rilevanza fisica quali quelli associati alle osservabili posizione ed impulso non risultano definiti ovunque. — Saremo esclusivamente interessati a un particolare tipo di operatori,

Appendice 575

quelli lineari, in quanto solo essi giocano un diretto ruolo fisico nella teo-

ria. Passiamo quindi a dame una caratterizzazione precisa. Operatori lineari Un operatore l dicesi lineare se il suo dominio 0(l) è una varietà lineare, e se

esso agisce linearmente su D(l), vale a dire:rp, y c 0(l) implica ap+ by c D(l) e inoltre L(aq) + by) = al@+ big. Risulta ovvio che oltre al dominio, anche il range di un operatore lineare è una varietà lineare. Ovviamente anche nel caso di trasformazioni dallo spazio di Hilbert agli elementi di un corpo numerico si può richiedere che la corrispondenza risulti lineare.

Come già anticipato, d'ora in poi prenderemo in considerazione esdusivamente operatori lineari densamente definiti, per cui queste due richieste si intenderanno tacitamente assunte valere per tutti gli operatori di cui ci occuperemo nel seguito. Vale la pena richiamare l'attenzione del lettore sul fatto che la pretesa che il dominio di un operatore sia una varietà lineare e che esso sia denso in %, non implica che l'operatore sia definito dappertutto. In generale, infatti, una varietà lineare non coincide con la sua chiusura, per cui l'operatore potrebbe non essere definito su punti limite

dd suo dominio. Vogliamo ora sottolineare una caratteristica fondamentale degli operatori che li differenzia in un modo essenziale dalle funziohi delle posizioni e degli impulsi che, nel formalismo classico, rappresentano le osservabili fisiche. Essa consiste nel fatto che l'algebra delle osservabili quantistiche risulta noncommutativa. Con questa espressione si vuole segnalare che l'ordine in cui agiscono due operatori è significativo, ovvero che, in generale, 7Z risulta diverso da Z7. È quindi utile introdurre un simbolo apposito per esprimere la differenza tra il prodotto di due operatori presi in un certo ordine e nell'ordine inverso.

576 4. l fondamenti concettuali e leimplicazioni epistemoligiche...

Parentesi di commutazione Diremo parentesi di commutazione tra i due operatori 7 ed Ze indicheremo

col simbolo [7, S] la deferenza appena menzionata, vale a dire porremo: [7, ZJ = 7Z — W Come vedremo il fatto che due operatori commutino (cioè per

essi valga la relazione [7, Z] = 0) oppure non commutino ([7, Z] c 0) ha delle implicazioni di notevole rilevanza sul piano sia concettuale che pratico. Per ora ci limiteremo a enunciare alcune relazioni di validità generale che ci consentiranno di ricondurre commutatori complessi a commutatori semplici. Innanzi tutto, la relazione di commutazione è lineare: [7, al+ bS] = a [7, Ej + b[7, Z], da cui segue che se un operatore 7 commuta con due operatori E ed Z allora esso commuta anche con ogni loro combinazione lineare. In secondo luogo ogni potenza di un operatore commuta con qualsiasi altra sua potenza: [7 ", 7 "] = 0 in quanto entrambi i termini del commutatore risultano uguali a 7 '"'". Infine vale la seguente importante relazione che si verifica b analmente esplicitandone i termini: [7, H ] = E[7, Z] + [7, Z]X Essa implica che se un operatore commuta con altri due allora esso commuta anche con il loro prodotto.

Dobbiamo ora introdurre un concetto che risulterà essenziale per caratterizzare gli operatori che potranno legittimamente rappresentare osserva-

bili fisiche. L'aggiunto di un operatore Si consideri un operatore lineare 7 che, come sempre, sia densamente definito. Possiamo allora definire un operatore 7 ', che si dice l'aggiunto o il coniugato hermitiano di 7, nel seguente modo: il dominio di 7 ' è costituito da tutti quei vettori g e P per i quali esiste un vettore g che soddisfa: (g, q))= (g, 7y)

per ogni y c 0(7 ). Dal fatto che 7 è densamente definito segue immediatamente che l'elemento g, se esiste, risulta unico, Si definisce allora g = 7 'g. Si noti che il dominio di 7 ' non è vuoto in quanto almeno l'elemento neutro m vi appartiene (e la sua immagine co risulta uguale a N). Inoltre è immediato verificare che 7 ' è un operatore lineare. Possiamo esprimere la relazione tra

7 e 7 ' mediante la seguente uguaglianza: (7 'g, y) = (g, 7y), bg e 0(7 ') e b'q) c D(7 ).

Proprietà di coniugio Si verifica immediatamente che, con opportune precisazioni sui domini, valgono le seguenti proprietà di coniugio: (aT)' = a=7 ', (7 + Z)' = 7 ' + l ' , =' i 7@t g ~7 t (7 )~ (7 )

Appendice 577

Operatore simmetrico o hermitiano Un operatore lineare Z densamente definito dicesi simmetrico o hermitiano se il suo aggiunto coincide con lui sul suo dominio, vale a dire se per ogni y E 0(Z), Zy = L'y. Si noti che questo non implica direttamente S= L', in

quanto il dominio di L' potrebbe risultare più grande di quello di X Tecnicamente si direbbe (si veda il paragrafo A.9) che L' costituisce una estensione

di Z.

Siamo ora pronti per caratterizzare la famiglia di operatori che, come discuteremo in dettaglio più avanti, rappresentano le osservabili di un sistema fisico. Essi sono gli operatori autoaggiunti o ipermassimali,

Operatore autoaggiunto o ipermassimale Un operatore dicesi autoaggiunto se esso coincide con il suo aggiunto cioè se la relazione Z = L' vale in senso stretto: i due operatori non solo coincidono in quanto hanno lo stesso effetto sugli elementi dello spazio su cui entrambi sono definiti, ma anche i loro domini coincidono esattamente.

A.4 Equazione agli autovalori Per la formulazione della teoria, in particolare per l'identificazione ddle probabilità che essa assegna agli esiti di vari processi fisici, gioca un ruolo assolutamente prominente l'equazione agli autovalori associata agli operatori lineari. Consideriamo un siffatto operatore, diciamo 8, e l'equazione: 8y„ = a„y„, vale a dire cerchiamo gli eventuali elementi dello spazio tali che 8, agendo su di essi, li moltiplica semplicemente per una costante. L'equazione appena scritta si dice equazione agli autovalori, i numeri per i quali essa ammette soluzioni appartenenti allo spazio di Hilbert si dicono appunto autovalori e le relative soluzioni, cioè i vettori p„, si dicono autovettori dell'operatore considerato. L'insieme degli a, si dice costituire lo spettro discreto dell'operatore 8. Autovettori e autovalori hanno alcune proprietà valide del tutto in generale, ma qudle più interessanti derivano dall'assunzione che l'operatore A sia simmetrico o, ancor meglio, autoaggiunto.

578 4.Ifondamenti concettualie leim plicazioni epistemoligiche...

Proprietà generali degli autovalori edegli autovettori Cominciamo con l'osservare che se yj è un autovettore relativo a un certo autovalore, allora, per la linearità di 8, anche kcpj, bk c C è un autovettore relativo allo stesso autovalore, Gli autovettori sono quindi definiti a meno di una costante moltiplicativa che noi sceglieremo in modo che essi risultino normalizzati, Anche con questa richiesta l'autovettore non risulta univocamente definito in quanto resta sempre possibile moltiplicarlo per un numero complesso di modulo 1, o, come si dice, per un fattore di fase del tipo e" con a reale. Questa arbitrarietà residua, come vedremo, risulta comunque non rilevante per la teoria. Altrettanto immediato è verificare che gli autovettori associati a un autovalore (nel caso in cui ve ne siano più di uno linearmente indipendenti — e allora si dirà che l'autovalore risulta degenere) costituiscono una varietà lineare chiusa (che si dirà autovarietà di d). Se yja e q)jp sono entrambi autovettori associati all'autovalore a,; allora ogni loro combinazione

lineareabuja+ bcpjp è pure un autovettore associato allo stesso autovalore, e se (y„), s = 1, 2,... è una successione di autovettori, tutti relativi allo stesso autovalore a„, che converge a un vettore g„aHora la successione (8p„,), coincidendo di fatto con la successione (a,y„l converge ovviamente a a„g„. Pertanto il limite è anch' esso un autovettore relativo allo stesso autovalore. Autovalori e autovettori di una trasformazione simmetrica Come anticipato, nel caso di una trasformazione simmetrica (hermitiana), gli autovalori e gli autovettori godono di proprietà particolari, Innanzi tutto lo spettro discreto di un operatore lineare hermitiano è un insieme di punti dell'asse reale che può risultare vuoto (cioè non si hanno autovalori discreti) oppure finito o al più infinito numerabile. Per di più, autovettori relativi ad autovalori distinti sono ortogonali. 'La dimostrazione è semplicissima: dalla relazione che esprime l'hermiticità di 8, (y„, 8y„) = (8y„, y,) che, tenuto conto che y, è un autovettore, diventa (y„a,p,) = (a,y„, rp,),per la linearità e l'antilinearità del prodotto scalare nel secondo e primo membro, rispettivam ente, si ha: a„(y„ y , ) = a„'(y„, tp,), cioè a, = a,. L'autovalore è quindi un numero reale. In modo analogo, considerando due autovettori relativi ad autovalori distinti, dall'uguaglianza (yj, tlcp,) = (8cpj, q),), tenendo conto dell'equazione agli autovalori, ddle proprietà del prodotto scalare e del fatto che gli autovalori sono reali si deduce: (a, — aj)(yj, y,) = 0 cioè (pj, y„) = 0, la relazione di ortogonalità. Se si considera l'insieme di tutti gli autovalori e l'insieme delle varietà lineari a essi associate e se in ogni autovarietà, nel caso essa risulti degenere, si introduce un insieme ortonormale completo che la genera, si ottiene un insieme ortonormale (cp„) di autovettori associati allo spettro discreto ddl'operatore considerato. Ovviamente, risulta interessante chiedersi se questo insieme risulta completo. La risposta a questo quesito richiede un'ulteriore articolazione del problema della determinazione dello spettro di un operatore simmetrico.

Appendice 579

Per affrontare questo punto cruciale cominciamo col considerare il caso in cui gli autovalori di d' risultino tutti non degeneri e siano un'infinità numerabile. Avremo quindi un insieme ortonormale (q)p) costituito dagb autovettori dell'operatore in esame e supponiamo che esso risulti essere un S.O.N.C., per cui qualunque vettore dello spazio potrà esprimersi come: g = g

r k p k , ck= (Ipk,g). Questa possibilità di esprimere ogni

elemento dello spazio in termini di una combinazione lineare di autovettori dell'operatore rf risulterà di grande rilevanza fisica. Anticipiamo fin d'ora che se tutto quanto ora discusso si verifica, allora' risulta autoaggiunto. Se rf presentasse degenerazione, allora, come già menzionato, dovremmo introdurre in ogni sua autovarietà un S.O.N.C. di autovettori. A parte la complicazione derivante dal dover usare due indici anziché uno per caratterizzare gli elementi dell'insieme, di nuovo, se l'insieme cosiottenuto (p~,) (ove k corre sugli autovalori distinti e s corre da 1 a Np —eventualmente Ni, -— ~ —la dimensionalità dell'autovarietà associata all'autovalore a~l, risulta completo, allora l'operatore 8 risulta autoaggiunto. Sfortunatamente i casi ora discussi non esauriscono tutte le possibilità di interesse fisico. Il caso più generale si presenta allorché un operatore, oltre eventualmente allo spettro discreto appena discusso, presenta anche qudlo che tecnicamente si dice uno spettro continuo. Non risulta possibile entrare nei dettagli della trattazione di questo caso generale. Ci limiteremo ad alcuni cenni che dovrebbero consentire al lettore di cogliere i termini

essenziali dd problema. Spettro continuo, autovalori e autofunzioni improprie La pretesa di limitare le proprie considerazioni alle soluzioni delle equazioni agli autovalori che sono elementi dello spazio di Hilbert risulta troppo restrittiva e non consente di inquadrare nello schema teorico operatori che hanno un notevole interesse fisico. Limitandoci al solo caso rilevante, cioè a quello di operatori simmetrici, siamo cosi condotti ad accettare anche soluzioni che non appartengono allo spazio di Hilbert, purché vengano soddisfatte due condizioni essenziali. — Gli autovalori iL corrispondenti a soluzioni di questo tipo, /y' -— kg', non sono isolati ma devono risultare distribuiti con continuità su uno o più intervalli dell'asse reale. — Le soluzioni godono della proprietà che se si considera una loro combinazione lineare continua (cioè un'integrale anziché una somma) con6nata a un qualsiasi arbitrario intervallo (non importa quanto piccolo) contenuto negli intervalli di variabilità di L si ottiene un elemento dello spazio, In altri termi-

580 4.I ondamenti f concettualie leimplicazioni epistem olig iche...

mf

O s dà a R, per ogni t) contenuto in uno dei suddetti imervalli.

Gli intervalli per i quali si hanno soluzioni siffatte si dicono costituire lo spettro continuo di 8, i valori di iL appartenenti allo spettro continuo si dicono autovalori impropri e le relative soluzioni dell'equazione agli autovalori autovettori impropri. Se l'operatore lineare f(d è simmetrico, risulta facile dimostrare che: — (come già anticipato) gli autovalori impropri sono reali, per cui lo spettro (discreto e continuo) è un sottoinsieme di E, — i prodotti scalari tra un autostato proprio e uno improprio risultano nulli: (A,A ) = o, — inf'ne, se si considerano due sovrapposizioni continue di autostati impropri dd tipo di quella menzionata sopra relative a due arbitrari intervalli dello

spettro continuo' e Q tra loro disgiunti, vale a dire i due stati @(à = pzdiL e

On= fes dà,con ( d m ( à = r}},s(ha(os,Co) =0. Le due ultime relazioni sostituiscono, nel caso più generale che stiamo analizzando, quelle di ortogonalità tra autovettori propri. Naturalmente, oltre a queste analogie formali tra il caso discreto e quello continuo, risulta di grande rilevanza indagare se sia possibile scrivere una relazione analoga a quella di completezza per le autofunzioni dell'operatore e(e nel caso discreto. Si dirà che questo accade allorché vale una formula che generalizza in modo ovvio quella che esprime la completezza delle autofunzioni proprie: per ogn(g u )g si dovrà avere: g =

g

spettro discreto

cse s +

f c(à}tptdg.

spenro continuo

Ovviamente le autofunzioni improprie devono anch' esse essere opportunamente "normalizzate", nel qual caso i coefficienti c(iL) sono esprimibili come: c(fL) = (yz, g). La normalizzazione richiede, nel caso continuo, l'introduzione di una "funzione" che risulta l'analogo della delta di Kronecker del caso discreto. Questo ruolo è giocato dalla cosiddetta delta di Dirac, che si scrive B(iL —iL') e si comporta sotto il segno di integrale come il simbolo di Kro-

necker sotto il segno di somma:f f (l')6(à' à)dà' = f(à), p— urché il valore fL cada aH'interno dell'intervallo di integrazione. Utilizzando la funzione di Dirac si può allora imporre la corretta "normalizzazione" alle autofunzioni improprie: (yz, yz) = @iL — Z). Naturalmente, varrà anche l'analoga della formula che lega la norma di un vettore ai coefficienti del suo sviluppo in ter-

mini di un S O NC., cioè si avrà I(gli'

= gi cal' + f I c(1)l' dg. Questa equa-

zione mostra che nel caso in esame non solo la serie Q I ct, l', ma anche l'inte-

gralef ic(rt)l' dà, esteso a tutto lo spetrro continuo, risulta convergente. Ma

Appendice 581

questo non è tutto; come nd caso discreto, le condizioni di convergenza sia della serie che dell'integrale, oltre che necessarie, risultano anche sufficienti a garantire dte la relazione r

= g spettro discreto

cze t+

f cQ) ttrdk definisca nn

spettro continua

vettore g e g per il quale (tp~, g)= c~ e (tp~, g) = c(il), Possiamo concludere qui la nostra trattazione del problema della detemunazione delle autofunzioni proprie e improprie di un operatore enunciando il teorema fondamentale per i nostri scopi: un operatore risulta autoaggiunto se e solo se il suo spettro (discreto e continuo) è reale e se l'insieme delle sue autofunzioni proprie e improprie risulta completo nel senso che qualsiasi elemento dello spazio può scriversi come indicato sopra.

A.9 Operatori continui, limitati, unitari e proiettori In questo paragrafo prenderemo in esame alcuni tipi di operatori che godono di particolari proprietà e giocano un ruolo importante nel formalismo. Avendo reso preciso il concetto di limite (cioè l'idea di convergenza) nel nostro spazio potremo definire ora una trasformazione continua.

Operatori continui Una trasformazione lineare 7 dicesi continua in un punto g del suo dominio se, per ogni arbitrario e ) 0, esiste un numero positivo B(e) tale che per ogni tp E D(T) per cui I I y —gli < B(e)si abbia: II7tp -al l L 9 >+ 'PJ.) (PLX> g ) — Infine, PL è idempotente, un'espressione tecnica per asserire che (PL') = PL, in quanto la decomposizione di un vettore che appartiene già a ["g] risulta ~ = pL + e vale a dire (PL)' y = PL (PLti)) = PL tl' Di fatto, le condizioni ora enunciate risultano non solo necessarie ma anche sufficienti affinché PL risulti un proiettore. In altri termini, per qualsiasi operatore lineare definito dappertutto, hermitiano e idempotente, esiste una vatietà lineare chiusa tale che esso risulta l'operatore che associa a ogni vettore la sua proiezione su di essa. È utile sottolineare che tutti i vettori appartenenti a ["g] sono autovettori di PL relativi all'autovalore 1, mentre tutti i vettori appartenenti al complemento ortogonale di [g] sono autovettori di PL appartenenti all'autovalore 0 e che questi valori, cioè 0 e 1, sono i soli autovalori di PL. Va notato che gli operatori di proiezione, essendo simmetrici e definiti dappertutto, risultano ovviamente autoaggiunti. Di fatto la relazione rp = q)L + yL costituisce precisamente lo sviluppo di un vettore arbitrario in termini degli autovettori di PL.

Per i nostri scopi futuri risulta opportuno sottolineare alcune importanti proprietà deH'insieme dei proiettori.

Appendice 585

Somme, prodotti e differenze di operatori di proiezione Si considerino due operatori di proiezione Pt e P~ associati alle varietà lineari chiuse gE] ed [+] , rispettivamente. Valgono le seguenti proprietà: - Il prodotto Pq P~ è un proiettore se e solo se i due proiettori commutano, [Pt, P~] = 0 e in questo caso esso è associato alla varietà [$] n [ Q] i n terse-

zione delle due varietà gg ed [~] (cioè agli elementi comuni a entrambe). — Pt + P~ è un proiettore se e solo sePt Pjg -— 0,il che avviene se e solo se le due varietà [g] ed [+] risultano ortogonali, In questo caso Pq + P~ proietta sulla varietà somma diretta [ $] S QN] ddle due. — P~ — P~è un proiettore se e solo se Pq P~ -— P~cioè se [Q] c: gli] e in questo caso Pt — P~ p roietta sul complemento ortogonale di [~] i n [ g ] ( u n a varietà che, in accordo con le notazioni precedenti, si indicherà come [g] -

[pÃ]), cioè su quegli elementi di [$] che sono ortogonali a tutti gli elementi della sua sottovarietà [~]. — L'operatore identità I è un proiettore (infatti esso è ovviamente definito ovunque, hermitiano e idempotente) ed è il proiettore sulla varietà lineare chiusa costituita dall'intero spazio di Hilbert p. — L'operatore nullo 0 è anch' esso un proiettore che proietta sulla varietà lineare costituita dal solo elemento ru. Si osservi che il teorema sulla differenza di due proiettori implica che se Pq è il proiettore associato alla varietà lineare [g] allora I — Pq è un proiettore ed è associato al complemento ortogonale di [g] vale a dire alla varietà

W - [f]. Rappresentazione esplicita di un operatoredi proiezione Per famiharizzare il lettore con gli operatori di proiezione cominciamo col considerare una varietà monodimensionale [g'"].e un vettore normalizzato y> appartenente a essa. Dalla discussione sulla decomposizione di un vettore e dalla definizione dell'operatore di proiezione risulterà allora ovvio che il proiettore P> associato a [g'"] agisce sul generico elemento g c p nel modo seguente: P> g = ((pn g) ~, vale a dire lo trasforma in un vettore appartenente

a [P"] ma ne modifica la lunghezza in dipendenza dalla sua componente sulla varietà in esame. Si noti che l'operatore P, risulta indipendente dalla scelta del fattore di fase di g. Possiamo ora passare a una varietà arbitraria Pi] c: [P]. Come sappiamo esiste un S.O.N.C. che genera questa varietà. Lo indicheremo come (y,), ove j corre da 1 alla dimensionalità N (eventualmente infinita) di [g ] . Per ogni y, esiste un proiettore P, associato alla varietà monodimensionale caratterizzata da questo vettore. Poiché i vettori y, (e quindi le relative varietà) sono a due a due ortogonali, i proiettori possono venire sommati dando cosi luogo al proiettore sulla somma diretta delle varietà che entrano in gioco. In breve, il proiettore P sulla varietà gli] agisce

586 4. l fondamenti concettuali e leimplicazioni epistemoligiche...

su)(ar)sitrarioeettorege PIneiseguente modo: Pg

=g Pg=g(gt,g)tp,.

Per concludere dobbiamo passare a considerare l'ultimo caso che si può pre-

sentare, cioè quello legato all'apparire di vettori impropri dd tipo di quelli associati agli autovalori dello spettro continuo. Con riferimento alle formule analizzate precedentemente vale la pena sottolineare che se si considerano le autofunzioni improprie appartenenti agli autovalori di un intervallo h dello spettro continuo (normalizzate come indicato sopra), allora l'operatore che agisce ne) modo seguente: Psgt =J

((tt,tg) gttdg, risulta un proienore. In-

fatti Pt, è definito dappertutto in quanto l'integrale a destra definisce in ogni

caso un elemento di p. Inoltre: P @ = f dg(y~, f (cpz, @)(p~d PI,)(pz = f dP(, - f d1(yz, @) yz— déb(f,— 1)(cpz, C)) yz— - P~@, cioèPz è idempotente e J(g infine, ricordando l'ortogonalità tra gli stati dello spettro discreto e quelli del continuo e il fatto che il prodotto scalare tra due stati del continuo è una delta di Dirac, si mostra facilmente che sia ('P, Pd,@)che (Ptg'P, @) risultano

uguali a:f dL('P, yz)(yz, @), in modo chePt, risulta hermitiano. J4

Facendo riferimento alle proprietà di inclusione di una varietà lineare in un'altra risulta possibile introdurre un ordinamento parziale tra l'insieme degli operatori di proiezione. Ricordiamo che un ordinamento parziale è una relazione, che indicheremo col simbolo — - P„e quindi 17z— -P>+ Pq. Poiché [gq] ed [$z] sono ortogonali 17z è un proiettore che proietta sulla somma diretta [g~] S /E'] de)le

due varietà. Poiché ovviamente gli~] c: [$>1 S /E'], si ha che 17> + + P~che ovviamente proietta sulla somma diretta delle prime k varietà lineari. È evidente che la successione (17;} risulta monotona nondecrescente e quindi converge a un proiettore. Riveste particolare importanza il caso in cui questo limite è proprio l'operatore identità o, equivalentemente, in cui la somma diretta di tutte le varietà lineari della successione coincide con tutto lo spazio

di Hilbert.

A.6 Risoluzioni dell'identità e teorema spettrale Per concludere la discussione sull'insieme degli autovettori propri e impropri di un operatore autoaggiunto conviene identificare delle famiglie di operatori di proiezione che costituiscono quella che tecnicamente si definisce una risoluzione dell'identità. Cominceremo col caratterizzare un

588 4.Ifondamenti concettualie leimplicazioni epistem olig iche.. .

siffatto concetto in modo del tutto formale, per passare poi a illustrarlo servendoci di opportuni esempi concreti.

Risoluzione dell'identità Una risoluzione dell'identità è una famiglia completamente ordinata di operatori di proiezione i cui membri P(i1) sono caratterizzati da un parametro reale e continuo il che varia nell'intervallo ( — ~, + ~) e soddisfano le seguenti condizioni: — P(1) — > 0 la convergenza dovendo intendersi, come sempre, nel senso

che P(iL)y —> Oy = co,b'q) cP, — P(il) ~

P( i l ), ove il + che abbiamo posto dopo A, sotto il segno di limite

kMz+

sta a significare che iL deve tendere a iL per valori maggiori di i1 stesso. In altre parole si ha continuità dal di sopra,

— P(L)> P(A,) per L > iL, — P(iL) m I, valeadire:P(iL)tp ~ I cp= cp,'tt < EP. z ->+ z&+

Vale la pena sottolineare che, poiché gli elementi della famiglia risultano totalmente ordinati, la differenza P(il) —P(A,), quando il, > il„è un proiettore.

Risulta ora relativamente semplice mostrare che per ogni operatore autoaggiunto si può costruire una risoluzione dell'identità, che si dice a lui associata, costruita in termini delle sue autofunzioni proprie e improprie.

Risoluzionedell'identità associata a un operatore autoaggiunto Per analizzare questo problema si consideri un operatore autoaggiunto 8. Indichiamo con (ai,) l'insieme (vuoto, finito o numerabile) dei suoi autovalori

propri che disporremo in ordine crescente, in modo che k > j implichi a~ > a,; Per ciascuna delle autovarietà associate ai vari autovalori consideriamo un

S.O.N.C. (yt,,} che la genera (l'indices, come sempre, corre sulla dimensionalità della k-esima autovarietà). L'operatore possederà, in generale, anche uno spettro continuo che, come sappiamo, è un sottoinsieme dell'asse reale. Detto p un punto dello spettro continuo indicheremo come (ou la relativa autofunzione impropria (a essere rigorosi andrebbe tenuto conto che anche per lo spettro continuo può presentarsi degenerazione, una possibilità che noi ignoreremo per semplicità ma che non dà luogo ad alcuna complicazione all'infuori di una maggiore complessità notazionale). Fatte queste premesse si

consideri la seguente famiglia di operatori di proiezione P'"'(i1) dipendenti

Appendice 5S9

dal parametro reale e continuo 1 che varia tra — ~ e + ~, i quali agiscono nel modo seguente su un arbitrario demento 4 c g:

J

p'"(a)e =g,, g, , (mi .„) m~., +

Questa formula richiede alcune chiarificazioni circa la notazione cui si è fatto ricorso. Innanzi tutto il simbolo [iL] che compare quale estremo superiore ddla somma sta a indicare che la somma stessa deve intendersi estesa a tutti gli interi positivi tali che i rdativi autovalori discreti a, soddisfino alla condi-

zione a; < iL Si intende anche che per valori di iL minori dell'estremo inferiore dei punti ddlo spettro (che si assume limitato inferiormente) P'"'(il) coinci-

de con l'operatore nullo. Lintegrale che appare al secondo membro dell'equazione deve intendersi esteso a tutti i valori dello spettro continuo minori o

uguali a il. Sulla base dell'analisi del paragrafo A.4, risulterà chiaro al lettore che la famiglia P'"~(iL)ora introdotta costituisce una risoluzione dell'identità in quanto soddisfa a tutte le condizioni cui deve soddisfare. In particolare, il fatto che nel caso di un operatore autoaggiunto ogni elemento dello spazio possa scriversi come una serie più un integrale dei suoi autostati propri e

impropri, garantisce che P~'(iL) tende all'identità per A, tendente all'infinito. Per chiarire ulteriormente il procedimento ora esposto analizzeremo un caso particolare, vale a dire quello di un operatore autoaggiunto d' che ha uno spettro discreto non degenere limitato inferiormente con un punto d'accumulazione in zero e uno spettro continuo, anch' esso non degenere, che si estende da zero all'infinito. Indicheremo con ap, k = l, 2, ... i suoi autovalori ordinati per valori crescenti e con q)~ i relativi autovettori normalizzati mentre indicheremo con yq, per L ) 0, gli autostati impropri associati allo spettro continuo. Risoluzione dell'identità associata a un operatore autoaggiunto: un semplice esempio Con riferimento all'esempio appena descritto il lettore avrà chiaro il compor-

tamento deùa famigliaP '(iL) al variare di il nell'intervallo ( — ~,0). Per valori di il inferiori al minimo autovalore si haP'"'(iL) = 0; allorché 1 raggiunge il valore a> si ha P'"'(L) = P„vale a dire P~'(L) coincide col proiettore sulla varietà monodimensionale corrispondente al primo autovettore e resta tale fino a che L non raggiunge il valore az, ove esso diventa il proiettore sulla varietà bidimensionale generata dai due primi autovettori, e cosi via. Allorché A, supera il valore 0 si dovrà aggiungere al proiettore P'"'(0) il proiettore

P'"'(0, iL) che agisce nel seguente modo: P' '(0, 1)4 = f (y„,4)y„dP. RiaiO sulta ovvio che la famiglia P"'(A) cosi introdotta soddisfa a tutte le condizioni

590 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

cui deve soddisfare una risoluzione dell'identità. La risoluzione dell'identità che abbiamo preso in esame è stata costruita facendo ricorso alle autovarietà ddl'operatore rf, essa viene quindi appropriatamente indicata come risoluzione spettrale associata all'operatore 8 stesso.

Per il lettore più interessato ai dettagli tecnici conviene aggiungere alcuni commenti per rendere più esplicito in che senso una data risoluzione dell'identità risulti associata a un preciso operatore autoaggiunto.

Rappresentazione spettrale di un operatore autoaggiunto: il caso deHo spettro discreto Per analizzare il problema appena menzionato cominciamo con osservare che nel caso di un operatore autoaggiunto 8 con spettro puramente discreto, dalla formula che esprime un generico vettore 4 dello spazio in termini del-

l'insieme ortonormale completo degli autovettori di 8: 4 = g

(c p,,4)p;,

supponendo che 4 appartenga al dominio di 8 e ricordando che l'operatore 8 è lineare e che i vettori g sono suoi autovettori si ha: tb& = rf 7 ~

(g);,4) Rep= g M = [g

i =l

(y, , 4 ) qi

a;( y i , 4 ) q);, che si può anche scrivere come

aiP i] 4.Per semplificare la notazione abbiamo ignorato la possi-

bilità che le autovarietà presentino degenerazione. Questo non limita in alcun modo la trattazione in quanto se ciò dovesse verificarsi basterebbe ammettere che autovalori con diverso indice coincidano. Per esempio se si ha una varietà N + 1 volte degenere basta supporre che a; = a;,q - ... = a;,g. Ovviamente, in questo caso i vettori g; y+,, ... q);,ti sono un S.O.N.C. in questa varietà. La relazione derivata sopra che descrive l'effetto dell'applicazione di 8 al vet-

tore 4 ci consente di scrivere: 8 = [Y ~

i =1

aiPi], la rappresentazione spettrale di

d in termini dei suoi autovalori e dei proiettori sulle sue autovarietà. Risulta appropriato sottolineare che l'ultima relazione implica ed è implicata dal fatto che valga, per ogni elemento 4 del dominio denso di 8, la relazione:

(4, 84) = g

ai(@,P,@).

Wel caso di spettro puramente discreto la risoluzione spettrale dell'operatore coinvolge ovviamente una serie. Come già sappiamo, per passare a trattare lo spettro continuo dovremo sostituire le somme con degli oppor-

Appendice 591

tuni integrali. A questo scopo conviene innanzi tutto generalizzare il concetto di integrale in modo che esso consenta di esprimere anche una somma discreta come un integrale. Questo si può ottenere ricorrendo alla definizione di integrale secondo Stieltjes. L'idea che sta alla base di questa generalizzazione risulta abbastanza semplice, Come sappiamo, un integrale ordinario esteso a un certo intervallo può definirsi dividendo l'intervallo di integrazione in tanti intervalli contigui b,;, moltiplicando l'ampiezza

dell'intervallo per il valore che la funzione da integraref(x) assume in un punto arbitrario dell'intervallo, sommando questi prodotti su tutti gli intervalli e infine prendendo il limite per l'ampiezza degli intervalli che tende a zero. Si noti che in questa definizione di integrale il generico intervallo (a, b) contribuisce col fattore d, = (b-a) all'integrale stesso. Stieltjes ha ritenuto opportuno considerare una definizione di integrale in cui regioni diverse deH'intervallo di integrazione contribuiscono in modo diverso. Questo può facilmente ottenersi introducendo una funzione definita sull'intervallo di integrazione la quale risulti positiva e monotona nondecrescente e assumendo che, nella valutazione dell'integrale, a un arbitrario intervallo (a, b) debba attribuirsi un valore che non è dato

(come nell'integrazione ordinaria) dalla differenza (b-a) ma invece dalla differenza p(b) — p(a). Risulterà evidente al lettore la ragione per cui un siffatto procedimento consente di scrivere una somma come un integrale. Infatti se si considera una funzione p(x) costante-a-tratti la quale fa dei salti in punti determinati, è ovvio che tutti gli intervalli in cui la funzione stessa risulta costante non contribuiscono all'integrale perché, secondo la prescrizione di Stieltjes, il loro peso risulta nullo essendo proporzionale

alla differenza p(b) — p(a). Al contrario, se tra a eb la funzione p(x) fa un salto per un definito valore x dell'asse x, allora l'unico intervallo contenuto tra questi due estremi che può contribuire all'integrale è quello che contiene il punto di discontinuità e il "salto" p(b) —p(a) viene moltiplicato per il valore f(x) della funzione nel punto in cui avviene il salto stesso. Se si assume questa prospettiva risulta allora possibile trattare in un modo unificato il caso di spettro discreto (funzione (4, P(il)4) che varia con discontinuità nei punti corrispondenti agli autovalori e mantiene lo stesso valore tra due autovalori) e quello di spettro continuo in cui la funzione in questione cresce con continuità. Fatte queste precisazioni possiamo concludere questa digressione tecnica enunciando il teorema di risoluzione spettrale per un operatore autoaggiunto nella sua forma più generale.

592 4. I fondamenti concettuali e le implicazioni epistentoligiche...

Teorema di risoluzione spettrale

La famiglia di operatori di proiezione P~) Q) costituisce la risoluzione spettrale associata all'operatore simmetrico 8, se essa è una risoluzione dell'identità e inoltre, per ogni elemento @ del dominio di 8, vale la relazione che (purché l'integrale venga inteso nel senso di Stieltjes) include e generalizza quella scr)tta sopra, cioè si ha ( tp, Atp) = è d(tp, p'"'(è)rp).

l

A.7 Commutatività e compatibilità In questo breve paragrafo vogliamo enunciare un teorema che risulta di

grande rilevanza per le sue implicazioni fisiche. Il teorema è più semplice da formulare e ha delle conseguenze che è più facile intuire allorché si faccia riferimento a due operatori autoaggiunti che abbiano entrambi uno spettro puramente discreto.

Commutatività e insiemi completi di autostati comuni Condizione necessaria e sufficiente affinché due operatori autoaggiunti rf e E con spettro puramente discreto abbiano un sistema completo di autostati in comune (vale a dire affinché esista un S.O.N.C. i cui dementi risultano autovettori simultanei di entrambi) è che essi commutino, cioè valga (88 — Erfl= 0. Ovviamente il teorema risulta significativo quando entrambi gli operatori presentano degli autovalori degeneri. Allora il teorema asserisce che, considerata una autovarietà degenere, per esempio di rt, si potranno identificare in essa degli opportuni vettori che risultano autovettori di E Ovviamente questi autovettori, in generale, saranno associati a differenti autovalori per quest'ultimo operatore mentre appartengono tutti allo stesso autovalore di l'. La considerazione di operatori commutanti ci consente quindi di eliminare (completamente o in parte) l'eventuale degenerazione delle autovarietà di ciascuno di essi.

Il teorema appena enunciato conduce direttamente a un concetto di notevole rilevanza, quello di insieme completo di osservabili commutanti.

Appendice 593

Insieme completo di osservabili commutanti Si consideri un insieme (8, E, d',...) di n osservabili che commutano tutte tra di loro. Come conseguenza del teorema precedente essi avranno un insieme completo di autostati in comune. Nei caso in cui assegnata un'ennupla qualsiasi di autovalori (a;, b,; c~,...) per gli operatori dell'insieme esiste uno e un solo vettore g, ~ che è un loro autostato simultaneo relativo agli autovalori considerati, si dirà che l'insieme in oggetto costituisce un insieme completo di osservabili commutanti. Siffatti insiemi giocano un ruolo essenziale nella preparazione di un sistema fisico.

A.S Funzione di osservabile Classicamente si fa continuo ricorso alla considerazione di funzioni di quantità fisicamente osservabili. Per esempio si considera l'energia cinetito ca che, come ben noto, è una funzione dell'impulso: T = p'/2m. Di fat nel caso generale ogni osservabile può esprimersi come una funzione delle posizioni e degli impulsi dei costituenti del sistema in esame. In meccanica quantistica questo problema richiede una particolare cautela, per la noncommutatività di osservabili diverse. Ma, almeno nel caso in cui si consideri un singolo operatore autoaggiunto, Dirac ha suggerito una definizione appropriata e precisa per quello che deve intendersi come una sua funzione, una definizione che soddisfa tutte le richieste naturali che gli devono essere imposte. Per illustrare la posizione di Dirac, cominciamo col discutere brevemente un caso ovvio, quello della potenza m-esima, 8" di un operatore autoaggiunto 8. Egli osserva appropriatamente che se si considera un autovettore pp di 8 relativo all'autovalore a~. rkpp= a~pp, allora esso risulta automaticamente autovettore di 8 relativo all'autovalore (a~) . — 8 Myp — - (ap)d'" 'yp -—(ap)8 'Bye -—(ap)'8 'yp - ... e cosi Infatti: d'"yp via. Sulla base di questa ovvia osservazione Dirac formula allora in generale la sua idea di funzione di osservabile. -

594 4. I fondamenti concettuali e leimplicazioni epistemoligiche...

Funzione di osservabile secondo Dirac Si consideri un operatore autoaggiunto 8 e l'insieme dei suoi autovalori e autovettori propri e impropri. Si definisce allora la funzionef(fi') dell'osservabile ffl come qudl'operatore che ha le stesse autofunzioni di 8 e come autovalori la funzione numerica f(x) degli autovalori associati, vale a dire si

pone: f(8) 0, Vcp c 0(d). Supponiamo ora di considerare un punto di accumulazione g di 0(8) che non gli appartiene. Come sappiamo esisterà

una successione ittt„i di elementi di Diri) che converge a g: ttt„sg. Risulta allora immediato mostrare che la successione (4„) dei trasformati degli elementi della successione, 4„ = Rep„, soddisfa al criterio di Cauchy. Infatti Il@j @J) Il/cjp Apbl I I IA(pj (pb) I I CI I pj p>II e l'ultimo termine di questa catena può rendersi arbitrariamente piccolo in quanto la suc-

cessione (yb) soddisfa a sua volta al criterio di Cauchy. Ma poiché lo spazio Pt è completo, la successione (@„) risulta convergente, vale a dire esiste un elemento tts e % tale che rtttt. = t ts„— s C'. P ossiamo allora considerare

unoperatore ri che coincide con A' su57P), ma è definito anche su g, ponen-

do: 8g = @. Lo stesso procedimento può applicarsi a tutti i punti di accumulazione di D(d'), ottenendo cosi un operatore d che costituisce un'estensione di rf alla varietà lineare chiusa I.P(8)], È facile verificare che questa estensione è unica e risulta lineare. In breve: ogni operatore lineare continuo ammette un'unica estensione lineare alla chiusura del suo dominio.

Vale la pena spendere due parole per illustrare con un'analogia il procedimento appena delineato. Poiché nel caso di un operatore lineare la continuità in un punto implica la continuità su tutta la varietà lineare che ne costituisce il dominio, un operatore continuo che non sia definito sulla chiusura del suo dominio si configura come l'analogo della funzione che si otterrebbe eliminando dal dominio chiuso [a, b] di una funzione continua

f(x) in esso uno degli estremi, per esempiob, ed asserendo chef(b) non è definito. Poiché la funzione in esame deriva da una funzione continua nell'intervallo chiuso, esiste il limite di f(x) quando x tende ab. Risulta allora ovvio estendere la funzione a tutto [a, b] definendof(b) = lim f(x). x~b

Quanto appena discusso mostra come considerare un operatore continuo definito su una varietà lineare non chiusa è in un certo senso una stravaganza cui si può rimediare in un modo estremamente naturale. Questo è quello che faremo d'ora in poi, vale a dire ogni volta che parleremo di un operatore continuo intenderemo riferirei alla sua (unica) estensione alla chiusura del suo dominio. D'altra parte poiché, come abbiamo ripetutamente segnalato, noi consideriamo solo operatori densamente definiti, questa scelta comporta che, per noi, ogni operatore continuo è definito su tutto K

596 4. l fondamenti concettuali e le implicazioni epistemoligiche...

Laggiunto di un operatore continuo definito ovunque Vale il seguente teorema: ogni operatore continuo rf definito dappertutto ammette aggiunto A" (questo lo sapevamo già) e per di più d' risulta esso stesso continuo e definito dappertutto. Incidentalmente, questo implica che ogni operatore continuo simmetrico è autoaggiunto.

Operatori positivi

Un operatore 8 continuo (limitato) si dice positivo se (y, rfy) > 0, V

0 implica che esso è un numero reale e quindi coincide con il suo complesso coniugato: (cp,Hy) = (8q), g)) = (cp, d'y), Vy c p (ove si è utilizzato il fatto appena menzionato che nd nostro caso ri" esiste ed è definito ovunque). Ora, la relazione (y, ~(p) = (p, Ep), Vy c g, implica banalmente 8 = E, come può vedersi ponendo al posto di q) le due combinazioni lineari p + g e y + tg, e derivando quindi (g, 8y) = (g, E(r). Questa uguaglianza, essendo g arbitrario, implica a sua volta 8y = Ey, Vy c g, cioè d = E.

Spettro e radice quadrata di un operatore positivo L'analisi appena svolta permette di mostrare che ogni operatore positivo 8 ha una risoluzione spettrale, il relativo spettro risultando anch' esso positivo. Quest'ultimo fatto segue banalmente dall'osservazione che se rf avesse un autovalore negativo, diciamo —p con p reale e positivo, detto y~ il relativo autovettore si avrebbe: (cpv, 8yz) = —plltp~ll', in contraddizione colla positività. (Un analogo argomento mostra che anche gli autovalori del continuo devono risultare positivi o nulli). Usando la prescrizione di Dirac per la funzione di un operatore può quindi definirsi un operatore n = ~J ( che si dirà la radice aritmetica di 8) come quell'operatore che ha le stesse autofunzioni di 8 le quali vengono associate alla radice aritmetica dei relativi punti dello spettro di rf stesso. Si noti che Eè un operatore positivo e che soddisfa A" = d'. Per di più Z è l'unico operatore positivo che soddisfa questa relazione.

Torniamo ora al caso generale di un operatore 8 continuo (limitato). In questo caso, come osservato in precedenza, l'aggiunto d' esiste, è limitato

Appendice 597

e definito ovunque. L'operatore Rl' = rf'8 è allora un operatore positivò in

quanto (y, ldl'y) = (y, A"8y) = (dy, 8y) = lldyll'. La tracciadi un operatore positivo

Sia 8 un operatore positivo e (yj) un S.O.N.C. in P. Si definisce traccia di 8 e si indica come tr8 l'espressione: trrf = Y (tp j f f t pj )Si mostra facilmente ~

j =l

che tr/ (che risulta un numero positivo o diverge a +~) non dipende dal S.O.N.C. considerato.

Siamo ora in grado di de6nire gli operatori di classe traccia, un sottoinsieme degli operatori continui.

Operatore di dasse traccia Un operatore 8, continuo (limitato) è di classe traccia se, posto Irti = gl/l ', risulta trlAI ( , vale a dire se la rdativa serie risulta convergente. Fquivalentemente può mostrarsi che un operatore limitato d è di dasse traccia se e solo

se, per almeno un S.O.N.C, (gj) la serie~P j l=lg/ g , l l risulta convergente. Nel seguito indicheremo come 7, l'insieme degli operatori di classe traccia.

Alcuni teoremi sugli operatori di dasse traccia — L'insieme 7t degli operatori di classe traccia è uno spazio vettoriale, vale a

àire d,E c 7> implica a 8 +bE e 7,, b'a,b c C, — 8 c 7t e E continuo implicano rfE e 7> e'' e 7>. — Se d' e 7> allora d' e 7>.

Proprietà della traccia Alcune proprietà dell'operazione di traccia per operatori di classe traccia saranno utili nel seguito. — La traccia è un'operazione hneare, vale a dire 8, E e 7j, a, b c C implicano tr(aH + aE) = a tr8 + b trE. — Se rI c 7> eEè limitato: trrfE = tr8rf.

598 4. I fondamenti concettuali ele implicazioni epistemoligiche...

Operatori di proiezione e operatori di classe traccia Sia Pi l'operatore di proiezione sulla varietà lineare chiusa [g;], Se questa varietà ha dimensione finita N, allora P; è di classe traccia e tr(P;) = N. Come caso particolare il proiettore su una varietà monodimensionale è di classe traccia e per di più ha traccia 1.

Operatore statistico o operatore densità Un operatore l'è un operatore statistico se è lineare, continuo, positivo (e quindi autoaggiunto), di dasse traccia e con traccia 1. Indicheremo la classe degli operatori statistici come 0,.

Gli operatori statistici godono di alcune importanti proprietà che conviene menzionare esplicitamente.

Proprietà dell'insieme degli operatori statistici L'insieme degli operatori statistici è convesso, vale a dire V, k'c Pl implica che per ogni coppia v, w di numeri reali e positivi per cui v+ w = 1 si ha vl + wk'e Dl, Ovviamente l'operazione di combinazione convessa ora considerata si può estendere a un numero finito di operatori statistici (/u,')i = 1, 2, ..., N. In ~

altre parole, la combinazione convessa

+

N i=l

wi l'i, con wi > 0 e

~

+

N i=l

w; = 1,

è un operatore statistico. Ancora più importante è il fatto che l'insieme degli operatori densità risulta convesso anche per la combinazione di un'infinità numerabile di operatori statistici (tecnicamente si esprime questa proprietà

dicendo che l'insieme Dl è biconvesso).

Combinazioni a coeáicienti reali e positivi di operatori di proiezione su varietà monodimensionali Da quanto precede segue banalmente che se [P;) è una successione di proiettori monodimensionali e (P;) una successione di numeri reali e positivi tali che la serie Y ~

i=l

w; r i s ulti convergente ed abbia somma 1, allora l'espressio-

ne Y w iPi definisce un operatore statistico. ~ i =l

Appendice 599

Traccia del prodotto di un operatore densità per un proiettore Risulta utile elencare una serie di proprietà che utilizzeremo in seguito. Si consideri un operatore statistico l'(che è un operatore di classe traccia) ed un proiettore P (non importa se associato a una varietà finito o infinito dimensionale). Essendo comunque P un operatore limitato, D' è di dasse traccia e coincide, per l'idempotenza di P con l'operatore kP = lvPP. Ricordando la proprietà ciclica dell'operazione di traccia, trdE = trBR valida per ogni 8 c O> ed ogni B limitato si ottiene: tr(kP) = tr (&PP) = tr (Pt(tP). Loperatore che appare nell'ultima espressione è un operatore positivo in quanto ((p, PluPy) =

(Py, kPy) e l'è positivo. La traccia è quindi definita ed indipendente dal S.O.N.C. che si sceglie per valutaria. Conviene allora considerare un insieme ortonormale ( ,

Xz ...g„,... è una successione numerabile di insietni misurabili, allora I è ancora un insieme misurabile. • gZ) è chiuso rispetto al complemento relativo insiemistico '. se X è un insieme misurabile, allora anche X' è un insieme misurabile.

614 5.La logicaquantistica

Ogni sottoinsieme misurabile X deHo spazio delle fasi può anche essere visto come una proposizione fisica astratta, che ogni stato puro p può verificare o falsificare. Diremo che:

p verificala proposizione X quando p appartiene a X; p falsifica X quando p non appartiene ad X (ossia appartiene al complemento relativo di X rispetto allo spazio Z). Questo modo di rappresentare matematicamente le proposizioni fisiche permette di rispondere subito alla domanda: "qual è la logica della meccanica classica?". La logica della meccanica classica è la logica clussica. Infatti, l'insieme 5(Z) dei sottoinsiemi misurabili ddlo spazio delle fasi Z è un campo di insiemi e dunque ha la struttura di un'algebra di Boole

g(Z), ll, U, ', 1, 0) dove ll, U e ' sono rispettivamente le operazioni insiemistiche di intersezione, riunione e complemento (relativo), mentre 1 e 0 rappresentano rispettivamente l'elemento massimo (Z) e l'elemento minimo (l'insieme vuoto 8). Secondo l'interpretazione logica standard, le operazioni insiemistiche corrispondono ai fondamentali connettivi logici: congiunzione (r), disgiunzione (v), negazione (~), E, come vedremo meglio più avanti, la logica dassica rappresenta quella particolare logica che corrisponde naturalmente al concetto algebrico di algebra di Boole. Otteniamo cosi, per la struttura delle proposizioni fisiche, l'usuale comportamento semantico, codificato dalle tavole di verità: p verifica la negazione di una proposizione X se e solo se p non verifica la proposizione X; p verifica la congiunzione di due proposizioni X, Y se e solo se p verifica entrambi i membri; p verifica la disgiunzione di due proposizioni se e solo se p verifica almeno uno deidue membri. Perché questa costruzione semantica non risulta trasferibile al caso della meccanica quantistica? Birkhoff e von Neumann osservano: «Nella teoria quantistica, i punti di Z corrispondono alle cosiddette "funzioni d'onda"; quindi Z è uno spazio di funzioni, che di solito si assume essere uno spazio di Hilbert». Lo spazio deUe fasi Z viene dunque sostituito da uno spazio di Hilbert A," mentre gli stati puri del sistema quantistico studiato sono rappresen-

' Per la definizione di spazio di Hilbert, cfr. il capitolo di Gbirardi in questo volume.

La nascit a della logica quantistica:Birkhoff e von Neumann 615

tati da vettori di lunghezza unitaria ~ in A' (corrispondenti alle funzioni d'onda). Su questa base scatta subito una fondamentale differenza semantica fra il caso della meccanica classica e quello della meccanica quantistica. Nella meccanica delle particelle classiche vale il principio semantico del terzo escluso: ogni proposizione è vera o falsa rispetto a qualsivoglia stato puro. Ossia:

per ogni X e per ogni p, p e X o p eX' Tertium non,datur! In meccanica quantistica, invece, le funzioni d'onda permettono di associare a ogni questione sperimentale "il valore della tale grandezza cade nel tale insieme?" soltanto valori di probabilità. Avremo dunque per ogni questione sperimentale Q e ognifunzione d'onda y

~(Q) e [0,1]. Otteniamo cosi una caratteristica situazione semantica polivalente (che costituisce una refutazione del principio semantico del terzo esduso). Sono possibili almeno tre casi:

1) ~ verifica Q perché ~ associa a Q valore di probabilità 1; 2) ~ falsifica Q, perché ~ associa aQ valore di probabilità 0; 3) Q resta indeterminata per ~, perché ~ associa a Q un valore di probabilità diverso sia da 1 sia da 0. Tertium datur! A questo punto si tratta di rispondere alla domanda: quale sarà un buon rappresentante matematico per il concetto intuitivo di proprietà fisica, nel formalismo degli spazi di Hilbert? Innanzitutto, conviene ricordare una caratteristica fondamentale ddla meccanica quantistica, che è codificata dal principio di sovrapposizione: le combinazioni lineari (sovrapposizioni) di stati puri determinano stati puri. Per esempio, supponiamo che yr e yz rappresentino due stati puri e consideriamo una qualsivoglia combinazione lineare y = cr yi + cz@z (che sia un vettore di lunghezza unitaria). In tal caso anche cp rappresenta uno stato puro. Secondo l'assiomatizzazione standard della meccanica quantistica,~ una sovrapposizione di stati come questa ha la seguente interpretazione fisica: un sistema che si trovi ndlo stato y, potrebbe verificare con probabilità )ci )' le proprietà certe dello stato p> e con probabilità Icz I Per la de6nizione di combinazione lineare, Ivi. ' Ivi.

616 5. La logica quantistica

le proprietà certe dello stato y2. (I valori Ic, ~ e Ic, l' possono essere legittimamente interpretati come valori di probabilità, visto che rp, Il/1 e li/z hanno lunghezza unitaria), Si tratta di un comportamento tipicamente quantistico: in meccanica classica, invece, le sovrapposizioni di stati puri, in generale, danno luogo a stati che non rappresentano informazioni massimali (si parla di stati misti o miscele di stati puri). Quando gli stati puri yn..., y„assegnano probabilità 1 a una certa proposizione sperimentale Q, allora ogni stato puro c p =av (u n p) Nella logica classica (ma non nella logica quantistica!) l'uncino di Sa-

saki collassa sulla usualeimplicazione materiale ~a v p. De6nizione4.1 Un modello algebricodi LQ è una coppia M = (A, v) dove

(A, ll, U, ', 1, 0) è un reticolo ortomodulare; b) v (la funzione di interpretazione) interpreta la negazione come l'ortocomplemento ('), e la congiunzione come l'infimo reticolare (Il); ossia: (i) v(~a) = v (a)' a) A =

(ii) v(u n p) = v(a) fl v(p) De6nizione 4.2 Un enunciato u è detto vero in un modello (A, v) se e solo se v(a) = 1. Su questa base otteniamo che: P è una conseguenza di u nella semantica algebrica (u I= p) se e solo se v(u) C v(p) in ogni moddlo (A, v) fondato su un reticolo ortomodulare A. Inoltre, u sarà una verità logico-quantistica nella semantica algebrica

La logicaquantistica ortodossa e lesue anomaliesem antiche 63 1

(C a) se e solo se a risulta vera in ogni modello algebrico di LQ. Usando la proprietà dell'ortomodularità, è possibile dimostrare una versione semantica del "lemma di deduzione":

Lemma a C P se e solo se I- a m

P

Da un punto di vista intuitivo, ciò significa che — > rappresenta un "buon connettivo condizionale": a — > p è una verità logica se e solo se

p è una conseguenza di a. Definizione43 Un modello kripkiano per la logica LQ ha la forma (I, R, II, v) dove: a) la relazione di accessibilità R è riflessiva e simmetrica (ossia, ogni mondo è accessibile a se stesso; se un primo mondo è accessibile a un secondo mondo, allora anche il secondo è accessibile al primo). Scrivere-

mo anche i>j invece di Rj i; e i J j per nonRji. Inoltre, se X c I, scriveremo i J X q u a ndoi è non accessibile a ogni elemento di X. Sei è accessibile a qualche elemento di X, scriveremo invece:i~ X. I ndichia-

mo con 2Pl'insieme: (i e I : i J

X) . Unaproposizione possibile rappre-

senta un insieme X massimale di mondi: ossia X deve contenere tutti e soli i mondi i cui mondi accessibili sono accessibili ad almeno un ele-

mento di X (i e X se e solo se per ognij [sei~j

al lora j > X]). Si di-

mostra facilmente che: X è una proposizione possibile per ogni X z I ;

8 e I sono proposizioni possibili; se X, Y sono proposizioni possibili allora anche l'intersezione X ll Y è un proposizione possibile;

b) II è un insieme di proposizioni possibili che contieneI, 8 ed è chiuso rispetto alle operazioni R e c) II è ortomodulare;

d) i) v(a) e II per ogni enunciato atomico a; ii) v(~a) = v (a) iii) v(a ~ P) = v (a) ll v(P). Definizione 43 Un enunciato a è vero in un modello (I, R, II, v) quan-

do è verificato in ogni mondoi (per ognii e I : i E v(a)). Su questa base risulta: p è una conseguenza di a nella semantica kripkia-

na di LQ se e solo se per ogni modello kripkiano (I, R, II, v) di LQ e per ogni mondoi: sei e v(a), allorai c v(p). Inoltre, a è unaverità logica di LQ nelIcs semantica kripkianase e solo se a è vera in ogni modello

kripkiano di LQ. Si dimostra che la semantica algebrica e quella kripkiana per LQ ca-

632 5. La logica quantistica

ratterizzano la stessa logica. In altri termini, le due semantiche catturano la stessa idea di conseguenza logica. Definizione 4.4 Un enunciato u è chiamatosemanticamente consistente quando fra le sue conseguenze semantiche non ci sono contraddizioni,

ossia per ogni p p r ~ p non è una conseguenza di u. Si dimostra che: u è semanticamente consistente se e solo se esiste almeno un modello algebrico (A, v) tale che v(u) c 0 se e solo se esiste al-

meno un modello kripkiano (I, R, II, v) e almeno un mondo i e I tale chei e v(u). Entrambe le semantiche, algebrica e kripkiana, ammettono una esemplificazione naturale negli spazi di Hilbert. Ciò costituisce il punto di partenza per l'interpretazione fisica di LQ. Sia A'uno spazio di Hilbert, che rappresenti l'interpretazione matematica di un certo sistema fisico S. Un modello algebrico (A, v) si può costruire scegliendo come algebra A. il reticolo ortomodulare dei sottospazi chiusi (o equivalentemente dei proiettori) di X; mentre v rispetterà il significato degli enunciati atomici. Chiaramente, da un punto di vista intuitivo, un modello algebrico di questo tipo è fondato sulla seguente idea: i significati astratti, che sono elementi della struttura, corrispondono a possibili controparti matematiche delle proprietà fisiche del sistema studiato.

Un modello kripkiano (fondato sullo stesso spazio di Hilbert A) si può ottenere assumendo che: • I = l'insieme degli stati puri del sistema (che, come sappiamo, sono rappresentati da vettori di lunghezza unitaria); • R = la relazione di non ortogonalità ~ fra stati puri: ~~ y s e e solo

se (~, y) c 0, dove (tp, ~) è il prodotto scalare di ~ e tp." • II = l ' insieme delle proposizioni possibili, che è univocamente determinato dall'insieme dei sottospazi chiusi. • v rispetta il significato degli enunciati atomici. In questo caso, l'idea intuitiva di base è la seguente: gli stati puri del sistema studiato rappresentano i mondi possibili del modello. Si tratta di una interessante esemplificazione fisica del concetto apparentemente metafisico di mondo possibile,introdotto da Leibniz. Le proposizioni possibili corrispondono aproprietà fisiche dd sistema; mentre, accessibilità significa non ortogonalità. Ma quando due stati puri sono non ortogonali fra loro? Quando è possibile trasformare il primo stato nel secondo stato, dopo aver eseguito una misurazione e aver applicato il collasso della

Si veda il capitolo di Ghirardi.

La logica quantistica ortodossa e le sue anomalie semantiche 633

funzione d'onda.' Pertanto, anche la relazione di accessibilità nel nostro modello acquista un significato fisico molto concreto. Modelli algebrici e kripkiani, fondati su spazi di Hilbert, sono anche chiamati modelli hilbertiani di LQ. A questo punto sorge naturalmente una domanda: la logica quantistica ortodossa è caratterizzata dalla classe dei modelli algebrici hilbertiani? La risposta è negativa. Come ha dimostrato Greechie,' esiste un enunciato piuttosto complicato del linguaggio di LQ (corrispondente alla cosiddetta legge ortoarguesiana) che è vero in ogni modello hilbertiano, mentre risulta non vero in qualche

modello di LQ. Chiamiamo logica quantistica hilbertiana (LQH) la logica che resta semanticamente caratterizzata dalla classe di tutti i mo-

delli hilbertiani. Chiaramente HLQ è più forte di LQ, in quanto ha fra le sue verità logiche anche la legge ortoarguesiana. Pertanto la logica quantistica astratta risulta decisamente più generale (e più debole) rispetto alla sua origine storica e fisica: non possiamo dire che essa descriva tutte le situazioni logiche caratteristiche della meccanica quantistica. 4.1 Una assiomatizzazione della logica quantistica ortodossa LQ è una logica assiomatizzabile. Molte assiomatizzazioni diverse (tutte equivalenti fra loro) sono state proposte. Noi presenteremo qui un calcolo, che risulta molto intuitivo in quanto è facilmente leggibile come una naturale "trascrizione logica" della struttura dei reticoli ortomodulari.' Il nostro calcolo non ha assiomi logici ed è determinato come un sistema di regole.Ogni regola ha la seguente forma Pi

— (pm a). Si dimostra che, diversamente da quello che succede nd caso classico, la negazione del principio ddl'a fortiori è un enunciato non contraddittorio. Tuttavia l'insieme che contiene soltanto questo enunciato non può ammettere estensioni non contraddittorie e complete.' Da un punto di vista intuitivo, la violazione della proprietà di Lindenbaum rappresenta un risultato di incompletezza logica molto forte: il principio del terzo escluso cade a un livello molto profondo. Esistono teorie che sono intrinsecamente incomplete anche in mente Dei, indipendentemente dalla conoscibilità e decidibilità del loro sistema di assiomi. Tutto questo va ben oltre i limiti sanciti dai famosi teoremi di Godd, secondo cui ogni teoria classica non contraddittoria e assiomatizzabile (che soddisfi alcuni requisiti sintattici canonici) è logicamente incompleta (ossia esprime enunciati che sono indecidibili nella teoria). L'incompletezza forte di LQ rappresenta una naturale controparte lo' Si veda DaUa Chiara, 1986e Golblatt, 1974. ' Dalla Chiara, 1986e Giuntini, 1991.

636 5. La logica quantistica

gica per l'indeterminismo essenziale della meccanica quantistica: in un certo senso, si tratta di un principio molto generale di indeterminazione semantica. Fra i problemi metalogici che risultano ancora aperti, limitiamoci a ricordare i seguenti:

1) LQ è decidibile? Ossia è possibile, per ogni enunciato del linguaggio, decidere in un numero finito di passi se si tratta o meno di una verità logica?

2) LQ gode dellaproprietà del modello finito? In altri termini, quando un enunciato non è una verità logica, esiste sempre un modello finito che non lo verifica? Un risposta positiva al secondo problema comporterebbe automaticamente una risposta positiva al primo, ma non viceversa.

5. Logiche quantistiche unsharP

5.1 L'approccio unsharP Nel paragrafo 4 abbiamo visto alcuni motivi di insoddisfazione verso l'approccio logico-quantistico standard. Una domanda che è stata discussa è la seguente: i proiettori rappresentano davvero la controparte matematica più adeguata per il concetto intuitivo di proprietà di un microoggetto? Una generalizzazione interessante è stata proposta nel contesto dell'approccio unsharp alla meccanica quantistica. Da un punto di vista intuitivo, la differenza fra l'approccio ortodosso (sharp) e quello unsharp può essere illustrato attraverso una metafora non scientifica. Consideriamo i due seguenti enunciati, il cui valore di verità appare altamente indeterminato: I. Amleto è alto un metro e settanta. Il. Bruto è un uomo d'onore. I nostri due esempi coinvolgono tipi diversi di indeterminazione semantica. Nel primo caso, l'incertezza del valore di verità sembra dipendere essenzialmente dall'incompletezza del concetto individuale associato al nome "Amleto". Com'è ben noto, diversamente dagli individui reali, i personaggi letterari hanno di solito molte proprietà che restano indefinite. Senza dubbio, "essere alti un metro e settanta" rappresenta una proprietà precisa (sharp). Tuttavia il concetto che abbiamo associato ad Amleto non è completo: pertanto non è in grado di decidere una simile proprietà. Molto diversa è invece l'indeterminazione semantica caratteristica del nostro secondo esempio. In questo caso, è la stessa proprietà che è ambigua e imprecisa. Che cosa significa esattamente "essere un uomo d'onore"? È inutile ricordare come l'ambiguità dell'espressione "uomo d'onore" giochi un ruolo poetico importante nel celebre monologo del Giu-

lio Cesare di William Shakespeare. L'approccio ortodosso alla meccanica e alla logica quantistica prendono in considerazione solo esempi di indeterminazione semantica del primo tipo: le proprietà (rappresentate dai proiettori) sono sharp; tuttavia i concetti individuali (gli stati puri del sistema) sono logicamente incompleSi veda, fra gli altri, Busch, Lahti e Mittelstaedt, 1991; Cattaneo e Laudisa, 1994; Davies, 1976 e Ludwig, 1983.

638 5. La logica quantistica

ti: pertanto non sono in grado di decidere tutte le proprietà rilevanti del sistema. In ogni caso, quando una proprietà non è impossibile (ossia non è rappresentata dal proiettore nullo) esiste sempre uno stato puro che ne gode con certezza (ossia le attribuisce valore di probabilità 1). Una caratteristica dell'approccio unsharp è lo studio di indeterminazioni semantiche del secondo tipo: ci sono proprietà intrinsecamente ambigue. Un caso limite di assoluta ambiguità è rappresentato dalla cosiddetta proprietà semitrasparente, a cui ogni stato puro associa valore di verità 1/2. Da un punto di vista fisico, l'ambiguità può essere determinata da tanti fattori diversi: l'errore nelle misure, il rumore nella trasmissione dell'informazione e cosi via. Come rappresentare matematicamente le proprietà ambigue? Negli spazi di Hilbert, un buon candidato è costituito da operatori particolari che sono stati chiamati effetti. Da un punto di vista intuitivo, gli effetti rappresentano una sorta di massimalizzazione del concetto di possibile proprietà fisica, che sia compatibile con le regole statistiche della meccanica quantistica. Supponiamo che s rappresenti uno stato (puro o misto) dd sistema studiato, e sia P una possibile proprietà rappresentata da un proiettore. Come sappiamo, ' secondo l'assiomatizzazione standard della teoria, la regola di Born insegna a calcolare la probabilità che il sistema nello stato s goda di P. Tale valore è rappresentato dal seguente numero

Tr(WsP) e [0,1] dove "Tr" è il funzionale traccia e Ws è l'operatore statistico associato a s. Si dimostra che i numeri, calcolati con tale regola, "si comportano bene" dal punto di vista probabilistico e in particolare cadono sempre nell'intervallo [0,1]. Tuttavia i proiettori non sono gli unici operatori in uno spazio di Hilbert che risultino compatibili con la regola di Born. Per definizione, gli effetti sono tutti e soli gli operatori che determinano una

probabilità di Borneo In altri termini, un effetto è un operatore lineare e limitato E, tale che per ogni stato (puro o misto) s vale:

Tr(WsE) e [0,1] Si dimostra che ogni proiettore è un effetto, ma non viceversa. I proiettori rappresentano effetti sharp, mentre ogni operatore che sia un effetto genuino è caratterizzato da un certo grado di ambiguità. La proprietà semitrasparente corrisponde qui all'operatore 1/2I (dove I è l'operatore di identità).

' Si veda il capitolo di Ghirardi. " Ivi. Un e&etto, si pnò definire, in modo equivalente, come un operatore lineare e limitato, compreso Era l'identità e l'operatore nullo.

Logiche quatistiche unsharp 639

5.2 Logiche quantistiche parziali e fuzzy La liberalizzazione dd concetto di proprietà fisica, nel contesto dell'approccio unsharp, ha suggerito in modo naturale nuove forme di logica quantistica. Infatti, la struttura degli effetti in uno spazio di Hilbert è molto diversa da quella dei proiettori: mentre, come abbiamo visto, i proiettori determinano un reticolo ortomodulare, gli effetti non hanno una struttura reticolare: in generale, due effetti non hanno un infimo e un supremo che sia ancora un effetto. In questa situazione, non esiste un'unica logica quantistica che si presenti come una naturale astrazione dall'al-

gebra degli effetti. Sono state studiate varie semantiche, capaci di catturare aspetti diversi dell'universo quantistico unsharp. Per esempio una logica molto vicina alla struttura concreta degli effetti è una forma di logica quantistica parziale, fo n data sulla seguente idea: dal punto di vista meramente linguistico, le congiunzioni e le disgiunzioni fra enunciati quantistici sono sempre sintatticamente corrette. Tuttavia dal punto di vista semantico, congiunzioni e disgiunzioni possono non avere un significato determinato. Ciò avviene in particolare quando si ha a che fare con enunciati che riguardanograndezzefisiche incompatibili fra loro (come la posizione e la quantità di moto, oppure lo spin in due direzioni diverse). In generale, le logiche quantistiche unsharp sono esempi di logiche fuzzy o paraconsistenti, che tollerano violazioni del principio di noncontraddizione: se tz descrive una proposizione "sufficientemente ambigua", la contraddizione u r ~ u non è necessariamente falsa! Cade inoltre il principio dassico di Duns Scoto, secondo cui ex absurdo sequitur quodlibet (da una contraddizione segue logicamente qualunque cosa). Tutto questo ha permesso di studiare interessanti relazioni fra le logiche quantistiche unsharp e le logiche a infiniti valori di verità proposte negli anni venti dal logico polacco Jan Lukasiewicz. L'intenzione originaria di Lukasiewicz era squisitamente filosofica: attraverso l'indeterminismo semantico si trattava di salvare la possibilità del libero arbitrio. Ai nostri giorni, queste logiche "filosofiche" hanno trovato importanti applicazioni tecnologiche, tant'è vero che oggi possiamo comprare lavatrici o videocamere che si chiamano proprio "fuzzy logic"!

Dalla Chiara e Giuntini, 1995.

6. Problemi epistemologici

Le indagini sulla logica quantistica hanno suscitato numerose discussioni epistemologiche. A grandi linee, le questioni più significative possono essere sintetizzate intorno alle seguenti domande:

1. La LQ è una "vera logica" ? 2. La LQ è "la vera logica" della teoria quantistica? 3. In che misura la LQ riesce a risolvere le anomalie logiche e concettuali ddla teoria quantistica? 4. In generale, la logica è una scienza empirica? La prima domanda appare oggi definitivamente risolta. Sarebbe molto "ideologico e partigiano" negare alla logica quantistica uno status di "vera logica" Come abbiamo visto, sia la logica quantistica ortodossa, sia le sue variante (forti o deboli) ammettono caratterizzazioni sintattiche e semantiche, del tutto analoghe a quelle di altre logiche (la logica intuizionistica, le logiche polivalenti e modali, la logica lineare...) a cui la comunità dei logici attribuisce piena cittadinanza. Si tratta pertanto di vere "teorie delle argomentazioni corrette", nd senso canonico ddla tradizione logica moderna. Più difficile è invece rispondere alla seconda e alla terza domanda. Che cosa può significare "la vera logica della meccanica quantistica (MQ)"? Come abbiamo visto, uno dei problemi oggi più spinosi è rappresentato dalla pluralità delle logiche quantistiche che sono state proposte: accanto

alla logica ortodossa, abbiamo forme di logiche parziali efuzzy, suggerite dalla struttura degli effetti. Probabilmente non ha molto senso tentare di individuare la "logica quantistica giusta" Come accade in altri contesti, anche nel caso ddla MQ, appare ragionevole ricorrere a logiche diverse, in funzione delle diverse situazioni teoriche e sperimentali in cui ci si viene a trovare. In ogni caso, è chiaro che la LQ interessa solo particolari frammenti linguistici della MQ, e non tutta la teoria, nella sua globalità. Infatti la parte matematica della MQ continua a usare esclusivamente la logica classica: a tutt' oggi non esiste una teoria degli spazi di Hilbert, formalizzata ndla logica quantistica invece che nella logica classica. Come abbiamo visto, la LQ interviene nel sottolinguaggio sperimentale della teoria, i cui enunciati atomici hanno il seguente significato: "il valore per la tale grandezza fisica cade nel tale insieme di possibili valori"

Problemi epistemologiei 641

A prima vista, la coesistenza di logiche diverse nell'ambito di un'unica teoria può creare un senso di disagio: si è parlato a questo proposito addirittura di una "schizofrenia logica" del fisico quantistico. Tuttavia, una situazione di pluralità di logiche nell'ambito di un'unica teoria non è una caratteristica specifica della MQ: si tratta di un fenomeno (ben noto anche in altri contesti) che la logica contemporanea ci ha insegnato a trattare in modo adeguato. Contro una opinione, che è stata dominante per molto tempo, oggi sappiamo che le costanti logiche fondamentali (i connettivi, i quantificatori, gli operatori modali,...) non sono degli invarianti semantici rispetto al variare delle situazioni teoriche. Anche nell'ambito di una stessa teoria, non , e , o , se. . . allora , pos s ono avere s1gnificati diversi e essere soggetti a sistemi diversi di regole deduttive. La cosa importante è non fare confusione: tutte le volte che si dice "non", bisogna sapere se si sta usando una negazione classica o intuizionistica o quantistica ofuzzy... Naturalmente l'uso di linguaggi formali aiuta a non confondere connettivi che, nel linguaggio comune, sono espressi con un'unica parola. Veniamo ora alla nostra terza domanda: fino a che punto la LQ permette di risolvere le anomalie logiche della MQ? Nel periodo "pionieristico" la LQ era stata descritta talvolta come uno strumento molto potente, capace di risolvere difficoltà profonde della teoria. Secondo alcuni, l e caratteristiche della disgiunzione quantistica potevano addirittura consentire il recupero di una interpretazione realistica della teoria, contro l'approccio di Come si può giustificare.una simile tesi? Riferiamoci per esempio a un elettrone in un certo stato p e supponiamo di sapere che per la nostra particella in quello stato il valore della grandezza spin nella direzione x è positivo. Dunque, secondo la semantica logico-quantistica possiamo dire che y verifica l'enunciato "lo spin nella direzione x è positivo" Scriviamo pertanto

Copen aghen.

'p I= spln„= +

In virtù del principio di indeterminazione, il valore dello spin in ogni altra direzione sarà allora totalmente indeterminato. Avremo dunque per la direzione y: 'P I SP1ny = +

~K spmy = Tuttavia, nello stesso tempo, dovrà valere la disgiunzione "il valore dello spin nella direzione y è positivo oppure negativo". In altri termini: ~ C (sP1ny +) v (sPiny = - ) ' Cfr. Putnam, 1969. Cfr. i1 capitolo di Ghirardi.

642 5. La logica quantistica

Tutto questo sembra andare perfettamente d' accordo con l'intuizione fisica comune: gli unici valori possibili per la grandezza spin in qualsivoglia direzione sono positivo (+) e negativo (-). Come sappiamo, la logica classica non permette situazioni semantiche in cui una disgiunzione è vera, mentre entrambi i membri sono fortemente indeterminati. Aderire alla LQ sembra allora giustificare la legittimità della conclusione seguente: le grandezze hanno sempre un valore in ogni stato del sistema, anche quando non è possibile determinare di quale valore si tratti. Ma il comportamento della disgiunzione quantistica rappresenta davvero un buon fondamento logico per una ipotesi di realismo? In effetti, la LQ ci ha costretti a cambiare la nostra idea tradizionale di disgiunzione: "avere un valore" non significa "avere un valore determinato" In realtà, il nostro elettrone nello stato ~ non ha un valore per lo spin nel-

la direzione y, anche se la disgiunzione "il valore per lo spin nella direzione y è positivo o negativo" risulta vera. È dunque illusorio cercare di assicurare per questa via l'esistenza di una sorta di valori nascosti per tutte le grandezze fisiche, per ogni stato dd sistema. Un argomento di tipo logico-quantistico a difesa di una ipotesi realistica ha tutta l'aria di una scappatoia meramente verbale. Le teorie che intendono completare gli stati puri ddla meccanica quantistica MQ attraverso informazioni che si riferiscono a parametri sconosciuti sono state chiamate teorie delle variabili nascoste:il loro scopo fondamentale è recuperare una descrizione determittistica dei microggetti, conservando nello stesso tempo la coerenza con le regole statistiche della teoria ortodossa. Tuttavia, proprio la L Q rappresenta un ostacolo per la realizzazione di un simile progetto di restaurazione deterministica: " alcuni teoremi, che sono stati chiamati "no go theorems", permettono di dimostrare una situazione di forte incompatibilità logica fra la MQ ortodossa e teorie delle variabili nascoste, che soddisfino alcuni requisiti canonici. Come ha osservato Gibbins, sarebbe sbagliato cercare nella LQ uno strumento capace di risolvere in modo più o meno magico le difficoltà concettuali della teoria quantistica. Al contrario, la LQ risulta essere una parte essenziale di quelle difficoltà, in quanto è profondamente radicata nel formalismo e nella struttura matematica della teoria. Infine, all'ultima delle nostre domande risulta piuttosto naturale ri-

tr Cfr. Ginnrini, 1991.

' Cfr. Gibbins, 1987.

Problemi epistemologici 643

spondere in maniera affermativa. Se le operazioni logiche fondamentali non rappresentano degli invarianti semantici rispetto al variare delle situazioni teoriche, è molto ragionevole accettare che il mutare dei significati per le nostre operazioni sia determinato anche dall'esperienza. Per molto tempo, la tesi del carattere a priori e analitico della logica era accompagnato dalla fiducia nella sua unicità. Per i neopositivisti, l'analiticità delle scienze formali (congiunta con le proprietà osservative delle scienze sperimentali) rappresentava una delle ragioni per cui le scienze sono intersoggettive e affidabili. Oggi sappiamo che le cose sono molto più complicate. Fra l'altro, lo sviluppo delle tecnologie informatiche e la realizzazione di intelligenze artificiali ha creato relazioni sempre più profonde fra i due mondi che Galileo aveva chiamato "delle certe dimostrazioni e delle sensate esperienze"

Bibliografia Beltrametti E., Cassinelli G. (1981), The logic of quantum mechanics,Encydopedia of Mathematics and its Applications, G.-C. Rota (a cura di), AddisonWesley, Reading. Birkho& G. (1967), Lattice theory, American Mathematical Society Colloquium Publications, XXV Providence.

Birkhoff G., von NeumannJ. (1936), The logic of quantum mechanic, in "Annals of Mathematics", pp. 823-843. Busch P., Lahti P., Mittelstaedt P. (1991), The quantum theory of measurement, Lecture Notes in Physics, New Series m2, Springer, Berlin. Cattaneo G., Laudisa F. (1994), Axiomatic unsharp quantum mechanics, in

"Foundations of Physics", n. 24, pp. 631-681. Cattaneo G., Dalla Chiara M.L., Giuntini R. (1993), Fuzzy-intuitionistic quantum logics, "Studia Logica", n. 52, pp.1-24.

Dalla ChiaraM.L. (1986), Quantum logic, in Handbook of philosophical logic,D. Gabbay, F. Guenthner (a cura di), Reidel, Dordrecht. Dalla Chiara M.L., Giuntini R. (1989), Paraconsistent quantum logic, in "Foun-

dations of Physics", n. 19, pp. 891-904. Dalla ChiaraM.L., Giuntini R. (1995), The logic of orthoalgebras,in "Studia Logica", n. 55, pp. 3-22. Davies E. (1976), Quantum theory of open systems, Academic Press, New York. D'Espagnat B. (1976), Conceptual foundations of quantum mechanics, Academic

Press, Reading. Behrametti E., van Fraassen B. (a cura di) (1981), Ettore Majorana International Science Series, n. 8, Plenum Press, New York. Foulis D., Randall C. (1981), Empi rical logic and tensor products, in Interpretations andfoundations o f quantum theory, Grundlagen der Exakt Naturwissenschaften, n. 5, Bibliographisches Institut, Mannheim.

Gibbins P.(1985), A user friendly quantum logic, in "Logique et Analyse", n. 112, pp. 353-362. Gibbins P. (1987), Particles and Paradoxes, Cambridge University Press, Cam-

bridge. Giuntini R. (1991), Quantum logic and hidden variables,Grundlagen der Exakt Naturwissenschaften, n. 8, Bibliographisches Institut, Mannheim.

Goldblatt R. (1974), Semantic analysis of orthologic, in "Joumal of Philosophical Logic", n. 3, pp. 19-35. Greechie R. (1981), A non-standard quantum logic unth a strong set of states, in E. Bertrametti, B. van Frassen (a cura di), Current issues in quantum logic, Ettore Majorana Intemational Science Series, n. 8, Plenum Press, New York.

uantum

Greechie R., GudderS. (1973), Q logics,in C. Hooker (a cura di), Contemporaryresearch in the foundations and philosophy of quantum theory, Reidel, Dordrecht.

GudderS. (1988), Quantum probability, Academic Press, San Diego.

Bibliografia 645

Hardegree G., Frazer P. (1981), Charting the labynnth of quantum logics,in E. Beltrametti, B. van Fraassen (a cura di), Currentissues in quantum logic, cit. Hardegree G. (1979), The conditional in abstract and concrete quantum logic, in

C. Hooker(acura di),The logic-algebraic approach to quantum mechanics,v. Il, The University of Western Ontario Series in Philosophy of Science, n. 5,

Reidel, Dordrecht. Jammer M. (1974), The philosophy of quantum mechanics,John Wiley R Sons, New York. JauchJ. (1986), Foundations of quantum mechanics,Addison-Wesley, Reading. Kalmbach G. (1983), Orthomodular lattices,Academic Press, New York. Kraus K. (1983),States, effectsand operations, "Lecture Notes in Physics", n. 190, Springer Verlag, Berlin. Lock P., Hardegree G. (1984),Connectionsamong quantum logics: quantum propositional logics, in "International Joumal of Theoretical Physics", 24, pp. 4353. Lock P., Hardegree G. (1984), Connections among quantum logics: quantum event logic, in "International Joumal of Theoretical Physics", 24, pp. 55-61.

Ludwig G.(1983), Foundations of quantum mechanics,v. I, Springer Verlag, Berlin. Mackey G. (1963), Mathemattcal foundations of quantum mechanics, Benjamin, New York. Mittelstaedt P. (1978), Quantum logic, Reidel, Dordrecht. Neumann vonJ. (1932), I fondamenti matematici della meccanica quantistica, Il Poligrafico, Padova 1977. NishimuraH. (1980), Sequential method in quantum logic,in "The Joumal of SymbolicLogic",n.45,pp.339-352. Piron C. (1976), Foundations of quantum physics,in A. Wightman (a cura di), Mathematical Physics Monograph Series, WA. Benjamin, Reading. Pták P., PulmannováS. (1991), Orthomodular structures as quantum logics,

Kluwer, Dordrecht. PutnamH. (1969), Is logic empirical?, in Boston Studiesin the Philosophy of Sctence, v. 5, Reidel, Dordrecht, pp. 216-241. Soler M.P., Charactertzation of Hilbert spaces by orthomodular spaces,di promima pubblicazione su "Order"

Indice dei nomi

indice dei noma (g49

Abbagnano N. 177 Adler C. 101 Agazzi E. 180, 181, 203, 231, 232, 233, 234, 235 Agostino A. 46 sant'Agostino 248

Albert D. 541, 542 Alpher R.A. 201, 202, 203 Ampère A.M. 17 -Apollonio di Perga 141 Aquilano R. 225, 227 Aristotele 145, 280, 2 81, 3 19,

323 Arrhenius S. 212

Aspect A. 464, 498, 499, 526, 561 Ayer A.J. 418 Fraassen van B. 249, 250, 251

Bailey C. 254 Barbour J. 137, 198 Barnett L. 101 Barrow J.D. 191, 192, 230, 232,

237 Bartels A. 162

Baryshev Yu.V. 178, 185 Beli J.S. 45, 69, 651, 353, 422, 436, 437, 448, 451, 452, 453, 454, 456, 457, 459, 464, 469, 478, 481, 482, 486, 487, 488, 489, 491, 493, 495, 496, 497, 505, 521, 526, 527, 532, 550, 557, 559, 561 Bellone E. 212 Beltrametti E. 561, 622

Beltrami E. 148 Benatti F. 553 Beretta A. 153

Bergia S. 65, 136, 137, 140, 150, 179, 188, 207, 208, 231, 296 Bernstein J. 487 Bertotti B. 137, 175, 179, 198,

200, 201, 215, 216, 219 Bessel F. 106 Bessell F.W. 138 Birkhoff G. 612, 613, 614, 616, 622, 630 Blau S. 227 Bohm D. 351, 433, 436, 445, 459, 467, 469, 470, 472, 473, 482, 483, 485, 486, 487, 488, 489, 500, 501, 502, 505, 530, 531, 535, 559, 560, 562 Bohr N. 344, 345, 346, 347, 348, 349, 417, 418, 419, 423, 424, 426, 427, 428, 443, 450, 452, 453, 454, 455, 469, 496, 497, 549, 560, 622 Boltzmann L. 224, 339

Bondi H. 173, 174, 181, 198, 199 Boniolo G. 106, 137, 142, 176, 185, 186, 189, 190, 193, 197, 198, 199, 200, 222, 273, 283, 287, 392 Borges L. 192

Bom M. 66, 349, 421, 423, 443, 444, 454, 455, 456, 469, 470, 560, 638 Braccesi A. 185, 198

Bradley F.H. 273, 309

650 Filosofia della fisica

Braginskij B. 106, 138 Brans C.H. 137, 139 Broglie de L.V. 346, 347, 348, 349, 413, 420, 469, 470, 482, 530, 560, 562 Brown H.R. 21 Burko L.M. 228 Busch P. 637

De-Witt B.207, 208, 328, 539, 540 Dicke R.H. 106, 137, 138, 139, 202, 229, 230, 298 Dieks D. 536, 538 Dirac P.A.M. 139, 199, 228, 229, 350, 509 Doppler C.J. 65 Dorato M. 46, 176, 185, 186, 189,

Cannata F. 227 Cantor G. 282, 314

Carnap R. 150, 154, 290, 322 Camot L.N.M. 285 Carter B. 230 Cartesio (Descartes R.) 44, 147,

316 Cassinelli G. 622 Cassirer E. 148, 255 Castagnino M. 225, 227 Cattaneo G. 637 Cavaliere A. 225

Cesa-Bianchi M. 153 Christman R. 219, 227

Christoffel E.B. 123 Clarke S. 159, 160 Clauser J.F. 493 Clausius R. 211, 212

Clifton R. 45, 47, 51 Comte A. 179

Coriolis G.G. de 134, 135 Capek K. 44, 63, 67 D'Espagnat B. 433, 441, 497, 521 Dalibard J. 498 Dalla Chiara M.L. 609, 635, 639 Darwin C. 236 Davidson D. 256, 257, 269 Davies P.C.W. 224, 225, 226, 230,

637

190, 193, 197, 198, 222, 273, 274, 276, 278, 283, 287, 295, 302 Duerr D. 562

Duhem P. 61, 143, 151 Dummett M. 274

Earman J. 132, 159, 160, 161 Eddington A.S. 140, 151, 155, 209, 247, 282, 308 Ehrenfest P. 465

Einstein A. 38, 39, 47, 48, 49, 51, 57, 62, 63, 66, 70, 87, 100, 101, 103, 105, 107, 114, 129, 133, 134, 135, 136, 137, 138, 139, 141, 149, 151, 154, 159, 173, 179, 188, 197, 198, 209, 289, 290, 296, 300, 343, 344, 347, 348, 349, 351, 419, 420, 421, 422, 423, 424, 425, 426, 427, 428, 436, 438, 443, 444, 450, 451, 452, 453, 454, 455, 458, 459, 469, 495, 496, 498, 529, 547, 552, 554, 560, 561, 562 Ellis G.F.R. 184, 187, 197, 198, 209, 300 Eotvos R. von 106, 138

Epicuro 254, 308 Eulero L. 148 Everett III H. 539, 540

De-Sitter W. 136, 188, 197, 283,

300

Faraday M. 17, 339

Indice dei nomi

Faye J. 274, 276, 286 Feigl H. 256, 319, 320, 321 Fermi E. 220 Feynman R.P. 208, 402, 487 Fields J.C. 146 Fieschi R. 202

Grangier P. 561 Grassi Rimini 459, 461, 553, 562 Gratton L. 217, 218

Foucault K.B.L. 198

Greechie R. 622, 633 Griffiths R.B. 542 Griinbaum A. 40, 48, 52, 53, 157, 159, 262, 282, 284, 290, 291, 292, 301 Gudder S. 622 Guidone M. 235

Foulis D. 622, 624

Gustafsson L. 236, 237

Fraassen van B.C. 159, 249, 250,

Guth A.H. 226

Finkelstein D. 622

Fitzgerald G. 57 Fleming G. 67

251, 307, 536 Fraisse P. 264 Frautschi S. 220

Frege G. 259 Friedman M. 48, 145, 158, 159, 189, 194, 195, 196 Friedmann A.A. 136, 239 Gale R. 300, 311 Galilei G. 7, 8, 9, 18, 105, 132, 138, 142, 306, 339, 353, 643 Gamow G. 201

Gauss K.F. 17, 109, 141, 148, 149, 151 G eli MannS.542, 546 Geller M.J. 185 Gerlach W. 401, 445, 483, 484, 555 Ghirardi G.C. 277, 285, 318, 338, 428, 459 Gibbins P. 633, 642 Gibbs J.W. 339 Giuntini R. 609, 635, 639, 642 Gleason A.M. 478 Godei K. 136, 296, 300, 635 Gold T. 174, 198, 199, 200 Goldblatt R. 633, 635 Goldstein E. 562 Graham N. 328

Hafele J. 65 Hall D. 66 Halliweii J.J, 207, 208 Hamilton WR. 339

Hardy G. 142 Harrison E. 173, 175, 195, 209 Hartle J. 207, 208, 542, 546 Hawking S.W. 206, 207, 208, 209, 300 Heisenberg W. 349, 350, 351, 413, 418, 420, 421, 423, 426, 488 Helmholtz H. von 152, 211, 212

HenryW. 17 Herman R.C. 201, 202, 203, 211 Higgs P. 205 Hilbert D. 338, 353, 357, 417, 429, 442, 480, 559, 564, 614, 615, 616, 619, 622, 623, 625, 632, 633, 638, 639, 640 Hintikka J. 259, 260 Hobbes T. 141 Hogarth M. 45, 47 Holt R.A. 493 Honl H. 137 Horne M.A. 493 Hoyle F. 137, 174, 177, 198, 233

652 Filosofia della fisica

Hubble T. 178, 193, 194, 196, 228, 230, 298 Huble E. 136, 177, 198, 199, 229

Lifsits I.M. 95 Linde A. 208 Lobachevski N.I. 117, 149, 153

Hume D. 48

Loewer B. 541 Lorentz H.A. 16, 19, 21, 22, 24,

Hughes R.I.G. 71 Husserl E. 43, 263, 264, 319 Ives H.E. 99

James W. 43 Jammer M. 451, 622 Jauch J. 488, 622 Jordan P. 139, 349, 422, 457, 523, 560 Joule J. 219 Kant I. 34, 48, 147, 148, 149, 151,

152, 153, 154, 176, 177, 180, 246, 253, 259, 312, 314, 315, 323, 324, 325, 328 Keating R. 65

Keplero G. 141, 142 Klein C.F. 509 Kochen S. 478, 480

Kragh H. 181 Kripke S. 627 Kroes P. 77 Krotov R. 106

LagrangeJ.L. de 339 Lahti P. 637 Landau L.D. 95 Laudisa F. 637 Layzer D. 183, 218 Legget A. 562

25,51,53,54,57, 62, 63,67,68, 69, 77, 78, 88, 89, 90, 91, 96, 99, 107, 119 Lovejoy A. 318 Luccio R. 153

Ludwing G. 224, 637 K,ukasiewicz J. 639 Lynden-Beli D. 216 Mac Millan E.M. 176 Mach E. 48, 129, 131, 132, 133, 134, 135, 137, 139, 198, 199, 229, 420 Mackey G. 622 MaddyP. 145 Malament D. 52, 53, 54 Masani A. 211

Maudlin T. 45, 71, 161 Maxwell J.C. 16, 17, 18, 44, 70, 223, 339, 347, 501, 520, 535 McCrea W. 181, 195 McInerney P.K. 266

McTaggart J.E. 248, 272, 273, 274, 278, 289 Meehl P.E. 318, 319, 320, 321 Mehlberg H. 284 Melchiorri B. 178 Mellor D.H. 268, 269 Merleau-Ponty M. 179, 188, 321

Mermin D. 495, 496, 497 Leibniz G.W. 159, 160, 305, 312, Michelson A. 57, 58, 59, 61, 62 319, 321, 325, 632 Michon J.A. 265 Miller A.I. 7, 99 Lemaitre G. 189 Milne E.A. 195, 199 Lense J. 135 Lèvy-Leblond J.M. 561 Minkowski H. 27, 36, 39, 40, 45, Lewis D. 276 46, 47, 49, 52, 54, 73, 74, 77, 89,

Indice dei nomi

90, 115, 145, 146, 197, 287, 291, 293, 294, 295, 297, 301 Misner C.W. 222 Mittelstaedt P. 622, 637

Morley E. 57, 58, 61, 62

Pepper S. 318 Piron C. 622 Planck M. 220, 223, 228, 252, 341, 343, 344, 345, 347, 450, 465 Platone 144

Nagel E. 154 Narlikar J.V. 137 Nernst W. 176, 178 Neumann von J351, 464, 466,

468, 469, 478, 479, 488, 511, 512, 513, 515, 516, 518, 521, 523, 526, 531, 536, 537, 538, 539, 547, 548, 560, 562, 612, 613, 614, 616, 622, 630

Podolsky B. 351, 421, 436, 438, 444, 459 Poincaré H. 535 Poisson S.D. 14, 15, 128, 136

Popper K.R. 148, 176, 454, 457, 458 Prigogine I. 282 Pták P. 625 Pulmannová S. 625

Newton I. 39, 40, 41, 106, 129,

Putnam H, 145, 259, 320, 641

130, 131, 132, 138, 157, 314, 325, 339 Nishimura H. 633

Quine W. van Orman 42, 54, 62,

145, 230

Nordtvedt K. 139

North J.D. 188, 328 Norton J. 53, 155, 159, 1.60, 161 Occam G. 541 Okun L.B. 100 Olbers H.W.M. 174, 175 Omnés R. 542, 546 Oppenheimer R.J. 469 Pais A. 454, 458, 459, 495, 496 Panov V. 106

Parmenide 63 Pauli W. 349, 382, 433, 488, 496, 560 Pauri M. 45, 189, 268, 286, 293, 296, 299, 303, 314 Pearle P. 553 Penrose R. 144, 206, 215, 221, 222, 223, 224, 225, 226, 227,

300, 562, 563 Penzias A.A. 171, 172, 202, 203

Ramanujan S. 142

Randall C. 622, 624 Reale A. 215 Rebaglia A. 231, 232, 233 Redhead M. 308 Regge T. 192 Reif F. 214 Reichenbach H. 40, 51, 52, 54, 143, 148, 150, 152, 154, 155, 156, 157, 158, 225, 258, 260, 286, 287, 290, 291, 292, 329 Resnick R. 91 Ricci M. 124, 129 Riemann B.G.F. 117, 118, 124, 146, 149 Rindler W. 64, 65, 69, 190, 195 Robertson H.P. 184, 188, 189,

300 Roger G. 498 Roll P.R. 106 Rosen J, 231, 234

654 Filosofia della fisica

Rosen N. 351, 421, 436, 438, 444, 459 Rosenfeld L. 452, 488 Rossi B. 66 Rota G.C. 144 Rovelli C. 303 Russell Hanson N.172 Russell B. 289 Rutherford sir E. 341 Ryckman T. 140 Saccheri G. 141 Salmon W. 71, 140 Scafati A. 215

Schilpp PA. 426, 443, 453 Schrodinger E. 215, 225, 292, 348, 349, 350, 352, 372, 419, 420, 421, 422, 427, 431, 444, 445, 470, 472, 473, 522, 529, 531, 536, 538, 539, 540, 543, 547, 551, 552, 553, 557, 560 Schutz B.F. 190 Schwarzchild K. 135 Sciama D.W. 137, 181, 182, 183, 196, 197, 198, 202

Stein H. 43, 44, 45, 46 Stengers L 282

Stern O. 401, 444, 445, 483, 484, 496, 555 Stokes G.G. 14, 16, 18 Suppes P. 622 Synge J.R,L.M. 64 Sypel R. 21 Taylor E.E.69 Thirring H. 135 349 Thom R. 255 Thomson W. 219 Thorne K.S. 139, 222 Tipler F J. 230, 232, 237 Tolman R.C. 64, 227 Toraldo di Francia G. 230 Torretti R. 303 Vetharaniam I. 54

Vico G. 141 Vilenkin A. 208

Searle J.R. 320 Seelinger H. 136 Sellars W. 247, 248, 319, 320

Wald R. 64, 66 Walker A,G. 184, 189, 300 Watkins J. 309 Weber T. 459, 461, 553 Weinberg J.S. 48, 142, 189, 193, 293

Severino E. 281

Weizsacker von C.F. 328

Shakespeare W. 637 Shimony A. 250, 310, 461, 462, 463, 489, 493, 497

Weyl H. 187, 188, 189, 197, 222, 223, 296, 327, 349 Wheeler J.A. 69, 137, 140, 207, 208, 222 Whitehead A.N. 316, 319, 328 Whitrow G.J. 181, 212, 296, 298

Scoto D. 639

Sitter W. de 188

Slipher V. 177 Smith Q.296,298 Solèr M.P. 623 Spencer H. 154 Spinoza B. 145 Squires E. 312 Stachei J. 268

Wiener N. 283

Wigner E.P. 142, 306, 328, 518, 523, 547, 548, 549, 550 Will C.M. 139 Williams R. 187

Indice dei nomi 655

Wilson R. 171, 172, 202, 203 Wittgenstein L. 259, 267

Zangari M. 54 Zelicovici D. 295

Zemansky M.W. 217 Zenonedi Elea 248, 314 Zurek W.H. 542, 546 Zwicki E 178