145 80 7MB
Italian Pages 493 Year 2009
A Nadine e Vanessa
Collana di Fisica e Astronomia
A cura di: Michele Cini Stefano Forte Massimo Inguscio Guida Montagna Oreste Nicrosini Franco Pacini Luca Peliti Alberto Rotondi
Egidio Landi Degl’Innocenti
Spettroscopia atomica e processi radiativi
123
EGIDIO LANDI DEGL’INNOCENTI Dipartimento di Astronomia e Scienza dello Spazio Università degli Studi di Firenze
Springer-Verlag fa parte di Springer Science+Business Media springer.com © Springer-Verlag Italia, Milano 2009 ISBN 978-88-470-1158-8
e-ISBN 978-88-470-1159-5
Quest’opera è protetta dalla legge sul diritto d’autore, e la sua riproduzione è ammessa solo ed esclusivamente nei limiti stabiliti dalla stessa. Le fotocopie per uso personale possono essere effettuate nei limiti del 15% di ciascun volume dietro pagamento alla SIAE del compenso previsto. Le riproduzioni per uso non personale e/o oltre il limite del 15% potranno avvenire solo a seguito di specifica autorizzazione rilasciata da AIDRO, Via Corso di Porta Romana n. 108, Milano 20122, e-mail [email protected] e sito web www.aidro.org. Tutti i diritti, in particolare quelli relativi alla traduzione, alla ristampa, all’utilizzo di illustrazioni e tabelle, alla citazione orale, alla trasmissione radiofonica o televisiva, alla registrazione su microfilm o in database, o alla riproduzione in qualsiasi altra forma (stampata o elettronica) rimangono riservati anche nel caso di utilizzo parziale. La violazione delle norme comporta le sanzioni previste dalla legge.
Riprodotto da copia camera-ready fornita dall’Autore Progetto grafico della copertina: Simona Colombo, Milano In copertina: immagine adattata dall’originale di N.A. Sharp, NOAO/AURA/NSF Stampa: Grafiche Porpora, Segrate, Milano Stampato in Italia Springer-Verlag Italia s.r.l., Via Decembrio, 28 - 20137 Milano
Prefazione Questo libro raccoglie le dispense del corso da me tenuto ininterrottamente, per pi` u di 25 anni, presso il Corso di Laurea in Fisica (poi divenuto Corso di Laurea Magistrale in Scienze Fisiche e Astrofisiche) dell’Universit` a di Firenze. Col passare degli anni le dispense, inizialmente manoscritte, si sono notevolmente ampliate mano a mano che il programma del corso `e cambiato per rivolgersi ad argomenti diversi, come richiesto, anno per anno, dalla programmazione didattica del Corso di Studi. Negli ultimi anni, grazie a un notevole sforzo di revisione e di aggiustamento, le dispense hanno finalmente assunto la veste editoriale adeguata che si trova adesso sotto gli occhi del lettore. Il corso, inizialmente denominato “Spettroscopia” e in seguito, a partire dal 1997, “Spettroscopia Astronomica”, `e attualmente rivolto agli studenti del curriculum Astrofisico del Corso di Laurea suddetto sebbene, nel corso del tempo, abbia ricevuto anche l’attenzione di studenti appartenenti ad altri curricula, in particolare quelli di Fisica dello Stato Solido interessati alla spettroscopia atomica. Gli argomenti trattati sono molteplici e l’intero volume contiene materiale sufficiente per almeno due corsi annuali (di secondo livello o di Dottorato). Selezionando opportunamente gli argomenti, `e possibile sviluppare un certo numero di percorsi didattici diversi. Ad esempio, volendo sviluppare un corso del tipo “Complementi di Elettromagnetismo e Termodinamica”, ci si potrebbe limitare a trattare gli argomenti contenuti nei Cap. 1, 2, 3 e 10, per un corso di “Spettroscopia Atomica Elementare” sarebbero sufficienti i Cap. 1, 2 e 6, mentre per un corso pi` u approfondito di “Spettroscopia Atomica” si potrebbero aggiungere anche i Cap. 4, 5, 7, e 9. Altre possibilit` a potrebbero riguardare corsi del tipo “Processi Radiativi”, “Spettroscopia Astronomica” oppure “Applicazioni di Elettrodinamica Quantistica”, adattando il programma a seconda dei casi. Lo schema mostrato nella figura di pagina seguente illustra la relazione logica fra i diversi capitoli e pu` o facilitare nella scelta del percorso didattico voluto. Ad esempio, la comprensione degli argomenti contenuti nel Cap. 15 (processi del secondo ordine) implica la conoscenza di quelli contenuti nel Cap. 3 (in cui si trattano i pi` u semplici di tali processi nell’ambito della fisica classica), nel Cap. 5 (in cui si introduce l’equazione relativistica di Dirac) e nel Cap. 11 (dedicato all’interazione materia-radiazione). I capitoli per cos`ı dire “introduttivi”, ovvero i Cap. 1, 5, 6 e 10 richiedono quelle conoscenze di base di elettromagnetismo, meccanica quantistica, relativit` a speciale e termodinamica statistica che sono normalmente acquisite a livello di Laurea Triennale. Ai lettori che si sentissero meno preparati su tali argomenti, questo libro offre la possibilit`a di approfondire il loro bagaglio culturale per mezzo di applicazioni fisiche di-
viii
PREFAZIONE
1
2
4
6
5
11
7
13
9
10
3
8
12
14
15
Lo schema illustra le relazioni logiche esistenti fra i vari capitoli del libro.
rette che possono contribuire a rendere meno aridi gli argomenti stessi, spesso trattati a livello notevolmente formale. Le Appendici costituiscono una parte non trascurabile di questo libro. Alcune di esse sono dedicate a sviluppare importanti risultati che emergono come complementi naturali degli argomenti trattati nel testo. Altre sono invece rivolte a introdurre in maniera assiomatica il formalismo utilizzato nel testo stesso. Per finire, intendo ringraziare i docenti del Corso di Laurea in Fisica fiorentino degli anni 1960 che mi hanno insegnato come il cammino maestro della Fisica passi sempre per l’interpretazione quantitativa dei fenomeni empirici senza eccessive indulgenze nei riguardi del formalismo. In particolare i miei ringraziamenti vanno ai defunti Prof. Manlio Mand` o e Simone Franchetti e ai Prof. Marco Ademollo e Giuliano Toraldo di Francia. Un sentito ringraziamento anche alle generazioni di studenti che si sono succeduti negli anni e che, con le loro illuminanti domande e richieste di chiarimento, hanno contribuito in maniera determinante alla presente stesura di questo libro. Arcetri, 26 Gennaio 2009
Egidio Landi Degl’Innocenti
Indice
1. LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO 1.1 Le equazioni di Maxwell 1 1.2 Energia trasportata dal campo elettromagnetico 2 1.3 Quantit` a di moto trasportata dal campo elettromagnetico 3 1.4 Potenziali elettromagnetici 5 1.5 Invarianza di gauge (di calibro) 6 1.6 Soluzione delle equazioni di Maxwell nel vuoto 8 1.7 Pressione della radiazione 12 1.8 Onde piane sinusoidali 14 2. SPETTRO E POLARIZZAZIONE 2.1 Spettro della radiazione 2.2 Spettri particolari di alcune forme d’impulso 2.3 Spettri di segnali stocastici e di segnali periodici 2.4 Spettroscopio a reticolo di diffrazione 2.5 Polarizzazione di un’onda monocromatica 2.6 Misure spettropolarimetriche 2.7 Propriet` a dei parametri di Stokes
17 22 24 29 35 39 44
3. RADIAZIONE DI CARICHE ELETTRICHE IN MOTO 3.1 Potenziali elettromagnetici dovuti a cariche e correnti 3.2 I potenziali di Li´enard e Wiechart 3.3 Campo elettromagnetico di una carica in moto 3.4 Irraggiamento di una carica in moto 3.5 La diffusione Thomson 3.6 La diffusione Rayleigh 3.7 La radiazione di frenamento 3.8 La radiazione di ciclotrone 3.9 La radiazione di sincrotrone 3.10 Sviluppo multipolare nella zona di radiazione 3.11 Diagramma di radiazione per le componenti multipolari
49 55 58 63 68 71 72 79 81 87 92
4. QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO 4.1 Oscillatore armonico, operatori di creazione e distruzione 97 4.2 Sviluppo del campo elettromagnetico in serie di Fourier 101 4.3 Passaggio alla quantizzazione 104 4.4 Intensit`a e fotoni 109
x
INDICE
5. EQUAZIONI D’ONDA RELATIVISTICHE 5.1 Equazione di Dirac per la particella libera 5.2 Equazione di Dirac per l’elettrone in un campo elettromagnetico 5.3 Limite non relativistico dell’equazione di Dirac 5.4 Limite all’ordine zero. Equazione di Pauli 5.5 Limite al primo ordine 5.6 L’equazione di Dirac descrive una particella di spin 21 5.7 Soluzione dell’equazione di Dirac in un campo magnetico
113 119 121 123 126 129 132
6. ATOMI CON UN SOLO ELETTRONE DI VALENZA 6.1 Atomo di Idrogeno, teoria di Bohr 6.2 L’equazione di Schr¨ odinger in coordinate sferiche 6.3 Atomo di Idrogeno, teoria quantistica 6.4 Atomo di Idrogeno, correzioni relativistiche 6.5 Spettri dei metalli alcalini
137 145 153 159 165
` ELETTRONI DI VALENZA 7. ATOMI CON PIU 7.1 Il principio di esclusione di Pauli 7.2 L’Hamiltoniana non relativistica: buoni numeri quantici 7.3 L’approssimazione del campo centrale 7.4 Il metodo di Thomas-Fermi 7.5 Il metodo variazionale e il metodo di Hartree-Fock 7.6 Configurazioni 7.7 Il principio di formazione del sistema periodico 7.8 Configurazioni di elettroni eccitati 7.9 Richiami della teoria del momento angolare 7.10 Termini provenienti da configurazioni assegnate 7.11 Le autofunzioni dell’Hamiltoniana non relativistica 7.12 L’atomo di Elio 7.13 L’atomo di Carbonio
171 175 178 179 183 188 191 195 196 204 212 214 218
8. ENERGIE DEI TERMINI 8.1 La regola della traccia 8.2 Calcolo di elementi di matrice diagonali 8.3 Elementi di matrice di particella singola 8.4 Elementi di matrice dell’interazione Coulombiana 8.5 Somme su sottozone chiuse 8.6 Struttura dei termini
221 224 229 230 233 236
9. MAGGIORI DETTAGLI SUGLI SPETTRI 9.1 L’interazione spin-orbita 9.2 Il teorema di Wigner-Eckart e il teorema della proiezione
239 242
INDICE
9.3 9.4 9.5 9.6 9.7 9.8 9.9
La regola degli intervalli di Land´e L’accoppiamento j-j e l’accoppiamento intermedio L’effetto Zeeman classico L’effetto Zeeman quantistico L’effetto Paschen-Back La struttura iperfine, effetto isotopico La struttura iperfine, effetto di spin nucleare
xi 246 252 255 257 263 266 270
10. LEGGI DI EQUILIBRIO TERMODINAMICO 10.1 I principi della statistica 10.2 La distribuzione Maxwelliana delle velocit`a 10.3 La legge di Saha-Boltzmann 10.4 La radiazione di corpo nero 10.5 Propriet` a della radiazione di corpo nero 10.6 La statistica di Fermi-Dirac 10.7 La statistica di Bose-Einstein
273 277 279 285 291 295 297
11. INTERAZIONE FRA MATERIA E RADIAZIONE 11.1 L’Hamiltoniana d’interazione 11.2 Le equazioni cinetiche 11.3 La regola aurea di Fermi 11.4 L’elemento di matrice 11.5 Processi elementari 11.6 Le equazioni dell’equilibrio statistico 11.7 I coefficienti di Einstein 11.8 L’equazione del trasporto radiativo 11.9 I coefficienti di assorbimento e di emissione 11.10 Profilo del coefficiente di emissione
301 303 307 309 312 319 322 324 326 330
12. REGOLE DI SELEZIONE E FORZE DELLE RIGHE 12.1 Regole di selezione sui numeri quantici 12.2 Regole di selezione sulle configurazioni 12.3 Transizioni proibite 12.4 Transizioni semiproibite 12.5 Righe proibite in oggetti astronomici 12.6 Forze relative entro multipletti in accoppiamento L-S
337 339 342 344 345 349
13. PLASMI IN CONDIZIONI DI NON-EQUILIBRIO 13.1 La temperatura cinetica degli elettroni 13.2 Collisioni elettrone-atomo 13.3 Le relazioni di Milne-Einstein 13.4 L’atomo a due livelli in condizioni di non-equilibrio
355 357 359 360
xii
INDICE
14. TRASPORTO RADIATIVO 14.1 Soluzione formale dell’equazione del trasporto radiativo 14.2 Trasporto radiativo nelle atmosfere stellari 14.3 Il modello di atmosfera grigia 14.4 L’equazione di Hopf 14.5 Modelli realistici di atmosfere stellari 14.6 Lo spettro continuo 14.7 Righe spettrali in equilibrio termodinamico locale 14.8 Righe spettrali in condizioni di non equilibrio
363 366 370 375 376 378 382 385
15. PROCESSI DEL SECONDO ORDINE 15.1 Considerazioni introduttive 15.2 La diffusione Thomson (teoria quantistica) 15.3 La diffusione Rayleigh quantistica e la diffusione Raman 15.4 La diffusione Compton: aspetti cinematici 15.5 La diffusione Compton: aspetti dinamici 15.6 L’equazione di Klein-Nishina 15.7 La sezione d’urto totale della diffusione Compton 15.8 Propriet` a di polarizzazione della diffusione Compton 15.9 Scambio di energia fra fotoni ed elettroni 15.10 L’effetto Compton inverso
389 393 398 400 403 410 418 419 422 424
APPENDICI A.1 Unit`a di misura dell’elettromagnetismo A.2 Algebra tensoriale A.3 La funzione delta di Dirac A.4 Le leggi dell’elettromagnetismo ritrovate A.5 L’equazione di Larmor nel caso relativistico A.6 Irraggiamento di onde gravitazionali A.7 Calcolo dell’integrale di Thomas-Fermi A.8 Energia della configurazione normale dell’atomo di Silicio A.9 Calcolo della costante di struttura fine di un termine A.10 Il principio fondamentale della termodinamica statistica A.11 Probabilit` a di transizione per le coerenze A.12 Somme sui numeri quantici magnetici A.13 Calcolo di un elemento di matrice A.14 Invarianza di gauge nell’Elettrodinamica Quantistica A.15 Le matrici gamma e gli invarianti relativistici
427 435 442 444 447 451 454 455 457 459 462 465 468 469 471
COSTANTI FISICHE
481
INDICE ANALITICO
483
Capitolo 1
Leggi generali del campo elettromagnetico Le equazioni di Maxwell racchiudono i principali risultati sperimentali sull’elettricit`a e il magnetismo, ottenuti fra la fine del XVIII e la met`a del XIX secolo grazie al lavoro di ricerca di numerosi scienziati quali, fra gli altri, Coulomb, Volta, Ørsted, Amp`ere, Faraday e Gauss. Lo scopo di questo capitolo `e quello di riprendere tali equazioni e di svilupparne una serie di conseguenze particolarmente rilevanti per la comprensione dei fenomeni elettromagnetici. In particolare, vedremo come le equazioni di Maxwell implicano la possibilit` a di definire per il campo elettromagnetico due quantit` a fisiche fondamentali quali la densit` a di energia e la densit`a di quantit` a di moto (o di impulso). Vedremo anche come la soluzione delle equazioni di Maxwell possa essere notevolmente semplificata mediante l’introduzione di due potenziali, il potenziale scalare e il potenziale vettore, di cui studieremo le principali propriet` a. L’ultima parte del capitolo `e dedicata allo studio delle onde elettromagnetiche piane, una soluzione particolare delle equazioni di Maxwell nel vuoto.
1.1 Le equazioni di Maxwell Nel sistema di unit`a c.g.s. di Gauss, consistentemente utilizzato in tutto questo volume, le equazioni di Maxwell, che riassumono varie leggi empiriche relative ai fenomeni elettromagnetici, si scrivono nella forma 1 = 4πρ , divE
(1.1)
=0 , divB
(1.2)
4π 1 ∂E = j , (1.3) c ∂t c + 1 ∂B = 0 , (1.4) rotE c ∂t `e il campo elettrico e B `e il vettore induzione magnetica, ρ `e la densit` dove E a di carica e j `e la corrispondente densit` a di corrente. La prima equazione non − rotB
1
Il lettore che non sia familiare con il sistema di unit` a qui utilizzato pu` o trovare nell’App. 1 le relazioni che sussistono fra questo sistema e il Sistema Internazionale, pi` u appropriato per le applicazioni pratiche dell’elettromagnetismo piuttosto che per quelle teoriche.
2
CAPITOLO 1
`e altro che l’espressione differenziale della legge di Coulomb per le cariche elettriche, la seconda, talvolta detta legge di Gilbert, `e l’analoga espressione per le cosiddette cariche magnetiche, implementata dal fatto che non esistono monopoli magnetici, la terza `e l’espressione differenziale della legge di Amp`ere, cos`ı come modificata da Maxwell per tener conto della corrente di spostamento, e la quarta `e infine l’espressione differenziale della legge dell’induzione di Faraday. Nella forma qui scritta le equazioni sono del tutto generali, nel senso che esse valgono non solo nel vuoto ma anche in presenza di un mezzo materiale pur di introdurre, nella densit` a di carica ρ, anche le cariche di polarizzazione e, nella densit` a di corrente j, anche le correnti di magnetizzazione e quelle di polarizzazione. Pi` u precisamente, nei mezzi materiali si introducono, accanto ai e B, anche i vettori D e H, detti rispettivamente spostamento elettrico vettori E ` `e il vettore campo elettrico e campo magnetico. E necessario specificare che E misurato entro una cavit` a aghiforme diretta lungo la direzione del campo stesso `e il vettore (per evitare la formazione di cariche di polarizzazione), mentre B campo magnetico misurato entro una cavit`a di spessore infinitesimo disposta perpendicolarmente alle linee di forza (per evitare la formazione di correnti di magnetizzazione). C’`e da notare infine che le equazioni di Maxwell gi`a contengono l’equazione di continuit`a per la carica elettrica. Infatti, prendendo la divergenza dell’Eq. (1.3) e sostituendo l’Eq. (1.1), si ottiene −
4π ∂ρ 4π = divj , c ∂t c
ovvero, ∂ρ + divj = 0 , ∂t che `e l’equazione di continuit`a esprimente la conservazione della carica elettrica.
1.2 Energia trasportata dal campo elettromagnetico Consideriamo un sistema di cariche e correnti soggette esclusivamente a interazioni di carattere elettromagnetico. Se si indica con W l’energia meccanica per unit` a di volume, si ha, ricordando che le forze magnetiche non compiono lavoro, ∂W . = j · E ∂t Ricavando j dall’Eq. (1.3) si ottiene
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
3
∂W c − 1 E · ∂E , = E · rotB ∂t 4π 4π ∂t e sottraendo al secondo membro l’Eq. (1.4) moltiplicata scalarmente per il vettore cB/(4π), si ha ∂W c − c B · rotE − 1 E · ∂E − 1 B · ∂B . = E · rotB ∂t 4π 4π 4π ∂t 4π ∂t Ricordando infine l’identit` a vettoriale (si veda l’App. 2, Eq. (A2.4)) × B) =B · rotE −E · rotB , div(E si pu` o scrivere ∂ =0 , (W + u) + divS ∂t dove u=
1 (E 2 + B 2 ) , 8π
= c E ×B . S 4π
Questa equazione, detta teorema di Poynting, rappresenta un bilancio energetico e si interpreta dicendo che il campo elettromagnetico possiede un’energia per unit` a di volume data da u e che, inoltre, esso trasporta energia lungo la Il modulo di questo vettore d`a la densit` direzione individuata dal vettore S. a di flusso dell’energia, ovvero l’energia che fluisce, per unit` a di tempo, attraverso l’unit` a di superficie disposta normalmente alla direzione del vettore stesso. Il `e detto vettore di Poynting. vettore S
1.3 Quantit` a di moto trasportata dal campo elettromagnetico la quantit` Indichiamo con Q a di moto per unit` a di volume del medesimo sistema di cariche e correnti considerato nel paragrafo precedente. Tale quantit` a di moto varia nel tempo secondo l’equazione ∂Q + j × B , = ρE ∂t c dove il primo termine del secondo membro `e dovuto alla forza elettrica, mentre il secondo termine `e dovuto alla forza di Lorentz. Eliminando ρ e j attraverso le Eq. (1.1) e (1.3), si ha
4
CAPITOLO 1
∂Q 1 )×B − 1 ∂E × B , + 1 (rotB = E divE ∂t 4π 4π 4πc ∂t ovvero, ricordando la definizione del vettore di Poynting ∂Q 1 )×B − 1 ∂S + 1 E + 1 (rotB × ∂B . = E divE ∂t 4π 4π c2 ∂t 4πc ∂t Sostituiamo adesso il termine ∂ B/∂t attraverso l’Eq. (1.4) e ricordiamo che divB = 0 (Eq. (1.2)); si ottiene cos`ı la formula simmetrica
∂ ∂t
+ S Q c2
=
1 +B divB −E × rotE −B × rotB ) , (E divE 4π
e per mezzo dell’identit` a vettoriale div(a a ) −
1 grad(a2 ) = a diva − a × rota , 2
deducibile per mezzo delle Eq. (A2.8) e (A2.9) dell’App. 2, si ottiene ∂ S 1 E +B B ) − 1 grad(E 2 + B 2 ) . Q+ 2 = div(E ∂t c 4π 8π Introduciamo adesso il tensore T, detto tensore di Maxwell, definito dall’espressione T=
1 B ) − 1 (E 2 + B 2 ) U , (E E + B 4π 8π
dove U `e il tensore unitario (Uij = δij ). In componenti si ha Tij = Tji =
1 1 (Ei Ej + Bi Bj ) − (E 2 + B 2 ) δij . 4π 8π
Ricordando l’identit` a tensoriale (si veda l’Eq. (A2.10)) div(f T) = (gradf ) · T + f divT , (dove f `e uno scalare arbitrario e T un tensore arbitrario), e la relazione v · U = U · v = v , (dove v `e un vettore arbitrario), si ottiene infine 1 ∂ Q + 2 S = divT . ∂t c
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
5
Questa equazione rappresenta un bilancio di impulso. Essa si interpreta dicendo che il campo elettromagnetico possiede una quantit` a di moto per unit` a 2 . Inoltre, il campo elettromagnetico si comporta di volume data dal vettore S/c come un mezzo materiale elastico soggetto a deformazioni, nel cui interno, come `e noto, si sviluppano delle forze descritte dal cosiddetto tensore degli sforzi. La variazione nell’unit` a di tempo della quantit` a di moto contenuta entro un volume arbitrario `e uguale al flusso del tensore −T attraverso una superficie che racchiude il volume stesso. Se si considera una superficie infinitesima dS caratterizzata dal versore normale n, la quantit` a dF = −n · T dS rappresenta il flusso di quantit` a di moto attraverso il dS (definito positivamente se diretto lungo n).
1.4 Potenziali elettromagnetici Tenendo presente l’Eq. (1.2), e ricordando che la divergenza del rotore di un vettore arbitrario `e identicamente nulla, il campo magnetico2 pu` o essere fatto detto potenziale vettore, attraverso discendere da un opportuno potenziale A, l’equazione = rotA . B Sostituendo questo risultato nell’Eq. (1.4), si ha
+ 1 ∂A rot E c ∂t
=0 ,
e ricordando che il rotore del gradiente di un vettore arbitrario `e nullo, possiamo introdurre il potenziale scalare φ scrivendo = −gradφ − 1 ∂ A . E c ∂t e di E nelle equazioni di Maxwell non omogenee. Sostituiamo questi valori di B Dall’Eq. (1.3) si ha )+ 1 ∂ rot(rotA c ∂t 2
1 ∂A gradφ + c ∂t
= 4π
j , c
si dovrebbe parlare pi` Riferendosi al vettore B u propriamente di “induzione magnetica” invece che di “campo magnetico”. In effetti, `e ormai invalso l’uso, quando questo non comporta come al campo magnetico. equivoci, di riferirsi a B
6
CAPITOLO 1
ovvero, per mezzo dell’identit` a vettoriale (A2.11) j 1 ∂φ 1 ∂2A = −4π . ∇ A − 2 2 − grad divA + c ∂t c ∂t c 2
Dall’Eq. (1.1) si ha poi ∇2 φ +
1 ∂ = −4π ρ , divA c ∂t
un’equazione che pu` o anche essere scritta nella forma 1 ∂φ 1 ∂2φ 1 ∂ 2 ∇ φ− 2 2 + divA + = −4π ρ . c ∂t c ∂t c ∂t Il sistema formato da queste due ultime equazioni permette, in linea di prin e φ (e quindi i campi E eB ), una volta note cipio, di ricavare i potenziali A e φ possono esρ e j e le condizioni al contorno. Vedremo comunque che A sere sottoposti a una condizione supplementare che permette di semplificare notevolmente le equazioni cui sono soggetti.
1.5 Invarianza di gauge (di calibro) e φ determinano univocamente i campi elettrico e magnetico; I potenziali A e φ che danno luogo agli stessi valori per tuttavia, esistono diverse funzioni A E e B. Infatti, se si eseguono le seguenti sostituzioni − gradχ , →A = A A
(1.5)
1 ∂χ , (1.6) c ∂t dove χ `e una funzione arbitraria delle coordinate e del tempo, si ottiene, per i e B , nuovi campi E φ → φ = φ +
= rot(A − gradχ) = rotA =B , B e, analogamente, 1 ∂ 1 ∂χ . − (A − gradχ) = E E = −grad φ + c ∂t c ∂t Questa propriet`a viene detta invarianza di gauge (di calibro) e pu` o essere convenientemente sfruttata mediante un’opportuna scelta della funzione χ.
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
7
0 e φ0 siano i potenziali vettore e scalare che danno Supponiamo infatti che A luogo ai campi E e B che siamo interessati a calcolare a partire da una distribuzione assegnata di cariche e correnti e da opportune condizioni al contorno. Consideriamo allora la trasformazione di gauge =A 0 − gradχ , A 1 ∂χ . c ∂t Se si sceglie la funzione χ in modo da soddisfare l’equazione φ = φ0 +
∇2 χ −
1 ∂2χ 0 + 1 ∂φ0 , = divA c2 ∂t2 c ∂t
si ha 1 ∂φ =0 . (1.7) c ∂t Quando si scelgono i potenziali in modo che soddisfino a questa equazione, e φ divengono si dice che si adotta il gauge di Lorenz3 e le equazioni per A + divA
− ∇2 A
j 1 ∂2A = −4π , 2 2 c ∂t c
(1.8)
1 ∂2φ = −4π ρ . (1.9) c2 ∂t2 In assenza di cariche libere, le cose possono essere ulteriormente semplificate 0 e φ0 siano mediante un’ulteriore trasformazione di gauge. Supponiamo che A una coppia di potenziali elettromagnetici che gi` a soddisfano il gauge di Lorenz. Se eseguiamo una trasformazione di gauge, `e necessario, per rimanere entro il gauge di Lorenz, che la funzione χ soddisfi l’equazione ∇2 φ −
1 ∂2χ =0 . c2 ∂t2 D’altra parte, in assenza di cariche elettriche, il potenziale φ0 soddisfa l’equazione ∇2 χ −
∇2 φ0 − 3
1 ∂ 2 φ0 =0 , c2 ∂t2
Il fisico danese L.V. Lorenz (1829-1891) non deve essere confuso col pi` u famoso fisico olandese H.A. Lorentz (1853-1928), noto soprattutto per le trasformazioni e per la forza che ne portano il nome. Entrambi i fisici, quasi contemporanei, sono ricordati insieme per un’equazione che viene detta di Lorentz-Lorenz la quale collega l’indice di rifrazione di un mezzo materiale al coefficiente di polarizzabilit` a delle molecole che lo compongono.
8
CAPITOLO 1
che `e la stessa equazione soddisfatta da χ e quindi anche da ∂χ/∂t. Scegliendo quindi la funzione χ in modo che −
1 ∂χ = φ0 , c ∂t
`e possibile fare in modo che il nuovo potenziale scalare sia φ=0 ,
(1.10)
col che la condizione di Lorenz risulta semplicemente =0 . divA
(1.11)
Un altro gauge particolarmente interessante `e il gauge di Coulomb che si ottiene scegliendo una funzione χ tale da soddisfare l’equazione 0 , ∇2 χ = divA 0 `e, al solito, il potenziale vettore che interessa calcolare. Con questa dove A trasformazione di gauge si ottiene =0 , divA e φ risultano e le equazioni per A − ∇2 A
∂φ j 1 1 ∂2A , = −4π + grad 2 2 c ∂t c c ∂t ∇2 φ = −4π ρ .
Questo gauge ha il vantaggio che il potenziale scalare coincide con quello (istantaneo) dell’elettrostatica, anche nel caso di fenomeni non stazionari che comportano la presenza di cariche e correnti variabili nel tempo.
1.6 Soluzione delle equazioni di Maxwell nel vuoto Consideriamo una regione dello spazio priva di cariche e di correnti. Come abbiamo visto nel paragrafo precedente, nel gauge di Lorenz possiamo porre φ = 0 dimodoch´e il campo elettromagnetico resta descritto dal solo potenziale vettore che obbedisce all’equazione − ∇2 A
1 ∂2A =0 , 2 2 c ∂t
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
9
con la condizione supplementare del gauge di Lorenz (nel vuoto) =0 . divA Supponiamo che il campo elettromagnetico dipenda da una sola coordinata, che immedesimiamo con l’asse z di un sistema di riferimento cartesiano ortogonale. La prima equazione diviene 1 ∂2A ∂2A − =0 . ∂z 2 c2 ∂t2 Questa equazione, che viene detta comunemente equazione delle onde, ammette la soluzione generale t) = A p (z − c t) + A r (z + c t) , A(z, p e A r sono funzioni (vettoriali) arbitrarie del loro argomento. I due dove A termini a secondo membro rappresentano onde piane che si propagano rispettivamente lungo la direzione positiva e negativa dell’asse z (onde progressive e regressive) con velocit`a c. Se fissiamo l’attenzione, ad esempio, sulle onde descritte dal primo termine del secondo membro, ovvero se ammettiamo che sia t) = A p (z − c t) , A(z, si vede immediatamente che, fissato un tempo t, il potenziale vettore `e costante su un qualsiasi piano z = costante. Inoltre, il valore del potenziale vettore che si trova al tempo t0 nel piano z = z0 si sposta, nel tempo dt, di una quantit` a dz tale che z0 − c t0 = (z0 + dz) − c (t0 + dt) , ovvero dz = c dt . Questo giustifica la denominazione di onda piana progressiva data alla pro p (z − c t). (Analogamente si pu` pagazione descritta dal potenziale vettore A o r (z + c t) descrive un’onda regressiva). mostrare che il potenziale vettore A Generalizzando i risultati precedenti, supponiamo adesso che la propagazione avvenga lungo una direzione caratterizzata dal versore n. Abbiamo allora r , t) = a(f ) , A( dove la quantit` a f , detta fase dell’onda, `e data da f = n · r − c t ,
10
CAPITOLO 1
r essendo la distanza del punto generico dall’origine del sistema di riferimento, e a essendo una funzione (vettoriale) arbitraria di f . Applicando la condizione di Lorenz (Eq. (1.11)), si ha div[ a(f ) ] = a (f ) · n = 0 ,
(1.12)
dove si `e tenuto conto che ⎛ ⎞ ∂f ∂ ⎝ = nj xj ⎠ = ni , ∂xi ∂xi j e dove si `e introdotta la notazione a (f ) per designare la derivata del vettore a(f ) rispetto al proprio argomento a (f ) =
d a(f ) . df
Integrando l’Eq. (1.12) rispetto a f ottiene a(f ) · n + a0 · n = 0 , dove a0 `e un vettore costante, indipendente cio`e da r e da t, che possiamo uguagliare a zero per mezzo di un’opportuna trasformazione di gauge (si applichi l’Eq. (1.5) scegliendo per χ la funzione a0 · r ). Si ha quindi a(f ) · n = 0 , il che significa che il potenziale vettore che descrive l’onda piana `e perpendicolare alla direzione di propagazione. eB associati all’onda. Con semplici passaggi Consideriamo adesso i vettori E si ottiene = rot[ a(f ) ] = n × a (f ) , B = − 1 ∂ a(f ) = a (f ) . E c ∂t eB sono entrambi perpendicolari Si ottiene quindi il risultato che i vettori E alla direzione di propagazione e che, inoltre = n × E , B
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
11
E
n
B eB formano, in quest’ordine, una terna destra. Fig. 1.1. I vettori n, E
il che significa che i due vettori sono perpendicolari fra loro e tali da formare B ), come si vede nella Fig. 1.1 con n una terna destrorsa4 (nell’ordine n, E, L’energia elettrica e magnetica trasportate dall’onda sono uguali fra loro (in quanto E 2 = B 2 ); la densit` a totale di energia elettromagnetica `e data da u=
1 2 1 (E 2 + B 2 ) = E , 8π 4π
mentre il vettore di Poynting risulta = c E ×B = c E 2 n . S 4π 4π Confrontando le due formule precedenti e ricordando che il modulo del vettore di Poynting rappresenta l’energia che fluisce per unit` a di tempo attraverso l’unit` a di superficie disposta perpendicolarmente al versore n, ne risulta che l’energia si propaga con la velocit` a c. Per la densit` a di quantit` a di moto si ha poi g =
S u E2 n = n , = 2 c 4π c c
da cui si vede che la densit`a di quantit` a di moto `e diretta lungo la direzione di propagazione dell’onda ed `e pari alla densit` a di energia divisa per c. Questo `e un importante risultato classico che si traduce in meccanica quantistica nella relazione E = c p che collega l’energia E all’impulso p di un fotone. 4
B) sia destrorsa e non sinistrorsa `e connesso con le convenzioni Il fatto che la terna ( n, E, che sono state storicamente stabilite per individuare i segni delle cariche elettriche e delle masse magnetiche. Si ricordi che la carica elettrica positiva (negativa) `e quella che si deposita per strofinio su una bacchetta di vetro (di ebanite), mentre la massa magnetica positiva (negativa) ` e quella che viene attratta dal polo Nord (polo Sud) terrestre.
12
CAPITOLO 1
Il flusso della quantit` a di moto si pu` o poi calcolare attraverso il tensore di Maxwell. Per tale flusso, valutato attraverso l’unit` a di superficie disposta perpendicolarmente alla direzione di propagazione, si ha F (n ) = −n · T . · n = B · n = 0, si ottiene Sostituendo l’espressione di T e tenendo conto che E 1 2 F (n ) = E n . 4π Pi` u in generale, possiamo calcolare il flusso di quantit` a di moto attraverso una superficie unitaria diretta perpendicolarmente alla direzione individuata dal versore arbitrario n . Si ha F (n ) = −n · T , e, sostituendo 1 E2 + B2 (n · E) E + (n · B) B − n . F (n ) = − 4π 2 eB formano una terna ortogonale, si pu` Tenendo conto che n, E, o scrivere n = (n · n ) n +
E B (n · E) (n · B) + , E2 B2
per cui, essendo E 2 = B 2 , si ottiene 1 2 E (n · n ) n , F (n ) = 4π ovvero il flusso `e sempre diretto lungo la direzione di propagazione ma contiene il fattore di proiezione (n · n) = cosθ, dove θ `e l’angolo definito nella Fig. 1.2.
1.7 Pressione della radiazione Consideriamo un’onda piana che si propaghi lungo la direzione n e supponiamo che essa incida sulla superficie dS di un corpo perfettamente assorbente orientata come in Fig. 1.2. La superficie dS assorbe, nel tempo dt, una quantit` a di moto d q data da E2 d q = F (n ) dS dt = (n · n) n dS dt , 4π la cui proiezione lungo la direzione perpendicolare all’elemento di superficie risulta
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
13
n’ θ
n dS
onda piana Fig. 1.2. Un’onda elettromagnetica piana incide su una superficie elementare. Il flusso della quantit` a di moto ` e diretto lungo n.
d q · n =
E2 E2 (n · n)2 dS dt = cos2 θ dS dt . 4π 4π
Questo trasferimento di quantit` a di moto si manifesta come una pressione5 (pressione di radiazione) che vale Prad =
E2 d q · n = cos2 θ = u cos2 θ , dS dt 4π
(1.13)
dove u `e la densit`a di energia. Il risultato cos`ı ottenuto vale per una superficie perfettamente assorbente. Nel caso di una superficie perfettamente riflettente bisogna tener conto che la quantit` a di moto trasferita `e doppia, dimodoch´e il secondo membro della formula precedente deve essere moltiplicato per un fattore 2. La pressione esercitata dalla luce su una superficie fu rivelata sperimentalmente da Lebedev nel 1901 mediante una delicata esperienza attraverso la quale riusc`ı a mostrare, entro gli errori sperimentali, la correttezza del valore teorico previsto dalle equazioni di Maxwell. In ambito astrofisico, oggi sappiamo che la pressione di radiazione ha importanza fondamentale negli interni delle stelle calde e quale meccanismo di accelerazione di venti stellari. A livello di astronautica esistono alcuni progetti di navicelle spaziali che sfruttano la pressione esercitata dalla radiazione solare come mezzo di propulsione verso l’esterno del sistema solare (vele cosmiche). 5
Effettivamente, nel caso schematizzato in figura si ha anche una forza di taglio, oltre che una forza perpendicolare alla superficie. Le forze di taglio si elidono quando la superficie `e investita da radiazione isotropa, caso in cui il fattore cos 2 θ dell’Eq. (1.13) assume il valore 1/3, pari alla sua media sull’angolo solido.
14
CAPITOLO 1
1.8 Onde piane sinusoidali Un tipo particolarmente importante di onde piane `e l’onda piana sinusoidale che `e descritta da un potenziale vettore della forma
r , t) = A 0 cos ω (n · r − c t) + ϕ , A( c 0 e ϕ sono due costanti che prendono rispettivamente il nome di amdove A piezza e fase dell’onda, ω `e la cosiddetta frequenza angolare, e n `e il versore che individua la direzione di propagazione. L’espressione di sopra pu` o anche essere scritta (in maniera del tutto equivalente) sotto varie forme diverse introducendo, volta per volta, la frequenza ciclica (o frequenza tout court) ν, il periodo T , la lunghezza d’onda λ, o il numero d’onde k. Queste grandezze sono collegate fra loro (e con la velocit` a della luce) dalle relazioni ν=
ω 1 = , 2π T
λ=
2π , k
k = ω n = k n , c
λν = c ,
ω = ck .
Ad esempio, si pu`o scrivere r , t) = A 0 cos A(
2π n · r − 2π ν t + ϕ , λ
oppure r, t) = A 0 cos(k · r − ω t + ϕ) . A( eB Se, ad esempio, si adotta quest’ultima espressione, si ottiene per E r , t) = B 0 sin(k · r − ω t + ϕ) , B(
r, t) = E 0 sin(k · r − ω t + ϕ) , E(
dove 0 = −k × A 0 , B
0 = − ω A 0 . E c
Naturalmente si ha ancora, a ciascun istante e in ogni punto dello spazio, r , t) = n × E( r, t) , B( come abbiamo mostrato, in forma pi` u generale, nel paragrafo precedente. Per l’energia e per la quantit` a di moto dell’onda piana sinusoidale si ottengono espressioni variabili, nello spazio e nel tempo, del tipo sin2 (k ·r − ω t + ϕ).
15
LEGGI GENERALI DEL CAMPO ELETTROMAGNETICO
Volendo considerare le medie temporali di tali quantit` a, si riottengono le corrispondenti espressioni del paragrafo precedente con i termini E 2 e B 2 sostituiti rispettivamente da E02 /2, e B02 /2 (la media su un periodo del quadrato della funzione seno `e pari a 1/2). Talvolta `e conveniente rappresentare un’onda piana sinusoidale mediante un esponenziale complesso, anzich´e mediante un’espressione reale, come ad esempio r , t) = A 0 e i (k·r−ω t+ϕ) , A(
oppure
r , t) = A 0 e i (k·r−ω t) , A(
0 `e un vettore complesso dato da dove A 0 e i ϕ . 0 = A A In questi casi, si fa la convenzione che la quantit` a fisica osservabile (ad esempio il campo elettrico) rappresenti la parte reale dell’espressione complessa introdotta. L’uso degli esponenziali complessi `e comodo quando si debbano compiere operazioni lineari, in quanto la parte reale del risultato `e uguale al risultato che si otterrebbe eseguendo le stesse operazioni lineari sulla parte reale. Quando per` o si debbono eseguire operazioni non lineari (come ad esempio per il calcolo dell’energia), prima si deve prendere la parte reale dell’esponenziale complesso e poi eseguire l’operazione desiderata. A questo proposito notiamo che se A(t) e B(t) sono due quantit` a complesse aventi la stessa dipendenza sinusoidale dal tempo A(t) = A e−i ω t ,
B(t) = B e−i ω t ,
con A e B costanti nel tempo, si pu` o scrivere, per la media temporale su un periodo delle loro parti reali ReA(t) ReB(t)
=
1 1 Re(AB ∗ ) = Re(A∗ B) . 2 2
Infatti: ReA(t) =
1 [A e−i ω t + A∗ e i ω t ] , 2
ReB(t) =
1 [B e−i ω t + B ∗ e i ω t ] , 2
e quindi ReA(t) ReB(t) Essendo tuttavia
=
e±2 i ω t
ReA(t) ReB(t)
=
1 4
AB e−2 i ω t + AB ∗ + A∗ B + A∗ B ∗ e 2 i ω t = 0, si ottiene
1 1 1 (AB ∗ + A∗ B) = Re(AB ∗ ) = Re(A∗ B) . 4 2 2
.
Capitolo 2
Spettro e polarizzazione Oltre che dalla direzione di propagazione, la radiazione elettromagnetica `e caratterizzata da due altre propriet`a fondamentali, tipiche dei fenomeni ondosi: lo spettro e la polarizzazione. Tali propriet` a, che sono di cruciale importanza per poter risalire dall’osservazione della radiazione alle caratteristiche fisiche del corpo che l’ha emessa, sia esso un atomo oppure una stella, sono codificate nell’andamento dei vettori campo elettrico e campo magnetico in funzione del tempo. In questo capitolo analizzeremo i concetti matematici che stanno alla base delle definizioni di spettro e di polarizzazione della radiazione elettromagnetica e vedremo come tali concetti possano essere concretizzati in misure fisiche realizzate per mezzo di appropriati strumenti, quali lo spettroscopio a reticolo e il polarimetro, di cui illustreremo i principi di funzionamento.
2.1 Spettro della radiazione L’onda monocromatica piana, introdotta nel capitolo precedente come soluzione delle equazioni di Maxwell, costituisce un’astrazione matematica e, come tale, pu` o fornire la descrizione della radiazione emessa in un processo fisico reale solo come caso limite. Pi` u in generale, i campi elettrico e magnetico associati alla radiazione che fluisce attraverso una superficie infinitesima, pensata fissa nello spazio, risultano descritti da delle opportune funzioni del tempo dal cui andamento dipendono le caratteristiche spettrali e polarimetriche della radiazione stessa. Tuttavia, come abbiamo visto nel capitolo precedente, in un’onda piana generica (non necessariamente monocromatica) propagantesi nel vuoto, `e sempre uguale in modulo al vettore campo il vettore campo magnetico, B, elettrico, E, ed `e ad esso perpendicolare (entrambi essendo perpendicolari alla direzione di propagazione). Se si fissa uno dei due vettori, l’altro risulta automaticamente individuato. Per caratterizzare in maniera esauriente la radiazione possiamo quindi limitarci a considerare uno solo dei due campi, ad esempio il campo elettrico, che risulta descritto, nel punto di osservazione, dalla funzione vettoriale E(t). Allo scopo di non appesantire troppo le notazioni, ci riferiremo inizialmente a una funzione scalare del tempo –invece che vettoriale– della forma E(t). Trascureremo quindi quei fenomeni che sono associati alla direzione del vettore campo elettrico nel piano perpendicolare alla direzione di propagazione. Tali fenomeni, detti fenomeni di polarizzazione, saranno illustrati in paragrafi suc-
18
CAPITOLO 2
cessivi di questo capitolo (Par. 2.5 e 2.6). Lo spettro della radiazione dipende dalla variazione temporale della funzione E(t) e, di conseguenza, non `e possibile definire lo spettro in un preciso istante ma soltanto su un intervallo di tempo sufficientemente lungo (nel senso che sar` a precisato in seguito). Se si suppone che la funzione E(t) si annulli sufficientemente per t → ±∞, possiamo definirne la trasformata di Fourier nello spazio ˆ delle frequenze angolari, E(ω), come la funzione complessa data dall’integrale ∞ 1 ˆ E(ω) = E(t) ei ω t dt . (2.1) 2π −∞ Poich´e la funzione E(t) `e reale, la complessa e coniugata della trasformata di ˆ ∗ , `e tale che Fourier, E(ω) ∞ ˆ ∗= 1 ˆ E(ω) E(t) e−i ω t dt = E(−ω) , 2π −∞ cosicch´e `e sempre possibile connettere la trasformata di Fourier a frequenze negative con quella a frequenze positive. In altre parole, la trasformata di Fourier a frequenze negative non contiene ulteriori informazioni rispetto alla parte a frequenze positive e pu`o, in un certo senso, essere eliminata. Dalla trasformata di Fourier si pu`o risalire al campo elettrico stesso mediante l’operazione di anti-trasformata, scrivendo ∞ ˆ E(t) = E(ω) e−i ω t dω . −∞
Per provare questa equazione, moltiplichiamo ambo i membri dell’Eq. (2.1) per e−i ω t e integriamo in dω. Si ha ∞ ∞ ∞ 1 ˆ dt E(t) e−i ω (t −t) dω . E(ω) e−i ω t dω = 2π −∞ −∞ −∞ D’altra parte, per l’ultimo integrale si pu` o scrivere, con un procedimento di passaggio al limite,
∞
e −∞
−i ω (t −t)
Ω
dω = lim
Ω→∞
−Ω
e−i ω (t −t) dω = lim
Ω→∞
2 sin(Ω Δt) , Δt
(2.2)
dove si `e posto Δt = t − t. Il grafico della funzione 2 sin(Ω Δt)/Δt `e rappresentato nella Fig. 2.1. Da esso si vede che la funzione si comporta, per Ω → ∞, come una funzione delta di Dirac1 . Pi` u precisamente 1
In principio, la delta di Dirac non `e una vera e propria funzione ma, piuttosto, una distribuzione, ovvero un funzionale che associa a una qualsiasi funzione reale f (x) un numero reale F [f (x)]. Le principali propriet` a della delta di Dirac sono illustrate nell’App. 3.
19
SPETTRO E POLARIZZAZIONE
2Ω
Ω
0
0 π/Ω
Fig. 2.1. Grafico della funzione 2 sin(ΩΔt)/Δt in funzione di Δt. La funzione ha un massimo nell’origine e il primo zero si verifica per Δt = π/Ω. Al limite per Ω → ∞, il picco centrale diventa sempre pi` u alto e, nello stesso tempo, si stringe sempre pi` u intorno a Δt = 0.
lim
Ω→∞
2 sin(Ω Δt) = 2π δ(Δt) . Δt
Sostituendo si ottiene quindi ∞ ∞ 1 −i ω t ˆ dω = E(t) 2π δ(t − t) dt = E(t ) , E(ω) e 2π −∞ −∞ che `e l’espressione che volevamo dimostrare. Consideriamo adesso il flusso di energia (energia per unit`a di superficie e per unit` a di tempo)2 trasportata dalla radiazione elettromagnetica. Ricordando la definizione del vettore di Poynting, e indicando il flusso con F , si ha F =
c 2 E (t) , 4π
e, per la quantit` a totale di energia, F, che traversa la superficie unitaria fra t = −∞ e t = +∞ 2
Il flusso di una data grandezza fisica (ad esempio l’energia, la carica, la massa, etc.) `e generalmente definito come la quantit` a di tale grandezza che attraversa un’area unitaria nell’unit` a di tempo. Bisogna per` o tener presente che tale definizione non `e universalmente accettata e che talvolta si parla di flusso riferendosi alla quantit` a della medesima grandezza che traversa una superficie assegnata (non necessariamente unitaria) nell’unit` a di tempo. In fisica matematica, il flusso di un vettore attraverso una superficie chiusa `e definito in maniera diversa (si ricordi il teorema di Gauss), senza far alcun riferimento all’unit` a di tempo.
20
CAPITOLO 2
∞
c F= F dt = 4π −∞
∞
E 2 (t) dt .
−∞
Introducendo la trasformata di Fourier, si pu` o scrivere
∞
2
E (t) dt = −∞
∞
∞
dt −∞
ˆ E(ω) e−i ω t dω
−∞
∞
ˆ )∗ ei ω t dω . E(ω
−∞
Valutando l’integrale in dt mediante un procedimento di passaggio al limite analogo a quello dell’Eq. (2.2) si ha ∞ ei (ω −ω) t dt = 2π δ(ω − ω) , −∞
per cui si ottiene il cosiddetto teorema di Parseval ∞ ∞ 2 ˆ E 2 (t) dt = 2π |E(ω)| dω . −∞
(2.3)
−∞
∗ ˆ ˆ , si ha Sostituendo nell’espressione per F e ricordando che E(ω) = E(−ω) infine ∞ 2 ˆ F =c |E(ω)| dω . 0
A parte il fattore di proporzionalit` a c, questa equazione permette di identificare il modulo quadro della trasformata di Fourier della funzione E(t) con l’energia totale (formalmente fra t = −∞ e t = +∞) che fluisce per unit`a di 2 ˆ superficie nell’intervallo spettrale dω. La quantit` a |E(ω)| `e chiamata lo spet3 tro della radiazione elettromagnetica . Come appare evidente dalla deduzione sopra presentata, tale spettro non dipende dal comportamento istantaneo della funzione E(t), ma dal suo comportamento su tempi molto lunghi (in principio infiniti). ` ovvio che, in pratica, una qualsiasi misura atta a individuare lo spettro E della radiazione non pu` o mai protrarsi per un tempo infinito, ma `e necessariamente limitata a un intervallo di tempo T , detto anche tempo di campionatura. Questo fatto impedisce ovviamente di poter ottenere informazioni sulla variabilit` a della funzione E(t) su periodi dell’ordine o maggiori di T , il che implica che lo spettro della radiazione a frequenze minori di una frequenza di taglio, ω t , con ωt 1/T , rimane indefinito. Questa limitazione non ha per` o alcuna rilevanza pratica per la radiazione elettromagnetica in quanto anche se T `e molto 3
In pratica le misure di spettro sono generalmente delle misure relative, nelle quali ci` o che si 2 a meno di una costante di proporzionalit` ˆ misura ` e l’andamento con ω della funzione |E(ω)| a. Pi` u precisamente si dovrebbe quindi dire che lo spettro della radiazione elettromagnetica `e 2. ˆ proporzionale a |E(ω)|
SPETTRO E POLARIZZAZIONE
21
breve, ad esempio un secondo, il valore di ωt risulta pari a 1 Hz, e la condizione ω < ωt viene a interessare una regione dello spettro del tutto irrilevante. In pratica, si ha molto spesso a che fare con fenomeni di tipo stazionario. Si pensi ad esempio alla radiazione emessa da una lampada a scarica, oppure ` ovvio che in questi casi l’integrale alla radiazione proveniente da una stella. E che definisce la trasformata di Fourier (Eq. (2.1)) `e divergente ed `e quindi necessaria una trattazione particolare, del tipo di passaggio al limite, nella quale il tempo di campionatura diventa essenziale. Consideriamo quindi un tempo di campionatura T sufficientemente grande da contenere tutte le caratteristiche spettrali significative del fenomeno in studio e poniamo artificialmente uguale a zero il campo elettrico per tempi t esterni all’intervallo di campionatura. ˆ La trasformata di Fourier, che adesso indichiamo con E(ω, T ) per ricordare la dipendenza “artificiale” da T che `e stata cos`ı introdotta, risulta data da 1 ˆ E(ω, T)= 2π
T /2
E(t) ei ω t dt .
(2.4)
−T /2
Andiamo adesso a considerare la quantit` a totale di energia, FT , che traversa la superficie unitaria nell’intervallo di tempo compreso fra −T /2 e T /2. Per essa si ha FT =
c 4π
T /2
E 2 (t) dt .
−T /2
Partendo da questa espressione, e utilizzando il fatto che il tempo di campionatura pu` o essere formalmente considerato come tendente a ∞, si possono ripetere tutti i passaggi matematici che hanno portato al teorema di Parseval per ottenerne una forma modificata valida per i fenomeni di tipo stazionario, ovvero FT =
c 4π
T /2
E 2 (t) dt = c
−T /2
∞
ˆ |E(ω, T )|2 dω .
(2.5)
0
Vedremo in seguito, riferendoci ad alcuni casi specifici di fenomeni stazionari, ˆ come anche la quantit`a |E(ω, T )|2 sia proporzionale a T . Questo ci permette di dare una definizione del tutto coerente di flusso monocromatico, ovvero della quantit` a di energia contenuta nell’intervallo di frequenza dω che fluisce attraverso la superficie unitaria nel tempo unitario. Indicando tale quantit` a con Fω , possiamo scrivere ∞ c ∞ ˆ FT = Fω dω = |E(ω, T )|2 dω , T T 0 0 dalla quale si ottiene Fω =
c ˆ |E(ω, T )|2 . T
(2.6)
22
CAPITOLO 2
2.2 Spettri particolari di alcune forme d’impulso Consideriamo alcune forme particolari della funzione E(t) e deduciamone i corrispondenti spettri. Sia E(t) una funzione di tipo gaussiano rappresentata matematicamente dall’equazione (caso a) 1
E(t) = E0 e− 2 (t/τ )
2
.
La trasformata di Fourier `e data da (si ricordi l’Eq. (2.1)) E0 ∞ − 1 (t/τ )2 +i ω t ˆ E(ω) = e 2 dt . 2π −∞ Introducendo la variabile ridotta x = t/τ e aggiungendo e togliendo la quantit`a ω 2 τ 2 /2 all’esponente, si ottiene E0 τ − 1 ω2 τ 2 ∞ − 1 (x−i ω τ )2 ˆ 2 e E(ω) = e 2 dx , 2π −∞ √ e, passando alla variabile complessa z = (x − i ωτ )/ 2 2 E0 τ − 12 ω2 τ 2 ˆ e e−z dz , E(ω) = √ 2π L dove L `e un cammino,√nel piano complesso della variabile z, parallelo all’asse reale. L’integrale vale π per cui si ottiene E02 τ 2 −ω2 τ 2 e . 2π Se ne conclude che lo spettro di una funzione E(t) di tipo gaussiano `e a sua volta una funzione di tipo gaussiano. Calcoli simili possono essere ripetuti per ulteriori forme della funzione E(t). Se (caso b) E0 sin(ω0 t) per |t| < τ2 E(t) = , 0 per |t| ≥ τ2 2 ˆ |E(ω)| =
dove τ `e un tempo tale da contenere un gran numero di periodi dell’onda (τ 1/ω0 ), si ottiene, per lo spettro a frequenze positive 2 ˆ |E(ω)|
E02 sin2 [(ω − ω0 ) τ /2] , 4π 2 (ω − ω0 )2
con un contributo simmetrico, a frequenze negative, centrato intorno alla frequenza −ω0 . Infine, se (caso c)
23
SPETTRO E POLARIZZAZIONE
Fig. 2.2. Grafico della funzione E(t) e della corrispondente trasformata di Fourier modulo quadro, |E(ω)|2 , per i tre casi a), b), e c) considerati nel testo. Si noti la corrispondenza fra il tempo caratteristico di durata del segnale, τ , e l’ampiezza in frequenza dello spettro, 1/τ .
E(t) =
E0 sin(ω0 t) e−t/τ 0
per t ≥ 0 per t < 0
,
dove τ `e di nuovo un tempo tale da contenere un gran numero di periodi dell’onda (τ 1/ω0 ), si ottiene per lo spettro a frequenze positive 2 ˆ |E(ω)|
1 E02 , 16π 2 (ω − ω0 )2 + (1/τ )2
con un contributo simmetrico, a frequenze negative, centrato intorno alla frequenza −ω0 . Le forme delle funzioni E(t) e i conseguenti spettri sono riportate nella Fig. 2.2. Dai tre casi considerati si deduce che l’ampiezza in frequenza dello
24
CAPITOLO 2
E(t)
t t1
t2
t3
Fig. 2.3. Andamento col tempo del campo elettrico dovuto alla sovrapposizione statistica di tre segnali elementari, tutti della stessa forma.
spettro, Δω, di un tipico segnale avente durata temporale τ `e collegata a tale durata dalla relazione Δω τ 1 . In altre parole, pi` u rapido `e l’impulso, pi` u larga `e la banda di frequenze nella quale la trasformata di Fourier `e significativamente diversa da zero, ovvero pi` u largo `e lo spettro. Al limite, se si considera un impulso avente una durata temporale infinitesima, del tipo di una delta di Dirac, lo spettro `e costante, cio`e indipendente dalla frequenza.
2.3 Spettri di segnali stocastici e di segnali periodici Consideriamo una situazione fisica in cui il campo elettrico E(t) `e di tipo stazionario e indichiamo con T il tempo di campionatura. Un caso particolare `e quello di un segnale di tipo stocastico, ovvero quello in cui il campo `e dato dalla sovrapposizione di un numero molto elevato, N , di segnali elementari, tutti uguali fra loro in forma, che si susseguono a istanti casuali con la frequenza N = N/T . Tali segnali possono eventualmente sovrapporsi l’uno con l’altro, come illustrato schematicamente nella Fig. 2.3, e sono tali da avere dei tempi scala caratteristici molto minori del tempo di campionatura. Indicando con t1 , t2 , · · · , tN gli istanti dei singoli segnali elementari, e con f (t) la funzione del tempo che descrive ciascun segnale, il campo elettrico `e dato dall’espressione
25
SPETTRO E POLARIZZAZIONE
E(t) =
N
f (t − tj ) .
j=1
La trasformata di Fourier di tale campo elettrico risulta N 1 T /2 ˆ f (t − tj ) ei ω t dt . E(ω, T ) = 2π j=1 −T /2
Nel j-esimo integrale eseguiamo il cambiamento di variabile t − tj = τ , e definiamo la trasformata di Fourier del segnale elementare attraverso la consueta equazione4 ∞ 1 f (τ ) ei ω t . fˆ(ω) = 2π −∞ Con facili passaggi si ottiene ˆ E(ω, T ) = fˆ(ω) S , dove il numero complesso S `e dato da S=
N
ei ω tj .
j=1
La trasformata di Fourier del campo elettrico `e quindi data dalla trasformata di Fourier del segnale elementare moltiplicata per la somma di N fattori di fase, ovvero di N numeri complessi tutti di modulo 1. Siccome i tempi tj sono distribuiti casualmente nel tempo, i fattori di fase, sommandosi fra loro, tendono ad annullarsi l’uno con l’altro di modo che il modulo del numero complesso S viene a risultare molto minore di N , come illustrato nella Fig 2.4. Siamo qui in una situazione molto simile a quella del moto Browniano nel quale una particella esegue nello spazio un random walk e si allontana lentamente nel tempo dalla sua posizione iniziale. Guardiamo adesso come si comporta il modulo quadro della trasformata. Per esso si ha ˆ |E(ω, T )|2 = |fˆ(ω)|2 |S|2 = |fˆ(ω)|2
N N
ei ω (tj −tk ) .
j=1 k=1
La somma doppia che compare in questa equazione pu` o essere spezzata in due parti. Prima si sommano gli N termini con j = k e poi gli N (N − 1) termini 4
Poich´ e abbiamo supposto che la funzione f (t) vari su tempi scala molto minori di T l’integrale in dt pu` o essere esteso fra −∞ e ∞ invece che fra −T /2 e T /2.
26
CAPITOLO 2
Fig. 2.4. La figura illustra il risultato della somma S di 100 numeri complessi aventi modulo uguale a 1 e fasi casuali. Man mano che si aggiungono i successivi addendi, il risultato della somma parziale si sposta nel piano complesso, a partire dal punto iniziale O, secondo un tipico movimento di random walk fino a raggiungere il punto finale P.
con j = k. La prima somma d`a ovviamente per risultato N , mentre la seconda, essendo i tempi tj e tk distribuiti in maniera casuale, porta un contributo molto piccolo il cui rapporto rispetto alla prima tende a zero per N tendente all’infinito. Si ottiene quindi, ricordando che N = N T 2 ˆ ˆ |E(ω, T )|2 = N T |f(ω)| .
(2.7)
Come avevamo anticipato nel Par. 2.1, la trasformata di Fourier risulta proporzionale al tempo di campionatura T . Ricordando l’Eq. (2.6) il flusso monocromatico risulta Fω = c N |fˆ(ω)|2 . Questa espressione pu`o essere generalizzata al caso in cui il campo elettrico possa essere considerato come la combinazione incoerente di due segnali di tipo stocastico. Se si suppone, ad esempio, che il campo elettrico risulti dalla sovrapposizione di tanti segnali elementari di forma f (t), distribuiti casualmente nel tempo con frequenza Nf , e di tanti segnali elementari di forma g(t), distribuiti anch’essi casualmente nel tempo con frequenza Ng , ripetendo il ragionamento sviluppato sopra si ottiene che il flusso monocromatico `e dato da Fω = c Nf |fˆ(ω)|2 + Ng |ˆ g (ω)|2 .
27
SPETTRO E POLARIZZAZIONE
Infine, nel caso in cui si abbia una distribuzione continua di segnali elementari (dipendenti, ad esempio, da un parametro ζ), sempre assumendo la distribuzione temporale stocastica e l’incoerenza fra segnali di tipo diverso, l’equazione precedente pu`o essere ulteriormente generalizzata scrivendo 2 ˆ Fω = c Ntot |f(ω)|
,
(2.8)
dove Ntot `e la frequenza totale dei segnali elementari e |fˆ(ω)|2 `e la media di |fˆ(ω)|2 rispetto al parametro ζ. Passiamo adesso a considerare il caso in cui la funzione stazionaria E(t) sia una funzione periodica del tempo con periodo T . In base al teorema di Fourier, valido per una funzione periodica arbitraria, il campo elettrico pu` o essere espresso mediante l’equazione E(t) =
∞
E (n) e−i n ω0 t ,
n=−∞
dove ω0 `e la frequenza angolare fondamentale definita da ω0 =
2π , T
e dove le E (n) (con E (−n) = E (n)∗ ) sono quantit`a complesse, dette componenti di Fourier, date dall’equazione E (n) =
1 T
t0 +T
E(t) e2π i n t/T dt =
t0
1 T
t0 +T
E(t) ei n ω0 t dt ,
t0
t0 essendo un istante arbitrario. Vogliamo determinare la relazione esistente fra la trasformata di Fourier e le componenti di Fourier, E (n) . Per questo, consideriamo un tempo di campionatura, T , che contenga un numero molto grande di periodi. Si ha 1 ˆ E(ω, T)= 2π
T /2
E(t) ei ω t dt ,
−T /2
ovvero, sostituendo l’espressione di E(t) in termini di componenti di Fourier ∞ 1 (n) T /2 i (ω−n ω0 ) t ˆ E e dt . E(ω, T ) = 2π n=−∞ −T /2 Sviluppando l’integrale si ha ∞ 1 (n) 2 sin[(ω − n ω0 ) T /2 ] ˆ E(ω, T)= E , 2π n=−∞ ω − n ω0
28
CAPITOLO 2
ed essendo, per T → ∞, lim
T →∞
2 sin[(ω − n ω0 )T /2 ] = 2π δ(ω − n ω0 ) , ω − n ω0
si ottiene ∞
ˆ E(ω, T)=
E (n) δ(ω − n ω0 ) .
n=−∞
Questa espressione, seppur corretta, non `e per` o appropriata per calcolare il modulo quadro della trasformata di Fourier in quanto farebbe intervenire il quadrato di una funzione delta di Dirac cui `e impossibile attribuire il significato corretto senza far ricorso a concetti matematici tipici della teoria delle ˆ distribuzioni. Per il calcolo della |E(ω, T )|2 si pu` o comunque seguire il proˆ cedimento di considerare l’espressione di E(ω, T ) in funzione di T , andarne a valutare il modulo quadro e passare poi al limite per T → ∞. Cos`ı facendo si ottiene una somma doppia del tipo ˆ |E(ω, T )|2 = ×
∞ ∞ 1 (n) (m)∗ E E 4π 2 n=−∞ m=−∞
2 sin[(ω − n ω0 )T /2 ] 2 sin[(ω − m ω0 )T /2 ] . ω − n ω0 ω − m ω0
Per n = m, nel limite T → ∞ le due funzioni di T che compaiono al secondo membro sono per` o mutuamente esclusive, nel senso che dove una `e diversa da zero l’altra `e nulla, e viceversa. La somma doppia pu` o quindi essere ristretta a una somma singola ponendo m = n. Osservando poi che 4 sin2 [(ω − n ω0 )T /2] = 2π T δ(ω − n ω0 ) , T →∞ (ω − n ω0 )2 lim
si ottiene ˆ |E(ω, T )|2 =
T 2π
∞
(2.9)
|E (n) |2 δ(ω − n ω0 ) .
n=−∞
Di nuovo abbiamo ottenuto il risultato che la trasformata di Fourier `e proporzionale al tempo di campionatura T . Ricordando l’Eq. (2.6), ed escludendo l’armonica zero (che equivale a supporre che la media tempoarle di E(t) sia nulla), il flusso monocromatico di un segnale periodico `e dato da Fω =
∞ c (n) 2 |E | δ(ω − n ω0 ) . 2π n=1
(2.10)
Lo spettro di un segnale periodico `e quindi composto da un “pettine” di funzioni delta di Dirac centrate alla frequenza fondamentale e, in generale, a
SPETTRO E POLARIZZAZIONE
29
d Onda diffratta
θ
L Onda piana incidente
Reticolo di diffrazione
Fig. 2.5. Schema del reticolo di diffrazione.
tutte le armoniche superiori. Il “peso” di ciascuna armonica `e proporzionale al modulo quadro della rispettiva componente di Fourier.
2.4 Spettroscopio a reticolo di diffrazione Lo spettroscopio a reticolo di diffrazione pu` o essere a buona ragione considerato lo strumento prototipo per misurare lo spettro della radiazione, almeno per quanto riguarda la regione visibile dello spettro elettromagnetico e le regioni limitrofe dell’infrarosso e dell’ultravioletto. In questo paragrafo ne diamo una trattazione semplificata al fine di illustrare la connessione fra la definizione matematica di spettro e i risultati pratici delle misure. Facendo riferimento alla Fig. 2.5, la radiazione, proveniente da una sorgente di laboratorio oppure da un telescopio, viene convertita in un’onda piana per mezzo di un sistema di lenti e viene fatta incidere perpendicolarmente su un reticolo piano a trasparenza5, caratterizzato dalla presenza di N tratti separati l’uno dall’altro dalla distanza d, detta costante del reticolo. Sul piano del reticolo, il campo elettrico associato alla radiazione sia descritto dalla funzione E(t). I tratti del reticolo danno luogo al fenomeno della diffrazione e l’espressione per l’onda diffratta pu` o essere calcolata attraverso il principio di Huygens5
Il reticolo piano a trasparenza `e il tipo pi` u semplice di reticolo di diffrazione. In pratica si possono utilizzare molti altri tipi di reticolo (a riflessione, a gradinata, a dente di sega, di trasparenza e fase, circolare, concavo, etc.).
30
CAPITOLO 2
Fresnel. Per il caso di un reticolo ideale a trasparenza, il principio pu`o enunciarsi dicendo che ciascun tratto del reticolo `e l’asse di un’onda cilindrica la cui ampiezza, sulla faccia di emergenza del reticolo, `e semplicemente data da E(t) in corrispondenza delle zone di trasparenza ed `e nulla in corrispondenza di quelle opache. Andiamo a considerare l’onda diffratta dal tratto j-esimo del reticolo nella direzione che forma un angolo θ con la direzione dell’onda incidente. Alla distanza L dal reticolo, l’ampiezza di tale onda `e data, al tempo t, da un’espressione del tipo d sinθ L d Ej (t, θ) = k E t − − j , c c dove k `e una costante, in generale complessa6 , e dove l’indice j numera i tratti del reticolo a partire dal primo (si veda la Fig. 2.5). Sommando il contributo delle onde diffratte da tutti i tratti del reticolo ed esprimendo il campo elettrico dell’onda incidente attraverso il suo integrale di Fourier7 , si ottiene, con semplici passaggi E d (t, θ) =
N
∞
−∞
j=1
ˆ k E(ω, T ) e−i ω(t−L/c) e i j ω d sinθ/c dω .
La somma su j pu` o essere facilmente eseguita ricordando che, per una serie geometrica troncata, si ha 1 + q + q 2 + · · · + q N −1 =
1 − qN . 1−q
Si ottiene quindi d
∞
E (t, θ) = −∞
ˆ k E(ω, T ) e−i ω[t−(L+d sinθ)/c] f (ω, θ) dω ,
dove f (ω, θ) =
1 − e i N ω d sinθ/c . 1 − e i ω d sinθ/c
L’equazione ottenuta per E d (t, θ) definisce direttamente la trasformata di Fourier del campo elettrico diffratto in direzione θ. Con simboli evidenti si ha 6
Nel caso di un reticolo ideale a trasparenza si pu` o mostrare che k ` e data da a cosθ/λ dove a` e la dimensione della zona trasparente di ciascun tratto e λ ` e la lunghezza d’onda (si veda G. Toraldo di Francia, La Diffrazione della Luce, Edizioni Scientifiche Einaudi, Boringhieri, Torino, 1958). In pratica, la costante k dipende anche dai dettagli di costruzione del reticolo stesso.
7
Ci riferiamo qui al caso in cui la radiazione abbia un comportamento stazionario, per cui `e necessario riferirsi alla trasformata di Fourier relativa a un certo tempo di campionatura T .
SPETTRO E POLARIZZAZIONE
31
ˆ ˆ d (ω, θ, T ) = k E(ω, T ) e i ω (L+d sinθ)/c f (ω, θ) . E In altre parole, a parte un fattore di proporzionalit`a, la trasformata di Fourier del campo elettrico diffratto in direzione θ si ottiene moltiplicando la trasformata di Fourier del campo incidente per un fattore di fase e per la funzione complessa f (ω, θ), detta funzione di trasferimento del reticolo. In un comune spettroscopio, la radiazione diffratta dal reticolo viene focheggiata per mezzo di un sistema di lenti sul rivelatore8, il quale risponde con un segnale proporzionale al quadrato del campo elettrico su di esso incidente. Nel punto del rivelatore su cui va a cadere la radiazione proveniente dalla direzione θ si ha quindi un segnale, S(θ), che risulta dato dall’espressione S(θ) = K
T /2
E d (t, θ)2 dt ,
−T /2
dove K `e una costante che dipende dall’efficienza del rivelatore (oltre che dalle unit` a in cui si misura S), e dove T `e il tempo su cui si esegue la misura (il tempo di campionatura). Ricordando il teorema di Parseval nella forma dell’Eq. (2.5) e ponendo K = 4π K, si ottiene
S(θ) = K
0
∞
ˆ d (ω, θ, T )|2 dω = K |E
∞
ˆ k 2 |E(ω, T )|2 |f (ω, θ)|2 dω . (2.11)
0
Studiamo adesso l’andamento con θ della funzione |f (ω, θ)|2 a ω fissato. Dalla definizione si ottiene sin2 N ω2dcsinθ . |f (ω, θ)|2 = sin2 ω d2sinθ c Questa funzione presenta dei massimi molto elevati in corrispondenza di quei valori di sinθ tali da annullare il denominatore, ovvero per sinθm = m
2π c , ωd
(2.12)
dove m `e un intero qualsiasi (positivo, negativo o nullo) che caratterizza il cosiddetto ordine dello spettro9 . In corrispondenza di tali valori di θ si ha, con un passaggio al limite 8
Al giorno d’oggi il rivelatore ` e generalmente costituito da una camera CCD o da una serie di fotomoltiplicatori. Anteriormente venivano comunemente utilizzate le lastre fotografiche.
9
Si noti che sostituendo in luogo della frequenza angolare la lunghezza d’onda (ω = 2πc/λ), l’Eq. (2.12) pu` o esser posta nella forma d sinθm = mλ, che ` e l’equazione che risulta dalla teoria elementare del reticolo di diffrazione.
32
CAPITOLO 2
Fig. 2.6. Grafico del modulo quadro della funzione di trasferimento del reticolo. Il grafico `e ottenuto per N = 8. I reticoli comunemente usati in laboratorio e nella pratica astronomica hanno valori di N molto pi` u elevati. Un tipico reticolo per osservazioni solari ha N 10 5 .
|f (ω, θm )|2 = N 2 . Tali punti si chiamano massimi principali e si pu`o mostrare che fra due qualsiasi di essi si vengono a trovare (N − 1) zeri della funzione che corrispondono a valori di θ tali da annullare il numeratore ma non il denominatore. Il primo zero contiguo a θm si trova a una distanza Δθ tale che 1 ω d sin(θm + Δθ) = m+ π , 2c N ovvero, mediante uno sviluppo in serie 1 tanθm . (2.13) mN Fra gli (N − 1) zeri si trovano inoltre, per il teorema di Rolle, (N − 2) massimi della funzione che prendono il nome di massimi secondari e nei quali la funzione assume un valore dell’ordine dell’unit`a. Il grafico della funzione per N = 8 `e riportato nella Fig. 2.6. Come mostrato dalla figura, all’aumentare di N la funzione assume un comportamento del tipo di “pettine” di delta di Dirac. In prima approssimazione si ottiene, tenendo conto dell’altezza dei picchi e della loro larghezza Δθ =
|f (ω, θ)|2 =
N tanθm δ(θ − θm ) . m m
SPETTRO E POLARIZZAZIONE
33
Alternativamente, si pu` o anche studiare l’andamento della stessa funzione con ω, a θ fissato. Di nuovo si trova che la funzione presenta dei massimi molto elevati, nei quali assume il valore N 2 , in corrispondenza delle frequenze ωm date da ωm = m
2π c . d sinθ
Il primo zero contiguo a ωm si trova a una distanza in frequenza, Δω, tale che (ωm + Δω) d sinθ 1 = m+ π , 2c N ovvero, Δω =
2π c . N d sinθ
Di nuovo, si ottiene in prima approssimazione un comportamento a “pettine” di delta di Dirac espresso dall’equazione |f (ω, θ)|2 =
m
N
2π c δ(ω − ωm ) . d sinθ
Sostituendo questo risultato nell’Eq. (2.11) si ricava la seguente espressione per il segnale misurato dal rivelatore dello spettroscopio in corrispondenza della direzione θ S(θ) = K k 2 N
2π c |E(ωm , T )|2 . d sinθ m
Messi a parte i possibili problemi derivanti dalla sovrapposizione degli spettri di ordine diverso, questa formula mostra che, se ci si restringe a considerare intervalli di θ sufficientemente piccoli (in modo da poter trascurare la leggera dipendenza da θ contenuta nel fattore k 2 / sinθ), il segnale ottenuto sul rivelatore dello spettroscopio fornisce effettivamente una misura del modulo quadro della trasformata di Fourier del campo elettrico della radiazione incidente, ovverosia del suo spettro. In altre parole, lo spettroscopio funziona come un dispositivo capace di eseguire in maniera analogica la trasformata di Fourier del campo elettrico incidente. Si noti anche che il segnale S(θ) `e proporzionale al tempo della misura, T , tale dipendenza essendo contenuta nel modulo quadro della trasformata di Fourier (si ricordino i risultati del Par. 2.3, e in particolare l’Eq. (2.7)). La teoria dello spettroscopio a reticolo presentata sopra permette anche di determinare il potere risolutivo dello strumento. Se si suppone di avere in ingresso una radiazione composta da due onde puramente monocromatiche che differiscono in frequenza di una piccola quantit` a δω, esse saranno diffratte,
34
CAPITOLO 2
all’ordine m, lungo due direzioni che formano fra loro un angolo δθ. Differenziando l’Eq. (2.12) si ottiene δθ = tanθm
δω . ω
D’altra parte, affinch´e i corrispondenti segnali sul rivelatore appaiano distinti, `e necessario che l’angolo δθ sia maggiore della larghezza intrinseca di ciascun segnale, Δθ, data dall’Eq. (2.13). Si ottiene quindi la condizione δω 1 ≥ . ω mN Questo pone un limite inferiore alla differenza in frequenza, (δω)min , che si deve avere affinch´e i segnali appaiono distinti. Ovviamente si ha (δω)min 1 = . ω mN Per potere risolutivo di uno strumento si intende il rapporto fra la frequenza ω e tale minima differenza (δω)min . Il potere risolutivo dello spettroscopio a reticolo `e quindi dato da P = mN . Come esempio pratico, consideriamo un reticolo di diffrazione caratterizzato da un numero di tratti N = 105 e da una costante d = 1.5 μm. Se la radiazione incidente copre tutto l’intervallo visibile tra 3800 e 7000 ˚ A, lo spettro del primo ordine si trova compreso fra gli angoli di deflessione (θ1 )min = 14◦ .7 ,
(θ1 )max = 27◦ .8 ,
lo spettro del secondo ordine fra gli angoli (θ2 )min = 30◦ .4 ,
(θ2 )max = 69◦ .0 ,
mentre lo spettro del terzo ordine parte dall’angolo di deflessione (θ3 )min = 49◦ .5 , e si estende fino a θ = 90◦ , angolo cui corrisponde la lunghezza d’onda di 5000 ˚ A. Gli spettri di ordine superiore non sono osservabili. Infine, il potere risolutivo `e pari a 105 per lo spettro del primo ordine, 2 × 105 per lo spettro del secondo ordine e 3 × 105 per quello del terzo ordine. Intorno a 5000 ˚ A, ad esempio, due righe possono essere risolte nello spettro del secondo ordine solo se esse distano pi` u di 25 m˚ A.
SPETTRO E POLARIZZAZIONE
35
2.5 Polarizzazione di un’onda monocromatica I fenomeni di polarizzazione della radiazione elettromagnetica sono connessi col fatto che il vettore campo elettrico (o l’associato vettore campo magnetico) di un pennello di radiazione che si propaga nel vuoto pu` o essere diretto lungo una qualsiasi direzione appartenente al piano perpendicolare alla direzione di propagazione. Per descrivere tali fenomeni, iniziamo col considerare un’onda monocromatica piana di frequenza angolare ω che si propaga lungo la direzione z di un sistema di riferimento cartesiano ortogonale destrorso (x, y, z). Il vettore campo elettrico dell’onda pu` o essere scomposto nelle due componenti lungo gli assi x e y. In un punto assegnato dello spazio, tali componenti risultano descritte da espressioni del tipo Ex (t) = E1 cos( ωt − φ1 ) ,
Ey (t) = E2 cos( ωt − φ2 ) ,
dove E1 , E2 , φ1 e φ2 sono quattro quantit` a reali. Alternativamente, si possono utilizzare quantit` a complesse scrivendo Ex (t) = Re[ E1 e−i ω t ] ,
Ey (t) = Re[ E2 e−i ωt ] ,
dove E1 = E1 ei φ1 ,
E2 = E2 ei φ2 .
L’estremo del vettore campo elettrico ruota nel piano x-y descrivendo un’ellisse che viene detta ellisse di polarizzazione. Per renderci conto di questo fatto, consideriamo l’equazione generale di un’ellisse riferendola ai suoi assi principali x e y . In forma parametrica l’equazione dell’ellisse `e Ex = E0 cosγ cos(ωt) ,
Ey = −E0 sinγ sin(ωt) ,
dove E0 `e una quantit` a reale e positiva e dove γ (con |γ | ≤ π/4) `e un parametro connesso con l’eccentricit` a dell’ellisse ( | tanγ | essendo il rapporto fra i semiassi). Nell’equazione precedente abbiamo assunto che, all’istante t = 0, il campo elettrico sia diretto lungo l’asse positivo x . Eliminando t, si ottiene
E02
Ey2 Ex2 + 2 =1 . 2 cos γ E0 sin2 γ
I semiassi dell’ellisse valgono rispettivamente E0 | cosγ | e E0 | sinγ |; se γ `e positivo l’ellisse `e percorsa in senso orario, ammesso che la rotazione sia osservata da una persona che veda la radiazione venirgli incontro. La situazione geometrica `e rappresentata nella Fig. 2.7, nella quale l’asse z esce dal foglio provenendo da dietro. Se il vettore campo elettrico `e visto ruotare in senso orario si dice
36
CAPITOLO 2
y
y’ E
x’
ξ x
Fig. 2.7. Al trascorrere del tempo l’estremo del vettore campo elettrico descrive l’ellisse di polarizzazione
che si ha a che fare con polarizzazione ellittica positiva (o destrorsa); nel caso contrario si ha a che fare con polarizzazione ellittica negativa (o sinistrorsa). Si possono avere due casi particolari (o degeneri) di polarizzazione ellittica: se γ = ±π/4, l’ellisse degenera in un cerchio e la polarizzazione viene detta circolare (destra e sinistra, rispettivamente). Se invece γ = 0, l’ellisse degenera in un segmento e la polarizzazione viene detta lineare (o rettilinea). Per connettere le caratteristiche geometriche dell’ellisse (ampiezza, E0 , azimut del semiasse maggiore, ξ, e rapporto fra i semiassi, tanγ) alle quantit` a E1 , dal sistema (x , y ) al sistema E2 , φ1 e φ2 , trasformiamo le componenti di E (x, y). Con riferimento alla Fig. 2.7 si ha Ex = Ex cosξ − Ey sinξ ,
Ey = Ex sinξ + Ey cosξ ,
e, sostituendo Ex = E0 [ cosγ cosξ cos(ωt) + sinγ sinξ sin(ωt) ] , Ey = E0 [ cosγ sinξ cos(ωt) − sinγ cosξ sin(ωt) ] . Identificando queste espressioni con quelle date precedentemente, si ottengono le relazioni che connettono le quantit` a E1 , E2 , φ1 e φ2 con i parametri dell’ellisse E1 cos φ1 = E0 cosγ cosξ ,
E1 sin φ1 = E0 sinγ sinξ ,
E2 cos φ2 = E0 cosγ sinξ ,
E2 sin φ2 = −E0 sinγ cosξ .
Quadrando le quattro equazioni si ottiene
SPETTRO E POLARIZZAZIONE
37
E02 = E12 + E22 ; moltiplicando la prima per la quarta e sottraendo il prodotto della seconda per la terza sin(2γ) =
2E1 E2 sin(φ1 − φ2 ) ; E12 + E22
moltiplicando la prima per la terza e aggiungendo il prodotto della seconda per la quarta cos(2γ) sin(2ξ) =
2E1 E2 cos(φ1 − φ2 ) ; E12 + E22
sottraendo dalla somma dei quadrati delle prime due la somma dei quadrati delle ultime due cos(2γ) cos(2ξ) =
E12 − E22 ; E12 + E22
infine, dividendo fra di loro le due ultime equazioni ottenute tan(2ξ) =
2E1 E2 cos(φ1 − φ2 ) . E12 − E22
Le equazioni scritte permettono di ottenere i parametri dell’ellisse, (E0 , γ, ξ), a partire dalle quantit`a che descrivono l’oscillazione elettrica lungo gli assi x e y, (E1 , E2 , φ1 , φ2 ). Come si vede dalle equazioni precedenti, i parametri dell’ellisse dipendono solo dalla differenza di fase (φ1 − φ2 ) e non dalle fasi assolute. Fondamentali dal punto di vista della caratterizzazione delle propriet`a di polarizzazione di un’onda monocromatica piana sono le quattro quantit` a bilineari nelle componenti del campo elettrico che compaiono nelle equazioni precedenti, ovvero (E12 + E22 ), (E12 − E22 ), 2E1 E2 cos(φ1 − φ2 ), e 2E1 E2 sin(φ1 − φ2 ). La prima quantit` a, (E12 + E22 ), `e proporzionale al flusso di energia, ovvero all’energia che traversa l’unit`a di superficie nell’unit`a di tempo. Indichiamo tale flusso col simbolo10 FI . Attraverso le altre quantit` a si possono definire dei flussi associati che indichiamo con FQ , FU , e FV . Per la nostra onda monocromatica, ricordando la definizione del vettore di Poynting e tenendo conto che le funzioni sin2 (ω t) e cos2 (ω t) valgono in media 1/2, mediando su un periodo si ha FI = FU = 10
c (E 2 + E22 ) , 8π 1
c 2 E1 E2 cos(φ1 − φ2 ) , 8π
c (E 2 − E22 ) , 8π 1 c FV = 2 E1 E2 sin(φ1 − φ2 ) . 8π
FQ =
Nel Par. 2.1, nel quale abbiamo fatto astrazione dalle propriet` a di polarizzazione, tale quantit` a` e stata pi` u semplicemente indicata col simbolo F .
38
CAPITOLO 2
Bisogna notare che simboli I, Q, U e V , utilizzati come indici nelle equazioni precedenti, vengono comunemente utilizzati per denotare delle quantit`a fisiche diverse, legate alle prime da delle costanti moltiplicative dimensionali. Tali quantit` a sono i cosiddetti parametri di Stokes, usualmente introdotti nella teoria del trasporto radiativo per radiazione polarizzata, che hanno le dimensioni dell’intensit` a specifica del campo di radiazione e che sono quindi dimensionalmente uguali a un’energia per unit` a di superficie, per unit`a di tempo, per unit` a di intervallo spettrale e per unit`a di angolo solido. Nel seguito ci riferiremo a FI , FQ , FU e FV come ai flussi (di energia) nei quattro parametri di Stokes. Invertendo le equazioni precedenti si possono legare le caratteristiche geometriche dell’ellisse di polarizzazione ai flussi nei parametri di Stokes. Si ottiene, con facili passaggi E02 =
8π FI , c
cos(2γ) sin(2ξ) =
sin(2γ) = FU , FI
FV , FI tan(2ξ) =
cos(2γ) cos(2ξ) =
FQ , FI
FU . FQ
A seconda dei valori dei flussi nei parametri di Stokes, l’ellisse di polarizzazione assume forme diverse, e, viceversa, ogni ellisse di polarizzazione `e caratterizzata da una particolare quaterna di flussi nei parametri di Stokes. In particolare, se l’ellisse degenera in una circonferenza (γ = ±π/4), si ha che FQ = FU = 0, FV = ±FI , il segno pi` u riferendosi a una circonferenza percorsa in senso orario (per un osservatore che veda avvicinarsi l’onda) e il segno meno a una circonferenza percorsa in senso antiorario. In questo caso si parla di polarizzazione circolare pura, positiva e negativa (oppure destrorsa e sinistrorsa), rispettivamente. Se invece l’ellisse degenera in un segmento (γ = 0), si ha FV = 0 e FQ2 + FU2 = FI2 , i valori di FQ e FU essendo legati all’angolo ξ che il segmento forma con l’asse x. In questo caso si parla di polarizzazione lineare (o rettilinea) pura. I flussi nei parametri di Stokes, possono anche essere espressi in termini delle ampiezze complesse E1 e E2 introdotte precedentemente. Si ha infatti, come `e facile verificare c (E ∗ E1 + E2∗ E2 ) , 8π 1 c (E ∗ E2 + E2∗ E1 ) , FU = 8π 1 FI =
c (E ∗ E1 − E2∗ E2 ) , 8π 1 c i (E1∗ E2 − E2∗ E1 ) . FV = 8π
FQ =
(2.14)
Possiamo infine osservare che i flussi nei parametri di Stokes di un’onda monocromatica piana non sono indipendenti fra loro. Quadrando infatti le espressioni precedenti, `e facile verificare per mezzo di semplici passaggi algebrici che i flussi nei parametri di Stokes sono legati dalla relazione FI2 = FQ2 + FU2 + FV2 .
(2.15)
39
SPETTRO E POLARIZZAZIONE
Questa relazione `e tipica delle onde monocromatiche le quali, per loro natura, sono sempre polarizzate. In altre parole, `e impossibile rappresentare una radiazione priva di polarizzazione (avente cio`e FQ = FU = FV = 0) per mezzo di un’onda monocromatica. La relazione precedente traduce in termini matematici il fatto che sono sufficienti tre soli parametri geometrici, che possono essere ad esempio l’ampiezza, il rapporto fra il semiasse maggiore e il semiasse minore, e l’inclinazione dell’asse maggiore, per definire completamente l’ellisse di polarizzazione.
2.6 Misure spettropolarimetriche L’onda monocromatica piana considerata nel paragrafo precedente ha un carattere di polarizzazione perfettamente definito. Essa rappresenta tuttavia un caso estremamente particolare. In tutta generalit`a possiamo assumere che le due componenti del vettore campo elettrico lungo due direzioni, x e y, perpendicolari alla direzione z di propagazione di un pennello di radiazione elettromagnetica, siano descritte da due funzioni arbitrarie del tempo, E1 (t) e E2 (t). Dall’andamento di queste due funzioni dipendono non solo lo spettro, ma anche le caratteristiche di polarizzazione della radiazione. Per le due funzioni E1 (t) e E2 (t), facendo riferimento a un fenomeno di tipo stazionario e al tempo di campionatura T , definiamo le rispettive trasformate di Fourier secondo l’Eq. (2.4)
ˆ1 (ω, T ) = 1 E 2π
T /2
−T /2
E1 (t) e
iωt
dt ,
ˆ2 (ω, T ) = 1 E 2π
T /2
−T /2
E2 (t) ei ω t dt .
A partire da queste definizioni possiamo generalizzare le varie equazioni che abbiamo dedotto precedentemente introducendo, in luogo del flusso monocromatico Fω , il flusso monocromatico nei singoli parametri di Stokes. Generalizzando l’Eq. (2.6), relativa a un segnale di tipo stazionario, si ottiene c T c FωQ = T c FωU = T c FωV = T FωI =
ˆ2 (ω, T )∗ E ˆ2 (ω, T )) , (Eˆ1 (ω, T )∗ Eˆ1 (ω, T ) + E ˆ2 (ω, T )∗ E ˆ1 (ω, T ) − E ˆ2 (ω, T )) , (Eˆ1 (ω, T )∗ E ˆ1 (ω, T )∗ E ˆ2 (ω, T )∗ E ˆ2 (ω, T ) + E ˆ1 (ω, T )) , (E ˆ2 (ω, T )∗ E ˆ2 (ω, T ) − E ˆ2 (ω, T )) . i (Eˆ1 (ω, T )∗ E
Generalizzando l’Eq. (2.8), relativa a un segnale stocastico, si ottiene
(2.16)
40
CAPITOLO 2
FωI = c Ntot fˆ1 (ω)∗ fˆ1 (ω) + fˆ2 (ω)∗ fˆ2 (ω)
,
FωQ = c Ntot fˆ1 (ω)∗ fˆ1 (ω) − fˆ2 (ω)∗ fˆ2 (ω)
,
FωU = c Ntot fˆ1 (ω)∗ fˆ2 (ω) + fˆ2 (ω)∗ fˆ1 (ω)
,
FωV = c Ntot i fˆ1 (ω)∗ fˆ2 (ω) − fˆ2 (ω)∗ fˆ1 (ω)
.
(2.17)
Infine, generalizzando l’Eq. (2.10) relativa a un segnale periodico, si ottiene FωI =
∞ c (n)∗ (n) (n)∗ (n) E1 E1 + E 2 E2 δ(ω − n ω0 ) , 2π n=1
FωQ =
∞ c (n)∗ (n) (n)∗ (n) E1 E1 − E2 E2 δ(ω − n ω0 ) , 2π n=1
FωU =
∞ c (n)∗ (n) (n)∗ (n) E1 E2 + E 2 E1 δ(ω − n ω0 ) , 2π n=1
FωV =
∞ c (n)∗ (n) (n)∗ (n) i E1 E2 − E2 E1 δ(ω − n ω0 ) . 2π n=1
(2.18)
Le equazioni precedenti mostrano che la caratterizzazione polarimetrica della radiazione elettromagnetica implica la determinazione di prodotti bilineari di ˆi (ω)∗ E ˆj (ω) con i, j = 1, 2. Nella regione ratrasformate di Fourier del tipo E dio dello spettro elettromagnetico, a frequenze minori o dell’ordine del GHz, questo pu`o essere realizzato andando a misurare direttamente i campi elettrici E1 (t) e E2 (t) per mezzo di due antenne disposte lungo gli assi x e y e ricavando poi le espressioni bilineari stesse mediante procedure di tipo elettronico. Per la regione visibile dello spettro elettromagnetico, e per le regioni limitrofe dell’ultravioletto e dell’infrarosso, questo non `e per`o possibile a causa dell’elevata frequenza della radiazione (ν 1015 Hz). Come abbiamo gi` a detto, in queste regioni dello spettro elettromagnetico le misure di campo elettrico vengono realizzate attraverso dei rivelatori (camere CCD, fotomoltiplicatori, lastre fotografiche, etc.) che danno un segnale proporzionale all’energia incidente, e quindi al quadrato del campo elettrico. Quello che si ottiene dalle misure `e quindi soltanto un tipo di informazione che si riferisce a integrali del tipo
T /2
−T /2
E1 (t)2 + E2 (t)2 dt ,
dove T `e il tempo di esposizione del rivelatore. Limitandoci a considerare fenomeni di tipo stazionario, ricordando il teorema di Parseval nella forma dell’Eq. (2.5), e isolando il contributo della radiazione contenuta in un intervallo
SPETTRO E POLARIZZAZIONE
41
x Ep α
E y
E1
E2
Fig. 2.8. Il filtro polarizzante `e disposto lungo una direzione che forma l’angolo α con l’asse x. La radiazione proviene da dietro il foglio.
di frequenza Δω centrato intorno alla frequenza ω, il segnale del rivelatore pu` o essere espresso nella forma
ˆ1 (ω, T )∗ E ˆ2 (ω, T )∗ E ˆ1 (ω, T ) + E ˆ2 (ω, T ) , S=K E dove K `e una costante dimensionale che dipende dalla sensibilit`a del rivelatore, dalle unit` a di misura in cui si misura il segnale e dall’ampiezza dell’intervallo di frequenza considerato. Questa formula mostra che, senza ricorrere a ulteriori dispositivi, le uniche misure che si possono realizzare sono quelle del flusso monocromatico FωI . Le misure di polarizzazione si ottengono interponendo sul cammino della radiazione degli opportuni dispositivi che alterano le caratteristiche di polarizzazione della radiazione incidente in maniera nota a priori. Questi dispositivi sono i filtri polarizzanti (o semplicemente polarizzatori) e le lamine di ritardo. I filtri polarizzanti (ideali) godono della propriet` a di essere completamente trasparenti alla radiazione il cui vettore campo elettrico vibri lungo una particolare direzione (detta direzione di accettazione o di trasparenza del filtro) e completamente opachi alla radiazione il cui vettore campo elettrico vibri lungo la direzione a essa perpendicolare. Se si dispone quindi il filtro in modo tale che la direzione di accettazione formi un angolo α con l’asse x (si veda la Fig. 2.8 per le convenzioni adottate), il rivelatore risponder`a con un segnale del tipo ˆp (ω, T )∗ E ˆp (ω, T ) , S(α) = K E
(2.19)
ˆp (ω, T ) `e la trasformata di Fourier della proiezione del campo elettrico dove E lungo l’asse di accettazione del polarizzatore. Con riferimento alla Fig. 2.8, tale trasformata pu` o essere espressa nella forma (ovviamente le trasformate delle componenti di un vettore si trasformano come le componenti stesse per rotazioni del sistema di riferimento) ˆp (ω, T ) = cosα E ˆ1 (ω, T ) + sinα Eˆ2 (ω, T ) , E
42
CAPITOLO 2
per cui si ottiene ˆ1 (ω, T )∗ E ˆ2 (ω, T )∗ E ˆ1 (ω, T ) + sin2 α E ˆ2 (ω, T )+ S(α) = K cos2 α E ˆ2 (ω, T )∗ E ˆ2 (ω, T ) + E ˆ1 (ω, T ) ˆ1 (ω, T )∗ E . + sinα cosα E Invertendo le Eq. (2.16) e sostituendo nell’equazione precedente, il segnale S(α) pu` o essere espresso attraverso i flussi monocromatici nei parametri di Stokes. Si ottiene S(α) = K FωI + cos(2α) FωQ + sin(2α) FωU , dove K `e una nuova costante. Da questa equazione si vede che i flussi monocromatici nei parametri di Stokes Q e U possono essere definiti operativamente mediante le equazioni
FωQ =
1 [S(0◦ ) − S(90◦ )] , 2 K
FωU =
1 [S(45◦ ) − S(135◦)] . 2 K
Il flusso monocromatico nel parametro di Stokes Q, rappresenta quindi la differenza fra il segnale misurato dal rivelatore a valle di un filtro polarizzante orientato sotto l’angolo α = 0◦ (direzione di accettazione coincidente con l’asse x) e il segnale misurato a valle di un filtro polarizzante orientato sotto l’angolo α = 90◦ (direzione di accettazione coincidente con l’asse y). Il significato dell’altro flusso monocromatico, quello nel parametro di Stokes U , `e del tutto analogo con gli angoli di orientazione del polarizzatore sostituiti da 45 ◦ (direzione di accettazione coincidente con la bisettrice degli assi x e y) e 135 ◦ (direzione di accettazione coincidente con la bisettrice degli assi −x e y), rispettivamente. Riguardo al flusso monocromatico nel parametro di Stokes I, si ha 1 [S(α) + S(α + 90◦ )] , 2 K con α qualsiasi. Alternativamente, la stessa quantit` a si pu` o misurare pi` u semplicemente senza interporre alcun filtro polarizzante (ideale). Da questo si vede che il flusso monocromatico nel parametro di Stokes I coincide col flusso monocromatico convenzionale. Le espressioni dedotte precedentemente mostrano che il flusso monocromatico nel parametro di Stokes V non pu` o essere misurato disponendo solamente di un filtro polarizzante. Per la sua misura `e necessario introdurre un ulteriore dispositivo, la lamina di ritardo. In generale, si pu` o definire lamina di ritardo (ideale) un dispositivo che scompone il fascio di radiazione entrante in due fasci distinti, caratterizzati da polarizzazioni diverse, sfasa un fascio rispetto FωI =
SPETTRO E POLARIZZAZIONE
43
all’altro, e ricompone infine in uscita i due fasci per formarne uno nuovo la cui polarizzazione `e diversa dalla polarizzazione del fascio in ingresso. In pratica, una lamina di ritardo pu` o essere realizzata attraverso un cristallo birifrangente caratterizzato da due assi perpendicolari fra loro e perpendicolari al suo asse ottico. Uno dei due assi `e detto asse veloce (fast axis) mentre l’altro `e detto asse lento (slow axis). Le componenti del campo elettrico lungo l’asse veloce e l’asse lento si propagano lungo l’asse ottico con indici di rifrazione diversi, nf e ns , rispettivamente, con ns > nf . Questa differenza fra gli indici di rifrazione provoca all’interno della lamina uno sfasamento (o ritardo) δ tale che, ˆf (ω) e E ˆs (ω) sono le trasformate di Fourier delle componenti del vettore se E campo elettrico lungo i due assi all’ingresso della lamina, le stesse trasformate ˆf (ω) e E ˆs (ω) , sono date (a meno di un fattore di fase all’uscita dalla lamina, E inessenziale) da ˆf (ω) = E ˆf (ω) , E
ˆs (ω) = E ˆs (ω) ei δ , E
dove δ = 2π (ns − nf ) L/λ , essendo L lo spessore geometrico della lamina e λ = 2π c/ω la lunghezza d’onda della radiazione. Se δ = π/2 si dice che si ha a che fare con una lamina a quarto d’onda, se δ = π con una lamina a mezz’onda, e cos`ı via. Si pu` o mostrare facilmente che una lamina a quarto d’onda trasforma un fascio polarizzato circolarmente in un fascio polarizzato linearmente (con direzioni che differiscono di 90 ◦ per polarizzazione circolare destra o sinistra, rispettivamente) e che una lamina a mezz’onda ruota di 90◦ la direzione della polarizzazione lineare (quando tale direzione coincide con la bisettrice dell’angolo compreso fra l’asse veloce e l’asse lento). Si noti inoltre che il ritardo di una lamina dipende fortemente da λ, da cui la difficolt` a che risulta nel costruire delle lamine cosiddette acromatiche (ovvero per le quali il ritardo sia indipendente dalla lunghezza d’onda). Supponiamo adesso di disporre di una lamina a quarto d’onda e inseriamola lungo il fascio in modo che l’asse veloce sia diretto lungo l’asse x. Facciamo poi seguire ad essa il polarizzatore, orientato di nuovo sotto un angolo α come ˆ2 (ω, T ) sono le trasformate di Fourier delle mostrato in Fig. 2.8. Se Eˆ1 (ω, T ) e E componenti del campo elettrico lungo gli assi x e y all’ingresso della lamina, le componenti all’uscita della lamina sono date (a meno di un inessenziale ˆ2 (ω, T ) ei π/2 = i E ˆ2 (ω, T ), rispettivamente. La fattore di fase) da Eˆ1 (ω, T ) e E trasformata di Fourier della proiezione del vettore campo elettrico lungo l’asse di accettazione del polarizzatore `e quindi data da ˆp (ω, T ) = cosα Eˆ1 (ω, T ) + i sinα E ˆ2 (ω, T ) . E Il rivelatore risponder` a con un nuovo segnale, T (α), ancora dato dal secondo membro dell’Eq. (2.19). Con la presente espressione per Eˆp (ω, T ) si ottiene
44
CAPITOLO 2
ˆ2 (ω, T )∗ E ˆ2 (ω, T ) T (α) = K cos2 α Eˆ1 (ω, T )∗ Eˆ1 (ω, T ) + sin2 α E ˆ2 (ω, T )∗ E ˆ2 (ω, T ) + E ˆ1 (ω, T ) ˆ1 (ω, T )∗ E , + i sinα cosα E ovvero, in termini di flussi monocromatici nei parametri di Stokes T (α) = K FωI + cos(2α) FωQ + sin(2α) FωV . Il flusso monocromatico nel parametro di Stokes V pu` o quindi essere definito operativamente dalla relazione 1 [T (45◦ ) − T (135◦)] . 2 K In pratica, le operazioni schematiche che abbiamo descritto per la misura dei flussi nei parametri di Stokes vengono realizzate per mezzo di opportuni strumenti detti polarimetri. Tali strumenti sono realizzati per mezzo di una o pi` u lamine di ritardo e da un polarizzatore di uscita. Quando si intenda eseguire sia l’analisi polarimetrica che l’analisi spettroscopica della radiazione, in genere si fa precedere la prima alla seconda, nel senso che la radiazione traversa il polarimetro prima di entrare nello spettroscopio. Il polarizzatore di uscita del polarimetro viene generalmente tenuto in posizione fissa perch´e un ordinario reticolo di diffrazione `e sensibile in maniera considerevole alla polarizzazione della radiazione che incide su di esso. FωV =
2.7 Propriet` a dei parametri di Stokes Come abbiamo visto nel Par. 2.5, un’onda monocromatica presenta sempre un carattere di polarizzazione ben definito. La cosa cessa di essere valida quando si considera un pennello di radiazione avente carattere stocastico. Per dimostrare questa propriet`a, consideriamo la quantit` a 2 2 2 2 P = FωI − FωQ − FωU − FωV . Sostituendo le espressioni delle Eq. (2.17) relative a un segnale stocastico, e sviluppando i calcoli si ottiene 2 P = 4 c2 Ntot [ f1∗ f1
f2∗ f2 − f1∗ f2
f2∗ f1 ] ,
dove, per non appesantire troppo le notazioni, abbiamo indicato con fi (i = 1, 2) le trasformate di Fourier fˆi (ω). Introduciamo adesso la quantit`a complessa A definita dall’equazione A = f2 f1∗ f1 − f1 f1∗ f2
.
45
SPETTRO E POLARIZZAZIONE
Per la media statistica del suo modulo quadro si ottiene, con facili passaggi |A|2 = f1∗ f1 f1∗ f1
f1∗ f1
e |A| e poich´e le quantit`a diseguaglianza di Cauchy-Schwarz f1∗ f1
2
f2∗ f2 − f1∗ f2
f2∗ f1
,
sono entrambe positive, se ne deduce la
f2∗ f2 − f1∗ f2
f2∗ f1 ≥ 0 ,
la quale, sostituita nell’espressione per P ottenuta precedentemente, implica
FωI
2
2 2 2 − FωQ − FωU − FωV ≥ 0 .
Si noti che il segno di uguaglianza vale soltanto quando la quantit` a A `e nulla, ovvero quando il rapporto fra le trasformate f1 e f2 `e tale da soddisfare l’equazione f1 = f2
f1∗ f1 f1∗ f2
.
In questo caso le trasformate delle due componenti dei segnali elementari lungo gli assi x e y sono caratterizzate dall’avere un rapporto fra le ampiezze costante e una differenza di fase anch’essa costante. Il caso dell’onda monocromatica considerato precedentemente `e un caso particolare di questa situazione. Il caso opposto `e invece quello in cui le trasformate delle due componenti sono caratterizzate dall’avere ampiezze medie uguali f1∗ f1 = f2∗ f2
,
e una relazione di fase aleatoria, dimodoch´e f1∗ f2 = f2∗ f1 = 0 . In questo caso si ha FωQ = FωU = FωV = 0 , e si dice che si ha a che fare con radiazione non polarizzata, oppure con radiazione naturale. Come abbiamo visto, i flussi nei parametri di Stokes necessitano di una direzione di riferimento per la loro definizione. Tale direzione `e arbitraria, dimodoch´e `e sempre necessario specificare chiaramente qual’`e la direzione di riferimento scelta quando si introducono tali quantit` a sia in calcoli teorici che in esperimenti di laboratorio o in osservazioni astronomiche. Nella pratica dell’astronomia notturna, ad esempio, `e invalso l’uso di scegliere come direzione di riferimento il meridiano passante per l’oggetto osservato. In fisica solare, o nell’osservazione di oggetti estesi, si possono scegliere direzioni di riferimento
46
CAPITOLO 2
x
x’
θ y
y’ Fig. 2.9. Una rotazione del sistema di riferimento implica una trasformazione dei flussi nei parametri di Stokes Q e U . La radiazione proviene da dietro il foglio.
diverse, appropriate alla geometria del particolare fenomeno in studio. Ad esempio, quando si osserva la polarizzazione al lembo solare, `e abitudine scegliere come direzione di riferimento la tangente al lembo stesso. Al cambiare del sistema di riferimento, i parametri di Stokes si trasformano mediante semplici relazioni lineari. Per vederlo, riferiamoci alla Fig. 2.9 e siano FωI , FωQ , FωU , FωV i flussi nei parametri di Stokes relativi alla direzione di riferimento x. Se (FωI ) , (FωQ ) , (FωU ) , (FωV ) sono i flussi nei parametri di Stokes relativi alla direzione x , ruotata di un angolo θ rispetto a x (in senso antiorario guardando la sorgente di radiazione), le leggi di trasformazione si trovano facilmente osservando che f1 = cosθf1 + sinθf2 ,
f2 = cosθf2 − sinθf1 .
Sostituendo nelle Eq. (2.17) si ottiene (FωI ) = FωI ,
(FωQ ) = cos(2θ) FωQ + sin(2θ) FωU ,
(FωU ) = cos(2θ) FωU − sin(2θ) FωQ ,
(FωV ) = FωV .
Al cambiare della direzione di riferimento solo i flussi nei parametri di Stokes relativi alla polarizzazione lineare, FωQ e FωU , cambiano, trasformandosi l’uno nell’altro secondo le equazioni precedenti. Gli altri flussi (in intensit` a e in polarizzazione circolare) sono invece invarianti. Si noti che una rotazione di un angolo θ = π lascia tutto inalterato, il che significa che la direzione di riferimento `e definita a meno del senso. Osserviamo infine che, in pratica, i flussi nei parametri di Stokes vengono spesso denotati con i simboli I, Q, U , e V , senza specificare, in molti casi, se essi siano riferiti all’unit` a di intervallo di frequenza (o di frequenza angolare, o di lunghezza d’onda), oppure se siano riferiti, oppure no, all’unit` a di angolo solido. Spesso questo non provoca inconvenienti in quanto i risultati delle misure
SPETTRO E POLARIZZAZIONE
47
polarimetriche vengono generalmente espressi mediante i rapporti Q/I, U/I, e V /I che sono indipendenti da eventuali fattori di proporzionalit`a impliciti nelle diverse definizioni. Per uniformit` a di notazioni, osserviamo semplicemente che il simbolo Iν (e i corrispondenti simboli Qν , Uν e Vν ) dovrebbero essere riservati a esprimere l’energia della radiazione, avente frequenza compresa fra ν e ν +dν, e direzione compresa entro l’angolo solido unitario, che fluisce, nell’unit`a di tempo, attraverso l’unit` a di superficie unitaria disposta perpendicolarmente alla direzione della radiazione.
Capitolo 3
Radiazione di cariche elettriche in moto Una delle conseguenze pi` u importanti delle equazioni di Maxwell `e l’emissione di radiazione elettromagnetica da parte di particelle cariche in moto accelerato. In questo capitolo daremo una descrizione classica di tale fenomeno, mettendone in evidenza le caratteristiche generali riguardo alle sezioni d’urto e alle propriet` a spettrali e polarimetriche della radiazione emessa, sia nel caso di particelle non relativistiche, che nel caso di particelle relativistiche. In particolare descriveremo alcuni processi fisici fondamentali quali la diffusione Thomson e Rayleigh, e daremo una trattazione approfondita della radiazione di frenamento (in approssimazione non relativistica), della radiazione di ciclotrone e di quella di sincrotrone. L’ultima parte del capitolo `e dedicata allo studio dell’irraggiamento dovuto a un numero elevato di particelle e al suo sviluppo in onde multipolari.
3.1 Potenziali elettromagnetici dovuti a cariche e correnti r , t) e il campo maCome abbiamo visto nel Cap. 1, il campo elettrico E( r, t) nel punto di coordinate r e all’istante t possono essere dedotti gnetico B( r, t) e φ(r, t) in tutta generalit` a a partire dai potenziali elettromagnetici A( mediante le equazioni r, t) = −gradφ(r, t) − 1 ∂ A(r, t) , E( c ∂t
r , t) = rotA( r, t) . B(
Qualora si adotti il gauge di Lorenz, i potenziali elettromagnetici soddisfano le equazioni differenziali alle derivate parziali (Eq. (1.8) e (1.9)) r, t) − ∇2 A(
1 ∂2 4π A(r, t) = − j (r, t) , c2 ∂t2 c
(3.1)
∇2 φ(r, t) −
1 ∂2 φ(r, t) = −4π ρ(r, t) , c2 ∂t2
(3.2)
dove ρ(r, t) e j (r, t) sono la densit` a di carica e di corrente, rispettivamente, e la condizione supplementare dell’Eq.(1.7)
50
CAPITOLO 3
1 ∂ φ(r, t) = 0 . (3.3) c ∂t Per trovare la soluzione di questo sistema di equazioni differenziali `e conveniente rifarsi al caso statico. Consideriamo preliminarmente l’equazione statica per il potenziale scalare (equazione di Poisson) r, t) + divA(
∇2 φ(r ) = −4π ρ(r ) ,
(3.4)
e cerchiamo di risolverla per il caso particolare ∇2 φ(r ) = −4π δ(r ) ,
(3.5)
dove δ(r ) `e la funzione di Dirac tridimensionale definita, in coordinate cartesiane, da δ(r ) = δ(x) δ(y) δ(z). Per ovvie ragioni di simmetria, il potenziale φ dipende solo dal modulo del vettore r. In queste circostanze, l’operatore Laplaciano `e dato semplicemente da (si veda l’Eq. (6.7)) 1 d 2 2 d ∇ = 2 r , r dr dr e pu` o anche esprimersi nella forma pi` u compatta 1 d2 r . r dr2 L’equazione differenziale per φ risulta quindi, per r = 0 ∇2 =
(3.6)
1 d2 [ rφ(r) ] = 0 . r dr2 La soluzione pi` u generale di questa equazione `e della forma r φ(r) = a + b r , con a e b costanti arbitrarie, e si ottiene quindi, per r = 0, a +b . r La costante b fissa il valore del potenziale per r → ∞. Assumendo che il potenziale si annulli all’infinito, tale costante risulta nulla, per cui φ(r) =
a . r Per determinare il valore della costante a, si pu` o ricordare che l’operatore Laplaciano `e dato da φ(r) =
∇2 = div grad .
RADIAZIONE DI CARICHE IN MOTO
51
Applicando il teorema di Gauss a una sfera di raggio arbitrario centrata nell’origine e tenendo conto che grad
a a a = − 2 n = − 3 r , r r r
dove n `e il versore di r, si ottiene −4π a = −4π , ovvero a = 1. Abbiamo quindi ottenuto il risultato fondamentale che la soluzione dell’equazione differenziale (3.5) che soddisfa la condizione al contorno di annullarsi per r → ∞ `e φ(r ) =
1 . r
Questo risultato pu`o essere generalizzato per traslazione. Ovviamente, la soluzione dell’equazione ∇2 φ(r ) = −4π δ(r − r ) ,
(3.7)
che soddisfa la medesima condizione al contorno `e φ(r ) =
1 . |r − r |
Se infine osserviamo che si pu`o sempre scrivere ρ(r ) = ρ(r ) δ(r − r ) d3r , per la linearit` a dell’operatore Laplaciano, si ottiene che la soluzione dell’equazione differenziale (3.4) `e la seguente ρ(r ) 3 φ(r ) = d r . |r − r | Il risultato che abbiamo ottenuto `e molto intuitivo dal punto di vista fisico e poteva essere anticipato ricordando che una carica puntiforme, q, genera nello spazio un campo elettrico che discende da un potenziale della forma V = q/r, r essendo la distanza dalla carica. L’espressione data sopra altro non `e che la generalizzazione di quest’ultima formula al caso di una distribuzione continua di cariche. Qui abbiamo preferito darne una prova matematica pi` u formale utilizzando un metodo standard della risoluzione delle equazioni differenziali lineari non omogenee detto metodo della funzione di Green. Ritorniamo adesso al caso dipendente dal tempo e cominciamo col risolvere l’equazione
52
CAPITOLO 3
∇2 φ(r, t) −
1 ∂ φ(r, t) = −4π f (t) δ(r ) , c2 ∂t2
dove f (t) `e una funzione arbitraria del tempo. Come nel caso precedente, la funzione φ, per ovvie ragioni di simmetria, pu` o dipendere soltanto dal modulo del vettore r, oltre che, adesso, dal tempo. Esprimendo l’operatore ∇2 attraverso l’Eq. (3.6), l’equazione per φ(r, t) risulta, per r = 0 1 ∂2 1 ∂2 [ r φ(r, t) ] − 2 2 φ(r, t) = 0 , 2 r ∂r c ∂t ovvero
∂2 1 ∂2 [ r φ(r, t) ] = 0 . − ∂r2 c2 ∂t2
La soluzione pi` u generale di questa equazione `e della forma r φ(r, t) = g(t ± r/c) , dove g `e una funzione arbitraria del proprio argomento, ovvero φ(r, t) =
g(t ± r/c) . r
In analogia a quanto fatto nel caso stazionario, imponiamo la condizione nell’origine applicando il teorema di Gauss a una sfera di raggio infinitesimo. Si ottiene g(t) = f (t) , per cui la soluzione `e della forma φ(r, t) =
f (t ± r/c) . r
Delle due soluzioni che si sono cos`ı ottenute solo una, quella col segno meno, ha significato nel problema fisico che stiamo considerando. Confrontando il risultato del caso dipendente dal tempo con quello ottenuto nel caso statico, vediamo infatti che il potenziale a distanza r dall’origine e al tempo t ha la stessa espressione del potenziale del caso statico corrispondente alla carica f (t − r/c), ovvero alla carica che si trova nell’origine al cosiddetto tempo anticipato, t , definito da t = t −
r . c
Questo risultato trova una sua spiegazione naturale nel fatto che i segnali elettromagnetici si propagano con velocit`a c. La soluzione con il segno pi` u farebbe
RADIAZIONE DI CARICHE IN MOTO
53
intervenire il tempo ritardato, t + r/c, invece del tempo anticipato. Essa non ha un’interpretazione fisica diretta in questo problema e deve essere scartata. Ripetendo gli argomenti svolti nel caso stazionario, si trova che la soluzione dell’equazione differenziale (3.2) `e data dall’espressione ρ(r , t ) 3 φ(r, t) = d r , (3.8) |r − r | dove t `e il tempo anticipato definito da |r − r | . (3.9) c Mediante considerazioni del tutto analoghe, per il potenziale vettore soluzione dell’Eq. (3.1) si ottiene l’espressione j (r , t ) 3 r , t) = 1 A( d r . (3.10) c |r − r | t = t −
Prima di poter accettare le soluzioni date dalle Eq. (3.8) e (3.10) per i potenziali scalare e vettore `e per`o necessario verificare che tali soluzioni soddisfino la condizione imposta dal calibro di Lorenz (Eq. (3.3)). Diamo nel seguito la dimostrazione premettendo che, quando si ha a che fare con funzioni del tipo f (r, t ), oppure f (r , t ) con t tempo anticipato, il simbolo di derivata parziale diventa ambiguo perch´e le variabili r (o r ) e t non sono indipendenti. Se si d` a infatti, ad esempio, una variazione δr a r, si possono considerare alternativamente due tipi diversi di incremento della funzione, δf1 e δf2 , dati da δf1 = f (r + δr, t ) − f (r, t ) ,
δf2 = f (r + δr, t + δt ) − f (r, t ) ,
dove δt `e la variazione di t dovuta al δr. Indicheremo l’operazione di derivazione eseguita con l’incremento δf2 col consueto simbolo “∂” di derivata parziale. Viceversa, l’operazione di derivazione eseguita con l’incremento δf 1 sar` a indicata col simbolo “δ”. Fra le due operazioni di derivazione sussiste la relazione ∂ δ ∂t ∂ f (r, t ) = f (r, t ) + f (r, t ) . ∂xk δxk ∂xk ∂t C’`e da notare che per funzioni che dipendono solo da r (e non dal tempo), i due tipi di derivata, ∂ e δ, coincidono. r, t). Poich´e tale operazione Iniziamo col valutare la divergenza del vettore A( deve essere fatta a t costante, dall’Eq. (3.10) si ha ∂ jk (r , t ) 1 ∂ divA(r, t) = d3r . Ak (r, t) = ∂xk c ∂xk |r − r | k
k
54
CAPITOLO 3
Per valutare questo integrale teniamo conto del fatto che la dipendenza da xk `e contenuta sia nel denominatore che nel numeratore in quanto il tempo anticipato, t , dipende da |r − r | e quindi da xk . Se poi osserviamo che ∂ ∂ |r − r | = − |r − r | , ∂xk ∂xk pu` l’espressione per divA o anche essere posta nella forma r , t) = 1 divA( c
1 ∂ δ jk (r , t ) + − jk (r , t ) d3r . ∂xk |r − r | |r − r | δxk k
Il primo pezzo dell’integrale pu` o essere trasformato, per il teorema di Gauss, in un integrale di superficie. Supponendo che la densit`a di corrente si annulli sufficientemente all’infinito, l’integrale d`a risultato nullo, per cui δ 1 r, t) = 1 divA( jk (r , t ) d3r . c |r − r | δxk k
Valutiamo adesso il secondo termine della condizione di Lorenz. Per l’Eq.(3.8) si ha 1 ∂ ρ(r , t ) 3 1 ∂ φ(r, t) = d r . c ∂t c ∂t |r − r | Se adesso teniamo conto che, a r e r fissati, si ha ∂ ∂ ρ(r , t ) = ρ(r , t ) , ∂t ∂t si ottiene 1 ∂ φ(r, t) = c ∂t δ 1 1 ∂ = jk (r , t ) + ρ(r , t ) d3r . c |r − r | δxk ∂t
r , t) + divA(
(3.11)
k
D’altra parte, l’equazione di continuit` a della carica, scritta per il punto di coordinate r e l’istante t , risulta, nelle notazioni che abbiamo introdotto, δ ∂ jk (r , t ) + ρ(r , t ) = 0 , δxk ∂t k
per cui la parentesi graffa contenuta nell’Eq. (3.11) si annulla e la condizione di Lorenz risulta verificata.
55
RADIAZIONE DI CARICHE IN MOTO
3.2 I potenziali di Li´ enard e Wiechart Nel paragrafo precedente abbiamo trovato le espressioni dei potenziali scalare e vettore per una distribuzione arbitraria di cariche e correnti. Adesso andiamo ad applicare tali espressioni al caso particolare in cui sia presente una sola particella puntiforme, di carica e, mobile nel tempo secondo l’equazione oraria r0 (t). Per il moto della particella definiamo i vettori velocit`a e accelerazione secondo le consuete equazioni v (t) =
d r0 (t) , dt
a(t) =
d2 d v (t) = 2 r0 (t) . dt dt
Le densit` a di carica e corrente dovute alla particella puntiforme possono essere espresse in termini della funzione delta di Dirac tridimensionale. Si ha ρ(r, t) = e δ[ r − r0 (t)] ,
j (r, t) = e v (t) δ[ r − r0 (t)] ,
e si ottiene quindi, dalle Eq. (3.8) e (3.10) φ(r, t) = e
δ[r − r0 (t )] 3 d r , |r − r |
r, t) = e A( c
v (t ) δ[r − r0 (t )] 3 d r , |r − r |
dove t `e il tempo anticipato definito dall’Eq. (3.9). La presenza della funzione delta di Dirac permette di valutare facilmente gli integrali contenuti nelle espressioni precedenti. Ricordiamo che date due funzioni arbitrarie f (x) e g(x), per la funzione delta di Dirac unidimensionale si ha (si veda anche l’App. 3)
∞
f (x) δ[g(x)] dx = −∞
N
f (xi )
i=1
1 |g (xi )|
,
dove xi , con i = 1, . . . , N , sono le N soluzioni dell’equazione g(x) = 0 e dove g (x) `e la derivata della funzione g(x) rispetto alla variabile x. Per la delta di Dirac tridimensionale, l’equazione precedente si generalizza nella seguente espressione f (r ) δ[g(r )] d3r =
N
f (ri )
i=1
1 , |J(ri )|
dove ri , con i = 1, . . . , N , sono le N soluzioni dell’equazione vettoriale g (r ) = 0, e dove J `e lo Jacobiano della trasformazione r = g(r ), ovvero il determinante della matrice Jacobiana Jkl (r ) definita da Jkl (r ) =
∂gk (r ) . ∂xl
56
CAPITOLO 3
Punto in cui si calcola il campo all’istante t z
r
R = r −r 0(t’) Traiettoria y
n a
r 0 (t’) v x
Particella carica all’istante anticipato t’ Fig. 3.1. Geometria per il calcolo del campo elettromagnetico nel punto di coordinate r all’istante t. I vettori v e a sono, rispettivamente, la velocit` a e l’accelerazione della particella all’istante anticipato. Il versore n ` e diretto lungo la direzione che va dalla posizione della particella all’istante anticipato al punto in cui si calcola il campo.
Ritornando agli integrali che ci interessa calcolare, osserviamo preliminarmente che, dato che la velocit`a della particella `e necessariamente minore di c, l’equazione r − r0 (t ) = 0 ammette, a r e t fissati, una e una sola soluzione, schematicamente illustrata nella Fig. 3.1. Per non appesantire troppo il formalismo con nuove notazioni, indicheremo con r e con t il punto e l’istante corrispondenti a tale soluzione. Per quanto concerne la matrice Jacobiana, si ha Jjk =
∂ ∂ xj − [r0 (t )]j = δjk − [r0 (t )]j . ∂xk ∂xk
Tenendo conto della definizione del tempo anticipato (Eq. (3.9)) si ottiene ∂ ∂t ∂ vj ∂ [ r (t )] = [ r (t )] =− |r − r | , 0 j 0 j ∂xk ∂t ∂xk c xk dove vj `e la componente j-esima della velocit`a della particella valutata all’istante t . Per calcolare l’ultima derivata, posto = r − r , R
57
RADIAZIONE DI CARICHE IN MOTO
si ha ∂Ri = −δik , ∂xk per cui ∂ 2 ∂ R = ∂xk ∂xk
Ri Ri
= −2Rk ,
i
e quindi ∂ ∂ √ 2 Rk = −nk , R= R =− ∂xk ∂xk R dove abbiamo introdotto il versore n per indicare la direzione del vettore R. Tenendo conto di questo risultato, la matrice Jacobiana risulta Jjk = δjk −
vj nk . c
Possiamo adesso calcolare lo Jacobiano. Si ha ⎛
vx nx c ⎜ vy nx ⎜ J = det ⎜ − c ⎝ vz nx − c e, con semplici passaggi algebrici, 1−
vx ny − c vy ny 1− c vz ny − c
J =1−
vx nz − c vy nz − c vz nz 1− c
⎞ ⎟ ⎟ ⎟ , ⎠
v · n . c
La sostituzione di questi risultati negli integrali contenenti le delte di Dirac porta alle seguenti espressioni per i potenziali φ(r, t) =
e , κR
r, t) = e v , A( cκR
(3.12)
v · n , c
(3.13)
dove si `e posto κ=1−
e dove tutte le quantit` a che compaiono in queste equazioni, ovvero v , R, n, κ vanno valutate all’istante anticipato t soluzione dell’equazione implicita t = t −
|r − r0 (t )| . c
(3.14)
58
CAPITOLO 3
v
Fig. 3.2. I segnali emessi da una sorgente in movimento a tempi successivi, qui rappresentati sotto forma di onde sferiche, si infittiscono nella direzione della velocit` a e si diradano nella direzione opposta. In ogni caso, essendo la velocit` a v minore di c, ciascuna onda sferica contiene tutte quelle emesse a tempi successivi. Questa `e la ragione per cui l’Eq. (3.14) ammette una sola soluzione.
I potenziali che abbiamo ottenuto prendono il nome di potenziali di Li´enard e Wiechart. Essi fanno comparire nella loro espressione il fattore 1/κ che, come vedremo, `e di importanza fondamentale nel determinare le propriet`a di irraggiamento delle cariche in movimento. Il significato fisico di tale fattore pu` o essere intuitivamente compreso osservando che i segnali emessi da una sorgente in movimento si infittiscono nella direzione della velocit`a e si diradano nella direzione opposta, come esemplificato nella Fig. 3.2. Infine, `e interessante osservare che, nel caso statico, il potenziale scalare di Li´enard e Wiechart si riduce al potenziale dell’elettrostatica (in quanto κ = 1), mentre il potenziale vettore `e nullo, essendo v = 0.
3.3 Campo elettromagnetico di una carica in moto Il campo elettrico e il campo magnetico dovuti, nel punto di coordinate r e all’istante t, a una particella puntiforme di carica e mobile con legge oraria r0 (t), si ottengono applicando ai potenziali di Li´enard e Wiechart le equazioni generali che definiscono i potenziali scalare e vettore, ovvero r, t) = rotA( r , t) , B(
(3.15)
r, t) = −gradφ(r, t) − 1 ∂ A( r, t) . E( c ∂t
(3.16)
RADIAZIONE DI CARICHE IN MOTO
59
La determinazione dei campi risulta quindi un banale esercizio di derivazione. Tale esercizio presenta per`o alcune sottili difficolt` a matematiche che `e necessario illustrare in dettaglio. Cominciamo con l’osservare che i potenziali di Li´enard e Wiechart contengono al denominatore l’espressione κR e che tale espressione pu`o essere posta nella forma κR =
v · n v · R 1− R=R− . c c
Osserviamo inoltre che, dato un vettore della forma = xa − xb , X con xa e xb funzioni di un parametro arbitrario ζ, si ha ∂xb ∂ ∂xa − , X= ∂ζ ∂ζ ∂ζ per cui ∂xb ∂ 2 ∂xa X = 2X · − , ∂ζ ∂ζ ∂ζ con la notazione vers(X), si ha e quindi, introducendo il versore del vettore X ∂ ∂ √ 2 1 · ∂xa − ∂xb = vers(X) · ∂xa − ∂xb . X= 2X X = ∂ζ ∂ζ 2X ∂ζ ∂ζ ∂ζ ∂ζ Utilizzando questo risultato, si ottengono facilmente le espressioni sotto riportate ∂R = −n · v , ∂t
∂t 1 ∂R n · v =κ , =1+ =1− ∂t c ∂t c
∂t 1 1 v = , grad [ r0 (t ) ] = −[ gradR ] . = ∂t ∂t κ c ∂t Per l’ultima equazione, si ha infatti ∂ ∂ ∂t [r0 (t )]j = [r0 (t )]j = ∂xi ∂t ∂xi vj ∂R R ∂ =− = vj t− . ∂xi c c ∂xi
{grad [ r0 (t ) ]}ij =
D’altra parte,
60
CAPITOLO 3
gradR = grad| r − r0 (t ) | = n − grad [ r0 (t ) ] · n = n + [gradR]
v · n , c
dalla quale si ottiene n , κ che permette di riscrivere l’equazione per il gradiente di r0 (t ) nella forma gradR =
grad [r0 (t )] = −
n v . κc
Si ha inoltre = grad [ r − r0 (t ) ] = U + gradR
n v , κc
dove U `e il tensore unitario (Uij = δij ), e ancora 1 n R = − gradR = − , grad t = grad t − c c κc grad v = (grad t )
∂v n a , =− ∂t κc
∂R ∂R ∂t v · n = =− , ∂t ∂t ∂t κ
∂t ∂R ∂R v ∂v ∂v ∂t a = =− , = = , ∂t ∂t ∂t κ ∂t ∂t ∂t κ dove a `e l’accelerazione della particella al tempo anticipato t . Attraverso queste relazioni `e facile esprimere sia il gradiente che la derivata temporale del prodotto κR. Si ha
v · R grad(κR) = grad R − c
= gradR −
1 − 1 gradR · v , (gradv ) · R c c
ovvero n 1 v v 2 n v 2 n v 1 ) n , grad(κR) = + 2 (a · R ) n − − 2 = 1 − 2 − + (a · R κ c κ c c κ c κ c c2 κ 2 ∂ ∂ v · R n · v 1 + v . (κR) = R− =− − a · R ∂t ∂t c κ cκ cκ Siamo adesso in grado di calcolare il campo elettrico. Attraverso le Eq. (3.16) e (3.12) si ottiene
61
RADIAZIONE DI CARICHE IN MOTO
r , t) = −e grad E(
1 κR
e ∂ − 2 c ∂t
v κR
,
ovvero, r , t) = E(
e κ2 R 2
grad(κR) −
e c2 κ R
∂ ∂v e v + 2 2 2 (κR) . ∂t c κ R ∂t
Sostituendo le espressioni trovate precedentemente si ottiene infine v 2 n v 1 r , t) = e ) n − e a 1 − E( ( a · R − + κ2 R 2 c2 κ c κ c2 c2 κ 2 R 1 v2 n · v e v − a · R + . + 2 2 2 − c κ R κ κc κc L’espressione del campo elettrico contiene vari addendi di cui alcuni proporzionali a R−2 e altri proporzionale a R−1 . Raccogliendo i primi si ottiene il cosiddetto termine Coulombiano, talvolta anche detto termine di velocit` a, che generalizza alle cariche in movimento l’usuale espressione del campo Coulombiano dell’elettrostatica. Raccogliendo gli altri termini si ottiene invece il cosiddetto termine di radiazione, talvolta detto anche termine di accelerazione r , t)]Coul perch´e proporzionale all’accelerazione della carica. Indicando con [E( e [E(r, t)]rad i due contributi, per mezzo di semplici fattorizzazioni si ottiene n · v v2 v2 v e [E(r, t)]Coul = 3 2 κ+ − 2 1 − 2 n − , κ R c c c c ovvero, ricordando l’espressione di κ (Eq. (3.13)) v2 v r , t)]Coul = e [E( . 1 − n − κ3 R 2 c2 c
(3.17)
Analogamente r , t)]rad = [E(
e c2 κ 3 R
v n − (a · n ) − κ a , c
ovvero, come `e facile verificare, r , t)]rad = [E(
e n × c2 κ 3 R
v n − × a . c
(3.18)
L’espressione per il campo elettrico pu`o essere posta in forma alternativa introducendo le notazioni tipiche della meccanica relativistica. Definendo v β = , c
a ˙ β = , c
62
CAPITOLO 3
si ottiene
r , t) = E(
e κ3 R 2
)+ (1 − β 2 ) (n − β
e ˙ n × [(n − β ) × β ] . c κ3 R
(3.19)
L’espressione per il campo magnetico discende da calcoli simili. Attraverso le Eq. (3.15) e (3.12) si ha e v e e 1 B(r, t) = rot = rotv + grad × v . c κR c κR c κR D’altra parte, si ha rotv = [grad t ] × a = −
1 n × a , cκ
e quindi, utilizzando risultati precedenti
r , t) = − B(
e e n × a − 2 2 2 c κ R c κ R2
1 v 2 n v − + 2 (a · R ) n × v . 1− 2 c κ c c κ
In analogia a quanto fatto per il campo elettrico, separiamo nel secondo membro i termini proporzionali a R−2 da quelli proporzionali a R−1 . Si ottiene
r , t) = − B(
e c κ3 R 2
v v2 e κ n × a + (a · n ) n × . 1 − 2 n × v − 2 3 c c κ R c
e β˙ questa espressione pu`o essere posta nella forma In termini dei vettori β
r , t) = − B(
e 2 ˙ − (n · β ) n × β˙ + (β ˙ · n ) n × β , − e n × β (1−β ) n × β κ3 R 2 c κ3 R
ovvero, come `e facile verificare
r , t) = − B(
! e 2 ˙ + n × n × (β ×β ˙ ) − e n × β . (1 − β ) n × β κ3 R 2 c κ3 R
Attraverso questa espressione, e attraverso l’espressione che abbiamo prece r , t) (Eq. (3.19)), `e facile dimostrare la relazione dentemente trovato per E( notevole r , t) = n × E( r , t) , B(
(3.20)
RADIAZIONE DI CARICHE IN MOTO
63
la quale mostra che il modulo del vettore campo magnetico `e sempre minore o uguale al modulo del vettore campo elettrico. Notiamo infine che le Eq. (3.19) e (3.20) sono estremamente generali e, data l’invarianza relativistica delle equazioni di Maxwell, dalle quali siamo partiti per la loro deduzione, sono valide in un sistema di riferimento inerziale arbitrario. Considerandone il limite non relativistico al primo ordine in β, `e possibile mostrare che da esse si ottengono le ordinarie leggi dell’elettromagnetismo valide per fenomeni stazionari. La deduzione di questa propriet`a `e contenuta nell’App. 4.
3.4 Irraggiamento di una carica in moto Come abbiamo visto nel paragrafo precedente, il campo elettromagnetico prodotto da una carica in movimento consta di due termini, uno inversamente proporzionale a R2 e l’altro inversamente proporzionale a R. Ovviamente, il primo termine prevale per R tendente a zero, mentre il secondo termine prevale ` interessante calcolare il valore di R per il quale i per R tendente all’infinito. E due termini sono dello stesso ordine di grandezza. Indicando con Rc tale valore, si ha per esso e κ3 Rc2
ea c2 κ3 Rc
,
ovvero c2 . a Indicando con L le dimensioni tipiche della regione in cui si muove la carica e con τ il tempo caratteristico su cui avvengono variazioni significative del moto, si ha Rc
a
L , τ2
per cui c2 τ 2 . L D’altra parte, come vedremo meglio in seguito, la stessa carica irradia a frequenze caratteristiche ν c/τ , per cui la distanza critica Rc pu` o anche porsi nella forma λ2 /L, dove λ `e la lunghezza d’onda tipica della radiazione irraggiata dalla carica in moto. La regione dello spazio in cui R Rc viene detta la zona di radiazione. In tale zona il campo elettromagnetico `e dato dalle Eq. (3.18) e (3.20) che qui riscriviamo Rc
64
CAPITOLO 3
r , t) = E(
e n × c2 κ 3 R
v n − × a , c
r , t) = n × E( r , t) . B(
Bisogna ricordare a proposito di queste equazioni che le quantit` a R, κ, n, v e a che ivi compaiono devono essere valutate al tempo anticipato t . Tuttavia, quando ci si ponga a grande distanza dalla carica stessa, ovverosia quando sia verificata la diseguaglianza R L, si pu` o trascurare l’effetto del tempo anticipato sia sulla distanza R che sul versore n ed entrambe queste quantit` a possono quindi essere considerate costanti. Il primo fatto da osservare a proposito dei campi elettrico e magnetico nella zona di radiazione `e che essi sono perpendicolari fra loro, sono entrambi perpendicolari al versore n e sono uguali in modulo. Questa `e una caratteristica che abbiamo gi` a incontrato nel Par. 1.6 per le onde piane che si propagano nel che `e dato da vuoto. Il secondo fatto concerne il vettore di Poynting, S, = c E ×B = c E × (n × E) = c E 2 n . S 4π 4π 4π Il vettore di Poynting nel punto P `e quindi diretto secondo la direzione che va dalla carica al punto P stesso. Consideriamo adesso il caso non relativistico in cui v c. Quando questa diseguaglianza `e verificata, il campo elettrico, all’ordine pi` u basso in v/c, `e dato da r , t) = e n × [ n × a ] = − e [ a − (a · n ) n ] . E( c2 R c2 R Come risulta da questa espressione, il campo elettrico `e diretto perpendicolarmente a n e giace nel piano individuato da n e da a, l’accelerazione della particella al tempo anticipato. Se si desidera quindi calcolare la componente del vettore campo elettrico lungo un versore di polarizzazione ei (i = 1, 2) perpendicolare a n, si ha r , t) · ei = − e a · ei . E( c2 R
(3.21)
Inoltre, indicando con θ l’angolo compreso fra la direzione dell’accelerazione (all’istante anticipato) e la direzione n, si ha per il vettore di Poynting a distanza R dalla carica 2 2 2 = e a sin θ n . S 3 4π c R2
Questa equazione mostra che la potenza emessa dalla carica in movimento dipende dalla direzione come sin2 θ. Quando si riporta in grafico, per ogni direzione, un segmento proporzionale alla potenza emessa lungo la direzione stessa,
RADIAZIONE DI CARICHE IN MOTO
65
Fig. 3.3. Diagramma di radiazione (o diagramma d’antenna) di una particella non relativistica. L’accelerazione della particella ` e diretta lungo l’asse verticale. La potenza emessa lungo una direzione che forma l’angolo θ con l’accelerazione `e proporzionale al segmento disegnato in figura.
si ottiene un diagramma che `e detto diagramma di radiazione. Il diagramma relativo a una carica (non relativistica) accelerata `e mostrato nella Fig. 3.3. pu` La stessa equazione per S o essere utilizzata per trovare la potenza totale emessa dalla carica. Calcolando il flusso W del vettore di Poynting attraverso una sfera di raggio R, e tenendo conto che " 1 2 sin2 θ dΩ = , 4π 3 si ottiene la cosiddetta equazione (o formula) di Larmor 2 e 2 a2 . (3.22) 3 c3 Ritornando al caso generale, `e interessante osservare la presenza di un importante fenomeno fisico dovuto alla presenza del fattore 1/κ3 nelle espressioni trovate per il campo di radiazione. Se consideriamo, per semplicit` a, il caso di una carica la cui accelerazione sia parallela alla velocit`a, il vettore di Poynting, alla distanza R dalla carica e nella direzione individuata dal versore n, `e dato da W =
2 2 2 e2 a2 sin2 θ = e a sin θ n = S n , 4π c3 κ6 R2 4π c3 (1 − β cosθ)6 R2
dove β = v/c e dove θ `e l’angolo compreso fra n e la direzione della velocit`a (che coincide, a parte eventualmente il senso, con quella dell’accelerazione). Per
66
CAPITOLO 3
Fig. 3.4. Diagramma di radiazione di una particella relativistica avente β = 0.8. Sia l’accelerazione che la velocit` a della particella sono dirette lungo l’asse verticale, quest’ultima nel senso che va dal basso verso l’alto. La potenza emessa lungo una direzione che forma l’angolo θ con l’accelerazione (e la velocit` a) ` e proporzionale al segmento disegnato in figura.
valori di β diversi da zero, il diagramma di radiazione risulta profondamente modificato rispetto al diagramma di radiazione del caso non relativistico, come illustrato nella Fig. 3.4. La radiazione tende a concentrarsi nella direzione “in avanti” rispetto al moto della particella. Questo `e un tipico effetto relativistico, conosciuto sotto il nome di beaming effect, che diventa sempre pi` u cospicuo mano a mano che la velocit` a della particella si avvicina alla velocit` a della luce. L’ampiezza angolare del cono entro il quale si concentra la radiazione si pu`o stimare osservando che, per β 1, il fattore 1/κ presenta un massimo molto elevato per θ = 0. Ponendo, nell’intorno di θ = 0, cosθ 1 − θ 2/2, si ha 1 1 1 . 2 κ 1 − β + β θ /2 1 − β + θ2/2 Questa espressione pu`o anche essere posta nella forma 1 2 , 2 κ θ + θ02 dove si `e introdotto l’angolo θ0 dato da # θ0 = 2 (1 − β) . Ricordando l’espressione del fattore relativistico γ (fattore di Lorentz), dato da 1 , γ= # 1 − β2
RADIAZIONE DI CARICHE IN MOTO
67
Fig. 3.5. Diagramma di radiazione di una particella relativistica avente β = 0.8. L’accelerazione ` e diretta lungo l’asse verticale, mentre la velocit` a` e diretta lungo l’asse orizzontale, da sinistra verso destra. La potenza emessa lungo una direzione, appartenente al piano che contiene velocit` a e accelerazione (φ = 0) e formante l’angolo θ con l’accelerazione, `e proporzionale al segmento disegnato in figura.
si ha, per il caso ultra-relativistico 1 1 # , γ= # (1 − β)(1 + β) 2(1 − β) per cui si ottiene θ0
1 . γ
Il valore θ0 `e proprio l’ampiezza angolare del cono nel quale viene concentrata la radiazione. Mano a mano che aumenta l’energia della particella, e quindi il fattore γ, l’ampiezza del cono diventa sempre pi` u piccola. Nel caso in cui l’accelerazione `e perpendicolare alla velocit` a, il calcolo del vettore di Poynting `e pi` u complicato e si perde la simmetria cilindrica. Introducendo un sistema di coordinate in cui l’accelerazione `e diretta lungo l’asse z e la velocit` a lungo l’asse x e indicando con θ e φ le coordinate polari della direzione n, si ottiene per il vettore di Poynting in tale direzione
= S
4π c3
e 2 a2 (1 − β sinθ cosφ)2 − (1 − β 2 ) cos2 θ n . 6 2 (1 − β sinθ cosφ) R
Il corrispondente diagramma di radiazione, relativo al piano contenente i vettori velocit`a e accelerazione (φ = 0), `e mostrato nella Fig. 3.5.
68
CAPITOLO 3
Infine, nel caso generale in cui l’accelerazione non sia n´e parallela n´e perpendicolare alla velocit` a, l’espressione del vettore di Poynting diviene ancora pi` u complicata. Essa `e riportata nell’App. 5, nella quale `e anche dimostrata la generalizzazione dell’equazione di Larmor per la potenza emessa da una carica relativistica, che risulta. 2 e2 6 2 (γ a + γ 4 a2⊥ ) , (3.23) 3 c3 dove a e a⊥ sono rispettivamente le componenti dell’accelerazione in direzione parallela e perpendicolare alla velocit` a. Come `e facile verificare, nel caso non relativistico in cui β 1, γ 1, essendo a2 + a2⊥ = a2 , si riottiene l’usuale espressione (3.22) dell’equazione di Larmor. W =
3.5 La diffusione Thomson Si consideri un elettrone libero di carica e = −e0 , con e0 = 4.803×10−10 u.e.s., e si supponga che l’elettrone sia soggetto all’azione di un’onda elettromagnetica polarizzata, di frequenza ω, che si propaga lungo la direzione n . Definita una coppia di versori e1 e e2 tali da formare con n una terna destrorsa come in Fig. 3.6, siano E1 e E2 le componenti complesse del vettore campo elettrico dell’onda lungo tali versori. Il moto dell’elettrone, che supponiamo non relativistico, `e descritto dall’equazione e0 E (t) , m (t), il campo elettrico dell’onda dove m `e la massa dell’elettrone e dove E incidente, `e dato da (t) = Re E e−i ω t = Re (E e + E e ) e−i ω t . E 1 1 2 2 a(t) = −
Siamo interessati a determinare l’espressione del campo elettrico emesso dall’elettrone nella zona di radiazione lungo la direzione individuata dal versore n di Fig. 3.6. Introducendo i due versori e1 e e2 (tali da formare con n una terna destrorsa) e utilizzando notazioni complesse, le componenti dell’accelerazione lungo tali versori sono date da A1 = −
e0 e1 · (E1 e1 + E2 e2 ) , m
A2 = −
e0 e2 · (E1 e1 + E2 e2 ) , m
`e implicitamente definito dall’equazione dove il vettore complesso A e−i ω t . a(t) = Re A
(3.24)
69
RADIAZIONE DI CARICHE IN MOTO
elettrone diffondente e1 e2
e’1
n
n’ e’2 Fig. 3.6. Geometria della diffusione Thomson nel caso generale. La scelta dei versori di polarizzazione `e arbitraria.
Tenendo conto dell’Eq. (3.21), le componenti, E1 e E2 , del campo di radiazione alla distanza R e nella direzione n sono date, in forma matriciale, dalle espressioni rc e1 · e1 e1 · e2 E1 E1 =− eiΦ , (3.25) E2 E2 R e2 · e1 e2 · e2 dove Φ = ωR/c `e un fattore di fase inessenziale introdotto dal ritardo, e dove rc , il cosiddetto raggio classico dell’elettrone, `e definito da e20 = 2.818 × 10−13 cm . (3.26) m c2 L’espressione che abbiamo ottenuto `e la legge della diffusione Thomson in termini di campi elettrici. Essa raccoglie tutte le propriet`a, spettrali, direzionali, e polarimetriche della radiazione diffusa, oltre alle propriet` a generali relative alla sezione d’urto. Dal punto di vista spettrale si ha semplicemente che l’elettrone oscilla alla stessa frequenza, ω, della radiazione incidente. La radiazione diffusa `e quindi, come si suol dire, coerente, ovvero lo spettro `e del tipo di una delta di Dirac centrata alla medesima frequenza ω. Per analizzare i risultati relativi al diagramma di radiazione e alla polarizzazione `e conveniente scegliere in maniera adeguata i versori di polarizzazione. Con la scelta schematizzata nella Fig. 3.7, la matrice 2 × 2 che compare nell’Eq. (3.25) si semplifica notevolmente e risulta 1 0 , 0 cosΘ rc =
dove Θ `e l’angolo di diffusione. Possiamo adesso passare a descrivere il processo di diffusione in termini di flussi nei parametri di Stokes. Per questo, bisogna ricordare le espressioni del Cap. 2, in particolare le Eq. (2.14), che collegano fra loro i flussi nei parametri di Stokes con le componenti del campo elettrico. Indicando con (FI , FQ , FU , FV )†
70
CAPITOLO 3
e’1
elettrone diffondente n’
e’2
Θ e1
Piano di diffusione
e2
n
Fig. 3.7. Caso particolare della geometria della diffusione Thomson. I versori di polarizzazione e1 e e1 sono perpendicolari al piano contenente le direzioni della radiazione incidente e diffusa (piano di diffusione), mentre e2 e e2 giacciono nel piano stesso.
il vettore di Stokes relativo alla radiazione incidente e con (FI , FQ , FU , FV )† quello relativo alla radiazione diffusa, con semplici passaggi algebrici si ottiene la seguente equazione matriciale ⎛
⎞ FI ⎜ F ⎟ 1 r2 ⎜ Q⎟ c ⎜ ⎟= ⎝ FU ⎠ 2 R2 FV
⎛
⎞⎛ ⎞ 1 + cos2 Θ FI sin2 Θ 0 0 ⎜ sin2 Θ ⎟⎜F ⎟ 2 1 + cos Θ 0 0 ⎜ ⎟⎜ Q⎟ ⎜ ⎟ . (3.27) ⎟⎜ ⎝ 0 0 2 cosΘ 0 ⎠ ⎝ FU ⎠ FV 0 0 0 2 cosΘ
In particolare, per la diffusione sotto l’angolo Θ di un raggio non polarizzato, si ottiene, per i flussi non nulli rc2 r2 (1 + cos2 Θ) FI , FQ (Θ) = c 2 sin2 Θ FI . 2 2R 2R Queste equazioni mostrano che la radiazione `e diffusa prevalentemente in avanti (o indietro) rispetto alla direzione della radiazione incidente. Il rapporto R fra la radiazione diffusa in direzione Θ e quella diffusa in avanti `e dato dall’equazione FI (Θ) =
1 + cos2 Θ , 2 e varia fra 1 e 1/2. Inoltre, la radiazione diffusa `e polarizzata linearmente e la frazione di polarizzazione `e data da R=
FQ (Θ) sin2 Θ = , FI (Θ) 1 + cos2 Θ il che implica che la polarizzazione lineare `e sempre positiva, ovvero perpendicolare al piano di diffusione, e che la radiazione `e polarizzata al 100% per
RADIAZIONE DI CARICHE IN MOTO
71
Θ = 90◦ . Inoltre, integrando l’intensit` a della radiazione diffusa su una sfera di raggio R si ottiene (si ricordi che la media di cos2 Θ sull’angolo solido vale 1/3) " W = R2 FI (θ) dΩ = σT FI , dove σT , la cosiddetta sezione d’urto Thomson, `e data da σT =
8π 2 8π e40 rc = = 6.652 × 10−25 cm2 . 3 3 m 2 c4
3.6 La diffusione Rayleigh La diffusione Rayleigh `e del tutto simile alla diffusione Thomson, con la sola differenza che l’elettrone, invece di essere libero, `e legato a un atomo o a una molecola. Dal punto di vista della fisica classica, l’elettrone legato pu`o essere descritto per mezzo di un semplice modello, dovuto a Lorentz, secondo il quale si suppone che l’azione sull’elettrone della nuvola di carica positiva presente nell’atomo possa essere schematizzata come una forza di richiamo elastica della forma F = −k x, dove k `e una costante e x `e la posizione dell’elettrone rispetto al centro di gravit`a delle cariche positive. La legge di moto dell’elettrone legato sotto l’azione di un campo elettrico di frequenza ω `e quindi
dove ω0 =
# k/m, e dove
d2 x e0 = −ω02 x − E (t) , dt2 m
(t) = Re( E e−i ω t ) . E L’equazione differenziale si risolve facilmente cercando una soluzione stazionaria del tipo x(t) = x0 e−i ω t . Trovata la soluzione, si determina poi l’accelerazione derivando due volte rispetto al tempo. Il risultato per le componenti dell’accelerazione (complessa) lungo i due versori e1 e e2 di Fig. 3.6 `e il seguente
A1 = −
e0 ω 2 e1 ·(E1 e1 +E2 e2 ) , m ω 2 − ω02
A2 = −
e0 ω 2 e2 ·(E1 e1 +E2 e2 ) . m ω 2 − ω02
Questa espressione `e molto simile a quella che abbiamo ottenuto precedentemente per la diffusione Thomson (Eq. (3.24)) e, come `e logico attendersi, si riduce alla precedente per ω0 = 0 (caso dell’elettrone libero). Ripetendo gli stessi ragionamenti di quelli sviluppati nel paragrafo precedente, si ottengono esattamente gli stessi risultati con la sola differenza che la sezione d’urto
72
CAPITOLO 3
Thomson, σT , deve essere sostituita con la sezione d’urto Rayleigh, σR , definita da σR =
(ω 2
8π 2 ω4 ω4 r . σT = 2 2 2 − ω0 ) (ω − ω02 )2 3 c
Un aspetto importante della diffusione Rayleigh `e il fatto che, per ω0 ω, la sezione d’urto risulta proporzionale a ω 4 . Dato che questa `e una buona approssimazione per la radiazione visibile diffusa dalle molecole di Azoto e Ossigeno, i costituenti pi` u abbondanti dell’atmosfera terrestre, e dato che la luce del cielo non `e altro che luce solare diffusa da tali molecole, ne segue che il cielo `e di colore azzurro1. Per la stessa ragione, il Sole (e gli altri astri) appaiono di colore rosso al sorgere e al tramontare.
3.7 La radiazione di frenamento Si d` a il nome di radiazione di frenamento (Bremsstrahlung in lingua tedesca) a quella radiazione che viene emessa quando una particella carica di alta velocit`a (tipicamente un elettrone) viene deviata passando nel campo Coulombiano generato da un’altra particella (in genere un nucleo atomico). In questo processo la carica viene accelerata e risulta quindi frenata perdendo energia per irraggiamento. La radiazione di frenamento `e un processo fisico fondamentale dei plasmi astrofisici. Essa trova anche vaste applicazioni tecnologiche e di laboratorio. La radiazione a raggi X che proviene dalle sorgenti comunemente utilizzate sia nei laboratori di ricerca sia, come strumento diagnostico e terapeutico, nelle strutture sanitarie nient’altro `e se non radiazione di frenamento, generalmente prodotta accelerando elettroni per mezzo di alte differenze di potenziale e facendoli urtare contro una lastra metallica ad alto Z. Sebbene lo studio dettagliato della radiazione di frenamento richieda una trattazione quantistica, qui lo affronteremo dal punto di vista classico, sottolineando solo alla fine della trattazione l’influenza che i fenomeni quantistici possono avere sui risultati ottenuti. Per fissare le idee, consideriamo un fascio unidirezionale di elettroni non relativistici che urtano contro dei nuclei pesanti (ovvero di massa molto maggiore di quella degli elettroni) e proponiamoci di esaminare le caratteristiche spettrali, geometriche e polarimetriche della radiazione emessa in tale processo. Con riferimento alla Fig. 3.8 sia v la velocit`a dell’elettrone che transita in vicinanza di un nucleo di carica Ze0 . Indichiamo con m la massa dell’elettrone e con b il suo parametro d’urto e supponiamo che l’elettrone sia sufficientemente veloce da poter trascurare la deviazione della 1
La radiazione di colore azzurro (4000 ˚ A) ` e diffusa con una sezione d’urto circa 10 volte maggiore rispetto a quella di colore rosso (7000 ˚ A).
73
RADIAZIONE DI CARICHE IN MOTO
z e1 e2
n
θ nucleo
ϕ b
y
χ traiettoria della particella
x
Fig. 3.8. Geometria per il calcolo della radiazione di frenamento.
sua traiettoria rispetto alla linea retta. Questo `e ben verificato se vale la diseguaglianza 1 Z e20 m v2 , 2 b che implica b bmin , dove 2 Z e20 . (3.28) m v2 Nell’approssimazione della traiettoria rettilinea, e utilizzando il sistema di coordinate (x, y, z) della Fig. 3.8, la posizione dell’elettrone in funzione del tempo `e data dall’equazione bmin =
r0 (t) = b cosϕı + b sinϕ j + v t k , dove ı, j, e k sono tre versori diretti, rispettivamente, come gli assi x, y, e z, ϕ `e l’angolo che specifica (insieme al parametro d’urto) la geometria della collisione, e t `e il tempo misurato dall’istante in cui l’elettrone traversa il piano x-y. L’accelerazione dell’elettrone si calcola facilmente tenendo conto della forza di Coulomb esercitata dal nucleo. Si ottiene a(t) =
−Z e20 r0 (t) Ze20 =− (b cosϕı + b sinϕ j + v t k ) . 3 m r0 (t) m (b2 + v 2 t2 )3/2
74
CAPITOLO 3
Fig. 3.9. Grafico delle funzioni F 2 (z) e G2 (z).
Si consideri adesso la radiazione emessa a grande distanza lungo la direzione individuata dal versore n e si introducano, come in Fig. 3.8, due versori e 1 e e2 secondo la consueta convenzione per cui la terna (e1 , e2 , n ) `e una terna destrorsa. Se θ e χ sono gli angoli polare e azimutale che individuano la direzione n, si ha n = sinθ cosχı + sinθ sinχ j + cosθ k, , e1 = − cosθ cosχı − cosθ sinχ j + sinθ k ,
e2 = sinχı − cosχ j .
Applicando l’equazione non relativistica (3.21), le componenti del campo elettrico nel punto alla distanza R dal nucleo lungo la direzione n sono date da E1 (t + R/c) = E2 (t + R/c) =
Z e30 [ b cosθ cos(ϕ − χ) − v t sinθ ] , + v 2 t2 )3/2
m c2 R (b2
Z e30 b sin(ϕ − χ) . m c2 R (b2 + v 2 t2 )3/2
Differentemente dai casi che abbiamo considerato nei paragrafi precedenti, il campo elettrico non presenta un andamento col tempo di tipo sinusoidale. Per ottenere le propriet` a spettrali e le corrispondenti propriet` a polarimetriche del campo di radiazione, `e necessario passare attraverso le trasformate di Fourier delle due componenti del vettore campo elettrico. Questo porta a dover valutare degli integrali della forma ∞ ∞ cos(ω t) t sin(ω t) dt , dt , 2 + v 2 t2 )3/2 2 + v 2 t2 )3/2 (b (b −∞ −∞
75
RADIAZIONE DI CARICHE IN MOTO
che, attraverso la sostituzione tanx = v t/b, possono essere ricondotti alle funzioni F (z) e G(z) definite da2
π/2
F (z) =
cos(z tanx) cosx dx , 0
G(z) =
π/2
sin(z tanx) sinx dx . 0
Per mezzo di queste funzioni, il cui quadrato `e riportato in grafico nella Fig. 3.9, si ottiene per le trasformate di Fourier ∞ 1 Z e30 ˆ f1 (ω) = E1 (t) ei ω t dt = 2π −∞ π m c2 b v R (3.29) × [ cosθ cos(ϕ − χ) F (z) − i sinθ G(z) ] e i Φ , ∞ 1 Z e30 sin(ϕ − χ) F (z) e i Φ , fˆ2 (ω) = E2 (t) ei ω t dt = 2π −∞ π m c2 b v R dove Φ = ωR/c `e una fase inessenziale (dovuta al tempo ritardato) e dove ωb . v Possiamo adesso valutare i flussi monocromatici nei parametri di Stokes della radiazione emessa nella direzione n. Per questo dobbiamo rifarci alle considerazioni sviluppate nel Par. 2.3. Le espressioni che veniamo di ottenere sono le trasformate di Fourier delle componenti, lungo i versori e1 e e2 , degli impulsi del campo elettrico emessi nel passaggio, in prossimit` a del nucleo, di un singolo elettrone, con valori assegnati del parametro d’urto b e dell’angolo φ. Pensiamo adesso alla situazione fisica in cui si ha un flusso uniforme di elettroni, tutti aventi velocit` a v. Siamo ovviamente in presenza di un fenomeno stocastico, descritto a livello microscopico da una situazione del tipo di quella della Fig. 2.3, per la quale i flussi monocromatici sono dati dalle Eq. (2.17). Indicando con Ne la densit` a numerica degli elettroni del fascio, nell’unit`a di tempo si ha un numero di collisioni, con parametro d’urto compreso fra b e b + db e angolo compreso fra ϕ e ϕ + dϕ, dato da dNcoll = Ne v b db dϕ, per cui si ottiene z=
2π
FωI (n ) = c v Ne 0
FωQ (n )
2π
= c v Ne
∞
dϕ
= c v Ne
[ fˆ1 (ω)∗ fˆ1 (ω) − fˆ2 (ω)∗ fˆ2 (ω) ] b db ,
0
2π
dϕ 0
2
[ fˆ1 (ω)∗ fˆ1 (ω) + fˆ2 (ω)∗ fˆ2 (ω) ] b db ,
0
0
FωU (n )
∞
dϕ
∞
[ fˆ1 (ω)∗ fˆ2 (ω) + fˆ2 (ω)∗ fˆ1 (ω) ] b db ,
0
Le funzioni F (z) e G(z) possono essere collegate alle funzioni di Bessel modificate di seconda specie, Kn (z). Si ha F (z) = z K1 (z), G(z) = z K0 (z).
76
CAPITOLO 3
FωV (n ) = c v Ne
2π
dϕ 0
∞
i [ fˆ1 (ω)∗ fˆ2 (ω) − fˆ2 (ω)∗ fˆ1 (ω) ] b db .
0
Sostituendo i valori delle trasformate di Fourier date dalle Eq. (3.29), ed eseguendo l’integrazione su ϕ, i flussi nei parametri di Stokes U e V si annullano. Per i due rimanenti si ottiene ∞ db I Fω (n) = C , (1 + cos2 θ)F 2 (z) + 2 sin2 θ G2 (z) b 0 ∞ 2 db FωQ (n) = − C sin2 θ , F (z) − 2 G2 (z) b 0 dove si `e posto Z 2 e60 Ne . π m 2 c3 v R 2 Bisogna tuttavia prendere in considerazione il fatto che gli integrali che compaiono nelle equazioni precedenti sono divergenti perch´e, per b → 0 gli integrandi vanno all’infinito come b−1 . Questa divergenza `e dovuta all’approssimazione della traiettoria rettilinea che abbiamo introdotto all’inizio del calcolo. Dato che l’approssimazione non `e giustificata per b < bmin, con bmin definito nell’Eq. (3.28), la divergenza pu` o essere evitata cambiando il primo estremo di integrazione da 0 a bmin. Cos`ı facendo si ottiene un’espressione approssimata che pu` o essere migliorata solo per mezzo di calcoli pi` u complicati. Se allora si definiscono le due quantit`a ∞ ∞ 1 2 ωb 1 2 ωb F= F db , G= G db , v v bmin b bmin b C=
si ottiene FωI (n) = C [ (1 + cos2 θ) F + 2 sin2 θ G ] ,
FωQ (n) = − C sin2 θ ( F − 2 G ) .
Come si pu` o arguire dall’espressione degli integrali che definiscono F e G e dagli andamenti di F 2 (z) e G2 (z) della Fig. 3.9, a ogni frequenza angolare ω che contribuisce sostanzialmente all’emissivit`a, la diseguaglianza F G `e sempre ben verificata. Questo implica che, con buona approssimazione, il diagramma di radiazione presenta una dipendenza da θ della forma (1 + cos2 θ) il che mostra che la radiazione emessa verso “i poli”, ovvero nella direzione del fascio di elettroni, `e due volte pi` u intensa di quella emessa nel “piano equatoriale”. Per quanto riguarda invece la polarizzazione, la radiazione `e linearmente polarizzata, con un valore percentuale, praticamente indipendente dalla frequenza, dato da FωQ (n) sin2 θ = − . FωI (n) 1 + cos2 θ
RADIAZIONE DI CARICHE IN MOTO
77
Questa equazione mostra che la radiazione emessa nel piano perpendicolare alla velocit`a delle particelle collidenti `e polarizzata linearmente al 100%, la direzione di polarizzazione essendo contenuta nel piano stesso (si ricordi la definizione dei due versori di polarizzazione della Fig. 3.8). Cambiando la direzione di emissione, la polarizzazione mantiene le stesse caratteristiche (lineare e diretta perpendicolarmente alla velocit`a) ma la percentuale `e sempre pi` u bassa mano a mano che sin2 θ diminuisce. In particolare, la radiazione emessa lungo la direzione della velocit`a (o in direzione opposta) non `e polarizzata. Infine, le equazioni precedenti possono anche essere utilizzate per dare una stima di ordine di grandezza per la potenza monocromatica totale (cio`e integrata su tutto l’angolo solido) della radiazione di frenamento. Eseguiamo per questo un’approssimazione piuttosto brutale sul comportamento della funzione F 2 (z) supponendo che essa valga 1 nell’intervallo di z compreso fra 0 e 1 e che sia nulla per z > 1. Questo implica, per la quantit`a F, bmax 1 bmax db = ln F= , bmin bmin b dove bmax =
v . ω
Se si suppone inoltre che G = 0, integrando il flusso FωI (n ) sulla una sfera di raggio R, e sostituendo i valori di bmin e bmax , si ottiene m v3 16 Z 2 e60 Ne Wω = ln , 3 m 2 c3 v 2 Z e20 ω ovvero un andamento spettrale quasi piatto, la dipendenza da ω essendo contenuta solo nel logaritmo. Un’analisi pi` u approfondita dello stesso problema3 , compiuta senza utilizzare l’approssimazione della traiettoria rettilinea, mostra che la formula da noi derivata `e corretta pur di apportare delle leggere modifiche. Nel limite delle basse frequenze (ω → 0), il fattore 12 nell’argomento del logaritmo deve essere sostituito dal fattore 2 e−γ , dove γ `e la costante di Eulero-Mascheroni definita da n−1 1 0.57721 . γ = lim − ln n + n→∞ k k=1
Viceversa, nel limite delle alte frequenze (ω → ∞), l’equazione √ deve essere modificata moltiplicando il secondo membro per il fattore π/ 3 e omettendo il logaritmo, cos`ı da dare 3
´ Si veda L. Landau & E. Lifchitz, Th´ eorie du Champ, Editions Mir, Moscou, 1966.
78
CAPITOLO 3
16π Z 2 e60 Ne . Wω = √ 3 3 m 2 c3 v La formula mostra che nel limite delle alte frequenze la potenza Wω `e indipendente da ω. Questo implica che per la radiazione di frenamento si ottiene, per cos`ı dire, una sorta di catastrofe dell’ultravioletto simile a quella della teoria classica della radiazione di corpo nero. Definendo infatti la potenza totale irradiata attraverso l’equazione ∞ W = Wω dω , 0
si ottiene un integrale divergente. La ragione di questo fatto `e dovuta all’aver trascurato completamente gli effetti quantistici, la cui conseguenza pi` u importante `e la comparsa di un valore di soglia per la frequenza angolare dei fotoni emessi, ωmax , data da h ¯ ωmax =
1 m v2 . 2
Per ottenere una stima di ordine di grandezza di W , trascuriamo la leggera dipendenza dal logaritmo e integriamo in dω fra 0 e ωmax . Si ottiene W
Z 2 e60 Ne v Z 2 e60 Ne ωmax = . 2 3 m c v 2 m c3 h ¯
Questa equazione permette l’introduzione di un’opportuna sezione d’urto, che indichiamo con σf , per la radiazione di frenamento. Il valore della sezione d’urto si ottiene dividendo la potenza totale irradiata, W , per il flusso di energia, Fe , degli elettroni collidenti che `e definito da Fe = Ne v
1 m v2 . 2
Con facili passaggi si trova σf =
W 1 = Z 2 α 2 rc2 , Fe β
hc)), β = v/c, e rc `e il dove α `e la costante della struttura fine (α = e20 /(¯ raggio classico dell’elettrone definito nell’Eq. (3.26). Come si vede, si ha una dipendenza della sezione d’urto dal quadrato del numero di carica Z. Per questa ragione, nei dispositivi tecnici che vengono utilizzati per la produzione di raggi X il bersaglio per gli elettroni accelerati `e costituito da lastre metalliche ad alto Z (tipicamente piombo). La formula precedente mostra anche che si ha una dipendenza quadratica inversa dalla velocit` a degli elettroni e, al limite per β → 0 si ottiene una divergenza. Questo `e ovviamente dovuto alle approssimazioni
RADIAZIONE DI CARICHE IN MOTO
79
z e1 B
n
e2 θ
y
χ x
traiettoria proiettata sul piano x−y
Fig. 3.10. Geometria per il calcolo della radiazione di ciclotrone.
introdotte, in particolare all’aver supposto che l’elettrone interagisca solo col nucleo atomico e non anche con la nuvola elettronica presente in ciascun atomo.
3.8 La radiazione di ciclotrone Un elettrone non relativistico mobile in una regione dello spazio dove `e presente un campo magnetico `e soggetto alla forza di Lorentz. Il moto dell’elettrone `e descritto dall’equazione d2 x e0 dx , ×B =− dt2 mc dt `e il campo magnetico che supponiamo uniforme e costante nel tempo. dove B In un sistema di coordinate (x, y, z) il cui asse z `e diretto lungo la direzione del campo, la soluzione pi` u generale di questa equazione `e la seguente
x = x0 + A cos(ωc t + φ) ,
y = y0 + A sin(ωc t + φ) ,
z = z0 + v t ,
dove la quantit` a e0 B (3.30) mc `e la cosiddetta frequenza di ciclotrone, e dove x0 , y0 , z0 , A, φ, e v sono sei costanti di integrazione. L’elettrone descrive un moto elicoidale, ovvero un moto circolare di raggio A nel piano x-y, sovrapposto a un moto uniforme lungo l’asse z. Il moto circolare si svolge alla velocit`a v⊥ = A ωc e il senso di percorrenza `e antiorario se si osserva il moto dall’estremit`a positiva dell’asse z. ωc =
80
CAPITOLO 3
Scegliendo opportunamente l’orientazione degli assi x e y, l’origine del sistema di coordinate e l’origine del tempo, l’equazione del moto pu` o essere posta nella seguente “forma minima” x=
v⊥ cos(ωc t) , ωc
y=
v⊥ sin(ωc t) , ωc
z = v t .
Dall’equazione di moto si calcola con facili passaggi il vettore accelerazione e, da questo, le sue componenti lungo i versori e1 e e2 , relativi alla direzione n, definiti come in Fig. 3.10. Senza perdere in generalit` a, la simmetria cilindrica del problema permette inoltre di scegliere la direzione n come appartenente al piano x-z (χ = 0). Si ottiene a1 = v⊥ ωc cosθ cos(ωc t) ,
a2 = v⊥ ωc sin(ωc t) ,
e applicando l’equazione non relativistica (3.21), le componenti del campo elettrico nel punto a grande distanza R lungo la direzione n risultano espresse dalle equazioni e0 v⊥ ωc cosθ cos(ωc t) , c2 R e0 v⊥ ωc sin(ωc t) . E2 (t + R/c) = c2 R Queste equazioni mostrano che le componenti del vettore campo elettrico sono periodiche con periodo T = 2π/ωc. Per esprimere i flussi nei parametri di Stokes bisogna far quindi ricorso alle Eq. (2.18) le quali, a loro volta, implicano il calcolo delle componenti di Fourier. D’altra parte, poich´e il campo ha un andamento temporale di tipo perfettamente sinusoidale, tutte le componenti di Fourier sono nulle eccetto quelle relative all’armonica fondamentale. Ricordando la definizione si ha E1 (t + R/c) =
(1)
E1
=
1 T
T
E1 (t) ei ωc t dt ,
(1)
E2
0
=
1 T
T
E2 (t) ei ωc t dt , 0
dalle quali si ottiene, con semplici passaggi e0 v⊥ ωc e0 v⊥ ωc i Φ (1) cosθ e i Φ , e E2 = i , 2 2c R 2 c2 R dove Φ = ωc R/c `e una fase inessenziale introdotta dal tempo anticipato. I flussi nei parametri di Stokes sono quindi espressi, in forma matriciale, dalle seguenti equazioni ⎛ I⎞ ⎛ ⎞ Fω 1 + cos2 θ ⎜ F Q ⎟ e2 v 2 ω 2 ⎜ − sin2 θ ⎟ ⎜ ω ⎟ ⎜ ⎟ ⎜ U ⎟ = 0 ⊥3 2c ⎜ ⎟ δ(ω − ωc ) . ⎝ Fω ⎠ 8π c R ⎝ ⎠ 0 V Fω −2 cos θ (1)
E1
=
RADIAZIONE DI CARICHE IN MOTO
81
Questa equazione mostra che la radiazione di ciclotrone `e polarizzata ellitticamente. In particolare, la radiazione emessa lungo la direzione del campo magnetico (θ = 0 oppure θ = π) `e polarizzata circolarmente e quella emessa nel piano perpendicolare al campo magnetico (θ = π/2) `e polarizzata linearmente (la direzione di polarizzazione essendo perpendicolare al campo magnetico). Il diagramma di radiazione `e della forma (1+cos2 θ), il che significa che l’intensit` a emessa “ai poli” `e doppia di quella emessa “nel piano equatoriale”. Infine, la potenza totale emessa, W , si determina mediante una doppia integrazione del flusso FωI su una sfera di raggio R e sulle frequenze. Tenendo conto che la media del fattore (1 + cos2 θ) sull’angolo solido `e 34 , si ottiene W =
2 ωc2 2 e20 v⊥ , 3 c3
oppure, ricordando la definizione della frequenza di ciclotrone (Eq. (3.30)) W =
2 B2 2 2 e40 v⊥ = rc2 β⊥ v⊥ B 2 , 3 m 2 c5 3
dove β⊥ = v⊥ /c e dove rc `e il raggio classico dell’elettrone. L’ultima equazione permette anche l’introduzione di un’opportuna sezione d’urto. Ricordando che la densit` a di energia magnetica `e B 2 /(8π), il flusso di energia spazzato dall’elettrone nel suo moto accelerato (cio`e facendo astrazione dal moto rettilineo uniforme lungo il campo magnetico) `e v⊥ B 2 /(8π). Tale energia `e trasformata dall’elettrone in energia raggiante con una sezione d’urto data da σc =
16 π β⊥ rc2 . 3
Ricordando il risultato ottenuto per la sezione d’urto Thomson, σT , si ha σc = 2 β⊥ σT .
3.9 La radiazione di sincrotrone Quando si passa a considerare il moto di un elettrone relativistico in un campo magnetico, le caratteristiche fisiche di tale moto rimangono inalterate rispetto al caso non relativistico descritto nel paragrafo precedente, eccetto per il fatto che la frequenza diminuisce, passando dalla frequenza di ciclotrone, ω c , a quella di sincrotrone, ωs , che adesso dipende dalla velocit`a della particella essendo data da ωs =
# e0 B = ωc 1 − β 2 , γ mc
82
CAPITOLO 3
dove β = v/c e dove γ `e il fattore di Lorentz. L’analisi delle caratteristiche della radiazione di sincrotrone va effettuata secondo le formule relativistiche date precedentemente (si ricordi in particolare l’Eq. (3.18)). La cosa importante da sottolineare `e che il fattore κ viene adesso a svolgere un ruolo fondamentale nel fenomeno fisico, cos`ı come l’effetto dovuto al tempo anticipato che non si limita pi` u a introdurre un semplice fattore di fase nelle espressioni delle trasformate di Fourier del campo di radiazione. L’analisi del fenomeno nella sua completezza `e molto complessa. In questo volume ci limitiamo a considerare il caso di un elettrone che descriva una traiettoria circolare e non elicoidale4 . Facendo sempre riferimento alla Fig. 3.10, si pu` o supporre, senza perdere in generalit`a, che la posizione dell’elettrone al tempo anticipato t sia data dalla legge x(t ) =
cβ [ cos(ωs t )ı + sin(ωs t ) j ] . ωs
Le corrispondenti espressioni della velocit`a e dell’accelerazione sono ovviamente date da v (t ) = c β [− sin(ωs t )ı + cos(ωs t ) j ] , a(t ) = −c β ωs [ cos(ωs t )ı + sin(ωs t ) j ] . Data la simmetria cilindrica del problema, consideriamo la radiazione emessa lungo una direzione appartenente al piano x-z della Fig. 3.10. Definito n = sinθı + cosθ k , si ha, con facili passaggi n − β = [ sinθ + β sin(ωs t ) ]ı − β cos(ωs t ) j + cosθ k ,
(n − β )×a = c β ωs cosθ sin(ωs t )ı − cosθ cos(ωs t ) j − [ sinθ sin(ωs t ) + β] k ,
× a = n × (n − β)
= c β ωs cos2 θ cos(ωs t )ı + [ sin(ωs t ) + β sinθ ] j − sinθ cos θ cos(ωs t ) k . La proiezione di quest’ultimo vettore sui versori e1 = − cosθı + sinθ k ,
e2 = −j ,
risulta 4
Per una trattazione pi` u approfondita si veda ad esempio G.B. Rybicki & A.P. Lightman, Radiative Processes in Astrophysics, John Wiley & Sons, New York, etc., 1979.
83
RADIAZIONE DI CARICHE IN MOTO
z campo magnetico
elettrone in orbita circolare
y
cono di radiazione
x
Fig. 3.11. Illustrazione dell’effetto faro. La particella relativistica ruota sulla circonferenza emettendo la maggior parte della radiazione entro il cono disegnato in figura. La situazione qui illustrata si riferisce all’istante in cui la radiazione emessa `e diretta lungo l’asse x. Al passare del tempo, il cono spazza tutte le direzioni del piano x-y.
! × a e1 · n × (n − β) = −c β ωs cosθ cos(ωs t ) ,
! × a e2 · n × (n − β) = −c β ωs [ sin(ωs t ) + β sinθ ] . Siamo adesso in grado di calcolare le componenti del campo elettrico all’istante t e a distanza R dalla carica lungo la direzione n. Dall’Eq. (3.18) si ottiene E1 (t) =
e0 β ωs cosθ cos(ωs t ) , c R κ3 (t )
E2 (t) =
e0 β ωs [ sin(ωs t ) + β sinθ ] , c R κ3 (t )
dove v (t ) · n = 1 + β sinθ sin(ωs t ) , c e dove il tempo anticipato, t , `e legato al tempo t dalla relazione κ(t ) = 1 −
t = t − t 0 +
β sinθ cos(ωs t ) , ωs
t0 essendo il tempo impiegato dalla luce a percorrere la distanza che separa il centro dell’orbita dal punto in cui si calcolano le componenti del campo elettrico.
84
CAPITOLO 3
Come gi` a illustrato precedentemente, il fattore κ−3 diviene essenziale per particelle relativistiche, quando β si avvicina a 1. In questo caso, essendo la particella in rotazione sull’orbita circolare, l’effetto beaming si trasforma pi` u propriamente in un “effetto faro” come illustrato schematicamente nella Fig. 3.11. In pratica, l’osservatore riceve un impulso di radiazione periodico, con periodo 2π/ωs , estremamente concentrato nel tempo. Poich´e tale impulso `e anche concentrato spazialmente ad angoli θ π/2, le equazioni precedenti per E1 e E2 mostrano che la radiazione `e polarizzata linearmente in direzione perpendicolare all’asse z, ovvero perpendicolare al campo magnetico. Ci proponiamo adesso di esaminare in maggior dettaglio le caratteristiche spettropolarimetriche della radiazione emessa. Per questo `e necessario calcolare le componenti di Fourier delle quantit` a E1 e E2 , ovvero le quantit` a
(n)
E1
=
1 T
T
E1 (t) ei n ωs t dt , 0
(n)
E2
=
1 T
T
E2 (t) ei n ωs t dt , 0
dove T = 2π/ωs . Sostituendo le espressioni trovate precedentemente si ha (n) E1
(n)
E2
2π/ωs cos(ωs t ) i n ωs t e0 β ωs2 cosθ e = dt , 2π c R κ3 (t ) 0 e0 β ωs2 2π/ωs sin(ωs t ) + β sinθ i n ωs t = dt . e 2π c R 0 κ3 (t )
Per valutare gli integrali, osserviamo che 1 dt dt = , = 1 + β sinθ sin(ωs t ) = κ(t ) , dt dt κ(t ) dt d 1 d 1 1 = = − 3 β ωs sinθ cos(ωs t ) , dt κ(t ) dt dt κ(t ) κ (t ) dt d cos(ωs t ) d cos(ωs t ) = = dt κ(t ) dt dt κ(t ) ωs ωs β sinθ cos2 (ωs t ) sin(ωs t ) + = − 3 [sin(ωs t ) + β sin θ] . =− 2 κ(t ) κ (t ) κ(t ) κ (t ) Sostituendo nelle espressioni delle componenti di Fourier, si ottiene (n)
E1
(n)
E2
2π/ωs d 1 e0 ωs cotθ ei n ωs t dt , ) 2π c R dt κ(t 0 2π/ωs d cos(ωs t ) i n ωs t e0 β ωs e =− dt . 2π c R 0 dt κ(t ) =−
RADIAZIONE DI CARICHE IN MOTO
85
Integriamo adesso per parti entrambi gli integrali. Il fattore finito si annulla per le condizioni di periodicit` a. Nell’integrale che rimane effettuiamo poi un cambiamento di variabile passando dalla variabile t alla variabile t . Poich´e dt = κ(t ) dt , si ottiene, ricordando la relazione fra t e t , (n)
E1
(n)
E2
2π/ωs i n e0 ωs2 cotθ ei n ωs (t0 +t ) e−i n β sinθ cos(ωs t ) dt , 2π c R 0 i n e0 β ωs2 2π/ωs = cos(ωs t ) ei n ωs (t0 +t ) e−i n β sinθ cos(ωs t ) dt . 2π c R 0
=
Il fattore di fase che proviene dal tempo t0 `e presente in entrambe le componenti e pu` o essere eliminato senza perdere in generalit` a. Effettuando in entrambi gli integrali il cambiamento di variabile ϕ = ωs t e sviluppando il primo esponenziale si ha
(n)
E1
(n)
E2
=
=
i n e0 ωs cotθ 2π c R i n e0 β ωs 2π c R
2π
[ cos(nϕ) + i sin(nϕ) ] e−i n β sinθ cosϕ dϕ ,
0 2π
cosϕ [ cos(nϕ) + i sin(nϕ) ] e−i n β sinθ cosϕ dϕ .
0
Gli integrali che compaiono in queste espressioni possono essere semplificati osservando che il contributo portato dal termine in sin(nϕ) `e nullo. Il contributo portato dal termine in cos(nϕ) pu` o poi essere ricondotto a funzioni speciali. Definite infatti le funzioni di Bessel di ordine intero come le soluzioni dell’equazione differenziale x2
d2 Jn dJn + (x2 − n2 ) Jn = 0 , +x dx2 dx
si pu` o dimostrare che Jn (x) =
in 2π
2π
cos(nϕ) e−i x cosϕ dϕ ,
0
e, per derivazione Jn (x)
d i n+1 Jn (x) = − = dx 2π
2π
cosϕ cos(nϕ) e−i x cos ϕ dϕ .
0
Attraverso queste relazioni `e possibile esprimere le componenti di Fourier nella forma (n)
E1
=
1 n e0 ωs cotθ Jn (nβ sinθ) , i n−1 c R
86
CAPITOLO 3 (n)
E2
=−
1 n e0 β ωs Jn (nβ sinθ) . in cR
Ricordando infine l’Eq. (2.18) si possono esprimere i flussi nei parametri di Stokes attraverso l’espressione ⎛
⎞ ⎛ 2 2 ⎞ FωI cot θ Jn (z) + β 2 J2 n (z) ∞ ⎜FQ ⎟ ⎟ 2 2 2 2 e2 ω 2 2 ⎜ ⎜ ω ⎟ ⎜ cot θ Jn (z) − β Jn (z) ⎟ n ⎜ ⎜ U ⎟ = 0 s2 ⎟ δ(ω − n ωs ) , ⎝ Fω ⎠ 2π c R n=1 ⎝ ⎠ 0 −2β cot θ Jn (z) Jn (z)
FωV dove
z = n β sinθ . ` interessante considerare il limite di queste espressioni per β → 0. Tenendo E conto dello sviluppo in serie di potenze z n 1 z2 − + ··· , Jn (z) = 2 n! 4(n + 1)! al primo ordine in z si ottiene che tutte le funzioni di Bessel di ordine intero con n ≥ 2 sono nulle. Per J1 (z) si ha poi J1 (z) =
z , 2
J1 (z) =
1 , 2
e si ritrovano le formule date per la radiazione di ciclotrone. Una caratteristica fondamentale dello spettro della radiazione di sincrotrone `e che a esso contribuiscono tutte le armoniche della frequenza ωs . Un problema interessante `e quello di chiedersi a quale armonica si abbia emissione massima. Un’analisi basata sugli sviluppi asintotici delle funzioni di Bessel5 mostra che, per valori di β vicini a 1, il massimo dell’emissione, integrata sull’angolo solido, si ottiene all’armonica caratterizzata dall’indice nmax dato da nmax (1 − β 2 )−3/2 = γ 3 . Ad esempio, per β = 0.99 si ha nmax 350. La frequenza che corrisponde al massimo, ωmax , `e quindi data da ωmax = γ 3 ωs = γ 2 ωc . Per elettroni ultra-relativistici, lo spettro della radiazione di sincrotrone risulta quindi uno spettro “quasi continuo”. Questo vale anche se gli elettroni hanno 5
´ Si veda L. Landau & E. Lifchitz, Th´ eorie du Champ, Editions Mir, Moscou, 1966.
87
RADIAZIONE DI CARICHE IN MOTO
tutti la stessa energia e si muovono lungo orbite circolari (e non elicoidali), caso a cui ci siamo limitati nella presente trattazione. Infine, per valutare la potenza totale emessa su tutto l’angolo solido possiamo utilizzare l’equazione di Larmor generalizzata al caso relativistico (Eq. (3.23)). Tenendo conto che l’accelerazione `e perpendicolare alla velocit` a e che vale in modulo c β ωs , si ottiene W =
2 e40 2 e20 4 2 2 γ β ωs = γ2β2B2 , 3c 3 m 2 c3
ovvero, in forma alternativa W =
2 2 2 2 2 γ β B c rc , 3
dove rc `e il raggio classico dell’elettrone. Quest’ultima equazione permette anche l’introduzione di un’opportuna sezione d’urto, analogamente a quanto gi` a fatto per la radiazione di ciclotrone. Ricordando che la densit` a di energia magnetica `e B 2 /(8π), il flusso di energia spazzato dall’elettrone nel suo moto `e c β B 2 /(8π). Tale energia `e trasformata dall’elettrone in energia raggiante con una sezione d’urto data da σs =
16π 2 2 γ β rc , 3
ovvero, in termini della sezione d’urto Thomson σs = 2 γ 2 β σT .
3.10 Sviluppo multipolare nella zona di radiazione Nei paragrafi precedenti ci siamo interessati a trovare le propriet` a della radiazione elettromagnetica irraggiata da una singola carica elettrica in moto arbitrario. Adesso andiamo a considerare il caso in cui si abbia un insieme di N cariche elettriche in moto, invece di una sola. Ovviamente, per la linearit`a delle equazioni di Maxwell, l’espressione dei campi elettrico e magnetico nella zona di radiazione si generalizza per semplice addizione dei campi dovuti a ciascuna carica. Si ha
r , t) = E(
N i=1
i (r, t) , E
r, t) = B(
N i=1
i (r, t) = B
N i=1
i (r, t) , ni × E
88
CAPITOLO 3
dove, ricordando l’Eq. (3.18) i (r, t) = E
ei ni × c2 κ3i Ri
vi × ai . ni − c
In questa espressione, tutte le quantit` a geometriche e dinamiche relative alla particella i-esima, ni , κi , Ri , vi e ai devono essere valutate al tempo anticipato della particella medesima, ti , definito da | r − ri (ti )| , c essendo ri (t) la traiettoria della particella i-esima. Ogni particella ha in generale un tempo anticipato diverso. Consideriamo il caso semplificato in cui l’insieme di particelle si trovi in una regione dello spazio avente dimensioni L molto minori della distanza R dal punto in cui si valutano i campi (L R). In queste condizioni, si pu`o supporre che il versore n e la distanza R siano uguali per tutte le cariche. Sotto queste ipotesi, a meno di termini dell’ordine di L/R, si ha per il campo elettrico ti = t −
ei r , t) = 1 E( n × 2 c R i=1 κ3i N
vi × ai . n − c
Se supponiamo adesso che le cariche si muovano con velocit` a non relativistiche, ovvero se supponiamo vi c (i = 1, . . . , N ), tutti i fattori κi sono uguali a 1 e il secondo termine entro la parentesi tonda del secondo membro pu`o essere trascurato. Si ottiene allora, per il campo elettrico all’ordine zero nel rapporto v/c N 1 E0 (r, t) = 2 n × n × ei ai . c R i=1 Introduciamo adesso l’ulteriore ipotesi di trascurare la dipendenza dal tempo anticipato ti nell’accelerazione della particella i-esima. Per questo, consideriamo un punto di coordinate rc (il punto “centrale”, per fissare le idee, del nostro insieme di cariche) e misuriamo le coordinate spaziali delle singole particelle rispetto a tale punto, definendo si = ri − rc . Con questa posizione, il tempo anticipato ti risulta, essendo |si | |r − rc | R si · n , c dove tc `e il tempo anticipato relativo al punto centrale. Affinch´e l’ipotesi di trascurare la dipendenza da ti sia giustificata, bisogna che il tempo tipico τ ti = tc +
RADIAZIONE DI CARICHE IN MOTO
89
su cui avvengono variazioni nel moto delle particelle sia molto maggiore del rapporto L/c, dove L sono le dimensioni tipiche della regione dello spazio in cui si trovano le particelle. D’altra parte, la lunghezza d’onda λ caratteristica della radiazione emessa dalle particelle `e dell’ordine di c τ , per cui si deve avere λ cτ L . Quando questa condizione `e verificata, definendo il momento di dipolo elettrico attraverso l’equazione del sistema di cariche, D, = D
N
ei si ,
(3.31)
i=1
si ottiene .. ) , 0 (r, t) = 1 n × (n × D E c2 R dove si `e adottata la “convenzione dei punti” per indicare la derivazione rispetto al tempo e dove la derivata seconda del momento di dipolo elettrico deve essere valutata al tempo anticipato tc . L’irraggiamento descritto da questa equazione viene detto irraggiamento di dipolo elettrico. Esso presenta un diagramma di radiazione uguale in tutto e per tutto a quello della carica singola non relativistica gi` a esaminato nel Par. 3.4 e descritto dalla Fig. 3.3. Per la potenza totale emessa si ha poi, in stretta analogia al risultato ivi ottenuto Wd.e. =
2 .. 2 D . 3 c3
.. sia nullo. Per In alcuni casi, si pu`o verificare la circostanza che il vettore D determinare le propriet`a dell’irraggiamento del sistema di cariche `e allora necessario andare a considerare il contributo del campo elettrico al primo ordine in v/c, contributo che abbiamo precedentemente trascurato. Con riferimento all’equazione generale per il campo elettrico, dobbiamo tener conto di tre termini distinti che provengono, rispettivamente: (a) dal fattore in vi /c in parentesi tonda; (b) dal fattore moltiplicativo κ−3 i ; (c) dalla correzione del termine di ordine zero in ai dovuto all’effetto del tempo anticipato. Con semplici considerazioni si ottiene allora per il contributo al campo elettrico dovuto al primo ordine nello sviluppo in v/c N ! ˙i ) , 1 (r, t) = 1 E e n × −( v × a ) + 3 ( v · n )( n × a ) + ( s · n )( n × a i i i i i i c3 R i=1
90
CAPITOLO 3
dove tutte le quantit` a sono valutate al tempo anticipato “centrale” t c . Questa espressione pu`o essere posta in forma diversa osservando che, dato un vettore w qualsiasi, si ha n × w = −n × [ n × [ n × w ]] , per cui, modificando attraverso questa equazione il primo termine entro la parentesi graffa, si pu`o scrivere
1 (r, t) = 1 n × n × A , E c3 R dove = A
N
ei n × (vi × ai ) + 3 ( vi · n ) ai + (si · n ) a˙i
! ,
i=1
ovvero, sviluppando il doppio prodotto vettoriale = A
N
ei (ai · n ) vi + 2 (vi · n ) ai + (si · n ) a˙i
! .
i=1
Modifichiamo adesso la forma di questa equazione ponendo ... ai = s¨i , a˙i = si . vi = s˙i , Con queste posizioni si ha = A
N
... ! ei (s¨i · n ) s˙i + 2 (s˙i · n ) s¨i + (si · n ) si .
i=1
Introduciamo il momento di dipolo magnetico del sistema attraverso l’espressione 1 = 1 M ei si × vi = ei si × s˙i . 2 c i=1 2 c i=1 N
N
(3.32)
Derivando due volte rispetto al tempo si ottiene N .. ... ! = 1 ei s˙i × s¨i + si × si , M 2c i=1
e, prendendone il prodotto vettoriale col versore n, N ! .. ... ... × n = 1 ei (s˙i · n ) s¨i − (s¨i · n ) s˙i + (si · n ) si − (si · n ) si . M 2 c i=1
RADIAZIONE DI CARICHE IN MOTO
91
di deduce Da questa equazione, ricordando l’espressione del vettore A N .. ... ... ! − cM × n = 1 3 (s¨i · n ) s˙i + 3 (s˙i · n ) s¨i + (si · n ) si + (si · n ) si . A 2 i=1
Definiamo adesso il tensore simmetrico Q / attraverso il seguente prodotto diadico Q /=
N
ei si si .
(3.33)
i=1
Come specificheremo meglio in seguito, questo tensore `e strettamente collegato al tensore del momento di quadrupolo elettrico che viene definito in elettrostatica. Derivandolo tre volte rispetto al tempo e moltiplicandolo scalarmente per il versore n (indifferentemente a destra o a sinistra in quanto il tensore `e simmetrico), si ottiene facilmente N ... ... ... ... ! n · Q /=Q / · n = ei (si · n )si + 3 (s¨i · n ) s˙i + 3 (s˙i · n ) s¨i + (si · n ) si , i=1
risulta espresso, in termini del momento di per cui, in definitiva, il vettore A dipolo magnetico e del tensore Q / , dall’equazione .. ... = cM × n + 1 n · Q A / . 2 Se adesso sostituiamo questa equazione nell’espressione del campo elettrico attraverso l’equazione E1 (r, t) e introduciamo il vettore Q = n · Q Q / , si ottiene ... .. 1 1 n × M + n × (n × Q ) . E1 (r, t) = 2 c R 2c ` interessante osservare che, ai fini del calcolo del campo E1 (r, t), il tensore Q E / pu` o essere senz’altro sostituito dal tensore del momento di quadrupolo elettrico, generalmente definito in elettrostatica dall’espressione Q=
1 ei si si − s2i U , 3 i=1
N
dove U `e il tensore unitario. Ovviamente si ha
92
CAPITOLO 3
Q=Q /−
1 ei s2i U , 3 i
cosicch´e i due tensori Q e Q / differiscono fra loro di una quantit` a proporzionale al tensore unitario. Se si adotta l’espressione di Q in luogo di Q / per definire si ottiene un altro vettore che differisce da Q per una quantit` il vettore Q, a 1 (r, t) a proporzionale a n la quale non d` a alcun contributo al campo elettrico E causa della presenza del doppio prodotto vettoriale. Quindi, ai fini del calcolo data sopra pu` di questo campo, la definizione di Q o essere sostituita dalla definizione equivalente = n · Q . Q
3.11 Diagramma di radiazione per le componenti multipolari Come abbiamo visto nel paragrafo precedente, il contributo del campo elettrico nella zona di radiazione dovuto alle correzioni del primo ordine in v/c pu` o, sotto un certo numero di ipotesi, essere scomposto nella somma di un termine dovuto all’irraggiamento di dipolo magnetico e un termine dovuto all’irraggiamento di quadrupolo elettrico, ovvero 1 (r, t) = E d.m. (r, t) + E q.e. (r, t) , E dove ... .. , q.e. = 1 n × (n × Q ) . d.m. = 1 n × M E E c2 R 2 c3 R Vogliamo adesso determinare i diagrammi di radiazione che competono indipendentemente ai due tipi diversi di irraggiamento. Se esiste soltanto irraggiamento di dipolo magnetico, esprimendo il vettore di Poynting attraverso la consueta espressione valida nella zona di radiazione, ovvero r, t) = c E 2 (r, t) n , S( 4π si ottiene
r, t) = S(
.. 2 sin2 θ M
n , .. . Il diagramma di radiazione dove θ `e l’angolo compreso fra i due vettori n e M `e in tutto e per tutto analogo a quello dell’irraggiamento di dipolo elettrico 4π c3 R2
RADIAZIONE DI CARICHE IN MOTO
93
mostrato nella Fig. 3.3. L’unica differenza fra questi due casi `e dovuta al fatto che nell’irraggiamento di dipolo elettrico compare un doppio prodotto .. ), mentre nell’irraggiamento di dipolo magnetico compare vettoriale, n × (n × D .. . Questa differenza ha conseguenze solo un prodotto vettoriale singolo, n × M sulle caratteristiche di polarizzazione dei due tipi di emissione. Nel primo caso il vettore campo elettrico giace nel piano contenente la direzione di propagazione, .. , mentre nel secondo caso il vettore campo elettrico `e diretto n, e il vettore D perpendicolarmente al piano contenente la direzione di propagazione e il vettore .. . Per la potenza totale si ottiene una formula del tutto analoga a quella M dell’emissione di dipolo elettrico, ovvero 2 .. 2 M . 3 c3 Passiamo adesso ad analizzare il caso dell’emissione di quadrupolo supponendo che esista solo tale tipo di irraggiamento. Il vettore di Poynting `e dato da Wd.m. =
... 2 1 n × Q n , 16π c5 R2 ovvero, ricordando la definizione del vettore Q r , t) = S(
r , t) = S(
... 2 1 n × n · Q / n , 16π c5 R2
... ... il tensore Q / potendo alternativamente essere sostituito dal tensore Q . Nel seguito ci atterremo a quest’ultima definizione, osservando che il ...tensore Q `e un tensore a traccia nulla6 e che tale propriet`a si conserva per Q . Ricordiamo poi che per un tensore cartesiano simmetrico, quale Q, si pu` o sempre determinare un opportuno sistema di riferimento, (x, y, z), nel quale il tensore stesso `e diagonale. Si pu`o quindi scrivere, in tale riferimento ... Q = Aı ı + B j j + C k k , dove ... A = Qxx ,
... B = Qyy ,
... C = Qzz ,
con A+B+C =0 . Individuando in questo sistema la direzione arbitraria n con gli angoli polari θ e φ, ovvero ponendo 6
Questa propriet` a semplifica la deduzione delle equazioni che saranno provate in seguito.
94
CAPITOLO 3
Fig. 3.12. Diagramma di radiazione per l’emissione di quadrupolo nel caso semplificato in cui sia A = B. Il diagramma ` e a simmetria di rotazione attorno all’asse verticale.
n = sinθ cosφı + sinθ sinφ j + cosθ k , si ottiene, con facili passaggi ... n × (n · Q ) = sinθ cosθ sin φ (C − B)ı + sinθ cosθ cosφ (A − C) j + sin2 θ sinφ cosφ (B − A) k , e il vettore di Poynting risulta 2 1 sin θ cos2 θ sin2 φ (B − C)2 + sin2 θ cos2 θ cos2 φ (C − A)2 5 2 16π c R + sin4 θ sin2 φ cos2 φ (A − B)2 n .
r , t) = S(
Questa formula esprime il diagramma di radiazione per l’emissione di quadrupolo elettrico. Tale diagramma risulta relativamente complicato e manca, in generale, di simmetria. Soltanto nel caso semplificato in cui sia A = B (che implica C = −2 A), si ottiene la seguente espressione, a simmetria di rotazione attorno all’asse z, illustrata nella Fig. 3.12 9 sin2 θ cos2 θ A2 n . 16π c5 R2 Tornando al caso generale, l’espressione per la potenza totale irradiata su tutto l’angolo solido pu` o essere facilmente determinata osservando che la media sull’angolo solido delle tre funzioni r, t) = S(
95
RADIAZIONE DI CARICHE IN MOTO
sin2 θ cos2 θ sin2 φ , 1 15 .
vale
sin2 θ cos2 θ cos2 φ ,
sin4 θ sin2 φ cos2 φ
Si ottiene quindi Wq.e. =
1 (B − C)2 + (C − A)2 + (A − B)2 , 5 60 c
e, ricordando che A + B + C = 0, per cui A2 + B 2 + C 2 = −2 (AB + BC + CA) , si ha
Wq.e. =
... 2 ... 2 1 ... 2 1 2 2 2 (Q . A = + B + C ) + (Q ) + (Q xx yy zz ) 20 c5 20 c5
Infine, si pu` o osservare che, dato un tensore di rango due qualsiasi, T ij , se ne pu` o definire il modulo quadro, T2 , con l’equazione Tij2 , T2 = ij
e si pu` o dimostrare che tale quantit` a `e invariante per rotazioni del sistema di riferimento. In particolare, nel sistema di riferimento in cui il tensore `e diagonale, si ha 2 2 2 T2 = Txx + Tyy + Tzz .
L’espressione per la potenza dell’irraggiamento di quadrupolo pu`o quindi essere scritta, in un sistema arbitrario, nella forma Wq.e. =
1 ... 2 Qij . 20 c5 ij
(3.34)
Osserviamo infine che le espressioni per l’irraggiamento di onde elettromagnetiche che abbiamo ottenuto in questi ultimi due paragrafi possono essere “traslate” in maniera euristica per descrivere l’irraggiamento di onde gravitazionali. L’Appendice 6 `e dedicata a questo argomento.
Capitolo 4
Quantizzazione del campo elettromagnetico Nella sua interazione con la materia, la radiazione elettromagnetica presenta un comportamento caratteristico per il quale l’assorbimento e l’emissione avvengono sotto forma di quanti di energia comunemente denominati fotoni. Tali fenomeni non possono essere descritti in base alla teoria classica sviluppata nel capitolo precedente ma necessitano una trattazione specifica capace di unificare, nell’ambito di una teoria formalmente coerente, i concetti di base dell’Elettromagnetismo e della Meccanica Quantistica. Tale teoria, detta Elettrodinamica Quantistica, `e stata sviluppata a partire dagli anni 1930 grazie al contributo di eminenti fisici, fra i quali basta qui ricordare Dirac e Feynman. In questo capitolo daremo un’introduzione di base del formalismo, cosiddetto di seconda quantizzazione, che viene oggi comunemente utilizzato nell’ambito dell’Elettrodinamica Quantistica per introdurre il concetto di fotone. Le applicazioni di questo formalismo alla descrizione dell’interazione fra materia e radiazione e allo studio di specifici processi fisici saranno trattate in capitoli successivi (Cap. 11 e 15).
4.1 Oscillatore armonico, operatori di creazione e distruzione Consideriamo un oscillatore armonico unidimensionale, la cui realizzazione pratica pi` u semplice `e costituita da una particella puntiforme, di massa m, mobile lungo una retta e soggetta all’azione di una forza di richiamo elastica. Detta x la coordinata misurata lungo tale retta a partire dalla posizione di equilibrio, l’equazione di moto `e mx ¨ = −k x , dove k `e la costante di richiamo. Come `e noto questa equazione ammette soluzioni di tipo armonico caratterizzate dalla frequenza angolare $ k ω= . m Nel formalismo della meccanica analitica, il sistema fisico `e descritto dalla funzione Hamiltoniana H, che rappresenta l’energia totale, data da
98
CAPITOLO 4
H=
1 p2 + k x2 , 2m 2
dove p `e l’impulso della particella. Seguendo le convenzioni della meccanica analitica, indichiamo col simbolo q la coordinata x. Sostituendo inoltre ω in luogo di k, l’Hamiltoniana si pu` o riscrivere nella forma H=
p2 1 + m ω2 q2 . 2m 2
In questa equazione p rappresenta pi` u propriamente il momento cinetico coniugato alla variabile q. Le equazioni di moto per q e p si ottengono attraverso le ben note equazioni di Hamilton p˙ = −
∂H = −m ω 2 q , ∂q
q˙ =
p ∂H = . ∂p m
Introduciamo adesso, in luogo delle variabili q e p, delle loro combinazioni lineari della forma a = C (m ω q + i p) , a∗ = C (m ω q − i p) ,
√ dove i = −1 `e l’unit`a immaginaria e dove C `e una costante reale il cui valore sar` a specificato in seguito. Per le equazioni di moto si ha, con facili passaggi, a˙ = C (m ω q˙ + i p) ˙ = −i ω a , e, analogamente, a˙ ∗ = i ω a∗ . Come si vede, con l’introduzione delle variabili a e a∗ , le equazioni differenziali risultano disaccoppiate e quindi di pi` u facile soluzione. Passando alla descrizione quantistica, q e p devono essere pensati come operatori lineari Hermitiani agenti su un opportuno spazio di Hilbert. I due operatori devono inoltre soddisfare la regola di commutazione [ q, p ] = q p − p q = i h ¯ , dove abbiamo introdotto il consueto simbolo per indicare il commutatore fra due operatori, e dove h ¯ `e la costante di Planck divisa per 2π (¯ h = 1.055 × 10−27 erg s). Con l’introduzione delle quantit` a a e a∗ , che nella formulazione
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
99
quantistica divengono gli operatori a e a† , gli operatori q e p si esprimono attraverso le equazioni 1 (a + a† ) , 2C mω i (a − a† ) , p=− 2C e l’Hamiltoniana risulta (facendo attenzione a non alterare l’ordine degli operatori) q=
H=
1 (a† a + a a† ) . 4 m C2
Valutiamo adesso il commutatore fra gli operatori a e a† . Si ha [ a, a† ] = C 2 [ m ω q + i p , m ω q − i p ] = 2 C 2 m h ¯ω , e scegliamo la costante C in modo che si abbia (4.1) [ a, a† ] = 1 . √ ¯ ω, col che l’Hamiltoniana risulta Per far questo `e sufficiente porre C = 1/ 2 m h H=
1 h ¯ ω (a a† + a† a) , 2
e, tenendo presente la regola di commutazione fra a e a† , si ottiene H=h ¯ ω a† a + 21 .
(4.2)
u Con l’introduzione degli operatori a e a† , che, per ragioni che saranno pi` chiare in seguito, prendono il nome, rispettivamente, di operatore di distruzione e di creazione, l’Hamiltoniana `e stata ricondotta a una forma molto semplificata. Adesso troveremo autovalori e autovettori di questa Hamiltoniana dimenticando, in un certo qual modo, la sua origine e sfruttando unicamente la regola di commutazione fra gli operatori a e a† . Calcoliamo preliminarmente alcuni commutatori [H, a] = h ¯ ω [ a† a, a ] = h ¯ ω [ a† , a ] a = −¯ hω a , ¯ ω [ a† a, a† ] = h ¯ ω a† [ a, a† ] = h ¯ ω a† . [H, a† ] = h Supponiamo adesso di conoscere un particolare autovettore, |H , dell’Hamiltoniana e il corrispondente autovalore H H|H = H|H
,
e consideriamo il prodotto scalare H| a† a |H . Con facili passaggi si ottiene
100
CAPITOLO 4
h ¯ ω H| a† a |H = (H −
1 2
h ¯ ω) H|H
.
In questa equazione si pu`o osservare che il primo membro `e positivo, essendo il prodotto della quantit` ah ¯ ω per la norma del vettore a|H . Essendo d’altra parte positiva anche la norma del vettore |H , ne risulta per l’autovalore H H≥
1 2
h ¯ω ,
il segno di uguaglianza essendo verificato solo quando a|H = 0. Applicando poi l’Hamiltoniana al vettore a|H , si ha, attraverso le regole di commutazione dimostrate precedentemente H a|H = (aH − h ¯ ω a)|H = (H − h ¯ ω) a|H
.
Questa equazione mostra che, se |H `e un autovettore dell’Hamiltoniana corrispondente all’autovalore H, allora il vettore a|H `e anch’esso un autovettore dell’Hamiltoniana corrispondente all’autovalore (H − h ¯ ω). Applicando ripetutamente questa propriet`a, si trova che, in generale, il vettore an |H (con n intero) `e anch’esso autovettore dell’Hamiltoniana corrispondente all’autovalore (H − n h ¯ ω). Cos`ı facendo si ottiene una catena di autovettori aventi autovalori sempre minori. Questa catena deve per` o interrompersi perch´e, altrimenti, si arriverebbe a trovare degli autovalori che non soddisfano pi` u la condizione H ≥ 21 h ¯ ω. L’unico modo possibile per interrompere la catena `e che, per un certo intero m, si verifichi am |H = 0 . Questo significa che il vettore am−1 |H `e l’autovettore che corrisponde all’autovalore 21 h ¯ ω. Tale autovettore, che sar`a indicato nel seguito col simbolo |0 , `e tale che a|0 = 0 ,
H|0 =
1 2
h ¯ ω |0
.
†
a di commutaSe consideriamo adesso il vettore a |0 , si ha, per le propriet` zione dimostrate precedentemente H a† |0 = (a† H + h ¯ ω a† )|0 =
3 2
h ¯ ω a† |0
,
e, analogamente, per un intero n qualsiasi ¯ ω a†n |0 H a†n |0 = (n + 12 ) h
.
Si `e cos`ı costruita, a partire dall’autovettore |0 , una catena di autovettori corrispondenti ad autovalori mano a mano crescenti. Gli autovalori dell’Hamiltoniana sono quindi dati dalle quantit` a 12 h ¯ ω, (1 + 12 ) h ¯ ω, . . . , (n + 12 ) h ¯ ω, . . . , e a tali autovalori corrispondono gli autovettori |0 , a† |0 , . . . , a†n |0 , . . . .
101
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
Gli autovettori cos`ı trovati non sono per` o normalizzati. Per trovare la norma dell’autovettore generico, bisogna considerare la quantit`a 0| an a†n |0 , che pu` o essere facilmente valutata tenendo conto dell’equazione (dimostrabile con un procedimento di induzione) [ a, a†n ] = n a†n−1 . Per la norma del vettore a†n |0 , si ha 0| an a†n |0 = 0| an−1 a a†n |0 = 0| an−1 (a†n a + n a†n−1 )|0 = = n 0| an−1 a†n−1 |0
.
Applicando successivamente questa equazione si ottiene infine 0| an a†n |0 = n! 0|0
.
Se si suppone allora che l’autovettore |0 sia normalizzato, si possono ottenere gli altri autovettori normalizzati, che indichiamo con |n , attraverso l’espressione 1 |n = √ a†n |0 n!
.
` facile mostrare che gli operatori a e a† agiscono sull’autovettore |n E seguente maniera √ n |n − 1 , √ † a |n = n + 1 |n + 1
nella
a|n =
.
Queste equazioni giustificano il nome loro attribuito di operatori di distruzione e di creazione, qualora si interpreti il numero quantico n come numero di occupazione di ipotetiche particelle.
4.2 Sviluppo del campo elettromagnetico in serie di Fourier Si consideri il campo elettromagnetico racchiuso in una cavit`a cubica, la cosiddetta “scatola”, di lato L e volume V = L3 . In assenza di cariche e correnti, per quanto visto nel Par. 1.5, possiamo utilizzare il caso particolare del gauge di Lorenz nel quale il potenziale scalare φ(x, t) `e nullo (Eq. (1.10)), dimodoch´e x, t) che `e soggetto alla conil campo `e descritto dal solo potenziale vettore A( dizione supplementare (non invariante relativisticamente) dell’Eq. (1.11)
102
CAPITOLO 4
x, t) = 0 , divA( e che soddisfa l’equazione delle onde 1 ∂2 A(x, t) = 0 . c2 ∂t2 Fissiamo un istante arbitrario t e sviluppiamo il potenziale vettore in serie di Fourier della variabile x. Imponendo che esso soddisfi alle cosiddette condizioni di periodicit` a, ovvero x, t) − ∇2 A(
y, z, t) = A(x + mx L, y + my L, z + mz L) , A(x, con mx , my , mz interi arbitrari (positivi, negativi, o nulli), si ottiene x, t) = (t) ei k·x , A( C k k
con la somma estesa a tutti i valori di k tali da soddisfare le condizioni di periodicit` a, ovvero a tutti i valori di k della forma k = nx 2π , ny 2π , nz 2π , L L L con nx , ny , nz interi arbitrari (positivi, negativi, o nulli). Essendo la funzione x, t) reale, il vettore complesso C (t) soddisfa la propriet` A( a di coniugazione k (t)∗ = C (t) . C k −k Imponiamo adesso che il potenziale vettore soddisfi l’equazione delle onde. Si (t) l’equazione differenziale ottiene per C k (t) d2 C k (t) , = −ωk2 C k dt2 dove abbiamo introdotto la frequenza angolare ωk (relativa al vettore d’onda k ) attraverso l’espressione ωk = c k , k essendo il modulo del vettore k. L’equazione differenziale pu` o essere facilmente risolta per dare (t) = C (−) e−i ωk t + C (+) ei ωk t , C k k k (+) costanti. Sostituendo si ottiene (−) e C con C k
k
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
x, t) = A(
(−) ei (k·x−ωk t) + C
k
103
(+) ei (k·x+ωk t) , C k
k
k
con (+) . (−)∗ = C C k − k Il potenziale vettore `e stato cos`ı decomposto in onde progressive e regressive. Tenendo conto che ωk = ω−k , si pu` o trasformare l’esponenziale che compare nell’onda regressiva mediante l’equazione e i (k·x+ωk t) = e−i (−k·x−ω−k t) , e cambiando nella seconda somma l’indice k in −k si ottiene (−)∗ (−) ei (k·x−ωk t) + x, t) = e−i (k·x−ωk t) , C C A(
k
k
k
k
che mostra in maniera diretta la realt` a della funzione A(x, t). Imponiamo infine la condizione supplementare di gauge (div A(x, t) = 0). Si ottiene, per ogni valore di k, la condizione di trasversalit` a k · C (−) = 0 . k
Possiamo soddisfare questa condizione nella seguente maniera. Per ogni vettore d’onda k, definiamo due versori di polarizzazione (in generale complessi) ekλ (λ = 1, 2) entrambi perpendicolari a k e perpendicolari fra loro, tali cio`e da soddisfare le equazioni ekλ · k = 0 , ∗ . ekλ · ekλ = δλλ
Con l’introduzione di questi versori possiamo soddisfare la condizione di trasversalit`a scrivendo (−) e−i ωk t = C ckλ(t) ekλ , k λ
dove ckλ(t) `e una funzione oscillante che soddisfa l’equazione differenziale d c (t) = −i ωk c (t) . kλ dt kλ Per il potenziale vettore si ottiene quindi l’espressione finale ∗ −i x, t) = ckλ(t) ekλ ei k·x + c∗kλ(t) ekλ e k·x , A( kλ
104
CAPITOLO 4
dalla quale si possono dedurre le espressioni per i vettori campo elettrico e campo magnetico ∗ −i x, t) = − 1 ∂ A( x, t) = i E( ωk ckλ(t) ekλ ei k·x − c∗kλ(t) ekλ e k·x , c ∂t c kλ
x, t) = rotA( x, t) = i B(
k × c (t) e ei k·x − c∗ (t) e ∗ e−i k·x . kλ kλ kλ kλ
kλ
Le somme che compaiono in queste espressioni sono estese a tutti i valori di k tali da soddisfare le condizioni di periodicit` a, e, fissato k, ai due possibili stati di polarizzazione. Ciascuna coppia (k, λ) definisce un cosiddetto modo del campo di radiazione entro la cavit` a. Il numero di modi per i quali il modulo del vettore d’onda `e compreso fra k e k + dk e la direzione del vettore d’onda `e compresa nell’angolo solido dΩ si pu` o trovare osservando che, nello spazio dei numeri d’onda, gli estremi dei possibili vettori k vengono a trovarsi sulle maglie di un reticolato cubico avente per lato 2π/L. Si ottiene quindi per tale numero dN = 2
2π L
−3 V 2 k 2 dk dΩ = k dk dΩ , 4π 3
(4.3)
dove V `e il volume della cavit`a e dove il fattore 2 supplementare `e stato introdotto per tener conto dei due possibili stati di polarizzazione.
4.3 Passaggio alla quantizzazione Lo sviluppo in serie di Fourier ottenuto nel paragrafo precedente `e basato su considerazioni puramente classiche. Si passa alla quantizzazione in rappresentazione di Schr¨odinger interpretando le grandezze classiche ckλ (t) e c∗kλ(t), ovvero i coefficienti dipendenti dal tempo che compaiono nello sviluppo in serie di Fourier del potenziale vettore e dei campi, come operatori quantistici ckλ e c† , indipendenti dal tempo, che agiscono su un opportuno spazio di Hilbert. kλ x, t), E( x, t) e B( x, t), divengono Cos`ı facendo, anche le grandezze classiche A( x) si ha, ad esempio operatori indipendenti dal tempo. Per l’operatore A( x) = A(
∗ −i c ekλ e i k·x + c† ekλ e k·x , kλ
kλ
kλ
x) e B( x). con espressioni analoghe per gli operatori E( Dobbiamo adesso costruire l’operatore che corrisponde alla Hamiltoniana del campo di radiazione. Per far questo ci basiamo sul principio di corrispondenza e scriviamo, ricordando l’espressione per la densit`a di energia del campo
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
H=
u(x ) d3 x = V
1 8π
105
2 (x ) + B 2 (x ) d3 x , E V
x ) e B( x ) sono l’operatore campo elettrico e l’operatore campo madove E( x) e gnetico, rispettivamente. Sostituendo le espressioni operatoriali per E( B(x ) si ottiene un’espressione contenente una somma doppia sugli indici (k, λ) o ossere (k , λ ). Tuttavia, tenendo conto delle condizioni di periodicit`a, si pu` vare che portano contributo non nullo all’integrale soltanto i termini contenenti prodotti di esponenziali del tipo ei k·x e−i k·x ,
per i quali l’integrazione in d3 x vale semplicemente V. Per ciascuno dei due contributi, quello elettrico e quello magnetico, che indichiamo rispettivamente con Hel. e Hma. , si ottengono quattro pezzi distinti, ovvero 1 2 (x ) d3 x = − V Hel. = ωk2 c c (ekλ · e−kλ ) E 2 kλ −kλ 8π V 8π c kλλ
Hma.
† ∗ ∗ ∗ + c† c† (ekλ · e−∗kλ ) − c c† (ekλ · ekλ ekλ · ekλ ) , ) − c c ( kλ kλ kλ −kλ kλ kλ 1 2 (x ) d3 x = − V ckλ c−kλ (k × ekλ ) · (−k × e−kλ ) = B 8π V 8π kλλ
∗ ∗ + c† c† (k × ekλ ) · (−k × e−∗kλ ) − c c† (k × ekλ ) · (k × ekλ ) kλ −kλ
kλ kλ
∗ ) · (k × ekλ ) . − c† c (k × ekλ kλ kλ
Osservando poi che, per due versori arbitrari e1 e e2 , entrambi perpendicolari al vettore k si ha (k × e1 ) · (k × e2 ) = k 2 (e1 · e2 ) , e che k 2 = ωk2 /c2 , si ottiene che, per i primi due addendi che compaiono entro le parentesi quadre a secondo membro, i contributi elettrico e magnetico si elidono, mentre, per gli ultimi due addendi, i contributi elettrico e magnetico risultano uguali. Tenendo infine conto che ∗ , ekλ · ekλ = δλλ
si ottiene l’espressione H=
V 2 † † c . ω c + c c k kλ kλ kλ kλ 4π c2 kλ
106
CAPITOLO 4
Per ricondurre questa Hamiltoniana alla somma di Hamiltoniane gi`a studiate precedentemente, passiamo dagli operatori c e c† agli operatori a e a† kλ kλ kλ kλ definiti da $ 1 ωk V c a = . kλ c 2π h ¯ kλ Con questa posizione, l’Hamiltoniana risulta
1 , (4.4) ¯ ωk a a† + a† a H= 2 h kλ kλ
kλ kλ
kλ
e l’operatore potenziale vettore si scrive nella forma % 2π h ¯ ∗ −i x) = a ekλ e i k·x + a† ekλ c e k·x . A( kλ kλ ωk V
(4.5)
kλ
Per completare la quantizzazione del campo elettromagnetico `e per` o necessario conoscere le regole di commutazione degli operatori a e a† . Queste kλ kλ possono essere dedotte attraverso il principio di corrispondenza sfruttando il fatto che conosciamo le equazioni di moto che regolano l’evoluzione temporale delle quantit`a classiche corrispondenti (ckλ (t) ∼ exp(−i ωk t)). Se |ψ `e un qualsiasi vettore di stato del sistema quantistico, l’osservabile classica corrispondente all’operatore akλ `e data dal valore di aspettazione ψ| akλ |ψ , e tale osservabile deve soddisfare l’equazione d ψ| a |ψ = −i ωk ψ| a |ψ . kλ kλ dt Tenendo conto d’altra parte che lo stato |ψ obbedisce all’equazione di Schr¨odinger, si ha d i ψ| a |ψ = ψ|[ H, a ]|ψ kλ kλ dt h ¯ e, sostituendo l’espressione trovata per H,
,
i d ω ψ|[ a a† + a† a , a ]|ψ ψ| a |ψ = kλ k λ k λ kλ k λ k λ dt 2 k
.
k λ
Identificando le due espressioni trovate per la derivata dell’osservabile, si ha ωk ψ| akλ |ψ = − 12
& k λ
ωk ψ|[ ak λ a†k λ + a†k λ ak λ , akλ ]|ψ
.
Poich´e l’espressione a secondo membro deve contenere, come quella a primo membro, soltanto quantit` a dipendenti dagli indici k e λ, e poich´e ci`o deve verificarsi per qualsiasi vettore di stato |ψ , si deve avere
107
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
[a , a ] = 0 k λ
per k = k, λ = λ ,
(4.6)
[a , a† ] = 0
per k = k, λ = λ ,
(4.7)
kλ
kλ
k λ
il che significa che operatori a e a† relativi a modi diversi commutano. L’equazione precedente risulta quindi ψ| a |ψ = − 12 ψ| a [ a† , a ] + [ a† , a ] a | ψ kλ
kλ
kλ
kλ
kλ
kλ
kλ
.
Essendo il vettore di stato arbitrario, questa equazione pu`o essere soddisfatta solo ponendo [ a , a† ] = 1 , kλ
kλ
(4.8)
e l’Hamiltoniana assume la forma H=
h ¯ ωk a† a + 21 . kλ kλ
(4.9)
kλ
Confrontando i risultati contenuti nelle Eq. (4.6)-(4.9) con quelli del Par. 4.1 (Eq. (4.1) e (4.2)), possiamo concludere che l’Hamiltoniana quantistica del campo elettromagnetico risulta pari alla somma di tante Hamiltoniane di oscillatore armonico, indipendenti fra loro; ciascun oscillatore `e associato a un modo del campo di radiazione caratterizzato dal vettore d’onda k (e quindi dalla frequenza angolare ωk ) e dal versore di polarizzazione ekλ . Ricordando i risultati del Par. 4.1 si ha che l’energia relativa a ciascun modo pu`o assumere soltanto uno dei valori Ekλ = h ¯ ωk (n + 12 ) , dove n `e un intero arbitrario maggiore o uguale a 0. Questo risultato si interpreta dicendo che il modo contiene un numero n di fotoni tutti di energia h ¯ ωk . Il numero n prende anche il nome di numero d’occupazione del modo. In particolare, se n = 0, l’energia assume il valore 12 h ¯ ωk , ovvero si ottiene la cosiddetta energia di zero. Tale energia ha, in molti casi, un’importanza puramente formale e pu`o essere ignorata in gran parte delle applicazioni. Si deve notare che, essendo il numero di modi infinito, l’energia di zero del campo elettromagnetico `e infinita. Per interpretare in maniera coerente la realt` a fisica si `e costretti a “rinormalizzare” l’energia che compete allo stato di vuoto imponendo che essa sia zero. Poich´e l’Hamiltoniana totale `e uguale alla somma di tante Hamiltoniane indipendenti, ne consegue che i suoi autovalori sono uguali alla somma degli autovalori delle singole Hamiltoniane. Gli autovalori dell’Hamiltoniana totale sono quindi della forma
108
CAPITOLO 4
E=
h ¯ ωk (nkλ + 12 ) ,
kλ
e risultano individuati dall’insieme dei numeri interi nkλ che specificano il numero di fotoni presenti in ciascun modo. Per quanto riguarda l’identificazione degli autovettori, ovvero degli stati stazionari del campo di radiazione, si pu`o utilizzare una generalizzazione del formalismo introdotto nel Par. 4.1 scrivendo l’autovettore nella forma compatta |n1 , n2 , . . . , nkλ , . . .
= |n1 |n2 · · · |nkλ · · · ,
ovvero come il prodotto diretto di tanti “ket” ciascuno definito in uno spazio di Hilbert diverso. Ciascun operatore a o a† opera soltanto sul vettore |nkλ kλ kλ relativo al modo corrispondente, per cui si ha a |n1 , n2 , . . . , nkλ , . . .
=
√ nkλ |n1 , n2 , . . . , nkλ − 1, . . .
a† |n1 , n2 , . . . , nkλ , . . .
=
# nkλ + 1 |n1 , n2 , . . . , nkλ + 1, . . .
kλ
kλ
,
(4.10) ,
(4.11)
il che giustifica il nome di operatori di distruzione e creazione di fotoni dato rispettivamente agli operatori akλ e a† . kλ Il formalismo introdotto in questo paragrafo prende il nome di formalismo della seconda quantizzazione. Questa denominazione non `e del tutto giustificata nel caso della quantizzazione del campo elettromagnetico ma trae origine dal fatto che procedimenti del tutto analoghi possono essere applicati alla quantizzazione di campi di particelle. Volendo ad esempio introdurre la quantizzazione di un campo di particelle non relativistiche di massa m, si parte dall’equazione di Schr¨ odinger per la funzione d’onda delle particelle stesse ih ¯
∂ h ¯2 2 ψ(x, t) = − ∇ ψ(x, t) , ∂t 2m
si sviluppa la funzione d’onda ψ(x, t) in serie di Fourier, e si interpretano poi i coefficienti dello sviluppo come operatori quantistici. In questo caso ha effettivamente senso parlare di seconda quantizzazione, in quanto il campo di particelle `e gi` a descritto da un’equazione d’onda quantistica. Nel caso dell’elettromagnetismo, invece, l’equazione d’onda per i fotoni `e una equazione classica che discende dalle equazioni di Maxwell. Per concludere, bisogna osservare che il formalismo che abbiamo qui introdotto non `e covariante, dato che non `e covariante l’espressione assunta per il = 0). La quantizzazione del campo eletgauge elettromagnetico (φ = 0, divA tromagnetico in forma covariante, pi` u elegante e sicuramente pi` u soddisfacente
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
109
dΩ P
Ω
dS fluisce attraFig. 4.1. La radiazione contenuta nell’angolo solido dΩ, centrato intorno a Ω, verso l’elemento di superficie dS.
dal punto di vista teorico1 , richiede l’utilizzazione di un formalismo pi` u pesante che non `e per` o necessario per molte applicazioni, quali quelle che saranno sviluppate nei Cap. 11 e 15 per trattare l’interazione fra materia e radiazione.
4.4 Intensit` a e fotoni Il concetto di fotone introdotto nel paragrafo precedente pu`o essere messo in stretta relazione con le quantit`a fisiche tradizionalmente impiegate per la descrizione dei fenomeni di irraggiamento, quali l’intensit`a specifica e la densit`a di energia del campo di radiazione. Si consideri un punto arbitrario P dello spazio e un elemento di superficie dS Indichiamo con la cui direzione normale `e individuata dal versore unitario Ω. dEν l’energia del campo elettromagnetico, avente frequenza compresa fra ν e che ν + dν e direzione compresa entro l’angolo solido dΩ centrato intorno a Ω, fluisce, nel tempo infinitesimo dt, attraverso il dS (si veda la Fig.4.1). Il dEν `e ovviamente proporzionale al prodotto dS dν dt dΩ e si ha quindi t) dS dν dt dΩ . dEν = Iν (P, Ω, t) che prende Questa equazione definisce implicitamente la quantit`a Iν (P, Ω, il nome di intensit` a specifica (o intensit`a tout court) del campo di radiazione e che `e in generale funzione, oltre che della frequenza, del punto, della direzione e del tempo. Se l’intensit` a non dipende dal tempo, il campo di radiazione si dice stazionario, se non dipende dalla direzione si dice isotropo e se non dipende dal punto P si dice omogeneo. In luogo dell’intensit` a specifica Iν si pu` o anche considerare la quantit` a Iλ che porta lo stesso nome e che `e definita dalla stessa equazione, eccetto per l’intervallo di frequenza dν che `e sostituito dall’intervallo di lunghezza d’onda 1
Si veda ad esempio J.D. Bjorken & S.D. Drell, Relativistic Quantum Fields, McGraw-Hill, New York, etc., 1965.
110
CAPITOLO 4
dλ. Analogamente si pu` o anche considerare la quantit` a Iω anch’essa definita dalla medesima equazione con il dω (intervallo di frequenza angolare) in luogo del dν (intervallo di frequenza). Evidentemente, per intervalli corrispondenti si ha Iν dν = Iλ dλ = Iω dω , e poich´e dλ = λ2 dν/c, dω = 2π dν, si ha anche Iλ =
c Iν , λ2
Iω =
1 Iν . 2π
(4.12)
Altra quantit` a, strettamente connessa all’intensit`a specifica, `e la densit` a di t), energia del campo di radiazione. Tale quantit` a, indicata col simbolo u ν (P, Ω, `e definita facendo riferimento a un elemento di volume dV centrato intorno al punto P. Se si indica con dEν la quantit` a di energia elettromagnetica contenuta nel dV e avente frequenza compresa fra ν e ν + dν e direzione contenuta nel dΩ si ha, per definizione t) dV dν dΩ . dEν = uν (P, Ω, Poich´e la radiazione elettromagnetica si propaga con velocit`a c, ne segue immediatamente la relazione fra Iν e uν , ovvero t) = c uν (P, Ω, t) . Iν (P, Ω,
(4.13)
Consideriamo adesso i modi del campo di radiazione che corrispondono all’intervallo di frequenza (ν, ν + dν) e alle direzioni contenute nell’angolo solido dΩ. Il numero di tali modi `e dato dall’Eq. (4.3) che, trasformando il dk nel dν per mezzo della relazione k = 2πν/c, d` a dN =
2 V ν2 dν dΩ , c3
(4.14)
dove V `e il volume di normalizzazione che possiamo qui identificare come il t) il numero di fotoni per volume infinitesimo dV . Se indichiamo con nν (P, Ω, modo relativo a tali modi e se ricordiamo che ciascun fotone ha energia h ν si ottiene 2 t) h ν 2 ν dV dν dΩ , dEν = nν (P, Ω, c3
e ricordando la definizione di uν si ottiene la relazione t) = uν (P, Ω,
2 h ν3 t) , nν (P, Ω, c3
ovvero, in termini di intensit` a specifica
QUANTIZZAZIONE DEL CAMPO ELETTROMAGNETICO
3 t) = 2 h ν nν (P, Ω, t) . Iν (P, Ω, c2
111
(4.15)
` importante osservare che un’espressione analoga vale anche classicamente. E In questo caso, invece di parlare di numero di fotoni per modo si parla pi` u semplicemente di energia per modo e, indicando con ν (P, Ω, t) tale quantit` a, si ha 2 ν2 ν (P, Ω, t) . (4.16) c2 Il numero di fotoni per modo `e una quantit` a molto importante che pu` o servire a caratterizzare in maniera fisica le sorgenti luminose. Come vedremo nel Cap. 10, per una sorgente termica tale numero `e dato da Iν (P, Ω, t) =
nν =
1 , e h ν/(kB T )
dove T `e la temperatura. Nel visibile a 5000 ˚ A, ad esempio, una normale lampada a incandescenza con filamento di Tungsteno (T 2700 K) produce una radiazione avente circa 2 × 10−5 fotoni per modo, mentre tale numero `e circa 10−2 per la radiazione solare (T 5800 K). La radiazione emessa da un laser, invece, presenta un numero di fotoni per modo molto pi` u elevato che pu`o raggiungere valori tipici dell’ordine di 107 o anche superiori.
Capitolo 5
Equazioni d’onda relativistiche Per poter porre su base quantitativa lo studio degli spettri atomici, cui saranno dedicati i prossimi capitoli di questo volume, `e necessario premettere uno studio approfondito delle equazioni relativistiche per le particelle atomiche con particolare riguardo all’equazione di Dirac per l’elettrone. In questo capitolo vedremo come sia possibile descrivere, nell’ambito della meccanica quantistica, le propriet` a dinamiche di una particella relativistica libera, oppure mobile in un campo elettromagnetico stazionario. Questo ci porter`a a introdurre un appropriato formalismo di tipo matriciale dal quale scaturiscono, in maniera del tutto naturale, un certo numero di conseguenze fisiche che sono spesso assunte in maniera fenomenologica nei trattati elementari di spettroscopia atomica (spin dell’elettrone, interazione spin-orbita, etc.).
5.1 Equazione di Dirac per la particella libera La relazione impulso-energia per una particella libera non relativistica di massa m `e espressa dall’equazione E=
p2 , 2m
dove p `e l’impulso, che coincide con il momento cinetico coniugato alla variabile posizione x. Il moto della particella `e descritto in meccanica quantistica dall’equazione di Schr¨ odinger ih ¯
∂ p2 |ψ = |ψ ∂t 2m
,
dove p `e l’operatore associato alla variabile dinamica classica “impulso”. L’operatore p deve soddisfare la relazione fondamentale della meccanica quantistica che stabilisce che fra gli operatori associati a due variabili dinamiche canonicamente coniugate, q e p, deve valere la regola di commutazione [ q, p ] = i h ¯ . L’espressione esplicita dell’operatore p dipende dalla particolare rappresentazione utilizzata per esprimere i vettori di stato dello spazio di Hilbert. Se si sce-
114
CAPITOLO 5
glie la rappresentazione nella quale i vettori di stato sono espressi come combinazioni lineari degli autovettori dell’operatore posizione (rappresentazione della funzione d’onda), l’operatore x `e il semplice moltiplicatore mentre l’operatore p risulta p = −i h ¯ grad . In tale rappresentazione l’equazione di Schr¨odinger assume la forma ih ¯
∂ h ¯2 2 ψ(x, t) = − ∇ ψ(x, t) , ∂t 2m
e, in accordo con i postulati della meccanica quantistica, la quantit` a |ψ(x, t)|2 rappresenta la densit`a di probabilit` a di trovare la particella nell’intorno del punto x all’istante t. Passando alla dinamica relativistica, la relazione impulso-energia diventa E 2 = p 2 c2 + m 2 c4 , ovvero E=
# p 2 c2 + m 2 c4 ,
dove m `e la massa a riposo della particella e c `e la velocit`a della luce. Si potrebbe quindi pensare di scrivere un’equazione di Schr¨odinger del tipo ih ¯
# ∂ ψ(x, t) = p2 c2 + m2 c4 ψ(x, t) , ∂t
h2 ∇2 . La radice quadrata presente al secondo memin cui p2 `e l’operatore −¯ bro pone tuttavia dei seri problemi interpretativi riguardo al significato da attribuire all’operatore che agisce sulla funzione d’onda. Se, ad esempio, si sostituisce alla radice quadrata il suo sviluppo in serie di potenze, si ottengono potenze di tutti gli ordini in ∇2 e l’equazione risulta praticamente insolubile. Un’equazione di gran lunga pi` u semplice si ottiene traducendo in termini quantistici la relazione quadratica fra energia e impulso scritta sopra. L’equazione risultante, detta equazione di Klein-Gordon, `e la seguente m 2 c2 1 ∂2 2 ∇ − 2 2 ψ(x, t) = ψ(x, t) . c ∂t h ¯2 Tuttavia questa equazione, oltre a presentare l’inconveniente di essere un’equazione differenziale del secondo ordine rispetto al tempo (a differenza dell’equazione di Schr¨ odinger che `e del primo ordine), descrive correttamente soltanto le particelle relativistiche che non presentano spin, quali ad esempio i bosoni. Il problema di determinare un’equazione relativistica che potesse descrivere particelle dotate di spin, quali l’elettrone, fu brillantemente risolto da Dirac, il
115
EQUAZIONI D’ONDA RELATIVISTICHE
quale, nel 1928, propose un’equazione d’onda nella quale gli operatori ∂/∂xi comparivano linearmente al pari dell’operatore ∂/∂t, approccio del tutto naturale in una teoria relativistica in cui la coordinata temporale non `e privilegiata rispetto alle coordinate spaziali. L’equazione proposta da Dirac, che ovviamente porta il suo nome, `e la seguente ∂ ∂ ∂ ∂ 2 ih ¯ ψ(x, t) = −i h ¯ c α1 + β m c ψ(x, t) , + α2 + α3 ∂t ∂x1 ∂x2 ∂x3 e pu` o anche essere scritta nella forma pi` u compatta ∂ ψ(x, t) = HD ψ(x, t) = c α (5.1) · p + β m c2 ψ(x, t) , ∂t dove HD `e la cosiddetta Hamiltoniana di Dirac e dove α1 , α2 , α3 , e β sono quattro quantit` a adimensionali, aventi carattere operatoriale, le quali godono, per definizione, della propriet` a di commutare con gli operatori ∂/∂t e ∂/∂xi . Tali quantit` a vengono determinate imponendo che dall’equazione di Dirac si ottenga la corretta relazione relativistica fra energia e impulso. Derivando rispetto al tempo l’Eq. (5.1) e risostituendo l’equazione stessa, si ottiene ih ¯
−¯ h2
∂2 · p + β m c2 ψ(x, t) , ψ(x, t) = c α · p + β m c2 c α 2 ∂t
e si deve quindi imporre che cα · p + β m c2 c α · p + β m c2 = p2 c2 + m2 c4 . Sviluppando (e facendo attenzione a non alterare l’ordine degli operatori non commutanti), si ottiene
c2
ij
αi αj pi pj + m c3
(αi β + β αi ) pi + m2 c4 β 2 = c2
i
p i p i + m 2 c4 ,
i
e quindi, per avere un identit` a fra il primo e il secondo membro, si devono imporre le condizioni {αi , αj } = 2 δij ,
{αi , β} = 0 ,
β2 = 1 ,
(5.2)
dove si `e introdotto il simbolo di anticommutatore definito da {A, B} = AB + BA . Gli enti pi` u semplici che soddisfano una tale algebra sono delle matrici, di cui adesso andiamo a studiare le propriet` a. Innanzitutto, essendo il quadrato
116
CAPITOLO 5
di ciascuna delle quattro matrici uguale all’unit` a, gli autovalori devono essere uguali a ±1. Inoltre, essendo β 2 = 1 e β αi = −αi β, per la traccia di ciascuna delle matrici αi si ottiene la seguente relazione Tr(αi ) = Tr(β 2 αi ) = −Tr(β αi β) . D’altra parte, per la propriet` a ciclica della traccia di una matrice si ha anche Tr(αi ) = Tr(β 2 αi ) = Tr(β αi β) . Avendo quindi ottenuto Tr(αi ) = −Tr(αi ), si deve necessariamente avere Tr(αi ) = 0 . In maniera del tutto analoga si prova anche che Tr(β) = 0. Quindi, poich´e la traccia `e la somma degli autovalori, e poich´e questi ultimi possono essere soltanto uguali a ±1 (in quanto le matrici hanno per quadrato l’unit` a), ne consegue che le matrici devono essere di ordine pari. Non essendo possibile costruire quattro matrici 2 × 2 che obbediscano all’algebra delle Eq. (5.2), la scelta cade sulle matrici 4 × 4. Risulta quindi che gli enti αi e β introdotti nell’equazione di Dirac possono essere rappresentati mediante matrici di ordine 4. Tali matrici prendono il nome di matrici di Dirac. La scelta delle matrici di Dirac non `e univoca. Una possibile rappresentazione, che risulta particolarmente adatta a trattare il limite non relativistico, `e quella data, in termini di matrice 2 × 2, dalle seguenti espressioni I 0 0 σi αi = , (5.3) , β= 0 −I σi 0 dove I `e la matrice unit` a di ordine 2 e dove le σi sono le matrici 2 × 2 di Pauli 0 1 0 −i 1 0 , σ2 = , σ3 = . σ1 = 1 0 i 0 0 −1 A partire dalle loro espressioni si pu`o facilmente mostrare che le matrici di Pauli soddisfano le relazioni [ σi , σj ] = 2 i ijk σk , k
{σi , σj } = 2 δij , dove ijk `e il tensore completamente antisimmetrico, o tensore di Ricci (si veda l’App. 2). Le due equazioni precedenti possono essere condensate nell’unica σi σj = δij + i ijk σk . k
EQUAZIONI D’ONDA RELATIVISTICHE
117
` facile verificare che le quattro matrici definite nelle Eq. (5.3), ovvero le quatE tro matrici ⎛
0 ⎜0 α1 = ⎝ 0 1 ⎛ 0 ⎜0 α3 = ⎝ 1 0
0 0 1 0
0 1 0 0
0 0 0 −1
1 0 0 0
⎞ 1 0⎟ ⎠ , 0 0 ⎞ 0 −1 ⎟ ⎠ , 0 0
⎛
0 ⎜0 α2 = ⎝ 0 i ⎛ 1 ⎜0 β=⎝ 0 0
⎞ 0 0 −i 0 i 0 ⎟ ⎠ , −i 0 0 0 0 0 ⎞ 0 0 0 1 0 0 ⎟ ⎠ , 0 −1 0 0 0 −1
` importante sottolineare che esisoddisfano l’algebra delle matrici di Dirac. E stono infinite rappresentazioni delle matrici di Dirac. Dato infatti un set di matrici di Dirac, un qualsiasi altro set ottenuto dal precedente mediante una trasformazione di similitudine arbitraria `e anch’esso un set di matrici di Dirac1 . Bisogna infine osservare che il carattere matriciale dell’equazione di Dirac comporta automaticamente che la funzione d’onda non sia pi` u uno scalare ma un ente a quattro componenti detto spinore. L’equazione di Dirac per la particella libera pu` o essere risolta esattamente. Cerchiamo infatti una soluzione della forma ψ(x, t) = W e i (q·x−E t)/¯h , dove W `e uno spinore a quattro componenti indipendente da x e t. Sostituendo nell’Eq. (5.1), si trova che lo spinore W deve soddisfare l’equazione E W = (c α · q + β m c2 ) W . Il problema di determinare i possibili valori per E `e ricondotto alla soluzione dell’equazione caratteristica ⎛
m c2 − E 0 ⎜ Det ⎝ c qz c q+
0 mc − E c q− −c qz 2
c qz c q+ −m c2 − E 0
⎞ c q− −c qz ⎟ ⎠=0 , 0 2 −m c − E
dove si `e posto q+ = qx + i qy ,
q− = qx − i qy .
Risolvendo il determinante si ottiene l’equazione di quarto grado in E 1
Una rappresentazione particolarmente utile per trattare il limite ultra-relativistico `e la cosiddetta rappresentazione di Majorana.
118
CAPITOLO 5
(E 2 − c2 q 2 − m2 c4 )2 = 0 , che ammette le quattro soluzioni E1 = E2 = ε ,
E3 = E4 = −ε ,
dove ε=
# c 2 q 2 + m 2 c4 .
Si sono cos`ı ottenute due soluzioni a energia positiva, con la corretta relazione relativistica fra energia e impulso, ma anche due soluzioni a energia negativa (anch’esse con la corretta relazione fra energia e impulso). Le soluzioni a energia negativa scaturiscono naturalmente dall’equazione di Dirac e sono una caratteristica peculiare delle equazioni d’onda relativistiche (si pu`o mostrare infatti che anche l’equazione di Klein-Gordon ammette soluzioni a energia negativa). Una volta trovati gli autovalori si pu` o passare alla determinazione dei corrispondenti autovettori. Si pu` o facilmente verificare che i quattro spinori W1 , W2 , W3 , e W4 , dati da ⎛
⎞ ε + m c2 1 0 ⎜ ⎟ W1 = # ⎝ ⎠ , 2 c qz 2 ε(ε + m c ) c q+ ⎛
⎞ −c qz 1 ⎜ −c q+ ⎟ W3 = # ⎝ 2⎠ , 2 ε(ε + m c2 ) ε + m c 0
⎛
⎞ 0 2 1 ⎜ε + mc ⎟ W2 = # ⎝ ⎠ , 2 c q− 2 ε(ε + m c ) −c qz ⎛
⎞ −c q− 1 ⎜ c qz ⎟ W4 = # ⎝ ⎠ , 0 2 ε(ε + m c2 ) ε + m c2
costituiscono quattro autovettori ortogonali e normalizzati corrispondenti, rispettivamente, ai quattro autovalori E1 , E2 , E3 e E4 . Queste espressioni mostrano che, al limite non relativistico, le ultime due componenti degli spinori a energia positiva sono trascurabili rispetto alle prime due. L’opposto `e vero per gli spinori a energia negativa. Le soluzioni a energia negativa furono opportunamente interpretate dallo stesso Dirac, il quale fu condotto a ipotizzare, e quindi a predire, l’esistenza di antiparticelle. L’interpretazione data da Dirac, qui esemplificata per il caso degli elettroni, `e la seguente: si pu` o pensare che lo stato di vuoto, ovvero lo stato in cui nessuna particella `e presente, sia in realt`a la situazione in cui tutti gli stati a energia negativa sono riempiti in accordo col principio di Pauli (mare di Fermi). Quando un elettrone, eccitato ad esempio per assorbimento di un quanto di radiazione di energia superiore al valore di soglia 2 m c2 (pari a circa 1 MeV), passa da uno stato di energia negativa a uno stato di energia positiva,
119
EQUAZIONI D’ONDA RELATIVISTICHE
esso lascia nel mare di Fermi una “lacuna”. Tale lacuna si comporta come una particella in tutto simile all’elettrone, ma di carica opposta, che viene detta positrone (o positone o elettrone positivo). In altre parole, si pu`o pensare che l’eccitazione di un elettrone da uno stato di energia negativa a uno stato di energia positiva dia luogo alla creazione di una coppia elettrone-positrone con conseguente annichilazione di un quanto di radiazione. I positroni furono rivelati sperimentalmente da Anderson nel 1932 con un esperimento in camera di Wilson. La scoperta dell’antiprotone avvenne molto pi` u tardi, nel 1955, ad opera di Chamberlain e Segr`e, quando si resero disponibili acceleratori di particelle con energie dell’ordine di qualche GeV.
5.2 Equazione di Dirac per l’elettrone in un campo elettromagnetico L’Hamiltoniana classica di una particella relativistica, dotata di carica e mobile in un campo elettromagnetico, si scrive nella forma $ H=
e 2 c2 p − A + m 2 c4 + e φ , c
(5.4)
dove e `e il valore algebrico della carica della particella, m la sua massa a e φ sono i potenziali elettromagnetici e infine p riposo, A `e il momento cinetico coniugato alla posizione della particella, che `e connesso all’impulso π dalla relazione e π = p − A . c Questa espressione dell’Hamiltoniana pu`o essere dedotta in varie maniere. Noi ci limitiamo qui a verificare che essa conduce alle corrette equazioni di moto. Per far questo, ricaviamo tali equazioni per mezzo delle equazioni di Hamilton −1/2 dx ∂H e 2 e 2 = v = = c2 p − A − A + m 2 c4 , c p dt ∂ p c c −1/2 ∂H e 2 e 2 d p 2 4 =− = c e (gradA ) · p − A c p − A + m c − e gradφ . dt ∂x c c Dalla seconda equazione, introducendo v , si ha e d p ) · v − e gradφ . = (gradA dt c Se adesso teniamo presente l’identit` a vettoriale (si veda l’Eq. (A2.9))
120
CAPITOLO 5
= (gradA ) · v − v · gradA , v × rotA = B, si ottiene e ricordiamo che rotA e d p + e v · gradA − e gradφ . = v × B dt c c Per l’impulso π si ha quindi e e d dπ + e v · gradA − e gradφ − e dA . p − A = = v × B dt dt c c c c dt L’ultimo termine del secondo membro rappresenta la derivata totale (o Euleriana) del potenziale vettore lungo la traiettoria della particella. Esso vale ∂A dA , = + v · gradA dt ∂t per cui, ricordando l’espressione del campo elettrico in termini dei potenziali elettromagnetici, si ha infine dπ + e v × B . = eE dt c Questa equazione, unita all’altra che si ottiene, con facili passaggi, dalla prima equazione di Hamilton, ovvero m π = # v , 1 − v 2 /c2 mostra che l’Hamiltoniana da cui siamo partiti `e corretta, in quanto essa conduce alle ben note equazioni relativistiche del moto di una particella carica in un campo elettromagnetico. Confrontando l’espressione dell’Hamiltoniana (5.4) con quella della particella libera, si vede che, per una particella carica in un campo elettromagnetico, sussiste, fra le quantit`a e A , c la stessa relazione che sussiste, per la particella libera, fra le quantit`a E e p. Questo significa che, in meccanica classica (relativistica), si passa dalla descrizione della particella libera a quella della particella carica in presenza di un campo elettromagnetico operando nell’Hamiltoniana la sostituzione formale E −eφ ,
p −
e A , E → E −eφ . (5.5) c Questa sostituzione formale `e conosciuta sotto il nome di regola, o principio, dell’accoppiamento minimale. p → p −
EQUAZIONI D’ONDA RELATIVISTICHE
121
Per il principio di corrispondenza si pu` o allora scrivere l’equazione di Dirac per una particella carica in un campo elettromagnetico applicando la regola dell’accoppiamento minimale all’Eq. (5.1). Si ha ih ¯
∂ e ψ(x, t) = c α · p − A + β m c2 + e φ ψ(x, t) , ∂t c
(5.6)
dove α e β sono le matrici 4 × 4 introdotte precedentemente, ovvero le matrici e φ sono, dal punto di vista operatoriale, dei moltiplicatori di Dirac, mentre A funzioni del punto e, eventualmente, del tempo. Si pu` o notare infine che, se si esegue una trasformazione di gauge sui potenziali elettromagnetici, ovvero se si pone = A − gradχ , A
φ = φ +
1 ∂χ , c ∂t
la nuova equazione di Dirac cos`ı ottenuta ammette per soluzione la funzione d’onda ψ (x, t) data da ψ (x, t) = ψ(x, t) e−i δ , dove δ=
eχ . h ¯c
Si ottiene quindi il risultato che, per trasformazioni di gauge, la funzione d’onda si trasforma secondo un fattore di fase. La fase risulta proporzionale alla funzione χ, generatrice della trasformazione di gauge stessa. In particolare, il modulo quadro della funzione d’onda `e invariante per trasformazioni di gauge.
5.3 Limite non relativistico dell’equazione di Dirac Per ottenere il limite non relativistico dell’equazione di Dirac per la particella carica in un campo elettromagnetico, `e conveniente scrivere la funzione d’onda ψ(x, t), che `e uno spinore di ordine 4, nella forma 2 χ e−i (m c +) t/¯h , ψ(x, t) = (5.7) ξ dove χ e ξ sono due spinori di ordine 2, e dove l’energia totale `e stata scritta nella forma (m c2 + ) in maniera tale che venga a rappresentare l’energia della particella a meno dell’energia di riposo m c2 . Il limite non relativistico si ottiene imponendo che sia mc2 . Allo stesso tempo, per` o, bisogna imporre
122
CAPITOLO 5
che le altre energie in gioco, come ad esempio l’energia elettrostatica, eφ, siano anch’esse piccole rispetto all’energia di riposo. Sostituendo la funzione d’onda (5.7) nell’Eq. (5.6) e supponendo che gli spinori χ e ξ siano, al pari dei potenziali elettromagnetici, indipendenti dal tempo, si ha e χ χ χ χ 2 , (m c + ) = cα · p − A +eφ + mc β ξ ξ ξ ξ c 2
e tenendo presente l’espressione esplicita delle matrici di Dirac (Eq. (5.3)), si ottengono le due equazioni accoppiate per gli spinori χ e ξ e c σ · p − A ξ = ( − e φ)χ , c e (2 m c2 + − e φ) ξ = c σ · p − A χ . c Ricaviamo adesso ξ dalla seconda equazione moltiplicando ambo i membri a sinistra per l’operatore (2 m c2 + − e φ)−1 . Si ottiene e ξ = (2 m c2 + − e φ)−1 c σ · p − A χ , (5.8) c e sostituendo questa espressione nella prima equazione, si ha e e c σ · p − A (2 m c2 + − e φ)−1 c σ · p − A χ = ( − e φ)χ . c c
(5.9)
Questa `e un’equazione esatta; il limite non relativistico si ottiene supponendo che sia ( − e φ) m c2 , e sviluppando l’operatore (2 m c2 + − e φ)−1 in serie di potenze
(2 m c2 + − e φ)−1
2 −eφ 1 −eφ 1− = + + ··· . 2 m c2 2 m c2 2 m c2
(5.10)
Gli ordini successivi del limite non relativistico dell’equazione di Dirac si ottengono andando a considerare i vari termini presenti nella parentesi quadra a secondo membro. Se si considera solo il primo termine, si ottiene il limite all’ordine 0, se si considerano i primi due termini, si ottiene il limite all’ordine 1, e cos`ı via.
EQUAZIONI D’ONDA RELATIVISTICHE
123
5.4 Limite all’ordine zero. Equazione di Pauli Consideriamo prima di tutto il limite non relativistico all’ordine pi` u basso, ovvero trascuriamo tutti i termini eccetto l’unit`a nell’Eq.(5.10) e sostituiamo il risultato nelle Eq. (5.8) e (5.9). Le equazioni per gli spinori χ e ξ risultano 1 e 2 σ · p − A χ = ( − e φ)χ , 2m c 1 e ξ= σ · p − A χ . 2mc c Quest’ultima equazione mostra che, essendo per una particella non relativistica ' e '' ' − A 'p ' = | π | m c , c risulta anche, per la norma dei due spinori |ξ| |χ| . Riprendiamo adesso l’equazione per χ e osserviamo che, se a e b sono due vettori qualsiasi che non commutano necessariamente fra loro, ma commutano con le matrici di Pauli, si ottiene, attraverso le propriet`a delle matrici stesse (σ · a )(σ · b ) = a · b + i σ · a × b . Tenendo conto di questa propriet`a, l’equazione per χ risulta
1 e 2 e i e p − A σ · p − A + × p − A χ = ( − e φ)χ . 2m c 2m c c
Il secondo addendo in parentesi quadra (che risulterebbe nullo nel caso le due non fossero operatori) pu` quantit` a p e A o essere trasformato sfruttando la regola di commutazione ¯ [ pi , Aj ] = −i h
∂Aj . ∂xi
Si ottiene, con facili passaggi ¯ e e ieh ¯ = ieh rotA p − A × p − A = B , c c c c `e il vettore campo magnetico. Sostituendo questo risultato si ottiene dove B infine il limite non relativistico dell’equazione di Dirac all’ordine zero, ovvero
124
CAPITOLO 5
e 2 1 eh ¯ p − A − σ · B + e φ χ = χ . 2m c 2mc
Questa equazione `e nota come equazione di Pauli e, a parte il secondo fattore in parentesi quadra, pu` o essere ottenuta in maniera diretta applicando il principio dell’accoppiamento minimale (Eq. (5.5)) all’equazione di Schr¨odinger era stato per la particella libera. Il termine aggiuntivo, proporzionale a σ · B, introdotto fenomenologicamente da Pauli per descrivere l’accoppiamento fra il momento magnetico intrinseco dell’elettrone e il campo magnetico. Tale termine contiene infatti il vettore σ che, come vedremo meglio in seguito, `e pro` interessante osservare che, nella teoria di porzionale allo spin dell’elettrone. E Dirac, lo spin compare in maniera del tutto naturale quale effetto relativistico di ordine zero. Consideriamo adesso un caso particolare dell’equazione di Pauli, ovvero il caso di una particella non relativistica mobile, oltre che in un potenziale elettrostatico φ, in un campo magnetico costante. Tale campo magnetico discende da un potenziale vettore della forma = A
1 2
× x , B
= 0. Infatti, tenendo conto dell’identit` che soddisfa la condizione divA a vettoriale (A2.6) si ha = −1 B · gradx + rotA 2
1 2
divx = B
1 2
+ 3B )=B . (−B
D’altra parte si ha anche 2 e 2 e 1 p2 +A · p ) + e A2 . p − A − ( p·A = 2m c 2m 2mc 2 m c2 Questa quantit` a pu` o essere trasformata tenendo conto che
+A · p = 2 A · p − i h = 2A · p = B × x · p = B ·M , p · A ¯ divA = x × p dove M `e il momento angolare orbitale della particella che porremo =h nella forma M ¯ . Inoltre A2 =
1 4
× x )2 = (B
1 4
· x )2 ] = [B 2 x2 − (B
1 4
B 2 x2⊥ ,
Sostidove x⊥ rappresenta la componente di x nel piano perpendicolare a B. tuendo questi risultati intermedi, l’equazione di Pauli per la particella carica, mobile in un campo magnetico uniforme e in un campo elettrico di potenziale φ, risulta 2 p eh ¯ e2 2 2 − ( + σ ) · B + B x⊥ + e φ χ = χ . (5.11) 2m 2mc 8 m c2
EQUAZIONI D’ONDA RELATIVISTICHE
125
μ
a Fig. 5.1. Una particella carica che percorre l’orbita di area a d` a luogo, per il principio di equivalenza di Amp`ere, a un momento magnetico μ. Il caso disegnato in figura corrisponde a un valore positivo della carica.
Il significato fisico dei vari termini che compaiono in questa equazione `e immediato: p2 /(2m) `e l’energia cinetica della particella, −e¯ h( · B)/(2mc) `e l’energia di interazione del momento angolare orbitale col campo magnetico, −e¯ h(σ · B)/(2mc), il termine introdotto fenomenologicamente da Pauli, `e l’energia di interazione del momento angolare intrinseco (spin) col campo magnetico, eφ `e l’energia elettrostatica e, infine, e2 B 2 x2⊥ /(8mc2 ) `e un termine, sempre positivo, che viene chiamato termine diamagnetico. La presenza del termine di interazione fra il momento angolare orbitale e il campo magnetico pu` o essere giustificata anche attraverso delle considerazioni fisiche elementari quando si supponga che la particella sia mobile in un campo di forze centrale. In tal caso, ragionando classicamente, la particella `e infatti soggetta a un moto periodico caratterizzato da un’orbita chiusa (si veda la Fig. 5.1). Si pu` o allora pensare di associare alla particella una corrente elettrica i e quindi, in base al principio di equivalenza di Amp`ere, un momento magnetico “classico” μ c dato dall’espressione μ c =
i a , c
dove a `e un vettore che ha per modulo l’area dell’orbita, per direzione la normale al piano dell’orbita, e per senso quello stabilito dalla regola della vite destra (regola del cavatappi). Se T `e il periodo con cui viene percorsa l’orbita, la corrente vale e/T , per cui μ c =
e a . cT
La quantit` a a/T `e d’altra parte la velocit` a areolare della particella e pu` o essere connessa al momento angolare. Si ottiene μ c =
e e eh ¯ e a = x × v = x × p = . c T 2c 2mc 2mc
Ricordando infine che l’espressione classica per l’energia di un dipolo immerso si ottiene in un campo magnetico `e data da − μc · B,
126
CAPITOLO 5
eh ¯ ·B , 2mc che `e giusto il termine che compare nell’equazione di Pauli. Emagnetica = −
5.5 Limite al primo ordine Il limite non relativistico al primo ordine dell’equazione di Dirac si ottiene considerando i primi due termini entro la parentesi quadra dell’Eq. (5.10) e sostituendo tale equazione nella (5.9). Si ottiene e 1 e −eφ σ · p − σ · p − A 1− A χ = ( − e φ)χ . 2m c 2 m c2 c Scambiamo adesso l’ordine dei due primi fattori che compaiono a primo membro. Per far questo bisogna tener conto della regola di commutazione e ih ¯e e −eφ = σ · [ p , φ ] = − σ · gradφ . σ · p − A , 1− 2 2 c 2mc 2mc 2 m c2 Ripetendo calcoli analoghi a quelli sviluppati nel paragrafo precedente, l’equazione di Dirac risulta −eφ e 2 e 1 i e 1− p − A + σ · p − A × p − A χ 2 m c2 2m c 2m c c
e ih ¯e e gradφ · p − A − + i σ · gradφ × p − A χ = ( − e φ)χ . 2 2 4m c c c Sviluppiamo ulteriormente i calcoli solo nel caso semplificato di un campo = 0. Tenendo conto che puramente elettrostatico, per cui si pu` o supporre A p × p = 0, l’equazione precedente diviene ih ¯e − e φ p2 χ− 1− [ gradφ · p + i σ · gradφ × p ] χ = ( − e φ)χ . 2 m c2 2m 4 m 2 c2 Poich´e all’ordine zero si ha p2 χ = ( − e φ)χ , 2m il termine − e φ p2 χ , 2 m c2 2 m
127
EQUAZIONI D’ONDA RELATIVISTICHE
che `e gi` a una correzione del primo ordine, pu`o essere sostituito, a meno di ordini superiori, con una qualsiasi delle due espressioni p4 ( − e φ)2 χ , oppure χ . (5.12) 8 m 3 c2 2 m c2 Inoltre, supponendo che il potenziale nel quale si muove la particella sia un potenziale centrale (φ = φ(r)), e tenendo conto che ∂φ 1 ∂φ gradφ = vers(r ) = r , ∂r r ∂r si possono eseguire le trasformazioni ∂φ ∂ , ∂r ∂r 1 ∂φ 1 ∂φ gradφ × p = r × p = h ¯ . r ∂r r ∂r Sostituendo, si ottiene l’equazione finale per il limite non relativistico al primo ordine nel caso semplificato di un potenziale puramente elettrostatico a simmetria sferica gradφ · p = −i h ¯
p2 p4 eh ¯ 2 1 ∂φ eh ¯ 2 ∂φ ∂ +eφ− + σ · χ = χ . − 2m 8 m 3 c2 4 m2 c2 ∂r ∂r 4 m2 c2 r ∂r
(5.13)
I primi due termini rappresentano al solito l’energia cinetica e l’energia elettrostatica di ordine zero. Si pu` o cercare di dare un’interpretazione fisica degli altri termini che compaiono nell’equazione. Il termine proporzionale a p4 `e la correzione relativistica dell’energia cinetica. Si ha infatti, con ovvie notazioni
Ecin
# = c2 p2 + m2 c4 −m c2 = m c2
$
p2 1+ 2 2 −1 m c
=
p4 p2 − +· · · . 2 m 8 m 3 c2
Il termine proporzionale a σ · descrive la cosiddetta interazione spin-orbita ed era stato introdotto empiricamente nell’equazione di Schr¨odinger ancor prima che ne fosse data una spiegazione formalmente corretta attraverso l’equazione di Dirac. L’interpretazione fisica dell’interazione spin-orbita va ricercata nell’accoppiamento fra il dipolo magnetico μ c associato al momento angolare della particella e il dipolo magnetico μ s associato al momento angolare intrinseco (spin) della particella stessa. Se si ammette che i due dipoli siano paralleli, si ha per l’energia di interazione Edipolo−dipolo =
1 μ c · μ s , r3
(5.14)
128
CAPITOLO 5
dove r `e la distanza tra i due dipoli, ovvero la distanza della particella dal punto origine del potenziale centrale nel quale essa si sta muovendo. D’altra parte, se ammettiamo, come suggerito dai risultati ottenuti nel paragrafo precedente, che sia μ c =
eh ¯ , 2mc
μ s =
eh ¯ σ , 2mc
si ottiene ¯2 1 e2 h σ · . 4 m 2 c2 r 3 Questa quantit` a coincide esattamente con quella ottenuta attraverso l’equazione di Dirac qualora si scelga per φ il potenziale Coulombiano dovuto a una carica −e (opposta a quella della particella), come nel caso di un atomo di Idrogeno. In tal caso si ha infatti φ = −e/r, e il termine in questione dell’equazione di Dirac risulta Edipolo−dipolo =
2 2 eh ¯ 2 1 ∂φ ¯ 1 = e h σ · σ · = Edipolo−dipolo . 2 2 4 m c r ∂r 4 m 2 c2 r 3 L’ulteriore termine che compare nell’equazione di Dirac, ovvero il termine proporzionale a gradφ · p, viene detto termine di Darwin e non ha analogo classico. Dal punto di vista del calcolo del suo valore di aspettazione su una funzione d’onda arbitraria esso pu` o essere trasformato in modo da portarlo nella forma di un cosiddetto termine di contatto. Se ψ `e la funzione d’onda –supposta qui scalare e reale–, il valore di aspettazione del termine di Darwin (scritto nella sua forma generale, ovvero senza supporre di essere nel caso del potenziale a simmetria sferica) risulta
EDarwin =
eh ¯2 4 m 2 c2
ψ gradφ · gradψ dV .
Questo integrale pu` o essere trasformato tenendo conto che ψ gradφ · gradψ =
1 2
gradψ 2 · gradφ =
1 2
div(ψ 2 gradφ) − ψ 2 ∇2 φ
.
Se si suppone che la funzione d’onda e il campo elettrico si annullino sufficientemente all’infinito, per il teorema di Gauss il primo termine in parentesi quadra d` a contributo nullo all’integrale e si ottiene EDarwin = −
eh ¯2 8 m 2 c2
ψ 2 ∇2 φ dV .
Questa espressione mostra che, al fine del calcolo del suo valore di aspettazione, al termine di Darwin contribuiscono solo i punti dove sono presenti le cariche
129
EQUAZIONI D’ONDA RELATIVISTICHE
elettriche che generano il potenziale φ. Ad esempio, se si suppone che φ sia dovuto a un’unica carica q situata nel punto x0 , ricordando che ∇2 φ = −4π q δ(x − x0 ) , si ottiene EDarwin =
4π e q h ¯2 2 ψ (x0 ) . 8 m 2 c2
(5.15)
5.6 L’equazione di Dirac descrive una particella di spin 1/2 Nei paragrafi precedenti abbiamo gi`a introdotto il concetto di spin, anche se in maniera non del tutto precisa. Adesso vogliamo provare in maniera rigorosa che una particella descritta dall’equazione di Dirac possiede un momento angolare intrinseco che vale 1/2 in unit` a h ¯ . Per far questo, osserviamo che se un’osservabile `e una costante del moto, essa deve godere della propriet` a che l’operatore associato commuti con l’Hamiltoniana. Poich´e il momento angolare totale j di una particella libera si conserva nel tempo, si deve avere [ H , j ] = 0 . Consideriamo il commutatore dell’Hamiltoniana di Dirac col momento angolare orbitale della particella, = x × p/¯ h. Ricordando l’Eq. (5.1) si ha 1 [ H , ] = [c α · p + β m c2 , x × p ] , h ¯ e per la componente i-esima del commutatore si ottiene ⎡ ⎤ 1 ikl ⎣ c αj pj + β m c2 , xk pl ⎦ = [ H , i ] = h ¯ j kl
c ikl αj [ pj , xk ] pl = −i c ikl αk pl . = h ¯ jkl
kl
Si ha quindi, in forma intrinseca [ H , ] = −i c α × p . Se ne deduce che il momento angolare orbitale della particella non `e una costante del moto in quanto non commuta con l’Hamiltoniana.
130
CAPITOLO 5
Consideriamo adesso le matrici τ , di ordine 4, definite da τ = − 2i α ×α ,
(5.16)
dove αi sono le matrici di Dirac. Ricordando la loro definizione in termini di matrici 2 × 2 (Eq. (5.3)), si ha
τi =
− 2i
&
jk ijk
0 σj
σj 0
0 σk
σk 0
=
− 2i
&
jk ijk
σj σk 0
0 σj σk
.
D’altra parte, per le propriet` a delle matrici di Pauli vale la relazione ijk σj σk = 2 i σi , jk
per cui si ottiene τi =
σi 0
0 σi
.
Le matrici τ sono quindi una generalizzazione all’ordine 4 delle matrici 2 × 2 di ` facile mostrare che esse soddisfano le stesse relazioni di quest’ultime, Pauli. E ovvero
[τi , τj ] = 2 i
{τi , τj } = 2 δij ,
ijk τk ,
τi τj = δij + i
k
ijk τk .
k
Considerando il commutatore [ H , τ ] si ha
& & 2 = c α p + β m c , α α [H , τi ] = − 2i kl ikl j j k l j = − 2i
&
kl ikl
& j
c pj [ αj , αk αl ] + m c2 [ β , αk αl ] .
Valutando i due commutatori che compaiono nel secondo membro si ha [ αj , αk αl ] = 2 δjk αl − 2 δjl αk ,
[ β , αk αl ] = 0 ,
per cui, con facili passaggi, si ottiene infine [ H , τ ] = 2 i c α ×p . Se introduciamo quindi il vettore j attraverso la relazione j = +
1 2
τ ,
131
EQUAZIONI D’ONDA RELATIVISTICHE
si ottiene [ H , j ] = 0 . Il vettore j `e una costante del moto ed `e quindi del tutto naturale immedesimarlo col vettore momento angolare totale. La relazione precedente mostra che esso si ottiene addizionando il momento angolare orbitale con un vettore, che indichiamo con s, che rappresenta il momento angolare intrinseco (spin) della particella s =
1 2
τ .
Il vettore s soddisfa le relazioni (immediatamente deducibili da quelle del vettore τ )
[ s i , sj ] = i
ijk sk ,
{si , sj } =
1 2
δij ,
si s j =
1 4
δij +
i 2
&
k ijk sk
.
k
Queste propriet`a mostrano che il vettore s soddisfa tutti i requisiti per essere considerato, a buon diritto, un momento angolare (si veda il Par. 7.9). Inoltre, essendo s2 = si si = 34 , i
si ottiene che il momento angolare intrinseco vale 12 (si ricordi dalla teoria del momento angolare che l’autovalore dell’operatore J 2 vale J(J + 1)). Nel limite non relativistico dell’equazione di Dirac sviluppato nei paragrafi precedenti, e in particolare nel limite all’ordine zero, abbiamo visto che il contributo preponderante dell’interazione della particella carica con un campo magnetico `e descritto da un termine dell’Hamiltoniana dato da eh ¯ . ( + σ ) · B 2mc Questa espressione `e consistente con l’idea che al momento angolare orbitale sia associato un dipolo magnetico μ e allo spin sia associato un momento magnetico μ s . Riferendoci al caso dell’elettrone, per cui e = −e0 , con e0 = 4.803 × 10−10 u.e.s., i dipoli sono dati da Hmagnetica = −
μ = −μ0 ,
μ s = −μ0 σ ,
dove abbiamo introdotto la quantit` a μ0 , detta magnetone di Bohr, definita da2 2
Si ricordi che nel sistema di unit` a c.g.s. di Gauss, l’unit` a di misura dell’induzione magnetica ` e il gauss, che si abbrevia con “G”.
132
CAPITOLO 5
μ0 =
¯ e0 h = 9.274 × 10−21 erg G−1 . 2mc
(5.17)
a stato interpretato in termini classici (si veda il Par. 5.4). Il momento μ `e gi` Per quanto riguarda μ s si pu` o osservare che, essendo σ la rappresentazione di ordine 2 della matrice τ di ordine 4, e, essendo τ = 2s, si pu` o anche scrivere μ s = −2 μ0 s . Il rapporto fra il momento magnetico (in unit`a di magnetoni di Bohr) e il corrispondente momento angolare (in unit`a h ¯ ) viene detto rapporto giromagnetico. Si ottiene quindi che il rapporto giromagnetico dell’elettrone vale −1 per il momento angolare orbitale e vale −2 per lo spin. Questo comportamento anomalo del momento magnetico associato allo spin era stato assunto fenomenologicamente nella teoria di Pauli dell’elettrone. Il fatto che ci`o scaturisca in maniera del tutto naturale dall’equazione di Dirac costituisce uno dei maggiori successi di questa teoria.
5.7 Soluzione dell’equazione di Dirac in un campo magnetico L’equazione di Dirac pu` o essere risolta esattamente in un certo numero di casi particolari. Come applicazione della teoria sviluppata in questo capitolo, cerchiamo la soluzione per una particella carica mobile in un campo magnetico costante. Un tale campo pu` o essere descritto dai potenziali elettromagnetici φ=0 ,
= A
1 2
× x , B
e l’equazione di Dirac risulta ih ¯
∂ ψ(x, t) = HB ψ(x, t) , ∂t
dove HB , l’Hamiltoniana di Dirac nel caso di campo magnetico costante, `e data da e HB = c α · p − A + β m c2 . c 2 Per risolvere questa equazione, cominciamo con l’osservare che l’operatore H B ha un’espressione molto pi` u semplice dell’operatore HB stesso. Si ha infatti
e e 2 · p − A = cα · p − A HB + β m c2 c α + β m c2 . c c
EQUAZIONI D’ONDA RELATIVISTICHE
133
L’espressione a secondo membro pu`o essere sviluppata tenendo conto dell’algebra delle matrici α e β (Eq. (5.2)). Ricordando inoltre la definizione delle matrici τ (Eq. (5.16)) e la regola di commutazione [ pi , Aj ] = −i h ¯
∂Aj , ∂xi
si trova, con alcune trasformazioni e 2 2 + m 2 c4 . = c2 p − A −eh ¯ c τ · B HB c Supponiamo adesso di aver risolto l’equazione agli autovalori per l’operatore 2 HB e indichiamo con 2 gli autovalori stessi (che devono necessariamente essere reali e positivi) e con Φ gli autovettori. Si ha, per definizione 2 (HB − 2 ) Φ = 0 ,
e l’equazione pu` o anche essere scritta nelle due forme alternative (HB − ) (HB + ) Φ = 0 ,
(HB + ) (HB − ) Φ = 0 .
Queste due equazioni mostrano che le due funzioni d’onda Ψ− = (HB − ) Φ ,
Ψ+ = (HB + ) Φ,
sono autofunzioni dell’Hamiltoniana HB corrispondenti rispettivamente agli autovalori e −. Attraverso questo algoritmo `e quindi possibile ricondurre la soluzione dell’equazione di Dirac alla soluzione dell’equazione agli autovalori 2 per l’operatore HB . Tenendo conto dell’espressione esplicita del potenziale vettore, e introducendo un sistema di assi cartesiani (x, y, z) con l’asse z diretto lungo la direzione del 2 campo magnetico, l’operatore HB assume la forma
2 HB
2 2 eB eB 2 y + c py − x + c2 p2z − e h = c px + ¯ c B τ3 + m 2 c 4 . 2c 2c 2
Il carattere spinoriale dell’operatore `e contenuto solamente nella matrice τ3 che `e diagonale ed `e esplicitamente data da ⎛
1 ⎜0 τ3 = ⎝ 0 0
0 −1 0 0
⎞ 0 0 0 0 ⎟ ⎠ . 1 0 0 −1
Inoltre, tutti i commutatori che si possono costruire a partire da due qualsiasi 2 dei cinque termini che compongono l’operatore HB sono nulli, con l’eccezione
134
CAPITOLO 5
del commutatore fra i primi due termini che `e diverso da zero. Allo scopo di 2 trasformare l’operatore HB in una somma di operatori commutanti, eseguiamo un cambiamento di variabile introducendo gli operatori eB eB a = γ py − x − i δ px + y , 2c 2c eB eB † x + i δ px + y , a = γ py − 2c 2c dove γ e δ sono due costanti reali da scegliere opportunamente. Con queste 2 trasformazioni, si ottiene per HB l’espressione 2 HB =
c2 2 c2 2 †2 † † (a + a + a a + a a) − (a + a†2 − a a† − a† a) 4 γ2 4 δ2
¯ c B τ3 + m 2 c 4 , + c2 p2z − e h e, per il commutatore fra gli operatori a e a† , [ a, a† ] =
2eBh ¯ γδ . c
Se adesso imponiamo γ 2 = δ2 ,
γδ =
c , 2eBh ¯
2 l’operatore HB risulta espresso come somma di Hamiltoniane commutanti gi`a note. Con facili passaggi, si ottiene 1 ∓ τ3 2 HB + c2 p2z + m2 c4 , = 2 |e| h ¯ c B a† a + 2
dove |e| `e il valore assoluto della carica della particella e dove il segno davanti a τ3 vale meno per le cariche positive e pi` u per le cariche negative. Ricordando i risultati ottenuti a proposito dell’oscillatore armonico nel Par. 4.1, e tenendo conto che gli autovalori della matrice τ3 sono ±1, gli autovalori dell’operatore 2 HB risultano della forma 2 = m2 c4 + c2 qz2 + 2 |e| h ¯ cBn , dove qz `e l’autovalore (continuo) dell’operatore pz e dove n `e un intero arbitrario positivo o nullo. Infine, per gli autovalori dell’Hamiltoniana HB , si ha =±
# m2 c4 + c2 qz2 + 2 |e| h ¯ cBn ,
(n = 0, 1, 2, . . .) .
I livelli energetici che si sono cos`ı trovati prendono il nome di livelli di Landau. Essi sono caratterizzati da un parametro continuo, qz , che `e la componente
EQUAZIONI D’ONDA RELATIVISTICHE
135
dell’impulso della particella lungo la direzione del campo magnetico, e da un indice intero, n, che invece caratterizza il moto nel piano perpendicolare al campo magnetico. Come nel caso dell’equazione di Dirac per la particella libera, esistono livelli a energia positiva e livelli a energia negativa. L’equazione che esprime gli autovalori dell’energia pu`o anche essere posta nella forma pi` u significativa % q2 B = ± m c2 1 + 2z 2 + 2 n , m c Bq dove abbiamo introdotto il cosiddetto campo magnetico quantistico, Bq , definito da Bq =
m 2 c3 , |e| h ¯
che, nel caso degli elettroni, vale 4.414 × 1013 G. Nel caso particolare in cui qz mc e B Bq , la radice si pu` o sviluppare in serie di potenze e all’ordine pi` u basso si ottiene q2 = ± mc2 + z + h ¯ ωc n , 2m dove la quantit` a ωc , definita da ωc =
|e| B , mc
`e la frequenza di ciclotrone che abbiamo gi`a incontrato nel Cap. 3 (Eq. (3.30)).
Capitolo 6
Atomi con un solo elettrone di valenza L’analisi spettroscopica della radiazione emessa da sostanze atomiche e molecolari nelle pi` u svariate condizioni di pressione e temperatura `e stata portata avanti per lungo tempo a partire dal momento in cui `e stata dimostrata l’esistenza di righe di assorbimento nello spettro del Sole da parte di Fraunhofer nel 1817. Questi studi hanno portato, nel corso degli anni, alla nascita di una nuova disciplina della fisica sperimentale e teorica che prende il nome di spettroscopia. Tale disciplina ha avuto un’importanza storica fondamentale per la comprensione della struttura atomica, sebbene sia stato necessario attendere l’avvento della meccanica quantistica per poter dare un’interpretazione rigorosa di quanto osservato nei laboratori terrestri e nei plasmi astrofisici. In questo volume affronteremo lo studio dei concetti di base della spettroscopia mediante un approccio moderno, iniziando col dare una descrizione, a livelli di sofisticazione crescenti, degli spettri pi` u semplici, ovvero quelli relativi ad atomi che contengono un solo elettrone di valenza (atomi idrogenoidi, metalli alcalini e relative sequenze isoelettroniche). Le complicazioni introdotte dalla presenza di un numero maggiore di elettroni di valenza sono illustrate nei capitoli successivi.
6.1 Atomo di Idrogeno, teoria di Bohr Lo spettro dell’atomo di Idrogeno `e il pi` u semplice ed `e stato anche il primo per il quale `e stata sviluppata un’interpretazione teorica adeguata. Le regolarit` a che compaiono nei valori delle lunghezze d’onda della serie di righe che si osserva nello spettro visibile dell’atomo di Idrogeno furono formulate quantitativamente da Balmer (un professore di scuole secondarie svizzero) nel 1886. Balmer trov` o che le lunghezze d’onda di tali righe potevano essere ben rappresentate attraverso la formula empirica λ = λB
n2 , −4
n2
dove λB `e una costante che vale circa 3647 ˚ A e dove n `e un intero che pu` o assumere i valori 3, 4, 5, etc.. Oggi, in maniera pi` u moderna, si preferisce scrivere la formula precedente nella forma
138
CAPITOLO 6
ν¯ = RH
1 1 − 2 2 2 n
,
(n > 2) ,
dove ν¯ (= 1/λ) `e il numero d’onde della riga e RH (= 4/λB ) `e la cosiddetta costante di Rydberg per l’atomo di Idrogeno. Se nella formula precedente si sostituisce l’intero 2 con altri numeri interi, si ottengono altre serie di righe, in modo tale che lo spettro completo dell’atomo di Idrogeno pu` o essere rappresentato dalla formula ν¯ = RH
1 1 − 2 2 m n
,
(n > m) .
(6.1)
La serie con m = 1 cade nell’ultravioletto e prende il nome di serie di Lyman; quella con m = 2 cade nel visibile e prende ovviamente il nome di serie di Balmer. Le altre serie cadono nell’infrarosso sempre pi` u lontano e prendono il nome di serie di Paschen (m = 3), di Brackett (m = 4), di Pfund (m = 5), e di Humphreys (m = 6). Lo spettro dell’atomo di Idrogeno `e rappresentato schematicamente in Fig. 6.1. La formula per ν¯ pu` o anche essere posta nella forma ν¯ = Tm − Tn , dove Tk =
RH , k2
(con k intero) .
(6.2)
Questo significa che il numero d’onde di una qualsiasi riga dello spettro dell’atomo di Idrogeno `e dato dalla differenza di due “termini spettroscopici” della forma RH /k 2 . In effetti, questa propriet` a `e del tutto generale, nel senso che essa vale per gli spettri di tutti gli altri elementi. Si verifica infatti sperimentalmente che i numeri d’onda delle numerosissime righe osservate nello spettro di un qualsiasi elemento (o ione) possono essere sempre ottenuti come differenze di un numero molto minore di termini, anche se, in generale, tali termini non possono essere espressi da semplici funzioni matematiche come quella dell’Eq. (6.2). Questo fatto ebbe un’importanza storica notevole e viene oggi assunto a principio, venendo denominato principio di Rydberg-Ritz. Esso afferma che tutte le righe dello spettro di un elemento (in un particolare stato di ionizzazione) si possono ottenere per differenza fra due qualsiasi termini spettroscopici, caratteristici dell’elemento stesso (in quel particolare stato di ionizzazione). Il numero di termini `e molto minore del numero di righe possibili. L’interpretazione teorica dello spettro dell’atomo di Idrogeno fu data per la prima volta da Bohr mediante un modello relativamente semplice che introduceva, accanto alle usuali leggi della meccanica classica, delle opportune ipotesi
139
ATOMI CON UN SOLO ELETTRONE DI VALENZA
Lyman
ν (cm −1 )
90000
Balmer
30000
60000
1000
2000
Paschen
0 5000
10000 λ (A)
Fig. 6.1. Spettro dell’atomo di Idrogeno dall’ultravioletto all’infrarosso. Le prime righe delle serie di Lyman, Balmer e Paschen sono rappresentate da tratti verticali. I limiti delle serie sono rappresentati in tratteggio. La scala orizzontale `e lineare nel numero d’onda.
quantistiche. Bench´e la teoria di Bohr appaia oggi superata alla luce della moderna meccanica quantistica, essa costituisce tuttavia una buona introduzione alla fisica atomica e vale la pena esporla in questa sede. Il punto di partenza della teoria di Bohr `e il cosiddetto modello planetario dell’atomo, emerso dai lavori sperimentali di Rutherford, secondo il quale l’atomo `e costituito da un nucleo centrale di carica positiva, praticamente puntiforme, intorno al quale ruotano gli elettroni. Bohr svilupp`o le proprie considerazioni per l’atomo pi` u semplice, il cosiddetto atomo idrogenoide, nel quale un solo elettrone ruota intorno a un nucleo centrale di carica Ze0 (dove e0 `e il valore assoluto della carica dell’elettrone e Z `e un intero). Le ipotesi introdotte da Bohr sono le seguenti: (a) Delle infinite orbite che, secondo la meccanica classica, un elettrone pu`o descrivere nel suo moto intorno al nucleo, solo alcune, che verificano delle opportune regole di quantizzazione, sono permesse. In contraddizione con la teoria classica dell’elettromagnetismo, l’elettrone non irradia quando si muove su tali orbite sebbene il suo moto sia accelerato. (b) La radiazione viene emessa oppure assorbita in seguito alla “transizione” dell’elettrone fra un’orbita permessa e un’altra. Tali processi avvengono per “quanti” di radiazione caratterizzati dalla frequenza ν=
ΔE , h
dove ΔE `e la differenza fra le energie che competono alle due orbite fra le quali avviene la transizione e dove h `e la costante di Planck (h = 6.626×10 −27 erg s). Si pu` o notare che questa seconda ipotesi contiene implicitamente il principio di Rydberg-Ritz, i termini spettroscopici essendo dati dalle energie delle orbite, a meno del fattore 1/(ch). Supponendo per semplicit` a che l’elettrone si muova su orbite circolari, dalla seconda legge della dinamica si ottiene
140
CAPITOLO 6
Z e20 m v2 = , r2 r
(6.3)
dove r `e il raggio dell’orbita, v la velocit`a dell’elettrone e m la sua massa. A questa equazione classica Bohr aggiunge la condizione di quantizzazione 1 per la quale il momento angolare dell’elettrone deve essere multiplo intero della costante ¯h = h/2π mvr = nh ¯ ,
(n = 1, 2, 3, . . .) .
Eliminando la velocit` a fra le due equazioni si ottiene, per il raggio dell’orbita caratterizzata dal “numero quantico” n rn =
h ¯ 2 n2 . m e20 Z
La quantit` ah ¯ 2 /(me20 ), avente le dimensioni di una lunghezza, prende il nome di raggio della prima orbita di Bohr e viene usualmente indicata col simbolo a0 . Essa vale 0.529 × 10−8 cm, ovvero 0.529 ˚ A. Attraverso tale quantit` a si ottiene allora rn = a0
n2 . Z
Sull’orbita generica di raggio r, l’elettrone possiede l’energia E=
1 2
m v2 −
Z e20 Z e20 =− , r 2r
dove abbiamo utilizzato l’Eq. (6.3) e abbiamo assunto nulla l’energia elettrostatica all’infinito. Sostituendo il valore di rn trovato precedentemente, si ottiene per l’energia dell’elettrone sull’orbita caratterizzata dal numero quantico n En = −
e20 Z 2 m e40 Z 2 = − . 2 a0 n 2 2h ¯ 2 n2
Dalla condizione di quantizzazione del momento angolare `e poi facile trovare la velocit`a vn che compete all’elettrone sull’orbita n-esima. Si ottiene vn =
e20 Z , h ¯ n
e, introducendo la quantit` a adimensionale α, detta costante della struttura fine, definita da 1
In effetti, il ragionamento originale di Bohr `e diverso, essendo basato sul principio di corrispondenza. Quella qui riportata `e un’adattazione moderna che non altera lo spirito della derivazione.
ATOMI CON UN SOLO ELETTRONE DI VALENZA
α=
141
1 e20 = = 7.29735 × 10−3 , h ¯c 137.036
si ottiene vn = α c
Z , n
la quale mostra che per l’atomo di Idrogeno (Z = 1) dobbiamo attenderci delle correzioni relativistiche dell’ordine di α2 . Dall’espressione per rn e vn , si pu` o poi trovare il periodo dell’elettrone sull’n-esima orbita. Si trova facilmente Tn =
2π rn 2π h ¯ 3 n3 = , vn m e40 Z 2
per cui si ottiene l’analogo della terza legge di Keplero rn3 Z e20 , = Tn2 4π 2 m
indipendente da n .
Si pu` o infine osservare che, con l’introduzione della costante della struttura fine, l’espressione per l’energia En pu` o anche essere scritta nella forma En = −m c2
α2 Z 2 . 2 n2
I risultati precedenti sono stati ottenuti supponendo che la massa del nucleo sia infinita. Se si tiene invece conto del fatto che la massa del nucleo `e finita, essi vanno modificati sostituendo alla massa dell’elettrone, m, la cosiddetta massa ridotta, mr , definita da mr =
m Mn , m + Mn
dove Mn `e la massa del nucleo intorno al quale ruota l’elettrone. Poich`e si ha sempre m Mn , si pu` o sviluppare in serie l’equazione precedente ottenendo m , mr m 1 − Mn che mostra che la correzione per la massa ridotta `e dell’ordine dello 0.5 per mille nel caso dell’atomo di Idrogeno. La prova formale dell’effetto della massa ridotta si basa sul cosiddetto teorema dei due corpi che qui ricordiamo. Siano dati due corpi di massa m1 e m2 , rispettivamente. Se il corpo 1 esercita sul corpo 2 la forza F , allora, per il terzo principio della dinamica, il corpo 2 esercita sul corpo 1 la forza −F , cosicch´e, per il secondo principio, il moto dei rispettivi centri di massa `e retto, con simboli evidenti, dalle equazioni
142
CAPITOLO 6
¨2 = F , m2 x
¨ 1 = −F . m1 x
Per il moto relativo, descritto dal raggio vettore x = x2 − x1 , si ha quindi 1 1 ¨ ¨ ¨ x = x2 − x1 = F , + m2 m1 ovvero ¨ = F , mr x dove mr =
m1 m2 . m1 + m 2
Quest’ultima equazione mostra che il moto del corpo 2 (nel nostro caso l’elettrone), riferito al corpo 1 (nel nostro caso il nucleo), `e lo stesso del moto assoluto di un corpo su cui agisce la stessa forza e la cui massa `e pari alla massa ridotta. Tenendo conto della correzione dovuta alla massa ridotta, l’energia dell’atomo idrogenoide sull’n-esima orbita risulta En = −
mr e40 Z 2 . 2h ¯ 2 n2
(6.4)
In base alla seconda ipotesi di Bohr, il numero d’onde del quanto emesso nella transizione fra l’orbita n-esima e l’orbita m-esima (con n > m) risulta En − Em 1 1 2 ν¯ = = RZ , − 2 hc m2 n dove R, la costante di Rydberg per l’atomo idrogenoide, `e data da R=
mr e40 , 4π c h ¯3
e in particolare, per l’atomo di Idrogeno, RH =
e40 m Mp , m + Mp 4π c h ¯3
Mp essendo la massa del protone. Come si vede, il modello di Bohr porta a un’espressione per i numeri d’onda delle righe spettrali dell’atomo di Idrogeno che coincide con quella osservata (Eq. (6.1)). Pi` u quantitativamente, si possono confrontare i valori numerici, teorico e sperimentale, ottenuti per RH . Sostituendo i valori delle costanti
ATOMI CON UN SOLO ELETTRONE DI VALENZA
143
atomiche, si trova un ottimo accordo . Questo fatto costitu`ı, dal punto di vista storico, una delle prove pi` u convincenti della correttezza della teoria di Bohr 2 . Come abbiamo gi` a osservato, le formule dedotte in questo paragrafo si applicano non solo allo spettro dell’atomo di Idrogeno ma anche agli spettri degli atomi idrogenoidi, ovvero degli atomi composti da un solo elettrone in orbita intorno a un nucleo avente carica Ze0 , con Z > 1. Tali spettri sono quelli dell’Elio una volta ionizzato, He+ , per cui Z = 2 (spettro dell’ He II), del Litio due volte ionizzato, Li++ , per cui Z = 3 (spettro del Li III), del Berillio tre volte ionizzato, etc.3 . Gli spettri degli idrogenoidi sono del tutto analoghi a quello dell’Idrogeno, con la differenza di un fattore di scala 1/Z nelle dimensioni delle orbite e di un fattore Z 2 nelle energie, ovvero nei numeri d’onda o nelle frequenze (oltre a una ulteriore differenza, dell’ordine della frazione del permille, dovuta all’effetto della massa ridotta che influisce sulla costante di Rydberg). La serie di Balmer dell’Elio ionizzato, ad esempio, viene a cadere nell’ultravioletto invece che nel visibile. Le condizioni di quantizzazione di Bohr si applicano soltanto alle orbite legate, cio`e alle orbite (ellittiche, in fisica classica) che corrispondono a energie negative. Le orbite che corrispondono a valori positivi dell’energia (iperboliche, in fisica classica) sono quindi tutte “possibili”. Oltre alle transizioni fra orbite quantizzate a energia negativa, sono anche possibili transizioni fra orbite a energia positiva e orbite a energia negativa, oppure fra due orbite entrambe a energia positiva. Nel primo caso, il numero d’onda del quanto di energia `e dato da R + 2 , hc n dove n `e il numero quantico dell’orbita a energia negativa e dove `e l’energia cinetica dell’elettrone all’infinito sull’orbita iperbolica. Poich´e pu` o assumere un qualsiasi valore positivo o nullo, ne segue che la serie di righe discrete, il cui limite si trova al numero d’onda R/n2 , sfuma in uno spettro continuo dalla parte dei numeri d’onda maggiori (lunghezze d’onda minori). Per lo spettro dell’atomo di Idrogeno, ad esempio, si ha il cosiddetto continuo di Lyman per λ < 912 ˚ A, il continuo di Balmer per λ < 3647 ˚ A, etc.. Una transizione di questo genere corrisponde, in assorbimento, all’espulsione di un elettrone dall’atomo (effetto fotoelettrico o fotoionizzazione), mentre in emissione corrisponde ν¯ =
2
Bisogna dire che al momento in cui Bohr pubblic` o i suoi risultati le costanti fisiche erano conosciute con scarsa precisione e la coincidenza fra valori teorici e sperimentali di R H non costitu`ı di per s´ e una prova sufficiente per avvalorare il suo modello presso la comunit` a scientifica. Oggi la situazione ` e profondamente mutata e la costante di Rydberg `e una delle costanti fisiche che sono conosciute con il maggior numero di cifre significative (R H = 1.0967758341 × 105 cm−1 ). 3 Lo spettro di un elemento n volte ionizzato si indica col simbolo dell’elemento seguito dal numero (n + 1) scritto in cifre romane. Ad esempio, lo spettro del Na I ` e lo spettro del Sodio neutro, lo spettro del C IV ` e lo spettro del Carbonio ionizzato tre volte, lo spettro del Fe XV ` e lo spettro del Ferro ionizzato 14 volte, e cos`ı via.
144
CAPITOLO 6
eV
12
cm
−1
0
5 4 3
Serie di Balmer
2
30000
9 Serie di Lyman
6
3
0
60000
90000 1
Fig. 6.2. Diagramma di Grotrian dell’atomo di Idrogeno. I livelli del continuo sono rappresentati dalla zona ombreggiata che, in principio, si estende indefinitamente verso l’alto.
al fenomeno inverso, detto ricombinazione elettronica. L’osservazione del continuo al limite della serie di righe che trae origine dal livello fondamentale `e molto importante, in quanto fornisce direttamente il potenziale di ionizzazione dell’atomo (o dello ione). Se ν¯∞ `e il numero d’onda corrispondente al limite di tale serie, il potenziale di ionizzazione espresso (come `e consuetudine) in eV si ottiene semplicemente dalla formula χ(eV) = 1.2398 × 10−4 ν¯∞ (cm−1 ) . Per l’atomo di Idrogeno, ad esempio, essendo ν¯∞ = RH si ottiene il potenziale di ionizzazione di 13.598 eV. Una transizione fra due orbite a energia positiva `e caratterizzata dal numero d’onda ν¯ =
− , hc
dove e sono le energie cinetiche all’infinito dell’elettrone sulle orbite iperboliche iniziale e finale. Una tale transizione corrisponde, in emissione, al cosiddetto fenomeno della Bremsstrahlung (radiazione di frenamento) e, in assorbimento,
ATOMI CON UN SOLO ELETTRONE DI VALENZA
145
al cosiddetto fenomeno della Bremsstrahlung inversa4. Una rappresentazione grafica particolarmente utile dei termini spettroscopici e delle righe spettrali si ottiene riportando in un diagramma i livelli energetici mediante dei tratti orizzontali su una scala verticale di energie (o di numeri d’onda). La Fig. 6.2 fornisce l’esempio di un tale diagramma (detto diagramma di Grotrian) per l’atomo di Idrogeno. L’energia del particolare livello si legge direttamente sulla scala di sinistra e il valore zero `e assegnato per convenzione al livello fondamentale. Il numero d’onda del termine corrispondente si legge invece sulla scala di destra, nella quale lo zero corrisponde, sempre per convenzione, al limite di ionizzazione. Una qualsiasi riga spettrale `e rappresentata mediante una linea verticale che connette due livelli energetici. La lunghezza della linea, misurata sulla scala di destra, fornisce direttamente il numero d’onda della riga spettrale e quindi la sua lunghezza d’onda. Per concludere, `e necessario menzionare che la teoria di Bohr, dedotta per orbite circolari, fu in seguito generalizzata da Sommerfeld al caso pi` u generale delle orbite ellittiche. Non ci dilungheremo qui su tale teoria dato che, al giorno d’oggi, essa riveste interesse quasi esclusivamente dal punto di vista storico.
6.2 L’equazione di Schr¨ odinger in coordinate sferiche L’approccio moderno per determinare la struttura e le caratteristiche del sistema dei livelli energetici degli atomi (e quindi del relativo spettro) si basa sulla soluzione dell’equazione di Schr¨ odinger stazionaria. Per una particella di massa m mobile in un campo di forze che ammette potenziale, l’equazione `e la seguente
p2 H |ψ = + V |ψ = E |ψ 2m
,
dove V `e l’energia potenziale della particella. Nella rappresentazione delle funzioni d’onda, dove l’operatore p vale −i h ¯ grad, l’equazione, per un potenziale indipendente dal tempo, diviene −
h ¯2 2 ∇ + V (x ) ψ(x ) = Eψ(x ) . 2m
Se il campo di forze `e a simmetria sferica, la soluzione dell’equazione di Schr¨odinger risulta semplificata introducendo le coordinate sferiche, r, θ, φ, definite implicitamente dalle equazioni (si veda la Fig. 6.3) 4
Si veda il Par. 3.7 per la teoria classica della radiazione di frenamento.
146
CAPITOLO 6
z
#
# $
$
θ
r
er eφ eθ
!
!
!
!
!
!
!
"
"
"
"
"
"
"
φ
y
x Fig. 6.3. Sistema di coordinate sferiche (r, θ, φ) e corrispondenti versori e r ,eθ ,eφ .
x = r sinθ cosφ ,
y = r sinθ sinφ ,
z = r cosθ ,
dove (x, y, z) `e un sistema di riferimento cartesiano ortogonale destrorso. Andiamo adesso a determinare l’espressione dell’operatore ∇2 (Laplaciano) in tale sistema di coordinate. Poich´e risulta ∇2 = div grad , dobbiamo esprimere in coordinate sferiche sia l’operatore gradiente che l’operatore divergenza. Introduciamo quindi i tre versori er , eθ ed eφ , tali da formare, in quest’ordine, una terna trirettangola destra, come in Fig. 6.3. Tali versori sono espressi, in funzione dei tre versori ı, j, k, diretti rispettivamente lungo gli assi x, y, z, dalle equazioni er = sinθ cosφı + sinθ sinφ j + cosθ k , eθ = cosθ cosφı + cosθ sinφ j − sinθ k , eφ = − sinφı + cosφ j . La distanza infinitesima dP fra due punti aventi coordinate sferiche (r, θ, φ) e (r + dr, θ + dθ, φ + dφ) si scrive nella forma dP = er dr + eθ r dθ + eφ r sinθ dφ . Osserviamo poi che, data una funzione scalare arbitraria, f , del punto, si ha, per definizione stessa di gradiente df = gradf · dP = (gradf )r dr + (gradf )θ r dθ + (gradf )φ r sinθ dφ ,
ATOMI CON UN SOLO ELETTRONE DI VALENZA
147
z dr
dθ y dφ x Fig. 6.4. La figura mostra il volumetto infinitesimo utilizzato per trovare l’espressione dell’operatore divergenza in coordinate sferiche.
dove si sono indicate con il simbolo (gradf )r,θ,φ , rispettivamente, le tre componenti del gradiente della funzione f lungo i tre versori er , eθ , eφ . D’altra parte, poich´e si ha anche df =
∂f ∂f ∂f dr + dθ + dφ , ∂r ∂θ ∂φ
dal confronto delle ultime due equazioni, essendo f arbitraria, si ottengono le espressioni per le componenti sferiche dell’operatore gradiente gradr =
∂ , ∂r
gradθ =
1 ∂ , r ∂θ
gradφ =
∂ 1 . r sin θ ∂φ
(6.5)
Analogamente possiamo determinare l’espressione dell’operatore divergenza. Facendo riferimento al flusso di un vettore v arbitrario attraverso la superficie del volumetto infinitesimo della Fig. 6.4, si ha, per il teorema di Gauss (divv ) r2 sinθ dr dθ dφ = +
∂ (vr r2 sinθ) dr dθ dφ ∂r
∂ ∂ (vθ r sinθ) dr dθ dφ + (vφ r) dr dθ dφ , ∂θ ∂φ
dalla quale si ottiene divv =
1 ∂ 2 1 ∂ 1 ∂ (r vr ) + (sinθ vθ ) + vφ . r2 ∂r r sinθ ∂θ r sinθ ∂φ
(6.6)
Ricordando che ∇2 = div grad, e ricordando le Eq. (6.5), si ottiene in definitiva l’espressione dell’operatore Laplaciano di una funzione scalare del punto in coordinate sferiche
148
CAPITOLO 6
1 ∂ ∇ = 2 r ∂r 2
1 ∂ ∂ 1 ∂2 2 ∂ r + 2 sinθ + 2 2 . ∂r r sinθ ∂θ ∂θ r sin θ ∂φ2
(6.7)
Mediante questa espressione, l’equazione di Schr¨odinger stazionaria per una particella mobile in un potenziale centrale risulta H ψ(r, θ, φ) = E ψ(r, θ, φ) , dove l’Hamiltoniana, espressa in coordinate sferiche, `e data da H=−
h ¯2 1 ∂ 1 ∂ ∂ 1 ∂2 2 ∂ r + sinθ + + V (r) . 2m r2 ∂r ∂r r2 sinθ ∂θ ∂θ r2 sin2 θ ∂φ2
Prima di procedere alla soluzione di questa equazione, `e opportuno trovare anche l’espressione, sempre in coordinate sferiche, degli operatori associati al momento angolare orbitale. Ricordando la definizione = 1 x × p = −i x × grad , h ¯
(6.8)
si ha = −i r er × er ∂ + eθ 1 ∂ + eφ 1 ∂ , ∂r r ∂θ r sinθ ∂φ dalla quale si ottiene, essendo er × eθ = eφ , er × eφ = −eθ , ∂ 1 ∂ − eθ . = −i eφ ∂θ sinθ ∂φ Da questa equazione si possono determinare le tre componenti del momento angolare orbitale lungo gli assi x, y, z di Fig. 6.3. Tenendo conto delle relazioni fra le terne (er , eθ , eφ ) e (ı, j, k), si ha ∂ ∂ + cotθ cosφ , x = ı · = i sinφ ∂θ ∂φ ∂ ∂ + cotθ sinφ , y = j · = i − cosφ ∂θ ∂φ ∂ z = k · . = −i ∂φ Per 2 si ha poi ∂ 1 ∂ ∂ 1 ∂ − eθ · eφ − eθ . = · = − eφ ∂θ sinθ ∂φ ∂θ sinθ ∂φ 2
ATOMI CON UN SOLO ELETTRONE DI VALENZA
149
Per calcolare questa quantit` a bisogna preliminarmente trovare le derivate dei versori rispetto alle coordinate sferiche. Con facili considerazioni geometriche si trova ∂ er = 0 , ∂r ∂ eθ = 0 , ∂r ∂ eφ = 0 , ∂r
∂ er = eθ , ∂θ ∂ eθ = −er , ∂θ ∂ eφ = 0 , ∂θ
∂ er = sinθeφ , ∂φ ∂ eθ = cosθeφ , ∂φ ∂ eφ = − sinθer − cosθeθ . ∂φ
Si ottiene allora 2 = −
1 ∂2 ∂2 ∂ − − cotθ , ∂θ2 ∂θ sin2 θ ∂φ2
ovvero 1 ∂ =− sinθ ∂θ 2
∂ 1 ∂2 sinθ − . ∂θ sin2 θ ∂φ2
L’espressione di trovata precedentemente permette anche di determinare le propriet` a di commutazione delle diverse componenti del momento angolare totale. Si ha infatti × = − eφ ∂ − eθ 1 ∂ × eφ ∂ − eθ 1 ∂ , ∂θ sinθ ∂φ ∂θ sinθ ∂φ dalla quale si ottiene, come `e facile verificare × = i , che `e la relazione fondamentale che esprime le regole di commutazione fra le componenti del momento angolare. Da questa propriet` a segue immediatamente l’altra [ 2 , ]=0 , esprimente il fatto che il quadrato del momento angolare orbitale commuta con ciascuna delle sue componenti. Con l’introduzione dell’operatore 2 , l’equazione di Schr¨odinger pu` o essere anche posta nella forma
h ¯2 ∂ h ¯2 2 ∂ 2 − r + + V (r) ψ(r, θ, φ) = E ψ(r, θ, φ) . 2 m r2 ∂r ∂r 2 m r2
(6.9)
150
CAPITOLO 6
Tenendo conto che l’operatore 2 opera soltanto sulle variabili θ e φ, e che l’operatore z opera solo sulla variabile φ, possiamo cercare una soluzione dell’equazione di Schr¨odinger che sia contemporaneamente autofunzione dei tre operatori commutanti H, 2 e z . Per far questo, iniziamo col determinare le autofunzioni dell’operatore z , ovvero determiniamo le funzioni tali che −i
∂ Φμ = μ Φ μ . ∂φ
Integrando questa equazione si ottiene, a meno di una funzione moltiplicativa arbitraria delle variabili r e θ, Φμ (φ) = e i μ φ . Osserviamo per` o che la funzione Φμ (φ) deve essere a un solo valore. Perch´e questo sia verificato, si deve avere μ=m , con m intero qualsiasi (positivo, negativo, o nullo). Si ottiene quindi che gli autovalori dell’operatore z sono gli interi m e che le corrispondenti autofunzioni sono della forma Φm (φ) = ei m φ . Passiamo adesso a determinare le autofunzioni comuni degli operatori 2 e z . Per far questo cerchiamo le funzioni della forma Θλ Φm tali da soddisfare l’equazione 1 ∂ ∂ 1 ∂2 − sinθ − Θ λ Φm = λ Θ λ Φm . sinθ ∂θ ∂θ sin2 θ ∂φ2 Sostituendo l’espressione per Φm ed eseguendo il cambiamento di variabile definito da x = cosθ , si ottiene per la funzione Θλ l’equazione differenziale m2 d2 Θλ dΘλ + λ − (1 − x2 ) Θλ = 0 . − 2 x dx2 dx 1 − x2 Per risolvere questa equazione, poniamo Θλ (x) = (1 − x2 )|m|/2 fλ (x) . Eseguendo le derivate e sostituendo, si ottiene per fλ l’equazione differenziale (1 − x2 )fλ (x) − 2 x (1 + |m|)fλ (x) + (λ − |m| − m2 )fλ (x) = 0 .
ATOMI CON UN SOLO ELETTRONE DI VALENZA
151
Infine, cerchiamo una soluzione per la funzione fλ di tipo serie di potenze ck xk . fλ (x) = k
Eseguendo le derivate e sostituendo, si ottiene una relazione ricorrente fra i coefficienti ck della forma ck+2 =
(k + |m|) (k + |m| + 1) − λ ck . (k + 2) (k + 1)
Se la serie non `e troncata si ottiene, per k → ∞, che il rapporto ck+2 /ck tende a 1. La serie `e quindi divergente per x = ±1. Per ottenere una funzione finita bisogna ammettere che la serie sia troncata, e questo impone per l’autovalore λ l’espressione λ = l(l + 1) , con l intero e con l ≥ |m| . Si noti che il grado massimo del polinomio, kmax risulta pari a kmax = l − |m| , e che il polinomio `e di grado pari oppure di grado dispari a seconda che kmax sia a sua volta pari o dispari. Le funzioni che abbiamo determinato sono, a parte una costante moltiplicativa, delle funzioni ben note in fisica-matematica. Esse prendono il nome di funzioni di Legendre (per m = 0) e di funzioni associate di Legendre di prima specie (per m arbitrario) e vengono usualmente denotate, rispettivamente, con |m| i simboli Pl (x) e Pl (x). Si pu` o mostrare che le funzioni associate di Legendre sono tali da soddisfare le condizioni di ortogonalit`a 1 |m| |m| Pl (x) Pl (x) dx = 0 , se l = l . −1
Riassumendo, abbiamo quindi trovato che le autofunzioni comuni degli operatori 2 e z sono caratterizzate da due numeri quantici interi, m e l, e risultano della forma |m|
Pl
(cosθ) e i m φ .
Moltiplicando queste funzioni per un opportuno fattore, si ottengono le cosiddette armoniche sferiche, Ylm (θ, φ). Il fattore viene scelto in modo tale che le armoniche sferiche siano normalizzate all’unit`a su tutto l’angolo solido e in
152
CAPITOLO 6
modo che esse soddisfino a ulteriori propriet` a del momento angolare (si veda l’equazione (6.10) che coinvolge gli operatori ± detti operatori di shift). La definizione delle armoniche sferiche `e la seguente % 2l + 1 (l − |m|)! |m| Ylm (θ, φ) = (−1)(m+|m|)/2 Pl (cosθ) ei m φ , 4π (l + |m|)! e le loro propriet`a fondamentali sono riassunte dalle seguenti equazioni ∂ 1 ∂2 1 ∂ 2 sinθ − Ylm (θ, φ) = Ylm (θ, φ) = − sinθ ∂θ ∂θ sin2 θ ∂φ2 = l(l + 1)Ylm (θ, φ) , ∂ Ylm (θ, φ) = m Ylm (θ, φ) , ∂φ ∂ ∂ ± i cotθ Ylm (θ, φ) = ± Ylm (θ, φ) = (x ± i y )Ylm (θ, φ) = ±e±i φ ∂θ ∂φ # = (l ± m + 1)(l ∓ m) Ylm±1 (θ, φ) , (6.10)
z Ylm (θ, φ) = −i
∗ Ylm (θ, φ) = (−1)m Yl−m (θ, φ) ,
2π
dφ 0
π
Ylm (π − θ, φ + π) = (−1)l Ylm (θ, φ) , (6.11)
∗ dθ sinθ Ylm (θ, φ) Yl m (θ, φ) = δll δmm .
(6.12)
0
Le espressioni esplicite delle armoniche sferiche pi` u semplici sono le seguenti $ Y00 =
1 , 4π
$ Y10 =
3 cosθ , 4π
$ Y1±1 = ∓
3 sinθ e ± i φ . (6.13) 8π
Tornando all’equazione di Schr¨ odinger nella forma (6.9), cerchiamo una soluzione del tipo ψ(r, θ, φ) = R(r) Ylm (θ, φ) =
1 P (r) Ylm (θ, φ) , r
dove R(r) `e la funzione radiale “ordinaria” mentre P (r) `e la cosiddetta funzione radiale ridotta, entrambe le funzioni dipendendo, in generale, dal numero quantico l. La funzione ridotta deve obbedire alla condizione al contorno P (0) = 0 , in modo tale che la funzione d’onda ψ sia finita nell’origine. Sostituendo, si ottiene per la funzione P (r) la cosiddetta equazione di Schr¨odinger radiale
ATOMI CON UN SOLO ELETTRONE DI VALENZA
h ¯ 2 d2 P (r) + Veff (r)P (r) = E P (r) , 2 m dr2 dove l’energia potenziale efficace, Veff (r), `e data da −
153
(6.14)
h ¯ 2 l(l + 1) . 2 m r2 L’equazione (6.14) `e in tutto e per tutto analoga a quella per il moto unidimensionale della particella, con la sola differenza che all’energia potenziale vera e propria `e necessario aggiungere un ulteriore termine detto potenziale centrifugo. Tale termine, che si annulla per l = 0, tende a mantenere la particella lontana dall’origine e la sua importanza aumenta quadraticamente all’aumentare del momento angolare orbitale. Bisogna osservare che la comparsa del potenziale centrifugo non `e una caratteristica della sola meccanica quantistica ma che una cosa del tutto analoga si verifica anche in fisica classica quando si studia il moto di una particella in un potenziale centrale. Poich´e in un potenziale centrale il momento angolare M `e costante, si pu` o introdurre un sistema di coordinate polari (r, φ) nel piano dell’orbita (definito appunto come il piano perpendicolare al vettore momento angolare). In tali coordinate, la conservazione del momento angolare implica Veff (r) = V (r) +
m r2 φ˙ = M , con M costante. D’altra parte, per il teorema di conservazione dell’energia meccanica, si ha 1 2
m v 2 + V (r) =
1 2
m r˙ 2 +
1 2
m r2 φ˙ 2 + V (r) = E ,
con E costante. Sostituendo per φ˙ il valore dedotto dalla conservazione del momento angolare si ha M2 =E , 2 m r2 che `e appunto l’equazione del moto unidimensionale di una particella in un potenziale “efficace” contenente il termine aggiuntivo dovuto al potenziale centrifugo. La traduzione quantistica di questa equazione `e appunto l’equazione di Schr¨ odinger radiale (6.14). 1 2
m r˙ 2 + V (r) +
6.3 Atomo di Idrogeno, teoria quantistica Applichiamo le considerazioni svolte nel paragrafo precedente a un atomo idrogenoide. L’energia potenziale dell’elettrone `e data da −Ze20 /r, per cui l’equazione di Schr¨ odinger radiale (Eq. (6.14)) risulta
154
CAPITOLO 6
h ¯ 2 l(l + 1) h ¯ 2 d2 Z e20 + P (r) = E P (r) , − P (r) + − 2 mr dr2 r 2 mr r 2 dove abbiamo introdotto la massa ridotta mr in quanto il teorema dei due corpi ammette una diretta generalizzazione quantistica. Per risolvere questa equazione `e conveniente introdurre delle variabili adimensionali. Ricordando i risultati ottenuti attraverso la teoria di Bohr, introduciamo i parametri ξ ed ponendo a0 Z 2 e20 , E = − , Z 2 a0 dove il raggio della prima orbita di Bohr contiene adesso la massa ridotta in luogo della massa effettiva dell’elettrone, ovvero r=ξ
a0 =
h ¯2 . mr e20
Eseguendo la sostituzione, si ottiene l’equazione differenziale 2 l(l + 1) d2 − P (ξ) + − P (ξ) = 0 . dξ 2 ξ ξ2 Osserviamo che, per ξ → ∞, l’equazione differenziale assume la forma semplificata d2 P (ξ) − P (ξ) = 0 . dξ 2 Se > 0 (caso delle orbite legate), la soluzione asintotica dell’equazione `e quindi P (ξ) = C e ±
√
ξ
,
dove C `e una costante. Delle due soluzioni dobbiamo scegliere quella con l’esponenziale negativo perch´e l’altra diverge. Poniamo quindi P (ξ) = e−
√ ξ
f (ξ) ,
dove f (ξ) `e una nuova funzione. Sostituendo, si ottiene per f (ξ) l’equazione differenziale √ 2 l(l + 1) f (ξ) − 2 f (ξ) + − f (ξ) = 0 . ξ ξ2 Cerchiamo per f (ξ) una soluzione del tipo serie di potenze ponendo f (ξ) = ξ p L(ξ) = ξ p
∞ k=0
ck ξ k ,
(c0 = 0) ,
ATOMI CON UN SOLO ELETTRONE DI VALENZA
155
dove p `e un numero reale positivo (p > 0) in quanto vogliamo che sia P (0) = 0. Sostituendo si ottiene la relazione ∞
ck [(k + p)(k + p − 1) − l(l + 1)] ξ
k+p−2
=2
k=0
∞
ck
√ (k + p) − 1 ξ k+p−1 .
k=0
Il termine di grado pi` u basso della prima somma (corrispondente a k = 0) non ha il suo analogo nella seconda somma. Si deve quindi avere p(p − 1) = l(l + 1) . Questa equazione di secondo grado in p ammette le due soluzioni p = l + 1, e p = −l. La seconda `e per` o da scartare in quanto deve essere p > 0. Si ottiene quindi che p `e un intero dato da p=l+1 . Sostituendo questo valore di p, si ottiene la relazione ricorrente cui devono soddisfare i coefficienti della serie di potenze ck+1 [(k + l + 2)(k + l + 1)] = 2 ck
√ (k + l + 1) − 1 .
Se la serie non `e troncata, poich´e si ha √ ck+1 , lim =2 k→∞ ck k √
la funzione f (ξ) va all’infinito come e2 ξ , dimodoch´e la funzione P (ξ) diverge. Se vogliamo una funzione limitata dobbiamo supporre che la serie sia troncata, ovvero dobbiamo imporre che, in corrispondenza di un certo intero k0 ≥ 0, sia √ (k0 + l + 1) = 1 .
(6.15)
Questa equazione porta agli autovalori possibili per che sono dati da =
1 1 = 2 , (k0 + l + 1)2 n
dove n `e un intero tale che n≥l+1 . Ricordando le nostre sostituzioni iniziali si ottiene quindi per gli autovalori dell’energia E=−
e20 Z 2 , 2 a0 n 2
156
CAPITOLO 6
ovvero un’espressione che coincide con quella trovata attraverso la teoria di Bohr. Per quanto riguarda le autofunzioni, determiniamo l’equazione differenziale cui soddisfa la serie di potenze L(ξ). Ricordando la sua definizione e l’equazione differenziale per f (ξ), si ha ξ
d2 l+1 ξ d L(ξ) + 2 1 − L(ξ) = 0 . L(ξ) + 2 l + 1 − dξ 2 n dξ n
Questa equazione pu`o essere riportata all’equazione differenziale caratteristica dei polinomi generalizzati di Laguerre. Per far questo bisogna introdurre una nuova variabile, ρ, data da ρ=
2 2Z ξ= r . n n a0
In termini di ρ, l’equazione differenziale risulta ρ
d2 d L(ρ) + (2 l + 2 − ρ) L(ρ) + (n − l − 1) L(ρ) = 0 . 2 dρ dρ
I polinomi generalizzati di Laguerre5 soddisfano l’equazione differenziale x
d (q) d2 (q) L (x) + p L(q) L (x) + (q + 1 − x) p (x) = 0 , dx2 p dx p
per cui la nostra funzione L(ρ) `e, a parte un fattore di proporzionalit`a, il (2l+1) polinomio generalizzato di Laguerre Ln−l−1 . Raccogliendo i risultati precedenti, abbiamo trovato che l’autofunzione radiale ridotta corrispondente agli autovalori n e l pu` o essere espressa con maggior semplicit` a in termini della variabile ρ ed `e data, a parte un fattore di proporzionalit` a, da Pnl (ρ) = e−ρ/2 ρl+1 Ln−l−1 (ρ) . (2l+1)
(6.16)
Questo risultato, unito a quello ottenuto nel paragrafo precedente per la parte angolare della funzione d’onda, permette di esprimere le autofunzioni dell’atomo idrogenoide nella forma ψnlm (r, θ, φ) = Nnl e−ρ/2 ρl Ln−l−1 (ρ) Ylm (θ, φ) , (2l+1)
dove Nnl `e un fattore da determinare imponendo che le autofunzioni siano normalizzate. Tenendo conto della formula, 5
Seguiamo qui la convenzione contenuta nel volume M. Abramowitz & I.A. Stegun, Handbook of Mathematical Functions, Dover Publ., New York, 1971.
ATOMI CON UN SOLO ELETTRONE DI VALENZA
∞
0
157
2 2 n [(n + l)! ]3 (2l+1) , e−ρ ρ2l Ln−l−1 (ρ) ρ2 dρ = (n − l − 1)!
si ottiene Nnl =
Z a0
3/2
% 2 n2
(n − l − 1)! . [(n + l)! ]3
(6.17)
Le espressioni esplicite delle autofunzioni dell’atomo idrogenoide possono essere ottenute attraverso la formula dei polinomi generalizzati di Laguerre L(q) p (x)
=
p
(−1)m
m=0
[(p + q)!]2 xm . (p − m)! (q + m)! m!
(6.18)
Le autofunzioni normalizzate per i primi due livelli (n = 1 e n = 2) risultano ψ100 (r, θ, φ) =
Z a0
3/2
2 e−Zr/a0 Y00 (θ, φ) ,
(6.19)
3/2 1 −Zr/(2a0 ) Zr Z √ e 2− Y00 (θ, φ) , ψ200 (r, θ, φ) = a0 a0 8 3/2 1 Zr Z √ e−Zr/(2a0 ) Y1m (θ, φ) . ψ21m (r, θ, φ) = a0 a0 2 6
Le propriet` a dei polinomi generalizzati di Laguerre permettono di determinare i valori medi delle potenze di r sulle autofunzioni radiali. Definendo ∞ ∞ 2 2 rk = Rnl (r) rk r2 dr = Pnl (r) rk dr , 0
ed esprimendo r
r4 r−1 r−4
in unit` a di
0
ak0 ,
si ottengono i seguenti risultati
1 n2 [3 n2 − l(l + 1)] , r2 = [5 n2 + 1 − 3 l(l + 1)] , 2Z 2 Z2 n2 = [35 n2 (n2 − 1) − 30 n2 (l + 2)(l − 1) + 3(l + 2)(l + 1)l(l − 1)] , 8 Z3 n4 = [63 n4 − 35 n2 (2l2 + 2l − 3) + 5 l(l + 1)(3l 2 + 3l − 10) + 12] , 8 Z4 Z 2 Z2 2 Z3 , , = 2 , r−2 = 3 r−3 = 3 n n (2l + 1) n l(l + 1)(2l + 1) 4 Z 4 [3 n2 − l(l + 1)] . = 5 n (2l + 3)(2l + 1)(2l − 1)l(l + 1) (6.20)
r = r3
k
158
CAPITOLO 6
I valori riportati nelle equazioni precedenti permettono di riottenere in senso probabilistico i risultati della teoria di Bohr. Il caso delle orbite circolari corrisponde infatti ad assumere, fissato n, il massimo valore possibile per il numero quantico l, ovvero l = n − 1. Per tale valore si ottiene r = a0
2 n2 + n , 2Z
che, al limite per grandi valori di n, coincide con l’espressione del raggio delle orbite di Bohr. Interessante `e anche calcolare la varianza σ(r) definita da , σ(r) =
r2 − r
2
.
Sempre per l = n − 1 si ottiene √ n 2n+1 , σ(r) = a0 2Z e quindi σ(r) 1 . =√ r 2n+1 Per grandi valori di n la funzione d’onda dell’elettrone tende a essere sempre pi` u concentrata intorno all’orbita di Bohr. Le autofunzioni che abbiamo determinato dipendono da tre numeri quantici, n, l, e m, che soddisfano le seguenti disuguaglianze n≥1 ,
l ≤n−1 ,
|m| ≤ l .
I tre numeri quantici prendono il nome, rispettivamente di numero quantico principale, numero quantico azimutale, e numero quantico magnetico. Talvolta si fa riferimento anche al cosiddetto numero quantico radiale, nr , definito da nr = n−l−1. Come abbiamo visto sopra, nr rappresenta il grado del polinomio generalizzato di Laguerre che compare nell’espressione dell’autofunzione. Per una propriet` a dei polinomi stessi, nr rappresenta anche il numero dei valori di r in cui l’autofunzione si annulla. Per una circostanza del tutto particolare, tipica del potenziale Coulombiano, gli autovalori dell’atomo idrogenoide dipendono solo dal numero quantico principale n e non anche da l (l’indipendenza da m `e caratteristica del potenziale centrale ed `e connessa alla simmetria sferica dell’Hamiltoniana). Questo fa s`ı che gli autovalori dell’atomo idrogenoide siano doppiamente degeneri (rispetto a m e a l). Per calcolare la degenerazione del livello n `e sufficiente osservare che l pu` o assumere i valori 0, 1, . . . , n − 1, e che, assegnato l, m pu` o assumere i (2 l + 1) valori −l, −l + 1, . . . , 0, . . . , l − 1, l. La degenerazione `e quindi
ATOMI CON UN SOLO ELETTRONE DI VALENZA
g(n) =
n−1
159
(2 l + 1) = n2 .
l=0
In teoria relativistica, quando si introduce lo spin, le funzioni d’onda sono caratterizzate da un ulteriore numero quantico, ms , l’autovalore dell’operatore sz , proiezione dello spin lungo l’asse di quantizzazione z, che pu` o assumere i due valori ± 12 . Tenendo conto anche dello spin, la degenerazione del livello n risulta quindi uguale a 2 n2 .
6.4 Atomo di Idrogeno, correzioni relativistiche Sebbene l’equazione di Dirac per l’atomo idrogenoide possa essere risolta in maniera esatta, preferiamo qui dedurre l’espressione delle correzioni relativistiche ai livelli energetici di tale atomo applicando la teoria delle perturbazioni. Riprendiamo quindi l’equazione di Dirac al limite non relativistico sviluppato al primo ordine (Eq. (5.13)) e, in tale equazione, sostituiamo il potenziale φ con Ze0 /r, la carica e con −e0 , e la massa m con la massa ridotta mr . A proposito di quest’ultima sostituzione bisogna dire che l’equazione di Dirac `e valida per un ipotetico nucleo di massa infinita, e che la sua generalizzazione al caso della massa finita (problema relativistico dei due corpi) porta a equazioni notevolmente complesse6 . La sostituzione m → mr non `e quindi completamente giustificata dal punto di vista teorico, ma va piuttosto considerata come un’approssimazione di carattere fenomenologico. Tenendo conto di queste sostituzioni, l’equazione pu` o essere posta nella forma H |ψ = (H0 + H ) |ψ = E |ψ
,
dove |ψ `e, in notazione di Dirac, la funzione d’onda spinoriale, e dove H0 = 1 H =− 2 m r c2
p2 Ze20 , − 2 mr r
2 ¯2 1 ∂ ¯2 1 Z e20 h Z e20 Z e20 h + E+ − σ · . r 4 m2r c2 r2 ∂r 4 m2r c2 r3
Riguardo al primo termine nell’espressione di H , notiamo che abbiamo preferito esprimerlo mediante la seconda delle due forme alternative dell’Eq.(5.12). Ricordiamo brevemente i risultati della teoria delle perturbazioni al primo ordine. Si abbia un’Hamiltoniana H esprimibile nella forma H0 + H , con 6
Si veda l’articolo: R. Giachetti & E. Sorace, Journal of Physics A 39, 15207 (2006).
160
CAPITOLO 6
H H0 , e supponiamo di aver risolto l’equazione di Schr¨ odinger stazionaria per H0 trovando gli autovalori En e i corrispondenti autovettori |n H0 |n = En |n
.
Per determinare la “perturbazione” indotta dall’Hamiltoniana H sugli autovalori En si agisce nella seguente maniera: a) se l’autovalore dell’energia non `e degenere, la correzione ΔEn all’energia si ottiene attraverso l’elemento di matrice diagonale ΔEn = n| H |n
,
mentre l’autovettore resta invariato; b) se invece l’autovalore `e degenere, indicato con ν un ulteriore numero quantico (o un set di numeri quantici) che caratterizza gli autovettori, |n, ν , dello spazio degenere, si calcolano gli elementi di matrice Hνν n, ν| H |n, ν =
,
e si determinano autovalori e autovettori di tale matrice che danno, rispettivamente, le correzioni all’energia En e gli autovettori dell’Hamiltoniana totale. Naturalmente, il calcolo risulta enormemente semplificato quando `e possibile trovare una base rispetto alla quale la matrice H νν `e diagonale. Altrimenti, con l’esclusione delle matrici di ordine 2 e, in qualche caso, di quelle di ordine 3, il calcolo, in generale, pu` o essere eseguito solo numericamente. Applichiamo adesso la teoria delle perturbazioni al nostro caso particolare. Come abbiamo visto nel paragrafo precedente, l’Hamiltoniana H0 ammette, tenendo conto anche dello spin, autofunzioni caratterizzate dai quattro numeri quantici n, l, m, ms di cui conosciamo l’espressione esplicita. Per tali autofunzioni utilizzeremo la notazione compatta |nlmms . L’energia invece dipende solo da n, per cui, per un n fissato, si hanno 2 n2 livelli degeneri caratterizzati da tutti i possibili valori diversi di l, m, e ms . Dobbiamo quindi calcolare, in principio, gli elementi di matrice Hlmm nlmms | H |nl m ms = s ,l m ms
.
L’Hamiltoniana H consta di tre termini. I primi due, agendo soltanto sulla variabile radiale r, commutano con gli operatori 2 , z e sz e, quindi, hanno elementi di matrici diagonali rispetto ai corrispondenti numeri quantici. Il terzo termine, invece, contenendo l’espressione σ · , non `e diagonale. Si pu`o tuttavia ovviare a questo inconveniente eseguendo un cambiamento di base, passando cio`e dalla base |nlmms alla base |nljmj , dove j e mj sono i numeri quantici relativi a un nuovo operatore, j, definito da j = + s .
ATOMI CON UN SOLO ELETTRONE DI VALENZA
161
Come mostrato nella sezione di questo libro dedicata alla teoria del momento angolare (Par. 7.9), il cambiamento di base implica che i nuovi vettori di stato si ottengono mediante opportune combinazioni lineari dei vecchi vettori le quali coinvolgono i coefficienti di Clebsh-Gordan (o i simboli 3-j di Wigner). Per i nostri scopi presenti non `e per` o necessario entrare nei dettagli della trasformazione. Basta qui osservare che, attraverso l’introduzione dell’operatore j, si pu` o trovare un’espressione appropriata per il termine · σ . Si ha infatti j 2 = ( + s )2 = 2 + s2 + 2 · s , dalla quale si ottiene, ricordando che σ = 2 s · σ = 2 · s = j 2 − 2 − s2 . L’operatore · σ risulta diagonale nella nuova base e, poich´e il terzo termine dell’Hamiltoniana H contiene tale operatore moltiplicato per una funzione di r, anche tale termine risulta, adesso, diagonale. Consideriamo uno stato caratterizzato, oltre che da n, dai tre numeri quantici l, j, e mj . L’energia imperturbata `e, come sappiamo E=−
Z 2 e20 1 , 2 a0 n 2
dove a0 = h ¯ 2 /(mr e20 ). Indichiamo con ΔE1 , ΔE2 e ΔE3 l’energia di perturbazione dovuta, rispettivamente, ai tre termini dell’Hamiltoniana H , ovvero al termine di correzione dell’energia cinetica, al termine di Darwin, e al termine di interazione spin-orbita. Si ha, per il primo termine 1 Z 2 e40 Z 2 Z a0 r−1 2 −2 ΔE1 = − , − + a0 r 2 mr c2 a20 4 n4 n2 e, ricordando le espressioni per r k date nel paragrafo precedente (Eq. (6.20)), si ottiene Z 4 e40 1 2 1 ΔE1 = − . − + 2 mr c2 a20 4 n4 n4 n3 (2l + 1) Questa espressione pu`o essere messa nella forma pi` u significativa Z 2 e20 Z 2 α2 3 n ΔE1 = − , − 2 a0 n 2 n 2 4 l + 12 dove α `e la costante della struttura fine. Per il termine di Darwin, indicando con Rnl (r) la funzione radiale, si ha ¯2 ∞ d Z e20 h 1 Rnl (r) r2 dr . Rnl (r) 2 ΔE2 = − 4, m2r c2 0 r dr
162
CAPITOLO 6
Risolvendo l’integrale si ottiene ΔE2 =
Z e20 h ¯2 2 R (0) . 8 m2r c2 nl
Questa quantit` a `e tipica di un termine di contatto, risultato che avevamo gi` a ottenuto nel Par. 5.5 (cfr. Eq. (5.15)). Essa `e diversa da zero solo per stati aventi l = 0 in quanto essi sono gli unici per i quali la funzione radiale `e diversa da zero nell’origine. Per mezzo delle Eq. (6.16), (6.17) e (6.18), si ottiene Rnl (0) =
Pnl (r) r
=2
r=0
Z n a0
3/2 δl,0 ,
e quindi ΔE2 =
Z 2 e20 1 2 2 1 Z α δl,0 . 2 a0 n 2 n
Infine, per il termine di interazione spin-orbita si ottiene ΔE3 =
¯ 2 −3 Z e20 h r [ j(j + 1) − l(l + 1) − 4 m2r c2
3 4
] ,
dove, per le regole d’addizione di due momenti angolari, il numero quantico j pu` o assumere i due valori (l − 12 ) e (l + 12 ), se l = 0, e il solo valore j = 12 , se l = 0. Sostituendo l’espressione per r −3 (Eq. (6.20)), si ha ΔE3 =
Z 2 e20 1 2 2 j(j + 1) − l(l + 1) − Z α 2 a0 n 2 n l(l + 1)(2l + 1)
3 4
.
(6.21)
` da notare che, per l = 0, questa espressione risulta indeterminata, essendo E della forma 0/0. Considerazioni pi` u approfondite mostrano che, in tale caso, si deve assumere ΔE3 = 0. Raccogliendo i contributi portati dai tre termini, aggiungendo tale risultato all’energia imperturbata, e distinguendo fra i tre casi possibili, si ottiene, per l’energia dello stato caratterizzato dai numeri quantici n, l, j e mj , l’espressione Z 2 α2 Z 2 e20 1 3 1 + (n − ) , (l = 0) , Enljmj = − 4 2 a0 n 2 n2 Z 2 α2 n Z 2 e20 1 3 − Enljmj = − 1+ , (l = 0 , j = l + 12 ) , 2 a0 n 2 n2 l+1 4 Z 2 α2 n 3 Z 2 e20 1 −4 Enljmj = − 1+ , (l = 0 , j = l − 12 ) . 2a0 n2 n2 l Le tre formule possono essere finalmente raccolte nell’unica
163
ATOMI CON UN SOLO ELETTRONE DI VALENZA
Enljmj
Z 2 α2 n Z 2 e20 1 1+ =− 2 a0 n 2 n2 j+
1 2
−
3 4
.
Questa espressione mostra che l’energia non dipende dal numero quantico mj (come era ovvio attendersi, essendo [ H, jz ] = 0) e che, inoltre, essa dipende soltanto da j (momento angolare totale) ma non da l (momento angolare orbitale). L’espressione inoltre coincide con lo sviluppo in serie al secondo ordine in α2 della soluzione esatta dell’equazione di Dirac per il campo Coulombiano. Tale soluzione, che contiene anche l’energia di riposo mc2 , `e infatti7
Enljmj = m c2 1 +
αZ √ n − k + k 2 − α2 Z 2
2 −1/2 ,
dove k=j+
1 2
.
Come abbiamo gi` a detto, la massa che compare in questa formula `e per`o la massa dell’elettrone e non la sua massa ridotta. Prescindendo da questa differenza, la formula da noi trovata e quella relativa alla soluzione esatta differiscono, per l’atomo di Idrogeno, di una quantit` a dell’ordine di α6 m c2 = α4
e20 . a0
Questa correzione `e cos`ı piccola da essere praticamente inosservabile sperimentalmente (e da confondersi con altre correzioni di cui parleremo in seguito). Per queste ragioni, la formula da noi trovata con la teoria delle perturbazioni pu` o, a tutti gli effetti, essere considerata esatta e non approssimata. Una volta che si tenga conto delle opportune correzioni, la formula `e verificata sperimentalmente con ottima precisione. La struttura dei livelli dell’atomo di Idrogeno risultante dalle correzioni relativistiche, la cosiddetta struttura fine, `e schematicamente illustrata nella Fig. 6.5. I livelli presentano una struttura complessa con l’energia che aumenta, fissato n, all’aumentare di j. Poich´e il valore minimo di j `e 12 , mentre il valore massimo `e n − 12 , la differenza in energia fra i livelli estremi risulta pari a ΔE =
e20 α2 (n − 1) , 2 a0 n 4
e diminuisce rapidamente all’aumentare di n. In termini numerici, se si considera la riga Lyα a 1216 ˚ A, si pu` o osservare che tale riga risulta separata dalla 7
Per la deduzione dell’equazione si veda ad esempio P.A.M. Dirac, The Principles of Quantum Mechanics, 4th Ed., Clarendon Press, Oxford, 1958.
164
CAPITOLO 6
l=0
l=1
l=2
n=4 3/2 1/2
n=3
n=2
5/2 3/2
7/2 5/2
1/2
3/2 1/2
l=3
5/2 3/2
1/2
3/2 1/2
1/2
n=1 1/2
Fig. 6.5. Diagramma di Grotrian della struttura fine dei primi 4 livelli dell’atomo di Idrogeno. Le linee punteggiate rappresentano le energie dei livelli imperturbati, quali risultano dalla teoria non relativistica. Il valore del numero quantico j ` e dato a destra di ciascun livello. Gli intervalli di energia non sono rappresentati in scala.
struttura fine in due componenti che differiscono fra loro di 5.4 m˚ A. Per la riga Lyβ a 1026 ˚ A, si hanno ancora due componenti con una separazione di 1.1 m˚ A. Come abbiamo detto precedentemente, esistono ulteriori correzioni allo spettro dell’atomo di Idrogeno che sono dovute, per un lato, alla presenza dello spin nucleare (struttura iperfine) e, per l’altro lato, a fenomeni di natura puramente quantistica dovuti alla cosiddetta auto-energia (self-energy) dell’elettrone. Alla struttura iperfine `e dedicata una sezione di questo volume (si vedano i Par. 9.8 e 9.9). Per quanto riguarda gli altri fenomeni, accenniamo semplicemente al fatto che essi furono messi in evidenza sperimentalmente da W.E. Lamb nel 1947. Mediante dispositivi spettroscopici di elevata risoluzione si osserva che livelli caratterizzati dagli stessi valori dei numeri quantici n e j, ma da diversi valori di l, hanno energie leggermente diverse (in contraddizione con la teoria di Dirac la quale prevede invece lo stesso valore per l’energia). Ad esempio, per il livello n = 2 dell’atomo di Idrogeno, si osserva, fra il sottolivello l = 0, j = 21 e il sottolivello l = 1, j = 12 , una differenza in energia pari a 1057.8 MHz (per confronto, la differenza in energia fra i sottolivelli l = 1, j = 12 e l = 1, j = 32 `e pari a 10968.6 MHz, ovvero circa un ordine di grandezza pi` u alta).
ATOMI CON UN SOLO ELETTRONE DI VALENZA
165
Questo effetto, che prende il nome di Lamb-shift, si spiega supponendo che l’elettrone in orbita intorno al nucleo esegua delle transizioni “virtuali” (che non conservano l’energia) con emissione di fotoni che vengono immediatamente riassorbiti dall’elettrone medesimo. Bisogna infatti osservare che il principio di indeterminazione di Heisenberg permette, su un tempo piccolo Δt, che la conservazione dell’energia possa essere violata di una quantit`a ΔE data da h ¯ . Δt L’insieme di questi processi virtuali porta a una correzione all’energia dell’elettrone la quale dipende dall’orbita stessa ed `e quindi diversa per stati con l diversi. I calcoli dettagliati, sviluppati da Bethe, sono in ottimo accordo con i valori osservati8 . ΔE
6.5 Spettri dei metalli alcalini Dopo quelli degli atomi idrogenoidi, gli spettri pi` u semplici risultano quelli dei metalli alcalini, ovvero degli elementi che occupano la prima colonna del sistema periodico, insieme alle loro sequenze isoelettroniche (Li, Be + , B++ , . . ., Na, Mg+ , Al++ , . . ., K, Ca+ , Sc++ , . . ., etc.). Questi atomi (ioni) sono caratterizzati dalla presenza di un solo “elettrone di valenza” (elettrone ottico), ovvero di un solo elettrone che ruota pi` u esternamente attorno a una nuvola di carica costituita dal nucleo e dagli altri elettroni. Ammettendo che la nuvola di carica abbia simmetria sferica, i livelli energetici dell’elettrone di valenza si trovano, come per il caso dell’atomo idrogenoide, risolvendo l’equazione stazionaria di Schr¨ odinger in un opportuno potenziale centrale, V (r). Per quanto riguarda la parte angolare le autofunzioni sono sempre date dalle armoniche sferiche, mentre la funzione radiale ridotta, P (r), obbedisce all’Eq. (6.14) che qui riscriviamo h ¯ 2 d2 h ¯ 2 l(l + 1) − P (r) = E P (r) . P (r) + V (r) + 2 m dr2 2 m r2 Un’approssimazione fenomenologica che pu`o essere assunta per V (r) `e la seguente a b V (r) = − − 2 , r r dove a e b sono due costanti. Tale espressione non `e che l’inizio dello sviluppo della funzione V (r) in serie di potenze di 1/r e risulta particolarmente appropriata per i metalli alcalini in quanto, per valori elevati di r, il potenziale 8
Per una discussione approfondita del Lamb-shift si veda H.A. Bethe & E.E. Salpeter, Quantum Mechanics of One- and Two-Electron Atoms, Springer-Verlag, Berlin, etc. 1957.
166
CAPITOLO 6
presenta un andamento Coulombiano (in accordo col fatto che gli elettroni interni schermano completamente la carica del nucleo), mentre, per piccoli valori di r, prevale il termine in r−2 che descrive la riduzione dell’effetto di schermo all’interno della nuvola elettronica. La costante a vale Zr e20 , dove Zr , il cosiddetto numero di carica residua, `e dato da Zr = Z − N e + 1 ,
(6.22)
con Z numero di carica del nucleo e Ne numero totale degli elettroni (Zr = 1 per atomi neutri, 2 per atomi una volta ionizzati, etc.). Per quanto riguarda la costante b, essa pu` o essere posta nella forma b=
h ¯2 β , 2m
con β adimensionale. Con queste posizioni, l’equazione per la funzione radiale ridotta risulta h ¯ 2 d2 h ¯ 2 l (l + 1) Zr e20 − + P (r) = E P (r) , (6.23) P (r) + − 2 m dr2 r 2 m r2 dove il numero reale l , definito implicitamente dall’equazione l (l + 1) = l(l + 1) − β , `e tradizionalmente scritto nella forma l = l − δl , la quantit` a δl essendo detta correzione di Rydberg, oppure difetto quantistico (quantum defect). L’equazione (6.23) pu` o essere risolta, in stretta analogia a quanto fatto nel caso dell’atomo idrogenoide. Eseguiti analoghi cambiamenti di variabile, si trova che, affinch´e la funzione radiale ridotta sia convergente all’infinito, deve essere verificata una relazione analoga a quella dell’Eq. (6.15) con l sostituito da l , ovvero √
(k0 + l + 1) =
√ (k0 + l − δl + 1) = 1 ,
dove k0 `e un intero ≥ 0 che stabilisce l’ordine del polinomio che compare nella funzione d’onda radiale ridotta. Per l’energia si ottiene infine Enl = −
1 Zr2 e20 , 2 a0 (n − δl)2
la quale mostra che le energie degli atomi alcalini, a differenza di quelle degli atomi idrogenoidi, dipendono anche dal numero quantico azimutale l, in quanto δl `e funzione di l. Il numero quantico n qui introdotto `e dato da
ATOMI CON UN SOLO ELETTRONE DI VALENZA
167
n = nr + l + 1 , dove nr , il numero quantico radiale, coincide con k0 . Poich´e nr ≥ 0, anche nel caso degli atomi alcalini si ha quindi l ≤n−1 . In certi casi si preferisce scrivere la formula per le energie nella forma Enl = −
Zr2 e20 1 , 2 a0 n∗2
(6.24)
dove n∗ = n − δl
(6.25)
`e un numero reale che prende il nome di numero quantico effettivo (effective quantum number). La correzione di Rydberg, δl, decresce rapidamente all’aumentare di l. Questo significa che, per l elevato, le energie dei livelli si approssimano sempre pi` u al corrispondente valore idrogenoide. La cosa non `e sorprendente e si interpreta pensando che le orbite con valore di l basso sono quelle pi` u allungate, cio`e quelle che penetrano pi` u profondamente entro la nuvola elettronica centrale (orbite penetranti). Per tali orbite ci si deve quindi attendere un’energia inferiore alla corrispondente energia idrogenoide. Viceversa, per alti valori di l, le orbite sono praticamente circolari e tendono quindi a evitare la zona centrale dell’atomo in cui il potenziale elettrico differisce sostanzialmente dal potenziale Coulombiano. Per tali orbite l’energia coincide quindi col valore idrogenoide. Un’ulteriore differenza rispetto al caso idrogenoide consiste nel fatto che il numero quantico n corrispondente al livello energetico pi` u basso (stato fondamentale) non `e uguale a 1, come per gli atomi idrogenoidi, ma `e uguale a 2 per il Litio, 3 per il Sodio, e cos`ı via. Questa `e una conseguenza del principio di esclusione di Pauli di cui parleremo in seguito (si vedano i Par. 7.1 e 7.7). Il diagramma di Grotrian per l’atomo di Sodio neutro `e rappresentato schematicamente nella Fig. 6.6. In tale figura sono anche riportate le righe appartenenti alle serie pi` u importanti del Na I. Dalla figura appare evidente che si hanno transizioni soltanto fra termini appartenenti a colonne adiacenti. In simboli, indicando con Δl la variazione del numero quantico azimutale nella transizione, si deve avere Δl = ±1 .
(6.26)
Una legge di questo genere viene detta regola di selezione. Nel Cap. 12 vedremo come questa legge possa essere dedotta in maniera rigorosa considerando l’interazione dell’atomo col campo di radiazione. Per il momento ci accontentiamo
168
CAPITOLO 6
s (l=0)
ν 6 5
p (l=1)
d (l=2)
6
f (l=3)
6
6
5
5
5
4
4
4
3
4
3
Na I 3
Fig. 6.6. Diagramma di Grotrian dell’atomo di Sodio neutro. La scala verticale d` a direttamente le energie dei livelli in cm−1 . Il numero quantico principale `e indicato accanto a ciascun livello. La figura mostra anche le varie serie di righe, ovvero le serie principale, sottile, diffusa e fondamentale.
di introdurre la regola di selezione in maniera fenomenologica accennando che essa `e dovuta al fatto che il cosiddetto elemento di matrice di dipolo fra gli stati iniziale e finale della transizione, ovvero l’elemento di matrice ψi | r |ψf
,
`e nullo a meno che non sia verificata la regola (6.26). Naturalmente tale regola di selezione vale non soltanto per lo spettro dell’atomo di Sodio ma per tutti gli spettri degli atomi con un solo elettrone di valenza, compresi gli atomi idrogenoidi. Le prime classificazioni proposte per interpretare lo spettro degli atomi alcalini rendono conto dell’uso spettroscopico di indicare i termini aventi valori di l pari a 0, 1, 2, 3, rispettivamente con le lettere (minuscole) “s”, “p”, “d”, “f ”. Infatti, la cosiddetta serie “principale” `e quella che risulta dalle transizioni fra termini con l = 1 e lo stato fondamentale; essa rende conto della denominazione “p” data ai termini con l = 1. Analogamente la serie “sottile” (sharp), che proviene dalla combinazione dei termini aventi l = 0 con il termine pi` u basso di quelli aventi l = 1, giustifica la denominazione “s” data ai termini con l = 0. Infine, la serie “diffusa”, che connette i termini aventi l = 2 col termine pi` u basso con l = 1, e la serie “fondamentale”, che connette i termini aventi l = 3 col termine pi` u basso con l = 2, rendono conto della denominazione “d” e “f ”
ATOMI CON UN SOLO ELETTRONE DI VALENZA
169
dei termini aventi l = 2 e l = 3, rispettivamente. Per valori di l pi` u elevati si procede poi con le lettere in ordine alfabetico a partire da “g” e con l’esclusione della lettera “j” (riservata, per cos`ı dire, ai momenti angolari) e delle lettere gi`a precedentemente utilizzate, in maniera da stabilire la corrispondenza risultante dal seguente schema
valori di l 0 denominazione s
1 p
2 3 d f
4 g
5 h
6 i
7 k
8 l
9 10 11 12 . . . . m n o q ...
Il gergo della spettroscopia si basa pesantemente sull’utilizzazione di questo codice. Ad esempio, invece di parlare di un elettrone la cui funzione d’onda `e caratterizzata dal numero quantico principale n = 3 e dal numero quantico azimutale l = 1, si parla semplicemente di un elettrone 3p. Il fatto poi che deve essere l ≤ (n − 1) fa s`ı che “esistano” soltanto elettroni 1s, 2s, 2p, 3s, 3p, 3d, e cos`ı via, mentre non esistono, ad esempio, elettroni 1d o elettroni 3f . I risultati teorici ottenuti per gli spettri dei metalli alcalini, condensati nelle Eq. (6.24) e (6.25), possono essere confrontati coi dati spettroscopici di laboratorio. Ad esempio, facendo riferimento allo spettro del Na I, si trova che le energie di tutti i livelli ns si ottengono dalle suddette equazioni (entro un errore inferiore o dell’ordine dell’1%) assumendo per la correzione di Rydberg il valore empirico δl = 1.36. Analogamente, per i livelli np si trova il valore δl = 0.87 e per i livelli nd il valore δl = 0.01. Le considerazioni sin qui svolte sugli spettri dei metalli alcalini hanno fatto astrazione dalla presenza dello spin. Anche per questi atomi si hanno, ovviamente, delle correzioni relativistiche descritte da termini analoghi a quelli visti per il caso dell’atomo idrogenoide. L’effetto del terzo e quarto termine nella parentesi quadra dell’Eq. (5.13), che dipendono soltanto dalla variabile radiale r, `e quello di apportare delle ulteriori correzioni al potenziale centrale (modificando leggermente, ad esempio, la costante β introdotta all’inizio del paragrafo). L’ultimo termine, che pu` o essere adesso riscritto nella forma h ¯2 1 d V (r) 2 · s , 4 m2 c2 r dr provoca invece uno sdoppiamento dei livelli aventi l = 0 (struttura fine). Introducendo il numero quantico j che (per l = 0) pu` o assumere i due valori l + 12 e l − 12 , si pu` o stimare l’intervallo in energia fra i due livelli di struttura fine sfruttando la formula precedentemente dedotta per gli atomi idrogenoidi. Un’applicazione diretta dell’Eq. (6.21) d` a Enlj=l+1/2 − Enlj=l−1/2 =
Z4 e20 2 , α 3 eff 2 a0 n l (l + 1)
170
CAPITOLO 6
dove Zeff rappresenta una sorta di carica nucleare efficace che parametrizza il potenziale nel quale si muove l’elettrone di valenza. Varie formule alternative sono state proposte per migliorare l’accordo di questa formula con i dati sperimentali. A seguito di un’analisi approfondita delle orbite penetranti, `e 4 stato proposto da Land´e di sostituire nella formula precdente il fattore Z eff con 2 2 Z Zr (Zr essendo il numero di carica residua), e di sostituire inoltre il numero quantico n con n∗ . La formula cos`ı modificata risulta quindi Enlj=l+1/2 − Enlj=l−1/2 =
e20 2 Z 2 Zr2 . α ∗3 2 a0 n l (l + 1)
Il confronto con i dati sperimentali mostra un accordo soddisfacente, soprattutto per quanto riguarda l’andamento con il numero quantico azimutale l. La presenza della struttura fine fa s`ı che gli spettri degli atomi alcalini si presentino come “spettri di doppietti”. Particolarmente conosciuto `e il cosiddetto doppietto del Sodio che si origina nella transizione fra il livello n = 3, l = 0 (livello 3s) e il livello n = 3, l = 1 (livello 3p), separato dalla struttura fine in due sottolivelli aventi j = 12 e j = 32 , rispettivamente. Le due righe del doppietto cadono rispettivamente alle lunghezze d’onda (nel vuoto) di 5891.58 e 5897.56 ˚ A, con una separazione di 5.98 ˚ A, ovvero di 17.2 cm−1 . Si noti che la formula dovuta a Land´e applicata al livello 3p d` a per la separazione il valore 36.6 cm−1 , ottenuto ponendo Z = 11, Zr = 1, n∗ = 2.13, l = 1. Questo valore `e circa il doppio di quello osservato sperimentalmente, il che mostra chiaramente i limiti della formula medesima che, in molti casi, pu`o essere utilizzata solo per dare una stima di ordine di grandezza. La formula, sebbene approssimata, illustra comunque una caratteristica fondamentale degli spettri atomici, ovvero che l’interazione spin-orbita aumenta rapidamente all’aumentare di Z.
Capitolo 7
Atomi con pi` u elettroni di valenza Gli spettri degli atomi che presentano un solo elettrone di valenza, considerati nel capitolo precedente, sono relativamente semplici e costituiscono gli unici esempi in cui i livelli energetici possono essere determinati mediante la soluzione di un’equazione di Schr¨ odinger unidimensionale. Quando si passa a trattare atomi che presentano un numero maggiore di elettroni di valenza, le cose si complicano considerevolmente ed `e indispensabile ricorrere a un certo numero di approssimazioni per rendere trattabile matematicamente il problema. Questo capitolo `e dedicato a introdurre le basi fisiche di tali approssimazioni oltre ai relativi concetti che da esse conseguono e che sono alla base della complessa terminologia comunemente utilizzata nella pratica spettroscopica (configurazioni, termini, multipletti, molteplicit` a, numeri quantici, etc.).
7.1 Il principio di esclusione di Pauli Una delle conseguenze pi` u importanti della meccanica quantistica `e il fatto che due particelle della stessa specie (come ad esempio due elettroni, due protoni, due atomi di Idrogeno, etc.) sono in tutto e per tutto indistinguibili dal punto di vista osservativo. Naturalmente, anche restando nell’ambito della fisica classica, non `e certo pensabile che corpuscoli della stessa natura possano portare dei “segni distintivi” che permettano di identificarli. Tuttavia, in fisica classica, `e sempre possibile, almeno in via di principio, seguire un corpuscolo con continuit` a nel tempo in maniera da stabilire con precisione la sua traiettoria ed `e quindi possibile identificarlo anche quando sia entrato in interazione con un corpuscolo della stessa natura. La situazione `e completamente diversa in meccanica quantistica, secondo i cui principi la rappresentazione pi` u adeguata che si pu` o dare di un corpuscolo `e quella di un pacchetto d’onde. Se due pacchetti d’onde che descrivono particelle uguali entrano in interazione fra loro (si pensi ad esempio a un urto fra due elettroni), anche se in seguito tornano a separarsi `e impossibile dire, sia dal punto di vista osservativo che da quello concettuale, quale pacchetto sia da attribuire a un corpuscolo e quale all’altro. D’altra parte, quando si descrive un sistema contenente due o pi` u particelle indistinguibili, `e necessario attribuire alle grandezze fisiche di ciascuna di esse il proprio simbolo matematico. Ad esempio, per un sistema composto di N elettroni, attribuiremo a un elettrone le coordinate (x1 , y1 , z1 ), a un altro
172
CAPITOLO 7
le coordinate (x2 , y2 , z2 ), e cos`ı via. Ovviamente, l’Hamiltoniana, cos`ı come qualsiasi altra osservabile del sistema, deve risultare simmetrica rispetto allo scambio di due qualsiasi degli indici che numerano gli elettroni (altrimenti gli elettroni sarebbero distinguibili!). Se si indica formalmente con Sij l’operatore che, agendo sulle variabili dinamiche del sistema, opera lo scambio delle particelle i e j, si deve avere, per qualsiasi osservabile O, Sij O = O . Per la funzione d’onda la situazione `e diversa in quanto la fase di tale funzione non `e una quantit` a osservabile. La condizione di invarianza rispetto allo scambio di due particelle non va quindi imposta alla funzione d’onda, bens`ı al suo modulo quadro. Se |ψ `e (in notazione di Dirac) la funzione d’onda complessiva del sistema di N particelle, la condizione di invarianza per il modulo quadro `e soddisfatta se Sij |ψ = e i α |ψ
,
dove α `e un numero reale arbitrario. D’altra parte, se si applica due volte l’operatore di scambio, la funzione d’onda deve ritornare a essere se stessa, per cui si deve avere Sij Sij |ψ = e 2 i α |ψ = |ψ
.
Si ottiene quindi e i α = ±1 , per cui, Sij = ±1 . Le funzioni d’onda per le quali vale il segno pi` u sono dette simmetriche (rispetto allo scambio delle particelle), mentre quelle per le quali vale il segno meno sono dette antisimmetriche. D’altra parte, dall’equazione di Schr¨ odinger segue che il tipo di simmetria di una funzione d’onda `e costante nel tempo. Infatti, la variazione infinitesima d|ψ nel tempo dt `e data da d|ψ =
1 H|ψ dt , ih ¯
ed essa ha lo stesso carattere di simmetria della |ψ dato che l’Hamiltoniana `e simmetrica rispetto allo scambio di due particelle. L’esperienza mostra che le particelle aventi spin nullo, oppure intero, hanno funzioni d’onda simmetriche, mentre quelle aventi spin semi-intero hanno funzioni d’onda antisimmetriche. Le prime sono dette particelle di Bose-Einstein,
` ELETTRONI DI VALENZA ATOMI CON PIU
173
o, pi` u semplicemente bosoni, le seconde sono dette particelle di Fermi-Dirac, o fermioni. Trattiamo adesso il caso particolare di N particelle identiche non interagenti e vediamo come, in questo caso, si possa esprimere la funzione d’onda del sistema complessivo per mezzo delle funzioni d’onda di particella singola. Per un tale sistema, indicando genericamente con xi l’intero set di coordinate (incluse eventualmente le coordinate di spin) della particella i-esima, l’Hamiltoniana `e uguale alla somma di N Hamiltoniane di particella singola, tutte uguali fra loro H(x1 , x2 , . . . , xN ) =
N
H(xi ) .
i=1
Indichiamo inoltre con ψa (x) le autofunzioni dell’Hamiltoniana H(x), e con Ea i corrispondenti autovalori H(x) ψa (x) = Ea ψa (x) . Come `e facile verificare, la funzione Ψ(a1 , a2 , . . . , aN ) = ψa1(x1 ) ψa2(x2 ) · · · ψaN(xN ) `e autofunzione dell’Hamiltoniana totale e corrisponde all’autovalore (Ea1 + Ea2 + · · · + EaN ), ovvero H(x1 , x2 , . . . , xN ) Ψ(a1 , a2 , . . . , aN ) = (Ea1 +Ea2 +· · ·+EaN ) Ψ(a1 , a2 , . . . , aN ) . Tuttavia questa funzione non soddisfa, salvo casi particolari, i requisiti richiesti di simmetria. La soluzione simmetrica si ottiene mediante un’operazione detta di simmetrizzazione ΨS (a1 , a2 , . . . , aN ) = NS P {ψa1(x1 ) ψa2(x2 ) · · · ψaN(xN )} , P
dove P `e l’operatore di permutazione delle coordinate delle particelle e dove la somma `e estesa a tutte le permutazioni possibili. NS `e poi una costante di normalizzazione da determinare in modo che | ΨS |2 = 1. Analogamente la soluzione antisimmetrica si ottiene mediante un’operazione detta di antisimmetrizzazione ΨA (a1 , a2 , . . . , aN ) = NA
(−1)P P {ψa1(x1 ) ψa2(x2 ) · · · ψaN(xN )} ,
(7.1)
P
dove il fattore di segno (−1)P vale ±1 a seconda che la permutazione considerata sia pari o dispari. Ad esempio, dalla funzione d’onda ψa (x1 )ψb (x2 )ψc (x3 ),
174
CAPITOLO 7
la quale rappresenta uno stato (del sistema complessivo) in cui la particella 1 occupa lo stato (di particella singola) a, la particella 2 lo stato b, e la particella 3 lo stato c, si ottiene la funzione d’onda antisimmetrica ΨA (a, b, c) = NA [ψa (x1 ) ψb (x2 ) ψc (x3 ) + ψa (x2 ) ψb (x3 ) ψc (x1 ) + ψa (x3 ) ψb (x1 ) ψc (x2 ) − ψa (x2 ) ψb (x1 ) ψc (x3 ) − ψa (x1 ) ψb (x3 ) ψc (x2 ) − ψa (x3 ) ψb (x2 ) ψc (x1 )] . Questa autofunzione descrive adesso uno stato (del sistema complessivo) in cui una particella (senza specificare quale) occupa lo stato (di particella singola) a, un’altra lo stato b e l’ultima lo stato c. Solo l’autofunzione antisimmetrizzata descrive uno stato fisico (ovviamente se le particelle considerate sono fermioni), mentre l’autofunzione di partenza non descrive uno stato fisico in quanto essa implica la distinguibilit` a delle particelle. L’operazione di antisimmetrizzazione si pu` o anche ottenere mediante la valutazione del determinante (detto determinante di Slater) di un’opportuna matrice ⎛ ⎞ ψa1(x1 ) ψa2(x1 ) · · · ψaN(x1 ) ⎜ ψ (x ) ψ (x ) · · · ψ (x ) ⎟ a2 2 aN 2 ⎟ ⎜ a 2 ΨA (a1 , a2 , . . . , aN ) = NA Det⎜ 1 ⎟ . ⎝ ··· ··· ··· ··· ⎠ ψa1(xN ) ψa2(xN ) · · · ψaN(xN ) Ricordando le regole dello sviluppo di un determinante, la propriet` a di antisimmetria della funzione d’onda rispetto allo scambio di due particelle risulta correlata al fatto che il determinante di una matrice cambia di segno se si scambiano fra loro due righe qualsiasi. Dalle medesime regole segue anche che, se si vuol ottenere una funzione d’onda non identicamente nulla, gli stati di particella singola a1 , a2 , . . . , aN , devono essere tutti distinti. In caso opposto si otterrebbe infatti una matrice avente due o pi` u colonne uguali e il relativo determinante risulterebbe nullo. Quanto abbiamo qui mostrato `e un’illustrazione del principio scoperto empiricamente da Pauli e che prende il nome di principio di esclusione o principio di Pauli: in un sistema composto da pi` u fermioni, ogni stato quantico pu` o essere occupato al pi` u da un fermione, ovvero, ogni fermione deve possedere un set di numeri quantici diverso dal set di qualsiasi altro fermione. Tale principio si pu` o anche enunciare facendo riferimento al cosiddetto concetto di numero di occupazione che `e, per definizione, il numero di particelle che condividono lo stesso stato quantico di particella singola. Nel caso dei fermioni, il numero di occupazione pu`o essere soltanto 0 oppure 1. Invece, nel caso dei bosoni, tale numero non `e soggetto ad alcuna limitazione. Osserviamo infine che il fattore di normalizzazione introdotto nelle formule precedenti risulta (se le singole ψai (x) sono normalizzate)
` ELETTRONI DI VALENZA ATOMI CON PIU
NS = (N ! m1 ! m2 ! · · ·)−1/2
175
per il caso simmetrico , per il caso antisimmetrico ,
NA = (N !)−1/2
dove, nel caso dei bosoni, m1 , m2 , · · · , sono i numeri di occupazione degli stati occupati dalle particelle.
7.2 L’Hamiltoniana non relativistica: buoni numeri quantici Consideriamo un atomo (o ione) composto da N elettroni mobili intorno a un nucleo centrale avente numero di carica Z. Trascurando le correzioni relativistiche, l’Hamiltoniana totale del sistema di elettroni si scrive nella forma H=
2 N 2 Ze20 e0 pi − + , 2 m r r i i=1 i >
Se si tiene adesso presente la formula che definisce la funzione generatrice delle funzioni di Legendre ∞ 1 # = Pn (μ) xn 1 − 2μx + x2 n=0
(|x| ≤ 1) ,
si ottiene l’espressione ∞ n r< 1 = Pn (cos Θ) . n+1 r12 r n=0 >
(7.9)
Sostituendo questa espressione nell’integrale, ed eseguendo l’integrazione sugli angoli polari dei due elettroni, si vede facilmente, per le propriet`a delle funzioni di Legendre, che contribuisce all’integrale il solo termine con n = 0. Si ottiene quindi3 ∞ ∞ 1 −2z (r1 +r2 )/a0 2 2 I3 = 16π 2 dr1 dr2 e r1 r2 , r> 0 0 ed eseguendo l’integrale con metodi elementari si ottiene I3 = 3
5π 2 a50 . 8 z5
Nel caso che stiamo considerando, in cui le funzioni d’onda degli elettroni sono a simmetria sferica, questa espressione per l’integrale I3 si pu` o anche ottenere, pi` u direttamente, attraverso semplici considerazioni basate sul teorema di Gauss.
186 Ione Valori calcolati (eV) Valori osservati (eV) Errore (%)
CAPITOLO 7
H−
He
Li+
Be++
B3+
C4+
N5+
O6+
−0.74 0.75 –
23.1 24.6 6.1
74.0 75.6 2.1
152.2 153.8 1.0
257.6 259.3 0.7
390.2 392.0 0.5
550.0 551.9 0.3
736.9 739.1 0.3
Tab. 7.1. Potenziale di ionizzazione dell’atomo di Elio e della sua sequenza isoelettronica.
Infine, sostituendo i valori trovati per gli integrali, si ottiene il valore di aspettazione dell’Hamiltoniana sulle funzioni di prova H =
e20 2 (z − 2 Zz + a0
5 8
z) .
Il primo termine in parentesi `e il contributo dell’energia cinetica, il secondo quello dell’interazione Coulombiana degli elettroni col nucleo, e il terzo quello dell’interazione Coulombiana fra i due elettroni. Nello spirito del metodo delle variazioni dobbiamo cercare il valore di z che minimizza H . Tale valore `e presto trovato uguagliando a zero la derivata di H rispetto a z. Il minimo si trova per z=Z−
5 16
,
e si ottiene H
min
=−
e20 Z− a0
5 2 16
.
5 La corrispondente autofunzione `e data dall’Eq. (7.8) con z sostituito da (Z− 16 ). Il risultato ora ottenuto permette di determinare il potenziale di ionizzazione dell’atomo di Elio (e della sua sequenza isoelettronica). Tale potenziale `e infatti dato dall’equazione
I+ H
min
=−
e20 2 Z , 2 a0
dove il secondo membro rappresenta l’energia dell’elettrone nello stato fondamentale dello ione risultante dalla ionizzazione. Sostituendo il valore di H min si ottiene I=
e20 2 5 Z − 4Z + 2 a0
25 128
.
Il confronto con i dati spettroscopici `e riportato nella Tab. 7.1. La tabella mostra che, astraendo dallo ione H− , per il quale il calcolo fornisce un valore negativo dell’energia di legame, i risultati del calcolo variazionale (ottenuti con una funzione di prova contenente un solo parametro libero) sono
` ELETTRONI DI VALENZA ATOMI CON PIU
187
relativamente accurati, soprattutto all’aumentare di Z. Ovviamente si possono ottenere risultati migliori introducendo funzioni di prova pi` u sofisticate. Con tali funzioni si trova, ad esempio, che lo ione H− `e effettivamente stabile (si veda il Par. 14.6). Una volta ottenuta la funzione d’onda dello stato fondamentale, il calcolo variazionale pu` o essere esteso alla determinazione dei livelli energetici aventi energia maggiore. Ad esempio, per ottenere l’energia del primo livello eccitato, `e sufficiente calcolare il valore di aspettazione dell’Hamiltoniana su stati descritti da funzioni di prova (dipendenti da uno o pi` u parametri) ortogonali rispetto alla funzione d’onda del livello fondamentale. Il minimo del valore di aspettazione ottenuto al variare dei parametri fornisce un limite superiore per l’energia del primo livello eccitato. Il metodo variazionale, che abbiamo qui illustrato con un semplice modello per l’atomo a due elettroni, `e anche utilizzato per trovare i livelli energetici di atomi complessi costituiti da un numero elevato di elettroni. In prima approssimazione tali atomi vengono descritti dall’Hamiltoniana non relativistica dell’Eq. (7.2). Per tali atomi si adotta una funzione d’onda di prova, Ψ, contenente un certo numero di parametri liberi e si calcola il valore di aspettazione dell’Hamiltoniana su tale funzione d’onda H = Ψ|H|Ψ
.
I parametri vengono poi variati fino ad ottenere il minimo per H . Le prime applicazioni numeriche di questo tipo si ebbero agli inizi degli anni 1930 ad opera soprattutto di Hartree. In questi primi lavori, la funzione di prova `e data semplicemente dal prodotto di N funzioni d’onda di particella singola, senza nessun tentativo di antisimmetrizzazione. Le funzioni d’onda di particella singola sono inoltre scelte in maniera tale da essere ortogonali fra loro e normalizzate. Una volta determinate le “migliori” funzioni d’onda col metodo variazionale si procede poi a trovare la densit`a di carica (calcolata sommando i moduli quadri delle funzioni d’onda di particella singola) e a risolvere l’equazione di Poisson (3.4) per determinare il potenziale φ(r). Dal potenziale φ(r) si passa poi all’energia potenziale Vc (r) attraverso delle espressioni approssimate simili a quelle viste nel paragrafo precedente e si risolve l’equazione di Schr¨ odinger stazionaria per trovare delle nuove funzioni d’onda di particella singola. Tali funzioni d’onda vengono di nuovo parametrizzate e si ripete il procedimento fino a trovare una soluzione autoconsistente del problema. I lavori di Hartree sono stati successivamente generalizzati da parte di diversi autori (fra cui in particolare Fock) per tener conto dell’indistinguibilit` a delle particelle. Il risultato `e una teoria complessa che `e oggi nota col nome di teoria di Hartree-Fock. La teoria spiega in maniera quantitativa la struttura dei livelli energetici degli atomi pi` u semplici e costituisce in ogni caso il punto di partenza per sviluppare interpretazioni pi` u sofisticate basate, in generale, sulla teoria delle perturbazioni.
188
CAPITOLO 7
7.6 Configurazioni L’Hamiltoniana di ordine zero, H0 , che abbiamo introdotto nell’approssimazione del campo centrale, `e costituita dalla somma di N Hamiltoniane formalmente uguali e indipendenti fra loro (si veda l’Eq. (7.3)). Per trovare i suoi autovalori e autovettori `e sufficiente risolvere l’equazione di Schr¨ odinger per l’Hamiltoniana di particella singola. Tenendo conto anche dello spin, la soluzione di tale equazione risulta caratterizzata da quattro numeri quantici n, l, m, e ms , ovvero ψnlmms =
1 Pnl (r) Ylm (θ, φ) χms , r
(7.10)
o assudove Ylm (θ, φ) `e l’armonica sferica, χms `e l’autofunzione di spin che pu` mere una delle due espressioni 0 1 , , oppure 1 0 a seconda che la proiezione dello spin lungo l’asse di quantizzazione sia 12 oppure − 12 , rispettivamente, e dove Pnl (r) `e la soluzione dell’equazione di Schr¨odinger radiale h ¯ 2 d2 h ¯ 2 l(l + 1) Pnl (r) = W0 (n, l)Pnl (r) , − Pnl (r) + Vc (r) + 2 m dr2 2 m r2
(7.11)
Vc (r) essendo il potenziale centrale e W0 (n, l) l’autovalore dell’energia, che dipende soltanto dai due numeri quantici n e l. I quattro numeri quantici n, l, m, e ms obbediscono alle solite restrizioni viste a proposito degli atomi idrogenoidi e dei metalli alcalini, ovvero n≥l+1 ,
|m| ≤ l ,
ms = ± 12 .
A proposito della prima diseguaglianza bisogna dire che, per un potenziale Vc (r) arbitrario, il significato del numero quantico principale n `e connesso al numero dei nodi (senza contare l’origine) della funzione d’onda radiale. Tale numero `e infatti dato da (n − l − 1). Con le autofunzioni di particella singola possiamo costruire le autofunzioni dell’Hamiltoniana H0 . Esse saranno caratterizzate da N set di numeri quantici a1 , a2 , . . . , aN , ciascun set ai essendo costituito dalla quaterna di numeri quantici (ni , li , mi , msi ). A tale autofunzione compete l’autovalore W0 =
i
W0 (ni , li ) ,
(7.12)
` ELETTRONI DI VALENZA ATOMI CON PIU
189
che dipende soltanto dai numeri quantici n e l, ma non dipende da m e ms . La conseguenza di questo fatto `e che esistono in generale diverse autofunzioni distinte che corrispondono al medesimo autovalore dell’Hamiltoniana H0 . Gli stati fisici corrispondenti formano, nel loro insieme, una cosiddetta configurazione che pu`o essere specificata assegnando il numero di elettroni contraddistinti dalla coppia di numeri quantici n e l, ovvero, pi` u sinteticamente, il numero di elettroni che occupano l’orbitale (nl). Nelle notazioni tipiche della spettroscopia una configurazione si designa brevemente con la scrittura n1 l1q1 n2 l2q2 . . . nk lkqk ,
& dove qi `e il numero di elettroni che occupano l’orbitale (ni li ), con i qi = N . Ad esempio, una possibile configurazione di un atomo con 5 elettroni `e la seguente 1s2 2s2 2p , nella quale, come `e consuetudine, si `e omesso l’esponente 1 all’orbitale 2p. I set completi di numeri quantici, ai , non possono tuttavia essere arbitrari. Infatti, a causa del principio di esclusione di Pauli, il set ai deve differire dal set aj (con i = j) per almeno uno dei numeri quantici n, l, m, ms . Questo fa s`ı che esistano delle restrizioni sul numero di elettroni che possono occupare un determinato orbitale. Dalle disuguaglianze scritte sopra si ha infatti che in un orbitale l si possono trovare al massimo Ql elettroni, dove Ql = 2 (2l + 1) . Cos`ı, ad esempio, in un orbitale s si possono trovare al massimo due elettroni, in un orbitale p sei elettroni, in un orbitale d dieci elettroni, e cos`ı via, dimodoch´e un’ipotetica configurazione quale 1s3 2s2 non rappresenta alcuno stato fisico (in quanto viola il principio di esclusione di Pauli). Un importante concetto riguardo alle configurazioni `e quello di parit` a, concetto che avevamo gi`a incontrato parlando delle autofunzioni di particella singola. Per l’autofunzione di particella singola, la parit`a `e data da (−1)l , dove l `e il numero quantico azimutale. Tale concetto si generalizza in maniera molto semplice alle configurazioni. La parit` a di una configurazione `e infatti data da & P = (−1) i li , e rappresenta il fattore per il quale viene moltiplicata la funzione d’onda di un qualsiasi stato appartenente alla configurazione per inversione delle coordinate degli elettroni rispetto all’origine. Le configurazioni si distinguono in configurazioni pari oppure dispari. Ad esempio, la configurazione 1s2 2s2 2p2 `e una configurazione pari (P = 1), mentre la configurazione 1s2 2s 2p3 `e una configurazione dispari (P = −1).
190
CAPITOLO 7
Un altro importante concetto `e quello di degenerazione. Assegnata una configurazione, ci possiamo chiedere quale sia il numero di stati quantici distinti a essa corrispondenti. Per trovare tale numero si pu` o ragionare nel modo seguente. Assegnato l’orbitale (nl), ovvero, come si usa dire, assegnata una sottozona (appartenente alla zona n), sia qnl il numero di elettroni in essa presenti. A ciascuno di tali elettroni pu`o essere assegnata una qualsiasi coppia di numeri quantici (m, ms ), in maniera per`o che ciascuna coppia differisca dalle altre per almeno uno dei due numeri quantici. Poich`e le coppie distinte sono in numero Ql , il numero di possibilit` a `e dato dalle combinazioni semplici di qnl oggetti della classe Ql . Per la degenerazione si ha quindi - Ql g= , qnl nl
dove il prodotto `e steso a tutti i valori possibili dei numeri quantici n e l e dove abbiamo introdotto il simbolo di coefficiente binomiale definito da n! n = (0 ≤ m ≤ n) . m m! (n − m)! A proposito di questa formula giova osservare che, essendo n n =1 , =1 , 0 n `e inutile considerare esplicitamente i contributi provenienti sia dalle cosiddette sottozone chiuse (quelle con qnl = Ql ) che dalle cosiddette sottozone vuote (quelle con qnl = 0). Ad esempio, per la configurazione 1s2 2s2 2p4 , si pu` o valutare la degenerazione tenendo conto soltanto della sottozona aperta 2p, e si ottiene 6 = 15 . g= 4 Inoltre, dalla propriet` a dei coefficienti binomiali n n , = n−m m segue una regola di simmetria secondo la quale, ad esempio, la degenerazione della configurazione nd4 `e uguale a quella della configurazione nd6 , etc.. Infine si pu` o osservare che la degenerazione di una configurazione dipende criticamente dal fatto che gli elettroni siano “equivalenti” oppure “non equivalenti”, ovvero che essi abbiano, a parit` a di l, valori uguali oppure diversi di
` ELETTRONI DI VALENZA ATOMI CON PIU
191
n. Ad esempio, consideriamo la configurazione 1s2 2s2 2p 3p 4p. Per tale configurazione, la degenerazione (dovuta ai tre elettroni p non equivalenti) `e data da 6 6 6 = 216 . · · g= 1 1 1 Invece, per la configurazione 1s2 2s2 2p2 3p, in cui si hanno due elettroni p equivalenti e uno non equivalente, si ha 6 6 = 90 , · g= 1 2 mentre per la configurazione 1s2 2s2 2p3 , con tre elettroni p equivalenti la degenerazione vale 6 = 20 . g= 3 Come si vede, la degenerazione diminuisce rapidamente all’aumentare del numero di elettroni equivalenti, un’ovvia conseguenza del principio di esclusione di Pauli.
7.7 Il principio di formazione del sistema periodico Il principio di esclusione di Pauli e l’approssimazione del campo centrale sono alla base del cosiddetto principio di formazione, col quale si riescono a comprendere, anche se non sempre in maniera quantitativa, le propriet` a fondamentali del sistema periodico degli elementi. Il principio consiste nel procedere a un’immaginaria “costruzione” degli atomi, considerati sempre nel loro stato fondamentale, partendo dall’atomo di Idrogeno e aggiungendo, volta per volta, un elettrone e una carica positiva al nucleo. Come sappiamo, l’atomo di Idrogeno nel suo stato fondamentale ha un solo elettrone nella sottozona 1s. Aggiungendo un elettrone e una carica positiva al nucleo, si ottiene l’atomo di Elio, nel quale i due elettroni possono entrambi “coabitare” nella sottozona 1s; ovviamente, lo stato 1s dell’atomo di Elio `e diverso dallo stato 1s dell’atomo di Idrogeno, dato che il potenziale centrale (approssimato) nel quale si muovono gli elettroni dell’Elio `e diverso dal potenziale puramente Coulombiano dell’atomo di Idrogeno. La configurazione che compete allo stato fondamentale dell’Elio, la cosiddetta configurazione normale, `e quindi 1s2 . Con l’atomo di Elio si chiudono sia la sottozona che la zona (che in questo caso coincidono, essendo n = 1). Le zone vengono comunemente disegnate con lettere maiuscole dell’alfabeto, a partire dalla lettera K e procedendo
192
CAPITOLO 7
in ordine alfabetico, secondo la convenzione dello schema seguente n 1 denominazione K
2 3 L M
4 5 6 N O P
7 Q
... . ...
Con l’atomo di Elio si chiude quindi la zona K. Passando all’atomo successivo, ovvero al Litio, l’elettrone “aggiunto”, deve andare a occupare uno stato della zona L. In questa zona si hanno sia orbitali s che orbitali p, ma ai primi compete energia minore perch´e le orbite sono pi` u penetranti (si ricordi la discussione del Par. 6.5 a proposito dei metalli alcalini). L’elettrone si dispone quindi nella sottozona 2s, e la sua autofunzione radiale `e molto pi` u “espansa” dell’autofunzione radiale dei due elettroni interni che occupano la zona K. Se si ricordano infatti i risultati dell’atomo idrogenoide, il valor medio della distanza radiale r relativo a uno stato 2s `e 4 volte pi` u grande del corrispondente valore per uno stato 1s, e, in questo caso, il rapporto risulta ancora maggiore perch´e gli elettroni interni risentono di una carica efficace pi` u elevata (una stima basata sulle considerazioni svolte nel 5 Par. 7.5 porta un ulteriore fattore 3 − 16 2.7, col che il rapporto assume un valore dell’ordine di 11). La conseguenza di questo fatto `e che il Litio presenta un elettrone pi` u debolmente legato degli altri, con un potenziale di ionizzazione di 5.4 eV (da confrontare col valore di 13.6 eV per l’Idrogeno e di 24.5 per l’Elio). Siccome le propriet` a chimiche degli elementi dipendono soltanto dagli elettroni periferici (elettroni di valenza od ottici), si comprende facilmente la ragione per cui il Litio `e un elemento chimicamente attivo con tendenza a cedere facilmente un elettrone (elemento monovalente). L’atomo successivo `e il Berillio, con configurazione normale 1s2 2s2 , al quale segue il Boro con configurazione normale 1s2 2s2 2p. Il Boro d` a inizio a un “periodo” di 6 elementi nel quale si riempie in maniera sempre pi` u completa la sottozona 2p. Si hanno cos`ı gli atomi di Carbonio, Azoto, Ossigeno, Fluoro e Neon. Col Neon, la cui configurazione normale `e 1s2 2s2 2p6 , si chiude sia la sottozona 2p che la zona L. Gli elementi con i quali si arriva a completare la sottozona p mostrano, dal punto di vista chimico, scarsissima tendenza a combinare con altri elementi. Essi sono detti gas nobili o gas inerti, e, dal punto di vista fisico, sono caratterizzati da elevati potenziali di ionizzazione. La stabilit` a chimica `e dovuta al fatto che una sottozona chiusa comporta una “nuvola” di carica elettronica caratterizzata da un’esatta simmetria sferica, conseguenza di una propriet` a delle armoniche sferiche l m=−l
2
|Ylm (θ, φ)| =
2l +1 , 4π
(indipendente da θ e φ) .
Inoltre, gli elettroni appartenenti a una sottozona p chiusa sono difficilmente eccitabili, in quanto devono essere portati su orbitali relativamente lontani in energia (l’orbitale 3s, ad esempio, nel caso del Neon). Questo non si verifica
` ELETTRONI DI VALENZA ATOMI CON PIU
193
invece per gli elementi relativi a sottozone s chiuse, come ad esempio il Berillio (per i quali rimane comunque vera la propriet` a di simmetria sferica della carica). Nel caso del Berillio, `e relativamente facile eccitare un elettrone 2s portandolo all’orbitale 2p e questo spiega la sua maggiore reattivit` a chimica rispetto a un elemento come il Neon. Dopo che si `e completata una zona, si ricomincia con un elemento contenente un elettrone debolmente legato, poi con due elettroni, tre elettroni, etc., legati sempre meno debolmente, fino ad arrivare nuovamente a una zona completa avente la massima stabilit`a. Da questo fatto risulta evidente l’origine della periodicit` a di quelle propriet` a degli elementi che dipendono dagli elettroni esterni, come il comportamento chimico e quello spettroscopico. Nella Tab 7.2 sono riportate le configurazioni elettroniche normali osservate di tutti gli elementi fino all’Uranio (Z = 92). Per evitare inutili ripetizioni, la configurazione `e data a meno delle configurazioni dei gas nobili precedenti. Ad esempio, la configurazione normale del Sodio che si legge in tabella `e 3s. La configurazione effettiva si ottiene facendo precedere a questo simbolo le configurazioni dell’Elio e del Neon quali si leggono in tabella, cos`ı da ottenere 1s2 2s2 2p6 3s. Dalla tabella si vede che il processo di “costruzione” degli atomi procede regolarmente fino al riempimento totale della sottozona 3p con l’Argon (Z = 18). Arrivati all’Argon, si potrebbe pensare che, a partire dall’elemento successivo, si cominci a riempire la sottozona 3d. Si ha invece un’inversione, nel senso che gli orbitali 4s si riempiono prima di quelli 3d. Questo non `e affatto incomprensibile se si ricorda che la correzione di Rydberg, di cui abbiamo parlato a proposito degli spettri dei metalli alcalini, `e tanto pi` u importante quanto pi` u alta `e la carica nucleare. L’effetto di penetrazione fa s`ı che l’energia dell’elettrone sull’orbita 4s sia pi` u bassa dell’energia sull’orbita 3d che `e praticamente circolare. La sottozona 3d comincia quindi a riempirsi dopo la sottozona 4s. Si ottiene cos`ı una serie di 10 elementi che va dallo Scandio (Z = 21) allo Zinco (Z = 30). Dopo lo Zinco si riempie la sottozona 4p e si procede poi lungo il tracciato illustrato nella Fig.7.2, nel quale ciascun “passo” `e contrassegnato dal numero atomico dell’elemento col quale si inizia il riempimento della sottozona successiva. Bisogna notare che, in questo processo di riempimento successivo delle sottozone, si verificano alcune irregolarit`a. Ad esempio, quando col Bario (Z = 56) si `e riempita la sottozona 6s, si passa al riempimento della sottozona 5d e si ha cos`ı il Lantanio con configurazione normale (esterna) 5d 6s2 . A questo punto, invece di proseguire con la sottozona 5d, si salta, per cos`ı dire, alla sottozona 4f e si ottiene una serie di 14 elementi, dal Cerio (Z = 58) al Lutezio (Z = 71), con propriet`a simili a quelle del Lantanio (famiglia delle terre rare o dei lantanidi). Successivamente torna a riempirsi la sottozona 5d. Una cosa del tutto analoga si verifica con le sottozone 6d e 5f . Il corrispondente del Lantanio `e l’Attinio (Z = 89) mentre il corrispondente della famiglia dei lantanidi `e la famiglia degli attinidi.
194
CAPITOLO 7
Z
Si.
Elemento
Configuraz.
Z
Si.
Elemento
Configuraz.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46
H He Li Be B C N O F Ne Na Mg Al Si P S Cl Ar K Ca Sc Ti V Cr Mn Fe Co Ni Cu Zn Ga Ge As Se Br Kr Rb Sr Y Zr Nb Mo Tc Ru Rh Pd
Idrogeno Elio Litio Berillio Boro Carbonio Azoto Ossigeno Fluoro Neon Sodio Magnesio Alluminio Silicio Fosforo Zolfo Cloro Argon Potassio Calcio Scandio Titanio Vanadio Cromo Manganese Ferro Cobalto Nichel Rame Zinco Gallio Germanio Arsenico Selenio Bromo Krypton Rubidio Stronzio Ittrio Zirconio Niobio Molibdeno Tecnezio Rutenio Rodio Palladio
1s 1s2 2s 2s2 2s2 2p 2s2 2p2 2s2 2p3 2s2 2p4 2s2 2p5 2s2 2p6 3s 3s2 3s2 3p 3s2 3p2 3s2 3p3 3s2 3p4 3s2 3p5 3s2 3p6 4s 4s2 3d 4s2 3d2 4s2 3d3 4s2 3d5 4s 3d5 4s2 3d6 4s2 3d7 4s2 3d8 4s2 3d10 4s 3d10 4s2 3d10 4s2 4p 3d10 4s2 4p2 3d10 4s2 4p3 3d10 4s2 4p4 3d10 4s2 4p5 3d10 4s2 4p6 5s 5s2 4d 5s2 4d2 5s2 4d4 5s 4d5 5s 4d5 5s2 4d7 5s 4d8 5s 4d10
47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92
Ag Cd In Sn Sb Te I Xe Cs Ba La Ce Pr Nd Pm Sm Eu Gd Tb Dy Ho Er Tm Yb Lu Hf Ta W Re Os Ir Pt Au Hg Tl Pb Bi Po At Rn Fr Ra Ac Th Pa U
Argento Cadmio Indio Stagno Antimonio Tellurio Iodio Xenon Cesio Bario Lantanio Cerio Presodimio Neodimio Promezio Samario Europio Gadolinio Terbio Disprosio Olmio Erbio Tullio Itterbio Lutezio Afnio Tantalio Wolframio Renio Osmio Iridio Platino Oro Mercurio Tallio Piombo Bismuto Polonio Astazio Radon Francio Radio Attinio Torio Protoattinio Uranio
4d10 5s 4d10 5s2 4d10 5s2 5p 4d10 5s2 5p2 4d10 5s2 5p3 4d10 5s2 5p4 4d10 5s2 5p5 4d10 5s2 5p6 6s 6s2 5d 6s2 4f 5d 6s2 4f 3 6s2 4f 4 6s2 4f 5 6s2 4f 6 6s2 4f 7 6s2 4f 7 5d 6s2 4f 9 6s2 4f 10 6s2 4f 11 6s2 4f 12 6s2 4f 13 6s2 4f 14 6s2 4f 14 5d 6s2 4f 14 5d2 6s2 4f 14 5d3 6s2 4f 14 5d4 6s2 4f 14 5d5 6s2 4f 14 5d6 6s2 4f 14 5d7 6s2 4f 14 5d9 6s 4f 14 5d10 6s 4f 14 5d10 6s2 4f 14 5d10 6s2 6p 4f 14 5d10 6s2 6p2 4f 14 5d10 6s2 6p3 4f 14 5d10 6s2 6p4 4f 14 5d10 6s2 6p5 4f 14 5d10 6s2 6p6 7s 7s2 6d 7s2 6d2 7s2 5f 2 6d 7s2 5f 3 6d 7s2
Tab. 7.2. Configurazione elettronica normale degli elementi. La configurazione `e data a meno delle configurazioni dei gas nobili che precedono l’elemento nella Tabella. Per alcuni elementi si presentano delle eccezioni rispetto alle “regole” enunciate nel testo. La configurazione normale del Cromo, ad esempio, che dovrebbe essere 3d4 4s2 , ` e invece 3d5 4s.
195
` ELETTRONI DI VALENZA ATOMI CON PIU
1s 3
2s
5
2p 11
3s
13
3p
19
21
4s
3d 31
4p 37
5s
39
4d 49
5p 55
6s
57
6p
4f 58 72
5d
5f
5g
6d
6f
6g
6h
7d
7f
7g
7h
81
90
87 89
7s
7p
7i
Fig. 7.2. Tracciato schematico che illustra il riempimento successivo delle sottozone secondo il principio di formazione del sistema periodico degli elementi. Ciascun passo da sottozona a sottozona ` e contrassegnato dal numero atomico dell’elemento col quale si inizia il riempimento della sottozona successiva.
Altre irregolarit` a minori si incontrano qua e l` a, soprattutto durante il riempimento delle sottozone d oppure f . Come si deduce dalla Tab 7.2, tali irregolarit` a si verificano per gli elementi Cromo, Rame, Niobio, Molibdeno, Rutenio, Rodio, Palladio, Argento, Gadolinio, Platino, Oro e Torio. La configurazione normale (esterna) dell’Oro, ad esempio, `e 4f 14 5d10 6s, invece di essere 4f 14 5d9 6s2 .
7.8 Configurazioni di elettroni eccitati Attraverso il principio di formazione abbiamo trovato la configurazione elettronica che compete a tutti gli elementi del sistema periodico nel loro stato fondamentale, ovvero la cosiddetta configurazione normale. L’eccitazione di uno o pi` u elettroni a orbitali di energia maggiore d` a luogo a ulteriori configurazioni. Consideriamo ad esempio l’atomo di Carbonio, avente configurazione normale 1s2 2s2 2p2 . L’eccitazione di uno o pi` u elettroni pu` o portare a confi-
196
CAPITOLO 7
gurazioni varie, come ad esempio 1s 2s2 2p3 1s2 2s 2p2 3s 1s2 2s2 3s 3p 1s2 2s2 2p 3d
eccitazione di un elettrone 1s a 2p , eccitazione di un elettrone 2s a 3s , eccitazione dei due elettroni 2p a 3s e 3p , eccitazione di un elettrone 2p a 3d .
Le configurazioni risultanti dall’eccitazione di elettroni interni (appartenenti cio`e a zone o sottozone chiuse), come la prima e la seconda di quelle elencate sopra, corrispondono in generale a energie molto maggiori dell’energia della configurazione normale e le righe che provengono dalle relative transizioni vanno a cadere nella regione dei raggi ultravioletti duri o dei raggi X. I relativi spettri vengono osservati in laboratorio per lo pi` u come spettri in assorbimento. Le configurazioni che si originano dall’eccitazione di due o pi` u elettroni esterni, come la terza dell’elenco, sono responsabili della comparsa dei cosiddetti termini anomali. Tali termini costituiscono, come dice il loro stesso nome, una anomalia e sono osservati raramente e solo in condizioni particolari. Di gran lunga pi` u importanti sono invece le configurazioni che si originano dall’eccitazione di un solo elettrone appartenente alla sottozona aperta, come la quarta dell’elenco. Praticamente tutte le righe dello spettro visibile e del vicino ultravioletto di un dato elemento si originano da transizioni fra una configurazione di questo tipo e la configurazione normale oppure fra due configurazioni di questo tipo. Come abbiamo visto nel Par. 7.6, una configurazione corrisponde a un numero g di stati quantici diversi, descritti dalle funzioni d’onda Ψ(a1 , a2 , . . . , aN ), autofunzioni degeneri dell’Hamiltoniana H0 . Considerando delle opportune combinazioni lineari di tali funzioni d’onda `e possibile costruire delle nuove quantit` a che risultano autofunzioni, oltre che dell’Hamiltoniana H0 , anche di un set di operatori che commutano con H0 e che commutano fra loro. Il set pi` u appropriato `e costituito, nella maggior parte dei casi, dagli operatori L 2 , Lz , S 2 e Sz . Sorge quindi il problema di stabilire, per un’assegnata configurazione, quali siano i possibili autostati di tali operatori e, pi` u in particolare, a quali valori dei numeri quantici L e S essi corrispondano singolarmente. Si suol dire in questi casi che si vanno a cercare i termini di tipo L-S (o termini tout court) che si originano da una data configurazione. Per risolvere questo problema `e per` o necessario ricordare alcuni risultati della teoria del momento angolare.
7.9 Richiami della teoria del momento angolare In meccanica quantistica il momento angolare `e definito come un operatore le cui tre componenti cartesiane, Jx , Jy , e Jz , soddisfano le regole vettoriale, J, di commutazione
197
` ELETTRONI DI VALENZA ATOMI CON PIU
[Ji , Jj ] =
i ijk Jk ,
k
che possono essere condensate nell’unica identit` a operatoriale J × J = i J . Da queste propriet`a di commutazione si ottiene che ciascuna componente del momento angolare commuta col suo modulo quadro, ovvero [J , J 2 ] = 0 . A partire dalle due equazioni precedenti si pu` o impostare il problema della ricerca degli autovalori e degli autovettori del momento angolare assumendo come set massimo di operatori commutanti il modulo quadro e una qualsiasi ad esempio la componente Jz . Il risultato delle tre componenti del vettore J, `e che gli autovettori possono essere individuati da due numeri quantici, j e m tali che j pu` o assumere soltanto valori interi o semi-interi non negativi (0, 12 , 1, 3 o assumere solo uno dei (2j + 1) valori (−j, −j + 1, 2 , etc.), e, fissato j, m pu` . . ., j − 1, j). Indicati tali autovettori (normalizzati) col simbolo |j, m , gli autovalori sono dati da J 2 |j, m = j(j + 1) |j, m
,
Jz |j, m = m |j, m
.
Le fasi relative degli autovettori sono poi fissate stabilendo, per convenzione, che gli elementi di matrice dei cosiddetti operatori di shift, J± = Jx ± iJy , siano reali, ovvero che sia j, m ± 1|J± |j, m =
# # j(j + 1) − m(m ± 1) = (j ± m + 1)(j ∓ m) .
Si considerino adesso due operatori di momento angolare, J1 , e J2 , commutanti fra loro. Si pu` o facilmente mostrare che l’operatore somma dei due momenti angolari, J = J1 + J2 , soddisfa le regole di commutazione caratteristiche dei momenti angolari ed `e quindi, esso stesso, un momento angolare nel senso della meccanica quantistica. Per la descrizione degli autostati comuni dei due momenti angolari si possono utilizzare due diverse rappresentazioni (o basi). Una prima base `e quella dei quattro operatori commutanti J12 , J1z , J22 , J2z . Se |j1 , m1 sono gli autovettori di J1 e |j2 , m2 sono quelli di J2 , gli autovettori di questa base sono dati dal prodotto diretto |j1 , m1 |j2 , m2 e possono essere indicati col simbolo compatto |j1 j2 m1 m2 . Per essi si ha
198
CAPITOLO 7
J12 |j1 j2 m1 m2 = j1 (j1 +1)|j1 j2 m1 m2 ,
J1z |j1 j2 m1 m2 = m1 |j1 j2 m1 m2 ,
J22 |j1 j2 m1 m2 = j2 (j2 +1)|j1 j2 m1 m2 ,
J2z |j1 j2 m1 m2 = m2 |j1 j2 m1 m2 .
un’altra base `e invece quella dei quattro operatori commutanti J12 , J22 , J 2 , Jz , i cui autovettori sono indicati col simbolo |j1 j2 JM , e sono tali che J12 |j1 j2 JM
= j1 (j1 + 1)|j1 j2 JM
J 2 |j1 j2 JM
= J(J + 1)|j1 j2 JM
, ,
J22 |j1 j2 JM
= j2 (j2 + 1)|j1 j2 JM
Jz |j1 j2 JM
= M |j1 j2 JM
,
.
Poich´e le due basi descrivono il medesimo spazio vettoriale, esiste una trasformazione di similitudine che connette una base all’altra. Si ha quindi |j1 j2 JM
=
|j1 j2 m1 m2
j1 j2 m1 m2 |j1 j2 JM
,
(7.13)
m1 m2
|j1 j2 m1 m2 =
|j1 j2 JM
j1 j2 JM |j1 j2 m1 m2
.
(7.14)
JM
I coefficienti che compaiono in queste trasformazioni, qui scritti nella forma di prodotti scalari, sono detti coefficienti di Wigner o, pi` u spesso, coefficienti di Clebsh-Gordan. Tali coefficienti sono identicamente nulli a meno che non sia M = m 1 + m2 , e a meno che J non sia uguale a uno qualsiasi dei possibili valori J = |j1 − j2 |, |j1 − j2 | + 1, . . . , j1 + j2 − 1, j1 + j2 . La dimostrazione della prima condizione si ottiene facilmente considerando il prodotto scalare j1 j2 m1 m2 |J1z + J2z |j1 j2 JM
,
e facendo agire l’operatore J1z + J2z = Jz alternativamente sul “bra” oppure sul “ket”. Si ottiene (m1 + m2 − M ) j1 j2 m1 m2 |j1 j2 JM
=0 ,
la quale mostra che, affinch´e il coefficiente di Clebsh-Gordan sia diverso da zero, deve necessariamente essere M = m1 + m2 . La dimostrazione della seconda condizione `e invece pi` u complessa e verr` a data in seguito.
199
` ELETTRONI DI VALENZA ATOMI CON PIU
In luogo dei coefficienti di Clebsh-Gordan si considerano spesso, soprattutto nei lavori pi` u moderni, i cosiddetti simboli 3-j, introdotti da Wigner e definiti dall’equazione
j1 j2 m1 m2 |j1 j2 JM
= (−1)
j1 −j2 +M
√ 2J + 1
j1 m1
j2 m2
J −M
.
(7.15)
L’espressione esplicita dei simboli 3-j (e quindi quella dei coefficienti di ClebshGordan) pu` o essere trovata attraverso un calcolo laborioso. Definendo in maniera opportuna le fasi relative dei vettori delle due basi, i simboli 3-j (e i coefficienti di Clebsh-Gordan) risultano reali e sono dati dall’espressione4
1 = (−1)a−b+γ √ abαβ|abcγ = (−1)a−b+γ Δ(a, b, c) 2c + 1 # × (a + α)!(a − α)!(b + β)!(b − β)!(c + γ)!(c − γ)! (−1)ν a b α β
c −γ
ν
×[(a−α−ν)! (c−b+α+ν)! (b+β−ν)! (c−a−β+ν)! ν! ( a+b−c−ν)!] −1 , (7.16) dove l’indice ν assume tutti i valori che danno luogo a fattoriali aventi significato (ovvero non negativi), e dove il simbolo Δ(a, b, c) `e definito da % (a + b − c)! (a + c − b)! (b + c − a)! . (7.17) Δ(a, b, c) = (a + b + c + 1)! I simboli 3-j soddisfano alcune importanti propriet` a che sono qui di seguito enunciate senza dimostrazione (ovviamente, i coefficienti di Clebsh-Gordan soddisfano propriet` a analoghe): a) Il simbolo 3-j
a b α β
c γ
`e nullo a meno che non sia α + β + γ = 0 e a meno che a, b e c non soddisfino la diseguaglianza triangolare (|a − b| ≤ c ≤ a + b). b) Relazioni di completezza e di ortonormalit` a a b c a b c = δcc δγγ , (2c + 1) (7.18) α β γ α β γ αβ
4
Questa formula, dovuta a G. Racah (Physical Review 62, 438, [1942]), `e particolarmente simmetrica nello scambio dei tre momenti angolari a, b e c. Per la deduzione di una formula equivalente, ma meno simmetrica, si veda ad esempio E. Landi Degl’Innocenti & M. Landolfi, Polarization in Spectral Lines, Kluwer Acad. Publ., Dordrecht, 2004.
200
CAPITOLO 7
z
J
2
m2
J
M=m 1 + m 2
J1
m1
Fig. 7.3. Fissati m1 e m2 , l’estremo del vettore J, risultante di j1 e j2 , pu` o trovarsi su un punto qualsiasi della circonferenza disegnata in alto. Il vettore J non ` e quindi determinato univocamente.
cγ
(2c + 1)
a α
b β
c γ
a α
b β
c γ
= δαα δββ .
c) Cambiando di segno le componenti della seconda riga, il simbolo 3-j risulta moltiplicato per il fattore di segno (−1)a+b+c a b c a b c = (−1)a+b+c . (7.19) −α −β −γ α β γ d) Scambiando fra loro due qualsiasi colonne, il simbolo 3-j risulta moltiplicato per lo stesso fattore (−1)a+b+c . Ad esempio a b c b a c = (−1)a+b+c . (7.20) α β γ β α γ I coefficienti di Clebsh-Gordan hanno un’interpretazione fisica immediata. Il loro modulo quadro, ovvero la quantit` a | j1 j2 m1 m2 |j1 j2 JM |2 , `e, secondo i principi della meccanica quantistica, la probabilit` a che, dati due sistemi per i quali si siano misurati separatamente i quadrati del momento angolare, trovando rispettivamente i valori j1 (j1 +1) e j2 (j2 +1), e le componenti dei momenti lungo l’asse z, trovando i valori m1 e m2 , la misura del quadrato del momento
201
` ELETTRONI DI VALENZA ATOMI CON PIU
m2
¡
¡
£¢
l
l
l
l
m
m
m
l
l m
²
² ³
³
µ´
µ´
·¶
l
l
l
l
m
m
m
m
·¶
£¢
¹¸
¥¤
¹¸
F
F
F
F
G
G
G
G
F
~
~
§¦
ȼ
F
¥¤
ȼ
½¼
F
F
F
G
G
G
D
D
D
E
E
E
À
À
æ
æ
Á
ç
ç
D
D
D
D
E
E
E
E
ô õ
÷ö
÷ö
Â
 Ã
Ã
x
x
y
y
Ö ×
ÙØ
6
6
6
6
7
7
7
7
{z
éè
B
B
B
B
C
C
C
C
P Q
{z
8
8
8
8
9
9
9
9
óò
óò
B
B
B
B
C
C
C
C
ÏÎ
ÏÎ
ÑÐ
ÑÐ
ÓÒ
ÓÒ
ÕÔ
ÕÔ
ML
ML
ON
ON
ed
ed
32
32
ÇÆ
ÉÈ
ÉÈ
ËÊ
ËÊ
ÍÌ
@
@
@
@
A
A
A
A
@
@
@
@
A
A
A
A
ÍÌ
>
>
>
>
?
?
?
?
ßÞ
áà
áà
ãâ
>
>
>
>
?
?
?
?
v
v
J
w
w
K
ãâ
UT
WV
H
H
%
%
kj
kj
I
WV
I
YX
'
'
n
n
n
n
n
o
o
o
o
o
M=j 1 + j 2 M=j 1 + j − 1 2 M=j 1 + j − 2
n o
p
p
p
p
p
p
p
q
q
q
q
q
q
q
r
r
r
r
r
r
r
s
s
s
s
s
s
s
J K
a 2 si ha che δ(x) = lim f (x, a) . a→0
Analogamente, se si considera la famiglia g(x, a) = √
2 1 e−(x/a) , 2π a
443
APPENDICI
ancora si ha δ(x) = lim g(x, a) . a→0
Esistono infinite possibilit`a di rappresentare la delta di Dirac come limite di opportune famiglie di funzioni. Le rappresentazioni che si incontrano pi` u comunemente in fisica-matematica sono le seguenti δ(x) = lim
1 sin(Ω x) , π x
δ(x) = lim
1 sin2 (Ω x) . π Ω x2
Ω→∞
Ω→∞
La propriet` a fondamentale della delta di Dirac `e riassunta nella seguente espressione, che ne costituisce la definizione formale ∞ F (x) δ(x) dx = F (0) , −∞
e dalla quale conseguono, per mezzo di semplici cambiamenti di variabile, le due seguenti ∞ F (x) δ(x − x0 ) dx = F (x0 ) , −∞
∞
F (x) δ(ax) dx = −∞
1 F (0) , |a|
dove a `e un numero reale qualsiasi diverso da zero. Da queste equazioni si pu`o ottenere un’importante generalizzazione che riguarda la delta di Dirac il cui argomento `e una funzione reale arbitraria g(x). Indicando tale quantit` a con la notazione δ[g(x)] e indicando con xi gli eventuali zeri della funzione g(x), si ha ∞ 1 F (xi ) , F (x) δ[g(x)] dx = (x )| |g i −∞ i dove g (x) indica la derivata della funzione g(x) rispetto al proprio argomento. Ulteriori generalizzazioni al caso della delta di Dirac tridimensionale sono illustrate direttamente nel testo (si veda il Par. 3.2). Esiste infine anche la possibilit`a di dare significato alla derivata della funzione delta di Dirac, δ (x), definita dalla usuale relazione δ (x) = lim
Δx→0
δ(x + Δx) − δ(x) . Δx
Per mezzo di questa definizione si ha, per una funzione F (x) arbitraria
444
APPENDICI
∞
∞
F (x) δ (x) dx = lim −∞
Δx→0
F (x) −∞
δ(x + Δx) − δ(x) dx , Δx
dalla quale si ottiene ∞ F (−Δx) − F (0) = −F (0) . F (x) δ (x) dx = lim Δx→0 Δx −∞
A.4 Le leggi dell’elettromagnetismo ritrovate Nel testo abbiamo calcolato, a partire dai potenziali di Li´enard e Wiechart, le espressioni del campo elettrico e del campo magnetico, valutati in un punto arbitrario dello spazio, dovuti a una singola carica mobile. I risultati sono contenuti nelle Eq. (3.19) e (3.20). Vediamo adesso come da tali equazioni si possano ricavare, nel limite non relativistico, le equazioni elementari dell’elettromagnetismo valide per fenomeni stazionari. Lo scopo di questa appendice `e una semplice verifica di consistenza in quanto `e ovvio che le equazioni da cui partiamo, essendo conseguenza delle equazioni di Maxwell, devono gi`a contenere quei risultati che, anche storicamente, stanno alla base delle equazioni di Maxwell stesse. Consideriamo una particella, avente carica elettrica e, mobile entro un conduttore elettrico a sezione costante. La sua velocit` a `e molto minore della velocit` a della luce. Per fissare le idee, possiamo pensare che tale velocit` a sia dell’ordine di 10−2 cm s−1 , che rappresenta l’ordine di grandezza delle velocit`a di drift degli elettroni che si stabiliscono all’interno di un conduttore in un tipico circuito elettrico macroscopico. Il corrispondente valore di β `e dell’ordine di 10−12 , dimodoch´e l’approssimazione β 2 1 `e sicuramente verificata. Inoltre, gli effetti di curvatura del conduttore (che provocano delle piccolissime accelerazioni) possono essere senz’altro trascurati dimodoch´e possiamo supporre che il campo elettrico sia dato soltanto dal termine Coulombiano dell’Eq. (3.19). Trascurando termini dell’ordine di β 2 tale campo si scrive nella forma e (n − β ) , κ3 R 2 dove κ, R, n sono le quantit` a introdotte nel Cap. 3 che devono essere calcolate al tempo anticipato t . Il campo magnetico `e poi dato dall’Eq. (3.20), ovvero r , t) = E(
r, t) . B(r, t) = n × E( Si pu` o subito osservare che, se si pone β = 0, ovvero se si considera una carica elettrica a riposo, non `e ovviamente necessario considerare la differenza fra tempo vero e tempo anticipato e si ottiene
445
APPENDICI
P
R’
n’ Pt’
R
n β R’
Pt
Fig. A.1. Si intende calcolare il campo elettrico nel punto P all’istante t. Pt ` e la posizione della particella al medesimo istante, mentre Pt ` e la posizione della particella all’istante anticipato.
r ) = e n , E( R2
r) = 0 . B(
Queste sono le ordinarie equazioni dell’elettrostatica che traducono, in termini di campi, la legge di Coulomb. Andiamo adesso a vedere cosa si ottiene al primo ordine in β. Con facili considerazioni si pu` o mostrare che il campo elettrico E(r, t) `e esattamente uguale a quello che si calcolerebbe in base alla legge di Coulomb supponendo, ipoteticamente, che la velocit`a della luce fosse infinita (ovvero trascurando la differenza fra tempo vero e tempo anticipato). Infatti, facendo riferimento alla Fig. A.1 e indicando con un’apice le quantit` a valutate al tempo anticipato t e senza apice le stesse quantit` a valutate all’istante t, si ha t = t −
R , c
= R + (t − t ) v = R + R β , R
dalla quale segue, dividendo per R = n − β
R . R
(A4.1)
Introducendo le nuove notazioni nell’espressione del campo elettrico, e ricor `e costante, si ottiene dando che β r, t) = E(
e eR (n − β) = 3 3 . 2 R κ R
κ3
446
APPENDICI
D’altra parte si ha, per definizione κ = 1 − β · n , e applicando il teorema di Carnot al triangolo PPt Pt , · n + β 2 . R = R 1 − 2β
(A4.2)
Sostituendo nell’espressione del campo elettrico si ottiene il risultato che avevamo anticipato, ovvero, a meno di termini dell’ordine di β 2 2 3/2 e n r , t) = e R (1 − 2β · n + β ) 2 . E( 3 3 R R (1 − β · n )
Resta da valutare il contributo del campo magnetico. Per esso si ha r, t) = n × E( r, t) = e n × n . B( R2
D’altra parte, sempre a meno di termini dell’ordine di β 2 , si ha, dalle Eq. (A4.1) e (A4.2) n = β + n (1 − β · n) , per cui r, t) = e β × n . B( R2 Applichiamo adesso questa equazione al caso di un elemento di conduttore di lunghezza d. Indicando con N la densit` a numerica delle particelle cariche mobili e con S la sezione trasversale del conduttore, nell’elemento `e contenuto un parallela al d. numero di particelle dato da N S d, dotate di velocit` a v = c β, Tale numero `e esattamente compensato da un ugual numero di particelle fisse di carica opposta, per cui il campo elettrico risultante `e nullo per la propriet` a precedentemente dimostrata. Per il campo magnetico si ha invece NSv n d × 2 . c R D’altra parte, se si indica con i l’intensit` a di corrente che fluisce nel conduttore si ha B(r, t) = e
i = eN S v , per cui l’equazione per il campo magnetico si scrive B(r, t) =
n i d × 2 . c R
447
APPENDICI
Questa non `e altro che la seconda legge di Laplace che esprime il campo magnetico generato da un elemento di corrente. Come risulta chiaro dalla nostra deduzione, sebbene le cariche elettriche si muovano entro il conduttore a bassissima velocit`a, esse sono ciononostante in grado di creare un effetto relativistico che si manifesta con la presenza del campo magnetico.
A.5 L’equazione di Larmor nel caso relativistico Nella zona di radiazione le Eq. (3.18) e (3.20) forniscono l’espressione dei campi elettrico e magnetico dovuti a una carica in movimento r , t) = E(
e n × [(n − β ) × a ] , c2 κ 3 R
r , t) = n × E( r , t) , B(
dove e `e il valore della carica elettrica, c `e la velocit`a della luce, n `e il versore del raggio vettore che va dalla carica al punto di coordinate r, R `e il modulo di tale vettore, β = v /c `e la velocit`a della carica in unit` a della velocit`a della luce, a `e la sua accelerazione, e κ `e definito dall’equazione κ = 1 − n · β . e a che compaiono nelle Bisogna anche ricordare che le quantit`a R, κ, n, β, equazioni precedenti devono essere valutate al tempo anticipato t , legato a t dall’equazione R . c Sviluppando il doppio prodotto vettoriale, si ottiene t = t −
e ) − κ a ] . [(n · a )(n − β c2 κ 3 R D’altra parte, come sappiamo, il vettore di Poynting `e dato da r, t) = E(
r, t) = c E 2 (r, t) n , S( 4π e sviluppando il quadrato del campo elettrico, si ottiene, con facili passaggi 2 2 · a ) (1 − β 2 )(n · a )2 e a ( n · a )( β r , t) = S( n . +2 − 4π c3 R2 κ4 κ5 κ6 Questa espressione mostra che, nel caso generale, la distribuzione angolare della radiazione emessa (ovvero il diagramma di radiazione) `e relativamente complicata. I casi particolari in cui l’accelerazione `e parallela o perpendicolare alla
448
APPENDICI
velocit`a sono gi` a stati analizzati nel testo. Qui `e sufficiente sottolineare il fatto che, per velocit` a e accelerazione arbitrarie, esistono sempre due direzioni per le quali il vettore di Poynting `e nullo. Questo pu` o essere visto semplicemente dall’espressione del campo elettrico. Lungo le direzioni caratterizzate dai versori sia parallelo al vettore a, il campo elettrico `e ovn0 tali che il vettore n0 − β viamente nullo, e cos`ı anche il vettore di Poynting. Le direzioni n0 sono quindi e a e sono date dalle soluzioni contenute nel piano individuato dai vettori β dell’equazione (n0 − β ) × a = 0 . Indicando con α l’angolo che il vettore velocit` a forma con il vettore accelerazione, i versori n0 sono individuati dagli angoli θ± (contati a partire dal vettore accelerazione nello stesso senso di α) dati da θ+ = arcsin(β sinα) ,
θ− = π − arcsin(β sinα) .
Ad esempio, se α = 45◦ , e β = 0.8, si ha θ+ = 34◦ .45 e θ− = 145◦ .55. Passiamo adesso al calcolo della potenza. Per questo bisogna osservare che se si eseguisse semplicemente l’integrale " r, t) · n R2 dΩ , (A5.1) I = S( esteso a una sfera di raggio R centrata sulla posizione della carica all’istante anticipato, (t − R/c), si otterrebbe il rapporto fra l’energia che traversa la sfera in un intervallo di tempo dt e il dt stesso. Questa `e per`o una quantit` a di interesse minore. Pi` u interessante `e trovare la potenza istantanea emessa dalla particella carica. Per questo bisogna tener conto del fatto che l’energia che traversa la sfera in un tempo dt `e stata emessa dalla particella in un tempo dt che dipende dalla direzione e che `e legato a dt dalla relazione dt = κ dt . Per trovare la potenza W emessa dalla particella bisogna quindi eseguire l’integrale " " dt 2 r, t) · n κ R2 dΩ . W = S(r, t) · n R dΩ = S( dt Sostituendo l’espressione del vettore di Poynting trovata precedentemente si ha quindi " 2 · a ) (1 − β 2 )(n · a )2 e2 a (n · a )(β W = dΩ . +2 − 4π c3 κ3 κ4 κ5
449
APPENDICI
Per eseguire questo integrale, introduciamo un sistema di coordinate polari (ψ, χ) con l’asse polare diretto lungo il vettore velocit`a e con l’azimut χ misurato a partire dal piano contenente la velocit`a e l’accelerazione. Con ovvie a, e n sono dati da notazioni, in questo sistema i tre vettori β, β = β k ,
a = a⊥ı + ak ,
n = sinψ cosχı + sinψ sinχ j + cosψ k ,
per cui l’integrando si pu` o scrivere nella forma a2 + a2⊥ (1 − β cosψ)3 −(1 − β 2 )
+ 2 β a
sinψ cosχ a⊥ + cosψ a (1 − β cosψ)4
sin2 ψ cos2 χ a2⊥ + 2 sinψ cosψ cosχ a⊥ a + cos2 ψ a2 (1 − β cosψ)5
,
e il dΩ risulta dato da sinψ dψ dχ. Eseguendo l’integrazione in dχ nell’intervallo (0, 2π), i fattori che non contengono nessuna funzione di χ danno per risultato 2π, quelli contenenti cosχ danno risultato nullo, mentre il fattore contenente cos2 χ d` a per risultato π. Si ottiene allora π a2 + a 2 2 β cosψ a2 e2 ⊥ + W = 2 c3 0 (1 − β cosψ)3 (1 − β cosψ)4 2 1 2 2 2 sin ψ a + cos ψ a ⊥ 2 sinψ dψ . − (1 − β 2 ) (1 − β cosψ)5 Gli integrali in dψ che compaiono in questa espressione sono elementari e possono essere eseguiti facilmente sia integrando per parti che, alternativamente, per mezzo del cambiamento di variabile x = 1 − β cosψ. Si ottiene 1 π 1 1 sinψ dψ = , 2 0 (1 − β cosψ)3 (1 − β 2 )2 cosψ β 1 π 4 sinψ dψ = , 2 0 (1 − β cosψ)4 3 (1 − β 2 )3 1 π sin2 ψ 1 2 sinψ dψ = , 5 2 0 (1 − β cosψ) 3 (1 − β 2 )3 cos2 ψ 1 π 1 1 + 5β 2 sinψ dψ = . 2 0 (1 − β cosψ)5 3 (1 − β 2 )4 Sostituendo queste espressioni e raccogliendo separatamente i termini in a2 e in a2⊥ , si ottiene
450
APPENDICI
β2 1 e2 8 1 1 + 5β 2 2 a W = + − 2 c3 (1 − β 2 )2 3 (1 − β 2 )3 3 (1 − β 2 )3 1 1 1 2 , − + a⊥ (1 − β 2 )2 3 (1 − β 2 )2 ovvero, sviluppando 2 e2 W = 3 c3
a2
a2⊥ + (1 − β 2 )3 (1 − β 2 )2
.
Ricordando la definizione del fattore relativistico γ 1 γ= # , 1 − β2 l’espressione per la potenza emessa da una carica relativistica in moto accelerato pu` o anche scriversi nella forma pi` u significativa W =
2 e2 6 2 (γ a + γ 4 a2⊥ ) . 3 c3
Questa formula generalizza l’equazione di Larmor (3.23) al caso relativistico. Ovviamente per γ = 1 si ritrova l’equazione di Larmor in quanto a2 + a2⊥ = a2 . Per concludere bisogna notare che, se avessimo eseguito l’integrale del vettore di Poynting sulla sfera senza tener conto della differenza fra il dt e il dt , ovvero l’integrale I dell’Eq. (A5.1), avremmo ovviamente ottenuto un’espressione diversa. Tenendo conto che 1 2 1 2 1 2 1 2
π
1 1 3 + β2 sinψ dψ = , (1 − β cosψ)4 3 (1 − β 2 )3
π
1 β (5 + β 2 ) cosψ sin ψ dψ = , (1 − β cosψ)5 3 (1 − β 2 )4
π
sin2 ψ 2 5 + β2 sinψ dψ = , 6 (1 − β cosψ) 15 (1 − β 2 )4
π
cos2 ψ 1 5 + 38 β 2 + 5 β 4 sinψ dψ = , (1 − β cosψ)6 15 (1 − β 2 )5
0
0
0
0
si ha infatti I=
2 e2 8 1 2 2 2 2 6 2 γ . (1 + β ) a + γ (1 + β ) a ⊥ 5 5 3 c3
451
APPENDICI
Questa differenza fra potenza emessa dalla particella, W , e potenza ricevuta sulla sfera, I, `e un semplice effetto cinematico e non ha niente a che vedere con la relativit` a. Un effetto simile `e presente anche per le onde acustiche emesse, per esempio, da un aereo che viaggi a una velocit`a prossima a quella del suono. Mentre la potenza in onde acustiche emessa dall’aereo `e fissa, la potenza ricevuta pu` o essere molto grande e al limite infinita se l’aereo viaggia esattamente alla velocit`a del suono (il cosiddetto bang sonico che accade talvolta di percepire `e proprio dovuto a tale fenomeno).
A.6 Irraggiamento di onde gravitazionali Le equazioni che abbiamo ottenuto per l’irraggiamento di onde elettromagnetiche possono anche essere applicate, con alcune leggere modifiche, per trattare l’irraggiamento di onde gravitazionali. Ovviamente questo modo di procedere non `e rigoroso, in quanto le leggi dell’irraggiamento di onde gravitazionali dovrebbero essere dedotte dalla teoria della gravitazione universale. L’approccio qui seguito `e tuttavia sufficiente per la comprensione delle propriet`a fondamentali dei meccanismi di generazione delle onde gravitazionali e conduce a formule sostanzialmente corrette (come pu`o essere verificato a posteriori). Nelle equazioni per l’irraggiamento elettromagnetico dedotte nel Par. 3.10 eseguiamo la trasformazione formale e i → mi ,
(i = 1, . . . N ) ,
ovvero sostituiamo, per ciascuna particella, la carica con la massa. Inoltre, nelle equazioni che esprimono il vettore di Poynting, ovvero in quelle che esprimono la potenza irraggiata, moltiplichiamo il secondo membro per la costante di gravitazione universale G. Notiamo, per inciso, che in tali equazioni il fattore dimensionale [e2 ] viene cos`ı sostituito dal fattore dimensionale [Gm2 ] avente le stesse dimensioni. Le varie quantit` a introdotte nel Par. 3.10, ovvero il mo (Eq. (3.31)), il momento di dipolo magnetico, M mento di dipolo elettrico, D (Eq. (3.32)), e il tensore simmetrico di ordine due (collegato al momento di quadrupolo elettrico), Q / (Eq, (3.33)), si trasformano in altrettante quantit`a G, M G, e Q per le quali utilizzeremo, rispettivamente, i simboli D / G , ovvero = D
N
G = ei si → D
i=1
N
mi si ,
i=1
= 1 G = 1 M ei si × vi → M mi si × vi , 2 c i=1 2 c i=1 N
Q / =
N i=1
ei si si → Q /G =
N
N i=1
mi si si .
452
APPENDICI
G , l’analogo del dipolo elettrico, altro Osserviamo adesso che la quantit`a D non `e, per definizione, se non la coordinata del centro di massa del sistema di N particelle, rG , moltiplicata per la massa totale. Si ha cio`e G = D
N
mi si = M rG ,
i=1
dove M=
N
mi .
i=1
Si ha quindi, per un sistema isolato 2 .. = M d rG = 0 . D G dt2
G , l’analogo del dipolo magnetico, risulta proporzionale Inoltre, la quantit` aM in quanto al momento angolare totale del sistema, J, G = 2cM
N
mi si × vi = J .
i=1
Si ottiene quindi, per un sistema isolato, . = d J = 0 , M G dt e quindi, a pi` u forte ragione .. =0 . M G In base alla nostra analogia, si conclude da queste considerazioni che per le onde gravitazionali non si ha l’analogo della radiazione di dipolo elettrico n´e l’analogo della radiazione di dipolo magnetico. Resta quindi soltanto l’analogo della radiazione di quadrupolo elettrico (oltre, ovviamente, alla radiazione dovuta a multipoli pi` u elevati). Il tensore Q / G viene tradizionalmente indicato col simbolo /I, in quanto si tratta sostanzialmente di un tensore d’inerzia. Non bisogna per` o confonderlo col tensore d’inerzia ordinario, I, che viene introdotto nello studio della dinamica del corpo rigido e che `e definito da I=
N
mi (s2i U − si si ) ,
i=1
dove U `e il tensore unitario. Si ha ovviamente
453
APPENDICI
/I = −I +
1 2
(Tr I) U ,
in quanto, per definizione di traccia di un tensore Tr I =
mi (3 s2i − x2i − yi2 − zi2 ) = 2
i
mi s2i .
i
I due tensori I e /I differiscono fra loro per una quantit` a proporzionale al tensore unitario. Questa propriet`a `e strettamente analoga a quella che sussiste fra i tensori Q e Q / dell’elettrodinamica per cui, nella nostra analogia, la potenza emessa in onde gravitazionali all’ordine pi` u basso nello sviluppo multipolare si pu` o dedurre dall’Eq. (3.34) ed `e data da G ... 2 Ijk . 20 c5
WG =
jk
Questa formula `e corretta in tutto fuorch´e nel fattore numerico. Calcoli basati sulla teoria della gravitazione universale non ne cambiano la struttura ma si li1 mitano a sostituire il fattore 20 col fattore 15 . Intuitivamente si pu` o giustificare questa moltiplicazione per un fattore 4 osservando che un’onda elettromagne e B, trasversali rispetto tica `e descritta da due vettori non indipendenti, E alla direzione di propagazione. Se z `e tale direzione, due sole componenti di uno dei due campi, ad esempio Ex ed Ey , sono sufficienti per descrivere l’onda. Un’onda gravitazionale `e invece descritta da due tensori indipendenti trasversali rispetto alla direzione di propagazione. Se si indicano tali tensori con i simboli tradizionali e+ ed e× , l’onda risulta descritta dall’ottupla di compo+ + + × × × × nenti (e+ xx , exy , eyx , eyy , exx , exy , eyx , eyy ). Ne risulta quindi un fattore 4 legato, per cos`ı dire, ai gradi di libert` a della polarizzazione. La formula corretta per la potenza emessa in onde gravitazionali `e quindi WG =
G ... 2 Ijk . 5 c5 jk
Conviene infine osservare che, se si cambia centro di riduzione ponendo si = b + si , con b vettore costante, si ottiene, per il nuovo tensore d’inerzia I ,
I = I + M (2 b · rG + b2 ) U − b b − b rG − rG b , per cui, per un sistema isolato, I¨ = I¨ ,
454
APPENDICI
... ... e, a pi` u forte ragione, I = I . Queste considerazioni autorizzano a calcolare il tensore d’inerzia a partire da un centro di riduzione arbitrario al fine di determinare la potenza di emissione di onde gravitazionali.
A.7 Calcolo dell’integrale di Thomas-Fermi Nelle applicazioni del modello atomico di Thomas-Fermi si rende necessario il calcolo del seguente integrale
∞
I= 0
(1 + χ) χ3/2 dx , x1/2
dove χ(x) `e la soluzione dell’equazione di Thomas-Fermi x1/2 χ = χ3/2 , che soddisfa le condizioni al contorno χ(0) = 1 ,
lim χ(x) = 0 .
x→∞
L’integrale si spezza nella somma di due integrali I = I1 + I2 ,
(A7.1)
dove I1 =
∞
0
χ3/2 dx , x1/2
I2 = 0
∞
χ5/2 dx . x1/2
Il primo integrale `e banale in quanto, tenendo conto dell’equazione di ThomasFermi e delle condizioni al contorno della funzione χ, si ha ∞ I1 = χ dx = −χ (0) . (A7.2) 0
Il calcolo del secondo integrale `e pi` u complesso e lo si pu`o affrontare cos`ı: da un lato si ha I2 = 0
∞
χ5/2 dx = x1/2
∞
χ χ dx ,
0
e, integrando per parti e tenendo conto che χ(0) = 1 ∞ I2 = −χ (0) − χ 2 dx . 0
(A7.3)
455
APPENDICI
D’altra parte, considerando la quantit` a x−1/2 dx come fattore differenziale, integrando di nuovo per parti e ricordando l’equazione di Thomas-Fermi, si ottiene I2 =
∞
0
χ5/2 dx = −5 x1/2
∞
1/2 3/2
x
χ dx = −5
χ
0
∞
x χ χ dx .
0
o esprimere nella forma Adesso si osserva che il prodotto χ χ si pu` 1 dχ 2 , 2 dx e, di nuovo integrando per parti, si ottiene 5 ∞ 2 I2 = χ dx . 2 0 χ χ =
Confrontando questa espressione con l’Eq. (A7.3), si ottiene ∞ 2 5 χ 2 dx = − χ (0) , ovvero, I2 = − χ (0) . 7 7 0 Infine, ricordando le Eq. (A7.1) e (A7.2)
∞
I= 0
(1 + χ) χ3/2 12 dx = − χ (0) . 7 x1/2
(A7.4)
A.8 Energia della configurazione normale dell’atomo di Silicio Come applicazione dei risultati ottenuti nel Cap. 8, valutiamo l’energia che compete alla configurazione normale dell’atomo di Silicio, ovvero alla configurazione 1s2 2s2 2p6 3s2 3p2 . Per eseguire questi calcoli `e necessario preliminarmente valutare alcuni simboli 3-j. Per mezzo della formula analitica riportata nell’Eq. (7.16), si ha
0 0
0 0 0 0
2
=1 ,
0 0
1 1 0 0
2
=
1 3
,
1 1 0 0
2 0
2 =
2 15
.
La configurazione contiene quattro sottozone chiuse e una sottozona aperta. L’Hamiltoniana H0 (definita nell’Eq. (7.3)) e la parte F dell’Hamiltoniana H1 (definita nelle Eq. (8.2) e (8.3)) portano cinque contributi, uno per ciascuna sottozona (chiusa o aperta). L’energia corrispondente, che indichiamo con E 1 , si ottiene per mezzo dell’Eq. (8.7) ed `e data da
456
APPENDICI
E1 = 2 W0 (1s) + 2 W0 (2s) + 6 W0 (2p) + 2 W0 (3s) + 2 W0 (3p) + 2 I(1s) + 2 I(2s) + 6 I(2p) + 2 I(3s) + 2 I(3p) , dove W0 `e definito dall’Eq. (7.11) e I(n, l) `e l’integrale definito nell’Eq. (8.6). L’energia di interazione Coulombiana (ovvero la parte G dell’Hamiltoniana H1 ) entro le sottozone chiuse porta quattro contributi, uno per ciascuna sottozona. Indicando con E2 l’energia corrispondente si ha, per mezzo dell’Eq. (8.17) E2 = F 0 (1s, 1s) + F 0 (2s, 2s) + 15 F 0 (2p, 2p) −
6 5
F 2 (2p, 2p) + F 0 (3s, 3s) ,
dove le quantit` a F k (na la , nn lb ) sono definite nell’Eq. (8.9). Andando poi a considerare l’energia di interazione Coulombiana fra sottozone chiuse diverse, si hanno sei contributi, tante quante le coppie distinte che si possono formare con le quattro sottozone chiuse. Indicando con E3 l’energia corrispondente si ha, per mezzo delle Eq. (8.14) e (8.16) E3 = 4 F 0 (1s, 2s) − 2 G0 (1s, 2s) + 12 F 0 (1s, 2p) − 2 G1 (1s, 2p) + 4 F 0 (1s, 3s) − 2 G0 (1s, 3s) + 12 F 0 (2s, 2p) − 2 G1 (2s, sp) + 4 F 0 (2s, 3s) − 2 G0 (2s, 3s) + 12 F 0 (2p, 3s) − 2 G1 (2p, 3s) , dove le quantit` a Gk (na la , nn lb ) sono definite nell’Eq. (8.10). Infine resta da valutare il contributo dell’interazione Coulombiana fra la sottozona aperta 3p e le quattro sottozone chiuse. Indicando con E4 l’energia corrispondente si ha, per mezzo delle Eq. (8.13) e (8.15) E4 = 4 F 0 (1s, 3p) − − 2 G0 (2p, 3p) −
2 3 4 5
G1 (1s, 3p) + 4 F 0 (2s, 3p) − G2 (2p, 3p) + 4 F 0 (3s, 3p) −
1 2 3 G (2s, 3p) + 1 2 3 G (3s, 3p) .
12 F 0 (2p, 3p)
L’energia della configurazione fondamentale dell’atomo di Silicio, che indichiamo con E, si ottiene per semplice addizione dei quattro termini, ovvero E = E 1 + E2 + E3 + E4 . I quattro contributi all’energia che abbiamo calcolato sono degeneri rispetto a tutti gli stati della configurazione e la stessa propriet`a vale ovviamente anche per E. La parte restante che resta da calcolare `e data dall’ Eq.(8.11) con la somma estesa alla sole coppia di elettroni appartenenti alla sottozona aperta 3p. Il calcolo esplicito `e svolto nel Par. 8.6. I due elettroni 3p danno luogo a tre termini, ovvero, in ordine di energia crescente, 3P , 1D, e 1S, con un rapporto pari a 3/2 fra l’intervallo (1S −1D) e l’intervallo (1D −3P ).
457
APPENDICI
A.9 Calcolo della costante di struttura fine di un termine Il calcolo della costante ζ(α, LS) che caratterizza gli intervalli di struttura fine dei termini appartenenti a una configurazione assegnata pu`o essere effettuato mediante un procedimento basato sulla regola della traccia. Un procedimento simile `e stato seguito nel Par. 8.1 per determinare l’energia dei termini. Il punto di partenza `e l’Eq. (9.8) che, particolarizzata al caso di elementi di matrice diagonali, risulta αLSML MS | ξ(ri )i · si |αLSML MS = ζ(α, LS) ML MS . i
D’altra parte, per un qualsiasi autostato della configurazione, della forma ΨA (a1 , a2 , . . . , aN ) dell’Eq. (7.1), l’elemento di matrice diagonale dello stesso operatore `e dato da
ΨA (a1 , a2 , . . . , aN )| ξ(ri )i · si |ΨA (a1 , a2 , . . . , aN ) =
i
ζni li mi msi ,
i
dove ζni li `e la quantit` a definita nell’ Eq.(9.10). Premesse queste considerazioni, consideriamo il caso particolare di una configurazione pf la quale, come risulta dalla Tab. 7.3, d` a luogo ai sei termini 1D, 1 1 3 3 3 F , G, D, F , G. Partiamo da uno stato avente i valori pi` u alti per i numeri quantici ML e MS , ovvero ML = 4, MS = 1. Questo stato pu`o provenire soltanto dal termine 3 G. In termini invece di stati di particella singola, questo stato `e del tipo m1 = 1, ms1 = 12 , m2 = 3, ms2 = 12 , dove gli indici 1 e 2 si riferiscono rispettivamente all’elettrone p e all’elettrone f . Utilizzando le stesse notazioni del Par. 8.1, si pu` o quindi scrivere l’uguaglianza5 [4, 1] = (1+ , 3+ ) , che, in base alle equazioni precedenti, risulta6 4 ζ(3G) =
1 2
ζnp +
3 2
ζnf .
Si ottiene quindi il risultato 5
Il simbolo [ML , MS ] significa la somma degli elementi di matrice diagonali dell’Hamiltoniana di interazione spin-orbita fra tutti gli stati Ψ A aventi per autovalore di Lz e Sz i valori ± ML e MS , rispettivamente. Analogamente, la notazione (m± 1 , m2 ) indica l’elemento di matrice diagonale della stessa Hamiltoniana sullo stato in cui l’elettrone 1 ha numero quantico magnetico m1 e numero quantico di spin +1/2 oppure −1/2 e, analogamente, l’elettrone 2 ha numero quantico magnetico m2 e numero quantico di spin +1/2 oppure −1/2.
6
Si noti che gli eventuali elettroni presenti in sottozone chiuse non portano alcun contributo all’equazione
458
APPENDICI
ζ(3G) =
1 8
ζnp +
3 8
ζnf .
Si procede poi diminuendo il valore di ML (e mantenendo MS = 1). Si ottengono le equazioni [3, 1] = (0+ , 3+ ) + (1+ , 2+ ) ,
[2, 1] = (−1+ , 3+ ) + (0+ , 2+ ) + (1+ , 1+ ) ,
o dalle quali si ha, osservando che la combinazione [ML = 3, MS = 1] pu` provenire dai termini 3 G e 3F , e che la combinazione [ML = 2, MS = 1] pu` o provenire dai termini 3 G, 3F , e 3D 3 [ζ(3 G) + ζ(3F )] = 3
3
3
2 [ζ( G) + ζ( F ) + ζ( D)] =
3 2
ζnf +
− 21
1 2
ζnp +
ζnp + ζnf , 3 2
ζnf + ζnf +
1 2
ζnp +
1 2
ζnf .
Risolvendo il sistema si arriva alle seguenti espressioni (anche deducibili mediante le Eq. (9.11)) ζ(3F ) =
1 24
ζnp +
11 24
ζ(3D) = − 61 ζnp +
ζnf ,
2 3
ζnf .
In principio si potrebbero poi considerare anche valori di MS = 0. Ad esempio [4, 0] = (1+ , 3− ) + (1− , 3+ ) . Tuttavia, cos`ı facendo si ottengono equazioni della forma 0 = 0 e il valore di ζ(1 G) resta indeterminato. Questo `e del tutto consistente in quanto gli stati di singoletto non presentano struttura fine e la costante ζ non `e definita. Interessanti sono anche i casi delle configurazioni di elettroni equivalenti perch´e, ripetendo gli stessi ragionamenti, si perviene direttamente alla seconda regola di Hund. Consideriamo ad esempio la configurazione p2 che porta, come risulta dalla Tab. 7.4, ai tre termini 1S, 1D, e 3P . Per i termini di singoletto, al solito, la costante della struttura fine resta indeterminata. Per il termine di tripletto si ha invece [1, 1] = (0+ , 1+ ) , dalla quale si ottiene ζ(3P ) =
1 2
ζnp .
Se si passa a considerare la configurazione complementare, ovvero p 4 , si la stessa struttura di termini. Questa volta, per trovare la costante di struttura fine del termine 3P , l’equazione da considerare `e la seguente7 7
La quantit` a (1+ , 1− , 0+ , −1+ ), relativa alla configurazione p4 , si ottiene dalla corrispondente quantit` a (0+ , 1+ ), relativa alla configurazione p2 , prendendo “la complementare” di quest’ultima, ovvero (−1+ , −1− , 0− , 1− ), e poi cambiando di segno a tutti i valori di m e a tutti i valori di ms .
APPENDICI
459
[1, 1] = (1+ , 1− , 0+ , −1+ ) , e si ottiene ζ(3P ) = − 21 ζnp , ovvero un valore esattamente uguale a quello della configurazione p 2 ma di segno opposto. Queste considerazioni possono essere ripetute per una qualsiasi configurazione di elettroni equivalenti e per la corrispondente configurazione complementare e portano alla seconda regola di Hund. Nel caso particolare delle configurazioni che riempiono per met` a la sottozona (come p3 , d5 , e f 7 ) la configurazione coincide con quella complementare e si ottiene un valore nullo per le costanti di struttura fine di tutti i termini.
A.10 Il principio fondamentale della termodinamica statistica Consideriamo, in tutta generalit` a, un sistema fisico macroscopico e pensiamo di numerare con l’indice i tutti i possibili stati microscopici nei quali tale sistema si pu` o trovare. Indichiamo inoltre con Ei l’energia dello stato i-esimo. Se il sistema `e in uno stato stazionario, possiamo pensare che esso evolva incessantemente da uno stato microscopico all’altro e possiamo introdurre una descrizione statistica indicando con pi la probabilit` a che esso si trovi nello stato microscopico i-esimo. Ovviamente deve essere valida la propriet` a di normalizzazione pi = 1 . i
Si tratta adesso di connettere la probabilit` a pi all’energia Ei . Per far questo diamo una definizione dell’entropia ponendo, secondo un’ipotesi originariamente dovuta a Boltzmann S = −kB pi ln pi , i
dove kB `e la costante di Boltzmann. Questa definizione pu`o essere giustificata ammettendo che l’entropia di un sistema misuri la quantit` a di “disordine” contenuta nel sistema stesso e osservando che la funzione sopra definita ha la propriet` a matematica di assumere il valore massimo quando tutte le probabilit`a pi sono uguali fra loro e di assumere il valore minimo (che risulta uguale a 0) quando una singola pi `e uguale a 1 e tutte le altre sono uguali a 0. La prova della seconda propriet` a `e banale. Per provare la prima propriet` a si pu` o osservare
460
APPENDICI
che dando una variazione arbitraria, δpi , alle probabilit` a, la corrispondente variazione δS dell’entropia risulta δS = −kB (ln pi + 1) δpi . i
D’altra parte, dovendo essere
δpi = 0 ,
i
ne risulta che se ln pi `e costante, cio`e indipendente da i, δS `e nullo e quindi ` poi facile verificare che tale estremo risulta l’entropia presenta un estremo. E effettivamente un massimo, in quanto d2 S 1 = −kB